1. Прогнозирование наработки на отказ нефтедобывающего оборудования
- Категория: Прогнозные системы
 - Клиент: Газпром нефть
 - Дата: 2018
 
Разработать методику прогнозирования средней наработки на отказ (СНО) внутрискважинного оборудования и планирования межремонтного периода (МРП) работы скважин, а также систему определения технического предела работы оборудования в скважине. Общая задача: Создание системы прогнозирования средней наработки на отказ (СНО) оборудования по группе заданных параметров.
                    Функция распределения
                Постановка задачи
Используемые признаки входных данных, описывающих нефтедобывающие скважины
- Численные: 'Напор', 'Глубина спуска', 'Произв.', Q ж (режим)', Q н (режим)', '% воды (режим)', ' H дин (режим)', Pзаб(режим), Pпр(режим)
 - Категориальные (полная бинаризация ): 'Причина (предыдущая остановка)', 'Принадлежность', 'Подрядчик ЭПУ', 'Тип насоса', 'Режим работы', 'ЭЦН, завод изготовитель', 'Протектор, завод изготовитель', 'ПЭД, завод изготовитель', 'Кабель, завод изготовитель‘
 
Целевой признак: наработка на отказ (в днях) '
Проблема: много пропущенных данных
Начальная обработка входных данных
Используемые признаки дополнительных таблиц:
- Используются только данные по насосам
 - Численные ::'Номинал Q', ' Левая зона', 'Правая зона', 'Номинал F', 'Q', ' Н', ' Мощн ', 'КПД
 - Категориальные (полная бинаризация): 'VENDOR', 'TYPERU', 'TYPEFGN'
 
Использованный классификатор: Catboost
Результат после начальной обработки (SMAPE): 0.734
Двухпараметрическое распределение Вейбулла
Нормальное распределение является частным случаем двухпараметрического распределения Вейбулла, которое описывает наработку до отказа с учетом коэффициента k, характеризующую изменение интенсивности отказов во времени.
Добавление признаков распределения Вейбулла по месторождениям
- Для каждого месторождения обучающей выборки по целевому признаку (НнО) автоматически рассчитываются параметры распределения Вейбулла (коэффициент формы, матожидание, дисперсия)
 - Указанные параметры добавляются, в зависимости от месторождения, в обучающую и тестовую выборки.
 
Результат с признаками Вейбулла (SMAPE): 0.732
Результат после настройки параметров catboost (SMAPE): 0.726
2. Прогнозная система отказа тяговыхэлектродвигателей электровозов 2ЭС6
- Категория: Прогнозные системы
 - Клиент: Синара Транспортные Машины
 - Дата: 2019
 
                    
                Разработанные модели позволяют делать следующие прогнозы:
- Прогноз вероятности отказа в течении в среднем 36 часов непрерывной работы через 1 день от даты прогноза с использованием данных за 6 дней до даты прогноза
 - То же, через 7 дней с использованием данных за 7 дней
 - То же, через 14 дней с использованием данных за 16 дней
 - То же, через 30 дней с использованием данных за 30 дней
 
В процессе анализа предоставленных данных, были обнаружены следующие особенности, влияющие на конечные результаты прогнозов
- Фрагментация данных
 - Выбросы в данных
 - Шумы
 - Смещение выборки в сторону отказов
 
Ниже представлены метрики roc-auc оценки качества моделей прогноза:
- Прогноз через 1 день: roc-auc: 0.75
 - Прогноз через 7 дней: roc-auc: 0.7
 - Прогноз через 14 дней: roc-auc: 0.65
 - Прогноз через 30 дней: roc-auc: 0.6
 
3. Система прогнозирования останова при производстве пероксидноймарки
- Категория: Прогнозные системы
 - Клиент: Сибур
 - Дата: 2019
 
При производстве пероксидной марки полипропилена последний этап заключается в нарезке гранулята. Бывает так, что на ножи начинают налипать агломераты в результате ножи начинают отъезжать от фильеры, процесс деградирует и происходит останов оборудования. Это большие потери для производства. Процесс деградации косвенно можно отследить по наличию агломератов на вибросите. На базе данных телеметрии (за год), по а также данным по остановам экструдера разработать систему предсказывающая останов.
Общая задача: использовать эти данные для разработки и развертывания прогнозной системы, способной предвидеть отключения оборудования.
В рамках пилотного проекта мы успешно реализовали LSTM (Long Short-Term Memory) and GRU (Gated Recurrent Unit) модели.
Результаты (LSTM):
- Training Accuracy = 0.97
 - Test Accuracy = 0.89
 
Результаты (GRU):
- Accuracy = 1.000
 - Test Accuracy = 0.87
 
Эти результаты могут быть дополнительно улучшены за счет постоянного сотрудничества со специалистами в предметной области и внедрения более совершенных методов предварительной обработки данных.
