Statanly - технологии, которые видят, слышат и понимают

1. Прогнозирование наработки на отказ нефтедобывающего оборудования

Категория: Прогнозные системы
Клиент: Газпром нефть
Дата: 2018

Разработать методику прогнозирования средней наработки на отказ (СНО) внутрискважинного оборудования и планирования межремонтного периода (МРП) работы скважин, а также систему определения технического предела работы оборудования в скважине. Общая задача: Создание системы прогнозирования средней наработки на отказ (СНО) оборудования по группе заданных параметров.

Функция распределения

Постановка задачи

Используемые признаки входных данных, описывающих нефтедобывающие скважины

Численные: 'Напор', 'Глубина спуска', 'Произв.', Q ж (режим)', Q н (режим)', '% воды (режим)', ' H дин (режим)', Pзаб(режим), Pпр(режим)
Категориальные (полная бинаризация ): 'Причина (предыдущая остановка)', 'Принадлежность', 'Подрядчик ЭПУ', 'Тип насоса', 'Режим работы', 'ЭЦН, завод изготовитель', 'Протектор, завод изготовитель', 'ПЭД, завод изготовитель', 'Кабель, завод изготовитель‘

Целевой признак: наработка на отказ (в днях) '

Проблема: много пропущенных данных

Начальная обработка входных данных

Используемые признаки дополнительных таблиц:

Используются только данные по насосам
Численные ::'Номинал Q', ' Левая зона', 'Правая зона', 'Номинал F', 'Q', ' Н', ' Мощн ', 'КПД
Категориальные (полная бинаризация): 'VENDOR', 'TYPERU', 'TYPEFGN'

Использованный классификатор: Catboost

Результат после начальной обработки (SMAPE): 0.734

Двухпараметрическое распределение Вейбулла

Нормальное распределение является частным случаем двухпараметрического распределения Вейбулла, которое описывает наработку до отказа с учетом коэффициента k, характеризующую изменение интенсивности отказов во времени.

Добавление признаков распределения Вейбулла по месторождениям

Для каждого месторождения обучающей выборки по целевому признаку (НнО) автоматически рассчитываются параметры распределения Вейбулла (коэффициент формы, матожидание, дисперсия)
Указанные параметры добавляются, в зависимости от месторождения, в обучающую и тестовую выборки.

Результат с признаками Вейбулла (SMAPE): 0.732

Результат после настройки параметров catboost (SMAPE): 0.726

2. Прогнозная система отказа тяговыхэлектродвигателей электровозов 2ЭС6

Категория: Прогнозные системы
Клиент: Синара Транспортные Машины
Дата: 2019

Разработанные модели позволяют делать следующие прогнозы:

Прогноз вероятности отказа в течении в среднем 36 часов непрерывной работы через 1 день от даты прогноза с использованием данных за 6 дней до даты прогноза
То же, через 7 дней с использованием данных за 7 дней
То же, через 14 дней с использованием данных за 16 дней
То же, через 30 дней с использованием данных за 30 дней

В процессе анализа предоставленных данных, были обнаружены следующие особенности, влияющие на конечные результаты прогнозов

Фрагментация данных
Выбросы в данных
Шумы
Смещение выборки в сторону отказов

Ниже представлены метрики roc-auc оценки качества моделей прогноза:

Прогноз через 1 день: roc-auc: 0.75
Прогноз через 7 дней: roc-auc: 0.7
Прогноз через 14 дней: roc-auc: 0.65
Прогноз через 30 дней: roc-auc: 0.6

3. Система прогнозирования останова при производстве пероксидноймарки

Категория: Прогнозные системы
Клиент: Сибур
Дата: 2019

При производстве пероксидной марки полипропилена последний этап заключается в нарезке гранулята. Бывает так, что на ножи начинают налипать агломераты в результате ножи начинают отъезжать от фильеры, процесс деградирует и происходит останов оборудования. Это большие потери для производства. Процесс деградации косвенно можно отследить по наличию агломератов на вибросите. На базе данных телеметрии (за год), по а также данным по остановам экструдера разработать систему предсказывающая останов.

Общая задача: использовать эти данные для разработки и развертывания прогнозной системы, способной предвидеть отключения оборудования.

В рамках пилотного проекта мы успешно реализовали LSTM (Long Short-Term Memory) and GRU (Gated Recurrent Unit) модели.

Результаты (LSTM):

Training Accuracy = 0.97
Test Accuracy = 0.89

Результаты (GRU):

Accuracy = 1.000
Test Accuracy = 0.87

Эти результаты могут быть дополнительно улучшены за счет постоянного сотрудничества со специалистами в предметной области и внедрения более совершенных методов предварительной обработки данных.

Приложения системы

1. Прогнозирование наработки на отказ нефтедобывающего оборудования

2. Прогнозная система отказа тяговыхэлектродвигателей электровозов 2ЭС6

3. Система прогнозирования останова при производстве пероксидноймарки