1. Прогнозная система характеристик публикаций (Views, Likes, Clicks, Comments, и т.д.)
- Категория: NLP
- Заказчик: Life.ru
- Дата: 2021
Используя исторические данные из различных источников и взаимодействие, связанное с публикациями, разработана система прогнозирования, которая анализирует содержание статей для прогнозирования различных характеристик публикаций. К этим характеристикам относятся просмотры, клики по ссылкам, лайки и т. д. Используя эту систему, организации могут оптимизировать свои контент-стратегии и принимать решения на основе данных, чтобы максимизировать вовлеченность и взаимодействие со своими публикациями.
Application of predictive models
Подходы
Векторизация заголовка*
- TF-IDF
- BERT
Регрессионная модель**
- FFN
- Catboost
*Векторизация процесс выделения из данных (текста) признаков которые используются для построения прогнозных моделей
** Регрессионные модели прогнозирующая функция от независимой переменной и параметров с добавлением случайной переменной
Метрики оценки качества прогнозирующих моделей
- Mean Squared Error (MSE)
- RMSE
- Mean Absolute Error (MAE) ~ 2500 просмотров
2. Специализированные системы поиска и вопросов и ответов
- Категория: NLP
- Клиент: ТВЦ, и другие компании
- Дата: 2019-2023
До появления ChatGPT существовала потребность в системах, которые могли бы быстро находить ответы в конкретных, узких областях, таких как техническая документация, инструкции и руководства пользователя. В таких случаях ChatGPT может не предоставить правильное решение. Наша команда НЛП сыграла важную роль в создании таких систем, в частности:
Наша команда сыграла важную роль в создании таких систем, в том числе:
- Системы поиска информации, способные находить конкретные статьи в обширной базе знаний с помощью текстовых описаний.
- Голосовые помощники, которые находят нужные ответы в технической документации по неоднозначно сформулированным вопросам (поскольку пользователям часто не хватает технической терминологии)
- Автоматизированные системы распознавания и классификации поломок и неисправностей промышленного оборудования. В случае выхода из строя производственного оборудования эти системы распознают конкретную терминологию неисправностей на основе голосовых вызовов операторов производственных машин и оперативно формируют заявки на ремонт оборудования.
3. Поисковая информационная система (локальная LLM)
- Категория: NLP
- Клиент: Devprom
- Дата: 2023
Обучение и настройка локальной LLM (большой языковой модели) для русского языка с целью использования, аналогично ChatGPT для внутренних документных баз данных компании