Системы на базе анализа естественного языка

Недавний подъём интереса к системам АI/ML был вызван появлением неожиданно успешных LLMs типа ChatGPT и GPT-4. Хотя это только одна из многих областей AI/ML, именно в этой области произошли наиболее важные и наиболее обсуждаемые изменения. Наша компания имеет большой опыт и глубокую экспертизу в области систем на базе обработки естестенного языка. За последние годы были реализованы десятки проектов, среди которых можно выделить:

Доменно-специфичные поисковые вопросно-ответные системы

ChatGPT был запущен в конце 2022 года и привлёк внимание своими широкими возможностями: написание кода, создание текстов, возможности перевода, демонстрируя удивительные возможности отвечать на любые человеческие вопросы, зачастую на уровне не хуже эксперта в определенной области. Получить ответы на многие вопоросы теперь стало гораздо проще и быстрее. Не нужно искать необходимую информацию среди сотен страниц, выдаваемых поисковыми системами по определенным запросам. Данная модель (Generative Pre-trained Transformer) - обучен на сотнях миллионов текстов различной тематике, специфики и языков. Тем не менее, еще задолго до появления ChatGPT возникала потребность в системах, способных быстро найти ответ в определенной узкой области, в технической документации, инструкции, руководстве пользователей. В таких случаях, к сожалению ChatGPT будет бесполезным (конечно, он просто может придумать ответ, но это будет не корректно). Наша NLP-команда принимала участие в создании таких систем, в частности:

  • Системы информационного поиска, когда необходимо найти в большой базе знаний определенную статью по текстовому описанию
  • Голосовой помощник, который находит необходимый ответ в технической документации даже на базе не четко поставленного вопроса (как правило пользователь не знает техническую терминологию)
  • Автоматизированная система распознавания и классификации поломок и неисправностей на промышленном предприятии. На основании голосового звонка оператора на предприятии, в случае поломок производственных станков и устройств система распознавала специфичную терминологию оператора, касательно поломки, оперативно формировала заявку на ремонт.

Системы анализа и классификации текстов

Системы, позволяющие анализировать текст и отностить его к различным категориям. В частности, компанией разработана система классификации веб-сайтов, отностящая сайт к одной или нескольким из более, чем 500 категорий. Использовании данной системы актуально для проведения маркетинговых и рекламных компаний путем сужения целевой аудитории.

Системы перефразирования текстов

Системы перефразирования текстов (задача парафраза), когда необходимо, возможно в сжатом виде пересказать определенной статью, текст, заметку.

Системы выделения ключевых слов, тегов, тональностей текстов

Системы анализа текстов и выделения различных сущностей, среди которых ключевые слова и теги, тональности, стилю, типу и и т.д. В частности, такие системы используются для анализа ответов операторов колцентра (вежливо, грубо), отзывов и кометариев к статьям (положительный, отрицательный, нейтральный)

Примеры проектов

Прогнозная система характиристик публикаций

  • Категория: NLP
  • Клиент: Life.ru
  • Дата: 2021
  • Детали: Подробнее

Классификация веб сайтов по категориям

  • Категория: NLP
  • Клиент: Segmento
  • Дата: 2022
  • Детали: Подробнее

Генерация доменных имен по описанию

  • Категория: NLP
  • Клиент: It.com
  • Дата: 2021
  • Детали: Подробнее