Недавний подъём интереса к системам АI/ML был вызван появлением неожиданно успешных LLMs типа ChatGPT и GPT-4. Хотя это только одна из многих областей AI/ML, именно в этой области произошли наиболее важные и наиболее обсуждаемые изменения. Наша компания имеет большой опыт и глубокую экспертизу в области систем на базе обработки естестенного языка. За последние годы были реализованы десятки проектов, среди которых можно выделить:
Доменно-специфичные поисковые вопросно-ответные системы
ChatGPT был запущен в конце 2022 года и привлёк внимание своими широкими возможностями: написание кода, создание текстов, возможности перевода, демонстрируя удивительные возможности отвечать на любые человеческие вопросы, зачастую на уровне не хуже эксперта в определенной области. Получить ответы на многие вопоросы теперь стало гораздо проще и быстрее. Не нужно искать необходимую информацию среди сотен страниц, выдаваемых поисковыми системами по определенным запросам. Данная модель (Generative Pre-trained Transformer) - обучен на сотнях миллионов текстов различной тематике, специфики и языков. Тем не менее, еще задолго до появления ChatGPT возникала потребность в системах, способных быстро найти ответ в определенной узкой области, в технической документации, инструкции, руководстве пользователей. В таких случаях, к сожалению ChatGPT будет бесполезным (конечно, он просто может придумать ответ, но это будет не корректно). Наша NLP-команда принимала участие в создании таких систем, в частности:
Системы анализа и классификации текстов
Системы, позволяющие анализировать текст и отностить его к различным категориям. В частности, компанией разработана система классификации веб-сайтов, отностящая сайт к одной или нескольким из более, чем 500 категорий. Использовании данной системы актуально для проведения маркетинговых и рекламных компаний путем сужения целевой аудитории.
Системы перефразирования текстов
Системы перефразирования текстов (задача парафраза), когда необходимо, возможно в сжатом виде пересказать определенной статью, текст, заметку.
Системы выделения ключевых слов, тегов, тональностей текстов
Системы анализа текстов и выделения различных сущностей, среди которых ключевые слова и теги, тональности, стилю, типу и и т.д. В частности, такие системы используются для анализа ответов операторов колцентра (вежливо, грубо), отзывов и кометариев к статьям (положительный, отрицательный, нейтральный)
Примеры проектов