Русский ИИ учится чувствовать эмоции: как ВШЭ создаёт «золотой стандарт» для эмоционального ИИ

Лингвисты питерского НИУ ВШЭ создали эмоциональный словарь для обучения искусственного интеллекта.
Что внутри «эмоционального словаря»?
Искусственный интеллект должен распознавать эмоции человека, который с ним общается. Без этого невозможно эффективное развитие технологии.
Лингвисты НИУ ВШЭ в Санкт-Петербурге представили принципиально новый словарь, предназначенный для нейросетей. Это мультимодальный «эмоциональный словарь» — набор данных, целевая опорная точка для систем, распознающих эмоциональные состояния. Этот проект Лаборатории языковой конвергенции продолжает восполнять нехватку качественных русскоязычных данных и может стать важной вехой в развитии отечественного искусственного интеллекта (ИИ).

Ресурс включает 909 видеозаписей общей длительностью почти 173 минуты. Каждый фрагмент размечен по шести базовым человеческим эмоциям: радость, удивление, злость, страх, грусть и отвращение. Уникальность датасета — в его мультимодальности: одни и те же проявления эмоций представлены в четырёх форматах — полное видео, аудио, текст и видео без звука. Это позволяет сравнивать эффективность моделей при работе с данными разных типов и тестировать мультимодальные системы.
Зачем это России и миру?
До сих пор качественные мультимодальные датасеты для русского языка были редкостью. Западные аналоги, такие как CMU-MOSEI, ориентированы на английский язык, игнорируя культурные особенности выражения эмоций. Для развития российских технологий необходимы именно датасеты для русского языка.
Новый словарь не только закрывает этот пробел, но и создаёт основу для разработки современного эмпатичного ИИ, способного понимать тонкости русской речи и особенности невербалики.
От науки к применению
Проект стал логичным продолжением предыдущих инициатив — бимодального корпуса «Душа» (Dusha: самый большой открытый датасет для распознавания эмоций в устной речи на русском языке) и мультимодальной базы RAMAS.

Однако, в отличие от них, новый датасет изначально задуман как инструмент оценки и стандартизации. Он уже используется в пилотных проектах в ИИ-технологиях для сферы культуры. Например, в интерактивных решениях для Эрмитажа, где чат-боты адаптируются под эмоциональное состояние посетителей.
Будущее за эмоциональным ИИ
Впереди — расширение датасета: добавление всевозможных смешанных эмоций, а также возрастных, региональных и социальных контекстов. Учёные уверены, что новый российский ресурс быстро привлечёт внимание специалистов ИИ всего мира. В условиях роста значимости эмоционального интеллекта в образовании, медицине и сервисной поддержке такой шаг может вывести российскую науку в лидеры в этой нише.

Создание «эмоционального словаря» для нейросетей — не просто технологический прорыв. Это заявка на полную самостоятельность: русский язык с его богатой эмоциональной палитрой занимает важное место в мировой культуре искусственного интеллекта.