13:34, 30 августа 2025

Русский ИИ учится чувствовать эмоции: как ВШЭ создаёт «золотой стандарт» для эмоционального ИИ

Лингвисты питерского НИУ ВШЭ создали эмоциональный словарь для обучения искусственного интеллекта.

Что внутри «эмоционального словаря»?

Искусственный интеллект должен распознавать эмоции человека, который с ним общается. Без этого невозможно эффективное развитие технологии.

Лингвисты НИУ ВШЭ в Санкт-Петербурге представили принципиально новый словарь, предназначенный для нейросетей. Это мультимодальный «эмоциональный словарь» — набор данных, целевая опорная точка для систем, распознающих эмоциональные состояния. Этот проект Лаборатории языковой конвергенции продолжает восполнять нехватку качественных русскоязычных данных и может стать важной вехой в развитии отечественного искусственного интеллекта (ИИ).

Photo - Русский ИИ учится чувствовать эмоции: как ВШЭ создаёт «золотой стандарт» для эмоционального ИИ

Ресурс включает 909 видеозаписей общей длительностью почти 173 минуты. Каждый фрагмент размечен по шести базовым человеческим эмоциям: радость, удивление, злость, страх, грусть и отвращение. Уникальность датасета — в его мультимодальности: одни и те же проявления эмоций представлены в четырёх форматах — полное видео, аудио, текст и видео без звука. Это позволяет сравнивать эффективность моделей при работе с данными разных типов и тестировать мультимодальные системы.

Зачем это России и миру?

До сих пор качественные мультимодальные датасеты для русского языка были редкостью. Западные аналоги, такие как CMU-MOSEI, ориентированы на английский язык, игнорируя культурные особенности выражения эмоций. Для развития российских технологий необходимы именно датасеты для русского языка.

То, что раньше делал лингвист на основе словаря, теперь делают вычислительные модели, только их словарь должен быть организован по-другому. Вместо пары «слово – толкование» используется пара «текстовый фрагмент – эмоциональная метка»

Анастасия Колмогорова

профессор НИУ ВШЭ в Санкт-Петербурге, заведующая Лабораторией языковой конвергенции, академический руководитель образовательной программы «Языковые технологии в бизнесе и образовании»

Новый словарь не только закрывает этот пробел, но и создаёт основу для разработки современного эмпатичного ИИ, способного понимать тонкости русской речи и особенности невербалики.

От науки к применению

Проект стал логичным продолжением предыдущих инициатив — бимодального корпуса «Душа» (Dusha: самый большой открытый датасет для распознавания эмоций в устной речи на русском языке) и мультимодальной базы RAMAS.

Однако, в отличие от них, новый датасет изначально задуман как инструмент оценки и стандартизации. Он уже используется в пилотных проектах в ИИ-технологиях для сферы культуры. Например, в интерактивных решениях для Эрмитажа, где чат-боты адаптируются под эмоциональное состояние посетителей.

Будущее за эмоциональным ИИ

Впереди — расширение датасета: добавление всевозможных смешанных эмоций, а также возрастных, региональных и социальных контекстов. Учёные уверены, что новый российский ресурс быстро привлечёт внимание специалистов ИИ всего мира. В условиях роста значимости эмоционального интеллекта в образовании, медицине и сервисной поддержке такой шаг может вывести российскую науку в лидеры в этой нише.

Создание «эмоционального словаря» для нейросетей — не просто технологический прорыв. Это заявка на полную самостоятельность: русский язык с его богатой эмоциональной палитрой занимает важное место в мировой культуре искусственного интеллекта.

Наука и новые технологии