bg
Наука и новые технологии
19:29, 06 августа 2025
views
3

AmbiK: как российский датасет меняет будущее «умных» помощников

Институт искусственного интеллекта (AIRI) и Московский физико-технический институт (МФТИ) при поддержке Центра робототехники Сбера выпустили AmbiK — крупнейший открытый набор данных для тестирования систем, которым предстоит понимать бытовые команды от людей. На данный момент даже самые продвинутые алгоритмы ошибаются в 80% случаев.

Когда ИИ не понимает, что значит «немного посолить»

Российские исследователи представили AmbiK - крупнейший в мире открытый набор данных, созданный специально для проверки, как робототехнические системы интерпретируют двусмысленные и неполные инструкции. Он включает в себя 2 тысячи бытовых задач с пометками по типу неоднозначности - от предпочтений до безопасности.

Главная особенность AmbiK - его фокус на уникальность. В отличие от стандартных инструкций, где всё чётко прописано, здесь моделируются проблемы с реальными бытовыми формулировками: «подогрей, пока не станет вкусно», «сделай покрепче» или «не пересоли». Каждая задача аннотирована по трем ключевым категориям неопределенности: общие знания (что означает «покипятить»?), выбор пользователя (сладко или нет?) и вопросы безопасности (можно ли предоставить плиту без присмотра?).

Результаты тестирования оказались ошеломляющими: даже самые передовые языковые модели справились лишь с двадцатью процентами задачи. Это не ошибка - это диагноз: современный ИИ пока не готов к миру, где всё неоднозначно и контекстуально и зависит от человека.

Самый крупный в мире датасет в своей нише

Ранее аналогичные наборы данных содержали не более 500–600 примеров. AmbiK почти вчетверо превосходил их по объему, что делает его крупнейшим ресурсом такого типа в мире. Его открытость — важный шаг для научного сообщества: любой исследователь может использовать данные для обучения и тестирования моделей.

Это особенное открытие для России. До сих пор в стране практически не было больших текстовых наборов данных, ориентированных на повседневное взаимодействие. AmbiK выполняет эту работу и становится первым отечественным проектом подобного масштаба в области языкового понимания для роботов.

Датасет пригоден не только для оценки распознавания нечетких команд, но и для систем, занимающихся планированием поведения. Идеальная механика впечатляет, но без автономного управления и способности к обучению она теряет ценность
quote

Значимость: от кухни до технологического суверенитета

Для граждан России AmbiK — путь к более интуитивным и безопасным ИИ-ассистентам. Представьте, что ваш «умный» холодильник или кухонный робот действительно понимает, что вы имеете в виду, когда говорите: «Сделай, как в прошлый раз».

Для России — шаг к технологическому суверенитету: развитие правильных датасетов, особенно в ключевой области «человек–робот», снижение зависимости от западных платформ и учет позиции страны в гонке за лидерство в ИИ и робототехнике.

Для мира AmbiK может стать новым стандартом. Открытость позволяет использовать его в качестве универсальной платформы для сравнения эффективности языковых моделей и системного планирования. Это «тренажёр» для ИИ, где теперь имеется не только знание синтаксиса, но и способность к здравому смыслу.

Перспективы: от науки до глобального экспорта

AmbiK — не просто набор данных, это фундамент для будущего. Во-первых, это открывает путь для экспорта российских IT-решений: набор дат может стать международным эталоном для оценки «понимания» роботами человеческих команд.

Во-вторых, он помогает адаптировать роботов к реальности — к нашим кухням, привычкам, культурным нормам. Больше не нужно будет копировать западные планы: теперь есть данные, отражающие нашу жизнь.

Для научного сообщества AmbiK — уникальный инструмент. Текстовые скрипты можно использовать для изучения языковых моделей без привязки к сенсорам или изображениям. Пошаговая разбивка инструкций позволяет проанализировать, на каком этапе планирования ИИ развивается — и где нужно улучшить логику.

Начало умного будущего

AmbiK — это не просто датасет. Это стратегический ресурс для развития «разумных» домашних роботов и ИИ-ассистентов. Его появление подчёркивает, что понимание языка — это не только про грамматику, но и про контекст, здравый смысл и безопасность.

Пока ИИ справляется лишь с 20% задач - но это не предел, а стартовая точка. В ближайшие годы можно ожидать глубокую интеграцию AmbiK в российские образовательные и исследовательские программы по ИИ и взаимодействию человека и робота. Датасет будет активно использоваться зарубежными лабораториями. Коллекция расширяться за счёт новых событий, жилых зон (ванная, гостиная) и даже социальных контекстов.

AmbiK — это не просто научный успех. Это вызов всему миру: научите свои модели понимать не только слова, но и смысл.

like
heart
fun
wow
sad
angry
Последние новости
Главное
Рекомендуем
previous
next