16:30, 30 июля 2025

Российские разработчики научили ИИ чётко распознавать голос в шумной среде

Нейросеть «Яндекса» понимает команды даже при громкой музыке или работе пылесоса.

Российские ИТ-специалисты создали алгоритм, который значительно улучшает распознавание речи в условиях сильного шума. Разработка применяется в умных устройствах «Яндекса»: колонки распознают команды даже при громких посторонних звуках — от пылесоса или при включённой воде.

Руководитель направления голосовой активации «Яндекса» Дмитрий Солодуха:

«до сих пор не существовало универсального решения, которое одинаково эффективно работало бы как в лабораторных условиях, так и в реальной жизни».

Новый алгоритм использует нейросетевой механизм внимания, анализирующий два сигнала одновременно — с шумоподавлением и эхоподавлением. В каждый момент времени система выбирает наиболее чёткий вариант, что значительно повышает качество распознавания. Технологию протестировали как на мощном серверном оборудовании, так и на малопроизводительных процессорах умных устройств.

‎Разработчики надеются, что открытая публикация метода ускорит развитие голосовых интерфейсов в России и мире, позволив другим компаниям создавать более совершенных ассистентов.

‎Эта разработка открывает новые перспективы для развития технологий распознавания речи. Повышение точности понимания голосовых команд даже в сложных акустических условиях позволит сделать умные устройства более удобными, надёжными и полезными в повседневной жизни пользователей.

Наука и новые технологии