Российские разработчики научили ИИ чётко распознавать голос в шумной среде

Нейросеть «Яндекса» понимает команды даже при громкой музыке или работе пылесоса.
Российские ИТ-специалисты создали алгоритм, который значительно улучшает распознавание речи в условиях сильного шума. Разработка применяется в умных устройствах «Яндекса»: колонки распознают команды даже при громких посторонних звуках — от пылесоса или при включённой воде.
Руководитель направления голосовой активации «Яндекса» Дмитрий Солодуха:
Новый алгоритм использует нейросетевой механизм внимания, анализирующий два сигнала одновременно — с шумоподавлением и эхоподавлением. В каждый момент времени система выбирает наиболее чёткий вариант, что значительно повышает качество распознавания. Технологию протестировали как на мощном серверном оборудовании, так и на малопроизводительных процессорах умных устройств.
Разработчики надеются, что открытая публикация метода ускорит развитие голосовых интерфейсов в России и мире, позволив другим компаниям создавать более совершенных ассистентов.
Эта разработка открывает новые перспективы для развития технологий распознавания речи. Повышение точности понимания голосовых команд даже в сложных акустических условиях позволит сделать умные устройства более удобными, надёжными и полезными в повседневной жизни пользователей.