Стереозрение для робота
Ученые Московского физико-технического института (МФТИ) представили инновационную разработку в области компьютерного зрения – систему Un-ViTAStereo. Эта технология позволяет точно определять дистанцию до объектов, не прибегая к использованию дорогостоящих лидаров и трудоемкой ручной разметки снимков.

Российские ученые создали систему компьютерного стереозрения, позволяющую оценивать расстояние до объектов с помощью видеокамеры без использования дополнительных сенсоров. Суть инновации заключается в отказе от зависимости от лидаров – лазерных сканеров, которые обеспечивают точность, но стоят дорого и часто страдают от атмосферных помех. Новая технология позволяет роботам точнее определять расстояние до объектов, работая в условиях плохой видимости: в сумерках, дожде, снегу или пыли.
Новое слово в автопилотировании автомобилей и навигации автономных роботов
Даже самые современные процессоры значительно уступают человеку в скорости анализа высококачественных изображений для определения расстояния до движущихся объектов и траектории их перемещения. Такая задержка создает фундаментальные риски при использовании роботов, дронов и автономных транспортных средств.
Новая нейросеть показывает высокую эффективность в сложных ситуациях, где традиционные аналоги ошибаются: в условиях тумана, при анализе густой листвы или однородных поверхностей вроде гладких стен. Подход может быть внедрен в системы автопилотирования автомобилей и навигации автономных роботов.

Как учили новую нейросеть
Разработчики использовали в технологии специального «учителя» для нейросети – DepthAnything V2. Анализируя картинку с камеры, он не вычислял расстояние в абсолютных величинах, а с высокой долей уверенности определял их взаимное расположение, учитывая при этом особенности освещения и геометрии сцены. Механизм обучения брал в расчет только те данные, которые совпадали с «мнением» наставника, что заметно повысило точность работы нейросети.
В основу новой технологии положен принцип человеческого зрения, которое при внезапном появлении препятствий реагирует на движущиеся объекты, вместо того чтобы обрабатывать изображение целиком. Аппаратное обеспечение для реализации такого алгоритма построено на двумерных синаптических транзисторах – высокочувствительных чипах для детектирования движения. Эти транзисторы обладают тремя ключевыми свойствами: способностью обнаруживать изменения в изображении всего за 100 микросекунд (значительно быстрее человеческого глаза), удерживать информацию о движении более 10 000 секунд и выдерживать свыше 8000 рабочих циклов без деградации характеристик.
Получив кадр, система игнорирует статичную часть изображения и регистрирует только ключевые изменения, выделяя все движущиеся объекты, которые затем передаются стандартным алгоритмам для детальной обработки. В статье утверждается, что этот процесс более чем в 10 раз быстрее традиционных подходов.

Надежность автономных систем в руках российских учёных
Новая разработка - не массовый потребительский продукт, а инфраструктурная технология для робототехники, автономного транспорта, промышленных систем, беспилотников и сервисных машин. Её значимость для российской IT-отрасли в том, что речь идет не о “еще одной нейросети вообще”, а о конкретном алгоритмическом блоке для восприятия среды - то есть о том, что напрямую влияет на надежность автономных систем.
Устойчивое машинное зрение критически важно для железнодорожной отрасли, промышленной безопасности и спасательных работ.
В условиях, когда надежность восприятия среды становится ключевым фактором безопасности, возможность обходиться без тотальной зависимости от дорогих сенсорных систем удешевляет вход в автономные системы. Это открывает двери для массового внедрения роботов не только в мегаполисах, но и в удаленных регионах России, где климатические условия особенно суровы, а инфраструктура требует постоянного мониторинга.

Эра гибридных систем. Что ждет рынок в ближайшие годы?
С высокой вероятностью мы будем двигаться в сторону гибридных систем восприятия. Будущее не за одним типом датчиков, а за сочетанием камер, стереозрения, радаров и алгоритмов, компенсирующих слабые стороны друг друга. Ценность нового алгоритма МФТИ именно в том, что он может стать частью более дешевых и масштабируемых отечественных комплексов навигации.
Экспортный потенциал также нельзя сбрасывать со счетов. Если алгоритм действительно позволяет улучшать оценку расстояний без дорогого лидара, решение станет интересным для международных рынков логистики и агротеха.
Однако приоритет остается за внутренним рынком. Россия последовательно наращивает компетенции в связке «ИИ + робототехника + автономная навигация».









































