07:57, 29 июня 2026

Меньше памяти – больше смысла: учёные МГУ учат роботов «видеть» мир по-новому

Учёные факультета вычислительной математики и кибернетики МГУ имени М.В. Ломоносова предложили подход к распознаванию трехмерных объектов, основанный на представлении их в виде графов простых геометрических форм и применении графовых нейросетей.

Если кто-то попытается на словах объяснить, как выглядит автомобиль – на это уйдёт очень много времени и гигабайты информации. Можно описать каждую песчинку на его поверхности, каждую микротрещину, а можно сказать: «Это прямоугольный кузов на четырех цилиндрах-колесах». Второй вариант требует в миллионы раз меньше усилий, но суть объекта передает идеально.

Именно этот принцип лег в основу нового прорыва российских ученых. Исследователи факультета вычислительной математики и кибернетики (ВМК) МГУ имени М. В. Ломоносова предложили новейший метод распознавания трехмерных объектов, который позволяет искусственному интеллекту «видеть» мир, затрачивая на это минимум ресурсов.

Как сжать необъятное?

Современные роботы, беспилотные автомобили и системы дополненной реальности ориентируются в пространстве с помощью лазерных сканеров (лидаров) и камер глубины. На выходе они получают так называемые «облака точек» – миллионы пространственных координат, описывающих каждый окружающий предмет. Проблема в том, что хранение и обработка этих массивов данных требуют колоссальных объемов памяти и мощных, очень прожорливых процессоров.

Ученые МГУ предложили новое решение. Вместо того чтобы хранить миллиарды отдельных точек, алгоритм представляет объект как граф из простых геометрических фигур (примитивов). Вершины этого графа – сами фигуры, а связи между ними показывают, как эти элементы пересекаются и соприкасаются. Благодаря использованию минимального набора примитивов и всего одного типа связей объем сохраняемой информации сокращается в разы. Метод уже успешно протестирован на международном наборе 3D-моделей ShapeNet и представлен на конференции «Ломоносовские чтения».

Photo - Меньше памяти – больше смысла: учёные МГУ учат роботов «видеть» мир по-новому

Зачем это нужно обычным людям?

На первый взгляд, сложные алгоритмы обработки 3D-данных – удел узкопрофильных инженеров. Но на самом деле эта разработка напрямую повлияет на качество повседневной жизни. Например, она поможет развитию доступной робототехники. Если роботу не нужен суперкомпьютер на борту, чтобы понять, что перед ним стоит стул или лежит коробка, стоимость его производства резко упадет. Сервисные роботы в магазинах, госпиталях и на складах станут массовыми и доступными.

Кроме того, это отразится на БПЛА. Беспилотники, доставляющие посылки или лекарства, сегодня тратят огромную часть заряда батареи на работу мощных бортовых компьютеров. Облегчение «мозгов» дрона напрямую увеличит дальность и время его автономного полета. Также после внедрения разработки беспилотные такси и личные автомобили с автопилотом смогут обрабатывать дорожную обстановку мгновенно, прямо на борту, не тратя время на отправку данных в облако и обратно.

Стратегический суверенитет

В условиях технологического суверенитета Россия не может полагаться на зарубежное программное обеспечение для критически важных отраслей. Разработка МГУ укрепляет российские компетенции в области компьютерного зрения и графовых нейросетей.

Этот алгоритм может стать базовым компонентом для отечественных программных комплексов, управляющих робототехникой, беспилотным транспортом и системами промышленной автоматизации. Более того, метод позволяет создавать эффективные системы на доступной вычислительной аппаратуре, что снижает зависимость российской индустрии от дефицитных зарубежных чипов топ-уровня.

В тренде с мировым развитием

Российская наука не просто догоняет мировые тренды, но и задает свои направления в сфере «облегчения» искусственного интеллекта. Ретроспектива последних лет показывает четкую динамику.

Так, в 2023 году ученые ИТМО предложили метод построения 3D-модели человека по двум фотографиям с минимальными требованиями к ресурсам, что открыло путь к созданию виртуальных примерочных. В 2024 году российские исследователи сосредоточились на повышении точности нейросетей, а к 2025 году в ИТМО обобщили методы структурного анализа облаков точек для промышленного контроля. Метод МГУ 2026 года логично продолжает этот ряд, делая главный акцент не на усложнении, а на радикальном упрощении и сжатии данных без потери смысла.

Весь мир сегодня сталкивается с проблемой «тяжелого» 3D-зрения. Если метод МГУ успешно пройдет проверку в реальных, «шумных» условиях, он станет востребованным не только внутри страны, но и на экспортных рынках – в составе программных пакетов для робототехники и умных городов.

От лаборатории к реальным дорогам

Важно понимать: пока перед нами блестящая научная работа, а не готовый коммерческий продукт. Алгоритм протестирован на идеальных цифровых моделях. В реальном мире лидары и камеры сталкиваются с дождем, снегом, пылью, бликами и пропусками данных.

Ближайший шаг для ученых – проверить устойчивость графа к «шумам» и искажениям. Затем последует этап создания промышленных прототипов и интеграция алгоритма в реальные бортовые компьютеры роботов и автомобилей.

Подход к представлению трехмерных объектов в виде графов примитивов известен давно. Особенность нашей работы состоит в том, что объем сохраняемой информации удалось существенно сократить: используется минимальный набор геометрических примитивов и только один тип отношений между ними – наличие или отсутствие пересечений. Это позволяет уменьшить объем памяти, необходимый для хранения данных, оставляя при этом достаточно высокую точность распознавания

Илья Никольский

доцент кафедры суперкомпьютеров и квантовой информатики факультета ВМК МГУ

Наука и новые технологии