16:15, 10 мая 2026

Новый российский бенчмарк проконтролирует ИИ в дизайне белков

Ученые из AIRI, НИУ ВШЭ и Constructor University представили бенчмарк GeomMotif для оценки способности ИИ-моделей работать с геометрией белковых структур. Он включает 57 задач и позволяет выявлять, на каком этапе модели допускают ошибки. Работа представлена на конференции ICLR в Рио-де-Жанейро.

Как бы это странно не звучало, но искусственный интеллект научился фантазировать на языке биологии. Нейросети уже предлагают ученым новые белковые структуры, обещая революцию в создании лекарств и ферментов. Но мечта алгоритма часто разбивается о суровую реальность физического мира. Группа исследователей из Института AIRI, НИУ ВШЭ и Constructor University представила инструмент, который заставил генеративные модели отвечать за свои фантазии. Бенчмарк GeomMotif показал: там, где прежние тесты видели триумф, реальная геометрическая точность хромает на обе ноги.

Задача бенчмарка – проверить способность модели достраивать белок вокруг заданного структурного фрагмента с сохранением его точной 3D-геометрии. Ранее отдельного инструмента для такой оценки не существовало. В GeomMotif фрагменты отбираются по геометрическим и физико-химическим свойствам, а не по функции, что критично, поскольку даже отклонение на один ангстрем (внесистемная единица измерения длины, которая используется для измерения очень маленьких расстояний, таких как размеры атомов, молекул и длина световых волн) может резко снизить вероятность успешного проектирования.

Тест на геометрическую точность

До недавнего времени оценка ИИ-моделей, проектирующих белки, напоминала проверку архитектора по красивым рендерам, а не по чертежам. Большинство существующих бенчмарков фокусировались на биологической функции фрагментов: если модель выдавала что-то, отдаленно напоминающее нужный участок, тест считался пройденным. Однако в структурной биологии дьявол кроется в деталях, точнее – в ангстремах.

Разработчики GeomMotif сместили акцент на жесткую геометрию и физико-химические свойства. Задача бенчмарка прежде всего проверить, способна ли ИИ-система достроить белковую структуру вокруг заданного фрагмента, сохранив его точную трехмерную форму. Как подчеркивают эксперты CNews, отклонение геометрии даже на один ангстрем может критически снизить шансы на успех эксперимента. В лабораторных условиях «красивый» белок с нарушенной геометрией просто не свяжется с целевой молекулой, сделав месяцы работы бесполезными.

Photo - Новый российский бенчмарк проконтролирует ИИ в дизайне белков

Иллюзия совершенства

Результаты тестирования оказались отрезвляющими. Исследователи проверили десять систем двух типов. Если на привычных, «мягких» бенчмарках лидирующие модели демонстрировали почти стопроцентный результат, то GeomMotif заставил их попотеть. Лучшая из протестированных систем набрала лишь 40 баллов из 100.

Эта цифра отнюдь не повод для разочарований, а четкий сигнал развития. Она показывает, что современные ИИ-системы для дизайна белков обладают серьезным ограничением: они хорошо генерируют правдоподобные структуры, но плохо контролируют точную пространственную привязку. GeomMotif выступает не как генератор, а как строгий контролер, выявляющий «слепые зоны» алгоритмов. Без таких инструментов прогресс в области AI for Science рискует застрять на этапе красивых, но нерабочих прототипов.

От Нобелевки до AIRI

Появление GeomMotif не случайно вписывается в контекст последних лет. Тема ИИ в биологии стала мейнстримом после того, как в 2024 году Нобелевскую премию по химии вручили за предсказание и дизайн белков. Вслед за AlphaFold 3, научившейся моделировать сложные комплексы с ДНК и малыми молекулами, индустрия двинулась в сторону еще большей точности.

Россия в этой гонке занимает позицию не потребителя, а создателя инфраструктуры. Напоминанием тому служит активная работа отечественных ученых. Специалисты AIRI уже дорабатывали AlphaFold2 для предсказания эффектов мутаций, что критически важно для изучения болезней. В 2025 году совместно с Constructor University была представлена модель DiMA, способная генерировать белки с заданными характеристиками. GeomMotif логично завершает эту цепочку: мало создать модель или улучшить зарубежную, нужно иметь собственный инструмент для валидации результатов.

Суверенитет через точность

GeomMotif – не потребительский продукт, а научно-технологическая инфраструктура. Но в среднесрочной перспективе именно такие инструменты ускорят появление реальных лекарств. Бенчмарк позволяет отсеивать бесперспективных кандидатов, экономя ресурсы фармкомпаний.

Для России значимость проекта выходит за рамки чистой науки. Это вопрос технологического суверенитета в фармацевтике и биотехе. Чем точнее отечественные модели и инструменты их оценки, тем меньше зависимость от зарубежных платформ. Экспортный потенциал здесь скорее научно-технологический: Россия может предлагать миру методики оценки, датасеты и экспертизу. Однако конкуренция высока – США, Европа и Китай активно развивают свои стандарты. Чтобы GeomMotif стал мировым эталоном, потребуется открытый код и признание независимыми научными группами.

Будущее за гибридом

Прогноз на ближайшие годы очевиден: эпоха «слепого доверия» нейросетям заканчивается. Появится больше специализированных бенчмарков, проверяющих не только функцию, но и устойчивость. ИИ-дизайн белков станет стандартом в R&D, но он не отменит лабораторию. Даже самая совершенная модель требует экспериментальной проверки и регуляторной экспертизы.

GeomMotif доказал: российский научный сектор способен создавать сложные инструменты мирового уровня для оценки ИИ. Это важный шаг к тому, чтобы искусственный интеллект в биологии перестал быть просто генератором идей и стал надежным инженерным инструментом.

В дальнейшем мы планируем ускорить систему проверки результатов и расширить бенчмарк на новые классы генеративных белковых моделей. В первую очередь речь идет о полноатомных моделях, которые учитывают все атомы белка, а не только его остов

Павел Страшнов

ведущий научный сотрудник группы дизайна белков центра ИИ-разработки новых лекарственных препаратов института AIRI

Наука и новые технологии