10:51, 10 апреля 2026

Как новая российская разработка меняет правила игры в биоинформатике

Ученые Института искусственного интеллекта и цифровых наук (Института ИИиЦН) факультета компьютерных наук НИУ ВШЭ разработали модель, которая с точностью до 95% предсказывает, будут ли белки взаимодействовать друг с другом. GSMFormer-PPI использует три типа данных о белке, в том числе и о его поверхности, и анализирует связи между ними, в отличие от предыдущих моделей, где данные просто объединялись. Разработка может ускорить поиск молекулярных механизмов болезней, биомаркеров и потенциальных мишеней для лекарств. Работа опубликована в журнале Scientific Reports.

Белки – это главные «работники» клетки. Они передают сигналы, запускают реакции и собираются в комплексы. Если белки перестают правильно взаимодействовать, клетка даёт сбой, так начинаются многие болезни. Поэтому учёным критически важно знать, какие белки «дружат», а какие – нет.

Проверять все возможные пары белков в лаборатории очень долго и дорого. Если в исследовании сотня белков, возможных комбинаций – тысячи. На помощь приходит искусственный интеллект: он учится предсказывать взаимодействия, анализируя данные о молекулах.

Модель полного охвата

Система GSMFormer-PPI, предлагаемая исследователями ВШЭ, смотрит на каждый белок сразу с трёх сторон. Цепочка аминокислот – «текст», из которого собран белок (анализирует языковая модель ИИ). Анализируется 3D-форма – как эта цепочка сворачивается в пространстве (обрабатывает графовая нейросеть). Изучается поверхность молекулы – участки, через которые белки «узнают» друг друга. Прежде такие данные часто просто «складывали» в один набор признаков. Авторы GSMFormer-PPI пошли иначе: их нейросеть не механически объединяет данные, а ищет связи между ними.

Благодаря этому модель учится «видеть» белок целостно и предсказывать его взаимодействия с точностью 95,7%.

Photo - Как новая российская разработка меняет правила игры в биоинформатике

Зачем это нужно?

Прямого эффекта «завтра в аптеке» не будет. Но именно такие решения ускоряют поиск биомаркеров, расшифровку механизмов болезней и отбор мишеней для будущих лекарств. Для пациента это означает перспективу более точной диагностики и персонализированной терапии. Для науки – сокращение дорогостоящих лабораторных циклов: ИИ фильтрует гипотезы, оставляя учёным самые перспективные.

Россия в глобальной гонке «AI forbiology»

Разработка ВШЭ встраивается в мировой тренд: в 2024 году Нобелевскую премию по химии присудили за предсказание белковых структур, а компания GoogleDeepMind представила AlphaFold 3. Российская модель не копирует западные аналоги, а предлагает собственную архитектуру, что важно для технологического суверенитета. Проект реализован в рамках исследовательского ИИ-центра при государственной поддержке.

От статьи в журнале к реальным исследованиям

Перспективы развития лежат в двух плоскостях. На международном уровне это, прежде всего, экспорт экспертизы: публикация в Scientific Reports открывает дорогу к коллаборациям и цитированиям. Внутри страны – это интеграция модели в R&D-цепочки фармакологических компаний и академических лабораторий. Уже сегодня в России формируются комплексные ИИ-инструменты: например, система ChemCoScientist (ИТМО, 2026) автоматизирует полный цикл вычислительного поиска молекул. GSMFormer-PPI может стать важным модулем в этой экосистеме.

Что дальше?

Новая разработка не является готовым медицинским продуктом. Но это мощный исследовательский инструмент. В краткосрочной перспективе ожидаются доработка архитектуры, бенчмарки и пилотные внедрения. В скором времени модель может быть включена в отечественные платформы для drug discovery.

Российская ИИ-наука уверенно движется в сторону сложных задач мирового уровня, где цена ошибки высока, а выигрыш измеряется ускорением биомедицинских открытий.

При взаимодействии белков особенно важна их поверхность: именно через нее молекулы распознают друг друга и на ней сосредоточены физико-химические свойства, от которых зависит связывание. В нашей модели мы попытались учесть эту информацию вместе с последовательностью и трехмерной структурой белка, а затем не просто объединить признаки, а дать алгоритму возможность анализировать связи между ними. Именно это и позволило точнее предсказывать белок-белковые взаимодействия

Мария Попцова

директор Центра биомедицинских исследований и технологий Института ИИиЦН ФКН НИУ ВШЭ

Наука и новые технологии