12:18, 18 мая 2026

Научный интеллект: как российские ИИ-модели учатся понимать язык науки

Исследователи НИУ ВШЭ разработали подход к адаптации больших языковых моделей для работы с русскоязычной научной терминологией.

Специалисты Национального исследовательского университета «Высшая школа экономики» (НИУ ВШЭ) совершили важный шаг в развитии отечественного искусственного интеллекта. Они разработали подход к адаптации больших языковых моделей для работы с русскоязычной научной терминологией. Результат впечатляет: адаптированная модель работает в 2,7 раза быстрее и требует на 73% меньше памяти, чем исходная открытая мультиязычная система. Программа уже прошла государственную регистрацию.

Ключевая задача разработки – научить ИИ точнее анализировать российские научные тексты, патенты, отчёты и аналитические материалы. Здесь важны не только грамматика и синтаксис, но и профессиональный контекст: научно-технологическая терминология, связи между понятиями, отраслевые формулировки. Основой стал корпус данных iFORA-QA, вручную собранный более чем 150 экспертами Института статистических исследований и экономики знаний (ИСИЭЗ) НИУ ВШЭ из материалов в сфере науки, технологий и инноваций.

Photo - Научный интеллект: как российские ИИ-модели учатся понимать язык науки

Эффективность как преимущество: меньше ресурсов – больше возможностей

В условиях, когда вычислительные мощности остаются дорогим ресурсом, снижение требований к оборудованию–не просто техническое достижение, а стратегическое преимущество. Модель от ВШЭ может запускаться на более доступном «железе», что потенциально снижает стоимость внедрения ИИ в вузах, исследовательских центрах и организациях, где нет мощной GPU-инфраструктуры.

Это особенно значимо для России: технология попадает в один из главных трендов отечественного ИИ – создание собственных специализированных языковых моделей и прикладных ИИ-агентов для закрытых профессиональных контуров. В отличие от универсальных моделей, такая система ориентирована на российские источники, русскоязычную терминологию и научно-технологическую повестку.

Что получат наука и общество?

Разработка обеспечит ускорение научных и прикладных исследований, более быструю обработку патентов и научных публикаций, повышение качества экспертной аналитики. В перспективе это может ускорять появление новых медицинских, инженерных, образовательных и промышленных решений.

Для России разработка усиливает технологический суверенитет в сфере ИИ и научной аналитики. Это не просто очередной чат-бот, а специализированный инструмент для научно-технической аналитики, который может применяться в университетах, НИИ, госструктурах, корпорациях и R&D-подразделениях.

Умный поиск, графы связей и мультиагентные системы

Ближайшая перспектива – превращение адаптированной модели в комплексную систему научно-технической аналитики. Уже в 2026 году на базе модели планируется разработать дополнительные инструменты: «умный поисковик» со ссылками на научные источники, граф связей для выявления закономерностей и механизм работы с неполной или неоднозначной информацией. В дальнейшем эти возможности должны объединиться в мультиагентную систему для автоматического решения сложных аналитических задач.

Главные направления применения на внутреннем рынке: научная аналитика, поддержка принятия решений при анализе перспективных направлений и научных школ, поиск патентных рисков, мониторинг конкурентов, помощь исследователям в работе с большими массивами данных.

Сама идея специализированных национальных и отраслевых больших языковых моделей (LLM) актуальна на международном уровне. Российская разработка может быть интересна как пример адаптации ИИ к научной терминологии неанглоязычной страны и как подход к снижению ресурсоёмкости больших моделей.

Прямой экспорт такой модели может быть ограничен языковой специализацией, однако подход к созданию отраслевых языковых моделей на национальных корпусах данных может быть востребован в странах, где также есть проблема доминирования англоязычных данных в ИИ. Особенно перспективны рынки СНГ, БРИКС и дружественные юрисдикции.

Профессиональный ИИ вместо универсального чат-бота

Разработка НИУ ВШЭ важна не столько как отдельная нейросеть, сколько как свидетельство перехода на новый этап развития российского ИИ: от универсальных чат-ботов к специализированным профессиональным моделям. Главный практический эффект – повышение качества и скорости работы с русскоязычной научно-технической информацией.

Качество системы будет зависеть от полноты корпуса данных, прозрачности ссылок и защиты от «галлюцинаций». Если проект будет доведён до промышленного уровня, он может занять нишу специализированного ИИ-помощника для российской науки, технологической экспертизы и инновационной политики. Это один из элементов будущей инфраструктуры «научного ИИ» в России – профессионального инструмента для исследователей, аналитиков и инженеров.

Универсальные языковые модели знают много, но поверхностно. Нам же нужна модель, которая понимает, о чем пишут российские ученые и инженеры. Благодаря проведенным исследованиям мы смогли научить алгоритм мыслить в категориях предметной области, понимать связи между сложными понятиями и корректно интерпретировать запросы

Анастасия Малашина

главный аналитик проекта, научный сотрудник и ведущий эксперт Центра стратегической аналитики и больших данных ИСИЭЗ

Наука и новые технологии