09:53, 07 January 2026

В России в прошлом году ИИ научили русскому языку

В 2025 году российские разработчики заметно продвинулись в создании языковых моделей для практической работы

Речь идет не о демонстрациях, а о технологиях, которые уже можно использовать в поиске, аналитике и корпоративных сервисах. Среди важнейших разработок года можно отметить семейство моделей GigaEmbeddings и языковую модель T-pro 2.0.

Векторы для русского языка

GigaEmbeddings — это модели векторных представлений текста, созданные специально для русского языка. Их задачей является перевод текста в числовые векторы, которые затем используются в семантическом поиске, классификации документов и выдаче рекомендаций.

В отличие от универсальных западных моделей, GigaEmbeddings обучались на больших русскоязычных массивах данных. Это дало в итоге более точное понимание смыслов, устойчивых выражений, идиом и длинных текстов. По результатам тестов, опубликованных разработчиками, модели соответствуют высоким показателям качества в задачах поиска и сопоставления текста на русском языке. Такие embedding-модели уже становятся базой для корпоративных ИИ-систем.

Рассуждения для русской интеллигенции

T-pro 2.0 представляет собой языковую модель другого класса. Ее главная особенность и назначение — ориентация на последовательное рассуждение и улавливание контекста. Модель использует гибридный механизм вывода. Это позволяет быстрее отвечать на запросы и экономить вычислительные ресурсы.

Разработчики изначально делали ставку не на высокие показатели «на бумаге», а на стабильность и прикладное использование, а здесь как раз важны минимальные требования к «железу». T-pro 2.0 рассчитана на анализ текстов, работу внутренних помощников и поддержки принятия решений. При этом модель соблюдает логику ответа и контекст, а не только генерирует тексты.

Обе разработки характеризуют общий сдвиг российского ИИ-рынка в сторону создания практически применимых продуктов.

Цифровые продукты и платформы