bg
Новости
15:48, 05 марта 2026
views
9

В России нейросеть научили читать научные книги вслух

Новую систему на базе нейросетей научили превращать научные тексты в аудиоформат за считанные минуты

Фото: iStock

Специалисты Исследовательского центра искусственного интеллекта Новосибирского государственного университета создали технологию, способную трансформировать научную литературу в формат аудиокниг. Разработанный в НГУ сервис переводит научную литературу в аудиоформат. Система работает с PDF-файлами, извлекает текст, обрабатывает его и формирует готовую звуковую дорожку.

Весь процесс проходит автоматически. Нейросеть анализирует структуру документа, очищает текст от технических элементов и готовит материал для синтеза речи.

По данным университета, технология работает значительно быстрее традиционной записи аудиокниг. Конвертация текста в звук занимает примерно в шестнадцать раз меньше времени, чем запись с участием профессионального диктора.

Тысячи аудиокниг

Проект пока проходит стадию тестирования. За время апробации система уже создала аудиоверсии первой сотни научных изданий.

Разработчики подчеркивают, что технология расширяет способы доступа к научной информации. Аудиоформат помогает знакомиться с научной литературой в дороге или, например, на беговой дорожке. Кроме того, это важно для людей с нарушением зрения или просто аудиалов.

Следующий этап проекта связан с масштабированием. Команда планирует перевести в аудиоформат всю электронную библиотеку Новосибирского государственного университета. В ней хранится около семи тысяч изданий, включая книги университетского издательства.

После завершения пилотного этапа и анализа отзывов пользователей сервис предложат другим библиотекам и образовательным площадкам.

Фреймворк «Каппа»

Технологической основой сервиса стал фреймворк «Каппа». Его также разработали специалисты центра искусственного интеллекта НГУ. Платформа управляет сложными моделями и контролирует корректность работы нейросетей.

«Решение оказалось крайне эффективным и не требует колоссальных вычислительных мощностей, поскольку на одну книгу уходит в среднем всего полчаса процессорного времени», – отметил ведущий научный сотрудник центра ИИ Евгений Павловский.

По словам разработчиков, весь фонд университетской библиотеки технически можно озвучить примерно за месяц. Подготовка материалов и проверка результатов потребуют значительно больше времени. На этот этап может уйти до года.

В университете подчеркнули, что вся работа проходит с соблюдением авторского права. Для обработки книг разработчики получают разрешения от правообладателей.

like
heart
fun
wow
sad
angry
Последние новости
Главное
Рекомендуем
previous
next