В России нейросеть научили читать научные книги вслух
Новую систему на базе нейросетей научили превращать научные тексты в аудиоформат за считанные минуты

Специалисты Исследовательского центра искусственного интеллекта Новосибирского государственного университета создали технологию, способную трансформировать научную литературу в формат аудиокниг. Разработанный в НГУ сервис переводит научную литературу в аудиоформат. Система работает с PDF-файлами, извлекает текст, обрабатывает его и формирует готовую звуковую дорожку.
Весь процесс проходит автоматически. Нейросеть анализирует структуру документа, очищает текст от технических элементов и готовит материал для синтеза речи.
По данным университета, технология работает значительно быстрее традиционной записи аудиокниг. Конвертация текста в звук занимает примерно в шестнадцать раз меньше времени, чем запись с участием профессионального диктора.
Тысячи аудиокниг
Проект пока проходит стадию тестирования. За время апробации система уже создала аудиоверсии первой сотни научных изданий.
Разработчики подчеркивают, что технология расширяет способы доступа к научной информации. Аудиоформат помогает знакомиться с научной литературой в дороге или, например, на беговой дорожке. Кроме того, это важно для людей с нарушением зрения или просто аудиалов.
Следующий этап проекта связан с масштабированием. Команда планирует перевести в аудиоформат всю электронную библиотеку Новосибирского государственного университета. В ней хранится около семи тысяч изданий, включая книги университетского издательства.
После завершения пилотного этапа и анализа отзывов пользователей сервис предложат другим библиотекам и образовательным площадкам.
Фреймворк «Каппа»
Технологической основой сервиса стал фреймворк «Каппа». Его также разработали специалисты центра искусственного интеллекта НГУ. Платформа управляет сложными моделями и контролирует корректность работы нейросетей.
По словам разработчиков, весь фонд университетской библиотеки технически можно озвучить примерно за месяц. Подготовка материалов и проверка результатов потребуют значительно больше времени. На этот этап может уйти до года.
В университете подчеркнули, что вся работа проходит с соблюдением авторского права. Для обработки книг разработчики получают разрешения от правообладателей.








































