В России создали универсальный датасет для улучшения качества создаваемых ИИ-изображений

Испытания показали повышение качества визуального контента
Группа российских исследователей разработала инновационный датасет. Он позволяет значительно улучшить качество визуального контента, создаваемого ИИ.
Отечественным учёным удалось автоматизировать процесс создания обучающих данных, используя диффузную генеративную систему. Это позволяет на порядок сократить объём требуемой выборки — эффективность доказана на наборе всего из 3 350 пар изображений с текстовыми описаниями.
Отечественный датасет решает одну из самых распространённых проблем современных генеративных моделей — зависимость от закрытых или узкоспециализированных датасетов. Большинство коммерческих компаний используют для обучения нейронных сетей недоступную публично информацию, что ограничивает возможности независимых исследователей. Российская методика предлагает универсальное решение, применимое как для научных исследований, так и для дообучения коммерческих моделей.
Тестовые испытания доказали эффективность — эстетика и сложность создаваемых ИИ-изображений выросли на 12–20%. При этом содержание соответствовало текстовому запросу пользователя. Об этом сообщает издание ТАСС со ссылкой на пресс-службу «Яндекса».
Разработка особенно ценна для задач тонкой настройки ИИ под специфические требования. При решении подобных задач традиционно требовались трудоёмкие ручные подборки обучающих данных.