Последнее

ИИ стал создавать картинки за доли секунды

18.04.26, 04:30 958

Российские ученые ускорили генерацию изображений в разы.

ИИ стал создавать картинки за доли секунды

Фото: inbusiness.kz/сгенерировано при помощи ChatGPT

Создание изображений с помощью нейросетей, которое еще недавно занимало несколько секунд, теперь может происходить почти мгновенно. Российские исследователи представили метод, способный радикально ускорить работу генеративного ИИ, не жертвуя качеством результата, передает inbusiness.kz со ссылкой на ТАСС.

Исследователи в России разработали подход, который позволяет в несколько раз ускорить работу генеративных систем ИИ за счет уменьшения числа шагов, необходимых для подготовки изображений, и снижения их разрешения на первых этапах этого процесса.

"Предложенный командой ученых Yandex Research и НИУ ВШЭ метод сокращает время генерации с нескольких секунд до 0,3-0,4 секунды при сохранении визуального качества. В результате, это позволяет быстрее и дешевле использовать современные диффузионные модели и делает их более доступными для практического применения", — говорится в сообщении пресс-службы Yandex Research.

Как объясняют исследователи, существующие диффузионные модели ИИ генерируют изображения пошаговым образом. На первых этапах этого процесса формируется только общая структура изображения, которая постепенно достраивается до картины, которую описал пользователь в своем запросе. В общей сложности этот процесс включает в себя около 20-50 шагов, исполнение которых требует много времени и вычислительных ресурсов.

"Российские исследователи разработали подход, который позволяет существенным образом ускорить этот процесс сразу двумя путями. Во-первых, ученые предложили снизить разрешение на первых шагах генерации изображений, когда их мелкие детали еще не различимы, а также при этом они создали особый подход, позволяющий использовать крупные системы ИИ, такие как алгоритмы FLUX и Stable Diffusion, для обучения более простых генеративных моделей", - рассказали в пресс-службе исследовательской компании.

В рамках этого подхода исследователи применили особый математический подход, который позволяет сравнивать то, как модель-учитель "видит" изображение на своих внутренних уровнях обработки, с тем, как модель-студент представляет то же изображение. Это существенным образом ускоряет обучение и позволяет отказаться от использования вспомогательных моделей, что упрощает данный процесс.

Как показали проведенные учеными эксперименты, созданный ими подход позволяет в несколько раз ускорить генерацию и изображений, и видеороликов, и при этом не потерять в качестве получаемого контента, как по оценкам пользователей, так и по различным автоматическим метрикам.

"В перспективе, это позволит сделать генеративные системы ИИ более доступными и удобными для использования", - подытожили исследователи.

Подобные решения могут серьёзно изменить рынок цифрового контента. Ускорение генерации открывает возможности для использования ИИ в реальном времени — от видеоигр и киноиндустрии до маркетинга и образования. При этом снижение вычислительных затрат делает технологии доступнее не только крупным компаниям, но и небольшим командам разработчиков.

Речь идет не просто об очередном улучшении, а о важном шаге к массовому внедрению генеративного ИИ в повседневные сервисы. Быстродействие становится ключевым фактором, и новый подход российских ученых может задать новый стандарт для всей индустрии.

Читайте по теме:

Посоветоваться с ChatGPT теперь будет непросто