OpenAI научил нейросеть редактировать изображения по текстовому описанию
Компания OpenAI, которая ранее разработала модель искусственного интеллекта GPT-3 и DALL-E, продемонстрировала нейросеть под названием GLIDE.
Об этом сообщает Synced.
Эта нейросеть может не только генерировать изображения по текстовому описанию, но и редактировать существующие - с сохранением экспозиции и стиля. Разработчики уже опубликовали исходный код сокращенной модели на GitHub, чтобы ее можно было протестировать.
Synced уточняет, что GLIDE искажает исходное изображение, добавляя гауссовский шум, а потом обращает процесс вспять и дорисовывает необходимые детали. По похожему принципу работает технология Google для увеличения разрешения. Нейросеть, по словам разработчиков, правит изображение буквально за секунды, причем способна учитывать тени. Система распознает как фото, так и репродукции картин и может адаптироваться под стиль и манеру художника. Создавать фотореалистичные изображения она тоже умеет.
Исследователи обучили GLIDE на 3,5 млрд параметров.
Читайте также
У самурая нет цели, есть только путь. Мы боремся за объективную информацию.
Поддержите? Кнопки под статьей.