20:15 24.12.2021

OpenAI научил нейросеть редактировать изображения по текстовому описанию

Источник

Компания OpenAI, которая ранее разработала модель искусственного интеллекта GPT-3 и DALL-E, продемонстрировала нейросеть под названием GLIDE.

Об этом сообщает Synced.

Эта нейросеть может не только генерировать изображения по текстовому описанию, но и редактировать существующие - с сохранением экспозиции и стиля. Разработчики уже опубликовали исходный код сокращенной модели на GitHub, чтобы ее можно было протестировать.

Synced уточняет, что GLIDE искажает исходное изображение, добавляя гауссовский шум, а потом обращает процесс вспять и дорисовывает необходимые детали. По похожему принципу работает технология Google для увеличения разрешения. Нейросеть, по словам разработчиков, правит изображение буквально за секунды, причем способна учитывать тени. Система распознает как фото, так и репродукции картин и может адаптироваться под стиль и манеру художника. Создавать фотореалистичные изображения она тоже умеет.

Исследователи обучили GLIDE на 3,5 млрд параметров.

Читайте также

В 2019 г. сообщалось, что в Китае нейросеть Sogou хотят научить читать книги голосами авторов.
Нейроинженер Виктор Тот научил трех крыс играть в Doom - точнее, проходить кастомный уровень, построенный на движке Doom II.

техно