Перейти к основному содержанию

OpenAI научил нейросеть редактировать изображения по текстовому описанию

""

Компания OpenAI, которая ранее разработала модель искусственного интеллекта GPT-3 и DALL-E, продемонстрировала нейросеть под названием GLIDE.

Об этом сообщает Synced.

Эта нейросеть может не только генерировать изображения по текстовому описанию, но и редактировать существующие - с сохранением экспозиции и стиля. Разработчики уже опубликовали исходный код сокращенной модели на GitHub, чтобы ее можно было протестировать.

Synced уточняет, что GLIDE искажает исходное изображение, добавляя гауссовский шум, а потом обращает процесс вспять и дорисовывает необходимые детали. По похожему принципу работает технология Google для увеличения разрешения. Нейросеть, по словам разработчиков, правит изображение буквально за секунды, причем способна учитывать тени. Система распознает как фото, так и репродукции картин и может адаптироваться под стиль и манеру художника. Создавать фотореалистичные изображения она тоже умеет.

Исследователи обучили GLIDE на 3,5 млрд параметров.


Читайте также

  • В 2019 г. сообщалось, что в Китае нейросеть Sogou хотят научить читать книги голосами авторов.
  • Нейроинженер Виктор Тот научил трех крыс играть в Doom - точнее, проходить кастомный уровень, построенный на движке Doom II.

У самурая нет цели, есть только путь. Мы боремся за объективную информацию.
Поддержите? Кнопки под статьей.