«Сбер» разработал первую в мире нейросеть, создающую изображения по словесному описанию
Пресс-служба Сбера сообщила о разработке нейросети ruDALL-E, создающей изображения по словесному описанию
:format(webp)/aW1hZ2VzL2FydGljbGVzL2NvdmVyLzA3YTRjNzdiLWZiMWUtNDI0Mi05NGFiLTUwMTYxMDY0YWMxMC9SSUFOXzYzNDQwMDYuTFIucnUuanBn.webp?w=1920)
Специалисты «Сбера» сделали нейронную сеть, которая может создавать изображения, используя при этом только текстовое описание на русском языке. Об этом сообщила пресс-служба компании.
«Нейросеть ruDALL-E одновременно обучается на двух видах данных — изображениях и текстах — и позволяет создавать неограниченное число новых изображений по заданному описанию», — сказано в сообщении пресс-службы «Сбера», которое процитировал ТАСС.
В компании отметили, что нейросеть можно использовать для создания вариантов дизайна интерьера, векторных иллюстраций, стоковых изображений, а также материалов для копирайтинга, рекламы, архитектурного и промышленного дизайна.
Авторы разработали две версии нейросети, в каждой содержится разное количество параметров. Модель ruDALL-E XL можно бесплатно загрузить с сервиса Github. Оба варианта разработки, в том числе расширенная версия ruDALL-E 12B, представят на платформе ML Space компании SberCloud, которая входит в экосистему «Сбера».
Создание изображений с помощью ruDALL-E проходит в несколько этапов. Сначала искусственный интеллект принимает текст и генерирует заданное число картинок, потом выбирает, какие изображения максимально соответствуют описанию и наиболее удачны, в конце нейросеть увеличивает их в размере без потери качества.