Как Искусственный Интеллект (ИИ) может сделать стоковые фотографии ненужными

Getty Images однажды может быть не на кого подать в суд за копирайт

Стоковые фотографии — проклятие для многих маркетологов и дизайнеров. Крупные поставщики изображений непомерно дороги, в то время как доступные по цене все очень похожи друг на друга.

В TheNextWeb мы плавно преодолеваем эти барьеры, создавая нестандартные шедевры, такие как эти великолепные фотографии Марка Цукерберга :

Марк Цукерберг

Марк, я обещаю, что не имею к этому никакого отношения. Предоставлено: The Next Web.

К сожалению, не все наделены такой виртуозностью, в том числе и ваш покорный слуга.

К счастью, вскоре ИИ сможет скрыть нашу художественную неспособность, позволив создавать фотореалистичные изображения.

Новая демоверсия Nvidia GauGAN2 дает представление о потенциале. Система может перевести текст в реалистично выглядящие фотографии, которые  затем можно редактировать по вашему желанию.

Модель, основанная на генеративных состязательных сетях (GAN) , объединяет отображение сегментации, рисование и создание изображения из текста.

Вы можете использовать эти функции для создания чего-то волшебного, например единорогов и радуги, или чего-то более реалистичного, например, апокалипсиса.

Демо лучше всего работает с простыми описаниями природы, такими как «закат на каменистом пляже» или «снег в горах». Более сложный текст может давать странные результаты, но это дает системе возможность выставить напоказ свои возможности редактирования.

Вы можете создать карту сегментации объектов в сцене, а затем переключиться в режим рисования, чтобы нарисовать любые изменения. Затем умная кисть GauGAN2 преобразует эскизы в стиль фотографии.

Эта функция позволяет вносить реалистичные изменения, например добавлять дерево или увеличивать гору. Его также можно использовать для создания потусторонних образов.

Модель искусственного интеллекта, лежащая в основе GauGAN2, была обучена на 10 миллионах высококачественных пейзажных изображений с использованием суперкомпьютера NVIDIA Selene , системы NVIDIA DGX SuperPOD, входящей в десятку самых мощных суперкомпьютеров в мире. Исследователи использовали нейронную сеть, которая изучает связь между словами и изображениями, которым они соответствуют, такими как «зима», «туман» или «радуга».

По сравнению с современными моделями, специально предназначенными для приложений преобразования текста в изображение или сегментации карты в изображение, нейронная сеть, стоящая за GauGAN2, обеспечивает большее разнообразие и более высокое качество изображений

«Представьте себе, например, воссоздание ландшафта культовой планеты Татуин во франшизе « Звездных войн », на которой изображено два солнца», — сказал Ишан Салиан из Nvidia в своем блоге .

«Все, что нужно, — это текст «солнце над дюнами в пустыне», чтобы создать отправную точку, после которой пользователи могут быстро рисовать на втором солнце».

Солнце в пустыне

Результаты не всегда идеальны, но этот подход имеет огромный потенциал. Возможно, скоро мы откажемся от стоковых фотографий в пользу бесконечно настраиваемого генератора изображений AI.

Источник — TheNextWeb.

Не забудьте подписаться на наш Telegram канал с актуальными новостями о фотостоках и интересной информацией. Коротко и полезно.

[mc4wp_form]

Последнее изменение: 27 ноября 2021 в 16:24.