В этой статье разберем как работать с нейросетью, какие подводные камни и неожиданные моменты. Используем самую популярную бесплатную нейросеть для генерации изображений «Шедеврум» от Яндекса https://shedevrum.ai/
Основные особенности “Шедеврума”:
Вот подробная инструкция по созданию изображений в “Шедевруме”:
Структура эффективного запроса:
Практические советы:
Примеры запросов: “Милый котик смотрит на дождь через окно”
Что нельзя делать:
Работа с результатом:
При составлении запроса рекомендуется начинать с простого описания и постепенно добавлять детали, чтобы получить именно тот результат, который вы хотите. Чем точнее и детальнее запрос, тем лучше будет результат генерации.
Давайте разберемся на примере создания изображения под проект
Задача:
Создать изображение для главной страницы сайта «Стоматология» в соотношении сторон 16:9 и еще пару дополнительных изображений по теме.
Начнем с варианта, предложенного заказчиком: «Сочное, притягательное изображение, демонстрирующее не только красоту здоровых зубов, но и лидирующие позиции стоматологической клиники в профессиональной сфере. Идея использовать мотивы феи зубной и свежести леса и фруктов».
Запрос «Зубы фронтально, демонстрирующие красоту здоровых зубов, вокруг яблоки и цветы много солнца и капли росы, зеленый, оранжевый, белый, реалистичное изображение фото, вокруг летают феи»:

Первое сгенерированное изображение по запросу вышло немного пугающее, пробуем снова, добавляем деталей в описании и конкретики:
«Фея рядом в полный рост белоснежный зуб блестит на зеленой поляне, много солнца и капли росы, много цветов и яблок, сверху зубная щетка, зеленый, оранжевый, белый, реалистичное изображение фото, вокруг летают стрекозы феи, бабочки, зеленая поляна»:

Уже нормально, кроме феи, корректируем ее, добавляя детальное описание:
«Фея красивая девушка с зубной щеткой рядом в полный рост улыбающийся белоснежный зуб блестит на зеленой поляне, много солнца и капли росы, много цветов и яблок, сверху зубная щетка, зеленый, оранжевый, белый, реалистичное изображение фото, вокруг летают стрекозы феи, бабочки, зеленая поляна»:

Хорошо, но нам нужно меньше мультипликации, дорабатываем запрос:
«Фея красивая изящная женщина в руке зубная щетка, рядом зуб в полный рост улыбается белоснежный блестит на зеленой поляне, много солнца и капли росы, много цветов и яблок, сверху зубная щетка, зеленый, оранжевый, белый, реалистичное изображение фото, вокруг летают стрекозы феи, бабочки, зеленая поляна»:

Получаем корректировки от заказчика и понимаем, что идея изначальная не оправдала его ожидания, и концепцию нужно поменять. Эскизы отняли совсем немного времени, что помогло быстро скорректировать идею и понять заказчика. Меняем запрос на технологичность, которая отразит лидерство в отрасли.
Меняем запрос и начинаем подбирать запросы для эскиза:
«Роботизированная красивая женщина стоматолог, рядом зуб в полный рост, голографический эффект, реалистичное изображение фото»:

Получаем не то, что планировали, но не отчаиваемся и пробуем дальше. Генерация составляет всего 30 секунд, поэтому устраивает. Корректируем запрос и получаем:
«Роботизированная красивая женщина в стоматологическом кабинете смотрит в кадр, держит зуб с белоснежной улыбкой в полный рост, вокруг блестки, голубые, голографический эффект, прожекторы, белый струящийся свет, голубой, микронная точность ,высокое качество, глубина изображения, микромир, светлячки»:

Очень футуристично, добавляем жизненной энергии и опять корректируем запрос. Получаем несколько изображений по запросу с небольшой корректировкой в виде «белый робот рядом» и в целом устраивает:
«Красивая женщина в стоматологическом кабинете смотрит прямо, держит большой светящийся зуб с улыбкой в полный рост, вокруг блестки, голубые, очень светло, белый фон голографический эффект, прожекторы, белый струящийся свет, голубой, микронная точность ,высокое качество, глубина изображения, микромир, светлячки»:


Также генерируем дополнительные изображения для карточек в разных категориях по нашим запросам, оставляя неизменно строку «очень светло, белый фон голографический эффект, прожекторы, белый струящийся свет, голубой, микронная точность ,высокое качество, глубина изображения» и получаем интересные изображения:

Еще хочу поделиться довольно интересными вариантами видения моего запроса искусственным интеллектом. В какой-то момент понимаешь: «а может у него есть чувство юмора?» и нейросеть выдает промежуточные варианты для разгрузки монотонной генерации? Вот несколько примеров по запросам выше, они меня поразили:



Нейросети для генерации изображений прошли огромный путь развития за последние годы. От простых, примитивных картинок они пришли к созданию фотореалистичных изображений, способных обмануть даже искушённый взгляд.
А вы используете нейросети в своих проектах? Оставляйте комментарии и делитесь опытом.