"Фу, это нейросетка нарисовала, это ненастоящее искусство!" Конечно, весомый аргумент, и по большому счету верный, но иногда... Короче, решил я освоить эти ваши нейросети (да, я об этом уже писал, и те три человека, которые на меня подписаны, скорее всего знают об этом), а именно генерацию изображений через Стейбыл Дифьюжын.
Когда нужно сделать картинку, на которой будет что-то более или менее соответствующее запросу, то это не так уж и сложно. Но не всё так просто, когда у тебя есть чёткое видение того, как должен выглядеть конечный результат. А у меня как раз так, и мне нужно, чтобы изображение на экране абсолютно соответствовало изображению в моей голове. Художники таких называют "доёбистый заказчик (не отвечать)". Но нейросеть не возмущается, а смиренно принимает все правки, сколько бы их не было. А их у меня обычно туева хуча, причём с самых первых шагов.
Около 50 попыток уходит только на то, чтобы нейронка выдала мне эскиз, в котором все объекты расположены правильно (так, как мне надо, то есть), и который можно было бы взять за основу, постоянно добавляя и меняя выражения как в основном промте, так и в негативном. Далее следует изменение через инпэинт различных элементов типа предметов на фоне, прически, деталей одежды.
И вот изображение уже почти готово, осталось исправить некоторые мелкие детали типа аксессуаров, формы рта, цвета глаз, а так же количества и формы СРАНЫХ ПАЛЬЦЕВ!!!11 которые являются прямо больным местом сгенерированных изображений. Для этого засовываю картинку в графический редактор, дроблю её на элементы, и начинаю корректировать их уже по отдельности. И каждый из них проходит по несколько шагов инпэинта, клинапа, апскейла, и так по кругу, пока результат меня не удовлетворит.
Обычно хватает 5-10 операций, пока дело не доходит до рук и ПАЛЬЦЕВ, да что с вами не так?! Их должно быть 5 (ну, иногда 4, при определенном положении руки), не шесть, не три, а ПЯТЬ! Да, вот в этом месте должен быть ещё мизинец, понимаешь? Нет, большой палец должен быть с другой стороны, это правая рука, видишь в промте ключ (right hand)? И ногти должны быть одинакового цвета, а кольцо должно быть НА пальце, а не ВМЕСТО.
А иногда сложности возникают, откуда не ждёшь. Например, при попытке сгенерировать платье или майку. Проблема в том, что промты пишутся на английском, а в английском платье - это "dress" (одежда), а майка - это "t-shirt" (футболка). Может быть, есть более правильные слова, но май инглиш из бед и огорчений, я не знаю, как объяснить нейронке, что мне нужна майка, которая футболка, но без рукавов. Моих когнитивных способностей хватает только на то, чтобы прописать в промте "футболка", а в негативном промте "рукава". Вроде работает, но не всегда и не со всем.
Когда все детали отредактированны, я снова собираю их в графическом редакторе подобно паззлам, попутно настраивая сглаживания, прозрачности. Теперь сохраняю эту мозаику как один файл и, ура, у меня получилось именно то, что я хотел.
К чему этот пост? К тому, что генерация изображений иногда бывает чуть более сложным делом, чем просто прописывание нескольких фраз в поле промта. И иногда это бывает не рандомное изображение, а реализация вполне конкретного образа из головы автора. Но это, конечно же, не искусство. Как считаешь, юзернейм?