Сегодня я хочу показать вам как создать в STABLE DIFFUSION стилистический текст типа такого:
Прошлые мои посты по примерам интересных генераций собрали много плюсов и в комментариях просили так же писать шаги которые я проделываю что бы получить результат.
Итак, для создания текста по методу из поста вам понадобится фотошоп, сам stable diffusion, control net, препроцессор DEPTH, модель DEPTH для него. Вес контролнет"а можно убавить, желательно на 20-30%, я зачастую использую 0.7-0.75
Первым делом мы создаём в фотошопе нужный текст, далее на фон под него выкладываем картинку из гугла на соответствующую тему, что бы было контрастно, были тени, разные оттенки цветов в общем всё для того что бы нейронка могла за это зацепиться. Ещё я использвал инструмент "палец" что бы изменить очертания букв и придать им волнистость, жёсткость надо было изменить перед этим что позже выльется в небольшой косяк но это поправимо.
Для песка я в гугле ввёл Sand City
Джунгли - тоже реальное фото из гугла
Для воды взял картинку из океанариума и ещё потыкал сверху кистью что бы в промпте дописать - water particles, water splashes
После этого идём в раздел img2img в stable diffusion, добавляем туда картинку и накидываем описание, возьмём в пример ДЖУНГЛИ. Там должны быть trees, vines, swamp, leaves, bushes, flowers (деревья, лозы, болото, листья, кусты, цветы) ещё можно добавить detailed и всё это в positive подсказке. Силу каждого отдельного слова можно менять что бы получить больше или меньше того или иного в готовом результате
Негатив сразу приложу для самого идеального варианта 2d,cgi,render,cartoon,painting,illustration,drawing,anime,frame,pencil,(worst quality:2),(low quality:2),(normal quality:2)
Это позволит получить максимально реалистичный, не похожий на рисунок вариант.
В разделе RESIZE to выставляете размер картинки который у вас был изначально, я делал 1000 на 400, шум можно регулировать от 0.5 до 0.6 по моим наблюдениям это самые оптимальные числа. CFG scale 6-7 роли особой не играет. Чем больше добавите sampling steps - тем дольше будет генерироваться рисунок но в нём будет больше деталей с вашего запроса, оптимальное число - 25-40. Sampling method - мой самый любимый и частый для текста это DPM++ 2M Karras
первая генерация выдала такой результат
Поменяв сэмплинг метод на euler a я получил чуть другой результат
Добавил к запросу stone, rocks, moss - получил более вменяемый результат и решил обрабатывать дальше его
Картинку перетаскиваем в тот же img2img, отключаем control net и включаем ниже SD Upscale, настройки я выставляю всегда такие, размер плиток, размер увеличения и апскейлер
Обратите внимание что для апскейла тут желательно выбрать кое какие другие настройки, я ставлю 800 на 800, уменьшаю шум где то в 2 раза и ставлю сэмплинг метод HEUN. В самом промпте ничего менять не нужно
Первая обработка и получаю такой результат
красиво но хочу больше и делаю ещё один прогон этой картинки
Это уже готовый результат с небольшой коррекцией оттенков в фотошопе.
На первый взгляд незаметно но детали стали чётче. Есть небольшие размытости поверх букв в верхней части но это мой косяк так как я хотел при помощи "пальца" в фотошопе деформировать буквы и изменить их стандартные очертания, надо было выбирать жёсткую а не мягкую кисть.
Целью этого поста было показать вам как на скорую руку можно быстро сделать стилистичный текст для ваших картинок или заставок в видео. Остаётся только убрать фон и добавить текст туда куда вам понадобится.
P.S. Вы наверное заметили что хоть я и писал ЦВЕТЫ в запросе для джунглей - нейронка его не добавила. Это потому что нужно было ещё на этапе фотошопа взять красную кисточку и нарисовать поверх текста какие то цветные крякозябры, красные, жёлтые и синие. Нейросети было бы за что ухватиться при генерации и она нарисовала бы на их месте цветы. Исправить ситуацию поможет функция INPAINT но об этом как нибудь в другой раз, и то, если вам будет интересно.