Как создавать узнаваемых персонажей с помощью AI

preview_player
Показать описание
Как создавать узнаваемых (консистентных) персонажей с помощью AI 🧙🏻‍♂️ для тех, кто создаёт комиксы, иллюстрации к книгам, маскотов для своего бизнеса, или просто хочет сделать себе или друзьям классные аватарки.

Подписывайтесь в Телеграм на мой авторский блог. Там будет больше актуальной информации про ИИ инструменты и не только:

#ai #midjourney #stablediffusion
Рекомендации по теме
Комментарии
Автор

Привет. Поскольку была просьба оценить)) Инструмент интересный, но я как всегда за локальную установку. Поскольку с несколькими LORA 80 проходов, локально генерация занимает у меня около 10 секунд. Фактически все модели(сети) являются общедоступными. Конечно тут упрощён интерфейс, но на ютубе полно уроков, как создавать свои LORA и textual embedding. (для справки LORA формат разности весов, позволяющий используя маленький размер файла разности LORA, до обучить базовую модель) С гораздо большими возможностями повлиять на результат. Это не критика, просто моё собственное мнение. Что бы быть полезным расскажу о своём опыте. (поскольку тут не любят ссылок, то все значимые имена приводят к ним по поиску в гугл) Я перешел на форк AUTOMATIC1111, это vladmandic automatic. У меня карта 3080 и это позволяет использовать преимущества Ampere в Torch 2.0.0+cu118, на которую заточен форк(установка в один клик). Оптимизация не только увеличивает скорость работы но и поскольку проводит оптимизацию работы с вниманием модели даёт ощутимо лучшие результаты. Даже при отсутствии негативного промпта значительно уменьшаются анатомические искажения, по сравнению с AUTOMATIC1111. По моделям, поскольку их на civitai просто немеряно. Некоторое время лучшей(общего назначения) была Deliberate2, её обогнала ChilloutMix, но по моему только по генерации сексапильных кореянок)) Так, что Deliberate2 по прежнему лучшая. Лучшая в моём контексте, это предсказуемая реакция модели на промпт, позволяющая получить желаемый результат. Без излишнего сжатия разнообразия(как в ChilloutMix все лица будут слегка корейскими). Далее идут специализирующиеся модели. Опять это только мой взгляд, базирующийся на моём опыте. Модель revAnimated_v122 и Это модели 3D гиперреализма, зачастую почти неотличимые от реального фото, но всё же ориентированные на 3D комикс и аниме. Модели крайне разнообразные и пластичные по отношению к промпту. Особо отмечу модель aZovyaRPGArtistTools_v2Art. Меня она задела огромной выразительностью. Это стиль книжной иллюстрации с явным влиянием импрессионизма. Опишу свои впечатления от простого теста. Промпт женщина сидящая на корточках(вписаться в квадрат). Фактически все реалистичные модели дали при разных сидах позу лишь слегка отличающуюся положением рук и ног. RPGArtist, дала наибольшее разнообразие, где значительно менялся ракурс и сама поза. Но самое интересное было когда я добавил пожелание, что бы поза выражала трагизм(сексапильность, счастье, испуг и т.д.) Все остальные модели почти не поменяли результат, а RPGArtist реально в большинстве случаев сумел выразить то что я просил, проявив максимально творческий потенциал и разнообразие. При переработке базовой модели, всегда что то теряется и что то приобретается. Эта модель потеряла многообразие стилей, но получила за счёт этого большую выразительность. Потом идут модели специализирующиеся на аниме "И несть им числа". Тут важно понять, что для этих моделей самое важное, это LORA которые под них делались, в не этой задачи, они все делают аниме)) Самая общая Anything-V3.0(появились более новые версии). Более специализированные и важные с точки зрения LORA разные orangemix и самое частое abyssorangemix3AOM3_aom3a1b, которые упоминают как AOM. Ну и куда же без порно)) Пожалуй это самые любопытные модели. Ближайший конкурент Deliberate2 это artErosAerosATribute_aerosNovae, трудно сравнивать, но Deliberate2 ощущается как более послушная.

Мне для использования под Unity приходится оценивать модели по занимаемому месту в видео памяти и к сожаления aZovyaRPGArtistTools_v2Art с 6 гиг мало подходит(иначе это был бы мой выбор). Я выбрал deliberate_v2 общая, гиперреализм, randomizer89merge_v10 аниме, meinahentai_v21 аниме. С ними неплохо работают большинство LORA, они занимают чуть больше 2 гиг памяти, что оставляет больше места для моделей языка и самого Unity. Ну и они сами по себе довольно приличны, если не учитывать, что deliberate_v2 вообще лидер.

OldAlexander
Автор

Спасибо за видео. Интересно и информативно (хотя немного подзатянуто). Странно что так мало подписчиков и комментариев

Elena_IA
Автор

смотрел 1 ч 3 м Что сказать ? Не могут нейросети заменить Daz3D, пока еще не могут. Возьни с ними больше чем в самом дазе, а непредсказуемость вообще безграничная. Ну как работать с такой непредсказуемостью результатов?
И в нейросетях мы не можем ни камеру выставлять, ни персонажа переодевать, ни локации, ни позы, я уже не говорю про нсфв ограничения (гениталии показывать). Т.е. как режисеры мы вообще без права голоса. Даз ограничен лишь библиотекой, пользуйся тем что есть либо заказывай 3Д художникам или сам создавай. Но это уже другие знания. Для статичных картинок что может быть лучше даза, была надежда что нейросети будут проще, но пока что не так, а про "что лучше" даже стыдно сказать...
Автор, ну реально, на сегодняшний день какая программа сможет давать те красивые отренденные картинки как мы хотим? Да, дазовский интрефейс тяжелее нейросетей, комп нужен "жирный", у меня рендерстейшэн i-9 12KF, RTX 3090 24GB x2, 124GB ram, 2Tb SSD и всякаое такое, но все равно хочется что-то менее трудозатратное чем Даз но полностью подконтрольное нам как Даз, и желательно с возможностью анимирования как анрил 5, нейросети пока этого не выдают. Я не умею в анрил, наверное проще его освоить чем ждать пока нейросети позволят обходиться без него.
Я и у Хачатура(ХpucT) все видео смотрю, и в его дискорте лазаю, и в его бусте, и у другого нейрохудожника(имя вылетело из головы а зайти глянуть лень, ха ха). Что мы имеем: с большими времязатратами еще как-то люди создают нейтральные или эротические картинки, но с анимацией полная беда.

sakarmotor