Я обычно не выкладываю промпты. Но вот что-то последнее время попадается на глаза красота с использованием стилевых кодов для MJ. Заодно и расскажу, как это работает на уровне имплементации.
Что такое эти стилевые коды?
Кроме текстового промпта на вход можно подать ссылку на референсную картинку (или несколько), в стиле которой и будет финальная генерация. MJ не раскрывают имплементацию этой фичи (боятся конкуренции). Но почти наверняка это работает на базе IP-Adapter – это штука, которая позволяет дотюнить диффузию так, чтобы кроме текстового промпта на вход можно было также подавать референсную картинку. Это может использоваться как для генерации нескольких картинок в одном стиле, так и для консистентности персонажа. Картинка преобразуется в вектор с помощью CLIP, который затем скармливается в продублированные параллельно с оригинальными cross-attention слои в каждом слое трансформера (в случае DiT или SD3) или в соответствующих слоях Unet. Иногда еще добавляют LoRA чтобы слегка подстроить оригинальные cross-attention слои, работающие с текстом.
Так вот, самые интересные стили могут быть "закешированы" на сервере в виде векторов, которым назначены номера. Затем эти стили можно легко и быстро переиспользовать, если известен номер. Это и делает аргумент
Вот моя подборка таких sref кодов (по номерам картинок в посте):
1.
2.
3.
4.
5.
6.
7.
Коды, кстати, можно мешать и даже выставлять веса для каждого через
Больше стилей и кодов к ним можно посмотреть в этой галлерее: midjourneysref.com
@ai_newz
Что такое эти стилевые коды?
Кроме текстового промпта на вход можно подать ссылку на референсную картинку (или несколько), в стиле которой и будет финальная генерация. MJ не раскрывают имплементацию этой фичи (боятся конкуренции). Но почти наверняка это работает на базе IP-Adapter – это штука, которая позволяет дотюнить диффузию так, чтобы кроме текстового промпта на вход можно было также подавать референсную картинку. Это может использоваться как для генерации нескольких картинок в одном стиле, так и для консистентности персонажа. Картинка преобразуется в вектор с помощью CLIP, который затем скармливается в продублированные параллельно с оригинальными cross-attention слои в каждом слое трансформера (в случае DiT или SD3) или в соответствующих слоях Unet. Иногда еще добавляют LoRA чтобы слегка подстроить оригинальные cross-attention слои, работающие с текстом.
Так вот, самые интересные стили могут быть "закешированы" на сервере в виде векторов, которым назначены номера. Затем эти стили можно легко и быстро переиспользовать, если известен номер. Это и делает аргумент
--sref <код-стиля> после промпта в MJ.
Вот моя подборка таких sref кодов (по номерам картинок в посте):
1.
--c 8 --sref 4158384349 --p --s 1000 --ar 1:1
2.
--sref 340668170
3.
--sref 981744181
4.
shot, underwater --c 30 --ar 2:3 --sref 981744181 --p --s 500
5.
--sref 3677111049 {--style raw}
6.
--sref 885020885 --style raw --ar 2:3 --sw 200 --stylize 300
7.
--sref 1693082081
Коды, кстати, можно мешать и даже выставлять веса для каждого через
::
. В этом случае эти закешированные вектора линейно интерполируются. А параметр --sw 0-100
меняет вес всего стиля (style weight). Ну, и небольшой промптинг для полировки всё-таки может понадобиться.Больше стилей и кодов к ним можно посмотреть в этой галлерее: midjourneysref.com
@ai_newz
group-telegram.com/ai_newz/2992
Create:
Last Update:
Last Update:
Я обычно не выкладываю промпты. Но вот что-то последнее время попадается на глаза красота с использованием стилевых кодов для MJ. Заодно и расскажу, как это работает на уровне имплементации.
Что такое эти стилевые коды?
Кроме текстового промпта на вход можно подать ссылку на референсную картинку (или несколько), в стиле которой и будет финальная генерация. MJ не раскрывают имплементацию этой фичи (боятся конкуренции). Но почти наверняка это работает на базе IP-Adapter – это штука, которая позволяет дотюнить диффузию так, чтобы кроме текстового промпта на вход можно было также подавать референсную картинку. Это может использоваться как для генерации нескольких картинок в одном стиле, так и для консистентности персонажа. Картинка преобразуется в вектор с помощью CLIP, который затем скармливается в продублированные параллельно с оригинальными cross-attention слои в каждом слое трансформера (в случае DiT или SD3) или в соответствующих слоях Unet. Иногда еще добавляют LoRA чтобы слегка подстроить оригинальные cross-attention слои, работающие с текстом.
Так вот, самые интересные стили могут быть "закешированы" на сервере в виде векторов, которым назначены номера. Затем эти стили можно легко и быстро переиспользовать, если известен номер. Это и делает аргумент
Вот моя подборка таких sref кодов (по номерам картинок в посте):
1.
2.
3.
4.
5.
6.
7.
Коды, кстати, можно мешать и даже выставлять веса для каждого через
Больше стилей и кодов к ним можно посмотреть в этой галлерее: midjourneysref.com
@ai_newz
Что такое эти стилевые коды?
Кроме текстового промпта на вход можно подать ссылку на референсную картинку (или несколько), в стиле которой и будет финальная генерация. MJ не раскрывают имплементацию этой фичи (боятся конкуренции). Но почти наверняка это работает на базе IP-Adapter – это штука, которая позволяет дотюнить диффузию так, чтобы кроме текстового промпта на вход можно было также подавать референсную картинку. Это может использоваться как для генерации нескольких картинок в одном стиле, так и для консистентности персонажа. Картинка преобразуется в вектор с помощью CLIP, который затем скармливается в продублированные параллельно с оригинальными cross-attention слои в каждом слое трансформера (в случае DiT или SD3) или в соответствующих слоях Unet. Иногда еще добавляют LoRA чтобы слегка подстроить оригинальные cross-attention слои, работающие с текстом.
Так вот, самые интересные стили могут быть "закешированы" на сервере в виде векторов, которым назначены номера. Затем эти стили можно легко и быстро переиспользовать, если известен номер. Это и делает аргумент
--sref <код-стиля> после промпта в MJ.
Вот моя подборка таких sref кодов (по номерам картинок в посте):
1.
--c 8 --sref 4158384349 --p --s 1000 --ar 1:1
2.
--sref 340668170
3.
--sref 981744181
4.
shot, underwater --c 30 --ar 2:3 --sref 981744181 --p --s 500
5.
--sref 3677111049 {--style raw}
6.
--sref 885020885 --style raw --ar 2:3 --sw 200 --stylize 300
7.
--sref 1693082081
Коды, кстати, можно мешать и даже выставлять веса для каждого через
::
. В этом случае эти закешированные вектора линейно интерполируются. А параметр --sw 0-100
меняет вес всего стиля (style weight). Ну, и небольшой промптинг для полировки всё-таки может понадобиться.Больше стилей и кодов к ним можно посмотреть в этой галлерее: midjourneysref.com
@ai_newz
BY эйай ньюз
![](https://photo.group-telegram.com/u/cdn4.cdn-telegram.org/file/tXJ2cS3sUsMdon5P-oE-49IjVkrtGjLmQa2Vac693WH-_TqE0Ja3-vb4Ek6-G3ygq7z6DSar3JsLJltGHpodkDvAdAzuesKilLBVrsd2z-zucK9oJJkFMEs8yOylZ33Fcb11Jn-MCOq1wEGPUOUmqDwwSGADMiyf4sTWdSz40l-P64XMEW_dqYte9pt13NsM4EeOhFCgP_xCelxzJ4VGetlWtB-RFh41-spiYej6ZaE5Gc-fnSUh1Hx70O5TzNnPCS135mskzkI5mKQXbb8e-Uztd2hiH6wGzWwiv5IZoEM5EDqzw1wFnXL5vnPzP5isn25Aue4Qnaqa8Nmf91I-QQ.jpg)
![](https://photo.group-telegram.com/u/cdn4.cdn-telegram.org/file/fwlywjR3umG6CxJ9maUUfkDowleL1kDj7tAmhsbbSaM-W2bXbJVpACroaih1_W0WqneIt59v_Ud8PDOr6hh9_DVEp3qXHY8DS5S4XjeHt9PVymf9gyOaS5YeyHXN_bDOv6xVCp8PH-3SG53bsnm3eYu1usumHSHXylVT5mYKtt7-lUCiPyYs84BfsCaFSQmlPb-PI-MWwLcWFrhVEyo-Cl2AEM-DbBJsOBjOzVpsvI9WyzcIeAWZ_nhGvoLzlm7QGCO96Qt8YsCwBkB9tGfuLQj6c0OHZQvpUjXLj459LztFG1ZkvdXhJQKlQISKQJM1zK95-F7qDO1kppFBF1g5xg.jpg)
![](https://photo.group-telegram.com/u/cdn4.cdn-telegram.org/file/QWNXrbGVFzFNm_fpMW3OyCgO_ji3-Yxahl5IJm1MC5f4gVT6Cme4Npnst3Gz5nMv5Ym6_UuZ-i-RXT-a5pwQXGeqaMLqEuowo0ve19WJ8MPXZ7BntK6l8v_869nt9mWP3d1r5B1eaRu5Jn1GHsPmzStVUYJltLq_GmfKVAgoarhKyQTbHZt021-vAr45CUdJ3pSqkA9siIfIJT9qZTqP52H3BXOujW-cp2U22sm_HCAWQRfCxFk1eup3xrqJShmPeb1jux4pqAG5g-F4CITEY2yoUHzxwgfoZbljweXk37qVLAYvMDIC5gHw7SaVZ8Q9y8bI52B9fM0eLI_zw8W-1g.jpg)
![](https://photo.group-telegram.com/u/cdn4.cdn-telegram.org/file/ewQWMifWit9nRqmTBKTzeK-C_aAruwYj5sAVolm37ogmnvUMPVJzXMtC1E84OQT2AckaAEEAeMlkUHmNWOHmMVvID_hk1Ibk_rW5jS-oiB93ZfIlphcOwFgW6rXgifz9JGKX1W6NxmAtHevVPIeoDLUgD28yqRUejYBeJwCr4hTbSsX5-9OTMzfAfRiniqKo9LY2CS5eiLEzqLq4GL5jF6Mp1tIckty74srVuevXidyKihrk4kQ_liFYYjNBpXe24nQzQGkPxhzXJhWDCWZ4TuaGLFZdtDjw1j9jHFvgVFs861wzeCG3kvWx6qYkZVTsLC375ZLsQ5chr2LEpEwG2Q.jpg)
![](https://photo.group-telegram.com/u/cdn4.cdn-telegram.org/file/toxOyFwx2yBZeHeRfoU7lcHtmkxZrBx-DHOaOr_78ACUc7sw2gWyZcx69o73zjNtUrBy8in6ND2NZBx8KqUhFGqNRpvJNHQTwDJFisHFmCd-8kGpovltO_NaPEt4c-cNJsSIKYKqFYPjmxw9KjLo24XQhD-702NptoAjsjufNe-sOEF6xYl7NKCHvZzaQBaMtziMnl7raRCRriy5h964SNZo2SwJPHf0V0dEKfxhRH07DSsrXJdOYFM4Y8I-JccfFm-ORVkHY5SVzKAShH6aEltLONUQHBHYxiusl1CQAC4QfFfUo3v48Ht0BjdSfwwZCln73F0Bh84YlOcUitUzrw.jpg)
![](https://photo.group-telegram.com/u/cdn4.cdn-telegram.org/file/eOLNK7BfVm8xAV3Fq8dm9uf7MWumbL2sruQO6ajZ1CDszMURhHNiS7H0IxiIs-XZqM8YHG6nzUF5pORUaGnwDbIDOIy11Ibo2HmQVK6HNlKoV1pdZNXXQw3gOgldIMtfBpc64rSoHmfgHiTGNDi0r8xNKVoGKjItRoibZy02x8erXeTXzy4GWMUeeTJs33WFDhWeSXISKTSxvMQylVI8WcHOJULjztcfENavv8523FiCVcZdZ9zAo-hsA1DpT8qXF-WujrvStyJYwxKk90Qw2H3vjIeghNHN0dJAPCNv8y36yCUB8b1y10j0S3vD9e1Hf_p0nWqKkE0FCEc4cqQdOQ.jpg)
![](https://photo.group-telegram.com/u/cdn4.cdn-telegram.org/file/oOSVy8oTsRCfPxw3AJ8qpFco1VICNWaZBQFiVSevL7mr36cDbyfhbJgJdtJyIq1Jw8wIMoubToI5pzct-IEf8TXaAiLbpJmY7Ipr4DxqZnAIy8YtqoqeYdbiHjVmEMktijsmNcfZvkrXfy37uGzqW6N9HDiI-tr7HKmvIPhijOfn2XHw50uh2pxE8Iyv4yYp0mVr9QOEZ6VgzlXGKbZoNKkvQuXfanmcn-J3c3Ycb4dl4OA6XXI3CakjDXgrxcLqdnuCTeVJgFUjKJ-TVIgsOnFugXogRV2Op-YGJNbPdkJXit4PGNBtGe0DWl7k6HcQa7KrVM0Ad1x07fqB5boFNg.jpg)
Share with your friend now:
group-telegram.com/ai_newz/2992