Я обычно не выкладываю промпты. Но вот что-то последнее время попадается на глаза красота с использованием стилевых кодов для MJ. Заодно и расскажу, как это работает на уровне имплементации.
Что такое эти стилевые коды?
Кроме текстового промпта на вход можно подать ссылку на референсную картинку (или несколько), в стиле которой и будет финальная генерация. MJ не раскрывают имплементацию этой фичи (боятся конкуренции). Но почти наверняка это работает на базе IP-Adapter – это штука, которая позволяет дотюнить диффузию так, чтобы кроме текстового промпта на вход можно было также подавать референсную картинку. Это может использоваться как для генерации нескольких картинок в одном стиле, так и для консистентности персонажа. Картинка преобразуется в вектор с помощью CLIP, который затем скармливается в продублированные параллельно с оригинальными cross-attention слои в каждом слое трансформера (в случае DiT или SD3) или в соответствующих слоях Unet. Иногда еще добавляют LoRA чтобы слегка подстроить оригинальные cross-attention слои, работающие с текстом.
Так вот, самые интересные стили могут быть "закешированы" на сервере в виде векторов, которым назначены номера. Затем эти стили можно легко и быстро переиспользовать, если известен номер. Это и делает аргумент
Вот моя подборка таких sref кодов (по номерам картинок в посте):
1.
2.
3.
4.
5.
6.
7.
Коды, кстати, можно мешать и даже выставлять веса для каждого через
Больше стилей и кодов к ним можно посмотреть в этой галлерее: midjourneysref.com
@ai_newz
Что такое эти стилевые коды?
Кроме текстового промпта на вход можно подать ссылку на референсную картинку (или несколько), в стиле которой и будет финальная генерация. MJ не раскрывают имплементацию этой фичи (боятся конкуренции). Но почти наверняка это работает на базе IP-Adapter – это штука, которая позволяет дотюнить диффузию так, чтобы кроме текстового промпта на вход можно было также подавать референсную картинку. Это может использоваться как для генерации нескольких картинок в одном стиле, так и для консистентности персонажа. Картинка преобразуется в вектор с помощью CLIP, который затем скармливается в продублированные параллельно с оригинальными cross-attention слои в каждом слое трансформера (в случае DiT или SD3) или в соответствующих слоях Unet. Иногда еще добавляют LoRA чтобы слегка подстроить оригинальные cross-attention слои, работающие с текстом.
Так вот, самые интересные стили могут быть "закешированы" на сервере в виде векторов, которым назначены номера. Затем эти стили можно легко и быстро переиспользовать, если известен номер. Это и делает аргумент
--sref <код-стиля> после промпта в MJ.
Вот моя подборка таких sref кодов (по номерам картинок в посте):
1.
--c 8 --sref 4158384349 --p --s 1000 --ar 1:1
2.
--sref 340668170
3.
--sref 981744181
4.
shot, underwater --c 30 --ar 2:3 --sref 981744181 --p --s 500
5.
--sref 3677111049 {--style raw}
6.
--sref 885020885 --style raw --ar 2:3 --sw 200 --stylize 300
7.
--sref 1693082081
Коды, кстати, можно мешать и даже выставлять веса для каждого через
::
. В этом случае эти закешированные вектора линейно интерполируются. А параметр --sw 0-100
меняет вес всего стиля (style weight). Ну, и небольшой промптинг для полировки всё-таки может понадобиться.Больше стилей и кодов к ним можно посмотреть в этой галлерее: midjourneysref.com
@ai_newz
group-telegram.com/ai_newz/2992
Create:
Last Update:
Last Update:
Я обычно не выкладываю промпты. Но вот что-то последнее время попадается на глаза красота с использованием стилевых кодов для MJ. Заодно и расскажу, как это работает на уровне имплементации.
Что такое эти стилевые коды?
Кроме текстового промпта на вход можно подать ссылку на референсную картинку (или несколько), в стиле которой и будет финальная генерация. MJ не раскрывают имплементацию этой фичи (боятся конкуренции). Но почти наверняка это работает на базе IP-Adapter – это штука, которая позволяет дотюнить диффузию так, чтобы кроме текстового промпта на вход можно было также подавать референсную картинку. Это может использоваться как для генерации нескольких картинок в одном стиле, так и для консистентности персонажа. Картинка преобразуется в вектор с помощью CLIP, который затем скармливается в продублированные параллельно с оригинальными cross-attention слои в каждом слое трансформера (в случае DiT или SD3) или в соответствующих слоях Unet. Иногда еще добавляют LoRA чтобы слегка подстроить оригинальные cross-attention слои, работающие с текстом.
Так вот, самые интересные стили могут быть "закешированы" на сервере в виде векторов, которым назначены номера. Затем эти стили можно легко и быстро переиспользовать, если известен номер. Это и делает аргумент
Вот моя подборка таких sref кодов (по номерам картинок в посте):
1.
2.
3.
4.
5.
6.
7.
Коды, кстати, можно мешать и даже выставлять веса для каждого через
Больше стилей и кодов к ним можно посмотреть в этой галлерее: midjourneysref.com
@ai_newz
Что такое эти стилевые коды?
Кроме текстового промпта на вход можно подать ссылку на референсную картинку (или несколько), в стиле которой и будет финальная генерация. MJ не раскрывают имплементацию этой фичи (боятся конкуренции). Но почти наверняка это работает на базе IP-Adapter – это штука, которая позволяет дотюнить диффузию так, чтобы кроме текстового промпта на вход можно было также подавать референсную картинку. Это может использоваться как для генерации нескольких картинок в одном стиле, так и для консистентности персонажа. Картинка преобразуется в вектор с помощью CLIP, который затем скармливается в продублированные параллельно с оригинальными cross-attention слои в каждом слое трансформера (в случае DiT или SD3) или в соответствующих слоях Unet. Иногда еще добавляют LoRA чтобы слегка подстроить оригинальные cross-attention слои, работающие с текстом.
Так вот, самые интересные стили могут быть "закешированы" на сервере в виде векторов, которым назначены номера. Затем эти стили можно легко и быстро переиспользовать, если известен номер. Это и делает аргумент
--sref <код-стиля> после промпта в MJ.
Вот моя подборка таких sref кодов (по номерам картинок в посте):
1.
--c 8 --sref 4158384349 --p --s 1000 --ar 1:1
2.
--sref 340668170
3.
--sref 981744181
4.
shot, underwater --c 30 --ar 2:3 --sref 981744181 --p --s 500
5.
--sref 3677111049 {--style raw}
6.
--sref 885020885 --style raw --ar 2:3 --sw 200 --stylize 300
7.
--sref 1693082081
Коды, кстати, можно мешать и даже выставлять веса для каждого через
::
. В этом случае эти закешированные вектора линейно интерполируются. А параметр --sw 0-100
меняет вес всего стиля (style weight). Ну, и небольшой промптинг для полировки всё-таки может понадобиться.Больше стилей и кодов к ним можно посмотреть в этой галлерее: midjourneysref.com
@ai_newz
BY эйай ньюз
![](https://photo.group-telegram.com/u/cdn4.cdn-telegram.org/file/DmM_6v8PeXbWOQpAdAAlc4brUqiDDxZY8aSzQWj5cJRqGPN8RykbUpnRnzQNByuj1AZqYEMFw61GIWmQ4Lh2DXryIMwsotNtmByvMHZ4wonPTxYSxcaAzxm1_pM23hCqcuctqZnQmmWauQoA_Kr_-IE48bsOpG4YucA5kQoKRyMaMpzKb9HDdU9GkneKtyy87s9HH4nZ32gZQmOwI-Pb4jgrIwmi7gJITm_HZyyjFc88w8PzBS0fDRWkVLPLxIU51HGuzBgWcwPc2q1uP4AoAt7eeARVQRNoSzOMYlLt77bigU4XbCXthe94DmuLmWw6txYvaVL2WV962UJ-UlN7tA.jpg)
![](https://photo.group-telegram.com/u/cdn4.cdn-telegram.org/file/h3cumZW5_uHdct_60ATMzBoDmJYHCppp6bqPHWagTkaSyUfT6CCYU_1WVIcYK1oawvbEf8v2B00xaEyGT84OF0cw0onyGmiT_eh0EXON18RpgHciBFFhkKTd2Ar78cBoeFsfK5w37zleDe1Coc9U9HglAGadnTAAe9MKVnX2D-fMNH8mxm4_hwjGoOw1Tfi6W9RqCPH_LF4Smfy09zsp5ee6U-ySvX_7AYfCKqjPhyFNRigeA4FeeQoCO6bxCSchMZft3ZN2KnlqyRqTZgUIdBRJvNEqkrPhT0vLQ7juaJfjIqqjvyLjpM_3ClazfetAQDvlQyfyKarlJYgdBwcMOA.jpg)
![](https://photo.group-telegram.com/u/cdn4.cdn-telegram.org/file/d-KP6-_vD0CJG3HsN4xWpOLrWT3zstJqS6qN5Ok68q7dXVAARMrGyoc45PoqIXx1OYSOP80ysgmLtf5tQGDlOqd1R4eBkjkSCD7v4AbnNRtAcRszOVOTItlCOaf3NVXf8mpWShThKUAitC4GnEYDu06Dm65P-fsQQz5gz2kpym2ynrbWugBlCpmLVB0v3VmO23Hdq1_OF_bV3gSAVnIk4igq11tEGtAYblGTPqrA33gj0FLWEr3_9BzfOBep6fadBj5Wo5tUY9JFT9rfMTKXfJVgMO-ntCWyqhoGVvuVe9Iy_atrZiaMsYgLFPhrI9l6PZNqYthgMjG2W_ZQJbkGLQ.jpg)
![](https://photo.group-telegram.com/u/cdn4.cdn-telegram.org/file/jiGo_vagSl3NMp8YCrHz76uSguwWFF49DeA3hll0fJs2Bxn8MOK39u6zxFUtK00N_psFov_MQW4qvVVvthRyefz0SGmv_tEzHmQp8EYtTb7AxjBV7J7CBUDUZURGaFSMB3sUY9IKn0p1Pb99fTsNgIIz-mWfIld-vviv3PG0Xmw_sdpU3ASPdeRAeCBosTOPI7NFnHTNrxRKjMVu5HG2n6AaIwgKboN8NR_88GVXw6BPZ9FEubgeqUACHnHVVBkUGYQIx_WwdVSjTkyAIl8rG0uEniULqHQUplR17IBGcMQ1UcaRGXTh2if0uE22oS4AZ63N4W0pzMCTSR7Rzs_Q9w.jpg)
![](https://photo.group-telegram.com/u/cdn4.cdn-telegram.org/file/hgTEAWyP-IxssKu9KdGDYCKTXeBSaMhWal1Fv9ggvqw1zpIpz3LonCwGAIa4zK2KWS0Oj2ammaSbwiKUCKfgsmZM5eRZXCsq1Ke9-rrolNoUcd6wcxv63G-PgRg-9mf_KTjuhWphYVTvcr1r5PS5PYcVihS0QmPODGC9UpbSj1QGikFftrMDn7gnKd-X0EQWMD3kYRsbINHzjYx6TrN6WbNu_7HBfiGEEf5J5z3KxDB_U1KkK-qersJG0zXDqRZ3Q3LEWU2WmmnSmBG00pLVZup96R76_SvbTj5D6A8ZuTBdXOqRbImROJKGCUnx1HEar7T0BEYWY-3UoJc5E0tkTQ.jpg)
![](https://photo.group-telegram.com/u/cdn4.cdn-telegram.org/file/Z7Ke-wo5GD-rBDVva_NZnrmtua3qJGz--__pGFEQ84X5XKJGuvRHNNNGQssKQ7Qe_Q1-tJ69j5q1lnU9FRNRVU76LXKJiJEWDNDI9G21mtcH-pAvJ7B5BoXxHTSwkUiaDQbmf3BOfEPIvkr-Qd5k4mkGtroow12nH7l9gZBBODxkWF9TFCVh73nxGzgV8WJuD0_z5a0gihvkZEnBgyRd3S8esm4oWwZT-X90ckx7TsJxoOO5B9xIKcHCZnuPfCgKSdnOqwtzknxNyj8DX1i_uZSDeKWqefchcQ1nI4qFW_F5yw14wF4I9HDIQbOXvznKDgO3DShIepnMMKDwNWrbZg.jpg)
![](https://photo.group-telegram.com/u/cdn4.cdn-telegram.org/file/dyR_ZM3mD3LfrTrZlKi2IfFdy8wNqrNjVO-9ZaTx6tC1oIbT_jYWOlJd1K3AeKbwa-ApGX8hHGMSCPy3cNpSVcliWapNrVd2GFdHb3t6C4xF70ExbEZVA1XzENGLaFGDDaG11VHh1Dun8eNmp6jz16c03gDGBMnFWP_prYOqErkbRb5xNHj_N3lRMrJGboVEXyWtwHq7mnVQlkhbuHLgpYSmRwxeoV2ir3sNP18VDd4ebagqvIMKrgpf3pjit5RFxPPdGLkPNPmY-UBXrlNS8vHeiajwLkTa8mFZq7IhBu9j2jN1UkWCGmMA-Mh-AXfpvioj4COESYKXsXkZBr9wew.jpg)
Share with your friend now:
group-telegram.com/ai_newz/2992