Я обычно не выкладываю промпты. Но вот что-то последнее время попадается на глаза красота с использованием стилевых кодов для MJ. Заодно и расскажу, как это работает на уровне имплементации.
Что такое эти стилевые коды?
Кроме текстового промпта на вход можно подать ссылку на референсную картинку (или несколько), в стиле которой и будет финальная генерация. MJ не раскрывают имплементацию этой фичи (боятся конкуренции). Но почти наверняка это работает на базе IP-Adapter – это штука, которая позволяет дотюнить диффузию так, чтобы кроме текстового промпта на вход можно было также подавать референсную картинку. Это может использоваться как для генерации нескольких картинок в одном стиле, так и для консистентности персонажа. Картинка преобразуется в вектор с помощью CLIP, который затем скармливается в продублированные параллельно с оригинальными cross-attention слои в каждом слое трансформера (в случае DiT или SD3) или в соответствующих слоях Unet. Иногда еще добавляют LoRA чтобы слегка подстроить оригинальные cross-attention слои, работающие с текстом.
Так вот, самые интересные стили могут быть "закешированы" на сервере в виде векторов, которым назначены номера. Затем эти стили можно легко и быстро переиспользовать, если известен номер. Это и делает аргумент
Вот моя подборка таких sref кодов (по номерам картинок в посте):
1.
2.
3.
4.
5.
6.
7.
Коды, кстати, можно мешать и даже выставлять веса для каждого через
Больше стилей и кодов к ним можно посмотреть в этой галлерее: midjourneysref.com
@ai_newz
Что такое эти стилевые коды?
Кроме текстового промпта на вход можно подать ссылку на референсную картинку (или несколько), в стиле которой и будет финальная генерация. MJ не раскрывают имплементацию этой фичи (боятся конкуренции). Но почти наверняка это работает на базе IP-Adapter – это штука, которая позволяет дотюнить диффузию так, чтобы кроме текстового промпта на вход можно было также подавать референсную картинку. Это может использоваться как для генерации нескольких картинок в одном стиле, так и для консистентности персонажа. Картинка преобразуется в вектор с помощью CLIP, который затем скармливается в продублированные параллельно с оригинальными cross-attention слои в каждом слое трансформера (в случае DiT или SD3) или в соответствующих слоях Unet. Иногда еще добавляют LoRA чтобы слегка подстроить оригинальные cross-attention слои, работающие с текстом.
Так вот, самые интересные стили могут быть "закешированы" на сервере в виде векторов, которым назначены номера. Затем эти стили можно легко и быстро переиспользовать, если известен номер. Это и делает аргумент
--sref <код-стиля> после промпта в MJ.
Вот моя подборка таких sref кодов (по номерам картинок в посте):
1.
--c 8 --sref 4158384349 --p --s 1000 --ar 1:1
2.
--sref 340668170
3.
--sref 981744181
4.
shot, underwater --c 30 --ar 2:3 --sref 981744181 --p --s 500
5.
--sref 3677111049 {--style raw}
6.
--sref 885020885 --style raw --ar 2:3 --sw 200 --stylize 300
7.
--sref 1693082081
Коды, кстати, можно мешать и даже выставлять веса для каждого через
::
. В этом случае эти закешированные вектора линейно интерполируются. А параметр --sw 0-100
меняет вес всего стиля (style weight). Ну, и небольшой промптинг для полировки всё-таки может понадобиться.Больше стилей и кодов к ним можно посмотреть в этой галлерее: midjourneysref.com
@ai_newz
group-telegram.com/ai_newz/2995
Create:
Last Update:
Last Update:
Я обычно не выкладываю промпты. Но вот что-то последнее время попадается на глаза красота с использованием стилевых кодов для MJ. Заодно и расскажу, как это работает на уровне имплементации.
Что такое эти стилевые коды?
Кроме текстового промпта на вход можно подать ссылку на референсную картинку (или несколько), в стиле которой и будет финальная генерация. MJ не раскрывают имплементацию этой фичи (боятся конкуренции). Но почти наверняка это работает на базе IP-Adapter – это штука, которая позволяет дотюнить диффузию так, чтобы кроме текстового промпта на вход можно было также подавать референсную картинку. Это может использоваться как для генерации нескольких картинок в одном стиле, так и для консистентности персонажа. Картинка преобразуется в вектор с помощью CLIP, который затем скармливается в продублированные параллельно с оригинальными cross-attention слои в каждом слое трансформера (в случае DiT или SD3) или в соответствующих слоях Unet. Иногда еще добавляют LoRA чтобы слегка подстроить оригинальные cross-attention слои, работающие с текстом.
Так вот, самые интересные стили могут быть "закешированы" на сервере в виде векторов, которым назначены номера. Затем эти стили можно легко и быстро переиспользовать, если известен номер. Это и делает аргумент
Вот моя подборка таких sref кодов (по номерам картинок в посте):
1.
2.
3.
4.
5.
6.
7.
Коды, кстати, можно мешать и даже выставлять веса для каждого через
Больше стилей и кодов к ним можно посмотреть в этой галлерее: midjourneysref.com
@ai_newz
Что такое эти стилевые коды?
Кроме текстового промпта на вход можно подать ссылку на референсную картинку (или несколько), в стиле которой и будет финальная генерация. MJ не раскрывают имплементацию этой фичи (боятся конкуренции). Но почти наверняка это работает на базе IP-Adapter – это штука, которая позволяет дотюнить диффузию так, чтобы кроме текстового промпта на вход можно было также подавать референсную картинку. Это может использоваться как для генерации нескольких картинок в одном стиле, так и для консистентности персонажа. Картинка преобразуется в вектор с помощью CLIP, который затем скармливается в продублированные параллельно с оригинальными cross-attention слои в каждом слое трансформера (в случае DiT или SD3) или в соответствующих слоях Unet. Иногда еще добавляют LoRA чтобы слегка подстроить оригинальные cross-attention слои, работающие с текстом.
Так вот, самые интересные стили могут быть "закешированы" на сервере в виде векторов, которым назначены номера. Затем эти стили можно легко и быстро переиспользовать, если известен номер. Это и делает аргумент
--sref <код-стиля> после промпта в MJ.
Вот моя подборка таких sref кодов (по номерам картинок в посте):
1.
--c 8 --sref 4158384349 --p --s 1000 --ar 1:1
2.
--sref 340668170
3.
--sref 981744181
4.
shot, underwater --c 30 --ar 2:3 --sref 981744181 --p --s 500
5.
--sref 3677111049 {--style raw}
6.
--sref 885020885 --style raw --ar 2:3 --sw 200 --stylize 300
7.
--sref 1693082081
Коды, кстати, можно мешать и даже выставлять веса для каждого через
::
. В этом случае эти закешированные вектора линейно интерполируются. А параметр --sw 0-100
меняет вес всего стиля (style weight). Ну, и небольшой промптинг для полировки всё-таки может понадобиться.Больше стилей и кодов к ним можно посмотреть в этой галлерее: midjourneysref.com
@ai_newz
BY эйай ньюз
![](https://photo.group-telegram.com/u/cdn4.cdn-telegram.org/file/lYbgR20HZb-vGhUQdYkszlcDDKmTf9XXJfDIO5Nf-p-8Vv5B6Ey425zzIkrGwGCcXQfRn-dlRqbsHwzEdhZNADOcoyf55yx7llywJrfJwCrrZYzmGElWff1s4_qaaVh7bUtzM-jEALB4mtCJuBfoSzqEby3yVC-ugJyaI7EO3WmzDAMcKO7uHsKGQ6lp6A1xRgV45SnRozM5HVqk-u24voByKdilme2vgRDYPQVMCRFSgojRRg58gsmKgp3yYOI0fZr3AregIsDUthtuU3HzrOeuFFoIpGPCaXwnbJUE39Mp4fe8S2lw_FKqRzWytIQZEQbO5GI3DC4KS9YlX2DHww.jpg)
![](https://photo.group-telegram.com/u/cdn4.cdn-telegram.org/file/o_hWcwD7OwiGZPCVD10VRlrkWQtTATgr-AMcQG5Wl6ZkPUtslP5AXHG00VDJid-kG8rqU4vahRgk2Lgmos4gvAaR62N-X0CIVE2TSJ9SeeaizdByn8lQ1jkDy9qsk2Ke1iswPDdjAluT3HtVXnHaDmcOzU2_OyNU_KZ13vBsz4IMUeMdVnW4Ciaw7s_o38fBPaK_lIsa8hNIFcYlM0Twy_0p2Z-eYyRtSk0d0QDaBiaVNKPjzEgGA0kHmqKXB9-X0MGez3RHarYzpT2XuhRHwLmWikXj_kAZXS3bowOdDXqR5WPxto68_DL0T0S542rmsJoOQeSYVy3cgxnG2mLChQ.jpg)
![](https://photo.group-telegram.com/u/cdn4.cdn-telegram.org/file/A5WdNRa2EqafL2fDq-eW7ZAgI6geUvb139M67KsDKypfZit2p6BKXH5U7c6_OjI6HXvj9ZoVQsC95STdiCgYdmthVg3fSCHUIhywrGFnEG2sn4y11O0VjyQAkYs94yAbzkQn4yVJ2Ael1HorsHFroRkYw9_LHwfXbxDTebva73Y72vJnsNdAdI3_3TT32rJyhivtQ8IXacG6A8PgRYAh3ekwMbUaszbxjkcfMN9V0H7AqevcIkcTz3rAxZJO_CkgNGj1P-RMP9E3jlcSYNQzilUyT-sm4En-Te1_uiTqZ1o1GjgENOt408us9sGJi0RiNTMVlltiU74H7DVN7JV1RQ.jpg)
![](https://photo.group-telegram.com/u/cdn4.cdn-telegram.org/file/Y0KNLkr8iy4XSnKsGUfVH7ypxc3ibY55BuZ8zyeJUmixsUZe6Q1-NPTkInjozFLeLHTaDCQjGoadsl7StxNVHUEXga1_Bvs2I6HBE3xVBDE5Q8lZa9pz5HuPJ6i0Eg4-qZB6bIDHmMRAkbUybbOhR0VEGbBHDGPFAVpS3ZAwCCrEE8yFQ-Eate2NPz7U1nT6ziRQEWEZZ6ZISACPwVS_OuEjtBxVoSva0ET2XyEb77DbVn63FAAwN4a2WlRgqBwO_RQNIwYN5QmaDXuv5JLh1wygkHc8T_0FSS4LcGCochPIplhs-d5mM2ePgzVjl4iTX6RK5DAMFkkV2xshHds_TA.jpg)
![](https://photo.group-telegram.com/u/cdn4.cdn-telegram.org/file/TO7zsBuutT_5tOGRTa_U-s-izKWu1JaRvgDXUDuHSGByUchdTyQSvoWjK2CmkzeONlRMrYO7FaXLkxeD6gKV27T--hSLd4VuDUfLKaC2DwOLSYS3S9Z9jaRyfHXeYYnq3BKR70oJCGI78YIoX_i49sQxC9CCZOeWeKqlrReoEivBSKcG3PXGU6nkF6WNKQKrC57CgtFD6T5tHyDQOOA-BdRop1w1wxbfCPrhAWB06E_xLU3cB0fRZCaTZvJHC6fD8FXSyZpVu7KrZhMgkgd32BgSgvwUHHl0xX1VRfWGbnxyGpUShnujYg14KqC1D8rHI7XvLMyQ7XFTxEu-s4tQ_w.jpg)
![](https://photo.group-telegram.com/u/cdn4.cdn-telegram.org/file/JxNJ8cQ6Fyt-2Gjikliz09C1WmlWx6EXpU1Er_3Wg5Vr5ZdwqYNii-OTqyq3BiAt_dmTrIeenVszGt-3ZXfKkiQiBQexMrP9j4TK7s1eL0KVsZJg2rsz_R1056IjNCT0m60XPZ4fs-GPlTZtoJbDJPvtUwCAQYF12kb_aGNmyna99gVohFvAABr-W0x2MacS7Q-d1rkNs6V8rfMGQ57KsBZOHUPF3WPzXEJvchwOWhetIWkRq0lmkrgZqmVtivToE17CfbakFKlw75GagwJ1Dy0jy-XHN7jxUJfeaOHeuD8sL2eTw45o2Gi8B13Q04tYRmE-YhR2UaXr79C9SAguXA.jpg)
![](https://photo.group-telegram.com/u/cdn4.cdn-telegram.org/file/pdtqpeweiQ2VHGEX583TmHtQLugwKbE-Yk2rPj1TtufgBkv0NkZWsKUH5K4WcpPIhPKOul1j_uURDKiA5aktvZH08HJ7F_P6AJsGgGaOmp2Dyxlkj2XwRNJoy3r5o8wc6EAdcdGFGUSvc5CkgM6I19wLpQwg6PKe4bO7iEskRlPPXb_4PD1VoZZkmOJJXb7C17hTlKIUHFyidY-ua9dgpD5LLHC4pueclCeKuAYK_HKOY52hSUNJzEsgwy7LW1zB4-JaFhY3b6ObWRyuVWqpkAZzCOSPQfpc7G1QTgfVgFD3YNfwbBxvyL_cY6OsaVm6AtEz0X_5DbulhyeRelw7QQ.jpg)
Share with your friend now:
group-telegram.com/ai_newz/2995