Я обычно не выкладываю промпты. Но вот что-то последнее время попадается на глаза красота с использованием стилевых кодов для MJ. Заодно и расскажу, как это работает на уровне имплементации.
Что такое эти стилевые коды?
Кроме текстового промпта на вход можно подать ссылку на референсную картинку (или несколько), в стиле которой и будет финальная генерация. MJ не раскрывают имплементацию этой фичи (боятся конкуренции). Но почти наверняка это работает на базе IP-Adapter – это штука, которая позволяет дотюнить диффузию так, чтобы кроме текстового промпта на вход можно было также подавать референсную картинку. Это может использоваться как для генерации нескольких картинок в одном стиле, так и для консистентности персонажа. Картинка преобразуется в вектор с помощью CLIP, который затем скармливается в продублированные параллельно с оригинальными cross-attention слои в каждом слое трансформера (в случае DiT или SD3) или в соответствующих слоях Unet. Иногда еще добавляют LoRA чтобы слегка подстроить оригинальные cross-attention слои, работающие с текстом.
Так вот, самые интересные стили могут быть "закешированы" на сервере в виде векторов, которым назначены номера. Затем эти стили можно легко и быстро переиспользовать, если известен номер. Это и делает аргумент
Вот моя подборка таких sref кодов (по номерам картинок в посте):
1.
2.
3.
4.
5.
6.
7.
Коды, кстати, можно мешать и даже выставлять веса для каждого через
Больше стилей и кодов к ним можно посмотреть в этой галлерее: midjourneysref.com
@ai_newz
Что такое эти стилевые коды?
Кроме текстового промпта на вход можно подать ссылку на референсную картинку (или несколько), в стиле которой и будет финальная генерация. MJ не раскрывают имплементацию этой фичи (боятся конкуренции). Но почти наверняка это работает на базе IP-Adapter – это штука, которая позволяет дотюнить диффузию так, чтобы кроме текстового промпта на вход можно было также подавать референсную картинку. Это может использоваться как для генерации нескольких картинок в одном стиле, так и для консистентности персонажа. Картинка преобразуется в вектор с помощью CLIP, который затем скармливается в продублированные параллельно с оригинальными cross-attention слои в каждом слое трансформера (в случае DiT или SD3) или в соответствующих слоях Unet. Иногда еще добавляют LoRA чтобы слегка подстроить оригинальные cross-attention слои, работающие с текстом.
Так вот, самые интересные стили могут быть "закешированы" на сервере в виде векторов, которым назначены номера. Затем эти стили можно легко и быстро переиспользовать, если известен номер. Это и делает аргумент
--sref <код-стиля> после промпта в MJ.
Вот моя подборка таких sref кодов (по номерам картинок в посте):
1.
--c 8 --sref 4158384349 --p --s 1000 --ar 1:1
2.
--sref 340668170
3.
--sref 981744181
4.
shot, underwater --c 30 --ar 2:3 --sref 981744181 --p --s 500
5.
--sref 3677111049 {--style raw}
6.
--sref 885020885 --style raw --ar 2:3 --sw 200 --stylize 300
7.
--sref 1693082081
Коды, кстати, можно мешать и даже выставлять веса для каждого через
::
. В этом случае эти закешированные вектора линейно интерполируются. А параметр --sw 0-100
меняет вес всего стиля (style weight). Ну, и небольшой промптинг для полировки всё-таки может понадобиться.Больше стилей и кодов к ним можно посмотреть в этой галлерее: midjourneysref.com
@ai_newz
group-telegram.com/ai_newz/2992
Create:
Last Update:
Last Update:
Я обычно не выкладываю промпты. Но вот что-то последнее время попадается на глаза красота с использованием стилевых кодов для MJ. Заодно и расскажу, как это работает на уровне имплементации.
Что такое эти стилевые коды?
Кроме текстового промпта на вход можно подать ссылку на референсную картинку (или несколько), в стиле которой и будет финальная генерация. MJ не раскрывают имплементацию этой фичи (боятся конкуренции). Но почти наверняка это работает на базе IP-Adapter – это штука, которая позволяет дотюнить диффузию так, чтобы кроме текстового промпта на вход можно было также подавать референсную картинку. Это может использоваться как для генерации нескольких картинок в одном стиле, так и для консистентности персонажа. Картинка преобразуется в вектор с помощью CLIP, который затем скармливается в продублированные параллельно с оригинальными cross-attention слои в каждом слое трансформера (в случае DiT или SD3) или в соответствующих слоях Unet. Иногда еще добавляют LoRA чтобы слегка подстроить оригинальные cross-attention слои, работающие с текстом.
Так вот, самые интересные стили могут быть "закешированы" на сервере в виде векторов, которым назначены номера. Затем эти стили можно легко и быстро переиспользовать, если известен номер. Это и делает аргумент
Вот моя подборка таких sref кодов (по номерам картинок в посте):
1.
2.
3.
4.
5.
6.
7.
Коды, кстати, можно мешать и даже выставлять веса для каждого через
Больше стилей и кодов к ним можно посмотреть в этой галлерее: midjourneysref.com
@ai_newz
Что такое эти стилевые коды?
Кроме текстового промпта на вход можно подать ссылку на референсную картинку (или несколько), в стиле которой и будет финальная генерация. MJ не раскрывают имплементацию этой фичи (боятся конкуренции). Но почти наверняка это работает на базе IP-Adapter – это штука, которая позволяет дотюнить диффузию так, чтобы кроме текстового промпта на вход можно было также подавать референсную картинку. Это может использоваться как для генерации нескольких картинок в одном стиле, так и для консистентности персонажа. Картинка преобразуется в вектор с помощью CLIP, который затем скармливается в продублированные параллельно с оригинальными cross-attention слои в каждом слое трансформера (в случае DiT или SD3) или в соответствующих слоях Unet. Иногда еще добавляют LoRA чтобы слегка подстроить оригинальные cross-attention слои, работающие с текстом.
Так вот, самые интересные стили могут быть "закешированы" на сервере в виде векторов, которым назначены номера. Затем эти стили можно легко и быстро переиспользовать, если известен номер. Это и делает аргумент
--sref <код-стиля> после промпта в MJ.
Вот моя подборка таких sref кодов (по номерам картинок в посте):
1.
--c 8 --sref 4158384349 --p --s 1000 --ar 1:1
2.
--sref 340668170
3.
--sref 981744181
4.
shot, underwater --c 30 --ar 2:3 --sref 981744181 --p --s 500
5.
--sref 3677111049 {--style raw}
6.
--sref 885020885 --style raw --ar 2:3 --sw 200 --stylize 300
7.
--sref 1693082081
Коды, кстати, можно мешать и даже выставлять веса для каждого через
::
. В этом случае эти закешированные вектора линейно интерполируются. А параметр --sw 0-100
меняет вес всего стиля (style weight). Ну, и небольшой промптинг для полировки всё-таки может понадобиться.Больше стилей и кодов к ним можно посмотреть в этой галлерее: midjourneysref.com
@ai_newz
BY эйай ньюз
![](https://photo.group-telegram.com/u/cdn4.cdn-telegram.org/file/p8cnRIZMNDruYvttx6CsloFHWsHKd4KlVAzTTBKPHJ5XCO6IBfZPvXsLfR6xf7frO3yzaCQWHCAOxoMGpmLJbwSEcKBZSVvBTK9FsoGMgsPtK2NFymbLV6LIcF5LBLq5sxza-uIRRYbHUmqB54N3leACxc29Q8DFMNYpfM3HJSULf8ifV3zEppaqQ9BUWoyRtnnAoDfY5Tym2EIz03E5x_7iGfh_5HHwAu-M4pXRdBUxm38eGHV9Nmpg8erJdp2FBbkoSwYDQiJay0LQvJeBKORKpMvQHvfue49G0wZsb6p0kRpNUGffwSUwkGBM5MHJpyKgTp8Sd2OlQAtInMIHbg.jpg)
![](https://photo.group-telegram.com/u/cdn4.cdn-telegram.org/file/Qdp3-LFH2AdjCFPM8uu-Vc_--Fyt10Hmt9bco0k-5jxJmRjyMHqmEqrJ5r35rclufQfaGnRgX5hqxAno072zgKDonRbfeuzHDq8UNYv0f3jgLXoOLiQW-8CrPvClYxx3vbPDc-McCHysmtU4ixNLb4NeDtrzHqAtKAjfCkSAftt5aKKeFJ27nq9IQkP4CX_kvXuJ4mJygpCnCX5QN5bcbIbzy_8GCf8sxE8fQ7x-Vkw7pu_P_er2E2mAHLhlo7cH0yRT0nRSVhcbQy_4ENSFytDsmxDvV3E2TpX8Yrtg7UiPo-mJx-gFB7Qq3tBT8gEJu6M__LGiDgkzoRKX6eNUQw.jpg)
![](https://photo.group-telegram.com/u/cdn4.cdn-telegram.org/file/CPvSG9FOMSbRJ4_NxM8ApfWjdvV6h3GJT8-c6IFP6hIZDOdKcNCC5FPtvjdTOy3SIOzwyTh_9LB5RRlv12C5UVJ2E2AhzFQfwLNSFe7xAR-2zt9G5_oQQLBHFT1mTQ5vsVb4cxLeXaIPcBBYL4iLKXtS-ikHci3Q2rB5vTEcCrAbB1AjvyV4i9UJPLpgNLf5AnjGz4yFZFMXaabGocwC19f_2RX9_ai2nDimwQOjvi9RQwKhXfJN2Nr-3n8hzB5uT_3RDlYTwb3kg-d0xVxuTn3XmhBTNtuBNw5wZ4UtTKClqr3FvGOyGwOZtUSQkOzP_PF7nIN971FTv-1xptFCsg.jpg)
![](https://photo.group-telegram.com/u/cdn4.cdn-telegram.org/file/cyySX3hbGPOpTA3LlcSBwMVkHhqmzVG9fllWHakLXt5L7hF10trISCVmCULsHnI_M9upzUuQ_ETsSlV8tEcGajLxYRtceXVCdJTkkN1QZzgYrfZHRzu_dPEo7z1tvroqYHCPK8KSVUp4tY9zpumQscEm3IA6grx70sRFISLdxknu8C7GSMNXmvUNTiaQrZaBp87Gwa3xBNDnEQ1nAD509Xr1xLW-gXhyAvGZ8Sl-EDk-VaYK8bTGwY3r3dG5tg3sI1iYjIlPWW6qUR3Iuf8-696R87hz8J_eM0eNPPds08hOIBX1YLW60QyV9__IrqdweNfguqsJ4FhuJTrrf4LjEQ.jpg)
![](https://photo.group-telegram.com/u/cdn4.cdn-telegram.org/file/mIuCpTZIwspIszV84in_qShp_nE7PiYUdHlLdKn2r-Z8jrQPFOmnW--LyYCXuOMsVYPQqnWHsxGabCMTwkXEtw75fPOIdbjpXFogqDFfIeaa58rWBOO12EKTD2_Q3LIN_79wmr-4352Tqz8CK54lGNo-QUBYqJGdB5NyFPUZTgy7W2DN70MANUZe6mmNouKSrOIJyh0Uw-Em6CkNxqgbnIJs4MCVUQtkH6o7khn9F-ZWXMdy7LfoQ5YTbtv66MBRZikKgMUhfGlwcLFcXEYqgWkdqeNGogHsYbaxMX9UsAd2adtzXZJ-csVs05GnjofgQMVOy6jyZggIIHa1jzxgag.jpg)
![](https://photo.group-telegram.com/u/cdn4.cdn-telegram.org/file/frztKToEBR9_X450sUr1ZHhhdP3eAfCKYhIjj5iGyNjorHRnfPBqU53Imlacb9oXk6HQQFxOqyP8kRY_4CMJzmInOwOZHGEXATzkAnFpSkNGjS28s-RPlPJJGUckfG_r3wwn5DEqLfrHEhuBGJ98HIBRvMlAEmzTZ8bMNGy384bD6uhTXkdvOIswMK1y3F_urzIoL1sa4-ksICC2yHqqf_iTDuBSPUlmTNkylP_Cs8STra8vE0CqHSckkmpbZopHsmOxf395LMfNfkHgtKFTsNVIJJqO4LjUpL_09IllG0fStVw5swO4FudnkCRCJEgMezZAt4ziwe6vPoWQxmFzqQ.jpg)
![](https://photo.group-telegram.com/u/cdn4.cdn-telegram.org/file/MAa3jCNkLjkYUqd8Vt10e-RgjPlW1ETU13tGRiIHmUZFXG-kQHE0SDElojw4Bp-UuQmO3RAZW_qxVWXCL5NBUqgHC4lf07WfSnUidEGFOboCQKX1P2fC6LbmJSiU44onvVken7WlYJ2-mHzHtCNW2BEPMcxUkewxF2iKQlIptxl5PL91JhatGkNqOeY670j9gy5OnOZz6uVZv5iDrOAgfEiUk2hsLQwKkXCUZpAmJuStKXT5HAl6D1rUiJgMFAyFjQNtRqbPOaXg4qE63e7pjIvdazMu6SkVYUClxMgAicNg9MOQitFrZc5F0sJiyhqLoBJzFaLijO1J2f-mldpCbw.jpg)
Share with your friend now:
group-telegram.com/ai_newz/2992