Telegram Group & Telegram Channel
Я обычно не выкладываю промпты. Но вот что-то последнее время попадается на глаза красота с использованием стилевых кодов для MJ. Заодно и расскажу, как это работает на уровне имплементации.

Что такое эти стилевые коды?
Кроме текстового промпта на вход можно подать ссылку на референсную картинку (или несколько), в стиле которой и будет финальная генерация. MJ не раскрывают имплементацию этой фичи (боятся конкуренции). Но почти наверняка это работает на базе IP-Adapter – это штука, которая позволяет дотюнить диффузию так, чтобы кроме текстового промпта на вход можно было также подавать референсную картинку. Это может использоваться как для генерации нескольких картинок в одном стиле, так и для консистентности персонажа. Картинка преобразуется в вектор с помощью CLIP, который затем скармливается в продублированные параллельно с оригинальными cross-attention слои в каждом слое трансформера (в случае DiT или SD3) или в соответствующих слоях Unet. Иногда еще добавляют LoRA чтобы слегка подстроить оригинальные cross-attention слои, работающие с текстом.

Так вот, самые интересные стили могут быть "закешированы" на сервере в виде векторов, которым назначены номера. Затем эти стили можно легко и быстро переиспользовать, если известен номер. Это и делает аргумент --sref <код-стиля> после промпта в MJ.

Вот моя подборка таких sref кодов (по номерам картинок в посте):
1.  --c 8 --sref 4158384349 --p --s 1000 --ar 1:1
2.  --sref 340668170
3.  --sref 981744181
4.  shot, underwater --c 30 --ar 2:3 --sref 981744181 --p --s 500
5.  --sref 3677111049 {--style raw}
6.  --sref 885020885 --style raw --ar 2:3 --sw 200 --stylize 300
7.  --sref 1693082081

Коды, кстати, можно мешать и даже выставлять веса для каждого через :: . В этом случае эти закешированные вектора линейно интерполируются. А параметр --sw 0-100 меняет вес всего стиля (style weight). Ну, и небольшой промптинг для полировки всё-таки может понадобиться.

Больше стилей и кодов к ним можно посмотреть в этой галлерее: midjourneysref.com

@ai_newz



group-telegram.com/ai_newz/2995
Create:
Last Update:

Я обычно не выкладываю промпты. Но вот что-то последнее время попадается на глаза красота с использованием стилевых кодов для MJ. Заодно и расскажу, как это работает на уровне имплементации.

Что такое эти стилевые коды?
Кроме текстового промпта на вход можно подать ссылку на референсную картинку (или несколько), в стиле которой и будет финальная генерация. MJ не раскрывают имплементацию этой фичи (боятся конкуренции). Но почти наверняка это работает на базе IP-Adapter – это штука, которая позволяет дотюнить диффузию так, чтобы кроме текстового промпта на вход можно было также подавать референсную картинку. Это может использоваться как для генерации нескольких картинок в одном стиле, так и для консистентности персонажа. Картинка преобразуется в вектор с помощью CLIP, который затем скармливается в продублированные параллельно с оригинальными cross-attention слои в каждом слое трансформера (в случае DiT или SD3) или в соответствующих слоях Unet. Иногда еще добавляют LoRA чтобы слегка подстроить оригинальные cross-attention слои, работающие с текстом.

Так вот, самые интересные стили могут быть "закешированы" на сервере в виде векторов, которым назначены номера. Затем эти стили можно легко и быстро переиспользовать, если известен номер. Это и делает аргумент --sref <код-стиля> после промпта в MJ.

Вот моя подборка таких sref кодов (по номерам картинок в посте):
1.  --c 8 --sref 4158384349 --p --s 1000 --ar 1:1
2.  --sref 340668170
3.  --sref 981744181
4.  shot, underwater --c 30 --ar 2:3 --sref 981744181 --p --s 500
5.  --sref 3677111049 {--style raw}
6.  --sref 885020885 --style raw --ar 2:3 --sw 200 --stylize 300
7.  --sref 1693082081

Коды, кстати, можно мешать и даже выставлять веса для каждого через :: . В этом случае эти закешированные вектора линейно интерполируются. А параметр --sw 0-100 меняет вес всего стиля (style weight). Ну, и небольшой промптинг для полировки всё-таки может понадобиться.

Больше стилей и кодов к ним можно посмотреть в этой галлерее: midjourneysref.com

@ai_newz

BY эйай ньюз










Share with your friend now:
group-telegram.com/ai_newz/2995

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

And indeed, volatility has been a hallmark of the market environment so far in 2022, with the S&P 500 still down more than 10% for the year-to-date after first sliding into a correction last month. The CBOE Volatility Index, or VIX, has held at a lofty level of more than 30. Some privacy experts say Telegram is not secure enough But because group chats and the channel features are not end-to-end encrypted, Galperin said user privacy is potentially under threat. The S&P 500 fell 1.3% to 4,204.36, and the Dow Jones Industrial Average was down 0.7% to 32,943.33. The Dow posted a fifth straight weekly loss — its longest losing streak since 2019. The Nasdaq Composite tumbled 2.2% to 12,843.81. Though all three indexes opened in the green, stocks took a turn after a new report showed U.S. consumer sentiment deteriorated more than expected in early March as consumers' inflation expectations soared to the highest since 1981. READ MORE
from no


Telegram эйай ньюз
FROM American