⚡Новая t2i модель – PixArt 900M 1024x1024
На HuggingFace появилось новая модификация DiT на базе PixArt-Σ.
Что за она?
Оригинальная модель Pixart-Σ - это DiT с 28 слоями, которая имеет 600 M параметров в сумме. Умельцы взяли эту модель и прикрутили к ней еще 14 слоев (наверное, тупо добавили в конец). В итоге получили модель с 42 слоями и 900 M параметров. Далее это все дообучили на датасете с 3.5 млн картинок, причем первые 28 слоев инициализировали весами Pixart-Σ.
В датасете были генерации из MJ-6, DALLE-3, аниме и профессиональные фотографии. А тюнили все всего лишь на 8xA100.
Результаты:
На реддите модель хвалят, кто-то даже говорит, что для него она лушче чем SD3. Я потестил Pixart-Σ 600M против PixArt 900M на нескольких промптах cfv. Почти везде Σ лучше чем версия 900 M, кроме может быть аниме. На картинках слева - Σ, справа - PixArt 900M, промпты оставлю в комментах.
Модель еще очень сильно недотренирована, контуры обектов часто не очень четкие, детализация тоже еще не очень высокая. Что-ж, ждем новых версий тюна.
Я думаю, что учить с нуля было бы лучше, но так как это опенсорс, то все на энтузиазме, ресурсов мало, и поэтому придумали такой дешманский метод, чтобы расширить размер модели.
Веса:
- Базовая модель: https://huggingface.co/terminusresearch/pixart-900m-1024-ft-v0.5
- Файнтюн (его еще продолжают тренировать): https://huggingface.co/ptx0/pixart-900m-1024-ft-v0.7-stage2
Demo на обнимающем лице
@ai_newz
На HuggingFace появилось новая модификация DiT на базе PixArt-Σ.
Что за она?
Оригинальная модель Pixart-Σ - это DiT с 28 слоями, которая имеет 600 M параметров в сумме. Умельцы взяли эту модель и прикрутили к ней еще 14 слоев (наверное, тупо добавили в конец). В итоге получили модель с 42 слоями и 900 M параметров. Далее это все дообучили на датасете с 3.5 млн картинок, причем первые 28 слоев инициализировали весами Pixart-Σ.
В датасете были генерации из MJ-6, DALLE-3, аниме и профессиональные фотографии. А тюнили все всего лишь на 8xA100.
Результаты:
На реддите модель хвалят, кто-то даже говорит, что для него она лушче чем SD3. Я потестил Pixart-Σ 600M против PixArt 900M на нескольких промптах cfv. Почти везде Σ лучше чем версия 900 M, кроме может быть аниме. На картинках слева - Σ, справа - PixArt 900M, промпты оставлю в комментах.
Модель еще очень сильно недотренирована, контуры обектов часто не очень четкие, детализация тоже еще не очень высокая. Что-ж, ждем новых версий тюна.
Я думаю, что учить с нуля было бы лучше, но так как это опенсорс, то все на энтузиазме, ресурсов мало, и поэтому придумали такой дешманский метод, чтобы расширить размер модели.
Веса:
- Базовая модель: https://huggingface.co/terminusresearch/pixart-900m-1024-ft-v0.5
- Файнтюн (его еще продолжают тренировать): https://huggingface.co/ptx0/pixart-900m-1024-ft-v0.7-stage2
Demo на обнимающем лице
@ai_newz
group-telegram.com/ai_newz/3027
Create:
Last Update:
Last Update:
⚡Новая t2i модель – PixArt 900M 1024x1024
На HuggingFace появилось новая модификация DiT на базе PixArt-Σ.
Что за она?
Оригинальная модель Pixart-Σ - это DiT с 28 слоями, которая имеет 600 M параметров в сумме. Умельцы взяли эту модель и прикрутили к ней еще 14 слоев (наверное, тупо добавили в конец). В итоге получили модель с 42 слоями и 900 M параметров. Далее это все дообучили на датасете с 3.5 млн картинок, причем первые 28 слоев инициализировали весами Pixart-Σ.
В датасете были генерации из MJ-6, DALLE-3, аниме и профессиональные фотографии. А тюнили все всего лишь на 8xA100.
Результаты:
На реддите модель хвалят, кто-то даже говорит, что для него она лушче чем SD3. Я потестил Pixart-Σ 600M против PixArt 900M на нескольких промптах cfv. Почти везде Σ лучше чем версия 900 M, кроме может быть аниме. На картинках слева - Σ, справа - PixArt 900M, промпты оставлю в комментах.
Модель еще очень сильно недотренирована, контуры обектов часто не очень четкие, детализация тоже еще не очень высокая. Что-ж, ждем новых версий тюна.
Я думаю, что учить с нуля было бы лучше, но так как это опенсорс, то все на энтузиазме, ресурсов мало, и поэтому придумали такой дешманский метод, чтобы расширить размер модели.
Веса:
- Базовая модель: https://huggingface.co/terminusresearch/pixart-900m-1024-ft-v0.5
- Файнтюн (его еще продолжают тренировать): https://huggingface.co/ptx0/pixart-900m-1024-ft-v0.7-stage2
Demo на обнимающем лице
@ai_newz
На HuggingFace появилось новая модификация DiT на базе PixArt-Σ.
Что за она?
Оригинальная модель Pixart-Σ - это DiT с 28 слоями, которая имеет 600 M параметров в сумме. Умельцы взяли эту модель и прикрутили к ней еще 14 слоев (наверное, тупо добавили в конец). В итоге получили модель с 42 слоями и 900 M параметров. Далее это все дообучили на датасете с 3.5 млн картинок, причем первые 28 слоев инициализировали весами Pixart-Σ.
В датасете были генерации из MJ-6, DALLE-3, аниме и профессиональные фотографии. А тюнили все всего лишь на 8xA100.
Результаты:
На реддите модель хвалят, кто-то даже говорит, что для него она лушче чем SD3. Я потестил Pixart-Σ 600M против PixArt 900M на нескольких промптах cfv. Почти везде Σ лучше чем версия 900 M, кроме может быть аниме. На картинках слева - Σ, справа - PixArt 900M, промпты оставлю в комментах.
Модель еще очень сильно недотренирована, контуры обектов часто не очень четкие, детализация тоже еще не очень высокая. Что-ж, ждем новых версий тюна.
Я думаю, что учить с нуля было бы лучше, но так как это опенсорс, то все на энтузиазме, ресурсов мало, и поэтому придумали такой дешманский метод, чтобы расширить размер модели.
Веса:
- Базовая модель: https://huggingface.co/terminusresearch/pixart-900m-1024-ft-v0.5
- Файнтюн (его еще продолжают тренировать): https://huggingface.co/ptx0/pixart-900m-1024-ft-v0.7-stage2
Demo на обнимающем лице
@ai_newz
BY эйай ньюз
![](https://photo.group-telegram.com/u/cdn4.cdn-telegram.org/file/oVREuW5fBweLlcjRcxDxTfIGUj4m2Te6BC3mwCm2kttOpmsQMql7s5Snrv-9vUvPNojmFSNpSi8SUM1P-jwBvR9vTHW-YR2fEBeyWLOGeSyIjXX9SayHbnoPi4IY-rpsYMBUyNeuG4M1A70TQI59I4C_uDbonxnXtavBQDpgG9EdJemACxplAd02eH5sxJppWdAzweQ6pU_SP0kXaPegN4kdeIfG6ja7S7RPTBQzrHOca8wtlUczoEXPgqxaxnN-MR1YCXPs45EXfYBVaVjMVoazWRC9tycZ7pugTQ_EK3gFsRBWr6QDu940NO3t0BoTDRtmVOBooHLYU29DLmn6jA.jpg)
![](https://photo.group-telegram.com/u/cdn4.cdn-telegram.org/file/m6n4qoEjW1bBIyPfCaO38QHRL_ZCzMdQiGn9igTA2lztZ_UIKSoH0NTw4aUMkfZ1N0jeLnALeK2Zu9RgN7fO-AwFqY5VELnbtj7xbiB8N3heoq2LBjZkkZhwSSGs_LFdh3Ohgcx4wXllTNbfKGVzQnG6QM8_Ov9X8SW5LkqN2nNLEO2VqO3XOVFgLwjrBKApKOGdlNFRo_f9N-MKsZwN68GwCVquMAFz865kd3k9QQ1TG2sFVP7sl1-uW7GfmrqK7xsWnjR9H5qQqL3qkqGxHYThoqn5eUHMZGEsGjFdJCWp43M7unKtvgfctHFvYflxmWUrlxT5cY6K260BzNxFtg.jpg)
![](https://photo.group-telegram.com/u/cdn4.cdn-telegram.org/file/ih-mCS3SkkhWKMkW68EjsfBDxPjFvI1e9ce8csnvPsDbOAJUPM3jVJ2BeN6c_qxqI4u0IG727LLk0TxzW4kbIkwJ0iOFCeATUUzGW3IgF_KFPQ56s7cSDv_sMz_ewMi8TNE-0DzBpiLcP_PF5PxjF9j6Mxrg_7rHkIAHBmQ9wyemuZoB98YxJOBypJEOGyv6S0Bo0O4FJSxV0SvhFkrSxabH15xgMdX8GlSMA5lZeGqlfvGw2OkU0kUiTR06PtHuTCyJLa0osLtz9giF4EaBqcK0xPmoE-FNplPsFsbEx7tN7EKbLqLcrxYRzt5qW9JSByO_70TajsDZBFm4Tr0w-w.jpg)
![](https://photo.group-telegram.com/u/cdn4.cdn-telegram.org/file/OS_w59u-fnuuzF3zCZAZn4srp1MuPLdmVQ9eGMbU0zizwlKoKp5iSgVNQK1pw6S7nBxRhCE_D95KSKrPXzTHjyeSpGnEEVszvilF4BsxZsGLvywN-gXeNJck5dLguNh6s7Gn1rdRmXes68_dciVkHllPvtdqcJe9YcU7rGTccwnQiKRtA-j6vtiJtmPwACN85oYIVeyaza0fQVgsiLXef1hxwBcq69FqHQTctOcaR5Lga58gClBznLnZoI_IgczIqqZNNrR5SwedK7ZX65BmSAaRTZtusy0MRcdtdHnvmPpzX0he2L27Dd6-g3FSyP9Tp5yJIM7rAaGdSZC9ZTP-8Q.jpg)
![](https://photo.group-telegram.com/u/cdn4.cdn-telegram.org/file/qDdSvdfPQCHIdxBdOBEjUZy2mFzKI9yoaIe0q2eG7LnhrRy4umkQFucLObTM382E0Wb-W9iwVl6XUfMnUkE8-mTEvzhKNu0eLLJ6cwL3jehTi1IG89buaJSH9K_NJU8CcOxn4X7il50rWWy_1tmA8urC_NWd_3AuVgieP7sFizdU_xeQh1I30Xk2QYNEqCF0DKLXk2SI5voa3VmVAyqZ2yr6YIixThjekn6gvDMJ8Ik3nYO9ovBNQwPfK1ziQRvpD9SAnEHTvrC2Oj-2yWjj95tNSkndn44vQaq_ryFgLKTE_WunS2CD_pnmsgwHGzIh3xRZtFGhFePH8EHIGprRHw.jpg)
![](https://photo.group-telegram.com/u/cdn4.cdn-telegram.org/file/j2BM0LwhdSri4_jQA1lS_KBGja3KBBAjH-keNX-YUXQEs05z0rYnm2NSI4Xef7SrVZ3eaVPtV9CXc_2O6O61WlxUsZwWVjEZpvufATWYZ2hvXhtKyQavsJzyPEz0zTOV_HIgRQazJaSAlsYMLm3MBb6y__Sn7_7fZSOGW4sJGlHUHXZHVADibDi8amQ0RtSfHtuMvzYoVS_4t2-Mx25C5UBZQ648uZdYBMRtptW_3iQO1l17o-dkafsFFGjYgNrwd3IkcgLLmuge60QvLd0dv7dhRLD0wKJNdeZigiCJ8H7gsHzCAqNNNJ4sfVmiP7bF_hhR8Pia71gdV4LnD8uX_A.jpg)
![](https://photo.group-telegram.com/u/cdn4.cdn-telegram.org/file/ASTW7vFMdaxajytP9SDa6f8gIIljjrAk7ftkWKKr8hvgK4tZmKIMsr4jNwkfBmxzu5Gjwdm1gQzUgy84Qxy73WqYzmeTjUsYLnPRlxD0IzeN6aq2ODqnDYKdApy5Pr4FGjy11zJRNDyQAgHFr_JiSLUwWd7uiG0tZmIM-fKUxelQEWjWjmfuWIsEgc79Caf3mJgJis9wT35TjMWpOyh70UK-ET35gcJEp1i-wPAvNDInnOb6ilLOicpC9-sdbnuZ8Hcj3oobM5OE3ElyL4OsiNvqTZMCENJVb7rz_4JZODUh7srdvyOoIZMHPyqMFMvPbtCel3PHJ3o_4ujoDekE3A.jpg)
![](https://photo.group-telegram.com/u/cdn4.cdn-telegram.org/file/jvMz83230JIOT_3bBUmi-7v5UlUKgXX1KLseESKYKb4lCWLKKsAi5zma6mFpnL51azpxfX10MwbkZMMMzFXNtDAR1bhfN0GCufP0l09HGdSNm69eYtBaGGoal6lfzAhwl1rO11fBVVe3i9JoMH3yFrTdn12LgJ8UsK7EeN4jKB4kVAmxO8RSVTcXKmNW7SzE0pwbWVWl5p59DYV7tkZa-OquqyRVr3fADdO8hEBZBFip3opuWsQHIPk4mmO3wnXrfJrQtMFE_dDi3GrcYGjjUZLpc0EkRRK9f9nK-90TXp_Eqm9Gk1RzdqdEXuw3K7sQUChTz7PNRf-EXAESCHPQoA.jpg)
![](https://photo.group-telegram.com/u/cdn4.cdn-telegram.org/file/EKGV-ET97zyU5oUiVaQTMNjQG5L4nvVLxbsxoLYP3ScGznENt5bj07n1IkM0SqFwg3EkFlj84TPZTFiOWOHP2KD2zgHFRG9xg9fX9PyXn8CaxzG8NPZBP28zqoYl9pSIb2t1wm0ndwgVDrOFwUJuIBwwK_gqs8-W-GmI2w47jHE0Qb22H2YhNGYaGxafWy9GgLy9l4gJ9h2_uNQPCmrGXgGdqjKm5pLvdgln0lLARO7se4ZBqUPWcOCAslOTjsTfbJT7YyUnhrl9QBeunaE-U5wsuPgXVFyM3Yas4GMaNs9xrtlWJ4zRur5-mkBWzJlYMlZG2dgBdCdqZDa9RkG0GA.jpg)
![](https://photo.group-telegram.com/u/cdn4.cdn-telegram.org/file/mRceJ2stsrXaDL3L1F1WvjjBJEJWdRVoqHJVoYxt6Vm0tZGAoNAUSic8x_6jiO_U0zyMSWTmFZDfOwXaowqaFVnQHFQban-h2hkvn6vCr3RC5Tq6Cz6b_8sbHEkpHPSOZlIsFUvW3MLz1bwTyELDgz8pcp3XEaOZbuFJbkerXWLB6ldgXw3rGgGHIe3e04dD1rMfgimvQANqQ7vc8V-xbheqbzKUBEHEPbq29tjdxpU_6qED0JcQqTrPTFWJBEmobG-xKqRtv8IT04qgQMokntrCsRHU0Al_1xn2LOadseF7_hcdOv21yxsZ1kMOmtj_M4p3NMRYZef2Jw4Oqb4T3Q.jpg)
Share with your friend now:
group-telegram.com/ai_newz/3027