⚡Новая t2i модель – PixArt 900M 1024x1024
На HuggingFace появилось новая модификация DiT на базе PixArt-Σ.
Что за она?
Оригинальная модель Pixart-Σ - это DiT с 28 слоями, которая имеет 600 M параметров в сумме. Умельцы взяли эту модель и прикрутили к ней еще 14 слоев (наверное, тупо добавили в конец). В итоге получили модель с 42 слоями и 900 M параметров. Далее это все дообучили на датасете с 3.5 млн картинок, причем первые 28 слоев инициализировали весами Pixart-Σ.
В датасете были генерации из MJ-6, DALLE-3, аниме и профессиональные фотографии. А тюнили все всего лишь на 8xA100.
Результаты:
На реддите модель хвалят, кто-то даже говорит, что для него она лушче чем SD3. Я потестил Pixart-Σ 600M против PixArt 900M на нескольких промптах cfv. Почти везде Σ лучше чем версия 900 M, кроме может быть аниме. На картинках слева - Σ, справа - PixArt 900M, промпты оставлю в комментах.
Модель еще очень сильно недотренирована, контуры обектов часто не очень четкие, детализация тоже еще не очень высокая. Что-ж, ждем новых версий тюна.
Я думаю, что учить с нуля было бы лучше, но так как это опенсорс, то все на энтузиазме, ресурсов мало, и поэтому придумали такой дешманский метод, чтобы расширить размер модели.
Веса:
- Базовая модель: https://huggingface.co/terminusresearch/pixart-900m-1024-ft-v0.5
- Файнтюн (его еще продолжают тренировать): https://huggingface.co/ptx0/pixart-900m-1024-ft-v0.7-stage2
Demo на обнимающем лице
@ai_newz
На HuggingFace появилось новая модификация DiT на базе PixArt-Σ.
Что за она?
Оригинальная модель Pixart-Σ - это DiT с 28 слоями, которая имеет 600 M параметров в сумме. Умельцы взяли эту модель и прикрутили к ней еще 14 слоев (наверное, тупо добавили в конец). В итоге получили модель с 42 слоями и 900 M параметров. Далее это все дообучили на датасете с 3.5 млн картинок, причем первые 28 слоев инициализировали весами Pixart-Σ.
В датасете были генерации из MJ-6, DALLE-3, аниме и профессиональные фотографии. А тюнили все всего лишь на 8xA100.
Результаты:
На реддите модель хвалят, кто-то даже говорит, что для него она лушче чем SD3. Я потестил Pixart-Σ 600M против PixArt 900M на нескольких промптах cfv. Почти везде Σ лучше чем версия 900 M, кроме может быть аниме. На картинках слева - Σ, справа - PixArt 900M, промпты оставлю в комментах.
Модель еще очень сильно недотренирована, контуры обектов часто не очень четкие, детализация тоже еще не очень высокая. Что-ж, ждем новых версий тюна.
Я думаю, что учить с нуля было бы лучше, но так как это опенсорс, то все на энтузиазме, ресурсов мало, и поэтому придумали такой дешманский метод, чтобы расширить размер модели.
Веса:
- Базовая модель: https://huggingface.co/terminusresearch/pixart-900m-1024-ft-v0.5
- Файнтюн (его еще продолжают тренировать): https://huggingface.co/ptx0/pixart-900m-1024-ft-v0.7-stage2
Demo на обнимающем лице
@ai_newz
group-telegram.com/ai_newz/3027
Create:
Last Update:
Last Update:
⚡Новая t2i модель – PixArt 900M 1024x1024
На HuggingFace появилось новая модификация DiT на базе PixArt-Σ.
Что за она?
Оригинальная модель Pixart-Σ - это DiT с 28 слоями, которая имеет 600 M параметров в сумме. Умельцы взяли эту модель и прикрутили к ней еще 14 слоев (наверное, тупо добавили в конец). В итоге получили модель с 42 слоями и 900 M параметров. Далее это все дообучили на датасете с 3.5 млн картинок, причем первые 28 слоев инициализировали весами Pixart-Σ.
В датасете были генерации из MJ-6, DALLE-3, аниме и профессиональные фотографии. А тюнили все всего лишь на 8xA100.
Результаты:
На реддите модель хвалят, кто-то даже говорит, что для него она лушче чем SD3. Я потестил Pixart-Σ 600M против PixArt 900M на нескольких промптах cfv. Почти везде Σ лучше чем версия 900 M, кроме может быть аниме. На картинках слева - Σ, справа - PixArt 900M, промпты оставлю в комментах.
Модель еще очень сильно недотренирована, контуры обектов часто не очень четкие, детализация тоже еще не очень высокая. Что-ж, ждем новых версий тюна.
Я думаю, что учить с нуля было бы лучше, но так как это опенсорс, то все на энтузиазме, ресурсов мало, и поэтому придумали такой дешманский метод, чтобы расширить размер модели.
Веса:
- Базовая модель: https://huggingface.co/terminusresearch/pixart-900m-1024-ft-v0.5
- Файнтюн (его еще продолжают тренировать): https://huggingface.co/ptx0/pixart-900m-1024-ft-v0.7-stage2
Demo на обнимающем лице
@ai_newz
На HuggingFace появилось новая модификация DiT на базе PixArt-Σ.
Что за она?
Оригинальная модель Pixart-Σ - это DiT с 28 слоями, которая имеет 600 M параметров в сумме. Умельцы взяли эту модель и прикрутили к ней еще 14 слоев (наверное, тупо добавили в конец). В итоге получили модель с 42 слоями и 900 M параметров. Далее это все дообучили на датасете с 3.5 млн картинок, причем первые 28 слоев инициализировали весами Pixart-Σ.
В датасете были генерации из MJ-6, DALLE-3, аниме и профессиональные фотографии. А тюнили все всего лишь на 8xA100.
Результаты:
На реддите модель хвалят, кто-то даже говорит, что для него она лушче чем SD3. Я потестил Pixart-Σ 600M против PixArt 900M на нескольких промптах cfv. Почти везде Σ лучше чем версия 900 M, кроме может быть аниме. На картинках слева - Σ, справа - PixArt 900M, промпты оставлю в комментах.
Модель еще очень сильно недотренирована, контуры обектов часто не очень четкие, детализация тоже еще не очень высокая. Что-ж, ждем новых версий тюна.
Я думаю, что учить с нуля было бы лучше, но так как это опенсорс, то все на энтузиазме, ресурсов мало, и поэтому придумали такой дешманский метод, чтобы расширить размер модели.
Веса:
- Базовая модель: https://huggingface.co/terminusresearch/pixart-900m-1024-ft-v0.5
- Файнтюн (его еще продолжают тренировать): https://huggingface.co/ptx0/pixart-900m-1024-ft-v0.7-stage2
Demo на обнимающем лице
@ai_newz
BY эйай ньюз
![](https://photo.group-telegram.com/u/cdn4.cdn-telegram.org/file/D-_B964QhvuTJ6mb1j2kxFxeeeZ0MUsLhBBZTnv2KWlCF2BI4VKLTntywyRqrRwEEloXCWwIpnE2DPIDhAoL1U5-6iB0Q7Y9Q3zauUNdjfeyPyjEJUVGD3k4pQAxa56aoPer4-KtJGiK_EPFPG0rNwqzaXOS8O7lLntSaC-RvUb73r0K1h9Mkx1RRzilvYA17SXVk8FGI7jXPzOtTExMgWboSE4sv8CAcyMvOflkhqU0okUuM8tHgc5aPp_xSDNeDFzn-IN3GFZuNkYgrAM2owZhJN_4ThFeec6hUU3YgWEFoBmsBSWmA8-C6OflIiShMPwJ7FmaBdDdpzOFeDAfQw.jpg)
![](https://photo.group-telegram.com/u/cdn4.cdn-telegram.org/file/UiX3YYavcVpQYhjgDJnlKOksfjLMsmF2II6-28K04Azzu79hBk7YIYTEa_mjcCEGoXrz4KaP9734-ifPo8n1o8jMsbC6wtqRe8XmSSDsCGuZ1qo4g_CT2WHud4h217MMjI69wD_D5vcOtaLRXYsOEsH3Wu7Ok6i0oSxldsZRU5npvEfXaYUFe3y0yktjeAqoLNuUk0E5w4v80DgmBxeBJzswWG0exN6LuAJam0DQ3O4YNJnRjUgV7XT6bAMo-_cYSMahlzpgnDyKuE6OgH2HZUV7dJDf3L0A1YQBeyjkVxOqDFm2SVAbhBcbzPb-eEVpbMZp1D9TbivCwi8LhTJNkg.jpg)
![](https://photo.group-telegram.com/u/cdn4.cdn-telegram.org/file/NX1BRG5x8fvN7gCRO9MnuHI_GIL3bV4WIZeCqeABXH_I1U51RsuSxNsD6mmgG6Sz9xHrxLTg0TCD3TDVZCRD6PtqlAmNb1dv5B-EOYYkuJL_HyxAUgdVp8rpUvA0QibwojD5f9sf_5DDRFA9S1kA6xA7o1sK8FDS4PNWcYn1zyFuVQtU6Bi_0_cDKxbFcXrfC3OTfqM-HO9fNM3p0Tt2lhflbGDe1lnFDZ8vtphOopE5sMm5cRwq9hWxNKXDU4MS_sYz9coa5dWaqqUeLEuLmE0O6QFRtY1hjdZHEhjU2sk50AnK0EkO4Jsh2uleMLqB8o39HTXDj2aLfy7U-bnX_w.jpg)
![](https://photo.group-telegram.com/u/cdn4.cdn-telegram.org/file/SbMCHkiLYVmhc616jkefi0UDy_95828UKxNMmyccm7L2ctvWkF8egbC4_lghJZYTthfMQkEupl14z5tRt3rDTMwYF8RjBgi7WLARxkoFXzwJkNlMG7eKixsfV05lX5i6htRLWfb9ocri7fyGExRxW8DZYF1uoA-dtsW26peOBS7u7A0praU-YxjPwME5SAa4W6IYOpNwJBbllWvv1Vx7HdA6BnEgR8jIRBFHyWfM_bSPQdTKEv5xqTaId8UibPUsmwxlRKVGALjHnLCEiZvYQwSdRHYykMCfNSD1ZB11PTYZ7jh1hGPpWswMpqMyWHDhxXXUDaGGZ6W8RlAmnEYyDw.jpg)
![](https://photo.group-telegram.com/u/cdn4.cdn-telegram.org/file/mFZAiqXXBAKifQ34QF5Z39k6PUZYI3AzJKddwFxf9WKIc78Zn7M3b-idtO6PLJA1t0rJdxQcH-QigDiNy5bbnefm-FrZM2aoCJo4WF15uvrErLK6P1iWXDUoxti6Xo6-A0SELDCBfdmLVe1ch3O2TiHTaIarZpicI9j9xvLau52IX-jLELkgo7W_qJfGtTwMjOyUDUofDS0wb9FeTuofxzq4kJFsm8zS_Y7oNjxeXThOSUPpJKDvBfo8-1tM-8oK1Q6hGR5n_vbBcSKk9STM70BXl2lO6LhFx2kROA9Q0moqifJFFQY6Pk6SuvRzxU1DfOBi03Afg03SUdwhet9kZg.jpg)
![](https://photo.group-telegram.com/u/cdn4.cdn-telegram.org/file/givb_IZ33Vicz_jZQK2ZQwfMskJD_bM6z-bVsBYJOV0gpzsVVDRNz-m6NWloG1Rba0WVKzqlKyihMir2fIVYEjjk_ncBdb4rZyw4qhFG51f58prIA8D0SNGaU42U6vkwNfWOlYDyZJoKb0WJKWy6XtmUt6vrZOFTpXUATf-xfujOPn6DoiV-DKXVuEKJk0WRonQBF42GQhU1yNKznjJE30Z18JGI4LVMTqMsxVpEZ4RpdHVHy14A1mKW1_7BJ9Lw3Z4X8FzHZlV1fwkXY33daYSxTAiQauawTNVEfh-HMmt7gOmTMcCyiG011eCGiOVF4qMHTBIb8-Wlwo1rbv6lVw.jpg)
![](https://photo.group-telegram.com/u/cdn4.cdn-telegram.org/file/XtRfHJPS_PR6Mt5l4UOe5Nj5QUDhhA2W4AibiKCoj0_HRJxqn2-nu1saSqO3Nuu-HvW3NWbZKn6PeGUtQ1UoW2e-xxHUOKf7px0_9jRLaBv8iYklOPc2Wqeo744SYb2j1TT6EC_xhEbXVISNPw_y3jdqCDaQkmPsRKFzML6cHKD-fuMdYUtge6kX7v09glpVxkcSespnJ1_L4eTSbJZ0HVJ1RHfc7g0etMkI7wMgrW6kj_yxncTPUX_ujN1cvIdbTz8dda3qlppeRGUFAAmMfpKnTfIxZDI7Ol6mVQAYZgZUW764NZn6anLLkpVbDU1g0jkBT2y0X3nDFuy8D8KhBA.jpg)
![](https://photo.group-telegram.com/u/cdn4.cdn-telegram.org/file/FFQSgLleUTtcE8Wa7_bTx8_-hGGKjFyNx1gf6fqUgTCHnlc3ZCRABJ34gIz0z0ZzhvanThBEmgqXRPY3GxC_iZc9T2OimXcgGPRnFhyrhYd4OmK_5FI7IGKadKetnhSLKI8y8Ui6YfhGI2xfD4O-4bD3JK7s-W4Stb5sI6hsOMVzQa11uO3nXpEY16C_mr2PI2fVV0DP-yM03uxJ3yoAQknWg5Agb6z7iPbLCEAdYN_TyNLEFcEmFhSrZDJfBwlO5rUev65YKFmVgXXbDlf-Zy4oLf16rjDoxbiUYef7oxscwLttUhEC3QVzs4FuANXD30bvSy6_VXp5vtGn6YT-nw.jpg)
![](https://photo.group-telegram.com/u/cdn4.cdn-telegram.org/file/uQY3aZHvtLl2wWhM94fplGeO50ZVMBa2hrpP8OEB7pLasJ1IjRzXJOAtvjRsPYERl_d7snszYlkdCRQTpr63Z1b0EiZkgfKhQK17qLDzbuBim4VPtabP7S7gaZa5bTKPMe_kHxcarQ9AT7wC9EK5cmabQjCDISe0BqX_U53Bc43Z44FFiYLwvacXmle9uS70P9QrTrNI0dv0s7DlfH3HYYKJVIfqcr0FCicxh7F0LNEQIHUy8NJO-OJl205SM94okfwfW9TVmNuLobAckl8LE1GG8NqSuidvwu0InODyTT0B7UJ1gt_faoGZwu3eYAh9N2D52x0qd_JSDUgmIcBDTQ.jpg)
![](https://photo.group-telegram.com/u/cdn4.cdn-telegram.org/file/OkmMG3jRUlpk-X_DXr3x3a8BOJhuM16KX-a_-AZJAENCFP78KKSfuzicBCKRzBTlNWezHGWRLOR8xvZBXKt1RH2V5TyzuySYvOXStQcgfx-IuGlKSFo7zTQgsgkROH-iVP3OxCWIQAJ6QcmhZbjgU0LXTO_WlHCFf0U98pFFvxXp1AYu0Dg8bveUIJkx5E0R7PU_YdxJAOO9Nct6Udrb4E-Q-JDxAq2jcxuZqCoWaWrdtSVfmtpXnm_mz8fXrCGtYjHZ3eQw-vd5vJ5HstKL8Yg0SABLDaUKDcc2gNBvBiySTs1H5Ws1hLKqaoRya9l-x6zZz8rWjCbpksNY7Q_J0g.jpg)
Share with your friend now:
group-telegram.com/ai_newz/3027