⚡Новая t2i модель – PixArt 900M 1024x1024
На HuggingFace появилось новая модификация DiT на базе PixArt-Σ.
Что за она?
Оригинальная модель Pixart-Σ - это DiT с 28 слоями, которая имеет 600 M параметров в сумме. Умельцы взяли эту модель и прикрутили к ней еще 14 слоев (наверное, тупо добавили в конец). В итоге получили модель с 42 слоями и 900 M параметров. Далее это все дообучили на датасете с 3.5 млн картинок, причем первые 28 слоев инициализировали весами Pixart-Σ.
В датасете были генерации из MJ-6, DALLE-3, аниме и профессиональные фотографии. А тюнили все всего лишь на 8xA100.
Результаты:
На реддите модель хвалят, кто-то даже говорит, что для него она лушче чем SD3. Я потестил Pixart-Σ 600M против PixArt 900M на нескольких промптах cfv. Почти везде Σ лучше чем версия 900 M, кроме может быть аниме. На картинках слева - Σ, справа - PixArt 900M, промпты оставлю в комментах.
Модель еще очень сильно недотренирована, контуры обектов часто не очень четкие, детализация тоже еще не очень высокая. Что-ж, ждем новых версий тюна.
Я думаю, что учить с нуля было бы лучше, но так как это опенсорс, то все на энтузиазме, ресурсов мало, и поэтому придумали такой дешманский метод, чтобы расширить размер модели.
Веса:
- Базовая модель: https://huggingface.co/terminusresearch/pixart-900m-1024-ft-v0.5
- Файнтюн (его еще продолжают тренировать): https://huggingface.co/ptx0/pixart-900m-1024-ft-v0.7-stage2
Demo на обнимающем лице
@ai_newz
На HuggingFace появилось новая модификация DiT на базе PixArt-Σ.
Что за она?
Оригинальная модель Pixart-Σ - это DiT с 28 слоями, которая имеет 600 M параметров в сумме. Умельцы взяли эту модель и прикрутили к ней еще 14 слоев (наверное, тупо добавили в конец). В итоге получили модель с 42 слоями и 900 M параметров. Далее это все дообучили на датасете с 3.5 млн картинок, причем первые 28 слоев инициализировали весами Pixart-Σ.
В датасете были генерации из MJ-6, DALLE-3, аниме и профессиональные фотографии. А тюнили все всего лишь на 8xA100.
Результаты:
На реддите модель хвалят, кто-то даже говорит, что для него она лушче чем SD3. Я потестил Pixart-Σ 600M против PixArt 900M на нескольких промптах cfv. Почти везде Σ лучше чем версия 900 M, кроме может быть аниме. На картинках слева - Σ, справа - PixArt 900M, промпты оставлю в комментах.
Модель еще очень сильно недотренирована, контуры обектов часто не очень четкие, детализация тоже еще не очень высокая. Что-ж, ждем новых версий тюна.
Я думаю, что учить с нуля было бы лучше, но так как это опенсорс, то все на энтузиазме, ресурсов мало, и поэтому придумали такой дешманский метод, чтобы расширить размер модели.
Веса:
- Базовая модель: https://huggingface.co/terminusresearch/pixart-900m-1024-ft-v0.5
- Файнтюн (его еще продолжают тренировать): https://huggingface.co/ptx0/pixart-900m-1024-ft-v0.7-stage2
Demo на обнимающем лице
@ai_newz
group-telegram.com/ai_newz/3027
Create:
Last Update:
Last Update:
⚡Новая t2i модель – PixArt 900M 1024x1024
На HuggingFace появилось новая модификация DiT на базе PixArt-Σ.
Что за она?
Оригинальная модель Pixart-Σ - это DiT с 28 слоями, которая имеет 600 M параметров в сумме. Умельцы взяли эту модель и прикрутили к ней еще 14 слоев (наверное, тупо добавили в конец). В итоге получили модель с 42 слоями и 900 M параметров. Далее это все дообучили на датасете с 3.5 млн картинок, причем первые 28 слоев инициализировали весами Pixart-Σ.
В датасете были генерации из MJ-6, DALLE-3, аниме и профессиональные фотографии. А тюнили все всего лишь на 8xA100.
Результаты:
На реддите модель хвалят, кто-то даже говорит, что для него она лушче чем SD3. Я потестил Pixart-Σ 600M против PixArt 900M на нескольких промптах cfv. Почти везде Σ лучше чем версия 900 M, кроме может быть аниме. На картинках слева - Σ, справа - PixArt 900M, промпты оставлю в комментах.
Модель еще очень сильно недотренирована, контуры обектов часто не очень четкие, детализация тоже еще не очень высокая. Что-ж, ждем новых версий тюна.
Я думаю, что учить с нуля было бы лучше, но так как это опенсорс, то все на энтузиазме, ресурсов мало, и поэтому придумали такой дешманский метод, чтобы расширить размер модели.
Веса:
- Базовая модель: https://huggingface.co/terminusresearch/pixart-900m-1024-ft-v0.5
- Файнтюн (его еще продолжают тренировать): https://huggingface.co/ptx0/pixart-900m-1024-ft-v0.7-stage2
Demo на обнимающем лице
@ai_newz
На HuggingFace появилось новая модификация DiT на базе PixArt-Σ.
Что за она?
Оригинальная модель Pixart-Σ - это DiT с 28 слоями, которая имеет 600 M параметров в сумме. Умельцы взяли эту модель и прикрутили к ней еще 14 слоев (наверное, тупо добавили в конец). В итоге получили модель с 42 слоями и 900 M параметров. Далее это все дообучили на датасете с 3.5 млн картинок, причем первые 28 слоев инициализировали весами Pixart-Σ.
В датасете были генерации из MJ-6, DALLE-3, аниме и профессиональные фотографии. А тюнили все всего лишь на 8xA100.
Результаты:
На реддите модель хвалят, кто-то даже говорит, что для него она лушче чем SD3. Я потестил Pixart-Σ 600M против PixArt 900M на нескольких промптах cfv. Почти везде Σ лучше чем версия 900 M, кроме может быть аниме. На картинках слева - Σ, справа - PixArt 900M, промпты оставлю в комментах.
Модель еще очень сильно недотренирована, контуры обектов часто не очень четкие, детализация тоже еще не очень высокая. Что-ж, ждем новых версий тюна.
Я думаю, что учить с нуля было бы лучше, но так как это опенсорс, то все на энтузиазме, ресурсов мало, и поэтому придумали такой дешманский метод, чтобы расширить размер модели.
Веса:
- Базовая модель: https://huggingface.co/terminusresearch/pixart-900m-1024-ft-v0.5
- Файнтюн (его еще продолжают тренировать): https://huggingface.co/ptx0/pixart-900m-1024-ft-v0.7-stage2
Demo на обнимающем лице
@ai_newz
BY эйай ньюз
![](https://photo.group-telegram.com/u/cdn4.cdn-telegram.org/file/a6EGZkJYyBtblFxxL3J7z8qXBddY57GQLjxW6ynvO1008cgvFFG2f9cWiGbE4TsUqAKK-X0SHsSfBzM35NXVnaOEsla0jF8c8iHSM7KL6IvyTX5p1MzuOB5DjBeJZgAYOhvhOphIEq8hSroMn8cBvw79EJJ_qDwmnCGXt0haDoYS0uZKElSN51AABCDhO_EBipmDpA9_46jhi_XbgZgGRQjRRyH6xq3FWiflmH62gKM-etGhnAlXvFoZwkKhzxui1VgBLFmweG88N557ZgljTRD3sLW6wJXZW29o4IJ2gEy29kNlaizaqtad4bdqwJnFsfcIH2y0SHLEeVOh9T0fVQ.jpg)
![](https://photo.group-telegram.com/u/cdn4.cdn-telegram.org/file/bNmxMZxtqbh8OjzgyrA3FJD3JYOYF26_a4i5oMpZcJukCfQWGjsYqL36WPCqt5X7aDu0-k24rNkgDHpNVI5fEX6i2lDv2jFZrvS3BGNHUFvGuXB99kFLBBkKJoHhLG18LvFCeXLC6rJwZOT0UKhFibUxG_0Lgwl7IRIOjsuhQn6TJiryOk84TdXXhotbAiueOjmHBVVKuumEcRsM5dHZ_N3yEJ_Tl-n7o3LIF1AaF-XX1NU4zgkjQ7vvB2zsyanLtJ5d9JXxGypM453G13rYFQptT2ROeqxiMJ5-l11bPk6gVErMVvrNkmo_J1_Pg5jc3FIO9UENsZUHM4HH6YiSbw.jpg)
![](https://photo.group-telegram.com/u/cdn4.cdn-telegram.org/file/I1zCCi0PWByG0m1IgpyDhMUbtVywlzBCStne90tMhCVU3cErw7KoHI_z5aws5_CTC7J9cVqrZ-Cu_D_CWaUDC1PS78qCQ9tjVYAQvEaxWMy_eSCN0TyDD76-QwDetYfrgLp_616mNP9-l1L_zO6GkT5R9KImWOlAA-W8OhK9bHpsV8-RZ3b-dMJ5hbvgX-n9ySUJ78IExU_XKC-TxzGlQLt0y-4VrC9f757uDLZVVRrEFDp2BJ1stXRYaY63trlelwNCEPyEqLbQC15t0dFJuqvhyqXOgKTaw_xPJNHTj0234JPRUE1JV_Ge-xQ_C5Sml2fXkHBcU2PSJnGKRVxLNg.jpg)
![](https://photo.group-telegram.com/u/cdn4.cdn-telegram.org/file/rkqsFUMyLzBI3Xf1N4ob27ZhePfaYwPbrLkmke_jQFDSsPcpMpEylgUkhnX-LgxIFVhKjsX4VqdKRqKcas4ew_IXwmD7HklUom25GCCh05JMPE2RvXT9SvsX0PQuG-9K9gWObB4Y7qvH5i3WW1ieleSRelLhBRzfphzjiyqPOrDi-c0VYml23JR1yklSY-1wj7772wfXhKFDt1KFfER6UPb2q8bnCIXEPQZOFbHSfrK2j6uzUTvvgnCywqb_Pi27TAB8TXLXWqGLVQlbrE940tIssYJljlegSvi71KR5Km6zISIyFspccyhE8gATikrYG1bpa-3LRHk05cyoJ7oLeQ.jpg)
![](https://photo.group-telegram.com/u/cdn4.cdn-telegram.org/file/iaC9xWy6m7-PJfekq7YGDktl1g3uCnbxjROrQ5jNwihVB9TF8eIO-muIRRhaIv4Tc1tcsw3fqVZcNZVrmo50dNIA6GoapmKdqOG00kLjEXQCxUThp7wEKchu21rKfbqZTPkxuFBdRZ4WGXBz07fqZ22oosThUKOBt-C6F7B6Q23jO7T9jLkSgT1gY1M9OE61IY7jcM8H-jlAWwRZJJeT98mluetUl-CdVEuFgVp0JlqUXVsDRBCIB7BT7RJKk9vqfFIZ0Z18-UwM7BnyA6xQAe2gM0I5CPg7xp9wSggFM1QeQ05oqAQejJnlLfgjB79RVrBCiIQSPFVSjVK3t5QpCA.jpg)
![](https://photo.group-telegram.com/u/cdn4.cdn-telegram.org/file/F9yd-kMF-Q-5tjv6zR5iVrNUNe7lrvJRISaRSDh6gbuMkxJgGAPyLphXKOIFKWY4U0FNEP7GOvRl1T53Ixun5uA7FgS17QQLhbsSold0i4RifjGDQgc3wk9J-Jbgjwft_v8NY1YuC9crFvJhVvcv5F2j6DZZHSTNrw75lEbm5prJYDg7YJ44Yrtsx-FjOunGRY6jMIiyN--360MJx_op3ph4nbmVm1ZNv7rcl7dPwSXA-JRm0ok_vWCEW1jz8KgotvSV3eILNyJIV65a089fMtbwNzRsVZ4QfsIKBAI2PVn3zdQyHf36fo3C4Gxy7A_zvOkFSQ1pYEfyV_mkFIMXqw.jpg)
![](https://photo.group-telegram.com/u/cdn4.cdn-telegram.org/file/YYhb3o4BwfQTbK3Y6qdCc3vbDRGJ3XXeLTYBRMywZSSu8x2OZ1Ofzx29dEr06lhJlWnL8eThSYaeCGEuSrLUfXctxgg4OqXYlnH7nm2Cox5aYPGVc2AhH_X6fMSlfE8ycA4jeMEaXdQ8gggC9rP0OEdBX3eZMxpg2acFqOTNmEsfXxTRp6Jqxm7VA4k2JMLX4CwhKK7B402kOHJulfbWajVjRRrQYE1sqhLDkIL3hYErWC-zZ_FFirrRQAz1mvKz3MFbudYF5E0SsYzmJjdZpzKFr9BtxWrwVDZj_b-w6zph6dFoSVel7jY6o-HRXGCW7erTvaGEFf6eyMx7j27f5A.jpg)
![](https://photo.group-telegram.com/u/cdn4.cdn-telegram.org/file/RVO9deXvHDRIyEzpZLHftiUo4YCIW9H52eNggA4hHMN0l16CU6BeeOBR2EtXrbvCfG5Bj3JGjfXMmEuWRFcYMqGDHjGclb3cPLcS1tTLJJbSqBk0qLuX-ImQQJ-oQZi2o13qEEzf0jlbf8JH_hVCMAbnglPuciEk7K2Slk7VDM9e0MK7km1-8IJbhiD6dYNnoRfV9rMfJ8WbKgQR_vcCOklxbnlgujnVy1hApC5z6XRdhSw4MGd-gMo_uW7Og5rKmmXts9WslkzSESr8nnXYKEqvGhBgSGsRHmXXaqbu4aRt5lFcriWWR9vCZcuZ4tZTPnupGLe8BBwH1XKzGhVxdQ.jpg)
![](https://photo.group-telegram.com/u/cdn4.cdn-telegram.org/file/uBkj1cflVkOlmi6QUORuojmW1mYqMDvq17tbIu-X3NY6Ou7c3utlFLmN-wppB9homHmVT5C_v8njESWwAEWwk2W1eCdvrVcCy_zKWGWcsWXZL-0JHSHTCY1SAxcKiXFw1TFi8rwr7IPZdXQc3GmcC89MhYqn25cSO_8vfXuoFbbCPyQRVgNcn7PSeydbwxgn-b7R39KABUTN3530alozaROPD0aEkOUX2PqhxKcdqhlxQXcqKkABcnHGmBgGhZ_hhGL41ydzlTBUh_4jOio7xV9ZPhf6bd_WLHHSpqRvLJfy5KSCPOtHBkZpWT8pS9pBlZ0-F8HvjQcNd8B6aykFWg.jpg)
![](https://photo.group-telegram.com/u/cdn4.cdn-telegram.org/file/gw0YwvDkgRQ600Q7zsR2j1E49e-nURspJgXdCIa7QtDBxgp7CySgHHBVG_XcuIY62SoAJQmXya4w97hGdH34NGkcuAKJO-U-n5OTsXOmmdxzFOLbFCuClXKgLpH4ZcvbQBQdUJLFuJnSkQsr6AIP4T-IdP16w97ZUMNEBLIDlMKOIDy3SYxOCuwqN2-JMdMBUViowczRQ6DNSsTwcy6wLPghHOoh50N1npq2Vk_I7Veg66h7EnMkbHWatpW2iZCtJI8DSeL_MZ5Re5TL_mD7hWNnRcKwZ1B6yfm2pEJdh_z1LU2lkLZhj19Y69KM0hFmdIipAaTWJ7-UbDGPMdsHJg.jpg)
Share with your friend now:
group-telegram.com/ai_newz/3027