Forwarded from Igor Nevestenko
Собрал первую коллекцию для АрхВиза - в архиве описание workflow, ссылки на модели\лоры и примеры. Коллекция была сделана для моих платных подпичсиков на Boosty с акцентом на взаимодействие с плагином C4D to ComfyUI, но обычным пользователям ComfyUI так же актуальна!
https://www.group-telegram.com/c4d_folder/529
https://www.group-telegram.com/c4d_folder/529
Telegram
C4D:folder
ArchViz Workflow Collection - Vol.1 is designed to bridge the gap between Cinema 4D and ComfyUI
Download FREE
#ai #c4d #cinema4d #cg #comfy #comfyui #maxon #redshift #vfx
Download FREE
#ai #c4d #cinema4d #cg #comfy #comfyui #maxon #redshift #vfx
Seaweed APT2
Интерактивная модель генерации потокового видео по картинке в рилтайме от ByteDance, второе поколение. Первое было в январе
1 минута видео ,1 шаг, 24 кадра в секунду, потоковое разрешение 736x416 (эквивалент 640x480 - что???) в режиме реального времени на 1xh100 с интерактивным управлением!
Контроль позы, контроль камеры
Кода нет, ждем на сервисах
#image2video #realtime #cameracontrol #pose2video #posecontrol
Интерактивная модель генерации потокового видео по картинке в рилтайме от ByteDance, второе поколение. Первое было в январе
1 минута видео ,1 шаг, 24 кадра в секунду, потоковое разрешение 736x416 (эквивалент 640x480 - что???) в режиме реального времени на 1xh100 с интерактивным управлением!
Контроль позы, контроль камеры
Кода нет, ждем на сервисах
#image2video #realtime #cameracontrol #pose2video #posecontrol
Wan2.1_14B_FusionX
Сплав Wan2.1 с последними достижениями видеогенерации
До 50% быстрее стандартных моделей
Интегрированы Phantom Mode, VACE
- Кинематографичное движение от CausVid
- Детализация от AccVideo
- Плавность от MoviiGen1.1
- Текстуры и четкость от кастомных LoRA
воркфлоу
GGUF
#text2video #image2video #workflow
Сплав Wan2.1 с последними достижениями видеогенерации
До 50% быстрее стандартных моделей
Интегрированы Phantom Mode, VACE
- Кинематографичное движение от CausVid
- Детализация от AccVideo
- Плавность от MoviiGen1.1
- Текстуры и четкость от кастомных LoRA
воркфлоу
GGUF
#text2video #image2video #workflow
Media is too big
VIEW IN TELEGRAM
Seedance 1.0: Exploring the Boundaries of Video Generation Models
И еще новая модель для генерации видео от ByteDance, выше VEO 3 Preview на арене!
- поддерживает генерацию видео из текста и изображений;
- высокое качество и плавность движения в создаваемых видео;
- способна создавать видео с несколькими связными кадрами, сохраняя согласованность основного объекта, визуального стиля и атмосферы при переходах между кадрами;
- точно интерпретирует разнообразные стилистические подсказки, поддерживая широкий спектр творческих потребностей;
- позволяет стабильно контролировать взаимодействия между несколькими агентами, сложные последовательности действий и разнообразные движения камеры.
Пробовать бесплатно в Dreamina - 120 кредитов в день, спасибо @dAIpotestit
Попробовать платно на WavespeedAI
Попробовать платно на fal.ai
#text2video #image2video
И еще новая модель для генерации видео от ByteDance, выше VEO 3 Preview на арене!
- поддерживает генерацию видео из текста и изображений;
- высокое качество и плавность движения в создаваемых видео;
- способна создавать видео с несколькими связными кадрами, сохраняя согласованность основного объекта, визуального стиля и атмосферы при переходах между кадрами;
- точно интерпретирует разнообразные стилистические подсказки, поддерживая широкий спектр творческих потребностей;
- позволяет стабильно контролировать взаимодействия между несколькими агентами, сложные последовательности действий и разнообразные движения камеры.
Пробовать бесплатно в Dreamina - 120 кредитов в день, спасибо @dAIpotestit
Попробовать платно на WavespeedAI
Попробовать платно на fal.ai
#text2video #image2video
Media is too big
VIEW IN TELEGRAM
PlayerOne: Egocentric World Simulator
Симулятор реалистичных видео с точки зрения пользователя, основываясь на его движениях и сцене вокруг. Обучен на большом количестве данных и умеет точно моделировать мир. От Alibaba & co
Код ждем
#text2video #image2video #simulation #text2world #image2world #POV
Симулятор реалистичных видео с точки зрения пользователя, основываясь на его движениях и сцене вокруг. Обучен на большом количестве данных и умеет точно моделировать мир. От Alibaba & co
Код ждем
#text2video #image2video #simulation #text2world #image2world #POV
Экспериментальный Wan2.1-Self-Forcing-VACE
Свежий метод ускорения прикрутили к WAN2.1
воркфлоу для пряморуких умельцев
Прикрутили к модели 14B, работает с T2V и I2V. В виде LoRA. можно использовать и с FusionX - спасибо @MaxKhtv
#text2video #optimization #realtime
Свежий метод ускорения прикрутили к WAN2.1
воркфлоу для пряморуких умельцев
Прикрутили к модели 14B, работает с T2V и I2V. В виде LoRA. можно использовать и с FusionX - спасибо @MaxKhtv
#text2video #optimization #realtime
Telegram
Нейронавт | Нейросети в творчестве
Self Forcing: Bridging the Train-Test Gap in Autoregressive Video Diffusion
Метод ускорения видеогенерации через какие-то там трюки на обучении.
Модель генерирует высококачественные видео с разрешением 480P с начальной задержкой ~ 0,8 секунды, после чего…
Метод ускорения видеогенерации через какие-то там трюки на обучении.
Модель генерирует высококачественные видео с разрешением 480P с начальной задержкой ~ 0,8 секунды, после чего…
Media is too big
VIEW IN TELEGRAM
LoRA-Edit: Controllable First-Frame-Guided Video Editing via Mask-Aware LoRA Fine-Tuning
Метод редактирования видео. Распространяет изменения в первом кадре на всё видео с помощью масок. Позволяет использовать дополнительные опорные кадры.
На сайте есть сравнение с VACE и др
Код
#videoediting
Метод редактирования видео. Распространяет изменения в первом кадре на всё видео с помощью масок. Позволяет использовать дополнительные опорные кадры.
На сайте есть сравнение с VACE и др
Код
#videoediting
This media is not supported in your browser
VIEW IN TELEGRAM
Cosmos-Predict2
Семейство моделей от NVIDIA для создания изображений, видео и состояний мира с учетом физики - на основе текста, картинок или видеовходов.
2B и 14B
Про 2B пишут что хорошо, хотя втрое медленее SDXL при своей маленькости 😼
Код
Демо
Веса
воркфлоу
#text2image #text2video #image2image #image2video #world #physics
Семейство моделей от NVIDIA для создания изображений, видео и состояний мира с учетом физики - на основе текста, картинок или видеовходов.
2B и 14B
Про 2B пишут что хорошо, хотя втрое медленее SDXL при своей маленькости 😼
Код
Демо
Веса
воркфлоу
#text2image #text2video #image2image #image2video #world #physics
Wan 14B Self Forcing T2V Lora by Kijai
720x480 97кадров выдает за ~100 секунд на 4070ti super 16 vram, 4 steps, lcm, 1 cfg, 8 shift
Берете стандартный T2V воркфлоу от Kijai
Wan2.1-T2V-14B-StepDistill-CfgDistill - дистиллированная модель на 4-8 шагов, из которой Kijai вынул лору
#text2video #lora
720x480 97кадров выдает за ~100 секунд на 4070ti super 16 vram, 4 steps, lcm, 1 cfg, 8 shift
Берете стандартный T2V воркфлоу от Kijai
Wan2.1-T2V-14B-StepDistill-CfgDistill - дистиллированная модель на 4-8 шагов, из которой Kijai вынул лору
#text2video #lora
GitHub
ComfyUI-WanVideoWrapper/example_workflows/wanvideo_T2V_example_02.json at main · kijai/ComfyUI-WanVideoWrapper
Contribute to kijai/ComfyUI-WanVideoWrapper development by creating an account on GitHub.
MagCache: Fast Video Generation with Magnitude-Aware Cache
TeaCache пора на пенсию?
Метод ускорения генерации видео с помощью адаптивного кэширования, основанного на анализе величины изменений между шагами процесса. Это позволяет пропускать несущественные шаги и тем самым ускорять процесс без потери качества видео
Народные тесты на RTX5060ti:
- только torch compile: 60с
- только Magcache: 32с
- Magcache + torch compile: 21с
Прикручено к Wan2.1 / HunyuanVideo / FLUX / Chroma
Код
ComfyUI
#optimization
TeaCache пора на пенсию?
Метод ускорения генерации видео с помощью адаптивного кэширования, основанного на анализе величины изменений между шагами процесса. Это позволяет пропускать несущественные шаги и тем самым ускорять процесс без потери качества видео
Народные тесты на RTX5060ti:
- только torch compile: 60с
- только Magcache: 32с
- Magcache + torch compile: 21с
Прикручено к Wan2.1 / HunyuanVideo / FLUX / Chroma
Код
ComfyUI
#optimization
PartPacker: Efficient Part-level 3D Object Generation via Dual Volume Packing
Сегментированная генерация 3D моделей по картинке от NVIDIA
Как PartCrafter только уже с кодом и весами
Гитхаб
HF
Демо
#imageto3d #тестбендера
Сегментированная генерация 3D моделей по картинке от NVIDIA
Как PartCrafter только уже с кодом и весами
Гитхаб
HF
Демо
#imageto3d #тестбендера
Hunyuan 3D 2.1
Обновка 3D генератора от Tencent в опенсорсе.
2.5 похоже в опенсорс не выпустят
Акцент на #PBR текстурах. В прежней версии были просто RGB
Для генерации меша нужно 10 ГБ VRAM
Для генерации текстур 21 ГБ VRAM
Итого для текстурированного меша 29 ГБ VRAM.
Код
Демо
HF
#imageto3d #textto3d
Обновка 3D генератора от Tencent в опенсорсе.
2.5 похоже в опенсорс не выпустят
Акцент на #PBR текстурах. В прежней версии были просто RGB
Для генерации меша нужно 10 ГБ VRAM
Для генерации текстур 21 ГБ VRAM
Итого для текстурированного меша 29 ГБ VRAM.
Код
Демо
HF
#imageto3d #textto3d