Telegram Group Search
Forwarded from Igor Nevestenko
Собрал первую коллекцию для АрхВиза - в архиве описание workflow, ссылки на модели\лоры и примеры. Коллекция была сделана для моих платных подпичсиков на Boosty с акцентом на взаимодействие с плагином C4D to ComfyUI, но обычным пользователям ComfyUI так же актуальна!
https://www.group-telegram.com/c4d_folder/529
Seaweed APT2

Интерактивная модель генерации потокового видео по картинке в рилтайме от ByteDance, второе поколение. Первое было в январе

1 минута видео ,1 шаг, 24 кадра в секунду, потоковое разрешение 736x416 (эквивалент 640x480 - что???) в режиме реального времени на 1xh100 с интерактивным управлением!

Контроль позы, контроль камеры

Кода нет, ждем на сервисах

#image2video #realtime #cameracontrol #pose2video #posecontrol
Wan2.1_14B_FusionX

Сплав Wan2.1 с последними достижениями видеогенерации

До 50% быстрее стандартных моделей

Интегрированы Phantom Mode, VACE

- Кинематографичное движение от CausVid

- Детализация от AccVideo

- Плавность от MoviiGen1.1

- Текстуры и четкость от кастомных LoRA

воркфлоу
GGUF

#text2video #image2video #workflow
Media is too big
VIEW IN TELEGRAM
Seedance 1.0: Exploring the Boundaries of Video Generation Models

И еще новая модель для генерации видео от ByteDance, выше VEO 3 Preview на арене!

- поддерживает генерацию видео из текста и изображений;

- высокое качество и плавность движения в создаваемых видео;

- способна создавать видео с несколькими связными кадрами, сохраняя согласованность основного объекта, визуального стиля и атмосферы при переходах между кадрами;

- точно интерпретирует разнообразные стилистические подсказки, поддерживая широкий спектр творческих потребностей;

- позволяет стабильно контролировать взаимодействия между несколькими агентами, сложные последовательности действий и разнообразные движения камеры.

Пробовать бесплатно в Dreamina - 120 кредитов в день, спасибо @dAIpotestit
Попробовать платно на WavespeedAI
Попробовать платно на fal.ai

#text2video #image2video
Media is too big
VIEW IN TELEGRAM
PlayerOne: Egocentric World Simulator

Симулятор реалистичных видео с точки зрения пользователя, основываясь на его движениях и сцене вокруг. Обучен на большом количестве данных и умеет точно моделировать мир. От Alibaba & co

Код ждем

#text2video #image2video #simulation #text2world #image2world #POV
Media is too big
VIEW IN TELEGRAM
LoRA-Edit: Controllable First-Frame-Guided Video Editing via Mask-Aware LoRA Fine-Tuning

Метод редактирования видео. Распространяет изменения в первом кадре на всё видео с помощью масок. Позволяет использовать дополнительные опорные кадры.

На сайте есть сравнение с VACE и др

Код

#videoediting
This media is not supported in your browser
VIEW IN TELEGRAM
Cosmos-Predict2

Семейство моделей от NVIDIA для создания изображений, видео и состояний мира с учетом физики - на основе текста, картинок или видеовходов.

2B и 14B

Про 2B пишут что хорошо, хотя втрое медленее SDXL при своей маленькости 😼

Код
Демо
Веса
воркфлоу

#text2image #text2video #image2image #image2video #world #physics
Wan 14B Self Forcing T2V Lora by Kijai

720x480 97кадров выдает за ~100 секунд на 4070ti super 16 vram, 4 steps, lcm, 1 cfg, 8 shift

Берете стандартный T2V воркфлоу от Kijai

Wan2.1-T2V-14B-StepDistill-CfgDistill - дистиллированная модель на 4-8 шагов, из которой Kijai вынул лору

#text2video #lora
MagCache: Fast Video Generation with Magnitude-Aware Cache

TeaCache пора на пенсию?

Метод ускорения генерации видео с помощью адаптивного кэширования, основанного на анализе величины изменений между шагами процесса. Это позволяет пропускать несущественные шаги и тем самым ускорять процесс без потери качества видео

Народные тесты на RTX5060ti:
- только torch compile: 60с
- только Magcache: 32с
- Magcache + torch compile: 21с

Прикручено к Wan2.1 / HunyuanVideo / FLUX / Chroma

Код
ComfyUI

#optimization
Hunyuan 3D 2.1

Обновка 3D генератора от Tencent в опенсорсе.
2.5 похоже в опенсорс не выпустят

Акцент на #PBR текстурах. В прежней версии были просто RGB

Для генерации меша нужно 10 ГБ VRAM
Для генерации текстур 21 ГБ VRAM
Итого для текстурированного меша 29 ГБ VRAM.

Код
Демо
HF

#imageto3d #textto3d
2025/06/18 18:59:31
Back to Top
HTML Embed Code: