IEAP: Image Editing As Programs with Diffusion Models
И еще один метод редактирования изображений на диффузных трансформерах
Разбивает сложные инструкции на последовательность простых операций. Операции программируются агентом на основе VLM
Код
Демо
#imageediting #inpainting
И еще один метод редактирования изображений на диффузных трансформерах
Разбивает сложные инструкции на последовательность простых операций. Операции программируются агентом на основе VLM
Код
Демо
#imageediting #inpainting
Media is too big
VIEW IN TELEGRAM
ElevenLabs v3
Пользоваться этим сервисом - слишком попоболь, но вдруг вы мазохист или не россиянин - для вас выкатили самую выразительную модель озвучки текста.
- Поддерживает 70+ языков
- многоголосовой режим
- аудио-теги, которые задают интонацию, эмоции и паузы в речи.
- Считывает эмоциональные переходы, реагирует на контекст, меняет тон в процессе речи.
Весь июнь дают 80% скидки на генерацию.
Промпт-гайд для v3
#tts #text2pseech
Пользоваться этим сервисом - слишком попоболь, но вдруг вы мазохист или не россиянин - для вас выкатили самую выразительную модель озвучки текста.
- Поддерживает 70+ языков
- многоголосовой режим
- аудио-теги, которые задают интонацию, эмоции и паузы в речи.
- Считывает эмоциональные переходы, реагирует на контекст, меняет тон в процессе речи.
Весь июнь дают 80% скидки на генерацию.
Промпт-гайд для v3
#tts #text2pseech
Voyager: Long-Range and World-Consistent Video Diffusion for Explorable 3D Scene Generation
Видеогенератор создает по одной картинке объемно согласованный мир, последовательность облаков точек с заданной пользователем траекторией камеры. Якобы пригоден для 3D реконструкции с согласованноыми RGB и глубиной
Короче, это не рандомные шевеления, а правильные шевеления, как надо шевеления картинки
Код ждем
#image2video
Видеогенератор создает по одной картинке объемно согласованный мир, последовательность облаков точек с заданной пользователем траекторией камеры. Якобы пригоден для 3D реконструкции с согласованноыми RGB и глубиной
Короче, это не рандомные шевеления, а правильные шевеления, как надо шевеления картинки
Код ждем
#image2video
This media is not supported in your browser
VIEW IN TELEGRAM
Ctrl-Crash: Controllable Diffusion for Realistic Car Crashes
А вот генератор реалистичных автомобильных столкновений. Не знаю зачем это вам и не хочу знать
На вход принимает
начальный кадр, баундинг боксы, типы столкновений (например, «Ego-Only crash», «Ego-and-Vehicle crash» и другие)
Код
#image2video #simulation
А вот генератор реалистичных автомобильных столкновений. Не знаю зачем это вам и не хочу знать
На вход принимает
начальный кадр, баундинг боксы, типы столкновений (например, «Ego-Only crash», «Ego-and-Vehicle crash» и другие)
Код
#image2video #simulation
This media is not supported in your browser
VIEW IN TELEGRAM
Higgsfield Speak
Видеосервис Higgsfield тоже запустил аватары
Выберите стиль, выберите аватар, напишите сценарий. Сервис создаст кинематографичное движение, голос, эмоции.
Передает язык тела, эмоции и динамичное исполнение.
Вы получаете 16 встроенных типов сцен:
Vlog, Stream, Podcast, Car Talk, Coaching, Fashion, Beauty, Professions, Selling, Emotions, 3D, Forum и другие.
Каждый из них разработан для соответствия реальным форматам контента.
Можно создавать свои аватары
Идеально подходит для:
Библиотек рекламных роликов UGC.
Скетчей и форматов шоу.
Учебного и коучингового контента.
Каналов YouTube без лиц.
Клонов инфлюенсеров.
Вирусных видео с говорящими головами.
Higgsfield Speak доступен на тарифах Pro и Ultimate.
Напишите комментарий 'Speak' к официальному посту чтобы поклянчить промокод с туториалом
По промокоду
По промокоду
#humananimation #speech2video #humanavatar
Видеосервис Higgsfield тоже запустил аватары
Выберите стиль, выберите аватар, напишите сценарий. Сервис создаст кинематографичное движение, голос, эмоции.
Передает язык тела, эмоции и динамичное исполнение.
Вы получаете 16 встроенных типов сцен:
Vlog, Stream, Podcast, Car Talk, Coaching, Fashion, Beauty, Professions, Selling, Emotions, 3D, Forum и другие.
Каждый из них разработан для соответствия реальным форматам контента.
Можно создавать свои аватары
Идеально подходит для:
Библиотек рекламных роликов UGC.
Скетчей и форматов шоу.
Учебного и коучингового контента.
Каналов YouTube без лиц.
Клонов инфлюенсеров.
Вирусных видео с говорящими головами.
Higgsfield Speak доступен на тарифах Pro и Ultimate.
Напишите комментарий 'Speak' к официальному посту чтобы поклянчить промокод с туториалом
По промокоду
SPEAK_DISCOUNT
дают скидку 20% на 1 месяц По промокоду
SPEAK_EXTRA
дают жалкие 15 кредитов на 3 генерации#humananimation #speech2video #humanavatar
This media is not supported in your browser
VIEW IN TELEGRAM
fluxions AI vui
Небольшие разговорные модели речи, которые могут запускаться на устройстве
Это опенсорсный конкурент notebooklm
Голосовая модель 100М параметров
Умеет клонировать голос
модели могут издавать различные неречевые звуки. Добавляйте в текст охи-ахи, это должно улучшить результат
Vui.BASE - базовая модель, обученная на 40 тысячах часов аудио-разговоров.
Vui.ABRAHAM - модель одного говорящего, может отвечать с учетом контекста.
Vui.COHOST - диалоговая модель двух собеседников
Попробовать на офсайте - на старте дают 10000 кредитов. По русски ни бельмес к сожалению. Качество речи ужасное. Ах да, это ж мелкие модели для смартфонов
Код
Веса
Демо - здесь будет HF демоспейс
#tts #text2speech #voicecloning #conversation #mobile
Небольшие разговорные модели речи, которые могут запускаться на устройстве
Это опенсорсный конкурент notebooklm
Голосовая модель 100М параметров
Умеет клонировать голос
модели могут издавать различные неречевые звуки. Добавляйте в текст охи-ахи, это должно улучшить результат
Vui.BASE - базовая модель, обученная на 40 тысячах часов аудио-разговоров.
Vui.ABRAHAM - модель одного говорящего, может отвечать с учетом контекста.
Vui.COHOST - диалоговая модель двух собеседников
Попробовать на офсайте - на старте дают 10000 кредитов. По русски ни бельмес к сожалению. Качество речи ужасное. Ах да, это ж мелкие модели для смартфонов
Код
Веса
Демо - здесь будет HF демоспейс
#tts #text2speech #voicecloning #conversation #mobile
Video World Models with Long-term Spatial Memory
Видеогенератор использует долгосрочную пространственную память для улучшения качества и согласованности генерируемых видео
Кода нет зато похоже на RDR2
#image2video
Видеогенератор использует долгосрочную пространственную память для улучшения качества и согласованности генерируемых видео
Кода нет зато похоже на RDR2
#image2video
This media is not supported in your browser
VIEW IN TELEGRAM
MARBLE: Material Recomposition and Blending in CLIP-Space
Новинка от Stability AI
Метод редактирования и смешивания материалов в изображениях с помощью предварительно обученных генеративных моделей, управляя ими через изменения в пространстве эмбеддингоав CLIP. Это позволяет настраивать такие свойства материалов, как шероховатость, металлический вид, прозрачность и свечение.
Код
Демо
#material #imageediting
Новинка от Stability AI
Метод редактирования и смешивания материалов в изображениях с помощью предварительно обученных генеративных моделей, управляя ими через изменения в пространстве эмбеддингоав CLIP. Это позволяет настраивать такие свойства материалов, как шероховатость, металлический вид, прозрачность и свечение.
Код
Демо
#material #imageediting
На fal.ai завезли Veo 3 от Гугла. Об этом в соответствующем анонсе объявила сама площадка в своем дискорде.
Никаких пробных попыток не дают, генерация 5-ти секундного видео стоит $3.75.
Спасибо @asleephidden
#text2video
https://fal.ai/models/fal-ai/veo3/playground
Никаких пробных попыток не дают, генерация 5-ти секундного видео стоит $3.75.
Спасибо @asleephidden
#text2video
https://fal.ai/models/fal-ai/veo3/playground
Media is too big
VIEW IN TELEGRAM
SeedVR2: One-Step Video Restoration via Diffusion Adversarial Post-Training
Метод одношаговой реставрации видео с помощью диффузии
Код ждем
#videorestoration
Метод одношаговой реставрации видео с помощью диффузии
Код ждем
#videorestoration
Media is too big
VIEW IN TELEGRAM
FlexPainter: Flexible and Multi-View Consistent Texture Generation
Гибкая генерация текстур, согласованных по ракурсам
На вход принимает референсные картинки и текстовые описания
Код ждем
#texture #image2texture
Гибкая генерация текстур, согласованных по ракурсам
На вход принимает референсные картинки и текстовые описания
Код ждем
#texture #image2texture
Pixel3DMM: Versatile Screen-Space Priors for Single-Image 3D Face Reconstruction
Создание 3D-модели лица по одной фотографии. Модель анализирует изображение и предсказывает геометрические характеристики для каждой точки изображения, что позволяет точно реконструировать форму лица в трёх измерениях.
Но выходе можно получить:
- нормали
- uv-координаты
- 2D-вершины (точки на плоскости, которые помогают в реконструкции геометрии лица)
- параметры 3D морфабельной модели лица (3DMM), которые описывают форму и особенности лица в трёх измерениях
Код
#imageto3d #head #image2normal #image2uv #uv
Создание 3D-модели лица по одной фотографии. Модель анализирует изображение и предсказывает геометрические характеристики для каждой точки изображения, что позволяет точно реконструировать форму лица в трёх измерениях.
Но выходе можно получить:
- нормали
- uv-координаты
- 2D-вершины (точки на плоскости, которые помогают в реконструкции геометрии лица)
- параметры 3D морфабельной модели лица (3DMM), которые описывают форму и особенности лица в трёх измерениях
Код
#imageto3d #head #image2normal #image2uv #uv
SkyReels-Audio: Omni Audio-Conditioned Talking Portraits in Video Diffusion Transformers
Оживлятор портретов по аудиофайлу речи от SkyReels
Умеет делать липсинк видео
Похоже что код и веса публиковать не собираются
Платно на офсайте - Можно загрузить свое аудио или сгенерировать, на выбор есть библиотека голосов
#lipsync #portraitanimation #speech2video #image2video
Оживлятор портретов по аудиофайлу речи от SkyReels
Умеет делать липсинк видео
Похоже что код и веса публиковать не собираются
Платно на офсайте - Можно загрузить свое аудио или сгенерировать, на выбор есть библиотека голосов
#lipsync #portraitanimation #speech2video #image2video