Telegram Group Search
This media is not supported in your browser
VIEW IN TELEGRAM
Animate AI

Генератор анимации с консистентными персонажами

записаться в вейтлист

#image2video #text2video #cartoon
This media is not supported in your browser
VIEW IN TELEGRAM
OCTAVE (Omni-Capable Text and Voice Engine)

Генератор речи следующего поколения от Hume AI.

Сочетает возможности EVI 2 с возможностями таких систем, как Voice Engine от OpenAI, TTS Voice Design от Elevenlab и NotebookLM от Google Deepmind

OCTAVE может генерировать любой голос и индивидуальность - и сопровождающий язык – по подсказке, имитируя пол, возраст, акцент, вокальный регистр, эмоциональную интонацию, стили речи.

Клонирует голос, акцент и индивидуальность любого говорящего из шумной записи продолжительностью всего в 5 секунд.

Общается голосом в реальном времени. Может создать несколько агентов, общающихся между собой, как в NotebookLM, только в реальном времени.

Сейчас идет тестирование "безопасности" модели кругом избранных, осторожничают

#realtime #text2speech #tts #voicecloning
This media is not supported in your browser
VIEW IN TELEGRAM
Опубликован код генератора 3D сцен на гауссианах по картинке WonderWorld

Код

#gaussian #image2scene #imageto3d
Switti: Designing Scale-Wise Transformers for Text-to-Image Synthesis

Масштабируемый трансформер для быстрой генерации картинок от Yandex Research. Приятно под занавес года увидеть отечественный релиз.

По словам разработчиков, превосходит существующие авторегрессионные (AR) модели и тягается наравне с ведущими диффузными моделями по качеству, при этом обходя их в 7 раз по скорости.

Код
Демо 512
Демо 1024

#text2image
1.58-bit FLUX

Bytedance и POSTECH квантизовали FLUX [dev].
Квантизованная модель требует для инференса в 5 раз меньше VRAM и занимает на диске в 7.7 раз меньше места.

К сожалению, есть только препринт, а ссылка из препринта ведет на несуществующий сайт. Ждем

#news #optimization #flux
DepthLab: From Partial to Complete

инпейнт карт глубины на основе диффузионных моделей.

Пригодно для заполнения недостающих данных, инпейнтинга 3D сцен, генерации оных по набору некалиброваных изображений или по тексту.

Код
Веса

#inpainting #image2depth
Новости сегодня уже бесполезно постить))

Этот год был определенно годом видеогенераторов и языковых моделей. Не согласны? Возразите мне в комментах))

Делайте ставки что бустанет в следующем году?

Спасибо всем кто помогал другу другу в комментах, спасибо за ваши репосты и реакции, вы лучшие. Поддержите канал бустами, своим ИИ-творчеством или чем хотите, велком а комментарии

Счастья вам, здоровья и быстрого инференса 🥂
Please open Telegram to view this post
VIEW IN TELEGRAM
Расскажите что у вас хорошего произошло в этом году?
#humor

Какие-то безумцы релизят свои нейросети даже 1 января. Не дают спокойно посидеть без новостей. Так что выхожу из сумрака
2025/06/19 02:15:36
Back to Top
HTML Embed Code: