GreenNeuralRobots Telegram Group

Telegram Group Search

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

fluxions AI vui

Небольшие разговорные модели речи, которые могут запускаться на устройстве

Это опенсорсный конкурент notebooklm

Голосовая модель 100М параметров

Умеет клонировать голос

модели могут издавать различные неречевые звуки. Добавляйте в текст охи-ахи, это должно улучшить результат

Vui.BASE - базовая модель, обученная на 40 тысячах часов аудио-разговоров.

Vui.ABRAHAM - модель одного говорящего, может отвечать с учетом контекста.

Vui.COHOST - диалоговая модель двух собеседников

Попробовать на офсайте - на старте дают 10000 кредитов. По русски ни бельмес к сожалению. Качество речи ужасное. Ах да, это ж мелкие модели для смартфонов

Код
Веса
Демо - здесь будет HF демоспейс

#tts #text2speech #voicecloning #conversation #mobile

1.5K views12:41

Нейронавт | Нейросети в творчестве

Media is too big

VIEW IN TELEGRAM

Media is too big

VIEW IN TELEGRAM

Video World Models with Long-term Spatial Memory

Видеогенератор использует долгосрочную пространственную память для улучшения качества и согласованности генерируемых видео

Кода нет зато похоже на RDR2

#image2video

1.4K views07:00

Нейронавт | Нейросети в творчестве

HuggingFace запустили #MCP сервер, предлагают подключать свои LLM к API-интерфейсам Hub напрямую из Cursor, VSCode, Windsurf и других приложений MCP

#news

1.4K viewsedited 07:41

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

MARBLE: Material Recomposition and Blending in CLIP-Space

Новинка от Stability AI

Метод редактирования и смешивания материалов в изображениях с помощью предварительно обученных генеративных моделей, управляя ими через изменения в пространстве эмбеддингоав CLIP. Это позволяет настраивать такие свойства материалов, как шероховатость, металлический вид, прозрачность и свечение.

Код
Демо

#material #imageediting

1.5K views08:11

Нейронавт | Нейросети в творчестве

На fal.ai завезли Veo 3 от Гугла. Об этом в соответствующем анонсе объявила сама площадка в своем дискорде.

Никаких пробных попыток не дают, генерация 5-ти секундного видео стоит $3.75.

Спасибо @asleephidden

#text2video

https://fal.ai/models/fal-ai/veo3/playground

1.6K views08:41

Нейронавт | Нейросети в творчестве

Media is too big

VIEW IN TELEGRAM

SeedVR2: One-Step Video Restoration via Diffusion Adversarial Post-Training

Метод одношаговой реставрации видео с помощью диффузии

Код ждем

#videorestoration

1.3K viewsedited 08:17

Нейронавт | Нейросети в творчестве

Media is too big

VIEW IN TELEGRAM

FlexPainter: Flexible and Multi-View Consistent Texture Generation

Гибкая генерация текстур, согласованных по ракурсам

На вход принимает референсные картинки и текстовые описания

Код ждем

#texture #image2texture

1.2K viewsedited 08:46

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

Pixel3DMM: Versatile Screen-Space Priors for Single-Image 3D Face Reconstruction

Создание 3D-модели лица по одной фотографии. Модель анализирует изображение и предсказывает геометрические характеристики для каждой точки изображения, что позволяет точно реконструировать форму лица в трёх измерениях.

Но выходе можно получить:

- нормали

- uv-координаты

- 2D-вершины (точки на плоскости, которые помогают в реконструкции геометрии лица)

- параметры 3D морфабельной модели лица (3DMM), которые описывают форму и особенности лица в трёх измерениях

Код

#imageto3d #head #image2normal #image2uv #uv

1.1K views09:14

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

SkyReels-Audio: Omni Audio-Conditioned Talking Portraits in Video Diffusion Transformers

Оживлятор портретов по аудиофайлу речи от SkyReels

Умеет делать липсинк видео

Похоже что код и веса публиковать не собираются

Платно на офсайте - Можно загрузить свое аудио или сгенерировать, на выбор есть библиотека голосов

#lipsync #portraitanimation #speech2video #image2video

1.1K views11:25

Нейронавт | Нейросети в творчестве

Media is too big

VIEW IN TELEGRAM

Difix3D+: Improving 3D Reconstructions with Single-Step Diffusion Models

Исправляет артефакты NeRF и 3DGS в областях с недостатком констрейнов (??), повышая общее качество 3D-представления. Проект NVIDIA

Код ждем

#gaussian #nerf

1.1K views14:11

Нейронавт | Нейросети в творчестве

Media is too big

VIEW IN TELEGRAM

CAST: Component-Aligned 3D Scene Reconstruction from an RGB Image

Cоздает 3D модели по одной картинке с учётом физических взаимодействий и пространственных отношений объектов

В деле замешаны Deemos

Код ждем

#imageto3d #image2scene

1.1K viewsedited 14:47

Нейронавт | Нейросети в творчестве

Media is too big

VIEW IN TELEGRAM

TeGA: Texture Space Gaussian Avatars for High-Resolution DynamicHead Modeling

Аватары на гауссианах от Google
Впечатляющее качество, уделали всех конкурентов, но

Кода нет

#gaussian #humanavatar

1.1K viewsedited 15:18

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

FreeTimeGS: Free Gaussian Primitives at Anytime Anywhere for Dynamic Scene Reconstruction

Реконструкция объемных динамических сцен по видео, на гауссианах

Еще один проект без кода, зато можно интерактивно покрутить сцены (поддерживает VR гарнитуры)

#novelveiw #rendering #gaussian #video2gaussian #videoto4D #4D

1.2K views15:48

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

HeyGem

Опенсорсная альтернатива HeyGen. Ну можно было и по названию догадаться

- Аватар в 4K по отрывку видео 1 секунда (???)
- Клонирование лица и голоса
- Запускается на 1080Ti +

Код

#lipsync #humanavatar #vocecloning #avatar #

1.0K views12:11

2025/06/11 09:24:51
Back to Top

HTML Embed Code:

<iframe width="100%" src="https://www.group-telegram.com/buyppe/webview?embed=1" title="Channel Webview" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>