GreenNeuralRobots 6139 Telegram Group

Pika 2.1 не впечатлил меня генерацией по исходной картинке, за исключением вот этой нигерации, тут получилось неплохо

#neuronaut_art

1.9K views09:06

Нейронавт | Нейросети в творчестве

Видеогенератор Pika 2.1 открыли для платных подписчиков #text2video #image2video

Сначала не обратил внимания, а ведь там мой шот с пловцом в трейлере

🧐

Please open Telegram to view this post

VIEW IN TELEGRAM

2.0K views11:25

Нейронавт | Нейросети в творчестве

Внезапно

DeepSeek можно пользоваться через API Open AI, просто заменив базовый URL и API ключ. Они полностью совместимы. Миграция разработчика в две строчки кода

DeepSeek to Open AI: 🖕

#news

Please open Telegram to view this post

VIEW IN TELEGRAM

2.3K viewsedited 10:45

Нейронавт | Нейросети в творчестве

сегодня про новинки писать не буду
Их слишком много а меня слишком мало

2.0K views13:18

Нейронавт | Нейросети в творчестве

0:21

Media is too big

VIEW IN TELEGRAM

Так, чую до субботы протухнет, надо постить сейчас

#humor

3.1K views17:36

Нейронавт | Нейросети в творчестве

1:19

Media is too big

VIEW IN TELEGRAM

Qwen2.5-Max

Новая флагманская LLM от Alibaba, совет экспертов.
Превосходит DeepSeek v3 по циферкам бенча

Чат - не забудьте выбрать Qwen2.5-Max

#assistant #MOE

1.9K viewsedited 07:29

Нейронавт | Нейросети в творчестве

Janus-Pro

Мультимодальная авторегрессионная модель от DeepSeek

Генерирует картинки "лучше, чем DALL-E 3, SD3 и Emu3" (нет), а понимает изображение точнее, чем LLaVA

Сперва меня картинки не впечатлили, отбраковал новость, потом передумал

Код
Демо

#multimodal #mllm #text2image #image2text

1.9K viewsedited 08:02

Нейронавт | Нейросети в творчестве

0:04

This media is not supported in your browser

VIEW IN TELEGRAM

0:06

This media is not supported in your browser

VIEW IN TELEGRAM

AnchorCrafter: Animate CyberAnchors Saling Your Products via Human-Object Interacting Video Generation

Нишевый оживлятор поясных портретов, негерит взаимодействие с небольшими предметами для создания видео презентатора-продажника

Код ждем

#humananimation #portraitanimation #image2video #pose2video

2.0K views08:38

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

GenXD: Generating Any 3D and 4D Scenes

Генерация 3D и 4D сцен от Университета Сингапура и Microsoft

На вход подают камеру и движения объекта (сам не понял. Видимо, видео)

Код ждем

#videoto3d #videoto4d

2.0K views09:09

Нейронавт | Нейросети в творчестве

0:25

This media is not supported in your browser

VIEW IN TELEGRAM

DiffSplat: Repurposing Image Diffusion Models for Scalable 3D Gaussian Splat Generation

Генератор 3D объектов на гауссианах по картинке, по тексту. Поддерживает контроль генерации контролнетом - в примерах есть canny, depth, normals

Модель представляет собой файнтюн PixArt-Sigma-XL-2-512-MS

Код
Веса
Демо ждем

#textto3d #imageto3d #gaussian #conditioning #text2gaussian #image2gaussian

2.2K viewsedited 09:38

Нейронавт | Нейросети в творчестве

0:13

This media is not supported in your browser

VIEW IN TELEGRAM

LLaSA: Scaling Train-Time and Test-Time Compute for LLaMA-based Speech Synthesis

Новая SOTA (state of the art - достижение) в клонировании голоса с контролем эмоций и ультрареалистичным звуком.

Клонирует голос с акцентом по 5-10 секундному образцу

Хотя на TTS-арене на 12 месте, но может еще рано, он еще свежий

В основе Llama 3.2

Поддерживает клонирование голоса на английском и китайском языках

Есть 1B, 3B, обещают 8B

Сайта не нашел. Есть видео от какого-то индуса с локальным запуском

Гитхаб - обучение с нууля
Демо
local-llasa-tts - для локального запуска с GUI на gradio

#voicecloning #tts #text2speech #leaderboard

2.2K views11:47

Нейронавт | Нейросети в творчестве

0:55

This media is not supported in your browser

VIEW IN TELEGRAM

T2V 01 Director

Новая версия видеогенератора от Hailuo
Основная фишка - контроль камеры.

Гайд от режиссера Мигеля Иванова

#text2video #image2video #cameracontrol

3.6K views07:47

2025/06/14 11:41:39
Back to Top

HTML Embed Code:

<iframe width="100%" src="https://www.group-telegram.com/buyppe/webview?embed=1" title="Channel Webview" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>