GreenNeuralRobots Telegram Group

SPAR3D: Stable Point-Aware Reconstruction of 3D Objects from Single Images

Новинка от Stability AI

Быстрая реконструкция 3D модели по одному изображению с промежуточной генерацией облака точек.

На основе SF3D

Позволяет интерактивно редактировать модель

Код
Демо

#imageto3d #image2mesh

1.3K views11:13

Нейронавт | Нейросети в творчестве

Grok iOS

Мобильное приложение вышло в AppStore в США

Веб-версию ждем

#assistant #mobile #ios

1.2K views13:30

Нейронавт | Нейросети в творчестве

1:50

Media is too big

VIEW IN TELEGRAM

STAR: Spatial-Temporal Augmentation with Text-to-Video Models for Real-World Video Super-Resolution

Апскейлер видео от ByteDance

Они там придумали как апскейлить видео при помощи видеогенераторов, сохраняя консистентность во времени.

Основано на I2VGen-XL, VEnhancer, CogVideoX и OpenVid-1M

Прикручено к I2VGen-XL и CogVideoX-5B

Претрейн на CogVideX-5B поддерживает исходники только 720x480

Иyфу по потреблению VRAM не нашел

Код
Демо

#upscale #enhance #video2video

1.6K views22:00

Нейронавт | Нейросети в творчестве

ebook2audiobook v2.0.0 Beta Конвертер электронных книг в аудиокниги обновился. Поддерживает разные форматы, клонирование голоса, 1124 языка, в том числе русский. Но мне не понравилась голосовая модель, попозже покажу лучший вариант Демо #text2speech …

Please open Telegram to view this post

VIEW IN TELEGRAM

1.3K viewsedited 07:54

Нейронавт | Нейросети в творчестве

0:21

This media is not supported in your browser

VIEW IN TELEGRAM

0:11

This media is not supported in your browser

VIEW IN TELEGRAM

ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation

Оценка позы по изображению и по видео

Код
Веса
Демо по картинке
Демо по видео/картинке
Колаб

#poseestimation #image2pose #video2pose

1.0K views10:13

Нейронавт | Нейросети в творчестве

ComfyUI-TangoFlux

Для желающих заморочиться по генерации звуковых эффектов подвезли #ComfyUI ноды TangoFlux

#text2audio #text2sfx #foley

GitHub

GitHub - LucipherDev/ComfyUI-TangoFlux: ComfyUI Custom Nodes for "TangoFlux: Super Fast and Faithful Text to Audio Generation with…

ComfyUI Custom Nodes for "TangoFlux: Super Fast and Faithful Text to Audio Generation with Flow Matching". This generates high-quality 44.1kHz audio up to 30 seconds using just a ...

1.1K views10:43

Нейронавт | Нейросети в творчестве

1:03

This media is not supported in your browser

VIEW IN TELEGRAM

Hallo3: Highly Dynamic and Realistic Portrait Image Animation with Diffusion Transformer Networks

Новое поколение липсинка от Baidu

Работает и с головными уборами.
Анимирует не только лицо но и фон.

Все потому что внутри претрейн Cogvideox-5b-i2v

Код
Веса

#lipsync #talkinghead #humananimation #portraitanimation

1.2K views11:04

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

EditAR: Unified Conditional Generation with Autoregressive Models

Авторегрессионная модель для различных задач управляемой генерации картинок от NVIDIA

- редактирование изображений
- генерация картинки по карте глубины
- генерация по карте краев (canny/edges)
- генерация по сегментной маске

Код ждем

#imageediting #conditioning #controlnet

1.1K views11:39

Нейронавт | Нейросети в творчестве

0:32

This media is not supported in your browser

VIEW IN TELEGRAM

Да она же обдолбаная

Робот от Realbotix для общения

#news #robot

1.1K viewsedited 18:19

Нейронавт | Нейросети в творчестве

FitDiT: Advancing the Authentic Garment Details for High-fidelity Virtual Try-on

Виртуальная примерочная от Tencent

Код
Демо HF
Демо 2

#tryon

567 views07:25

Нейронавт | Нейросети в творчестве