Telegram Group Search
Новости по агентам

Genspark super agent - универсальный агент
Под капотом GPT-4o, o1, Claude, Gemini, DeepSeek, ElevenLabs, Kling 1.6, PixVerse 3.5, DreamMachine, Veo 2, Hunyuan,FLUX, Ideogram, Recraft, Dall-e 3, Imagen 3
——————————————

Agent S2 - опенсорсный агент на вашем компе
——————————————

Elevenlabs MCP - Озвучка, клонирование голоса, транскрибация, генерация звуков - всё работает в Claude, Cursor, Windsurf и др
——————————————

MCP Studio - легкое создание MCP серверов, нужен Anthropic API key
——————————————

unreal-mcp - MCP для создания игр на #UE
——————————————

Nanobrowser - мультиагентная ИИ-ситсема для веб-автоматизации, локальная альтернатива OpenAI Operator
——————————————

На HF появился пустой репозиторий Manus AI

#agent #mcp
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
UNO - Less-to-More Generalization: Unlocking More Controllability by In-Context Generation

Мультиобъектная кастомизация картинок от ByteDance.
Умеет делать персонализацию, стиль, примерку.
Прикручено к #Flux

Код
Демо

#personalization #referencing #text2image #image2image
This media is not supported in your browser
VIEW IN TELEGRAM
Any2Caption: Interpreting Any Condition to Caption for Controllable Video Generation

Контроль генерации видео на основе любой входной информации (текст, нормали, глубина, эскиз, сегментация, ракурс и т д) за счет использования мультимодальных языковых моделей

Эпоха зоопарка контролнетов уходит?

В работе явно указан Hunyuan, наверняка, может работать и с другими генераторами

Код ждем

#text2video #conditioning #controlnet
This media is not supported in your browser
VIEW IN TELEGRAM
Hunyuan3D-2-stable-projectorz

Легкий установщик (Windows) Hunyuan3D, не требует установки CUDA. Работает на 8Гб VRAM
Для интеграции с текстуровщиком StableProjectorz.

Напоминаю, что все непроверенные штуки из интернета вы устанавливаете на свой страх и риск

#textto3d #imageto3d
Forwarded from CG дневничок
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Browserable

JS-Библиотека для создания браузерных ИИ-агентов
Для работы понадобится API ключ одного из провайдеров Gemini / Open AI / Claude

Код

#agent
2025/04/14 04:00:53
Back to Top
HTML Embed Code: