GreenNeuralRobots 7336 Telegram Group

Minimax Hailuo 02

Главная новость минувшей ночи

Новый видеоген, побивший на арене VEO3 Preview

- лучший в своем классе по следованию промпту
- нативный 1080p
- умеет в акробатику и прочую экстремальную физику

Из описания бесплатного тарифа убрали ежедневную раздачу кредитов. Press F

На офсайте его нет (у меня, я халявщик) но есть во вчера релизнутом агенте MiniMax-M1
Говорят, там вообще даром и пусть никто не уйдет обиженным

- Самое длинное в мире контекстное окно: ввод 1 млн токенов, вывод 80 тыс.
- SOTA по агентам в опенсорсе
- RL с непревзойденной эффективностью: обучение всего за 534 700 долларов

HF
Гитхаб
Чат

#text2video #agent #sota #assistant

1.5K viewsedited 06:19

Нейронавт | Нейросети в творчестве

Topaz Labs Astra "Первый в мире" (ага) креативный апскейлер видео. Предлагают апскейлить сгенерарованные нейросетками видео до 4K, "с улучшением качества и добавлением мельчайших деталей". Под капотом новые модели Starlight Умеет делать интерполяцию кадров…

хорошие новости. Сходите в тред Астры проверьте не подтвердили ли вам ранний доступ. Если просили конечно

1.3K views06:50

Нейронавт | Нейросети в творчестве

1:55

This media is not supported in your browser

VIEW IN TELEGRAM

Proactor

первый в мире проактивный ИИ-агент, который работает в реальном времени, анализирует обсуждения, выявляет потенциальные потребности и выполняет задачи до того, как пользователь их сформулирует. Он самостоятельно ~~нажимает красную кноп~~ включается в разговор, чтобы предоставить транскрипцию, резюме и помощь в режиме реального времени.

Записаться в вейтлист

#agent #realtime

1.5K views07:16

Нейронавт | Нейросети в творчестве

0:54

This media is not supported in your browser

VIEW IN TELEGRAM

Chatterbox Audiobook Generator

По Chatterbox уже много свистоперделок вышло, вот одна из них. Мультиголосовой генератор аудиокниг / подкастов

Код

#audiobook #tts #text2audiobook #podcast #text2podcast

1.4K views07:43

Нейронавт | Нейросети в творчестве

1:03

This media is not supported in your browser

VIEW IN TELEGRAM

Ego-R1

Система для анализа сверхдлинных эгоцентрических видеозаписей (#POV) (длительностью в дни и недели). Использование структурированного процесса Chain-of-Tool-Thought (CoTT) позволяет агенту Ego-R1 шаг за шагом анализировать видео, используя различные инструменты.

Гитхаб

#agent #video2text @reasoning

1.5K views08:11

Нейронавт | Нейросети в творчестве

2:25

This media is not supported in your browser

Midjourney Video V1

Главная новость минувшей ночи: у MidJourney теперь тоже свой видеогенератор.

480p, фокус на красоте, доступен на тарифе за 10$/месяц

А знаете у кого еще? У Nijijourney разумеется. Блог

#image2video

1.4K views07:01

Нейронавт | Нейросети в творчестве

OpenAI разрешили всем генерить картинки в WhatsApp по бесплатному номеру 1-800-242-8478.

Без привязки аккаунта OpenAi можно аж одно изображение в день. Захотите привязать аккаунт - напишите боту "Link my WhatsApp with ChatGPT"

#text2image #imageediting

1.5K views10:57

Нейронавт | Нейросети в творчестве

0:35

This media is not supported in your browser

VIEW IN TELEGRAM

Ну а Seedance доступен на Krea.ai

#text2video #image2video

1.3K views11:14

Нейронавт | Нейросети в творчестве

0:51

This media is not supported in your browser

VIEW IN TELEGRAM

0:04

This media is not supported in your browser

VIEW IN TELEGRAM

0:06

This media is not supported in your browser

VIEW IN TELEGRAM

0:25

This media is not supported in your browser

VIEW IN TELEGRAM

MiniMax-Remover : Taming Bad Noise Helps Video Object Removal

Это нам нужно
Клинап (удаление) объектов на видео
К одноименному видеогенератору отношения не имеет (кажется)

Код
Демо ждем
Веса
ComfyUI

#cleanup #videoinpainting #objectremoval

1.4K views11:42

Нейронавт | Нейросети в творчестве

Align Your Flow: Scaling Continuous-Time Flow Map Distillation

NVIDIA придумали способ улучшить генерацию картинок, SOTA на ImageNet

Основная идея заключается в использовании модели потока (flow map), которая позволяет эффективно преобразовывать шумное изображение в чистое за несколько шагов, избегая накопления ошибок, характерного для других методов. Это обеспечивает высокое качество изображений при меньшем количестве шагов генерации.

Код ждем

#text2image

1.2K views06:42

Нейронавт | Нейросети в творчестве

0:38

This media is not supported in your browser

VIEW IN TELEGRAM

Stream-Omni

чат-бот, похожий на GPT-4o, который поддерживает одновременное взаимодействие с использованием различных типов данных: текста, изображений и речи. Он способен обрабатывать мультимодальные входы и генерировать ответы в виде текста или речи.

Код
Веса

#multimodal #any2any #assistant

1.4K views07:41

Нейронавт | Нейросети в творчестве

0:24

This media is not supported in your browser

VIEW IN TELEGRAM

DeepSite v2

Вторая версия онлайн вайбкодинга на DeepSeek подъехала

#coding #vibecoding

1.4K views08:11

Нейронавт | Нейросети в творчестве

3:37

Media is too big

VIEW IN TELEGRAM

Обновился прототипизатор программ Memex

- Создание #MCP серверов по текстовому промпту (за 10 минут)

- Teams - cовместная работа

- Agents API - работа с агентами

Промокод DENISK от подписчика @DenisKrasnokutskiy

Пробуем

#vibecoding #coding #mcp

1.4K viewsedited 08:41

Нейронавт | Нейросети в творчестве

0:24

This media is not supported in your browser

VIEW IN TELEGRAM

Творческий конкурс от сервиса создания видеороликов Higgsfield

Призовой фонд 15 000 долларов.
25 победителей.
Скидка 50% для всех новых пользователей.

#news #contest

1.3K views09:12

Нейронавт | Нейросети в творчестве

Forwarded from Data Secrets

1:09

This media is not supported in your browser

VIEW IN TELEGRAM

Google показали пример генеративной операционной системы

Это тот самый концепт, о котором так много говорит Карпаты (см. этот и этот посты). Суть в том, что в системе на самом деле нет никаких готовых приложений, никакого предустановленного интерфейса, ничего.

Каждый раз, когда вы на что-то нажимаете, следующий экран полностью генерируется моделью в режиме онлайн. Да, если вы заходите в приложение – оно тоже генерируется с нуля в моменте. Вместо оперативки – контекстное окно: файлы не хранятся, а тоже генерируются каждый раз заново на основе ваших предыдущих действий.

У Google это называется Gemini Computer. Надо сказать, что это не отдельный релиз, а просто демка способностей новой Gemini 2.5 Flash Light, которую вчера выложили на YouTube официального аккаунта.

Мол: посмотрите, новая модель настолько резвая, что с ней можно даже вот такое провернуть (460 токенов в секунду – действительно хороший результат).

В общем, выглядит очень занятно. Google, кажется, первые, кто додумался что-то такое сделать: youtu.be/q6qD_i1Et2w

1.2K views12:28

2025/06/25 11:10:04
Back to Top

HTML Embed Code:

<iframe width="100%" src="https://www.group-telegram.com/buyppe/webview?embed=1" title="Channel Webview" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>