Telegram Group Search
Gen-4 References

Теперь можно закинуть любого персонажа в любую сцену. Если раньше для такого надо было тренировать LoRA, то сейчас достаточно дать нейросети два референса: персонажа и локацию/стилизацию.

Работает с фотографиями, 3D, селфи, генерациями, локациями, стилями, разными ракурсами и композициями.

Пока лучше всего работает на людях и сценах, но можно тестить и другие кейсы.

Только на платных тарифах, ссылка [тут]

@tips_ai #news
Сэм Альтман и проект World

В прошлом году я [рассказывал] про проект World, а сегодня Сэм на презентации показал Orb Mini — карманную версию своего шарика, который теперь выглядит как смартфон.

Он нужен, чтобы верифицировать людей и отличать их от ИИ в интернете. Альтман мечтает, чтобы с World ID можно было регать аккаунты в Visa, Tinder и прочих сервисах.

Гаджет должен быть всегда при тебе, чтобы можно было верифицировать других и помогать масштабировать всю эту систему.

На сегодня World уже верифицировал 12 миллионов человек 📸

Вопросов, конечно, куча (особенно по биометрии), но в эпоху дипфейков такой цифровой паспорт — может и не совсем прикол 🌍

@tips_ai #news
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
В Grok Studio добавили поддержку генерации PDF-документов.

Это удобно: можно создать резюме, официальное письмо, накладные, договоры.

Добавляете в свой запрос создай в PDF.

Работает шустро, но пока не идеально (например, иногда косячит с рисованием таблиц), текст лучше перепроверять.

• Ссылка [тут]. Подписка не требуется.

@tips_ai #tools #news
— Мам, как мы разбогатели?
— Два года назад папа сделал Telegram-бота ChatGPT и выдавал его за официальный.

@tips_ai
На Hugging Face есть 9 бесплатных курсов по ИИ

Мало кто знает, но на HF есть качественные курсы, от больших языковых моделей до AI-агентов, от компьютерного зрения до игр, от аудио до 3D.

В канале я писал только про курс AI агентов. Все курсы — это open-source, с практикой и абсолютно бесплатные.

Кратко, с ссылками, сохраните:

1 • Курс по LLM (большим языковым моделям).

Научат, как обучать, дообучать и запускать такие модели с помощью Transformers от Hugging Face.

Подходит тем, кто работает с текстами или делает чат-ботов.

2 • Курс по AI-агентам.

Сейчас все делают агентов — и ты сможешь. Покажут, как создавать мыслящие инструменты с помощью LangChain и Hugging Face.

3 • Курс по глубокому обучению с подкреплением (Deep RL)

Учишь ИИ принимать решения и учиться на своих ошибках. Для геймдевов, инженеров-робототехников и тех, кто хочет заниматься продвинутыми штуками.

4 • Курс по компьютерному зрению.

Работа с изображениями: определение объектов, сегментация, классификация.

Всё — на базе моделей Hugging Face. Полезно для стартапов, исследователей и просто энтузиастов.

5 • Курс по аудио.

Как превращать звук в данные. Работа с голосом, музыкой, синтез речи — всё на трансформерах.

Подходит для разработчиков аудио или голосовых приложений.

6 • Курс Машинное обучение для игр.

ИИ меняет геймдев. Курс расскажет, как делать умных NPC, генерировать уровни и создавать миры по-новому.

7 • Курс по ML и 3D.

Если ты работаешь с 3D-данными (точечные облака, меши и т.п.)

Подходит для AR/VR, робототехники и цифровых двойников.

8 • Курс по диффузионным моделям.

Это технология, есть в Stable Diffusion. Ты узнаешь, как генерировать изображения из шума.

9 • Сборник практических решений по ИИ с открытым исходным кодом.

Это открытая библиотека готовых решений и примеров от реальных разработчиков ИИ.

| Ну и от меня совет — зайдите в [Hugging Face Spaces] и посмотрите, что там популярно, сразу поймете, какие темы в AI сейчас популярны, что реально делают разработчики — и увидите, куда всё движется.

@tips_ai #news #tools
Во многих каналах и роликах в ТТ и IG говорят и пишут, что ИИ сделает вашу работу полностью.

Это чушь.

— Runway начинает галлюцинировать, если делать видео больше 5 секунд.
— ChatGPT теряет логику и смысл текста, как только контекст становится больше.
— Код в Cursor становится хуже по мере роста проекта.

ИИ может быстро выдать 70-80% результата.

Но за оставшиеся % придётся заплатить временем и нервами, как за полноценную ручную работу.

И мне, и вам лучше иметь 80%, чем ничего. Но в финале за результат всё равно отвечаешь ты.

@tips_ai #thoughts
Google обновил Gemini 2.5 Pro (Preview 05-06) [Блог]

Занял топ по кодингу, особенно в веб-разработке, а на WebDev арене и LM Arena делит первое место с самой OpenAI o3.

Не хочу писать больше про цифры, лучше показать примерами, что умеет.

Интересные примеры от пользователей, которые сделали интерактивные веб-приложения с помощью 2.5 Pro в Canvas:

• Игра с собакой
• Симуляция «100 человек против гориллы»
• Игра в стиле тамагочи
• Превращение эскиза в рабочее приложение
• 3D-тур по коллекции Чикагского института искусств.
• Превращение фото с природой в код, а после — в уникальные узоры.

Как всегда, модель лежит в [AI Studio] - 25 запросов в день или [тут].

@tips_ai #news
Media is too big
VIEW IN TELEGRAM
Comfy стал агрегатором моделей [Блог]

После обновления Comfy, стали доступны 11 облачных моделей и 65 готовых API-нод.

Это встроенные ноды в ComfyUI, которые могут вызывать API платных моделей.

Теперь прямо в воркфлоу Comfy можно юзать Flux Ultra, Kling, Luma Photon / Ray, MiniMax, PixVerse, Recraft, Stable Image Ultra и SD 3.5 Large.

Всё оплачивается по API. Цены тут.

• Обновляем ComfyUI или устанавливаем с [оф.сайта].
• Покупаем кредиты.
• Выбираем нужные API-ноды, добавляем на граф и запускаем.

Но, если честно, не в обиду любителям Comfy, мне больше нравится FloraFauna 😃

@tips_ai #news
Please open Telegram to view this post
VIEW IN TELEGRAM
2025/06/29 18:27:20
Back to Top
HTML Embed Code: