Непостоянная рубрика KSTATI
Google подтянули Gemini. теперь он наконец-то не просто читает PDF, а помогает с ними работать.
Теперь при открытии PDF в Drive, рядом появляется карточка с кратким содержанием и предложениями, что делать дальше.
Например: Составить черновик предложения / Сделать список вопросов по этому резюме; и так далее, в зависимости от контекста файла
Раньше надо было руками просить саммари. Сейчас всё само.
Открыл файл → получил суть → нажал на нужное → Gemini делает.
Работает на 20 языках (русский есть) и доступно в платных Workspace-планах (включая AI Pro и Education Premium).
#documents@TochkiNadAI
Google подтянули Gemini. теперь он наконец-то не просто читает PDF, а помогает с ними работать.
Теперь при открытии PDF в Drive, рядом появляется карточка с кратким содержанием и предложениями, что делать дальше.
Например: Составить черновик предложения / Сделать список вопросов по этому резюме; и так далее, в зависимости от контекста файла
Раньше надо было руками просить саммари. Сейчас всё само.
Открыл файл → получил суть → нажал на нужное → Gemini делает.
Работает на 20 языках (русский есть) и доступно в платных Workspace-планах (включая AI Pro и Education Premium).
#documents@TochkiNadAI
This media is not supported in your browser
VIEW IN TELEGRAM
Аранофски + AI
Посмотрели короткометражку Ancestra?
Режиссер Элиза МакНитт, а продюсером выступил Дэррен Аранофски в своём новом студийном проекте Primordial Soup в партнёрстве с Google DeepMind.
Veo 3 сгенерила часть видеоряда, остальное живые съемки. Речь про материнство и зарождение жизни, это личная история самой Элизы.
Картинка топ. Ну и ИИ тут не заменил всех и вся, так как над фильмом, кроме бездушной машины, работали еще 200 человек🤖 Аранофски вот тоже сказал: «AI – как звук или свет. Просто ещё один инструмент режиссера».
Это только первая часть трилогии. Еще два фильма в работе.
Сам фильм целиком смотрим тут.
Посмотрели короткометражку Ancestra?
Режиссер Элиза МакНитт, а продюсером выступил Дэррен Аранофски в своём новом студийном проекте Primordial Soup в партнёрстве с Google DeepMind.
Veo 3 сгенерила часть видеоряда, остальное живые съемки. Речь про материнство и зарождение жизни, это личная история самой Элизы.
Картинка топ. Ну и ИИ тут не заменил всех и вся, так как над фильмом, кроме бездушной машины, работали еще 200 человек
Это только первая часть трилогии. Еще два фильма в работе.
Сам фильм целиком смотрим тут.
Please open Telegram to view this post
VIEW IN TELEGRAM
Некоторые говорят, что смотреть ютуб во время приемов пищи – так себе практика
Я часто так делаю, поэтому длинные видео делю даже заранее в уме на количество приемов пищи.
Вот вам хороший подкаст на 3 завтрака или на завтрак/обед/ужин, или на ужин/ужин/полдник.
Это Саша Доброкотов, которого вы наверняка знаете, как AI Molodca в гостях у Дениса Лапшинова. C обоими, кстати, состою в полезном и немного безумном клубе креативных чуваков-директоров.
В подкасте много всего любопытного и актуального про ИИ, разумеется.
Смотреть тут.
Я часто так делаю, поэтому длинные видео делю даже заранее в уме на количество приемов пищи.
Вот вам хороший подкаст на 3 завтрака или на завтрак/обед/ужин, или на ужин/ужин/полдник.
Это Саша Доброкотов, которого вы наверняка знаете, как AI Molodca в гостях у Дениса Лапшинова. C обоими, кстати, состою в полезном и немного безумном клубе креативных чуваков-директоров.
В подкасте много всего любопытного и актуального про ИИ, разумеется.
Смотреть тут.
Ну все, видео-генератор Midjourney в здании
Отзывы пока есть и хорошие и не очень.
Периодически выкидывает артефакты и не всегда естественная анимация, также иногда проседает детализация, искажает лица, если лицо находится далеко в кадре.
Вот друг нагенерил только что. Симпатичные результаты вполне.
#VideoGenerative@TochkiNadAI
Отзывы пока есть и хорошие и не очень.
Периодически выкидывает артефакты и не всегда естественная анимация, также иногда проседает детализация, искажает лица, если лицо находится далеко в кадре.
Вот друг нагенерил только что. Симпатичные результаты вполне.
#VideoGenerative@TochkiNadAI
Напоминалка про Higgsfield, который во многом очень хорош
Первое видео – работа липсинка. Такой вот полноценный микро-клип, со сгенерированным в Suno треком.
А второе видео – как работает Canvas, который в примере закрепляет лого инпэйнтингом.
#videoEditing
Первое видео – работа липсинка. Такой вот полноценный микро-клип, со сгенерированным в Suno треком.
А второе видео – как работает Canvas, который в примере закрепляет лого инпэйнтингом.
#videoEditing
Gen AI Outlook Report 2025 .pdf
9.7 MB
Сохраняйте отчет на 160+ страниц про генеративный ИИ на 2025 год от ЕС
Внутри о том, как генеративный ИИ меняет экономику, госуправление, образование, здравоохранение, культуру и восприятие информации в целом.
Некоторые топики:
– Разумеется, Китай лидирует по объему исследований и подаче патентных заявок.
– Закон о регулировании ИИ вступает в силу в 2026 году.
– GDPR Закон о цифровых услугах теперь распространяется на GenAI, с более строгими правилами для крупных платформ и поисковых систем.
– ЕС хочет ИИ с открытым исходным кодом.
Внутри о том, как генеративный ИИ меняет экономику, госуправление, образование, здравоохранение, культуру и восприятие информации в целом.
Некоторые топики:
– Разумеется, Китай лидирует по объему исследований и подаче патентных заявок.
– Закон о регулировании ИИ вступает в силу в 2026 году.
– GDPR Закон о цифровых услугах теперь распространяется на GenAI, с более строгими правилами для крупных платформ и поисковых систем.
– ЕС хочет ИИ с открытым исходным кодом.
Audio
А вот для всех, кому лень читать 160 страниц отчета из прошлого поста.
Сгенерил короткий подкаст с некоторыми топиками, перед сном послушать.
Сгенерил короткий подкаст с некоторыми топиками, перед сном послушать.
Давно не было 2D-to-3D моделей
Вот есть Sparc3D, он генерит довольно детализированные модели.
На картинке к посту – Labubu-версия меня. Сгенерил ее изображением и отдал Спарку, он думал 1000 секунд, потом выдал ошибку. Потом снова попробую. Но у других ребят видел результаты – генерит круто. И прикладываю видео тизер демки.
Демо для тестов лежит на ХаггингФэйс.
#3D@TochkiNadAI
Вот есть Sparc3D, он генерит довольно детализированные модели.
На картинке к посту – Labubu-версия меня. Сгенерил ее изображением и отдал Спарку, он думал 1000 секунд, потом выдал ошибку. Потом снова попробую. Но у других ребят видел результаты – генерит круто. И прикладываю видео тизер демки.
Демо для тестов лежит на ХаггингФэйс.
#3D@TochkiNadAI
Ого, поехали.
YouTube летом добавит в Shorts Veo 3 от Google!
Пока неясно, это будет бесплатно или только по подписке Google AI Pro/Ultra. Это означает, что шортс-раздел будет завален бесконечным количеством генеративных видео. Представляю, какой начнется ад 🙂
Для примера прикрепляю видео. Вот такие ролики набирают десятки миллионов просмотров в Shorts прямо сейчас.
YouTube летом добавит в Shorts Veo 3 от Google!
Пока неясно, это будет бесплатно или только по подписке Google AI Pro/Ultra. Это означает, что шортс-раздел будет завален бесконечным количеством генеративных видео. Представляю, какой начнется ад 🙂
Для примера прикрепляю видео. Вот такие ролики набирают десятки миллионов просмотров в Shorts прямо сейчас.
This media is not supported in your browser
VIEW IN TELEGRAM
Тут кто-то спрашивал недавно про хороший способ клонировать голос
Вот одна из лучших моделей (а скорее всего даже лучшая) на данный момент, вышла в начале месяца обновленная OpenAudio S1.
Можно быстро клонировать голос, поддерживает кучу эмоций. Тестить тут.
#voice@TochkiNadAI
Вот одна из лучших моделей (а скорее всего даже лучшая) на данный момент, вышла в начале месяца обновленная OpenAudio S1.
Можно быстро клонировать голос, поддерживает кучу эмоций. Тестить тут.
#voice@TochkiNadAI
This media is not supported in your browser
VIEW IN TELEGRAM
От первого лица к третьему лицу
UFM (Unified Flow-Matching) умеет искажать изображение так, что кажется, будто вы видите сцену с другого ракурса. Это без 3D, с помощью потока и соответствий.
Эта модель решает сразу две задачи: определяет оптический поток (где и как двигаются пиксели между кадрами) и находит соответствия между разными изображениями (даже если они сняты с разных углов или сильно отличаются по масштабу)
Раньше эти задачи решались посложнее, с кучей стадий. Эта модель:
– на задачах оптического потока точнее на 28% по сравнению с предыдущими SOTA
– на задачах сопоставления ошибок меньше на 62%, и при этом работает почти в 7 раз быстрее.
Внутри UFM сначала использует DINOv2, чтобы закодировать изображения, а потом трансформер сразу выдает поток и маску видимости. Без всяких сложных пайплайнов работает быстро и обучается проще.
Можно потестить, есть демо на HF и код.
UFM (Unified Flow-Matching) умеет искажать изображение так, что кажется, будто вы видите сцену с другого ракурса. Это без 3D, с помощью потока и соответствий.
Эта модель решает сразу две задачи: определяет оптический поток (где и как двигаются пиксели между кадрами) и находит соответствия между разными изображениями (даже если они сняты с разных углов или сильно отличаются по масштабу)
Раньше эти задачи решались посложнее, с кучей стадий. Эта модель:
– на задачах оптического потока точнее на 28% по сравнению с предыдущими SOTA
– на задачах сопоставления ошибок меньше на 62%, и при этом работает почти в 7 раз быстрее.
Внутри UFM сначала использует DINOv2, чтобы закодировать изображения, а потом трансформер сразу выдает поток и маску видимости. Без всяких сложных пайплайнов работает быстро и обучается проще.
Можно потестить, есть демо на HF и код.
Любителям и любительницам детективных романов в реальной жизни.
Это сайт с компроматом на OpenAI, запущенный позавчера. Внутри архив с утечками и публичными расследованиями против компании.
Там и про отказ от некоммерческой миссии, и про AGI, как угрозу всему, и про токсичность Альтмана, которая портит атмосферу внурти.
Еще авторы материала предлагают направления для реформ, чтобы попытаться исправить ситуацию. Предлагают реформы у управлении, культуре прозрачности и безопасности и др.
Полистайте, вот сам архив.
Это сайт с компроматом на OpenAI, запущенный позавчера. Внутри архив с утечками и публичными расследованиями против компании.
Там и про отказ от некоммерческой миссии, и про AGI, как угрозу всему, и про токсичность Альтмана, которая портит атмосферу внурти.
Еще авторы материала предлагают направления для реформ, чтобы попытаться исправить ситуацию. Предлагают реформы у управлении, культуре прозрачности и безопасности и др.
Полистайте, вот сам архив.
This media is not supported in your browser
VIEW IN TELEGRAM
А вот и у HeyGen появился функционал для продукт плейсмента
Функция называется, как раз – Product Placement👽
– Загружаете фото продукта
– Выбираете аватар
– Добавляете свой сценарий
В общем-то так же, как и у этих ребят, которых недавно обсуждали.
Работает на основе гиперреалистичных жестов и синхронизации губ. Доступно всем на HeyGen, но чтобы было вайтлейбл - надо заплатить 30$.
#ecommerce@TochkiNadAI
Функция называется, как раз – Product Placement
– Загружаете фото продукта
– Выбираете аватар
– Добавляете свой сценарий
В общем-то так же, как и у этих ребят, которых недавно обсуждали.
Работает на основе гиперреалистичных жестов и синхронизации губ. Доступно всем на HeyGen, но чтобы было вайтлейбл - надо заплатить 30$.
#ecommerce@TochkiNadAI
Please open Telegram to view this post
VIEW IN TELEGRAM