Telegram Group Search
Forwarded from Machinelearning
⚡️ Claude получила возможность веб-поиска.

Anthropic объявила о запуске новой функции веб-поиска для Claude. Теперь ИИ способен анализировать актуальные данные из интернета, предоставляя ответы с прямыми ссылками на источники. Это позволяет не только повысить достоверность информации, но и упростить проверку фактов.

Поиск доступен в режиме Preview для платных подписчиков в США, но в ближайшие месяцы ожидается глобальное расширение. Для активации ye;yj включить опцию в настройках профиля и начать диалог с Claude 3.7 Sonnet — система сама определит, когда требуется обращение к веб-источникам
anthropic.com

✔️ Hugging Face запустил приложение HuggingSnap: оффлайн-ИИ для анализа окружения через камеру iPhone.

Hugging Face представила приложение HuggingSnap для iOS, использующее локальную Smolvlm2 для анализа изображений в реальном времени без подключения к сервису. В отличие от облачных аналогов, HuggingSnap обрабатывает данные исключительно на устройстве, экономя заряд устройства и гарантируя конфиденциальность. Пользователи могут получать описания объектов, сцен, текстов и сложных визуальных контекстов.

Для работы требуется iOS 18, но приложение также совместимо с macOS и Apple Vision Pro. По словам разработчиков, HuggingSnap-это пример, как локальный ИИ может стать повседневным инструментом.
techcrunch.com

✔️ Google добавит Gemini AI в Chrome, повторяя опыт Copilot для Windows 11

Google активно тестирует интеграцию ИИ-ассистента Gemini в браузер Chrome, стремясь вывести его за рамки веб-сайта. Как выяснили исследователи, функционал разместят в верхней части окна — рядом с кнопками управления. В настройках появится возможность назначить горячие клавиши или активировать ассистент через меню. При запуске Gemini будет открываться в отдельном плавающем окне. Кроме того, Google планирует вынести иконку ассистента в системный трей — запускать его можно будет прямо с панели задач, хотя для работы потребуется активный Chrome.

Пока функция доступна лишь в экспериментальных сборках, а ее стабильность оставляет желать лучшего. Ясно одно - Google намерен конкурировать с Microsoft, предлагая свой подход к интеграции ИИ в повседневные инструменты.
windowslatest

✔️ AudioX: универсальная модель генерации звука и музыки через кросс-модальные преобразования.

Moonshot AI совместно с Гонконгским университетом анонсировали AudioX — универсальную модель на базе Diffusion Transformer, способную генерировать высококачественное аудио и музыку из текста, видео, изображений или их комбинаций. Главная инновация — стратегия маскирования входных данных, которая усиливает обучение кросс-модальных представлений.

Возможности AudioX: генерация любых звуков на основе текста, видео и их комбинаций (текстовый промпт к видео), восстановление "потерянной" части аудио, генерация музыки на основе текста, видео и их комбинации и "аутпейнт" существующего аудио.

Тесты AudioX: лучшая в 15+ задачах, включая генерацию звука по видео (VGGSound) и создание музыки по тексту (MusicCaps). На FAD и KL-дивергенции модель показала улучшение на 12–35% против Tango 2 и AudioLDM.
Веса и код - coming soon.
zeyuet.github

✔️ Microsoft Research разработал Claimify: инструмент фактчекинга ИИ

Microsoft Research представил Claimify — систему, которая решает проблему недостоверных ответов ИИ, извлекая из текстов только верифицируемые утверждения. Метод основан принципах: исключение субъективных суждений, сохранение критического контекста, устранение двусмысленностей, самостоятельность утверждений и др. Результаты тестов показывают, что 99% утверждений, извлечённых Claimify, полностью соответствуют исходному контексту.
microsoft

✔️ RF-DETR: новая SOTA для обнаружения объектов в реальном времени с открытым исходным кодом.
Это первая модель, работающая а реальном времени: 60+ mAP на COCO. SOTA на бенчмарке RF100-VLRF-DETR.
Github

✔️ Same New - нейросеть копирует любой сайт с точностью до пикселя — по одной ссылке воспроизводит весь интерфейс, структуру, анимации, изображения и даже интерактивные элементы.


@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
PiEEG kit - bioscience Lab in home for your Brain and Body

🖥 Github: https://github.com/pieeg-club/PiEEG_Kit

📕 Paper: https://arxiv.org/abs/2503.13482

🌟 Methods: https://paperswithcode.com/task/eeg-1

@ArtificialIntelligencedl
Please open Telegram to view this post
VIEW IN TELEGRAM
FastCuRL: Curriculum Reinforcement Learning with Progressive Context Extension for Efficient Training R1-like Reasoning Models

🖥 Github: https://github.com/nick7nlp/FastCuRL

📕 Paper: https://arxiv.org/abs/2503.17287v1

🌟 Tasks
: https://paperswithcode.com/task/language-modeling

@ArtificialIntelligencedl
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Harnessing the Reasoning Economy: A Survey of Efficient Reasoning for Large Language Models

🖥 Github: https://github.com/devoallen/awesome-reasoning-economy-papers

📕 Paper: https://arxiv.org/abs/2503.24377v1

@ArtificialIntelligencedl
Please open Telegram to view this post
VIEW IN TELEGRAM
Effect-driven interpretation: Functors for natural language composition

🖥 Github: https://github.com/UCSC-VLAA/MedReason

📕 Paper: https://arxiv.org/abs/2504.00993v1

🔗 Tasks: https://paperswithcode.com/task/knowledge-graphs

@ArtificialIntelligencedl
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
REPA-E: Unlocking VAE for End-to-End Tuning of Latent Diffusion Transformers

🖥 Github: https://github.com/End2End-Diffusion/REPA-E

📕 Paper: https://arxiv.org/abs/2504.10483

🔗 Dataset: https://paperswithcode.com/dataset/imagenet

@ArtificialIntelligencedl
Please open Telegram to view this post
VIEW IN TELEGRAM
ReSpec: Relevance and Specificity Grounded Online Filtering for Learning on Video-Text Data Streams

🖥 Github: https://github.com/cdjkim/respec

📕 Paper: https://arxiv.org/abs/2504.14875v1

🔗 Dataset: https://paperswithcode.com/task/informativeness

@ArtificialIntelligencedl
Please open Telegram to view this post
VIEW IN TELEGRAM
UniVLA: Learning to Act Anywhere with Task-centric Latent Actions

🖥 Github: https://github.com/opendrivelab/univla

📕 Paper: https://arxiv.org/abs/2505.06111v1

🔗 Dataset: https://paperswithcode.com/dataset/room-to-room

@ArtificialIntelligencedl
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Deliberation on Priors: Trustworthy Reasoning of Large Language Models on Knowledge Graphs

🖥 Github: https://github.com/reml-group/deliberation-on-priors

📕 Paper: https://arxiv.org/abs/2505.15210v1

@ArtificialIntelligencedl
Please open Telegram to view this post
VIEW IN TELEGRAM
SpatialScore: Towards Unified Evaluation for Multimodal Spatial Understanding

🖥 Github: https://github.com/haoningwu3639/SpatialScore

📕 Paper: https://arxiv.org/abs/2505.17012v1

🔗 Tasks: https://paperswithcode.com/task/motion-estimation

@ArtificialIntelligencedl
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
7 июня — идеальный день, чтобы NLP-специалисту получить оффер мечты! 😉

Сразу две команды Сбера: «Стратегия и развитие» и AI Solutions, — приглашают вас принять в One Day Offer по профилю NLP/LLM.

Вы будете работать в гибридном формате: обучать и улучшать языковые модели, разрабатывать AI-помощника и ML-модели, а ещё анализировать процессы всего банка. Звучит круто, на деле тоже круто!

Отмечайте в календаре 7 июня, 10:00, регистрируйтесь по ссылке и готовьтесь к резкому карьерному виражу! 👌
EmergentTTS-Eval: Evaluating TTS Models on Complex Prosodic, Expressiveness, and Linguistic Challenges Using Model-as-a-Judge

🖥 Github: https://github.com/boson-ai/emergenttts-eval-public

📕 Paper: https://arxiv.org/abs/2505.23009v1

🔗 Tasks: https://paperswithcode.com/task/text-to-speech-1

@ArtificialIntelligencedl
Please open Telegram to view this post
VIEW IN TELEGRAM
Bagged Deep Image Prior for Recovering Images in the Presence of Speckle Noise

🖥 Github: https://github.com/Computational-Imaging-RU/Bagged-DIP-Speckle

📕 Paper: https://arxiv.org/abs/2505.23594v1


@ArtificialIntelligencedl
Please open Telegram to view this post
VIEW IN TELEGRAM
Работаете в Data Science и хотите стать Middle+? Проверьте свои знания быстрым тестом — и узнайте, готовы ли к следующему шагу!

🔥 ПРОЙТИ ТЕСТ: ссылка

Пройдите тест и проверьте, готовы ли вы к повышению квалификации на курсе «Machine Learning. Advanced». В программе — AutoML, Байесовские методы, обучение с подкреплением и многое другое. Вы научитесь деплоить модели, собирать end-to-end пайплайны и претендовать на позиции Middle+/Senior ML Engineer.

🎁 Успешное прохождение теста — ваш пропуск к записям открытых уроков и скидке на большое обучение.

👉 Оцените свой уровень прямо сейчас: ссылка

Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963.
2025/06/11 09:44:38
Back to Top
HTML Embed Code: