Telegram Group Search
Media is too big
VIEW IN TELEGRAM
Open Suno уже здесь! Вы можете генерировать целые песни с моделью параметров 7B! 🔥

Вы можете выбрать фоновую музыку, жанр, тексты песен — качество на выходе просто безумное!

Доступны все контрольные точки модели

https://huggingface.co/m-a-p
🔥 LocalAI — это инструмент с открытым исходным кодом для запуска моделей искусственного интеллекта локально, без необходимости подключения к облаку!

🌟 Он совместим с API OpenAI и поддерживает работу с моделями машинного обучения, такими как LLaMA, GPT-4 и другими. LocalAI предоставляет удобные инструменты для интеграции в существующие приложения, поддерживает GPU-ускорение и может работать в контейнерах Docker.

🔐 Лицензия: MIT

🖥 Github

@data_analysis_ml
Please open Telegram to view this post
VIEW IN TELEGRAM
🤗 На HF только что появились два новых ризонинг датасета.

1. OpenThoughts: 114 тыс примеров, полученных из R1 по математике, кодингу и науке https://huggingface.co/datasets/open-thoughts/OpenThoughts-114k.

2. R1-Distill-SFT: 1.7M (!), отобранных из R1-32B на NuminaMath и Tulu data

https://huggingface.co/datasets/ServiceNow-AI/R1-Distill-SFT

@data_analysis_ml
🖥 Audiblez — это инструмент для конвертации электронных книг в аудиокниги!

🌟 Он использует модель текст-в-речь Kokoro для создания файлов в формате .m4b из файлов .epub. Программа поддерживает различные языки, голоса и позволяет настроить скорость чтения. Также доступна работа на GPU для ускорения обработки.

🔐 Лицензия: MIT

🖥 Github

@data_analysis_ml
Please open Telegram to view this post
VIEW IN TELEGRAM
🐋 DeepSeek только что потерпел поражение в ходе аудита NewsGuard и занял предпоследнее место по точности ответов чат-ботов, провалив 83% тестов.

В сравнении с западными конкурентами такими, как ChatGPT от OpenAI и Google Gemini, DeepSeek разделил 10-е место с другим чат-ботом.

т.е. когда предъявлялись явно ложные утверждения, они опровергались лишь в 17% случаев.

→ NewsGuard применил свой стандартный аудит дезинформации к DeepSeek, оценив, как он справлялся с ложными заявлениями в политике, здравоохранении, бизнесе и международных отношениях. В то время как ведущие чат-боты имели средний показатель ошибок 62%, DeepSeek показал себя значительно хуже, ошибившись в 83% случаев.

→ Чат-бот особенно плохо справлялся с запросами, связанными с новостями, повторяя ложные утверждения в 30% случаев и не давая прямых ответов в 53% случаев.

https://www.reuters.com/world/china/deepseeks-chatbot-achieves-17-accuracy-trails-western-rivals-newsguard-audit-2025-01-29/

#DeepSeek #ai #ml
Это Большая Дата для нашего сообщества: приглашаем на большой митап по аналитике

📅 22 февраля в Москве и онлайне пройдёт митап для аналитиков от бизнес-группы Поиска и Рекламных технологий Яндекса. Послушаем доклады и попробуем свои силы в деловой игре по реальным кейсам из нашей практики.

В программе:

🔸 Павел Смирнов, руководитель команды дата-инженеров в Поиске и Рекламе. Расскажет, когда пора начинать строить единое логирование клиентской активности

🔸 Алексей Константинов, руководитель группы онлайн-метрик Поиска. Покажет, как сделать универсальную онлайн-метрику успешности сервиса на примере «Профицита»

🔸 Сайдаш Мифтахов, тимлид маркетинговой аналитики в международном Поиске. Объяснит, как Яндекс упрощает доступ в Поиск и растит долю рынка в Казахстане

✏️ Полный список тем докладов и форму регистрации ищите здесь.
🔥 MemoRAG — инновационный фреймворк RAG, который использует память для более эффективного извлечения данных и генерации ответов!

🌟 MemoRAG расширяет стандартный RAG, добавляя глобальную модель памяти, что позволяет обрабатывать запросы с учётом всего контекста базы данных. Это обеспечивает более точные и содержательные ответы, особенно для сложных или многоуровневых задач.

💡 Ключевые возможности MemoRAG включают поддержку сверхдлинных контекстов (до миллиона токенов), оптимизацию производительности, создание контекстуальных подсказок, ускорение обработки данных за счёт кеширования и повторное использование закодированного контекста. Инструмент может быть интегрирован с различными моделями LLM, такими как Meta-Llama и Mistral, и предоставляет демо для тестирования на базе Streamlit.

🔐 Лицензия: Apache-2.0

🖥 Github

@data_analysis_ml
Please open Telegram to view this post
VIEW IN TELEGRAM
⭐️ Mistral AI только что выпустили Small 3!

Вот все, что вам нужно знать:

- Доступны как предварительно обученные, так и настроенные контрольные точки
- без RL и без синтетических данных
- Mistral Small 3 оптимизирован по задержке
- 24B параметров
- 81% точности на MMLU и задержка 150 токенов/с
- Позиционируется как замена GPT-40-mini
- Конкурирует с Llama 3.3 70B и Qwen 32B
- в 3 раза быстрее, чем инструкция Llama 3.3 70B
- Лицензия Apache 2.0
- Доступно в la Plateforme, HF и других провайдерах

Варианты использования включают в себя быстродействующих речевых помощников, вызов функций с малой задержкой, тонкую настройку экспертных моделей и локальный вывод.

Великолепная маленькая модель, которая дополняет другие более крупные модели, такие как DeepSeek-R1.

https://mistral.ai/news/mistral-small-3/

#mistral #llm #ml #ai
Бизнесу данные нужны как воздух📊

На их основе компании принимают важные стратегические решения. Поэтому специалисты, которые собирают, обрабатывают и анализируют данные, всегда востребованы. 

Таких профессионалов готовят на курсе «Аналитик данных» от МФТИ и Нетологии. За 10 месяцев вы получите фундаментальные знания, актуальные навыки и кейсы в портфолио.

Вы научитесь:

- использовать Python для анализа данных;
- применять методы ИИ в своих задачах;
- работать с базами данных;
- визуализировать данные.

После обучения получите дипломы о профессиональной переподготовке от МФТИ и Нетологии. Центр развития карьеры поможет с трудоустройством, резюме и портфолио.

Освойте профессию на стыке IT и бизнеса со скидкой 30 000 рублей по промокоду DPOVUZ30 до 28 февраля https://netolo.gy/dRCR

Реклама. ООО "Нетология". ИНН 7726464125. Erid
2VSb5yYSEnc
🔥 Repomix — это инструмент, который упаковывает весь репозиторий в единый файл, удобный для работы с большими языковыми моделями, такими как ChatGPT, Claude и Gemini!

🌟 Он оптимизирует структуру кода для ИИ, поддерживает подсчет токенов, учитывает .gitignore и обеспечивает защиту от утечки данных с помощью Secretlint. Repomix прост в использовании и настраивается через конфигурационные файлы.

🔐 Лицензия: MIT

🖥 Github

@data_analysis_ml
Please open Telegram to view this post
VIEW IN TELEGRAM
⚡️Оценки стоимости обучения популярных моделей, таких как GPT-4o, Sonnet и DeepSeek (на H100)!

Калькулятор для оценки:
https://tnyqnervqldjme1y.vercel.app/

@data_analysis_ml
Forwarded from Machinelearning
🐋 DeepClaude

Высокопроизводительный LLM-интерфейс, который позволяет использовать возможности рассуждений DeepSeek R1 и творческие способности Claude с помощью единого и простого API и удобного иинтерфейса.

Особенности
🚀 Нулевая задержка - Очень быстрые ответы на базе высокопроизводительного API, написанного на Rust.
⚙️ Гибкая настройка соответствии с вашими потребностями
🌟 Открытый исходный код
🤖 Двойная мощь ИИ - объедините рассуждения DeepSeek R1 с и возможностями Claude

⭐️ DeepClaude объединяет обе модели, чтобы обеспечить:

- Новая SOTA 64,0% на бенчмарке aider polyglot
- 14-кратное снижение затрат по сравнению с предыдущей SOTA
- Повышенную точность генерации кода для различных языков программирования

git clone https://github.com/getasterisk/deepclaude.git
cd deepclaude

Github
Docs

@ai_machinelearning_big_data


#DeepSeek #Claude #llm #ml #ai #DeepClaude #opensource
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
⚡️Легкий способ получать свежие обновления и следить за трендами в разработке на вашем языке. Находите свой стек и подписывайтесь:

МАШИННОЕ ОБУЧЕНИЕ: www.group-telegram.com/ai_machinelearning_big_data
C++ www.group-telegram.com/cpluspluc
Python: www.group-telegram.com/pythonl
Linux: www.group-telegram.com/linuxacademiya
Хакинг: www.group-telegram.com/linuxkalii
Devops: www.group-telegram.com/DevOPSitsec
Data Science: www.group-telegram.com/data_analysis_ml.com
Javascript: www.group-telegram.com/javascriptv
C#: www.group-telegram.com/csharp_ci
Java: www.group-telegram.com/javatg
Базы данных: www.group-telegram.com/sqlhub
Python собеседования: www.group-telegram.com/python_job_interview
Мобильная разработка: www.group-telegram.com/mobdevelop
Docker: www.group-telegram.com/DevopsDocker
Golang: www.group-telegram.com/Golang_google
React: www.group-telegram.com/react_tg
Rust: www.group-telegram.com/rust_code
ИИ: www.group-telegram.com/vistehno
PHP: www.group-telegram.com/phpshka
Android: www.group-telegram.com/android_its
Frontend: www.group-telegram.com/front
Big Data: www.group-telegram.com/bigdatai
Собеседования МЛ: www.group-telegram.com/machinelearning_interview
МАТЕМАТИКА: www.group-telegram.com/data_math
Kubernets: www.group-telegram.com/kubernetc
Разработка игр: https://www.group-telegram.com/gamedev
Haskell: www.group-telegram.com/haskell_tg
Физика: www.group-telegram.com/fizmat

💼 Папка с вакансиями: www.group-telegram.com/addlist/_zyy_jQ_QUsyM2Vi
Папка Go разработчика: www.group-telegram.com/addlist/MUtJEeJSxeY2YTFi
Папка Python разработчика: www.group-telegram.com/addlist/eEPya-HF6mkxMGIy
Папка ML: https://www.group-telegram.com/addlist/2Ls-snqEeytkMDgy
Папка FRONTEND: https://www.group-telegram.com/addlist/mzMMG3RPZhY2M2Iy

😆ИТ-Мемы: www.group-telegram.com/memes_prog
🇬🇧Английский: www.group-telegram.com/english_forprogrammers
🧠ИИ: www.group-telegram.com/vistehno

🎓954ГБ ОПЕНСОРС КУРСОВ: @courses
📕Ит-книги бесплатно: https://www.group-telegram.com/addlist/BkskQciUW_FhNjEy
🔥 Agentic Memory — это проект, направленный на интеграцию когнитивных архитектур и психологических концепций памяти в системы на основе больших языковых моделей!

🌟 Он исследует способы моделирования различных типов памяти, таких как рабочая, эпизодическая, семантическая и процедурная, для создания более интеллектуальных и адаптивных агентов.

🖥 Github

@data_analysis_ml
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥 DocETL — это инструмент с открытым исходным кодом, предназначенный для создания и выполнения ETL-процессов (извлечение, преобразование и загрузка данных), особенно подходящий для сложных задач обработки документов!

🌟 Он предлагает интерактивный пользовательский интерфейс под названием DocWrangler, который помогает разработчикам итеративно разрабатывать конвейеры обработки данных, экспериментировать с различными запросами и пошагово строить свои процессы. После завершения разработки конвейера его конфигурацию можно экспортировать для использования в производственной среде.

🔐 Лицензия: MIT

🖥 Github

@data_analysis_ml
Please open Telegram to view this post
VIEW IN TELEGRAM
⭐️ R1-V

Усиление способности к сверхобобщению в моделях языка зрения при затратах менее $3.

Модель 2B превосходит модель 72B в тестах OOD всего за 100 шагов обучения.

Github

@data_analysis_ml

#ml #ai #datascience
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥 Это - подробное руководство по запуску модели DeepSeek-R1 с 671 миллиардами параметров в динамически квантованной версии 1,58-бит (сжатой до 131 ГБ) с использованием Llama.cpp!

🌟 Благодаря усилиям команды UnslothAI, эта оптимизированная модель может быть запущена на персональных компьютерах без необходимости в мощных серверных ресурсах, хотя производительность на потребительском оборудовании может быть ограничена.

🔗 Ссылка: *клик*

@data_analysis_ml
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
1–2 марта проводим Weekend Offer Analytics

Устроиться в Яндекс за выходные — реально. Ищем крутых аналитиков с опытом работы от 2 лет на Python, готовых работать в офисном или гибридном режиме на территории России.

Подавайте заявку до 24 февраля — и всего за 2 дня пройдите все технические собеседования. После сможете пообщаться с одиннадцатью нанимающими командами и выбрать ту, которая покажется самой интересной. Если всё сложится хорошо, сразу же пришлём вам офер.

Узнать подробности и зарегистрироваться.

Реклама. ООО "Яндекс". ИНН 7736207543
2025/02/22 21:36:48
Back to Top
HTML Embed Code: