Блог про то как челы решили что гпт делает их богом, алаймент не помог и юзеры потекли башкой.
Honest реакция админа:
О, я знаю таких челов, особенно подвержены те у кого есть техническое образование но при этом они не используют его по назначению, они когда в чатах спорит ходит спрашивать гптшку что то типа "аргументируй почему собеседник не прав"
Honest реакция админа:
О, я знаю таких челов, особенно подвержены те у кого есть техническое образование но при этом они не используют его по назначению, они когда в чатах спорит ходит спрашивать гптшку что то типа "аргументируй почему собеседник не прав"
404 Media
Pro-AI Subreddit Bans 'Uptick' of Users Who Suffer from AI Delusions
“AI is rizzing them up in a very unhealthy way at the moment.”
Очень смешное нытье элпа про то как у них ничего не работает, ни fewshots, ни ризонинг, вообще ни че го.
https://machinelearning.apple.com/research/illusion-of-thinking
https://machinelearning.apple.com/research/illusion-of-thinking
Apple Machine Learning Research
The Illusion of Thinking: Understanding the Strengths and Limitations of Reasoning Models via the Lens of Problem Complexity
Recent generations of frontier language models have introduced Large Reasoning Models
(LRMs) that generate detailed thinking processes…
(LRMs) that generate detailed thinking processes…
Сбер выкладывает папиру про датасет преференсов, не меряют reward bench, учат тиньковские T-lite-it-1.0(cравнительно cтарая работа? Почему то не ruadapt?)
Таксономия прикольная, используют human experts для разметки на сложность, но при этом используют WildChat как основу для запрсов. При том что на HF лежат запросы в Saiga, ruLLMarena, Vikhr и еще нескольких ботов, загадка почему не их.
Данных и моделей нет, подозреваю что будут после ревью?
папир
Таксономия прикольная, используют human experts для разметки на сложность, но при этом используют WildChat как основу для запрсов. При том что на HF лежат запросы в Saiga, ruLLMarena, Vikhr и еще нескольких ботов, загадка почему не их.
Данных и моделей нет, подозреваю что будут после ревью?
папир
This media is not supported in your browser
VIEW IN TELEGRAM
claude sonnet 4 moment
Love. Death. Transformers.
Cобтсвенно авторы показывают, если брать Hanoi like (ну знаете ханойски башни, волк капуста коза и тд) puzzles, то оказывается что на этой задаче LLMкам плохо, на небольшом количестве блоков работают нормально, ризонеры стабильно лучше не ризонеров, выводы…
друзья у нас инновации на wwdc
tldr: Full-Stack Engineer, $70k–$90k + options, relocation to Paris
Мы ⚪️ whitecircle.ai. Делаем так, чтобы образовательные чатботы для школьников не говорили про 🍑ПоRn0🍑, банковские приложения не советовали вложить все деньги в биткоин, а сервисы по генерации картинок создавали поменьше цп. Но другие называют это скучным AI Safety
Подняли 💸1.6m$ pre-seed💸 в феврале и планируем поднимать seed в ближайшее время. В команде топовые ребята из Вышки, ИТМО и зарубежных вузов. Среди инвесторов топы из OpenAI, Deepmind, Anthropic, HuggingFace и других компаний
Ищем в команду второго фулстека, который поможет нам реализовывать все то, что с дикой скоростью успевает делать рисерч команда.
Frontend: TypeScript, Next.js, React
Backend: Prisma, GraphQL, Node.js, Docker, Kubernetes
Скидывайте резюме www.group-telegram.com/mixedenn с тегом #CV_LDT
А еще заглядывайте на лендос, у нас там можно подзалипнуть
Мы ⚪️ whitecircle.ai. Делаем так, чтобы образовательные чатботы для школьников не говорили про 🍑ПоRn0🍑, банковские приложения не советовали вложить все деньги в биткоин, а сервисы по генерации картинок создавали поменьше цп. Но другие называют это скучным AI Safety
Подняли 💸1.6m$ pre-seed💸 в феврале и планируем поднимать seed в ближайшее время. В команде топовые ребята из Вышки, ИТМО и зарубежных вузов. Среди инвесторов топы из OpenAI, Deepmind, Anthropic, HuggingFace и других компаний
Ищем в команду второго фулстека, который поможет нам реализовывать все то, что с дикой скоростью успевает делать рисерч команда.
Frontend: TypeScript, Next.js, React
Backend: Prisma, GraphQL, Node.js, Docker, Kubernetes
Скидывайте резюме www.group-telegram.com/mixedenn с тегом #CV_LDT
whitecircle.ai
White Circle AI
We keep your AI models safe, reliable, and secure.
Forwarded from что-то на DL-ском
🛡VulnBuster
Мы тут с коллэгами в рамках huggingface MCP хакатона сделали агентную систему с объединением 5 MCP тулов для поиска уязвимостей в коде
🛡 В чем суть:
Агент автоматически анализирует код с помощью различных сканеров, сопоставляет результаты и предлагает варианты устранения уязвимостей на основе ИИ, а также выдает отчет от каждого тула.
🛡 Что использовали:
1. Bandit MCP [link] — проверяет Python-код, находит базовые баги вроде SQL-инъекций и небезопасного eval.
2. Detect Secrets MCP [link] — ищет в коде и конфигурациях токены, ключи, пароли — даже закодированные.
3. Semgrep MCP [link] — анализирует 20+ языков, ловит XSS, path traversal и другие шаблонные уязвимости.
4. Pip Audit MCP [link] — находит уязвимые зависимости по CVE и предлагает обновления.
5. Circle Test MCP [via White Circle AI api] — проверяет код на соответствие политикам, которые мы сами задавали: лицензии, TODO, безопасные практики и тд
Именно 5 mcp тулов позволяют закрыть разные уровни безопастности и гибко заменять и расширять друг друга
🛡 По итогу вы получаете:
🩰 отчеты от всех тулов
🩰 предложения по исправлению от агента
🩰 а также можете сказать готовый файл от агента и встроить его сразу в workflow, если вам все понравилось
🤗Space
🖥 Code
🥹 🥹 🥹 🥹 🥹 🥹 🥹
P.S. Мы будет очень рады вашим лайкам на спейс, а также предложениям по улучшению или интеграциям куда-либо для пользы опенсурсу
Мы тут с коллэгами в рамках huggingface MCP хакатона сделали агентную систему с объединением 5 MCP тулов для поиска уязвимостей в коде
Агент автоматически анализирует код с помощью различных сканеров, сопоставляет результаты и предлагает варианты устранения уязвимостей на основе ИИ, а также выдает отчет от каждого тула.
1. Bandit MCP [link] — проверяет Python-код, находит базовые баги вроде SQL-инъекций и небезопасного eval.
2. Detect Secrets MCP [link] — ищет в коде и конфигурациях токены, ключи, пароли — даже закодированные.
3. Semgrep MCP [link] — анализирует 20+ языков, ловит XSS, path traversal и другие шаблонные уязвимости.
4. Pip Audit MCP [link] — находит уязвимые зависимости по CVE и предлагает обновления.
5. Circle Test MCP [via White Circle AI api] — проверяет код на соответствие политикам, которые мы сами задавали: лицензии, TODO, безопасные практики и тд
Именно 5 mcp тулов позволяют закрыть разные уровни безопастности и гибко заменять и расширять друг друга
🤗Space
P.S. Мы будет очень рады вашим лайкам на спейс, а также предложениям по улучшению или интеграциям куда-либо для пользы опенсурсу
Please open Telegram to view this post
VIEW IN TELEGRAM
huggingface.co
Agents-MCP-Hackathon (Agents-MCP-Hackathon)
Org profile for Agents-MCP-Hackathon on Hugging Face, the AI community building the future.
Forwarded from Агенты ИИ | AGI_and_RL
А вот и опенсурс ризонер от Мистраля
https://huggingface.co/mistralai/Magistral-Small-2506
https://huggingface.co/mistralai/Magistral-Small-2506_gguf
Макс контекст 128к, но пишут что послевархаммер 40к может начать тупить
https://huggingface.co/mistralai/Magistral-Small-2506
https://huggingface.co/mistralai/Magistral-Small-2506_gguf
Макс контекст 128к, но пишут что после
huggingface.co
mistralai/Magistral-Small-2506_gguf · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
Бро какой в пизду фундаментальный ресерч ты yaml конфиг написать не можешь