Telegram Group Search
Все хорошее спизжено в опенаи все плохое в гугле
Audio
⚡️⚡️⚡️ НОВОЕ ЗАЯВЛЕНИЕ МАСКА


Украдено здесь я хз почему не репостится
Блог про то как челы решили что гпт делает их богом, алаймент не помог и юзеры потекли башкой.


Honest реакция админа:

О, я знаю таких челов, особенно подвержены те у кого есть техническое образование но при этом они не используют его по назначению, они когда в чатах спорит ходит спрашивать гптшку что то типа "аргументируй почему собеседник не прав"
Please open Telegram to view this post
VIEW IN TELEGRAM
Cобтсвенно авторы показывают, если брать Hanoi like (ну знаете ханойски башни, волк капуста коза и тд) puzzles, то оказывается что на этой задаче LLMкам плохо, на небольшом количестве блоков работают нормально, ризонеры стабильно лучше не ризонеров, выводы которые авторы делают не оч понятные.
ну типа на средних по сложности задачах thinking докидывает, на high все не работает, на low ризонинг не оч помогает.


Зачем решать такие задачи загадка, скейлинг на ARC agi видимо авторам не хватило, надо доRLить эти задачи на какой нибудь apple reasoner 1 и показать прирост 200 раз c 0.001 до 20
Сбер выкладывает папиру про датасет преференсов, не меряют reward bench, учат тиньковские T-lite-it-1.0(cравнительно cтарая работа? Почему то не ruadapt?)

Таксономия прикольная, используют human experts для разметки на сложность, но при этом используют WildChat как основу для запрсов. При том что на HF лежат запросы в Saiga, ruLLMarena, Vikhr и еще нескольких ботов, загадка почему не их.

Данных и моделей нет, подозреваю что будут после ревью?


папир
Forwarded from Русский research
Заполняем для себя и для своих коллег, уважаемые подписчики!
чет забыл добавить hi=1 при 10 статьях
tldr: Full-Stack Engineer, $70k–$90k + options, relocation to Paris

Мы ⚪️ whitecircle.ai. Делаем так, чтобы образовательные чатботы для школьников не говорили про 🍑ПоRn0🍑, банковские приложения не советовали вложить все деньги в биткоин, а сервисы по генерации картинок создавали поменьше цп. Но другие называют это скучным AI Safety

Подняли 💸1.6m$ pre-seed💸 в феврале и планируем поднимать seed в ближайшее время. В команде топовые ребята из Вышки, ИТМО и зарубежных вузов. Среди инвесторов топы из OpenAI, Deepmind, Anthropic, HuggingFace и других компаний

Ищем в команду второго фулстека, который поможет нам реализовывать все то, что с дикой скоростью успевает делать рисерч команда.

Frontend: TypeScript, Next.js, React
Backend: Prisma, GraphQL, Node.js, Docker, Kubernetes

Скидывайте резюме www.group-telegram.com/mixedenn с тегом #CV_LDT

А еще заглядывайте на лендос, у нас там можно подзалипнуть
🛡VulnBuster

Мы тут с коллэгами в рамках huggingface MCP хакатона сделали агентную систему с объединением 5 MCP тулов для поиска уязвимостей в коде

🛡В чем суть:

Агент автоматически анализирует код с помощью различных сканеров, сопоставляет результаты и предлагает варианты устранения уязвимостей на основе ИИ, а также выдает отчет от каждого тула.

🛡Что использовали:

1. Bandit MCP [link] — проверяет Python-код, находит базовые баги вроде SQL-инъекций и небезопасного eval.
2. Detect Secrets MCP [link] — ищет в коде и конфигурациях токены, ключи, пароли — даже закодированные.
3. Semgrep MCP [link] — анализирует 20+ языков, ловит XSS, path traversal и другие шаблонные уязвимости.
4. Pip Audit MCP [link] — находит уязвимые зависимости по CVE и предлагает обновления.
5. Circle Test MCP [via White Circle AI api] — проверяет код на соответствие политикам, которые мы сами задавали: лицензии, TODO, безопасные практики и тд

Именно 5 mcp тулов позволяют закрыть разные уровни безопастности и гибко заменять и расширять друг друга

🛡По итогу вы получаете:
🩰отчеты от всех тулов
🩰предложения по исправлению от агента
🩰а также можете сказать готовый файл от агента и встроить его сразу в workflow, если вам все понравилось

🤗Space
🖥Code

🥹🥹🥹🥹🥹🥹🥹
P.S. Мы будет очень рады вашим лайкам на спейс, а также предложениям по улучшению или интеграциям куда-либо для пользы опенсурсу
Please open Telegram to view this post
VIEW IN TELEGRAM
Бро какой в пизду фундаментальный ресерч ты yaml конфиг написать не можешь
2025/06/11 13:25:50
Back to Top
HTML Embed Code: