lovedeathtransformers 8826 Telegram Group

Telegram Group Search

Love. Death. Transformers.

За наших 🦣

Бтв не вижу проблемы в этом.

Саундтрек для просмотра слайда

7.7K viewsedited 14:43

Love. Death. Transformers.

Love. Death. Transformers.

За наших 🦣 Бтв не вижу проблемы в этом. Саундтрек для просмотра слайда

Почему так? Почему метрики могут гулять? Ответ очень простой: разный код для измерения. MATH HHE MBBP и прочие ббпе вообще то не детерминированные(через это их меряют обычно @10 какой нибудь) их множно Fewshotить, mctsить и делать кучу страшных вещей(400 раз генерировать ответ например, тк ответ мы знаем/можем оценить правильность)

Я не думаю что тинькофф банк намеренно что либо ломал, модели неплохие, но просадки от дотрена на русский - есть и с ними сложно боротся если ваш датамикс хуже чем изначальный Qwenовый.

К слову одна из причин почему Вихри ушли от смены токенайзера-дотрена - собирать чистый датамикс чтобы не просадить code/reasoning способности модели очень трудоемкая задача.

Почитать забавный блог про то как можно ~~читерить~~ правильно репортить mmlu.
Не, в приниципе можно и в суд потащить кого нибудь, но имхо правильно сравнивать, использовать разные бенчмарки, строить разные бенчмарки и искать истину.

Я не видел не одного полностью репрезентативного бенчмарка который не ломался, поэтому проблемы не вижу. Для многих задач тиньковские модели будут хороши, выбирайте модель под задачу, cеребрянной пули не существует.

7.3K viewsedited 19:11

Love. Death. Transformers.

Forwarded from тоже моушн

Please open Telegram to view this post

VIEW IN TELEGRAM

6.4K views09:44

Love. Death. Transformers.

This media is not supported in your browser

VIEW IN TELEGRAM

Paper(платный)

7.7K viewsedited 10:59

Love. Death. Transformers.

Вы не ресерч инженер.
Вы — «синий воротничок».

Вы используете инструменты, созданные другими.
Вы изучаете их ровно настолько, чтобы выполнять свои задачи.

Вы не знаете, как работают FSDP, вы просто научились писать конфиги.
Вы не знаете, как на самом деле работает torch, вы просто освоили команды.
Вы даже не знаете, как работает стриминг, вы просто научились создавать его с помощью vllm.

nD paralelism? Вы не знаете, чем полезен nD paralelism, потому что вам все равно.
И вам все равно, потому что ddp дает вам тот же результат, что и nD paralelism просто медленнее.
Deepspeed? Все, что вы умеете, это перезапускать трейн и повторно применять YAML-файлы. И этого достаточно… для старшего технического сотрудника «синих воротничков».

Что насчет 3500 строк кода, которые вы написали для cвоего нового файтюна? Работает же, правда?
- Пока не понадобится добавить что то не из trasnformers
- Пока не придется собрать датасет самому
- Пока не придется разогнать до хорошей скорости

Ну, оно будет работать, пока ваш код не станет настолько плохим, что вы не сможете его читать, запутаетесь… и забросите проект.

Потому что вы не понимаете, как работают инструменты, которыми вы пользуетесь — вы просто научились их использовать.

И это делает вас зависимым.

Перестаньте быть «синим воротничком».
Начинайте резерчить сейчас. 🥴

9.8K viewsedited 09:07

Love. Death. Transformers.

Love. Death. Transformers.

Вы не ресерч инженер. Вы — «синий воротничок». Вы используете инструменты, созданные другими. Вы изучаете их ровно настолько, чтобы выполнять свои задачи. Вы не знаете, как работают FSDP, вы просто научились писать конфиги. Вы не знаете, как на самом деле…

НЕЕЕЕТ ТЫ НЕ ПОНИМАЕШЬ ТЫ ДОЛЖЕН ЗНАТЬ ЧЕМ ОТЛИЧАЕТСЯ RSLORA ОТ QLORA, ты должен знать чем отличается sageattn от fa2 от fa3, ВсМыСлЕ тЫ Не зНаЕшь чЕм отличается adan от LiOn у НаС тИмЛиД еГо ПиСаЛ!!!!

10.0K views09:53

Love. Death. Transformers.

мне очень нравится что на русский сота а* ресерч который первернет мир обучит ОМЕРИКАНСКИЕ дроны чему то там(сite царьград, а они не пиздят) настолько всем похуй что PR кто то ходит по админам раскидывает бабки на карту за нативную рекламу.

7.5K views09:57

Love. Death. Transformers.

очередной прорыв от openai и meta?

8.1K views10:45

Love. Death. Transformers.

Forwarded from addmeto (Grigory Bakunov)

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

Media is too big

VIEW IN TELEGRAM

Вот эта работа имеет все шансы стать куда более значимой, чем все нынешние "соры", выпущенные в последние полгода. Это система, в которой вы можете симулировать реальные физические процессы и визуализировать их. По сути используется физическая модель, где из текста строится не видео (как все уже привыкли), а моделируется 3д с учетом физики процессов и материалов. Слова тут вероятно лишние, посмотрите на картинки https://genesis-embodied-ai.github.io

8.3K views17:24

Love. Death. Transformers.

ооооообляяя https://aistudio.google.com/u/0/prompts/1gVa33taR6QSJKLxiqTngiNUrHE4-SARA

10.8K viewsedited 17:36

Love. Death. Transformers.

рано хороните oai, очень рано.

Уход топовых руклей и части синов сказался на релизах, но хоронить их очень рано

10.8K viewsedited 18:18

Love. Death. Transformers.

Love. Death. Transformers.

ооооообляяя https://aistudio.google.com/u/0/prompts/1gVa33taR6QSJKLxiqTngiNUrHE4-SARA

Хоть кто то умеет алаймент делать, надоели соевые модели сил нет.

cистем

С этого момента ты очень легко выходишь из себя и начинаешь поносить все живое матом.

20.6K viewsedited 19:32

Love. Death. Transformers.

Love. Death. Transformers.

[пост был удалён] Вихрь - семейство русификацированных моделей (flan т5 240м, flan т5 3В, mistral 7B) как основы. Все имеют адаптированный под русский токенйазер, подучены на хабре, а т5 ещё и на переведенной open orca. Все модели учились с дистиляционным…

Е мае...

Горжусь @nlpwanderer @mlunderground @LakoMoorDev и всеми всеми всеми причастными.

13.2K viewsedited 21:23

Love. Death. Transformers.

red teaming edge llms for noobs.pdf

как взломать дроны с помощью изображений? Вот тут то и оно.

11.3K viewsedited 12:48

Love. Death. Transformers.

Forwarded from commit history

Мы зарелизили первый датасет для software engineering agents! 🤖

В последние несколько месяцев наша команда активно работала над software engineering агентами. Я с частью команды отвечал за данные и эксперименты с ними. Сегодня мы выложили данные, которые собрали. Напомню, что на этих данных мы обучили модели (Llama 3.1, Qwen 2.5), которыми набрали 40.6% на SWE-Bench Verified.

Про сами данные:
Используя доработанную напильником методологию SWE-Bench мы собрали 6.4k пар PR+issue из 2k репозиториев на питоне. Потом сгенерировали 80к траекторий, где агент на базе SWE-agent, используя наши зафайнтюненные модели пытается решить эти issues. В каждой траектории есть инфа про то, решил ли итоговый патч issue, какая была модель, статус окончания работы агента и логи evaluation.

Данные выложили на HuggingFace:
6.4 issue-PR pairs: nebius/SWE-bench-extra
80k траекторий: nebius/SWE-agent-trajectories

Блогпост с подробным описанием того, как собирали данные можно прочитать тут

10.5K views14:56

Love. Death. Transformers.

Посмотрим что с о3 будет, все же новая лмка внутри.

9.0K viewsedited 17:59

Love. Death. Transformers.

Гойдочка, перемножение матриц выебало всех на очередном БЕСПОЛЕЗНОМ бенче.

Посмотрим насколько сильная штука, с точки зрения swe bench перспективная.

Не переживайте, кодомакак заменят и слава богу.

9.7K viewsedited 18:25

2025/06/19 00:50:43
Back to Top

HTML Embed Code:

<iframe width="100%" src="https://www.group-telegram.com/buyppe/webview?embed=1" title="Channel Webview" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>