Forwarded from Data Secrets
Внезапно: OpenAI спонсировали EpochAI в создании бенчмарка FrontierMath и имели доступ к данным
Сразу для контекста: FrontierMath был создан недавно (пост) и позиционировался как супер-сложный закрытый математический бенчмарк. Когда он вышел, самые передовые модели набирали на нем порядка 2%. И это именно результатами на этом бенчмарке так хвастались везде и всюду OpenAI, когда представляли o3: она якобы набрала на нем аж 25% (пост).
А теперь оказывается, что OpenAI имели доступ к вопросам и ответам. В этом признались сами EpochAI после того как анонимный пользователь выложил на lesswrong пост, в котором рассказал о том, что FrontierMath спонсировался OpenAI. По его словам, финансовая коммуникация была непрозначной, и даже основная часть сотрудников EpochAI и математики, которые придумывали задачи для бенчмарка, были не в курсе.
EpochAI вину признали, но заявили, что их связывало NDA. Они подтвердили, что OpenAI имеет доступ к большинству задач бенчмарка кроме hold-out сета, но сказали, что между ними и OpenAI есть "устное соглашение о том, что эти данные не будут использоваться для обучения"🤦
Сразу для контекста: FrontierMath был создан недавно (пост) и позиционировался как супер-сложный закрытый математический бенчмарк. Когда он вышел, самые передовые модели набирали на нем порядка 2%. И это именно результатами на этом бенчмарке так хвастались везде и всюду OpenAI, когда представляли o3: она якобы набрала на нем аж 25% (пост).
А теперь оказывается, что OpenAI имели доступ к вопросам и ответам. В этом признались сами EpochAI после того как анонимный пользователь выложил на lesswrong пост, в котором рассказал о том, что FrontierMath спонсировался OpenAI. По его словам, финансовая коммуникация была непрозначной, и даже основная часть сотрудников EpochAI и математики, которые придумывали задачи для бенчмарка, были не в курсе.
EpochAI вину признали, но заявили, что их связывало NDA. Они подтвердили, что OpenAI имеет доступ к большинству задач бенчмарка кроме hold-out сета, но сказали, что между ними и OpenAI есть "устное соглашение о том, что эти данные не будут использоваться для обучения"
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Dealer.AI
Photo
Ну че вы, Сама и Ко дали "слово пацана" (если это применимо офк). Нет там fit on the test 👍
Please open Telegram to view this post
VIEW IN TELEGRAM
DeepSeek поделились интересным примером, того как их модель R1-Zero после обучения через rl "сама научилась останавливаться" и перепроверять свои решения. Причем ее этому не учили. Вот такой вот трансфер.
А что думаете Вы? Черипик или нет, верим?
Пишите в комментариях свое мнение.
https://github.com/deepseek-ai/DeepSeek-R1
А что думаете Вы? Черипик или нет, верим?
Пишите в комментариях свое мнение.
https://github.com/deepseek-ai/DeepSeek-R1
100 ярдов $ в OpenAI⚡️?)
До AGI оталось 6.9T $💳
https://www.cbsnews.com/news/trump-announces-private-sector-ai-infrastructure-investment/
Upd. Этот чел с какой-то части "Один дома" стал президентом и тут же решил сделать свой новый срок запоминающимся, по крайней мере для AI индустрии.
До AGI оталось 6.9T $
https://www.cbsnews.com/news/trump-announces-private-sector-ai-infrastructure-investment/
Upd. Этот чел с какой-то части "Один дома" стал президентом и тут же решил сделать свой новый срок запоминающимся, по крайней мере для AI индустрии.
Please open Telegram to view this post
VIEW IN TELEGRAM
CBS News
Trump announces up to $500 billion in private sector AI infrastructure investment
President Trump announced billions in private sector investment by OpenAI, Softbank and Oracle to build AI infrastructure in the U.S.
Мне нечего добавить к словам Вани о скоращениях и шансах(кстати новость впервые появилась тут), кроме как мемное из любимого сериала: https://youtu.be/g5OCi20yIyc?si=XGIpw5Ux6xku2WWP
Всем сокращенным такого желаю и жду конечно в наших рядах ;)
Всем сокращенным такого желаю и жду конечно в наших рядах ;)
YouTube
Хэдхантеры охотятся на Гилфойла. Кремниевая долина 3 сезон.
Гилфойл уволился из Pied Piper. Силиконовая долина 3 сезон 3 серия.
#Гилфойл #Динеш #КремниеваяДолина3сезон
#Гилфойл #Динеш #КремниеваяДолина3сезон
AI Operator - не скроется никто и ничто. ⌨️
Operator от OpenAI новая агентная система с ИИ. Теперь у вас есть свой коньсерж/ассистент/пикер, который может по указанию серфить интернет, совершать покупки, заказывать билеты, записывать на сервис и тп. И да он взаимодействует с браузером.
Уже Дядя видит этих ИИ сталкеров,которые следят за вашим профилем, собирают инфу с соц.сетей и пр. не этичные приложения эры агентов.
Руки на стол дамы и господа.🖕
А разработчикам новые вызовы с безопасностью и этикой.
http://operator.chatgpt.com/
Operator от OpenAI новая агентная система с ИИ. Теперь у вас есть свой коньсерж/ассистент/пикер, который может по указанию серфить интернет, совершать покупки, заказывать билеты, записывать на сервис и тп. И да он взаимодействует с браузером.
Уже Дядя видит этих ИИ сталкеров,которые следят за вашим профилем, собирают инфу с соц.сетей и пр. не этичные приложения эры агентов.
Руки на стол дамы и господа.
А разработчикам новые вызовы с безопасностью и этикой.
http://operator.chatgpt.com/
Please open Telegram to view this post
VIEW IN TELEGRAM
Chatgpt
An agent that can use its own browser to perform tasks for you.
Dealer.AI
AI Operator - не скроется никто и ничто. ⌨️ Operator от OpenAI новая агентная система с ИИ. Теперь у вас есть свой коньсерж/ассистент/пикер, который может по указанию серфить интернет, совершать покупки, заказывать билеты, записывать на сервис и тп. И да…
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Однажды Jun пришел к Staff super star pro plus ultra мастеру и спросил:
-Мастер, кого мне бояться в стиле кунг-фу GenAI?
-Nvidia? Ведь у них есть золотые лопаты и они делают лучшие GPU для обучения AI.
- Нет.
- OpenAI, META, Google. Ведь они имеют большие ресурсы, покупают золотые лопаты вагонетками и умнейших людей мира и делают лучшие в мире models?
- Нет.
- Кого мастер??
- Бойся тех, кто умеет на форках сделать свое улучшение, на лоуресурсах по лопатам оптимизировать компьют и при этом с большим человеческим потенциалом сделать DeepSeek R1.
-Мастер, кого мне бояться в стиле кунг-фу GenAI?
-Nvidia? Ведь у них есть золотые лопаты и они делают лучшие GPU для обучения AI.
- Нет.
- OpenAI, META, Google. Ведь они имеют большие ресурсы, покупают золотые лопаты вагонетками и умнейших людей мира и делают лучшие в мире models?
- Нет.
- Кого мастер??
- Бойся тех, кто умеет на форках сделать свое улучшение, на лоуресурсах по лопатам оптимизировать компьют и при этом с большим человеческим потенциалом сделать DeepSeek R1.
Ну че началося-то, а!?
Форкай, улучшай, топов побеждай?)
HuggingFace желает повторить и улучшить успех R1, разобрав на косточки сие изделие. Эпоха, когда не китайцы покупают высокотехнологичный гаджет и разбирают его до атомов. Снимают кальку технологии и воспроизводят. Теперь наоборот коллеги с "запада" перенимают опыт.
https://github.com/huggingface/open-r1
Форкай, улучшай, топов побеждай?)
HuggingFace желает повторить и улучшить успех R1, разобрав на косточки сие изделие. Эпоха, когда не китайцы покупают высокотехнологичный гаджет и разбирают его до атомов. Снимают кальку технологии и воспроизводят. Теперь наоборот коллеги с "запада" перенимают опыт.
https://github.com/huggingface/open-r1
GitHub
GitHub - huggingface/open-r1: Fully open reproduction of DeepSeek-R1
Fully open reproduction of DeepSeek-R1. Contribute to huggingface/open-r1 development by creating an account on GitHub.
Forwarded from Sberloga (🇻 🇱 🇦 🇩)
This media is not supported in your browser
VIEW IN TELEGRAM
Dealer.AI
100 ярдов $ в OpenAI⚡️?) До AGI оталось 6.9T $ 💳 https://www.cbsnews.com/news/trump-announces-private-sector-ai-infrastructure-investment/ Upd. Этот чел с какой-то части "Один дома" стал президентом и тут же решил сделать свой новый срок запоминающимся…
Китайцы на неделе радуют.
Вышел Qwen-2.5 на 1M контекста ссылка. Отмечается,что теперь, проблема "forgot in the middle", решена. А результаты модели даже выше, чем у ее старшего брата Turbo.
Далее национальный китайский банк вложит 137 млрд $ в ИИ. Как тебе такоеИлон Маск Сэм Альтман? Если учесть за сколько сделали китайцы DeepSeek R1,то кажется в пику старгейту ребяткам из Поднебесной хватит на бОльшее, чем OpenAI и Ко.
Вышел Qwen-2.5 на 1M контекста ссылка. Отмечается,что теперь, проблема "forgot in the middle", решена. А результаты модели даже выше, чем у ее старшего брата Turbo.
Далее национальный китайский банк вложит 137 млрд $ в ИИ. Как тебе такое
huggingface.co
Qwen2.5-1M - a Qwen Collection
The long-context version of Qwen2.5, supporting 1M-token context lengths