Futuris 2917 Telegram Group

Апдейты по новым моделям

Кто-то уже получил предварительный доступ к Gemini 2 и ходят слухи о скором релизе🔥

И на LLM арене сразу 3 новые модели Gemini test, big-engine, blueberry👌

1.1K viewsAnton, 07:58

Тут для современных моделек представили новый математический бенчмарк Frontier Math, который включает задачи, на решение которых у профессионалов уходит несколько дней. Современные модели справляются менее чем с 2% задач, несмотря на доступ к Python и большому количеству токенов. Для создания задач привлекли более 60 математиков, включая обладателей 14 золотых медалей IMO и одной Филдсовской премии.

Задачи оригинальны и требуют значительной работы, чтобы ответ не был угадан случайно. Подготовка к новым моделям идёт полным ходом, интересно будет пообщаться с ИИ (AGI) который рвёт этот бенчмарк в клочья (и почувствовать себя умственно отсталым🌚)

Я вообще тут подумал, что в какой-то момент выход каждой новой модели ИИ в массы будет больше пугать, чем восхищать, будем ещё топить за замедление темпа🫥

1.1K viewsAnton, edited 11:46

0:31

Скульпторам ничего не грозит говорили они.. Понятно, что ручной труд и опыт ничто не заменит, но как бизнес модель где можно штамповать изваяния на продажу очень даже сработает 🤓

https://www.robotor.it/about/

1.1K viewsAnton, edited 13:21

Подходил к концу 2024 год и я решил пройти... Скайрим✨
Но к нему я прикрутил локальную LLM Mistral 7b и простенький синтезатор голоса, так что моих 8gb видео с лихвой хватает для полного погружения и бесконечного общения с любым NPC🫶 (я думаю хватит и 4, Мистрал совсем нетребовательная, хотя по бенчмарку Language Understanding на уровне gpt 3.5👌). Можно добавлять в беседу сразу несколько человек (начало диалога грузит чуть дольше), просить выполнить простейшие действия и узнавать детали квеста, как в моём разговоре меня попросили найти должника в таверне, что по итогу приведёт к настоящему квесту и это всё локально и бесплатно🤯 Я теперь буду отслеживать опенсорс модельки, но уже этой хватает чтобы взрывать мозг и по настоящему погружаться в игру🧙‍♀️

Так можно и новый формат прохождений начать на YouTube 🤔 попробую потом улучшить мод, чтобы больше функций было у нпс и русский прикручу🌚

P.S.
Наконец-то узнаю историю, как стражнику прострелили колено✨

1.1K viewsAnton, edited 16:00

0:38

0:26

Если вы пропустили, то вчера вышла новая моделька Qwen 2.5 coder на 32b параметров, ну и она пишет код на уровне gpt4o🤯 для неё хватит и 16gb видео, а 14b и 7b, которые недалеко по бенчмарку ушли вообще на коленках можно запускать, this is big! 🔥

Опенсорс так скоро догонит и reasoning, как в o1 от OpenAI 🌚

https://huggingface.co/Qwen/Qwen2.5-Coder-32B-Instruct

1.2K viewsAnton, 05:06

Google выкатили пощупать новую экспериментальную модель Gemini exp 1114, которая сразу же стала лидером на чат-бот арене ✨

Пробуем тут с VPN USA https://aistudio.google.com/app/u/3/prompts/new_chat

Лимит контекста пока 32к токенов, говорят это урезанная Gemini 2 🌚

933 viewsAnton, 06:06

Просто, чтобы оценить скорость прогресса в LLM-сфере за последние 2 года: китайская моделька Yi-Lightning, которая занимает 6 место на арене, была обучена на 2000 графических процессоров и при бюджете в $3 млн🤯 тогда как OpenAI потратили на GPT-4 (которую Yi-Lightning обходит) от $80 до $100 млн.. Санкции, похоже только стимулируют Китай на инновации и оптимизацию вычислений, благодаря которым они и добились таких результатов (как и в недавней Qwen 2.5) В общем вопрос, кто достигнет AGI первым и каким способом, остаётся открытым🌚

1.0K viewsAnton, edited 09:15

0:28

0:15