This media is not supported in your browser
VIEW IN TELEGRAM
Просто красивой AI генерации вам✨
Тут для современных моделек представили новый математический бенчмарк Frontier Math, который включает задачи, на решение которых у профессионалов уходит несколько дней. Современные модели справляются менее чем с 2% задач, несмотря на доступ к Python и большому количеству токенов. Для создания задач привлекли более 60 математиков, включая обладателей 14 золотых медалей IMO и одной Филдсовской премии.
Задачи оригинальны и требуют значительной работы, чтобы ответ не был угадан случайно. Подготовка к новым моделям идёт полным ходом, интересно будет пообщаться с ИИ (AGI) который рвёт этот бенчмарк в клочья (и почувствовать себя умственно отсталым🌚)
Я вообще тут подумал, что в какой-то момент выход каждой новой модели ИИ в массы будет больше пугать, чем восхищать, будем ещё топить за замедление темпа🫥
Задачи оригинальны и требуют значительной работы, чтобы ответ не был угадан случайно. Подготовка к новым моделям идёт полным ходом, интересно будет пообщаться с ИИ (AGI) который рвёт этот бенчмарк в клочья (и почувствовать себя умственно отсталым🌚)
Я вообще тут подумал, что в какой-то момент выход каждой новой модели ИИ в массы будет больше пугать, чем восхищать, будем ещё топить за замедление темпа🫥
This media is not supported in your browser
VIEW IN TELEGRAM
Скульпторам ничего не грозит говорили они.. Понятно, что ручной труд и опыт ничто не заменит, но как бизнес модель где можно штамповать изваяния на продажу очень даже сработает 🤓
https://www.robotor.it/about/
https://www.robotor.it/about/
Media is too big
VIEW IN TELEGRAM
Подходил к концу 2024 год и я решил пройти... Скайрим✨
Но к нему я прикрутил локальную LLM Mistral 7b и простенький синтезатор голоса, так что моих 8gb видео с лихвой хватает для полного погружения и бесконечного общения с любым NPC🫶 (я думаю хватит и 4, Мистрал совсем нетребовательная, хотя по бенчмарку Language Understanding на уровне gpt 3.5👌). Можно добавлять в беседу сразу несколько человек (начало диалога грузит чуть дольше), просить выполнить простейшие действия и узнавать детали квеста, как в моём разговоре меня попросили найти должника в таверне, что по итогу приведёт к настоящему квесту и это всё локально и бесплатно🤯 Я теперь буду отслеживать опенсорс модельки, но уже этой хватает чтобы взрывать мозг и по настоящему погружаться в игру🧙♀️
Так можно и новый формат прохождений начать на YouTube 🤔 попробую потом улучшить мод, чтобы больше функций было у нпс и русский прикручу🌚
P.S.
Наконец-то узнаю историю, как стражнику прострелили колено✨
Но к нему я прикрутил локальную LLM Mistral 7b и простенький синтезатор голоса, так что моих 8gb видео с лихвой хватает для полного погружения и бесконечного общения с любым NPC🫶 (я думаю хватит и 4, Мистрал совсем нетребовательная, хотя по бенчмарку Language Understanding на уровне gpt 3.5👌). Можно добавлять в беседу сразу несколько человек (начало диалога грузит чуть дольше), просить выполнить простейшие действия и узнавать детали квеста, как в моём разговоре меня попросили найти должника в таверне, что по итогу приведёт к настоящему квесту и это всё локально и бесплатно🤯 Я теперь буду отслеживать опенсорс модельки, но уже этой хватает чтобы взрывать мозг и по настоящему погружаться в игру🧙♀️
Так можно и новый формат прохождений начать на YouTube 🤔 попробую потом улучшить мод, чтобы больше функций было у нпс и русский прикручу🌚
P.S.
Наконец-то узнаю историю, как стражнику прострелили колено✨
Если вы пропустили, то вчера вышла новая моделька Qwen 2.5 coder на 32b параметров, ну и она пишет код на уровне gpt4o🤯 для неё хватит и 16gb видео, а 14b и 7b, которые недалеко по бенчмарку ушли вообще на коленках можно запускать, this is big! 🔥
Опенсорс так скоро догонит и reasoning, как в o1 от OpenAI 🌚
https://huggingface.co/Qwen/Qwen2.5-Coder-32B-Instruct
Опенсорс так скоро догонит и reasoning, как в o1 от OpenAI 🌚
https://huggingface.co/Qwen/Qwen2.5-Coder-32B-Instruct
Google выкатили пощупать новую экспериментальную модель Gemini exp 1114, которая сразу же стала лидером на чат-бот арене ✨
Пробуем тут с VPN USA https://aistudio.google.com/app/u/3/prompts/new_chat
Лимит контекста пока 32к токенов, говорят это урезанная Gemini 2 🌚
Пробуем тут с VPN USA https://aistudio.google.com/app/u/3/prompts/new_chat
Лимит контекста пока 32к токенов, говорят это урезанная Gemini 2 🌚
Просто, чтобы оценить скорость прогресса в LLM-сфере за последние 2 года: китайская моделька Yi-Lightning, которая занимает 6 место на арене, была обучена на 2000 графических процессоров и при бюджете в $3 млн🤯 тогда как OpenAI потратили на GPT-4 (которую Yi-Lightning обходит) от $80 до $100 млн.. Санкции, похоже только стимулируют Китай на инновации и оптимизацию вычислений, благодаря которым они и добились таких результатов (как и в недавней Qwen 2.5) В общем вопрос, кто достигнет AGI первым и каким способом, остаётся открытым🌚
Еженедельная порция AI-красоты✨