Тут для современных моделек представили новый математический бенчмарк Frontier Math

Futuris

Тут для современных моделек представили новый математический бенчмарк Frontier Math, который включает задачи, на решение которых у профессионалов уходит несколько дней. Современные модели справляются менее чем с 2% задач, несмотря на доступ к Python и большому количеству токенов. Для создания задач привлекли более 60 математиков, включая обладателей 14 золотых медалей IMO и одной Филдсовской премии.

Задачи оригинальны и требуют значительной работы, чтобы ответ не был угадан случайно. Подготовка к новым моделям идёт полным ходом, интересно будет пообщаться с ИИ (AGI) который рвёт этот бенчмарк в клочья (и почувствовать себя умственно отсталым🌚)

Я вообще тут подумал, что в какой-то момент выход каждой новой модели ИИ в массы будет больше пугать, чем восхищать, будем ещё топить за замедление темпа🫥

www.group-telegram.com/id/Futuris.com/2898

1.2K viewsAnton, edited Nov 9, 2024 at 11:46

group-telegram.com/Futuris/2898

Create: 2024-11-09
Last Update: 2025-03-03 09:56:40

BY Futuris

Share with your friend now:
group-telegram.com/Futuris/2898

Telegram | DID YOU KNOW?

Тут для современных моделек представили новый математический бенчмарк Frontier Math