Telegram Group & Telegram Channel
более подробно о тесте o3 на ARC-AGI

o3 — новая ИИ-система, которая продемонстрировала способность адаптироваться к новым задачам, значительно превышая возможности предыдущих моделей GPT.

Результаты:
На Semi-Private Evaluation (100 задач) o3 набрал:
75.7% при ограниченном бюджете вычислений ($10k).
87.5% с высоким уровнем вычислений (172x больше).
На Public Evaluation (400 задач) результаты составили 82.8% (ограниченный бюджет) и 91.5% (высокий уровень вычислений).

Прорыв:
Это первый случай, когда ИИ достиг такого уровня обобщения, что сравним с человеческим.
Для сравнения, GPT-4o ранее набирал только 5% на аналогичных тестах.

Особенности o3:
Применяет новый подход, основанный на поиске и выполнении программ в текстовой форме для решения задач.
Способен комбинировать знания и адаптироваться к новизне, что ранее было невозможно для моделей GPT.

Вызовы:
Затраты на решение одной задачи (в низкоэффективном режиме) всё ещё выше человеческих (~$17-20 против $5 у человека).
Несмотря на высокую производительность, система всё ещё далека от уровня AGI (общего искусственного интеллекта).

Будущее:
В 2025 году планируется запуск нового теста ARC-AGI-2 для повышения сложности и продолжения исследований.
OpenAI планирует делать эти технологии более доступными и эффективными.

Вывод: OpenAI o3 — это качественный скачок в ИИ, демонстрирующий адаптивность и способность решать принципиально новые задачи. Это пока не AGI, модель всё ещё может совершать ошибки на совершенно простых задачах.



group-telegram.com/Futuris/2998
Create:
Last Update:

более подробно о тесте o3 на ARC-AGI

o3 — новая ИИ-система, которая продемонстрировала способность адаптироваться к новым задачам, значительно превышая возможности предыдущих моделей GPT.

Результаты:
На Semi-Private Evaluation (100 задач) o3 набрал:
75.7% при ограниченном бюджете вычислений ($10k).
87.5% с высоким уровнем вычислений (172x больше).
На Public Evaluation (400 задач) результаты составили 82.8% (ограниченный бюджет) и 91.5% (высокий уровень вычислений).

Прорыв:
Это первый случай, когда ИИ достиг такого уровня обобщения, что сравним с человеческим.
Для сравнения, GPT-4o ранее набирал только 5% на аналогичных тестах.

Особенности o3:
Применяет новый подход, основанный на поиске и выполнении программ в текстовой форме для решения задач.
Способен комбинировать знания и адаптироваться к новизне, что ранее было невозможно для моделей GPT.

Вызовы:
Затраты на решение одной задачи (в низкоэффективном режиме) всё ещё выше человеческих (~$17-20 против $5 у человека).
Несмотря на высокую производительность, система всё ещё далека от уровня AGI (общего искусственного интеллекта).

Будущее:
В 2025 году планируется запуск нового теста ARC-AGI-2 для повышения сложности и продолжения исследований.
OpenAI планирует делать эти технологии более доступными и эффективными.

Вывод: OpenAI o3 — это качественный скачок в ИИ, демонстрирующий адаптивность и способность решать принципиально новые задачи. Это пока не AGI, модель всё ещё может совершать ошибки на совершенно простых задачах.

BY Futuris




Share with your friend now:
group-telegram.com/Futuris/2998

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

This provided opportunity to their linked entities to offload their shares at higher prices and make significant profits at the cost of unsuspecting retail investors. Either way, Durov says that he withdrew his resignation but that he was ousted from his company anyway. Subsequently, control of the company was reportedly handed to oligarchs Alisher Usmanov and Igor Sechin, both allegedly close associates of Russian leader Vladimir Putin. Following this, Sebi, in an order passed in January 2022, established that the administrators of a Telegram channel having a large subscriber base enticed the subscribers to act upon recommendations that were circulated by those administrators on the channel, leading to significant price and volume impact in various scrips. But Telegram says people want to keep their chat history when they get a new phone, and they like having a data backup that will sync their chats across multiple devices. And that is why they let people choose whether they want their messages to be encrypted or not. When not turned on, though, chats are stored on Telegram's services, which are scattered throughout the world. But it has "disclosed 0 bytes of user data to third parties, including governments," Telegram states on its website. "There is a significant risk of insider threat or hacking of Telegram systems that could expose all of these chats to the Russian government," said Eva Galperin with the Electronic Frontier Foundation, which has called for Telegram to improve its privacy practices.
from id


Telegram Futuris
FROM American