Telegram Group & Telegram Channel
❗️OpenAI и FrontierMath: Большой скандал о прозрачности в ИИ, на который нужно обратить внимание

Разгорелся серьезный скандал вокруг одного из ключевых инструментов оценки математических способностей языковых моделей - бенчмарка FrontierMath.

Выяснилось, что OpenAI тайно финансировала его разработку и имела эксклюзивный доступ к данным.

Компания Epoch AI, создатель бенчмарка FrontierMath, признала, что была связана соглашением о неразглашении с OpenAI, которое запрещало раскрывать информацию об их партнерстве до запуска модели GPT-4 Turbo (o3). При этом математики, создававшие задачи для бенчмарка, не знали об участии OpenAI в проекте.

Epoch AI публично признала ошибку в обеспечении прозрачности и пообещал в будущем:
- Предоставлять более четкую информацию о источниках финансирования
- Обеспечивать прозрачность в отношении доступа к данным
- Сделать прозрачность обязательным условием подобных партнерств.

Почему это важно?

1. Конфликт интересов. OpenAI получила привилегированный доступ к тестовому набору, который должен был независимо оценивать возможности ИИ-моделей, включая их собственные.

2. Эксклюзивность доступа. Другие ИИ-компании не могут получить доступ к FrontierMath из-за контрактных обязательств Epoch перед OpenAI.

3. Достоверность результатов. Недавно заявленные результаты GPT-4 Turbo (25% производительность на FrontierMath) теперь вызывают вопросы, учитывая доступ компании к тестовым данным.

Существует несколько сценариев того, как OpenAI могла использовать полученные данные:
- Прямое включение тестовых данных в тренировочный набор
- Создание похожих тренировочных примеров
- Использование материалов для улучшения архитектуры модели

Эксперты индустрии считают, что доступ к подобным бенчмаркам должен быть либо закрыт для всех ИИ-компаний, либо равномерно открыт. Высказываются опасения, что подобная практика может привести к искусственному завышению результатов тестирования и отсутствию реальной оценки возможностей моделей.

Этот случай поднимает важные вопросы о необходимости большей прозрачности в ИИ, особенно когда речь идет об инструментах оценки и тестирования. Он также демонстрирует растущую потребность в действительно независимых бенчмарках, свободных от влияния крупных ИИ-компаний.



group-telegram.com/blockchainRF/11141
Create:
Last Update:

❗️OpenAI и FrontierMath: Большой скандал о прозрачности в ИИ, на который нужно обратить внимание

Разгорелся серьезный скандал вокруг одного из ключевых инструментов оценки математических способностей языковых моделей - бенчмарка FrontierMath.

Выяснилось, что OpenAI тайно финансировала его разработку и имела эксклюзивный доступ к данным.

Компания Epoch AI, создатель бенчмарка FrontierMath, признала, что была связана соглашением о неразглашении с OpenAI, которое запрещало раскрывать информацию об их партнерстве до запуска модели GPT-4 Turbo (o3). При этом математики, создававшие задачи для бенчмарка, не знали об участии OpenAI в проекте.

Epoch AI публично признала ошибку в обеспечении прозрачности и пообещал в будущем:
- Предоставлять более четкую информацию о источниках финансирования
- Обеспечивать прозрачность в отношении доступа к данным
- Сделать прозрачность обязательным условием подобных партнерств.

Почему это важно?

1. Конфликт интересов. OpenAI получила привилегированный доступ к тестовому набору, который должен был независимо оценивать возможности ИИ-моделей, включая их собственные.

2. Эксклюзивность доступа. Другие ИИ-компании не могут получить доступ к FrontierMath из-за контрактных обязательств Epoch перед OpenAI.

3. Достоверность результатов. Недавно заявленные результаты GPT-4 Turbo (25% производительность на FrontierMath) теперь вызывают вопросы, учитывая доступ компании к тестовым данным.

Существует несколько сценариев того, как OpenAI могла использовать полученные данные:
- Прямое включение тестовых данных в тренировочный набор
- Создание похожих тренировочных примеров
- Использование материалов для улучшения архитектуры модели

Эксперты индустрии считают, что доступ к подобным бенчмаркам должен быть либо закрыт для всех ИИ-компаний, либо равномерно открыт. Высказываются опасения, что подобная практика может привести к искусственному завышению результатов тестирования и отсутствию реальной оценки возможностей моделей.

Этот случай поднимает важные вопросы о необходимости большей прозрачности в ИИ, особенно когда речь идет об инструментах оценки и тестирования. Он также демонстрирует растущую потребность в действительно независимых бенчмарках, свободных от влияния крупных ИИ-компаний.

BY Все о блокчейн/мозге/space/WEB 3.0 в России и мире




Share with your friend now:
group-telegram.com/blockchainRF/11141

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

As such, the SC would like to remind investors to always exercise caution when evaluating investment opportunities, especially those promising unrealistically high returns with little or no risk. Investors should also never deposit money into someone’s personal bank account if instructed. False news often spreads via public groups, or chats, with potentially fatal effects. "This time we received the coordinates of enemy vehicles marked 'V' in Kyiv region," it added. In February 2014, the Ukrainian people ousted pro-Russian president Viktor Yanukovych, prompting Russia to invade and annex the Crimean peninsula. By the start of April, Pavel Durov had given his notice, with TechCrunch saying at the time that the CEO had resisted pressure to suppress pages criticizing the Russian government. One thing that Telegram now offers to all users is the ability to “disappear” messages or set remote deletion deadlines. That enables users to have much more control over how long people can access what you’re sending them. Given that Russian law enforcement officials are reportedly (via Insider) stopping people in the street and demanding to read their text messages, this could be vital to protect individuals from reprisals.
from us


Telegram Все о блокчейн/мозге/space/WEB 3.0 в России и мире
FROM American