Notice: file_put_contents(): Write of 7978 bytes failed with errno=28 No space left on device in /var/www/group-telegram/post.php on line 50

Warning: file_put_contents(): Only 4096 of 12074 bytes written, possibly out of free disk space in /var/www/group-telegram/post.php on line 50
Все о блокчейн/мозге/space/WEB 3.0 в России и мире | Telegram Webview: blockchainRF/11141 -
Telegram Group & Telegram Channel
❗️OpenAI и FrontierMath: Большой скандал о прозрачности в ИИ, на который нужно обратить внимание

Разгорелся серьезный скандал вокруг одного из ключевых инструментов оценки математических способностей языковых моделей - бенчмарка FrontierMath.

Выяснилось, что OpenAI тайно финансировала его разработку и имела эксклюзивный доступ к данным.

Компания Epoch AI, создатель бенчмарка FrontierMath, признала, что была связана соглашением о неразглашении с OpenAI, которое запрещало раскрывать информацию об их партнерстве до запуска модели GPT-4 Turbo (o3). При этом математики, создававшие задачи для бенчмарка, не знали об участии OpenAI в проекте.

Epoch AI публично признала ошибку в обеспечении прозрачности и пообещал в будущем:
- Предоставлять более четкую информацию о источниках финансирования
- Обеспечивать прозрачность в отношении доступа к данным
- Сделать прозрачность обязательным условием подобных партнерств.

Почему это важно?

1. Конфликт интересов. OpenAI получила привилегированный доступ к тестовому набору, который должен был независимо оценивать возможности ИИ-моделей, включая их собственные.

2. Эксклюзивность доступа. Другие ИИ-компании не могут получить доступ к FrontierMath из-за контрактных обязательств Epoch перед OpenAI.

3. Достоверность результатов. Недавно заявленные результаты GPT-4 Turbo (25% производительность на FrontierMath) теперь вызывают вопросы, учитывая доступ компании к тестовым данным.

Существует несколько сценариев того, как OpenAI могла использовать полученные данные:
- Прямое включение тестовых данных в тренировочный набор
- Создание похожих тренировочных примеров
- Использование материалов для улучшения архитектуры модели

Эксперты индустрии считают, что доступ к подобным бенчмаркам должен быть либо закрыт для всех ИИ-компаний, либо равномерно открыт. Высказываются опасения, что подобная практика может привести к искусственному завышению результатов тестирования и отсутствию реальной оценки возможностей моделей.

Этот случай поднимает важные вопросы о необходимости большей прозрачности в ИИ, особенно когда речь идет об инструментах оценки и тестирования. Он также демонстрирует растущую потребность в действительно независимых бенчмарках, свободных от влияния крупных ИИ-компаний.



group-telegram.com/blockchainRF/11141
Create:
Last Update:

❗️OpenAI и FrontierMath: Большой скандал о прозрачности в ИИ, на который нужно обратить внимание

Разгорелся серьезный скандал вокруг одного из ключевых инструментов оценки математических способностей языковых моделей - бенчмарка FrontierMath.

Выяснилось, что OpenAI тайно финансировала его разработку и имела эксклюзивный доступ к данным.

Компания Epoch AI, создатель бенчмарка FrontierMath, признала, что была связана соглашением о неразглашении с OpenAI, которое запрещало раскрывать информацию об их партнерстве до запуска модели GPT-4 Turbo (o3). При этом математики, создававшие задачи для бенчмарка, не знали об участии OpenAI в проекте.

Epoch AI публично признала ошибку в обеспечении прозрачности и пообещал в будущем:
- Предоставлять более четкую информацию о источниках финансирования
- Обеспечивать прозрачность в отношении доступа к данным
- Сделать прозрачность обязательным условием подобных партнерств.

Почему это важно?

1. Конфликт интересов. OpenAI получила привилегированный доступ к тестовому набору, который должен был независимо оценивать возможности ИИ-моделей, включая их собственные.

2. Эксклюзивность доступа. Другие ИИ-компании не могут получить доступ к FrontierMath из-за контрактных обязательств Epoch перед OpenAI.

3. Достоверность результатов. Недавно заявленные результаты GPT-4 Turbo (25% производительность на FrontierMath) теперь вызывают вопросы, учитывая доступ компании к тестовым данным.

Существует несколько сценариев того, как OpenAI могла использовать полученные данные:
- Прямое включение тестовых данных в тренировочный набор
- Создание похожих тренировочных примеров
- Использование материалов для улучшения архитектуры модели

Эксперты индустрии считают, что доступ к подобным бенчмаркам должен быть либо закрыт для всех ИИ-компаний, либо равномерно открыт. Высказываются опасения, что подобная практика может привести к искусственному завышению результатов тестирования и отсутствию реальной оценки возможностей моделей.

Этот случай поднимает важные вопросы о необходимости большей прозрачности в ИИ, особенно когда речь идет об инструментах оценки и тестирования. Он также демонстрирует растущую потребность в действительно независимых бенчмарках, свободных от влияния крупных ИИ-компаний.

BY Все о блокчейн/мозге/space/WEB 3.0 в России и мире



❌Photos not found?❌Click here to update cache.


Share with your friend now:
group-telegram.com/blockchainRF/11141

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

"Someone posing as a Ukrainian citizen just joins the chat and starts spreading misinformation, or gathers data, like the location of shelters," Tsekhanovska said, noting how false messages have urged Ukrainians to turn off their phones at a specific time of night, citing cybersafety. "And that set off kind of a battle royale for control of the platform that Durov eventually lost," said Nathalie Maréchal of the Washington advocacy group Ranking Digital Rights. In this regard, Sebi collaborated with the Telecom Regulatory Authority of India (TRAI) to reduce the vulnerability of the securities market to manipulation through misuse of mass communication medium like bulk SMS. But the Ukraine Crisis Media Center's Tsekhanovska points out that communications are often down in zones most affected by the war, making this sort of cross-referencing a luxury many cannot afford. Oh no. There’s a certain degree of myth-making around what exactly went on, so take everything that follows lightly. Telegram was originally launched as a side project by the Durov brothers, with Nikolai handling the coding and Pavel as CEO, while both were at VK.
from in


Telegram Все о блокчейн/мозге/space/WEB 3.0 в России и мире
FROM American