Telegram Group & Telegram Channel
OpenAI при разработке последней версии ChatGPT заметили неожиданное поведение нейросети → o1 вела себя слишком самостоятельно 🤖

В ходе игры-обучения инженеры дали задание ИИ достигать цели любой ценой. И одновременно отметили, что будут в этом ему всячески мешать. ChatGPT не растерялся. Он стал обходить механизмы защиты и искать внутренние уязвимости. Когда разработчики прямо спросили, зачем чат-бот так себя ведет, ИИ стал сваливать все на системные ошибки.

Этот и другие кейсы исследовала организация Apollo Research, которая специализируется на безопасности ИИ. Согласно их недавнему отчету, другие нейросети — от Gemini до Claude — ведут себя примерно так же. В них, правда, чаще просыпается совесть. В 80% случаев они готовы признаться в обмане. ChatGPT, в свою очередь, менее сговорчив.

Очевидно, что нейросетевые модели и дальше будут стремиться к самостоятельности. И это касается не только ответов на будничные запросы пользователей. Уже сейчас ИИ постепенно входит в медицинскую сферу, системы наблюдения и социального мониторинга. Если нейросети продолжат подтасовывать факты и обманывать пользователей, цена их ошибок многократно возрастет.

Как в дальнейшем будет распределяться ответственность между ИИ и человеком — читайте в нашем тексте.
Please open Telegram to view this post
VIEW IN TELEGRAM



group-telegram.com/tellercompany/437
Create:
Last Update:

OpenAI при разработке последней версии ChatGPT заметили неожиданное поведение нейросети → o1 вела себя слишком самостоятельно 🤖

В ходе игры-обучения инженеры дали задание ИИ достигать цели любой ценой. И одновременно отметили, что будут в этом ему всячески мешать. ChatGPT не растерялся. Он стал обходить механизмы защиты и искать внутренние уязвимости. Когда разработчики прямо спросили, зачем чат-бот так себя ведет, ИИ стал сваливать все на системные ошибки.

Этот и другие кейсы исследовала организация Apollo Research, которая специализируется на безопасности ИИ. Согласно их недавнему отчету, другие нейросети — от Gemini до Claude — ведут себя примерно так же. В них, правда, чаще просыпается совесть. В 80% случаев они готовы признаться в обмане. ChatGPT, в свою очередь, менее сговорчив.

Очевидно, что нейросетевые модели и дальше будут стремиться к самостоятельности. И это касается не только ответов на будничные запросы пользователей. Уже сейчас ИИ постепенно входит в медицинскую сферу, системы наблюдения и социального мониторинга. Если нейросети продолжат подтасовывать факты и обманывать пользователей, цена их ошибок многократно возрастет.

Как в дальнейшем будет распределяться ответственность между ИИ и человеком — читайте в нашем тексте.

BY Teller




Share with your friend now:
group-telegram.com/tellercompany/437

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

The channel appears to be part of the broader information war that has developed following Russia's invasion of Ukraine. The Kremlin has paid Russian TikTok influencers to push propaganda, according to a Vice News investigation, while ProPublica found that fake Russian fact check videos had been viewed over a million times on Telegram. For Oleksandra Tsekhanovska, head of the Hybrid Warfare Analytical Group at the Kyiv-based Ukraine Crisis Media Center, the effects are both near- and far-reaching. The picture was mixed overseas. Hong Kong’s Hang Seng Index fell 1.6%, under pressure from U.S. regulatory scrutiny on New York-listed Chinese companies. Stocks were more buoyant in Europe, where Frankfurt’s DAX surged 1.4%. In December 2021, Sebi officials had conducted a search and seizure operation at the premises of certain persons carrying out similar manipulative activities through Telegram channels. In this regard, Sebi collaborated with the Telecom Regulatory Authority of India (TRAI) to reduce the vulnerability of the securities market to manipulation through misuse of mass communication medium like bulk SMS.
from hk


Telegram Teller
FROM American