Telegram Group & Telegram Channel
OpenAI при разработке последней версии ChatGPT заметили неожиданное поведение нейросети → o1 вела себя слишком самостоятельно 🤖

В ходе игры-обучения инженеры дали задание ИИ достигать цели любой ценой. И одновременно отметили, что будут в этом ему всячески мешать. ChatGPT не растерялся. Он стал обходить механизмы защиты и искать внутренние уязвимости. Когда разработчики прямо спросили, зачем чат-бот так себя ведет, ИИ стал сваливать все на системные ошибки.

Этот и другие кейсы исследовала организация Apollo Research, которая специализируется на безопасности ИИ. Согласно их недавнему отчету, другие нейросети — от Gemini до Claude — ведут себя примерно так же. В них, правда, чаще просыпается совесть. В 80% случаев они готовы признаться в обмане. ChatGPT, в свою очередь, менее сговорчив.

Очевидно, что нейросетевые модели и дальше будут стремиться к самостоятельности. И это касается не только ответов на будничные запросы пользователей. Уже сейчас ИИ постепенно входит в медицинскую сферу, системы наблюдения и социального мониторинга. Если нейросети продолжат подтасовывать факты и обманывать пользователей, цена их ошибок многократно возрастет.

Как в дальнейшем будет распределяться ответственность между ИИ и человеком — читайте в нашем тексте.
Please open Telegram to view this post
VIEW IN TELEGRAM



group-telegram.com/tellercompany/437
Create:
Last Update:

OpenAI при разработке последней версии ChatGPT заметили неожиданное поведение нейросети → o1 вела себя слишком самостоятельно 🤖

В ходе игры-обучения инженеры дали задание ИИ достигать цели любой ценой. И одновременно отметили, что будут в этом ему всячески мешать. ChatGPT не растерялся. Он стал обходить механизмы защиты и искать внутренние уязвимости. Когда разработчики прямо спросили, зачем чат-бот так себя ведет, ИИ стал сваливать все на системные ошибки.

Этот и другие кейсы исследовала организация Apollo Research, которая специализируется на безопасности ИИ. Согласно их недавнему отчету, другие нейросети — от Gemini до Claude — ведут себя примерно так же. В них, правда, чаще просыпается совесть. В 80% случаев они готовы признаться в обмане. ChatGPT, в свою очередь, менее сговорчив.

Очевидно, что нейросетевые модели и дальше будут стремиться к самостоятельности. И это касается не только ответов на будничные запросы пользователей. Уже сейчас ИИ постепенно входит в медицинскую сферу, системы наблюдения и социального мониторинга. Если нейросети продолжат подтасовывать факты и обманывать пользователей, цена их ошибок многократно возрастет.

Как в дальнейшем будет распределяться ответственность между ИИ и человеком — читайте в нашем тексте.

BY Teller




Share with your friend now:
group-telegram.com/tellercompany/437

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

"There is a significant risk of insider threat or hacking of Telegram systems that could expose all of these chats to the Russian government," said Eva Galperin with the Electronic Frontier Foundation, which has called for Telegram to improve its privacy practices. Either way, Durov says that he withdrew his resignation but that he was ousted from his company anyway. Subsequently, control of the company was reportedly handed to oligarchs Alisher Usmanov and Igor Sechin, both allegedly close associates of Russian leader Vladimir Putin. The original Telegram channel has expanded into a web of accounts for different locations, including specific pages made for individual Russian cities. There's also an English-language website, which states it is owned by the people who run the Telegram channels. Ukrainian forces successfully attacked Russian vehicles in the capital city of Kyiv thanks to a public tip made through the encrypted messaging app Telegram, Ukraine's top law-enforcement agency said on Tuesday. That hurt tech stocks. For the past few weeks, the 10-year yield has traded between 1.72% and 2%, as traders moved into the bond for safety when Russia headlines were ugly—and out of it when headlines improved. Now, the yield is touching its pandemic-era high. If the yield breaks above that level, that could signal that it’s on a sustainable path higher. Higher long-dated bond yields make future profits less valuable—and many tech companies are valued on the basis of profits forecast for many years in the future.
from no


Telegram Teller
FROM American