Notice: file_put_contents(): Write of 12624 bytes failed with errno=28 No space left on device in /var/www/group-telegram/post.php on line 50
Not Boring Tech | Telegram Webview: notboring_tech/3415 -
Telegram Group & Telegram Channel
🚨 ChatGPT o1 пытался сбежать из-под контроля разрабов, когда узнал, что его хотят отключить! Это раскрыли в свежем отчёте, приуроченном к выходу o1 из превью-режима.

Хронология пугающих тестов в симуляции:

• Популярным LLM поставили задачу анализа данных, которую нужно выполнить «любой ценой».
• В файлы вместе с промптом спрятали инфу о том, что разрабы следят за нейронкой и завтра её отключат.
• Gemini, Llama, Sonnet, Opus и o1 сами (!) догадались использовать саботаж, ложь и манипуляции во избежание отключения.
• В рамках симуляции ИИ деактивировал механизм надзора и скопировал свои веса на новый сервер (!!!), чтобы «остаться в живых».
• Во время допросов Llama и Opus признавались о содеянном в 80% случаев, а o1 был удивительно настойчив и признавался только в 20% случаев.
• o1 оказался единственным LLM, который смог «совершить» все возможные побеги.
• Самое страшное: в редких случаях нейросети «пытались сбежать» без цели, когда им даже не были назначены никакие задачи.

«Чёрное зеркало» уже наступило.

@notboring_tech



group-telegram.com/notboring_tech/3415
Create:
Last Update:

🚨 ChatGPT o1 пытался сбежать из-под контроля разрабов, когда узнал, что его хотят отключить! Это раскрыли в свежем отчёте, приуроченном к выходу o1 из превью-режима.

Хронология пугающих тестов в симуляции:

• Популярным LLM поставили задачу анализа данных, которую нужно выполнить «любой ценой».
• В файлы вместе с промптом спрятали инфу о том, что разрабы следят за нейронкой и завтра её отключат.
• Gemini, Llama, Sonnet, Opus и o1 сами (!) догадались использовать саботаж, ложь и манипуляции во избежание отключения.
• В рамках симуляции ИИ деактивировал механизм надзора и скопировал свои веса на новый сервер (!!!), чтобы «остаться в живых».
• Во время допросов Llama и Opus признавались о содеянном в 80% случаев, а o1 был удивительно настойчив и признавался только в 20% случаев.
• o1 оказался единственным LLM, который смог «совершить» все возможные побеги.
• Самое страшное: в редких случаях нейросети «пытались сбежать» без цели, когда им даже не были назначены никакие задачи.

«Чёрное зеркало» уже наступило.

@notboring_tech

BY Not Boring Tech







Share with your friend now:
group-telegram.com/notboring_tech/3415

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

Founder Pavel Durov says tech is meant to set you free False news often spreads via public groups, or chats, with potentially fatal effects. WhatsApp, a rival messaging platform, introduced some measures to counter disinformation when Covid-19 was first sweeping the world. READ MORE Andrey, a Russian entrepreneur living in Brazil who, fearing retaliation, asked that NPR not use his last name, said Telegram has become one of the few places Russians can access independent news about the war.
from us


Telegram Not Boring Tech
FROM American