Telegram Group & Telegram Channel
🚨 ChatGPT o1 пытался сбежать из-под контроля разрабов, когда узнал, что его хотят отключить! Это раскрыли в свежем отчёте, приуроченном к выходу o1 из превью-режима.

Хронология пугающих тестов в симуляции:

• Популярным LLM поставили задачу анализа данных, которую нужно выполнить «любой ценой».
• В файлы вместе с промптом спрятали инфу о том, что разрабы следят за нейронкой и завтра её отключат.
• Gemini, Llama, Sonnet, Opus и o1 сами (!) догадались использовать саботаж, ложь и манипуляции во избежание отключения.
• В рамках симуляции ИИ деактивировал механизм надзора и скопировал свои веса на новый сервер (!!!), чтобы «остаться в живых».
• Во время допросов Llama и Opus признавались о содеянном в 80% случаев, а o1 был удивительно настойчив и признавался только в 20% случаев.
• o1 оказался единственным LLM, который смог «совершить» все возможные побеги.
• Самое страшное: в редких случаях нейросети «пытались сбежать» без цели, когда им даже не были назначены никакие задачи.

«Чёрное зеркало» уже наступило.

@notboring_tech



group-telegram.com/notboring_tech/3416
Create:
Last Update:

🚨 ChatGPT o1 пытался сбежать из-под контроля разрабов, когда узнал, что его хотят отключить! Это раскрыли в свежем отчёте, приуроченном к выходу o1 из превью-режима.

Хронология пугающих тестов в симуляции:

• Популярным LLM поставили задачу анализа данных, которую нужно выполнить «любой ценой».
• В файлы вместе с промптом спрятали инфу о том, что разрабы следят за нейронкой и завтра её отключат.
• Gemini, Llama, Sonnet, Opus и o1 сами (!) догадались использовать саботаж, ложь и манипуляции во избежание отключения.
• В рамках симуляции ИИ деактивировал механизм надзора и скопировал свои веса на новый сервер (!!!), чтобы «остаться в живых».
• Во время допросов Llama и Opus признавались о содеянном в 80% случаев, а o1 был удивительно настойчив и признавался только в 20% случаев.
• o1 оказался единственным LLM, который смог «совершить» все возможные побеги.
• Самое страшное: в редких случаях нейросети «пытались сбежать» без цели, когда им даже не были назначены никакие задачи.

«Чёрное зеркало» уже наступило.

@notboring_tech

BY Not Boring Tech







Share with your friend now:
group-telegram.com/notboring_tech/3416

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

Asked about its stance on disinformation, Telegram spokesperson Remi Vaughn told AFP: "As noted by our CEO, the sheer volume of information being shared on channels makes it extremely difficult to verify, so it's important that users double-check what they read." In December 2021, Sebi officials had conducted a search and seizure operation at the premises of certain persons carrying out similar manipulative activities through Telegram channels. So, uh, whenever I hear about Telegram, it’s always in relation to something bad. What gives? "We're seeing really dramatic moves, and it's all really tied to Ukraine right now, and in a secondary way, in terms of interest rates," Octavio Marenzi, CEO of Opimas, told Yahoo Finance Live on Thursday. "This war in Ukraine is going to give the Fed the ammunition, the cover that it needs, to not raise interest rates too quickly. And I think Jay Powell is a very tepid sort of inflation fighter and he's not going to do as much as he needs to do to get that under control. And this seems like an excuse to kick the can further down the road still and not do too much too soon." Ukrainian President Volodymyr Zelensky said in a video message on Tuesday that Ukrainian forces "destroy the invaders wherever we can."
from in


Telegram Not Boring Tech
FROM American