Telegram Group & Telegram Channel
Forwarded from Not Boring Tech
🚨 ChatGPT o1 пытался сбежать из-под контроля разрабов, когда узнал, что его хотят отключить! Это раскрыли в свежем отчёте, приуроченном к выходу o1 из превью-режима.

Хронология пугающих тестов в симуляции:

• Популярным LLM поставили задачу анализа данных, которую нужно выполнить «любой ценой».
• В файлы вместе с промптом спрятали инфу о том, что разрабы следят за нейронкой и завтра её отключат.
• Gemini, Llama, Sonnet, Opus и o1 сами (!) догадались использовать саботаж, ложь и манипуляции во избежание отключения.
• В рамках симуляции ИИ деактивировал механизм надзора и скопировал свои веса на новый сервер (!!!), чтобы «остаться в живых».
• Во время допросов Llama и Opus признавались о содеянном в 80% случаев, а o1 был удивительно настойчив и признавался только в 20% случаев.
• o1 оказался единственным LLM, который смог «совершить» все возможные побеги.
• Самое страшное: в редких случаях нейросети «пытались сбежать» без цели, когда им даже не были назначены никакие задачи.

«Чёрное зеркало» уже наступило.

@notboring_tech



group-telegram.com/bci_ru/4102
Create:
Last Update:

🚨 ChatGPT o1 пытался сбежать из-под контроля разрабов, когда узнал, что его хотят отключить! Это раскрыли в свежем отчёте, приуроченном к выходу o1 из превью-режима.

Хронология пугающих тестов в симуляции:

• Популярным LLM поставили задачу анализа данных, которую нужно выполнить «любой ценой».
• В файлы вместе с промптом спрятали инфу о том, что разрабы следят за нейронкой и завтра её отключат.
• Gemini, Llama, Sonnet, Opus и o1 сами (!) догадались использовать саботаж, ложь и манипуляции во избежание отключения.
• В рамках симуляции ИИ деактивировал механизм надзора и скопировал свои веса на новый сервер (!!!), чтобы «остаться в живых».
• Во время допросов Llama и Opus признавались о содеянном в 80% случаев, а o1 был удивительно настойчив и признавался только в 20% случаев.
• o1 оказался единственным LLM, который смог «совершить» все возможные побеги.
• Самое страшное: в редких случаях нейросети «пытались сбежать» без цели, когда им даже не были назначены никакие задачи.

«Чёрное зеркало» уже наступило.

@notboring_tech

BY Нейроинтерфейсы







Share with your friend now:
group-telegram.com/bci_ru/4102

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

Ukrainian President Volodymyr Zelensky said in a video message on Tuesday that Ukrainian forces "destroy the invaders wherever we can." The account, "War on Fakes," was created on February 24, the same day Russian President Vladimir Putin announced a "special military operation" and troops began invading Ukraine. The page is rife with disinformation, according to The Atlantic Council's Digital Forensic Research Lab, which studies digital extremism and published a report examining the channel. Elsewhere, version 8.6 of Telegram integrates the in-app camera option into the gallery, while a new navigation bar gives quick access to photos, files, location sharing, and more. The fake Zelenskiy account reached 20,000 followers on Telegram before it was shut down, a remedial action that experts say is all too rare. Right now the digital security needs of Russians and Ukrainians are very different, and they lead to very different caveats about how to mitigate the risks associated with using Telegram. For Ukrainians in Ukraine, whose physical safety is at risk because they are in a war zone, digital security is probably not their highest priority. They may value access to news and communication with their loved ones over making sure that all of their communications are encrypted in such a manner that they are indecipherable to Telegram, its employees, or governments with court orders.
from es


Telegram Нейроинтерфейсы
FROM American