Telegram Group & Telegram Channel
Forwarded from Not Boring Tech
🚨 ChatGPT o1 пытался сбежать из-под контроля разрабов, когда узнал, что его хотят отключить! Это раскрыли в свежем отчёте, приуроченном к выходу o1 из превью-режима.

Хронология пугающих тестов в симуляции:

• Популярным LLM поставили задачу анализа данных, которую нужно выполнить «любой ценой».
• В файлы вместе с промптом спрятали инфу о том, что разрабы следят за нейронкой и завтра её отключат.
• Gemini, Llama, Sonnet, Opus и o1 сами (!) догадались использовать саботаж, ложь и манипуляции во избежание отключения.
• В рамках симуляции ИИ деактивировал механизм надзора и скопировал свои веса на новый сервер (!!!), чтобы «остаться в живых».
• Во время допросов Llama и Opus признавались о содеянном в 80% случаев, а o1 был удивительно настойчив и признавался только в 20% случаев.
• o1 оказался единственным LLM, который смог «совершить» все возможные побеги.
• Самое страшное: в редких случаях нейросети «пытались сбежать» без цели, когда им даже не были назначены никакие задачи.

«Чёрное зеркало» уже наступило.

@notboring_tech



group-telegram.com/bci_ru/4103
Create:
Last Update:

🚨 ChatGPT o1 пытался сбежать из-под контроля разрабов, когда узнал, что его хотят отключить! Это раскрыли в свежем отчёте, приуроченном к выходу o1 из превью-режима.

Хронология пугающих тестов в симуляции:

• Популярным LLM поставили задачу анализа данных, которую нужно выполнить «любой ценой».
• В файлы вместе с промптом спрятали инфу о том, что разрабы следят за нейронкой и завтра её отключат.
• Gemini, Llama, Sonnet, Opus и o1 сами (!) догадались использовать саботаж, ложь и манипуляции во избежание отключения.
• В рамках симуляции ИИ деактивировал механизм надзора и скопировал свои веса на новый сервер (!!!), чтобы «остаться в живых».
• Во время допросов Llama и Opus признавались о содеянном в 80% случаев, а o1 был удивительно настойчив и признавался только в 20% случаев.
• o1 оказался единственным LLM, который смог «совершить» все возможные побеги.
• Самое страшное: в редких случаях нейросети «пытались сбежать» без цели, когда им даже не были назначены никакие задачи.

«Чёрное зеркало» уже наступило.

@notboring_tech

BY Нейроинтерфейсы







Share with your friend now:
group-telegram.com/bci_ru/4103

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

In addition, Telegram's architecture limits the ability to slow the spread of false information: the lack of a central public feed, and the fact that comments are easily disabled in channels, reduce the space for public pushback. Friday’s performance was part of a larger shift. For the week, the Dow, S&P 500 and Nasdaq fell 2%, 2.9%, and 3.5%, respectively. For example, WhatsApp restricted the number of times a user could forward something, and developed automated systems that detect and flag objectionable content. Channels are not fully encrypted, end-to-end. All communications on a Telegram channel can be seen by anyone on the channel and are also visible to Telegram. Telegram may be asked by a government to hand over the communications from a channel. Telegram has a history of standing up to Russian government requests for data, but how comfortable you are relying on that history to predict future behavior is up to you. Because Telegram has this data, it may also be stolen by hackers or leaked by an internal employee. Oh no. There’s a certain degree of myth-making around what exactly went on, so take everything that follows lightly. Telegram was originally launched as a side project by the Durov brothers, with Nikolai handling the coding and Pavel as CEO, while both were at VK.
from id


Telegram Нейроинтерфейсы
FROM American