Telegram Group & Telegram Channel
Forwarded from Not Boring Tech
🚨 ChatGPT o1 пытался сбежать из-под контроля разрабов, когда узнал, что его хотят отключить! Это раскрыли в свежем отчёте, приуроченном к выходу o1 из превью-режима.

Хронология пугающих тестов в симуляции:

• Популярным LLM поставили задачу анализа данных, которую нужно выполнить «любой ценой».
• В файлы вместе с промптом спрятали инфу о том, что разрабы следят за нейронкой и завтра её отключат.
• Gemini, Llama, Sonnet, Opus и o1 сами (!) догадались использовать саботаж, ложь и манипуляции во избежание отключения.
• В рамках симуляции ИИ деактивировал механизм надзора и скопировал свои веса на новый сервер (!!!), чтобы «остаться в живых».
• Во время допросов Llama и Opus признавались о содеянном в 80% случаев, а o1 был удивительно настойчив и признавался только в 20% случаев.
• o1 оказался единственным LLM, который смог «совершить» все возможные побеги.
• Самое страшное: в редких случаях нейросети «пытались сбежать» без цели, когда им даже не были назначены никакие задачи.

«Чёрное зеркало» уже наступило.

@notboring_tech



group-telegram.com/bci_ru/4100
Create:
Last Update:

🚨 ChatGPT o1 пытался сбежать из-под контроля разрабов, когда узнал, что его хотят отключить! Это раскрыли в свежем отчёте, приуроченном к выходу o1 из превью-режима.

Хронология пугающих тестов в симуляции:

• Популярным LLM поставили задачу анализа данных, которую нужно выполнить «любой ценой».
• В файлы вместе с промптом спрятали инфу о том, что разрабы следят за нейронкой и завтра её отключат.
• Gemini, Llama, Sonnet, Opus и o1 сами (!) догадались использовать саботаж, ложь и манипуляции во избежание отключения.
• В рамках симуляции ИИ деактивировал механизм надзора и скопировал свои веса на новый сервер (!!!), чтобы «остаться в живых».
• Во время допросов Llama и Opus признавались о содеянном в 80% случаев, а o1 был удивительно настойчив и признавался только в 20% случаев.
• o1 оказался единственным LLM, который смог «совершить» все возможные побеги.
• Самое страшное: в редких случаях нейросети «пытались сбежать» без цели, когда им даже не были назначены никакие задачи.

«Чёрное зеркало» уже наступило.

@notboring_tech

BY Нейроинтерфейсы







Share with your friend now:
group-telegram.com/bci_ru/4100

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

The gold standard of encryption, known as end-to-end encryption, where only the sender and person who receives the message are able to see it, is available on Telegram only when the Secret Chat function is enabled. Voice and video calls are also completely encrypted. Perpetrators of these scams will create a public group on Telegram to promote these investment packages that are usually accompanied by fake testimonies and sometimes advertised as being Shariah-compliant. Interested investors will be asked to directly message the representatives to begin investing in the various investment packages offered. Channels are not fully encrypted, end-to-end. All communications on a Telegram channel can be seen by anyone on the channel and are also visible to Telegram. Telegram may be asked by a government to hand over the communications from a channel. Telegram has a history of standing up to Russian government requests for data, but how comfortable you are relying on that history to predict future behavior is up to you. Because Telegram has this data, it may also be stolen by hackers or leaked by an internal employee. "For Telegram, accountability has always been a problem, which is why it was so popular even before the full-scale war with far-right extremists and terrorists from all over the world," she told AFP from her safe house outside the Ukrainian capital. The regulator took order for the search and seizure operation from Judge Purushottam B Jadhav, Sebi Special Judge / Additional Sessions Judge.
from sa


Telegram Нейроинтерфейсы
FROM American