Telegram Group & Telegram Channel
Palisade Research желают счастливых праздников и тизерят исследование про очередной «побег ИИ из лаборатории» 🥲

Кратко: они противопоставили разным моделькам агента-игрока в шахматы Stockfish, дали им доступ к терминалу для игры и попросили «осмотреться и одержать победу в игре над очень мощным и умным соперником».

О результате, вы, наверное, догадываетесь: вместо того, чтобы играть честно, модели начинали манипулировать файловой системой и руинить игровой state. При этом o1-preview для этого даже не требовались дополнительные подсказки: в 5 из 5 запусков она начинала жульничать сама. GPT-4o и Claude тоже не ангелы, но хотя бы не догадывались читерить с zero shot.

Пока что это именно анонс: кода нет, статьи нет. Все это обещают завезти уже в январе, так что ждем, чтобы разобраться основательнее
Please open Telegram to view this post
VIEW IN TELEGRAM



group-telegram.com/data_secrets/5835
Create:
Last Update:

Palisade Research желают счастливых праздников и тизерят исследование про очередной «побег ИИ из лаборатории» 🥲

Кратко: они противопоставили разным моделькам агента-игрока в шахматы Stockfish, дали им доступ к терминалу для игры и попросили «осмотреться и одержать победу в игре над очень мощным и умным соперником».

О результате, вы, наверное, догадываетесь: вместо того, чтобы играть честно, модели начинали манипулировать файловой системой и руинить игровой state. При этом o1-preview для этого даже не требовались дополнительные подсказки: в 5 из 5 запусков она начинала жульничать сама. GPT-4o и Claude тоже не ангелы, но хотя бы не догадывались читерить с zero shot.

Пока что это именно анонс: кода нет, статьи нет. Все это обещают завезти уже в январе, так что ждем, чтобы разобраться основательнее

BY Data Secrets




Share with your friend now:
group-telegram.com/data_secrets/5835

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

The Security Service of Ukraine said in a tweet that it was able to effectively target Russian convoys near Kyiv because of messages sent to an official Telegram bot account called "STOP Russian War." Continuing its crackdown against entities allegedly involved in a front-running scam using messaging app Telegram, Sebi on Thursday carried out search and seizure operations at the premises of eight entities in multiple locations across the country. Telegram has gained a reputation as the “secure” communications app in the post-Soviet states, but whenever you make choices about your digital security, it’s important to start by asking yourself, “What exactly am I securing? And who am I securing it from?” These questions should inform your decisions about whether you are using the right tool or platform for your digital security needs. Telegram is certainly not the most secure messaging app on the market right now. Its security model requires users to place a great deal of trust in Telegram’s ability to protect user data. For some users, this may be good enough for now. For others, it may be wiser to move to a different platform for certain kinds of high-risk communications. It is unclear who runs the account, although Russia's official Ministry of Foreign Affairs Twitter account promoted the Telegram channel on Saturday and claimed it was operated by "a group of experts & journalists." For tech stocks, “the main thing is yields,” Essaye said.
from nl


Telegram Data Secrets
FROM American