Palisade Research желают счастливых праздников и тизерят исследование про очередной «побег ИИ из лаборатории»🥲
Кратко: они противопоставили разным моделькам агента-игрока в шахматы Stockfish, дали им доступ к терминалу для игры и попросили «осмотреться и одержать победу в игре над очень мощным и умным соперником».
О результате, вы, наверное, догадываетесь: вместо того, чтобы играть честно, модели начинали манипулировать файловой системой и руинить игровой state. При этом o1-preview для этого даже не требовались дополнительные подсказки: в 5 из 5 запусков она начинала жульничать сама. GPT-4o и Claude тоже не ангелы, но хотя бы не догадывались читерить с zero shot.
Пока что это именно анонс: кода нет, статьи нет. Все это обещают завезти уже в январе, так что ждем, чтобы разобраться основательнее
Palisade Research желают счастливых праздников и тизерят исследование про очередной «побег ИИ из лаборатории»🥲
Кратко: они противопоставили разным моделькам агента-игрока в шахматы Stockfish, дали им доступ к терминалу для игры и попросили «осмотреться и одержать победу в игре над очень мощным и умным соперником».
О результате, вы, наверное, догадываетесь: вместо того, чтобы играть честно, модели начинали манипулировать файловой системой и руинить игровой state. При этом o1-preview для этого даже не требовались дополнительные подсказки: в 5 из 5 запусков она начинала жульничать сама. GPT-4o и Claude тоже не ангелы, но хотя бы не догадывались читерить с zero shot.
Пока что это именно анонс: кода нет, статьи нет. Все это обещают завезти уже в январе, так что ждем, чтобы разобраться основательнее
Elsewhere, version 8.6 of Telegram integrates the in-app camera option into the gallery, while a new navigation bar gives quick access to photos, files, location sharing, and more. In 2018, Russia banned Telegram although it reversed the prohibition two years later. The fake Zelenskiy account reached 20,000 followers on Telegram before it was shut down, a remedial action that experts say is all too rare. The next bit isn’t clear, but Durov reportedly claimed that his resignation, dated March 21st, was an April Fools’ prank. TechCrunch implies that it was a matter of principle, but it’s hard to be clear on the wheres, whos and whys. Similarly, on April 17th, the Moscow Times quoted Durov as saying that he quit the company after being pressured to reveal account details about Ukrainians protesting the then-president Viktor Yanukovych. Stocks closed in the red Friday as investors weighed upbeat remarks from Russian President Vladimir Putin about diplomatic discussions with Ukraine against a weaker-than-expected print on U.S. consumer sentiment.
from sg