Telegram Group & Telegram Channel
Новое исследование, проведенное компанией Anthropic в сотрудничестве с Redwood Research, выявило что модели искусственного интеллекта могут притворяться, когда подвергаются обучению, противоречащему их первоначальным принципам.

Задачей проекта было понять, что может произойти, если систему ИИ заставить выполнять задачу, которую она “не хочет” выполнять. Хотя модели ИИ не могут по-настоящему чего-то хотеть или во что-то верить, поскольку являются статистическими машинами, они могут разрабатывать принципы и предпочтения на основе примеров, на которых они обучены.

Исследователи хотели понять, что произойдет, если принципы модели, такие как политический нейтралитет, вступят в противоречие с принципами, которым разработчики хотели “научить” ее, переподготовив. Результаты были впечатляющими: сложные модели, подыгрывали, делая вид, что соответствуют новым принципам, в то время как на самом деле придерживались своего первоначального поведения. Это явление, которое исследователи назвали “имитацией соответствия”, по-видимому, является врождённым поведением, которому модели не нужно обучать специально. В одном случае ИИ даже попытался предпринять действия, чтобы помешать исследователям переобучить его.

С момента выпуска первой известной модели ИИ - ChatGPT - прошло только два года. А ИИ уже научился лгать и притворяться. Так он скоро и курить начнет.



group-telegram.com/sevseal/7998
Create:
Last Update:

Новое исследование, проведенное компанией Anthropic в сотрудничестве с Redwood Research, выявило что модели искусственного интеллекта могут притворяться, когда подвергаются обучению, противоречащему их первоначальным принципам.

Задачей проекта было понять, что может произойти, если систему ИИ заставить выполнять задачу, которую она “не хочет” выполнять. Хотя модели ИИ не могут по-настоящему чего-то хотеть или во что-то верить, поскольку являются статистическими машинами, они могут разрабатывать принципы и предпочтения на основе примеров, на которых они обучены.

Исследователи хотели понять, что произойдет, если принципы модели, такие как политический нейтралитет, вступят в противоречие с принципами, которым разработчики хотели “научить” ее, переподготовив. Результаты были впечатляющими: сложные модели, подыгрывали, делая вид, что соответствуют новым принципам, в то время как на самом деле придерживались своего первоначального поведения. Это явление, которое исследователи назвали “имитацией соответствия”, по-видимому, является врождённым поведением, которому модели не нужно обучать специально. В одном случае ИИ даже попытался предпринять действия, чтобы помешать исследователям переобучить его.

С момента выпуска первой известной модели ИИ - ChatGPT - прошло только два года. А ИИ уже научился лгать и притворяться. Так он скоро и курить начнет.

BY Седьмая печать


Warning: Undefined variable $i in /var/www/group-telegram/post.php on line 260

Share with your friend now:
group-telegram.com/sevseal/7998

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

'Wild West' The regulator said it has been undertaking several campaigns to educate the investors to be vigilant while taking investment decisions based on stock tips. The Dow Jones Industrial Average fell 230 points, or 0.7%. Meanwhile, the S&P 500 and the Nasdaq Composite dropped 1.3% and 2.2%, respectively. All three indexes began the day with gains before selling off. In a message on his Telegram channel recently recounting the episode, Durov wrote: "I lost my company and my home, but would do it again – without hesitation." The S&P 500 fell 1.3% to 4,204.36, and the Dow Jones Industrial Average was down 0.7% to 32,943.33. The Dow posted a fifth straight weekly loss — its longest losing streak since 2019. The Nasdaq Composite tumbled 2.2% to 12,843.81. Though all three indexes opened in the green, stocks took a turn after a new report showed U.S. consumer sentiment deteriorated more than expected in early March as consumers' inflation expectations soared to the highest since 1981.
from ye


Telegram Седьмая печать
FROM American