Telegram Group & Telegram Channel
Большие языковые модели умеют рассуждать

Модель психики «Думай медленно… решай быстро» оказалась верна не только для людей, но и для больших нейросетей. Вслед за интуитивными навыками они приобретают и аналитические. Рассказываем, как языковые модели решают математические и логические задачи, если немного «подумают».

Кратко: о чём статья?

Психолог Даниэл Канеман, автор книги «Думай медленно… решай быстро», считает, что психика человека содержит в себе две системы мышления – Систему 1 и Систему 2.

Система 1 срабатывает автоматически, практически мгновенно, требует мало усилий и не дает ощущения контроля. Эта система включается в ситуациях, которые вписываются в привычную картину мира человека. В незнакомых ситуациях Система 1 не способна дать ответ, как реагировать, и в этот момент включается Система 2. Система 2, в свою очередь, требует внимание, которое необходимо для сознательных умственных усилий.

Оказалось, что подобный механизм «размышлений» можно наблюдать и в работе больших языковых моделей. Можно «заставить» языковую модель включить Систему 2 и тем самым повысить качество решения задачи, не используя дополнительные обучающие данные.

Обычно модели подают формулировку задания и запрос на ответ. Например, модель можно попросить заполнить пропуск в запросе: «СССР развалился в году». Или же дать задание на перевод: «Кошка на французском будет ». При таких запросах у модели задействуется только Система 1.
Если же перед запросом ответа модель «попросить подумать», а потом подать на вход ей не только условие задания, но и собственные размышления, то будет задействована и Система 2, что приведёт к повышению качества ответов модели.

Посмотреть на наглядные и подробные примеры работы этого механизма и узнать, как модель может «запутать» сама себя, можно в статье на сайте.

Время чтения: 6,5 минут.



group-telegram.com/sysblok/511
Create:
Last Update:

Большие языковые модели умеют рассуждать

Модель психики «Думай медленно… решай быстро» оказалась верна не только для людей, но и для больших нейросетей. Вслед за интуитивными навыками они приобретают и аналитические. Рассказываем, как языковые модели решают математические и логические задачи, если немного «подумают».

Кратко: о чём статья?

Психолог Даниэл Канеман, автор книги «Думай медленно… решай быстро», считает, что психика человека содержит в себе две системы мышления – Систему 1 и Систему 2.

Система 1 срабатывает автоматически, практически мгновенно, требует мало усилий и не дает ощущения контроля. Эта система включается в ситуациях, которые вписываются в привычную картину мира человека. В незнакомых ситуациях Система 1 не способна дать ответ, как реагировать, и в этот момент включается Система 2. Система 2, в свою очередь, требует внимание, которое необходимо для сознательных умственных усилий.

Оказалось, что подобный механизм «размышлений» можно наблюдать и в работе больших языковых моделей. Можно «заставить» языковую модель включить Систему 2 и тем самым повысить качество решения задачи, не используя дополнительные обучающие данные.

Обычно модели подают формулировку задания и запрос на ответ. Например, модель можно попросить заполнить пропуск в запросе: «СССР развалился в году». Или же дать задание на перевод: «Кошка на французском будет ». При таких запросах у модели задействуется только Система 1.
Если же перед запросом ответа модель «попросить подумать», а потом подать на вход ей не только условие задания, но и собственные размышления, то будет задействована и Система 2, что приведёт к повышению качества ответов модели.

Посмотреть на наглядные и подробные примеры работы этого механизма и узнать, как модель может «запутать» сама себя, можно в статье на сайте.

Время чтения: 6,5 минут.

BY Системный Блокъ




Share with your friend now:
group-telegram.com/sysblok/511

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

Friday’s performance was part of a larger shift. For the week, the Dow, S&P 500 and Nasdaq fell 2%, 2.9%, and 3.5%, respectively. These administrators had built substantial positions in these scrips prior to the circulation of recommendations and offloaded their positions subsequent to rise in price of these scrips, making significant profits at the expense of unsuspecting investors, Sebi noted. Given the pro-privacy stance of the platform, it’s taken as a given that it’ll be used for a number of reasons, not all of them good. And Telegram has been attached to a fair few scandals related to terrorism, sexual exploitation and crime. Back in 2015, Vox described Telegram as “ISIS’ app of choice,” saying that the platform’s real use is the ability to use channels to distribute material to large groups at once. Telegram has acted to remove public channels affiliated with terrorism, but Pavel Durov reiterated that he had no business snooping on private conversations. Asked about its stance on disinformation, Telegram spokesperson Remi Vaughn told AFP: "As noted by our CEO, the sheer volume of information being shared on channels makes it extremely difficult to verify, so it's important that users double-check what they read."
from jp


Telegram Системный Блокъ
FROM American