Telegram Group & Telegram Channel
Большие языковые модели умеют рассуждать

Модель психики «Думай медленно… решай быстро» оказалась верна не только для людей, но и для больших нейросетей. Вслед за интуитивными навыками они приобретают и аналитические. Рассказываем, как языковые модели решают математические и логические задачи, если немного «подумают».

Кратко: о чём статья?

Психолог Даниэл Канеман, автор книги «Думай медленно… решай быстро», считает, что психика человека содержит в себе две системы мышления – Систему 1 и Систему 2.

Система 1 срабатывает автоматически, практически мгновенно, требует мало усилий и не дает ощущения контроля. Эта система включается в ситуациях, которые вписываются в привычную картину мира человека. В незнакомых ситуациях Система 1 не способна дать ответ, как реагировать, и в этот момент включается Система 2. Система 2, в свою очередь, требует внимание, которое необходимо для сознательных умственных усилий.

Оказалось, что подобный механизм «размышлений» можно наблюдать и в работе больших языковых моделей. Можно «заставить» языковую модель включить Систему 2 и тем самым повысить качество решения задачи, не используя дополнительные обучающие данные.

Обычно модели подают формулировку задания и запрос на ответ. Например, модель можно попросить заполнить пропуск в запросе: «СССР развалился в году». Или же дать задание на перевод: «Кошка на французском будет ». При таких запросах у модели задействуется только Система 1.
Если же перед запросом ответа модель «попросить подумать», а потом подать на вход ей не только условие задания, но и собственные размышления, то будет задействована и Система 2, что приведёт к повышению качества ответов модели.

Посмотреть на наглядные и подробные примеры работы этого механизма и узнать, как модель может «запутать» сама себя, можно в статье на сайте.

Время чтения: 6,5 минут.



group-telegram.com/sysblok/511
Create:
Last Update:

Большие языковые модели умеют рассуждать

Модель психики «Думай медленно… решай быстро» оказалась верна не только для людей, но и для больших нейросетей. Вслед за интуитивными навыками они приобретают и аналитические. Рассказываем, как языковые модели решают математические и логические задачи, если немного «подумают».

Кратко: о чём статья?

Психолог Даниэл Канеман, автор книги «Думай медленно… решай быстро», считает, что психика человека содержит в себе две системы мышления – Систему 1 и Систему 2.

Система 1 срабатывает автоматически, практически мгновенно, требует мало усилий и не дает ощущения контроля. Эта система включается в ситуациях, которые вписываются в привычную картину мира человека. В незнакомых ситуациях Система 1 не способна дать ответ, как реагировать, и в этот момент включается Система 2. Система 2, в свою очередь, требует внимание, которое необходимо для сознательных умственных усилий.

Оказалось, что подобный механизм «размышлений» можно наблюдать и в работе больших языковых моделей. Можно «заставить» языковую модель включить Систему 2 и тем самым повысить качество решения задачи, не используя дополнительные обучающие данные.

Обычно модели подают формулировку задания и запрос на ответ. Например, модель можно попросить заполнить пропуск в запросе: «СССР развалился в году». Или же дать задание на перевод: «Кошка на французском будет ». При таких запросах у модели задействуется только Система 1.
Если же перед запросом ответа модель «попросить подумать», а потом подать на вход ей не только условие задания, но и собственные размышления, то будет задействована и Система 2, что приведёт к повышению качества ответов модели.

Посмотреть на наглядные и подробные примеры работы этого механизма и узнать, как модель может «запутать» сама себя, можно в статье на сайте.

Время чтения: 6,5 минут.

BY Системный Блокъ




Share with your friend now:
group-telegram.com/sysblok/511

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

False news often spreads via public groups, or chats, with potentially fatal effects. But the Ukraine Crisis Media Center's Tsekhanovska points out that communications are often down in zones most affected by the war, making this sort of cross-referencing a luxury many cannot afford. Some privacy experts say Telegram is not secure enough Investors took profits on Friday while they could ahead of the weekend, explained Tom Essaye, founder of Sevens Report Research. Saturday and Sunday could easily bring unfortunate news on the war front—and traders would rather be able to sell any recent winnings at Friday’s earlier prices than wait for a potentially lower price at Monday’s open. Also in the latest update is the ability for users to create a unique @username from the Settings page, providing others with an easy way to contact them via Search or their t.me/username link without sharing their phone number.
from ua


Telegram Системный Блокъ
FROM American