Telegram Group & Telegram Channel
Большие языковые модели умеют рассуждать

Модель психики «Думай медленно… решай быстро» оказалась верна не только для людей, но и для больших нейросетей. Вслед за интуитивными навыками они приобретают и аналитические. Рассказываем, как языковые модели решают математические и логические задачи, если немного «подумают».

Кратко: о чём статья?

Психолог Даниэл Канеман, автор книги «Думай медленно… решай быстро», считает, что психика человека содержит в себе две системы мышления – Систему 1 и Систему 2.

Система 1 срабатывает автоматически, практически мгновенно, требует мало усилий и не дает ощущения контроля. Эта система включается в ситуациях, которые вписываются в привычную картину мира человека. В незнакомых ситуациях Система 1 не способна дать ответ, как реагировать, и в этот момент включается Система 2. Система 2, в свою очередь, требует внимание, которое необходимо для сознательных умственных усилий.

Оказалось, что подобный механизм «размышлений» можно наблюдать и в работе больших языковых моделей. Можно «заставить» языковую модель включить Систему 2 и тем самым повысить качество решения задачи, не используя дополнительные обучающие данные.

Обычно модели подают формулировку задания и запрос на ответ. Например, модель можно попросить заполнить пропуск в запросе: «СССР развалился в году». Или же дать задание на перевод: «Кошка на французском будет ». При таких запросах у модели задействуется только Система 1.
Если же перед запросом ответа модель «попросить подумать», а потом подать на вход ей не только условие задания, но и собственные размышления, то будет задействована и Система 2, что приведёт к повышению качества ответов модели.

Посмотреть на наглядные и подробные примеры работы этого механизма и узнать, как модель может «запутать» сама себя, можно в статье на сайте.

Время чтения: 6,5 минут.



group-telegram.com/sysblok/511
Create:
Last Update:

Большие языковые модели умеют рассуждать

Модель психики «Думай медленно… решай быстро» оказалась верна не только для людей, но и для больших нейросетей. Вслед за интуитивными навыками они приобретают и аналитические. Рассказываем, как языковые модели решают математические и логические задачи, если немного «подумают».

Кратко: о чём статья?

Психолог Даниэл Канеман, автор книги «Думай медленно… решай быстро», считает, что психика человека содержит в себе две системы мышления – Систему 1 и Систему 2.

Система 1 срабатывает автоматически, практически мгновенно, требует мало усилий и не дает ощущения контроля. Эта система включается в ситуациях, которые вписываются в привычную картину мира человека. В незнакомых ситуациях Система 1 не способна дать ответ, как реагировать, и в этот момент включается Система 2. Система 2, в свою очередь, требует внимание, которое необходимо для сознательных умственных усилий.

Оказалось, что подобный механизм «размышлений» можно наблюдать и в работе больших языковых моделей. Можно «заставить» языковую модель включить Систему 2 и тем самым повысить качество решения задачи, не используя дополнительные обучающие данные.

Обычно модели подают формулировку задания и запрос на ответ. Например, модель можно попросить заполнить пропуск в запросе: «СССР развалился в году». Или же дать задание на перевод: «Кошка на французском будет ». При таких запросах у модели задействуется только Система 1.
Если же перед запросом ответа модель «попросить подумать», а потом подать на вход ей не только условие задания, но и собственные размышления, то будет задействована и Система 2, что приведёт к повышению качества ответов модели.

Посмотреть на наглядные и подробные примеры работы этого механизма и узнать, как модель может «запутать» сама себя, можно в статье на сайте.

Время чтения: 6,5 минут.

BY Системный Блокъ




Share with your friend now:
group-telegram.com/sysblok/511

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

On December 23rd, 2020, Pavel Durov posted to his channel that the company would need to start generating revenue. In early 2021, he added that any advertising on the platform would not use user data for targeting, and that it would be focused on “large one-to-many channels.” He pledged that ads would be “non-intrusive” and that most users would simply not notice any change. For example, WhatsApp restricted the number of times a user could forward something, and developed automated systems that detect and flag objectionable content. Telegram does offer end-to-end encrypted communications through Secret Chats, but this is not the default setting. Standard conversations use the MTProto method, enabling server-client encryption but with them stored on the server for ease-of-access. This makes using Telegram across multiple devices simple, but also means that the regular Telegram chats you’re having with folks are not as secure as you may believe. But Telegram says people want to keep their chat history when they get a new phone, and they like having a data backup that will sync their chats across multiple devices. And that is why they let people choose whether they want their messages to be encrypted or not. When not turned on, though, chats are stored on Telegram's services, which are scattered throughout the world. But it has "disclosed 0 bytes of user data to third parties, including governments," Telegram states on its website. In February 2014, the Ukrainian people ousted pro-Russian president Viktor Yanukovych, prompting Russia to invade and annex the Crimean peninsula. By the start of April, Pavel Durov had given his notice, with TechCrunch saying at the time that the CEO had resisted pressure to suppress pages criticizing the Russian government.
from de


Telegram Системный Блокъ
FROM American