group-telegram.com/abstractDL/169
Last Update:
Chain-of-Thought: дайте GPT поразмышлять перед ответом! (by Google)
Большинство промптов для zero-shot нацелены на немедленное получение ответа, но оказалось, если дать языковой модели «поразмышлять вслух» над задачей, то вероятность правильного решения значительно повышается.
Теперь это кажется чертовски логичным! Ведь требовать ответ сразу без возможности подумать это слишком жестоко даже для людей 😅
Добавление простого «Lets think step-by-step» промпта позволило языковой модели PaLM обойти человека на 10 из 23 задач Big-Bench! Думаю, что chain-of-thought подход теперь должен стать общепринятым.
А ещё Google выпустил мультиязычную модель Flan-T5-xxl, которая дополнительно затюнена под этот промпт + лосс из UL2.
P.S. На скриншоте результат генерации для GPT-j.
Статья
BY AbstractDL
Share with your friend now:
group-telegram.com/abstractDL/169