Telegram Group & Telegram Channel
👨‍🏫🤖👩‍🏫Чтобы ответы нейросети были адекватными, полезными и максимально похожими на человеческие, её нужно обучать при помощи людей — AI-тренеров. В первую очередь, AI-тренер должен уметь работать с текстами, поэтому на эту должность часто приходят копирайтеры, редакторы, контент-менеджеры и лингвисты. Рассказываем, как такие люди помогают нейросетям становиться лучше.

• Пишут эталонные ответы на запросы
Идеальный ответ должен быть грамотным и структурированным, соответствовать нормам этики и чётко отвечать на запрос пользователя. Чем больше таких ответов показать нейросети, тем точнее будут её собственные. На начальном этапе любая модель обучается на текстах из интернета, но в качестве эталонных они не подходят, так как часто бывают низкого качества, могут содержать неверную информацию и иметь запутанную структуру. Поэтому AI-тренеры готовят часть ответов на разные вопросы, чтобы показать нейросети эталонные примеры и помочь ей составлять свои ответы по тому же принципу.

• Проверяют тексты, написанные нейросетью, на соответствие фактам
Языковые модели могут очень убедительно врать — этот феномен называется галлюцинациями нейросетей. Это происходит не потому, что кто-то хочет ввести пользователей в заблуждение. Языковые модели не могут осмыслить информацию и не способны делать самостоятельные выводы, они просто собирают ответы из наиболее подходящих слов. Одна из задач AI-тренера — проверить факты и показать модели, где правда, а где ложь.

• Оценивают и ранжируют ответы нейросетей
Модель генерирует несколько ответов на один и тот же запрос, а тренер даёт ей обратную связь. Он показывает, какие элементы ответа следует использовать в дальнейшем, а какие — нет. Так нейросеть может «понять», в каком направлении развиваться. Этот метод обучения называется RLHF (reinforcement learning with human feedback), что означает обучение с подкреплением на основе отзывов людей.

Подписывайтесь 👉@techno_yandex

Не пропускайте новости Яндекса тут @yandex



group-telegram.com/techno_yandex/1638
Create:
Last Update:

👨‍🏫🤖👩‍🏫Чтобы ответы нейросети были адекватными, полезными и максимально похожими на человеческие, её нужно обучать при помощи людей — AI-тренеров. В первую очередь, AI-тренер должен уметь работать с текстами, поэтому на эту должность часто приходят копирайтеры, редакторы, контент-менеджеры и лингвисты. Рассказываем, как такие люди помогают нейросетям становиться лучше.

• Пишут эталонные ответы на запросы
Идеальный ответ должен быть грамотным и структурированным, соответствовать нормам этики и чётко отвечать на запрос пользователя. Чем больше таких ответов показать нейросети, тем точнее будут её собственные. На начальном этапе любая модель обучается на текстах из интернета, но в качестве эталонных они не подходят, так как часто бывают низкого качества, могут содержать неверную информацию и иметь запутанную структуру. Поэтому AI-тренеры готовят часть ответов на разные вопросы, чтобы показать нейросети эталонные примеры и помочь ей составлять свои ответы по тому же принципу.

• Проверяют тексты, написанные нейросетью, на соответствие фактам
Языковые модели могут очень убедительно врать — этот феномен называется галлюцинациями нейросетей. Это происходит не потому, что кто-то хочет ввести пользователей в заблуждение. Языковые модели не могут осмыслить информацию и не способны делать самостоятельные выводы, они просто собирают ответы из наиболее подходящих слов. Одна из задач AI-тренера — проверить факты и показать модели, где правда, а где ложь.

• Оценивают и ранжируют ответы нейросетей
Модель генерирует несколько ответов на один и тот же запрос, а тренер даёт ей обратную связь. Он показывает, какие элементы ответа следует использовать в дальнейшем, а какие — нет. Так нейросеть может «понять», в каком направлении развиваться. Этот метод обучения называется RLHF (reinforcement learning with human feedback), что означает обучение с подкреплением на основе отзывов людей.

Подписывайтесь 👉@techno_yandex

Не пропускайте новости Яндекса тут @yandex

BY ТЕХНО: Яндекс про технологии




Share with your friend now:
group-telegram.com/techno_yandex/1638

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

One thing that Telegram now offers to all users is the ability to “disappear” messages or set remote deletion deadlines. That enables users to have much more control over how long people can access what you’re sending them. Given that Russian law enforcement officials are reportedly (via Insider) stopping people in the street and demanding to read their text messages, this could be vital to protect individuals from reprisals. Perpetrators of these scams will create a public group on Telegram to promote these investment packages that are usually accompanied by fake testimonies and sometimes advertised as being Shariah-compliant. Interested investors will be asked to directly message the representatives to begin investing in the various investment packages offered. After fleeing Russia, the brothers founded Telegram as a way to communicate outside the Kremlin's orbit. They now run it from Dubai, and Pavel Durov says it has more than 500 million monthly active users. In February 2014, the Ukrainian people ousted pro-Russian president Viktor Yanukovych, prompting Russia to invade and annex the Crimean peninsula. By the start of April, Pavel Durov had given his notice, with TechCrunch saying at the time that the CEO had resisted pressure to suppress pages criticizing the Russian government. Russian President Vladimir Putin launched Russia's invasion of Ukraine in the early-morning hours of February 24, targeting several key cities with military strikes.
from kr


Telegram ТЕХНО: Яндекс про технологии
FROM American