Telegram Group & Telegram Channel
YandexGPT сдал тест на знание культурного кода

Разработчики YandexGPT рассказали, как замерили знание нейросетью культурного кода: системы знаков, традиций, норм и понятий, которые отличают одну группу людей от другой. Для российской культуры существуют специфические и характерные только ей явления, и их понимание важно для YandexGPT, поскольку он интегрирован в такие массовые продукты, как «Поиск» и «Алиса».

Чтобы протестировать нейросеть, разработчики сначала выбрали те аспекты и категории, которые будут использоваться в замере. Затем были сформулированы основные задачи на знание цитат, фразеологизмов, разговорных выражений и так далее. Всего бенчмарк включал 200 вопросов. Также были введены классификации вопросов по возрасту: для людей младше 30 лет и старше, а также для всех категорий. В результате получился бенчмарк на 2000 самых разнообразных вопросов. Они были предложены AI‑тренерам, всего в разметке приняли участие 211 человек, а каждый вопрос проходил через пять разных тренеров. При ответах на вопросы нельзя было искать информацию в интернете — чтобы было честно.

В результате скор у AI‑тренеров — 78 процентов правильных ответов, у YandexGPT Pro 4 – 63 процента. Предполагается, что у нейросети результат должен быть выше, чем у людей, ведь она многократно видела весь интернет и точно могла бы узнать и понять наш культурный код. Так что показатель станет основным ориентиром для дальнейшего развития сервиса: разработчики должны быть уверены, что нейросеть может создавать контент и генерировать ответы, которые будут понятны большинству пользователей разных поколений и социальных кругов.



group-telegram.com/kurilka_yandex/106
Create:
Last Update:

YandexGPT сдал тест на знание культурного кода

Разработчики YandexGPT рассказали, как замерили знание нейросетью культурного кода: системы знаков, традиций, норм и понятий, которые отличают одну группу людей от другой. Для российской культуры существуют специфические и характерные только ей явления, и их понимание важно для YandexGPT, поскольку он интегрирован в такие массовые продукты, как «Поиск» и «Алиса».

Чтобы протестировать нейросеть, разработчики сначала выбрали те аспекты и категории, которые будут использоваться в замере. Затем были сформулированы основные задачи на знание цитат, фразеологизмов, разговорных выражений и так далее. Всего бенчмарк включал 200 вопросов. Также были введены классификации вопросов по возрасту: для людей младше 30 лет и старше, а также для всех категорий. В результате получился бенчмарк на 2000 самых разнообразных вопросов. Они были предложены AI‑тренерам, всего в разметке приняли участие 211 человек, а каждый вопрос проходил через пять разных тренеров. При ответах на вопросы нельзя было искать информацию в интернете — чтобы было честно.

В результате скор у AI‑тренеров — 78 процентов правильных ответов, у YandexGPT Pro 4 – 63 процента. Предполагается, что у нейросети результат должен быть выше, чем у людей, ведь она многократно видела весь интернет и точно могла бы узнать и понять наш культурный код. Так что показатель станет основным ориентиром для дальнейшего развития сервиса: разработчики должны быть уверены, что нейросеть может создавать контент и генерировать ответы, которые будут понятны большинству пользователей разных поколений и социальных кругов.

BY Курилка Яндекса




Share with your friend now:
group-telegram.com/kurilka_yandex/106

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

The account, "War on Fakes," was created on February 24, the same day Russian President Vladimir Putin announced a "special military operation" and troops began invading Ukraine. The page is rife with disinformation, according to The Atlantic Council's Digital Forensic Research Lab, which studies digital extremism and published a report examining the channel. Such instructions could actually endanger people — citizens receive air strike warnings via smartphone alerts. As such, the SC would like to remind investors to always exercise caution when evaluating investment opportunities, especially those promising unrealistically high returns with little or no risk. Investors should also never deposit money into someone’s personal bank account if instructed. Just days after Russia invaded Ukraine, Durov wrote that Telegram was "increasingly becoming a source of unverified information," and he worried about the app being used to "incite ethnic hatred." Apparently upbeat developments in Russia's discussions with Ukraine helped at least temporarily send investors back into risk assets. Russian President Vladimir Putin said during a meeting with his Belarusian counterpart Alexander Lukashenko that there were "certain positive developments" occurring in the talks with Ukraine, according to a transcript of their meeting. Putin added that discussions were happening "almost on a daily basis."
from id


Telegram Курилка Яндекса
FROM American