Telegram Group & Telegram Channel
YandexGPT сдал тест на знание культурного кода

Разработчики YandexGPT рассказали, как замерили знание нейросетью культурного кода: системы знаков, традиций, норм и понятий, которые отличают одну группу людей от другой. Для российской культуры существуют специфические и характерные только ей явления, и их понимание важно для YandexGPT, поскольку он интегрирован в такие массовые продукты, как «Поиск» и «Алиса».

Чтобы протестировать нейросеть, разработчики сначала выбрали те аспекты и категории, которые будут использоваться в замере. Затем были сформулированы основные задачи на знание цитат, фразеологизмов, разговорных выражений и так далее. Всего бенчмарк включал 200 вопросов. Также были введены классификации вопросов по возрасту: для людей младше 30 лет и старше, а также для всех категорий. В результате получился бенчмарк на 2000 самых разнообразных вопросов. Они были предложены AI‑тренерам, всего в разметке приняли участие 211 человек, а каждый вопрос проходил через пять разных тренеров. При ответах на вопросы нельзя было искать информацию в интернете — чтобы было честно.

В результате скор у AI‑тренеров — 78 процентов правильных ответов, у YandexGPT Pro 4 – 63 процента. Предполагается, что у нейросети результат должен быть выше, чем у людей, ведь она многократно видела весь интернет и точно могла бы узнать и понять наш культурный код. Так что показатель станет основным ориентиром для дальнейшего развития сервиса: разработчики должны быть уверены, что нейросеть может создавать контент и генерировать ответы, которые будут понятны большинству пользователей разных поколений и социальных кругов.



group-telegram.com/kurilka_yandex/106
Create:
Last Update:

YandexGPT сдал тест на знание культурного кода

Разработчики YandexGPT рассказали, как замерили знание нейросетью культурного кода: системы знаков, традиций, норм и понятий, которые отличают одну группу людей от другой. Для российской культуры существуют специфические и характерные только ей явления, и их понимание важно для YandexGPT, поскольку он интегрирован в такие массовые продукты, как «Поиск» и «Алиса».

Чтобы протестировать нейросеть, разработчики сначала выбрали те аспекты и категории, которые будут использоваться в замере. Затем были сформулированы основные задачи на знание цитат, фразеологизмов, разговорных выражений и так далее. Всего бенчмарк включал 200 вопросов. Также были введены классификации вопросов по возрасту: для людей младше 30 лет и старше, а также для всех категорий. В результате получился бенчмарк на 2000 самых разнообразных вопросов. Они были предложены AI‑тренерам, всего в разметке приняли участие 211 человек, а каждый вопрос проходил через пять разных тренеров. При ответах на вопросы нельзя было искать информацию в интернете — чтобы было честно.

В результате скор у AI‑тренеров — 78 процентов правильных ответов, у YandexGPT Pro 4 – 63 процента. Предполагается, что у нейросети результат должен быть выше, чем у людей, ведь она многократно видела весь интернет и точно могла бы узнать и понять наш культурный код. Так что показатель станет основным ориентиром для дальнейшего развития сервиса: разработчики должны быть уверены, что нейросеть может создавать контент и генерировать ответы, которые будут понятны большинству пользователей разных поколений и социальных кругов.

BY Курилка Яндекса




Share with your friend now:
group-telegram.com/kurilka_yandex/106

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

These administrators had built substantial positions in these scrips prior to the circulation of recommendations and offloaded their positions subsequent to rise in price of these scrips, making significant profits at the expense of unsuspecting investors, Sebi noted. There was another possible development: Reuters also reported that Ukraine said that Belarus could soon join the invasion of Ukraine. However, the AFP, citing a Pentagon official, said the U.S. hasn’t yet seen evidence that Belarusian troops are in Ukraine. Just days after Russia invaded Ukraine, Durov wrote that Telegram was "increasingly becoming a source of unverified information," and he worried about the app being used to "incite ethnic hatred." Elsewhere, version 8.6 of Telegram integrates the in-app camera option into the gallery, while a new navigation bar gives quick access to photos, files, location sharing, and more. The last couple days have exemplified that uncertainty. On Thursday, news emerged that talks in Turkey between the Russia and Ukraine yielded no positive result. But on Friday, Reuters reported that Russian President Vladimir Putin said there had been some “positive shifts” in talks between the two sides.
from ye


Telegram Курилка Яндекса
FROM American