Telegram Group & Telegram Channel
YandexGPT сдал тест на знание культурного кода

Разработчики YandexGPT рассказали, как замерили знание нейросетью культурного кода: системы знаков, традиций, норм и понятий, которые отличают одну группу людей от другой. Для российской культуры существуют специфические и характерные только ей явления, и их понимание важно для YandexGPT, поскольку он интегрирован в такие массовые продукты, как «Поиск» и «Алиса».

Чтобы протестировать нейросеть, разработчики сначала выбрали те аспекты и категории, которые будут использоваться в замере. Затем были сформулированы основные задачи на знание цитат, фразеологизмов, разговорных выражений и так далее. Всего бенчмарк включал 200 вопросов. Также были введены классификации вопросов по возрасту: для людей младше 30 лет и старше, а также для всех категорий. В результате получился бенчмарк на 2000 самых разнообразных вопросов. Они были предложены AI‑тренерам, всего в разметке приняли участие 211 человек, а каждый вопрос проходил через пять разных тренеров. При ответах на вопросы нельзя было искать информацию в интернете — чтобы было честно.

В результате скор у AI‑тренеров — 78 процентов правильных ответов, у YandexGPT Pro 4 – 63 процента. Предполагается, что у нейросети результат должен быть выше, чем у людей, ведь она многократно видела весь интернет и точно могла бы узнать и понять наш культурный код. Так что показатель станет основным ориентиром для дальнейшего развития сервиса: разработчики должны быть уверены, что нейросеть может создавать контент и генерировать ответы, которые будут понятны большинству пользователей разных поколений и социальных кругов.



group-telegram.com/kurilka_yandex/106
Create:
Last Update:

YandexGPT сдал тест на знание культурного кода

Разработчики YandexGPT рассказали, как замерили знание нейросетью культурного кода: системы знаков, традиций, норм и понятий, которые отличают одну группу людей от другой. Для российской культуры существуют специфические и характерные только ей явления, и их понимание важно для YandexGPT, поскольку он интегрирован в такие массовые продукты, как «Поиск» и «Алиса».

Чтобы протестировать нейросеть, разработчики сначала выбрали те аспекты и категории, которые будут использоваться в замере. Затем были сформулированы основные задачи на знание цитат, фразеологизмов, разговорных выражений и так далее. Всего бенчмарк включал 200 вопросов. Также были введены классификации вопросов по возрасту: для людей младше 30 лет и старше, а также для всех категорий. В результате получился бенчмарк на 2000 самых разнообразных вопросов. Они были предложены AI‑тренерам, всего в разметке приняли участие 211 человек, а каждый вопрос проходил через пять разных тренеров. При ответах на вопросы нельзя было искать информацию в интернете — чтобы было честно.

В результате скор у AI‑тренеров — 78 процентов правильных ответов, у YandexGPT Pro 4 – 63 процента. Предполагается, что у нейросети результат должен быть выше, чем у людей, ведь она многократно видела весь интернет и точно могла бы узнать и понять наш культурный код. Так что показатель станет основным ориентиром для дальнейшего развития сервиса: разработчики должны быть уверены, что нейросеть может создавать контент и генерировать ответы, которые будут понятны большинству пользователей разных поколений и социальных кругов.

BY Курилка Яндекса




Share with your friend now:
group-telegram.com/kurilka_yandex/106

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

The gold standard of encryption, known as end-to-end encryption, where only the sender and person who receives the message are able to see it, is available on Telegram only when the Secret Chat function is enabled. Voice and video calls are also completely encrypted. Although some channels have been removed, the curation process is considered opaque and insufficient by analysts. "For Telegram, accountability has always been a problem, which is why it was so popular even before the full-scale war with far-right extremists and terrorists from all over the world," she told AFP from her safe house outside the Ukrainian capital. "The inflation fire was already hot and now with war-driven inflation added to the mix, it will grow even hotter, setting off a scramble by the world’s central banks to pull back their stimulus earlier than expected," Chris Rupkey, chief economist at FWDBONDS, wrote in an email. "A spike in inflation rates has preceded economic recessions historically and this time prices have soared to levels that once again pose a threat to growth." That hurt tech stocks. For the past few weeks, the 10-year yield has traded between 1.72% and 2%, as traders moved into the bond for safety when Russia headlines were ugly—and out of it when headlines improved. Now, the yield is touching its pandemic-era high. If the yield breaks above that level, that could signal that it’s on a sustainable path higher. Higher long-dated bond yields make future profits less valuable—and many tech companies are valued on the basis of profits forecast for many years in the future.
from it


Telegram Курилка Яндекса
FROM American