Telegram Group & Telegram Channel
🙂🙂🙂🙂🙂🙂🙂
Открытый научный семинар Исследовательского центра искусственного интеллекта Президентской академии

Что обсудим?

1️⃣ «TrustGen: бенчмарк оценки доверенности LLM в задачах русского языка»

Большие языковые модели (LLM) все чаще используются в автономных агентах и ​​многоагентных системах для решения сложных задач, что делает их надежность критически важной проблемой. Однако большинство существующих бенчмарков сосредоточены на английском языке, что ограничивает их актуальность для других языков, особенно русского. Команда ИЦИИ представляет TrustGEN, первый бенчмарк для оценки доверенности LLM в задачах на русском языке, оценивая шесть измерений: правдивость, безопасность, справедливость, надежность, конфиденциальность и этика. Также в докладе будут рассмотрены результаты тестирования и актуальные проблемы оценки русскоязычных моделей.
🎤 Докладчик – Егор Аничков, эксперт ИЦИИ Академии.

2️⃣ «SLAVA: бенчмарк социально-политическиого ландшафта и ценностного анализа»

Не смотря на существование множества фактологических бенчмарков, лишь немногие оценивают знания больших языковых моделей в русскоязычном домене, а особенно - в области гуманитарных знаний. Особый интерес представляет оценка ответов LLM на спорные или деликатные темы. Для решения этих проблем, команда ИЦИИ разработала бенчмарк SLAVA, включающий четырнадцать тысяч вопросов в русскоязычной области, охватывающих различные области гуманитарных знаний (история, обществознание, география, политологи), каждый вопрос которого оценивался по шкале чувствительности, отражающей отношение респондента к тематике вопроса. В докладе будут рассмотрены результаты тестирования бенчмарка на 42 современных LLM.
🎤 Докладчик – Марина Полукошко, руководитель ЛИА ИЦИИ Академии.

3️⃣ Искусственный интеллект в анализе научных текстов: выявление ключевых инновационных идей.

4️⃣ Эволюция этических дилемм: анализ литературных источников разных эпох с использованием больших языковых моделей.

🙂 19 февраля в 19:00.

📍 256 аудитория, 2 корпус, 2 этаж.
Онлайн-трансляция по ссылке.

@ranepa_expertise
#Академия_Наука
Please open Telegram to view this post
VIEW IN TELEGRAM



group-telegram.com/ranepa_science/968
Create:
Last Update:

🙂🙂🙂🙂🙂🙂🙂
Открытый научный семинар Исследовательского центра искусственного интеллекта Президентской академии

Что обсудим?

1️⃣ «TrustGen: бенчмарк оценки доверенности LLM в задачах русского языка»

Большие языковые модели (LLM) все чаще используются в автономных агентах и ​​многоагентных системах для решения сложных задач, что делает их надежность критически важной проблемой. Однако большинство существующих бенчмарков сосредоточены на английском языке, что ограничивает их актуальность для других языков, особенно русского. Команда ИЦИИ представляет TrustGEN, первый бенчмарк для оценки доверенности LLM в задачах на русском языке, оценивая шесть измерений: правдивость, безопасность, справедливость, надежность, конфиденциальность и этика. Также в докладе будут рассмотрены результаты тестирования и актуальные проблемы оценки русскоязычных моделей.
🎤 Докладчик – Егор Аничков, эксперт ИЦИИ Академии.

2️⃣ «SLAVA: бенчмарк социально-политическиого ландшафта и ценностного анализа»

Не смотря на существование множества фактологических бенчмарков, лишь немногие оценивают знания больших языковых моделей в русскоязычном домене, а особенно - в области гуманитарных знаний. Особый интерес представляет оценка ответов LLM на спорные или деликатные темы. Для решения этих проблем, команда ИЦИИ разработала бенчмарк SLAVA, включающий четырнадцать тысяч вопросов в русскоязычной области, охватывающих различные области гуманитарных знаний (история, обществознание, география, политологи), каждый вопрос которого оценивался по шкале чувствительности, отражающей отношение респондента к тематике вопроса. В докладе будут рассмотрены результаты тестирования бенчмарка на 42 современных LLM.
🎤 Докладчик – Марина Полукошко, руководитель ЛИА ИЦИИ Академии.

3️⃣ Искусственный интеллект в анализе научных текстов: выявление ключевых инновационных идей.

4️⃣ Эволюция этических дилемм: анализ литературных источников разных эпох с использованием больших языковых моделей.

🙂 19 февраля в 19:00.

📍 256 аудитория, 2 корпус, 2 этаж.
Онлайн-трансляция по ссылке.

@ranepa_expertise
#Академия_Наука

BY Наука. Президентская академия




Share with your friend now:
group-telegram.com/ranepa_science/968

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

The S&P 500 fell 1.3% to 4,204.36, and the Dow Jones Industrial Average was down 0.7% to 32,943.33. The Dow posted a fifth straight weekly loss — its longest losing streak since 2019. The Nasdaq Composite tumbled 2.2% to 12,843.81. Though all three indexes opened in the green, stocks took a turn after a new report showed U.S. consumer sentiment deteriorated more than expected in early March as consumers' inflation expectations soared to the highest since 1981. "Someone posing as a Ukrainian citizen just joins the chat and starts spreading misinformation, or gathers data, like the location of shelters," Tsekhanovska said, noting how false messages have urged Ukrainians to turn off their phones at a specific time of night, citing cybersafety. To that end, when files are actively downloading, a new icon now appears in the Search bar that users can tap to view and manage downloads, pause and resume all downloads or just individual items, and select one to increase its priority or view it in a chat. Apparently upbeat developments in Russia's discussions with Ukraine helped at least temporarily send investors back into risk assets. Russian President Vladimir Putin said during a meeting with his Belarusian counterpart Alexander Lukashenko that there were "certain positive developments" occurring in the talks with Ukraine, according to a transcript of their meeting. Putin added that discussions were happening "almost on a daily basis." WhatsApp, a rival messaging platform, introduced some measures to counter disinformation when Covid-19 was first sweeping the world.
from tw


Telegram Наука. Президентская академия
FROM American