Telegram Group & Telegram Channel
🙂🙂🙂🙂🙂🙂🙂
Открытый научный семинар Исследовательского центра искусственного интеллекта Президентской академии

Что обсудим?

1️⃣ «TrustGen: бенчмарк оценки доверенности LLM в задачах русского языка»

Большие языковые модели (LLM) все чаще используются в автономных агентах и ​​многоагентных системах для решения сложных задач, что делает их надежность критически важной проблемой. Однако большинство существующих бенчмарков сосредоточены на английском языке, что ограничивает их актуальность для других языков, особенно русского. Команда ИЦИИ представляет TrustGEN, первый бенчмарк для оценки доверенности LLM в задачах на русском языке, оценивая шесть измерений: правдивость, безопасность, справедливость, надежность, конфиденциальность и этика. Также в докладе будут рассмотрены результаты тестирования и актуальные проблемы оценки русскоязычных моделей.
🎤 Докладчик – Егор Аничков, эксперт ИЦИИ Академии.

2️⃣ «SLAVA: бенчмарк социально-политическиого ландшафта и ценностного анализа»

Не смотря на существование множества фактологических бенчмарков, лишь немногие оценивают знания больших языковых моделей в русскоязычном домене, а особенно - в области гуманитарных знаний. Особый интерес представляет оценка ответов LLM на спорные или деликатные темы. Для решения этих проблем, команда ИЦИИ разработала бенчмарк SLAVA, включающий четырнадцать тысяч вопросов в русскоязычной области, охватывающих различные области гуманитарных знаний (история, обществознание, география, политологи), каждый вопрос которого оценивался по шкале чувствительности, отражающей отношение респондента к тематике вопроса. В докладе будут рассмотрены результаты тестирования бенчмарка на 42 современных LLM.
🎤 Докладчик – Марина Полукошко, руководитель ЛИА ИЦИИ Академии.

3️⃣ Искусственный интеллект в анализе научных текстов: выявление ключевых инновационных идей.

4️⃣ Эволюция этических дилемм: анализ литературных источников разных эпох с использованием больших языковых моделей.

🙂 19 февраля в 19:00.

📍 256 аудитория, 2 корпус, 2 этаж.
Онлайн-трансляция по ссылке.

@ranepa_expertise
#Академия_Наука
Please open Telegram to view this post
VIEW IN TELEGRAM



group-telegram.com/ranepa_science/968
Create:
Last Update:

🙂🙂🙂🙂🙂🙂🙂
Открытый научный семинар Исследовательского центра искусственного интеллекта Президентской академии

Что обсудим?

1️⃣ «TrustGen: бенчмарк оценки доверенности LLM в задачах русского языка»

Большие языковые модели (LLM) все чаще используются в автономных агентах и ​​многоагентных системах для решения сложных задач, что делает их надежность критически важной проблемой. Однако большинство существующих бенчмарков сосредоточены на английском языке, что ограничивает их актуальность для других языков, особенно русского. Команда ИЦИИ представляет TrustGEN, первый бенчмарк для оценки доверенности LLM в задачах на русском языке, оценивая шесть измерений: правдивость, безопасность, справедливость, надежность, конфиденциальность и этика. Также в докладе будут рассмотрены результаты тестирования и актуальные проблемы оценки русскоязычных моделей.
🎤 Докладчик – Егор Аничков, эксперт ИЦИИ Академии.

2️⃣ «SLAVA: бенчмарк социально-политическиого ландшафта и ценностного анализа»

Не смотря на существование множества фактологических бенчмарков, лишь немногие оценивают знания больших языковых моделей в русскоязычном домене, а особенно - в области гуманитарных знаний. Особый интерес представляет оценка ответов LLM на спорные или деликатные темы. Для решения этих проблем, команда ИЦИИ разработала бенчмарк SLAVA, включающий четырнадцать тысяч вопросов в русскоязычной области, охватывающих различные области гуманитарных знаний (история, обществознание, география, политологи), каждый вопрос которого оценивался по шкале чувствительности, отражающей отношение респондента к тематике вопроса. В докладе будут рассмотрены результаты тестирования бенчмарка на 42 современных LLM.
🎤 Докладчик – Марина Полукошко, руководитель ЛИА ИЦИИ Академии.

3️⃣ Искусственный интеллект в анализе научных текстов: выявление ключевых инновационных идей.

4️⃣ Эволюция этических дилемм: анализ литературных источников разных эпох с использованием больших языковых моделей.

🙂 19 февраля в 19:00.

📍 256 аудитория, 2 корпус, 2 этаж.
Онлайн-трансляция по ссылке.

@ranepa_expertise
#Академия_Наука

BY Наука. Президентская академия




Share with your friend now:
group-telegram.com/ranepa_science/968

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

On Feb. 27, however, he admitted from his Russian-language account that "Telegram channels are increasingly becoming a source of unverified information related to Ukrainian events." False news often spreads via public groups, or chats, with potentially fatal effects. "The result is on this photo: fiery 'greetings' to the invaders," the Security Service of Ukraine wrote alongside a photo showing several military vehicles among plumes of black smoke. The last couple days have exemplified that uncertainty. On Thursday, news emerged that talks in Turkey between the Russia and Ukraine yielded no positive result. But on Friday, Reuters reported that Russian President Vladimir Putin said there had been some “positive shifts” in talks between the two sides. For example, WhatsApp restricted the number of times a user could forward something, and developed automated systems that detect and flag objectionable content.
from nl


Telegram Наука. Президентская академия
FROM American