group-telegram.com/gulagdigital/2920
Last Update:
Нобелевская премия, институты и LLM
Не самый большой знаток работ Аджемоглу и, признаюсь, читать его книги "Почему богатые страны"(имейте институты и имейте их сто лет назад, желающие могут почитать Ватоадмина/Василия Тополева) было непросто. Но поговорим лучше о старой Нобелевке, писал о ней год назад.
"Грамматика институтов" — подход, предложенный Сью Кроуфорд и Элионор Остром в 1995 году. Он фокусируется на синтаксических структурных элементах, которые составляют и формируют институции. В 2009 году Элинор Остром получила премию памяти А. Нобеля по экономике за анализ феномена "economic governance" (термина, которому сложно подобрать точное русскоязычное обозначение).
Ссылка: https://www.group-telegram.com/evidence_guide/9
Широкое распространение подхода "грамматики институтов" затрудняют высокие временные и ресурсные затраты. В статье предлагается использовать машинное обучение и анализировать тексты с помощью методов NLP (обработка естественного языка). В качестве примера используется анализ 19 документов, регламентирующих работу пищевой отрасли.
Rice, Douglas, et al. "Machine Coding of Policy Texts with the Institutional Grammar." Public Administration. December 2020.
Ссылка: https://onlinelibrary.wiley.com/doi/10.1111/padm.12711
Этапы анализа:
1. Текст обрабатывается и размечается с помощью методов NLP для учета нестандартного форматирования: специфической пунктуации (тире, "буллеты" и т.п.) и сложной структуры текста. Для этого используется пакет Stanford CoreNLP на языке R.
2. Далее текст размечается по правилам "грамматики институтов" с помощью машинного обучения с учителем. Выделяются следующие 6 синтаксических элементов:
- Атрибут (Attribute, [A]) – актор, к которому относится утверждение.
- Цель (Aim, [I]) – действие утверждения.
- Деонтика (Deontic, [D]) – предписание, что актор должен или не должен делать.
- Объект (Object, [B]) – объект, к которому относится действие.
- Условие (Condition, [C]) – временные, пространственные или регуляторные ограничения.
- Or else (O) – стимул для выполнения или невыполнения действия (например, наказание за нарушение).
Эти элементы объединяются в набор, обозначаемый как ABDICO.
Пример:
Предложение: "Операции, сертифицированные как органические в соответствии с Национальной программой США по органическому производству, должны ежегодно представлять план органической системы, в противном случае сертификация будет отменена."
Разметка:
- Атрибут: "Операции, сертифицированные как органические..."
- Деонтика: "должны"
- Цель: "представлять"
- Объект: "план органической системы"
- Условие: "ежегодно"
- Or else: "в противном случае сертификация будет отменена"
В статье использовался набор из 19 документов, регламентирующих работу пищевой отрасли. Все слова, размеченные вручную как элементы "грамматики институтов", были разделены на обучающее множество (8320 слов) и множество для оценки (922 слова). Разметка текстов в соответствии с правилами "грамматики институтов" производилась с использованием машинного обучения с учителем, в частности нейронных сетей.
"Грамматика институтов", предложенная более двух десятилетий назад, открывает перспективы для ученых, занимающихся государственной политикой и администрированием, заинтересованных в систематическом изучении структуры и понимания политических текстов. Полученный уровень точности автоматической классификации подтверждает полезность такого анализа текстов в рамках подхода "грамматики институтов". Увеличение точности возможно при расширении количества классифицированных текстов, совершенствовании методов обработки естественного языка и машинного обучения.
Теперь ждём применения методов грамматики институтов на дешёвом LLM и ChatGPT.
BY Цифровой геноцид
Warning: Undefined variable $i in /var/www/group-telegram/post.php on line 260
Share with your friend now:
group-telegram.com/gulagdigital/2920