Telegram Group & Telegram Channel
Нобелевская премия, институты и LLM

Не самый большой знаток работ Аджемоглу и, признаюсь, читать его книги "Почему богатые страны"(имейте институты и имейте их сто лет назад, желающие могут почитать Ватоадмина/Василия Тополева) было непросто. Но поговорим лучше о старой Нобелевке, писал о ней год назад.

"Грамматика институтов" — подход, предложенный Сью Кроуфорд и Элионор Остром в 1995 году. Он фокусируется на синтаксических структурных элементах, которые составляют и формируют институции. В 2009 году Элинор Остром получила премию памяти А. Нобеля по экономике за анализ феномена "economic governance" (термина, которому сложно подобрать точное русскоязычное обозначение).

Ссылка: https://www.group-telegram.com/evidence_guide/9

Широкое распространение подхода "грамматики институтов" затрудняют высокие временные и ресурсные затраты. В статье предлагается использовать машинное обучение и анализировать тексты с помощью методов NLP (обработка естественного языка). В качестве примера используется анализ 19 документов, регламентирующих работу пищевой отрасли.

Rice, Douglas, et al. "Machine Coding of Policy Texts with the Institutional Grammar." Public Administration. December 2020.
Ссылка: https://onlinelibrary.wiley.com/doi/10.1111/padm.12711

Этапы анализа:

1. Текст обрабатывается и размечается с помощью методов NLP для учета нестандартного форматирования: специфической пунктуации (тире, "буллеты" и т.п.) и сложной структуры текста. Для этого используется пакет Stanford CoreNLP на языке R.

2. Далее текст размечается по правилам "грамматики институтов" с помощью машинного обучения с учителем. Выделяются следующие 6 синтаксических элементов:

- Атрибут (Attribute, [A]) – актор, к которому относится утверждение.
- Цель (Aim, [I]) – действие утверждения.
- Деонтика (Deontic, [D]) – предписание, что актор должен или не должен делать.
- Объект (Object, [B]) – объект, к которому относится действие.
- Условие (Condition, [C]) – временные, пространственные или регуляторные ограничения.
- Or else (O) – стимул для выполнения или невыполнения действия (например, наказание за нарушение).

Эти элементы объединяются в набор, обозначаемый как ABDICO.

Пример:
Предложение: "Операции, сертифицированные как органические в соответствии с Национальной программой США по органическому производству, должны ежегодно представлять план органической системы, в противном случае сертификация будет отменена."

Разметка:
- Атрибут: "Операции, сертифицированные как органические..."
- Деонтика: "должны"
- Цель: "представлять"
- Объект: "план органической системы"
- Условие: "ежегодно"
- Or else: "в противном случае сертификация будет отменена"

В статье использовался набор из 19 документов, регламентирующих работу пищевой отрасли. Все слова, размеченные вручную как элементы "грамматики институтов", были разделены на обучающее множество (8320 слов) и множество для оценки (922 слова). Разметка текстов в соответствии с правилами "грамматики институтов" производилась с использованием машинного обучения с учителем, в частности нейронных сетей.

"Грамматика институтов", предложенная более двух десятилетий назад, открывает перспективы для ученых, занимающихся государственной политикой и администрированием, заинтересованных в систематическом изучении структуры и понимания политических текстов. Полученный уровень точности автоматической классификации подтверждает полезность такого анализа текстов в рамках подхода "грамматики институтов". Увеличение точности возможно при расширении количества классифицированных текстов, совершенствовании методов обработки естественного языка и машинного обучения.

Теперь ждём применения методов грамматики институтов на дешёвом LLM и ChatGPT.



group-telegram.com/gulagdigital/2920
Create:
Last Update:

Нобелевская премия, институты и LLM

Не самый большой знаток работ Аджемоглу и, признаюсь, читать его книги "Почему богатые страны"(имейте институты и имейте их сто лет назад, желающие могут почитать Ватоадмина/Василия Тополева) было непросто. Но поговорим лучше о старой Нобелевке, писал о ней год назад.

"Грамматика институтов" — подход, предложенный Сью Кроуфорд и Элионор Остром в 1995 году. Он фокусируется на синтаксических структурных элементах, которые составляют и формируют институции. В 2009 году Элинор Остром получила премию памяти А. Нобеля по экономике за анализ феномена "economic governance" (термина, которому сложно подобрать точное русскоязычное обозначение).

Ссылка: https://www.group-telegram.com/evidence_guide/9

Широкое распространение подхода "грамматики институтов" затрудняют высокие временные и ресурсные затраты. В статье предлагается использовать машинное обучение и анализировать тексты с помощью методов NLP (обработка естественного языка). В качестве примера используется анализ 19 документов, регламентирующих работу пищевой отрасли.

Rice, Douglas, et al. "Machine Coding of Policy Texts with the Institutional Grammar." Public Administration. December 2020.
Ссылка: https://onlinelibrary.wiley.com/doi/10.1111/padm.12711

Этапы анализа:

1. Текст обрабатывается и размечается с помощью методов NLP для учета нестандартного форматирования: специфической пунктуации (тире, "буллеты" и т.п.) и сложной структуры текста. Для этого используется пакет Stanford CoreNLP на языке R.

2. Далее текст размечается по правилам "грамматики институтов" с помощью машинного обучения с учителем. Выделяются следующие 6 синтаксических элементов:

- Атрибут (Attribute, [A]) – актор, к которому относится утверждение.
- Цель (Aim, [I]) – действие утверждения.
- Деонтика (Deontic, [D]) – предписание, что актор должен или не должен делать.
- Объект (Object, [B]) – объект, к которому относится действие.
- Условие (Condition, [C]) – временные, пространственные или регуляторные ограничения.
- Or else (O) – стимул для выполнения или невыполнения действия (например, наказание за нарушение).

Эти элементы объединяются в набор, обозначаемый как ABDICO.

Пример:
Предложение: "Операции, сертифицированные как органические в соответствии с Национальной программой США по органическому производству, должны ежегодно представлять план органической системы, в противном случае сертификация будет отменена."

Разметка:
- Атрибут: "Операции, сертифицированные как органические..."
- Деонтика: "должны"
- Цель: "представлять"
- Объект: "план органической системы"
- Условие: "ежегодно"
- Or else: "в противном случае сертификация будет отменена"

В статье использовался набор из 19 документов, регламентирующих работу пищевой отрасли. Все слова, размеченные вручную как элементы "грамматики институтов", были разделены на обучающее множество (8320 слов) и множество для оценки (922 слова). Разметка текстов в соответствии с правилами "грамматики институтов" производилась с использованием машинного обучения с учителем, в частности нейронных сетей.

"Грамматика институтов", предложенная более двух десятилетий назад, открывает перспективы для ученых, занимающихся государственной политикой и администрированием, заинтересованных в систематическом изучении структуры и понимания политических текстов. Полученный уровень точности автоматической классификации подтверждает полезность такого анализа текстов в рамках подхода "грамматики институтов". Увеличение точности возможно при расширении количества классифицированных текстов, совершенствовании методов обработки естественного языка и машинного обучения.

Теперь ждём применения методов грамматики институтов на дешёвом LLM и ChatGPT.

BY Цифровой геноцид


Warning: Undefined variable $i in /var/www/group-telegram/post.php on line 260

Share with your friend now:
group-telegram.com/gulagdigital/2920

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

At its heart, Telegram is little more than a messaging app like WhatsApp or Signal. But it also offers open channels that enable a single user, or a group of users, to communicate with large numbers in a method similar to a Twitter account. This has proven to be both a blessing and a curse for Telegram and its users, since these channels can be used for both good and ill. Right now, as Wired reports, the app is a key way for Ukrainians to receive updates from the government during the invasion. "And that set off kind of a battle royale for control of the platform that Durov eventually lost," said Nathalie Maréchal of the Washington advocacy group Ranking Digital Rights. This provided opportunity to their linked entities to offload their shares at higher prices and make significant profits at the cost of unsuspecting retail investors. Update March 8, 2022: EFF has clarified that Channels and Groups are not fully encrypted, end-to-end, updated our post to link to Telegram’s FAQ for Cloud and Secret chats, updated to clarify that auto-delete is available for group and channel admins, and added some additional links. Official government accounts have also spread fake fact checks. An official Twitter account for the Russia diplomatic mission in Geneva shared a fake debunking video claiming without evidence that "Western and Ukrainian media are creating thousands of fake news on Russia every day." The video, which has amassed almost 30,000 views, offered a "how-to" spot misinformation.
from us


Telegram Цифровой геноцид
FROM American