Telegram Group & Telegram Channel
💬 Проблемы формы и значения в LLM

Впечатляющие способности больших языковых моделей (LLM) в овладении, понимании и генерировании человеческого языка основаны на больших языковых данных из интернета. Обучение включает разбиение текста или речи на токены и анализ связей между ними для создания грамматически корректных последовательностей. Сгенерированный текст может не соответствовать реальному миру, что создает проблему галлюцинаций и ложной информации.

Утверждения относительно лингвистических возможностей LLM имеют два необоснованных предположения:

1️⃣ Существование полноты языка в виде целостной сущности, схожей с физическими объектами, которая может быть эффективно смоделирована LLM.
2️⃣ Полнота данных, позволяющая идентифицировать и количественно оценить основные характеристики естественного языка в наборах данных.

В основе этих предположений лежит вычислительная теория разума, рассматривающая разум как систему обработки информации. Однако познание возможно с точки зрения энактивизма, который выделяет три характеристики инсценированного языка, отсутствующие в LLM:

Воплощение – тон голоса, жесты, эмоциональный контекст, выражение лица и т. д.
Участие – непринужденный разговор, мимолетные жесты, язык тела, паузы, колебания.
Неустойчивость – двусмысленность между людьми: напряженность, разногласия.

Таким образом, LLM не могут повторно использовать и создавать формы для манипулирования смыслом и работы в изменяющемся мире. Впечатляющие результаты работы основаны на прогнозировании предложений. Несмотря на неудачи в решении нелингвистических задач, LLM – это значительное инженерное достижение, требующее тщательной оценки перед развертыванием для смягчения тенденции к упрощению языка и кодированию общественных стереотипов.

💻 Подробнее – в новом материале на сайте Научно-технического центра.
Please open Telegram to view this post
VIEW IN TELEGRAM



group-telegram.com/rdc_grfc/1352
Create:
Last Update:

💬 Проблемы формы и значения в LLM

Впечатляющие способности больших языковых моделей (LLM) в овладении, понимании и генерировании человеческого языка основаны на больших языковых данных из интернета. Обучение включает разбиение текста или речи на токены и анализ связей между ними для создания грамматически корректных последовательностей. Сгенерированный текст может не соответствовать реальному миру, что создает проблему галлюцинаций и ложной информации.

Утверждения относительно лингвистических возможностей LLM имеют два необоснованных предположения:

1️⃣ Существование полноты языка в виде целостной сущности, схожей с физическими объектами, которая может быть эффективно смоделирована LLM.
2️⃣ Полнота данных, позволяющая идентифицировать и количественно оценить основные характеристики естественного языка в наборах данных.

В основе этих предположений лежит вычислительная теория разума, рассматривающая разум как систему обработки информации. Однако познание возможно с точки зрения энактивизма, который выделяет три характеристики инсценированного языка, отсутствующие в LLM:

Воплощение – тон голоса, жесты, эмоциональный контекст, выражение лица и т. д.
Участие – непринужденный разговор, мимолетные жесты, язык тела, паузы, колебания.
Неустойчивость – двусмысленность между людьми: напряженность, разногласия.

Таким образом, LLM не могут повторно использовать и создавать формы для манипулирования смыслом и работы в изменяющемся мире. Впечатляющие результаты работы основаны на прогнозировании предложений. Несмотря на неудачи в решении нелингвистических задач, LLM – это значительное инженерное достижение, требующее тщательной оценки перед развертыванием для смягчения тенденции к упрощению языка и кодированию общественных стереотипов.

💻 Подробнее – в новом материале на сайте Научно-технического центра.

BY НТЦ ГРЧЦ




Share with your friend now:
group-telegram.com/rdc_grfc/1352

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

On February 27th, Durov posted that Channels were becoming a source of unverified information and that the company lacks the ability to check on their veracity. He urged users to be mistrustful of the things shared on Channels, and initially threatened to block the feature in the countries involved for the length of the war, saying that he didn’t want Telegram to be used to aggravate conflict or incite ethnic hatred. He did, however, walk back this plan when it became clear that they had also become a vital communications tool for Ukrainian officials and citizens to help coordinate their resistance and evacuations. "The argument from Telegram is, 'You should trust us because we tell you that we're trustworthy,'" Maréchal said. "It's really in the eye of the beholder whether that's something you want to buy into." Also in the latest update is the ability for users to create a unique @username from the Settings page, providing others with an easy way to contact them via Search or their t.me/username link without sharing their phone number. "Like the bombing of the maternity ward in Mariupol," he said, "Even before it hits the news, you see the videos on the Telegram channels." Since its launch in 2013, Telegram has grown from a simple messaging app to a broadcast network. Its user base isn’t as vast as WhatsApp’s, and its broadcast platform is a fraction the size of Twitter, but it’s nonetheless showing its use. While Telegram has been embroiled in controversy for much of its life, it has become a vital source of communication during the invasion of Ukraine. But, if all of this is new to you, let us explain, dear friends, what on Earth a Telegram is meant to be, and why you should, or should not, need to care.
from us


Telegram НТЦ ГРЧЦ
FROM American