group-telegram.com/rdc_grfc/1352
Last Update:
Впечатляющие способности больших языковых моделей (LLM) в овладении, понимании и генерировании человеческого языка основаны на больших языковых данных из интернета. Обучение включает разбиение текста или речи на токены и анализ связей между ними для создания грамматически корректных последовательностей. Сгенерированный текст может не соответствовать реальному миру, что создает проблему галлюцинаций и ложной информации.
Утверждения относительно лингвистических возможностей LLM имеют два необоснованных предположения:
В основе этих предположений лежит вычислительная теория разума, рассматривающая разум как систему обработки информации. Однако познание возможно с точки зрения энактивизма, который выделяет три характеристики инсценированного языка, отсутствующие в LLM:
Таким образом, LLM не могут повторно использовать и создавать формы для манипулирования смыслом и работы в изменяющемся мире. Впечатляющие результаты работы основаны на прогнозировании предложений. Несмотря на неудачи в решении нелингвистических задач, LLM – это значительное инженерное достижение, требующее тщательной оценки перед развертыванием для смягчения тенденции к упрощению языка и кодированию общественных стереотипов.