group-telegram.com/MegaputerOfficial/120
Last Update:
👨🏻🏫👩🏫Всем привет!
Команда Мегапьютер продолжает пополнять свою библиотеку обучающих и просто полезных материалов о применении PolyAnalyst. В этот раз мы публикуем курс видео-инструкций по написанию поисковых правил на синтаксисе PDL.
PDL (pattern definition language) – язык для поиска лингвистических конструкций в неструктурированных текстах. Он предназначен для нахождения в тексте фактов, событий, сущностей и прочих объектов, представляющих интерес для конкретной предметной области. Такими объектами могут быть, например, географические объекты и компании, марки автомобилей, виды поломок и дефектов, названия лекарств и химических соединений, научные публикации, стихийные бедствия и эпидемии, цены акций, курсы валют и т.д.
Большинство подобных объектов можно найти в тексте, описав с помощью PDL соответствующие им лингвистические конструкции любой сложности.
В дальнейшем мы опубликуем аналогичные инструкции к расширенному языку для определения текстовых паттернов XPDL («eXtended Pattern Definition Language»), который позволяет не только находить значимые объекты в тексте, но и извлекать их, формируя структурированные таблицы данных. При этом обрабатывать с помощью PDL/XPDL можно не только неструктурированные текстовые документы, но и файлы MS Excel, JSON, XML, HTML и прочие электронный форматы. Пример обработки электронных таблиц представлен в видео, а более подробная информация по XPDL в соответствующем разделе документации.
BY Мегапьютер

Share with your friend now:
group-telegram.com/MegaputerOfficial/120