group-telegram.com/rantiquity/545
Last Update:
Спасибо, всем, кто слушал, вот ссылка на статью про дельту, которую я несколько раз сегодня упоминала. Там есть некорые выводы относительно приемлемой длины отрезка и числа mfw, необходимых для классификации.
У этой статьи было продолжение, в котором я выяснила, что косинусная (вюрцбургская) дельта работает на греческих текстах лучше, чем классическая. Но эта статья, увы, застряла в печати, поэтому ссылка только на препринт.
А самое главное понять (как я поняла лишь сравнительно недавно), что так называемая дельта — это не что иное, как метод машинного обучения под названием k-nn (метод ближайших соседей) при k = 1 на стандартизированных данных с манхэттенским расстоянием. Поэтому все это можно делать без stylo
в библиотеке tidymodels
(о чем в курсе по R) обязательно будет добавлен урок.
Почему tidymodels
, а не stylo
? Потому что, во-первых, это опрятно. Во-вторых, есть возможность провести перекресную проверку на разных выборках с разными параметрами (пакет rsample), оценить модели при помощи yardstick
и автоматически отобрать лучшую.
Но это без кодинга не решается, и для тех, кто не хочет кодировать, stylo
— вполне достойная замена.
BY RAntiquity
Share with your friend now:
group-telegram.com/rantiquity/545