rantiquity 549 Telegram Group

RAntiquity

За проезд не забываем передавать! — У Лондиниума остановите, пожалуйста! данные: orbis графика: ggplot палитра: brutal #цифровые_этюды #spatial_data

кстати, после нескольких дней возни с картографическими проекциями, должна сказать, что вместе с дарвином пусть тогда уж забирают круглую землю. я согласна на плоскую 🐢🐘🐘🐘

412 viewsOlga Alieva, edited 14:37

RAntiquity

Сегодня читали Эразма под руководством Мары Тимощук @thalatta_thalassa. Это был прекрасный семинар на живой латыни, но пост не об этом.

Есть такой датасет “Словарь русских писателей XVIII века: сеть персоналий” Это прекрасный датасет, подготовленный Борисом Ореховым @nevmenandr, но пост тоже не об этом.

Там собраны междустатейные ссылки в Словаре русских писателей XVIII века (1988–2010. Вып. 1–3). Узлами сети выступают посвященные персоналиям статьи словаря, а ребрами — ссылки на другие статьи в том же словаре. Но сейчас речь не об этом.

И вот, там 780 персоналий, и все они друг с другом как-то связаны. Но есть две странные изолированные пары.

Стало мне интересно, что это за несчастные, на которых ни одна статья не ссылается и их статьи тоже ни с кем не связаны.

Оказалось, что один из них -- Иоганн-Вернер Паузе, переводчик Эразма и Яна Коменского на русский. Вот о нем я и хотела написать.

523 viewsOlga Alieva, edited 19:07

RAntiquity

Почему так мало амфитеатров в Греции? А ведь были буквально родиной амфитеатров.

данные: римские амфитеатры
графика: tmap

#цифровые_этюды #spatial_data

467 viewsOlga Alieva, 15:57

RAntiquity

Forwarded from HSE R Meet Up

Всем привет!

Мы рады сообщить о запуске проекта HSE R Meet Up! Это пространство для обмена знаниями и опытом в мире анализа данных с использованием языка R. Наша цель — создать сообщество, где каждый сможет углубить свои навыки в data science, обсудить прикладные вопросы и новинки из этой области, а также найти единомышленников.

🔍 Что вас ждет?
- Мастер-классы от экспертов по разным методам анализа данных.
- Совместное решение и обсуждение реальных кейсов.
- Возможность делиться своими проектами и получать обратную связь.

Мы встречаемся как в очном формате, так и онлайн в Москве, Санкт-Петербурге и Перми.

В этом Telegram-канале мы будем публиковать анонсы мероприятий и всю актуальную информацию.

Let's RMeetUp ~ 🚀

484 viewsOlga Alieva, 19:39

RAntiquity

library(imager)
img <- load.image("https://upload.wikimedia.org/wikipedia/commons/thumb/a/ae/Aristotle_Altemps_Inv8575.jpg/1024px-Aristotle_Altemps_Inv8575.jpg")


# цветовые каналы
ar.red <- img
G(ar.red) <- 0
B(ar.red) <- 0

ar.blue <- img
R(ar.blue) <- 0
G(ar.blue) <- 0

ar.green <- img
R(ar.green) <- 0
B(ar.green) <- 0

ar.yellow <- img
B(ar.yellow) <- 0


library(purrr)
par(mfrow = c(2,2))
walk(list(ar.red, ar.blue, ar.green, ar.yellow), plot, 
     axes=FALSE)

#images #цифровые_этюды

526 viewsOlga Alieva, edited 03:41

RAntiquity

Почему так мало амфитеатров в Греции? А ведь были буквально родиной амфитеатров. данные: римские амфитеатры графика: tmap #цифровые_этюды #spatial_data

Please open Telegram to view this post

VIEW IN TELEGRAM

586 viewsOlga Alieva, edited 13:38

RAntiquity

Forwarded from Antibarbari HSE (полина крупинина)

📘В свежем выпуске журнала "Философия. Журнал Высшей школы экономики" вышла статья нашего редактора Ольги Алиевой "Pseudoplatonica: блеск и нищета стилометрии”.

🔎Откуда в платоновском корпусе тексты, написанные не Платоном, и правильно ли считать их "подложными"?

🔎Почему количественные методы атрибуции авторства не могут достоверно установить, какие тексты считать подлинными?

🔎Достаточно ли "аномальной" статистики для того, чтобы усомниться в авторстве диалога?

Обо всем этом✨с картинками✨читайте по ссылке.

577 viewsOlga Alieva, 06:26

RAntiquity

Я очень довольна этим текстом. Он емкий и внятный. Будет еще один в серии, как только я доведу до ума курс по R.

Antibarbari HSE

⚡ В свежих "Платоновских исследованиях" читайте статью Ольги Алиевой "Новая количественная модель Платоновского корпуса 1: Pseudoplatonica: проблемы происхождения и датировки"

Под влиянием филологической критики XIX в. диалоги из числа dubia и spuria долгое…

706 viewsOlga Alieva, 06:32

RAntiquity

Please open Telegram to view this post

VIEW IN TELEGRAM

583 viewsOlga Alieva, 07:24

RAntiquity

Please open Telegram to view this post

VIEW IN TELEGRAM

677 viewsOlga Alieva, edited 12:46

RAntiquity

Please open Telegram to view this post

VIEW IN TELEGRAM

572 viewsOlga Alieva, edited 12:19

RAntiquity

Forwarded from Antibarbari HSE (Olga Alieva)

🪩 15 октября в НГУ состоится “Школа молодого антиковеда”.

🪲 Для получения онлайн-ссылки на подключение необходимо заранее зарегистрироваться здесь.

💎 Для участия в дистанционном мастер-классе О. В. Алиевой необходимо заранее установить R & RStudio (или зарегистрироваться в облаке Posit). Инструкция, как это сделать, здесь.

🦕 Будем рады видеть друзей-антиковедов, молодых и не очень!

Please open Telegram to view this post

VIEW IN TELEGRAM

529 viewsOlga Alieva, 13:21

RAntiquity

Очень интересный эксперимент (2023) по датировке греческих документальных папирусов с использованием регрессионных методов (GitHub).

Многое скажет сердцу эллиниста табличка, в которой приведены правила нормализации греческого текста.

Результат неплохой, надо бы попробовать повторить.

635 viewsOlga Alieva, edited 17:09

RAntiquity

Не совсем моя тема, но интересно как пример использования нейросетей в антиковедении. Автоматическая классификация римских монет (код, модель, датасет по ссылке). Красивое.

P.S. Вот здесь группа товарищей тоже классифицирует римские монетки и делится данными, но там что-то связанное с теорией игр.

629 viewsOlga Alieva, 05:17

RAntiquity

Please open Telegram to view this post

VIEW IN TELEGRAM

865 viewsOlga Alieva, 20:57

RAntiquity

Forwarded from Vox medii aevi

Продолжаем рубрику «сегодня я узнала»: оказывается, уже ДВА ГОДА как можно подать заявку в консорциум CREMMA и получить доступ к eScriptorium (это такая платформа для автоматической транскрипции рукописей). Нужно только описать свой проект и пообещать поделиться тренировочными данными.
Сайт на французском

840 viewsOlga Alieva, 12:24

RAntiquity

Спасибо, всем, кто слушал, вот ссылка на статью про дельту, которую я несколько раз сегодня упоминала. Там есть некорые выводы относительно приемлемой длины отрезка и числа mfw, необходимых для классификации.

У этой статьи было продолжение, в котором я выяснила, что косинусная (вюрцбургская) дельта работает на греческих текстах лучше, чем классическая. Но эта статья, увы, застряла в печати, поэтому ссылка только на препринт.

А самое главное понять (как я поняла лишь сравнительно недавно), что так называемая дельта — это не что иное, как метод машинного обучения под названием k-nn (метод ближайших соседей) при k = 1 на стандартизированных данных с манхэттенским расстоянием. Поэтому все это можно делать без stylo в библиотеке tidymodels (о чем в курсе по R) обязательно будет добавлен урок.

Почему tidymodels, а не stylo? Потому что, во-первых, это опрятно. Во-вторых, есть возможность провести перекресную проверку на разных выборках с разными параметрами (пакет rsample), оценить модели при помощи yardstick и автоматически отобрать лучшую.

Но это без кодинга не решается, и для тех, кто не хочет кодировать, stylo — вполне достойная замена.

817 viewsOlga Alieva, edited 13:25

RAntiquity

Самое лучшее объяснение алгоритма knn я видела в книге Бретта Ланца “Машинное обучение на R” (русский перевод весьма пристойный).

Он, в частности, говорит о том, что это алгоритм ленивого обучения, т.к. машина на самом деле ничему не учится, а просто запоминает тренировочные данные. Тут-то я и осознала, что это дельта и есть.

Поэтому, если вы вдруг не понимаете смысл дельты, рекомендую посмотреть эту главу. Там и про векторное пространство, и про расстояния очень доходчиво с картинками.

Labirint.RU

Машинное обучение на R: экспертные техники для прогностического анализа

Язык R предлагает мощный набор методов машинного обучения, позволяющих быстро проводить нетривиальный анализ ваших данных.
Книга является руководством, которое поможет применять методы машинного обучения в решении ежедневных задач. Бретт Ланц...

873 viewsOlga Alieva, edited 13:30

RAntiquity

Forwarded from БРУСНИЦЫН культурный квартал

DH-центр ИТМО в Лектории Брусницына

Раз в две недели по субботам будем собираться в Лектории Брусницына и говорить с экспертами DH-центра про исследования в области цифровой гуманитаристики. Что это такое и кто этим занимается?

DH-центр — центр цифровых гуманитарных
исследований университета ИТМО, который организует магистратуру в Санкт-Петербурге, курирует цифровые проекты с культурными институциями и проводит исследования.

В Лектории будут выступать преподаватели магистратуры и команда центра. На лекциях вы узнаете о том, как цифровые методы и инструменты существуют в мире гуманитарных исследований.

Программа:

19 октября
«Как оцифровать болезнь? Цифровая гуманитаристика в медицине»

2 ноября
«GLAMVR: галереи, архивы, музеи, библиотеки и их цифровая жизнь»

16 ноября
«Игра как совместное событие в физическом и цифровом пространстве»

30 ноября
«Интерфейсы цифровых архивов: аутентичность, пользователи и правила»

14 и 28 декабря
темы уточняются (следите за анонсами)

Первая лекция «Как оцифровать болезнь? Цифровая гуманитаристика в медицине» пройдет 19 октября.

Поговорим о том, как технологии стали неотъемлемой частью медицинских процессов и как соотносятся версии болезни в «реальном» и «виртуальном» измерениях?

Спикер — Илья Смирнов, преподаватель программы магистратуры по Digital Humanities ИТМО, социальный исследователь науки и технологий (STS), аспирант ЕУ СПб, основатель проекта Versia.

Вход свободный, необходма регистрация

🗓 19 октября, 15:00
📍Культурный квартал Брусницын, Лекторий (Дом с колоннами, 3 этаж, вход в арке)

1.0K viewsOlga Alieva, 11:35

RAntiquity

🎯В Вышке закончился первый учебный модуль, а значит — пройдена первая четверть курса «Компьютерный анализ текста в R». Этот курс я читаю второй год студентам магистерской программы «Цифровые методы в гуманитарных науках», и продолжаю дорабатывать.

Итак, мы прошли следующие темы.

1. Начало работы в R (текст, видео).

2. Таблицы. Опрятные данные (текст, видео). Датасет: М. Кондра, Е. Казакова, «Программы по литературе для средней школы с 1919 по 1991 гг.». Узнали, в какой год в новейшей истории России распухли школьные программы.

3. Визуализации (текст, видео). Датасет: Т. Андервуд и др., “NovelTM Datasets for English-Language Fiction, 1700-2009”. Повторили знаменитое исследование Ф. Моретти о длине названия («Корпорация стиля») и узнали, в какие года среди романистов было больше всего женщин.

4. Циклы, условия, функции (текст, видео).

5. Функционалы в анализе данных (текст, видео). Исследовали датасет Британской библиотеки, посвященный Гарри Поттеру. После хакерской атаки на библиотеку он исчез с их сайта, но у меня сохранилась копия с прошлого года.

6. Импорт: JSON (текст, видео). Датасет: «Шедевры Пушкинского музея». И небольшой датасет со списком эпизодов «Теории большого взрыва».

7. Импорт: XML (текст, видео). Датасет: Д. Скоринкин, “Персонажи «Войны и мира» Л. Н. Толстого: вхождения в тексте, прямая речь и семантические роли”. Также пригодились XML из корпуса русской драмы Dracor.

8. Публикация с Quarto (текст, видео).

📚 Под каждую тему (кроме первой) был подобран гуманитарный датасет. Причем данные пришлось искать не только для лекционной части (см. выше), но и под каждое домашнее задание (это оставлю за кадром, чтобы сохранить интригу для будущих поколений). Поиск данных оказался самой сложной частью работы, и я хочу поблагодарить коллег, которые ими делятся. Это бесценно.

💙 С проверкой домашних работ мне очень помогает студентка второго курса магистратуры София Федотова. А еще мы с Софией научились настраивать автоматические тесты и оценивание, это просто спасает, потому что группа довольно большая, около 20 человек, и кода много.

📅 Впереди еще три модуля, и, если доживем, по итогам каждого я буду делиться такими обзорами. Для меня это важно еще и потому, что сейчас деление курса на темы немного расходится с реальными темпами прохождения материала — а значит структуру курса придется еще раз перерабатывать с опорой на эти заметки.

🐈 По правде говоря, я вообще мало что успеваю помимо постоянных доработок и переработок (и поэтому нечасто сюда пишу). Но результат, кажется, неплохой: во всяком случае, недавно кто-то из студентов сказал, что уже пользуется R на работе. Для всего двух месяцев освоения — неплохо.

Идем дальше.

#tar2024

Please open Telegram to view this post

VIEW IN TELEGRAM

locusclassicus.github.io

Компьютерный анализ текста

1.9K viewsOlga Alieva, edited 13:07

2025/01/05 05:49:02
Back to Top

HTML Embed Code:

<iframe width="100%" src="https://www.group-telegram.com/buyppe/webview?embed=1" title="Channel Webview" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>