rantiquity 559 Telegram Group

RAntiquity

Please open Telegram to view this post

VIEW IN TELEGRAM

731 viewsOlga Alieva, edited 12:46

RAntiquity

Please open Telegram to view this post

VIEW IN TELEGRAM

615 viewsOlga Alieva, edited 12:19

RAntiquity

Forwarded from Antibarbari HSE (Olga Alieva)

🪩 15 октября в НГУ состоится “Школа молодого антиковеда”.

🪲 Для получения онлайн-ссылки на подключение необходимо заранее зарегистрироваться здесь.

💎 Для участия в дистанционном мастер-классе О. В. Алиевой необходимо заранее установить R & RStudio (или зарегистрироваться в облаке Posit). Инструкция, как это сделать, здесь.

🦕 Будем рады видеть друзей-антиковедов, молодых и не очень!

Please open Telegram to view this post

VIEW IN TELEGRAM

575 viewsOlga Alieva, 13:21

RAntiquity

Очень интересный эксперимент (2023) по датировке греческих документальных папирусов с использованием регрессионных методов (GitHub).

Многое скажет сердцу эллиниста табличка, в которой приведены правила нормализации греческого текста.

Результат неплохой, надо бы попробовать повторить.

682 viewsOlga Alieva, edited 17:09

RAntiquity

Не совсем моя тема, но интересно как пример использования нейросетей в антиковедении. Автоматическая классификация римских монет (код, модель, датасет по ссылке). Красивое.

P.S. Вот здесь группа товарищей тоже классифицирует римские монетки и делится данными, но там что-то связанное с теорией игр.

674 viewsOlga Alieva, 05:17

RAntiquity

Please open Telegram to view this post

VIEW IN TELEGRAM

926 viewsOlga Alieva, 20:57

RAntiquity

Forwarded from Vox medii aevi

Продолжаем рубрику «сегодня я узнала»: оказывается, уже ДВА ГОДА как можно подать заявку в консорциум CREMMA и получить доступ к eScriptorium (это такая платформа для автоматической транскрипции рукописей). Нужно только описать свой проект и пообещать поделиться тренировочными данными.
Сайт на французском

893 viewsOlga Alieva, 12:24

RAntiquity

Спасибо, всем, кто слушал, вот ссылка на статью про дельту, которую я несколько раз сегодня упоминала. Там есть некорые выводы относительно приемлемой длины отрезка и числа mfw, необходимых для классификации.

У этой статьи было продолжение, в котором я выяснила, что косинусная (вюрцбургская) дельта работает на греческих текстах лучше, чем классическая. Но эта статья, увы, застряла в печати, поэтому ссылка только на препринт.

А самое главное понять (как я поняла лишь сравнительно недавно), что так называемая дельта — это не что иное, как метод машинного обучения под названием k-nn (метод ближайших соседей) при k = 1 на стандартизированных данных с манхэттенским расстоянием. Поэтому все это можно делать без stylo в библиотеке tidymodels (о чем в курсе по R) обязательно будет добавлен урок.

Почему tidymodels, а не stylo? Потому что, во-первых, это опрятно. Во-вторых, есть возможность провести перекресную проверку на разных выборках с разными параметрами (пакет rsample), оценить модели при помощи yardstick и автоматически отобрать лучшую.

Но это без кодинга не решается, и для тех, кто не хочет кодировать, stylo — вполне достойная замена.

878 viewsOlga Alieva, edited 13:25

RAntiquity

Самое лучшее объяснение алгоритма knn я видела в книге Бретта Ланца “Машинное обучение на R” (русский перевод весьма пристойный).

Он, в частности, говорит о том, что это алгоритм ленивого обучения, т.к. машина на самом деле ничему не учится, а просто запоминает тренировочные данные. Тут-то я и осознала, что это дельта и есть.

Поэтому, если вы вдруг не понимаете смысл дельты, рекомендую посмотреть эту главу. Там и про векторное пространство, и про расстояния очень доходчиво с картинками.

www.labirint.ru

Книга: Машинное обучение на R: экспертные техники для прогностического анализа - Бретт Ланц. Купить книгу, читать рецензии | Лабиринт

Книга: Машинное обучение на R: экспертные техники для прогностического анализа (Machine Learding wirh R. Expert techniques for predictive modeling).📙 Автор: Бретт Ланц. Аннотация, 🔝 отзывы читателей, иллюстрации. Купить книгу по привлекательной цене среди…

939 viewsOlga Alieva, edited 13:30

RAntiquity

Forwarded from БРУСНИЦЫН культурный квартал

DH-центр ИТМО в Лектории Брусницына

Раз в две недели по субботам будем собираться в Лектории Брусницына и говорить с экспертами DH-центра про исследования в области цифровой гуманитаристики. Что это такое и кто этим занимается?

DH-центр — центр цифровых гуманитарных
исследований университета ИТМО, который организует магистратуру в Санкт-Петербурге, курирует цифровые проекты с культурными институциями и проводит исследования.

В Лектории будут выступать преподаватели магистратуры и команда центра. На лекциях вы узнаете о том, как цифровые методы и инструменты существуют в мире гуманитарных исследований.

Программа:

19 октября
«Как оцифровать болезнь? Цифровая гуманитаристика в медицине»

2 ноября
«GLAMVR: галереи, архивы, музеи, библиотеки и их цифровая жизнь»

16 ноября
«Игра как совместное событие в физическом и цифровом пространстве»

30 ноября
«Интерфейсы цифровых архивов: аутентичность, пользователи и правила»

14 и 28 декабря
темы уточняются (следите за анонсами)

Первая лекция «Как оцифровать болезнь? Цифровая гуманитаристика в медицине» пройдет 19 октября.

Поговорим о том, как технологии стали неотъемлемой частью медицинских процессов и как соотносятся версии болезни в «реальном» и «виртуальном» измерениях?

Спикер — Илья Смирнов, преподаватель программы магистратуры по Digital Humanities ИТМО, социальный исследователь науки и технологий (STS), аспирант ЕУ СПб, основатель проекта Versia.

Вход свободный, необходма регистрация

🗓 19 октября, 15:00
📍Культурный квартал Брусницын, Лекторий (Дом с колоннами, 3 этаж, вход в арке)

1.1K viewsOlga Alieva, 11:35

RAntiquity

🎯В Вышке закончился первый учебный модуль, а значит — пройдена первая четверть курса «Компьютерный анализ текста в R». Этот курс я читаю второй год студентам магистерской программы «Цифровые методы в гуманитарных науках», и продолжаю дорабатывать.

Итак, мы прошли следующие темы.

1. Начало работы в R (текст, видео).

2. Таблицы. Опрятные данные (текст, видео). Датасет: М. Кондра, Е. Казакова, «Программы по литературе для средней школы с 1919 по 1991 гг.». Узнали, в какой год в новейшей истории России распухли школьные программы.

3. Визуализации (текст, видео). Датасет: Т. Андервуд и др., “NovelTM Datasets for English-Language Fiction, 1700-2009”. Повторили знаменитое исследование Ф. Моретти о длине названия («Корпорация стиля») и узнали, в какие года среди романистов было больше всего женщин.

4. Циклы, условия, функции (текст, видео).

5. Функционалы в анализе данных (текст, видео). Исследовали датасет Британской библиотеки, посвященный Гарри Поттеру. После хакерской атаки на библиотеку он исчез с их сайта, но у меня сохранилась копия с прошлого года.

6. Импорт: JSON (текст, видео). Датасет: «Шедевры Пушкинского музея». И небольшой датасет со списком эпизодов «Теории большого взрыва».

7. Импорт: XML (текст, видео). Датасет: Д. Скоринкин, “Персонажи «Войны и мира» Л. Н. Толстого: вхождения в тексте, прямая речь и семантические роли”. Также пригодились XML из корпуса русской драмы Dracor.

8. Публикация с Quarto (текст, видео).

📚 Под каждую тему (кроме первой) был подобран гуманитарный датасет. Причем данные пришлось искать не только для лекционной части (см. выше), но и под каждое домашнее задание (это оставлю за кадром, чтобы сохранить интригу для будущих поколений). Поиск данных оказался самой сложной частью работы, и я хочу поблагодарить коллег, которые ими делятся. Это бесценно.

💙 С проверкой домашних работ мне очень помогает студентка второго курса магистратуры София Федотова. А еще мы с Софией научились настраивать автоматические тесты и оценивание, это просто спасает, потому что группа довольно большая, около 20 человек, и кода много.

📅 Впереди еще три модуля, и, если доживем, по итогам каждого я буду делиться такими обзорами. Для меня это важно еще и потому, что сейчас деление курса на темы немного расходится с реальными темпами прохождения материала — а значит структуру курса придется еще раз перерабатывать с опорой на эти заметки.

🐈 По правде говоря, я вообще мало что успеваю помимо постоянных доработок и переработок (и поэтому нечасто сюда пишу). Но результат, кажется, неплохой: во всяком случае, недавно кто-то из студентов сказал, что уже пользуется R на работе. Для всего двух месяцев освоения — неплохо.

Идем дальше.

#tar2024

Please open Telegram to view this post

VIEW IN TELEGRAM

locusclassicus.github.io

Компьютерный анализ текста

2.4K viewsOlga Alieva, edited 13:07

RAntiquity

Благодарю Евгения Николаевича за рекомендацию. Попасть в обзоры блога “Наука и данные” — все равно, что отраслевую премию получить. Т.е. чертовски приятно, но очень большая ответственность.

Наука и данные

Компьютерный анализ текста в R 📖

Уважаемые коллеги,

Ольга Валерьевна Алиева (автор канала RAntiquity) читает курс «Компьютерный анализ текста в R» студентам магистерской программы «Цифровые методы в гуманитарных науках». Курс постоянно дорабатывается, однако…

1.3K viewsOlga Alieva, edited 18:34

RAntiquity

Forwarded from Системный Блокъ

«Системный Блокъ» объявляет осенний набор участников!

«Системный Блокъ» расширяется и приглашает новых авторов, редакторов, менеджеров, дата-аналитиков. Мы — волонтерское издание. Нас объединяет интерес к науке и технологиям, а также желание вдохновлять людей интересными материалами, исследованиями, новостями, тестами и т. п. Среди нас есть филологи, программисты, менеджеры, историки, журналисты и аналитики — люди из совершенно разных сфер.

Ниже вы найдете набор ролей, которые могут быть интересны вам или вашим друзьям. Если что-то из этого вам близко, добро пожаловать к нам! Если вы хотите присоединиться, но идеальной роли нет, то все равно оставляйте заявку!

В посте — неполный перечень ролей, которые сейчас открыты, а в статье — подробное описание задач и пожеланий к участникам.

1. Авторы в рубрики — ищем желающих писать для рубрик «Филология», «Общество», «Образование», «Биоинформатика», «Как это работает», «Тесты».
2. Кураторы рубрик «Археология», NLP, «Тесты»
3. Редакторы текстов
4. SMM-Lead / Менеджер отдела SMM
5. Выпускающие редакторы для соцсетей (SMM)
6. Продюсер дата-исследований
7. PR-менеджер
8. HR-менеджер
9. Менеджер студенческих практик
10. Продакт-менеджер и программист сайта
11. Дизайнер
12. Ивент-менеджер
13. Продакт/проджект-менеджер на новые проекты
14. Программист в команду «Пишу тебе»

Если вас заинтересовала одна из ролей – приглашаем заполнить форму до 4 ноября. Проект полностью волонтерский, мы не платим денег. Зато у нас человечный менеджмент, отлаженные процессы и хорошая репутация в русском научпоп-сообществе. Присоединяйтесь!

🤖 «Системный Блокъ» @sysblok

Please open Telegram to view this post

VIEW IN TELEGRAM

Telegraph

Набор в «Системный Блокъ». Роли

📍 Авторы в тематические рубрики Авторы — основа команды «Системного Блока». Именно они создают материалы, содержательную начинку нашего издания. Мы стараемся наладить процесс работы так, чтобы авторам было комфортно писать и совершенствовать свои навыки.…

1.0K viewsOlga Alieva, 11:24

RAntiquity

Коллеги рассказали о замечательной весенней школе в университете Потсдама “Text as Data” (31 марта - 4 апреля 2025).

Стилометрия, сетевой анализ, тематическое моделирование и др. — и все это в компании лучших специалистов отрасли. Заявки принимаются до 30 ноября. Для студентов есть трэвел-гранты.

www.uni-potsdam.de

Call for participation

1.0K viewsOlga Alieva, 17:07

RAntiquity

Сегодня покажу вам дендрограмму 1989 г. выпуска.

Это Леджер, “Re-counting Plato”: одно из первых количественных исследований платоновского корпуса.

Иерархическая кластеризация, метод Уорда. Все как сегодня — но не сразу поймешь, где тут дерево.

Читается просто: каждый отрывок представлен столбцом из крестов, которые меняются на точки с того места, где ветви расходятся.

Если приглядеться, можно заметить, что первыми от всех отщепляются “Домострой” Ксенофонта и “Архидам” Исократа. А “История” Фукидида немного похожа на “Против Эратосфена” Лисия.

С точки зрения выводов уже не очень интересно, но есть в этом какое-то винтажное обаяние.

935 viewsOlga Alieva, edited 20:58

RAntiquity

Please open Telegram to view this post

VIEW IN TELEGRAM

791 viewsOlga Alieva, edited 11:54

RAntiquity

Диаграмма Ленто названа так в честь Джины Ленто, впервые применившей метод для изучения эволюции ластоногих. Диаграмма позволяет оценить достоверность филогенетического дерева на основе бутстрепа.

Топология любого дерева, построенного на основе матрицы расстояния, зависит от выбранных признаков, метода связи и метрики расстояния. Бутстреп — повторные выборки — используются для того, чтобы проверить устойчивость каждой ветви дерева. Для этого строят обычно от 100 до 1000 деревьев, для обобщения которых, наряду с консенсусным деревом, используется диаграмма Ленто.

Построить такую диаграмму можно при помощи одноименной функции из пакета phangorn в R. При сравнении текстов — а для этого в стилометрии регулярно используются деревья — никаких допущений о происхождении не делается; смотрим только на степень поддержки каждого сплита.

На картинке — небольшой пример. По оси икс — сплиты (грубо говоря, какие диалоги «сидят» на одной ветви в дереве). Они расположены по убыванию поддержки.

По оси игрек — поддержка каждого сплита в виде столбика. Положительные значения — это число деревьев, где наблюдается такой сплит. Отрицательные значения — поддержка конфликтующих сплитов, которые невозможно отразить в том же дереве.

Первые десять сплитов — тривиальные (отдельная ветвь для каждого наблюдения). Здесь конфликта быть не может, и все столбики расположены выше нуля.

Но помимо них, 100%-ю поддержку имеет сплит, включающий три книги «Законов». Это значит, что такая группа есть во всех деревьях, созданных при помощи бутстрепа. За ней следует группа «Парменид» — «Кратил» и т.д. Диалоги, включенные в сплит, обозначены ⚫️темными точками.

Диаграмма Ленто хорошо показывает, что в любом дереве есть элемент случайности. Дерево — это только гипотеза, которую можно и нужно проверять. Недостаток такой диаграммы в том, что она быстро становится нечитаемой.

P.S. Диалоги выбраны случайным образом для примера, и никаких масштабных выводов на основе этой выборки делать не стоит.

#филогенетика

Please open Telegram to view this post

VIEW IN TELEGRAM

867 viewsOlga Alieva, edited 03:14

RAntiquity

@agricolamz , послушав мои истории про применение филогенетических методов к платоновскому корпусу, прислал мем. А я смотрю и думаю: треугольник, я же тебя знаю. Ты — “Клитофонт”! #филогенетика

653 viewsOlga Alieva, edited 07:01

RAntiquity

0:12

This media is not supported in your browser

VIEW IN TELEGRAM

“Это мобиль. Приходишь домой - успокаивает нервы” 🥂

694 viewsOlga Alieva, 07:05

RAntiquity

Forwarded from провода+болота

в Лиге Айвы поговорили с Борисом Ореховым о том, как неклассические университеты переиозобретают классику, чем ~~кролик на зайца непохож~~ университет отличаются от всего остального.

в ходе записи подкаста пытаемся различить пранк и кринж.

https://www.group-telegram.com/universitates_podcast/110

Лига Айвы 🎓 Подкаст об университете 🎙

Эпизод 23. Полина Колозариди о неклассических университетах

Наука должна жить длинным временем

О чем разговор:
🔊 Классические и неклассические университеты
🔊 Гуманитарии в техническом университете — это пранк?
🔊 Зачем в университете библиотека?
🔊 Есть ли…

658 viewsOlga Alieva, 10:49

2025/06/29 16:36:53
Back to Top

HTML Embed Code:

<iframe width="100%" src="https://www.group-telegram.com/buyppe/webview?embed=1" title="Channel Webview" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>