RAntiquity
Коллеги писали в комментариях к моему первому посту про доступ к Scopus через API, что компания Elsevier не очень щедро делится информацией, и это так. Но все же аффилиацию для авторов, количество цитирований и кое-что еще они отдают (и я даже узнала, какая…
(продолжение)
💠 Если по issn gpt опознает издателя очень хорошо, то по названию книги, автору и году просто гадает, таким образом восполнить пробелы в данных #scopus не получилось
💠 Однако оказалось возможным подтянуть, во-первых, некоторые недостающие издательства, а во-вторых, аффилиации через openAlex.
💠 Недостающую информацию также получилось собрать по ORCID, причем работать с публичным API оказалось проще через {
💠 На финальном этапе пришлось нормализовывать написания стран (где-то полностью, где-то коды), добавлять вручную страновые аффилиации (где я в них уверена, например, если знаю, что человек всю жизнь проработал во Франции или в России) — и вообще многое делать руками.
💠 В итоге из 7,400 публикаций примерно 1300 остались без страновой аффилиации, еще около 1000 - без издателя. Это не так уж плохо.
💠 Зато первая разведка дала интересный результат: согласно Scopus, мы на 4-м месте в мире по числу платоноведческих публикаций.
💠 Это почти пасхальное чудо, учитывая непростые условия, в которых существуют наши гуманитарные науки. Количество, конечно, — это только число, надо смотреть цитируемость и многое другое. Это позже. Но количество тоже о чем-то говорит. Вот, например, в США есть научная инфраструктура, и публикаций о Платоне много. А вот в Кувейте или Зимбабве — почти нет. И кажется, хороший знак, что мы по этому показателю ближе к США, чем к Зимбабве.
С Праздником!
💠 Если по issn gpt опознает издателя очень хорошо, то по названию книги, автору и году просто гадает, таким образом восполнить пробелы в данных #scopus не получилось
💠 Однако оказалось возможным подтянуть, во-первых, некоторые недостающие издательства, а во-вторых, аффилиации через openAlex.
💠 Недостающую информацию также получилось собрать по ORCID, причем работать с публичным API оказалось проще через {
httr2
}, чем через rorcid (который уже не развивается). Но и там страновая аффилиация указана далеко не всегда, многие журналы ее не требуют и не пишут.💠 На финальном этапе пришлось нормализовывать написания стран (где-то полностью, где-то коды), добавлять вручную страновые аффилиации (где я в них уверена, например, если знаю, что человек всю жизнь проработал во Франции или в России) — и вообще многое делать руками.
💠 В итоге из 7,400 публикаций примерно 1300 остались без страновой аффилиации, еще около 1000 - без издателя. Это не так уж плохо.
💠 Зато первая разведка дала интересный результат: согласно Scopus, мы на 4-м месте в мире по числу платоноведческих публикаций.
💠 Это почти пасхальное чудо, учитывая непростые условия, в которых существуют наши гуманитарные науки. Количество, конечно, — это только число, надо смотреть цитируемость и многое другое. Это позже. Но количество тоже о чем-то говорит. Вот, например, в США есть научная инфраструктура, и публикаций о Платоне много. А вот в Кувейте или Зимбабве — почти нет. И кажется, хороший знак, что мы по этому показателю ближе к США, чем к Зимбабве.
С Праздником!
RAntiquity
Первые обобщения #plato_mapping #scopus
ясно одно: как ни меняй проекцию, платоновских исследований в Гренладии нет. непорядок
make Greenland great again
make Greenland great again
RAntiquity
Первые обобщения #plato_mapping #scopus
Коллеги в лс и в чате предложили поменять проекцию. Чтобы два раза не вставать — поменяла сразу палитру и шрифты.
То, что еще утром было quick and dirty, теперь прямо-таки красота (не спорьте).
#maps
То, что еще утром было quick and dirty, теперь прямо-таки красота (не спорьте).
#maps
This media is not supported in your browser
VIEW IN TELEGRAM
Давно хотела попробовать пакет {gganimate}, но не могла придумать, куда его применить. Наконец придумала 🎸
#plato_mapping
p.s. видео, а не гиф, чтобы можно было поставить на паузу или промотать, ну и ради музыки конечно
#plato_mapping
p.s. видео, а не гиф, чтобы можно было поставить на паузу или промотать, ну и ради музыки конечно
Please open Telegram to view this post
VIEW IN TELEGRAM
Дорогие друзья, мне надо срочно освободить lebensraum, отдам книги по программированию, самовывоз Отрадное
1) питон-сет
2) питон-nlp-сет
3) text mining in R set
Можете просто забрать, но если что-то из этого кажется вам ценным, взамен можете мне подарить бутылочку отечественного вина 😊
Фото сетов в комментариях
upd: книги по R обещаны
upd2: сет 1 тоже обещан
upd3: все книги скоро обретут новых читателей, спасибо))
1) питон-сет
2) питон-nlp-сет
3) text mining in R set
Можете просто забрать, но если что-то из этого кажется вам ценным, взамен можете мне подарить бутылочку отечественного вина 😊
Фото сетов в комментариях
upd: книги по R обещаны
upd2: сет 1 тоже обещан
upd3: все книги скоро обретут новых читателей, спасибо))
2025-05-28_Invitation_Alieva.pdf
164.8 KB
🗓 С любезного разрешения организаторов делюсь приглашением на семинар, огранизованный Техническим университетом Нюрнберга.
✍️ 28 мая в 4 p.m. (европейское время) буду рассказывать о большом стилометрическом эксперименте на материале платоновского корпуса.
📝 На русском языке этот материал пока не опубликован, на английском буду представлять впервые перед смешанной аудиторией классиков и специалистов по ML.
🔗 Ссылка на Zoom в прикрепленном файле. Ссылка на презентацию здесь.
✍️ 28 мая в 4 p.m. (европейское время) буду рассказывать о большом стилометрическом эксперименте на материале платоновского корпуса.
📝 На русском языке этот материал пока не опубликован, на английском буду представлять впервые перед смешанной аудиторией классиков и специалистов по ML.
🔗 Ссылка на Zoom в прикрепленном файле. Ссылка на презентацию здесь.
Наш человек в “Системном блоке” продолжает жечь глаголом https://www.group-telegram.com/sysblok/1170
Telegram
Системный Блокъ
Только не списывай точь-в-точь: автоматический поиск аллюзий и цитат в древнеримской литературе
Выявление цитат и аллюзий — важная задача филологов, справляться с которой до недавнего времени приходилось традиционными методами. Особенно сложной она оказывается…
Выявление цитат и аллюзий — важная задача филологов, справляться с которой до недавнего времени приходилось традиционными методами. Особенно сложной она оказывается…
Forwarded from античные лолы и кеки
вышел мой второй материал в Системном Блоке!! это примерно то же, что я рассказывала в конце марта уважаемым классикам на конференции в РГГУ, только теперь в форме лонгрида и со смешным названием
а вообще хочу сказать, что мне дико нравится работать с командой СБъ: при том что это полностью волонтерский проект, там задействовано очень много людей, которые к тому же знают, что делают (общая координация, редактура и их иллюстрации - это просто chef’s kiss 🙏🏻), все процессы отлично налажены + есть хорошее внутреннее комьюнити и его прям очень стараются развивать и поддерживать. короче они крутые очень, все идите и читайте!!
а вообще хочу сказать, что мне дико нравится работать с командой СБъ: при том что это полностью волонтерский проект, там задействовано очень много людей, которые к тому же знают, что делают (общая координация, редактура и их иллюстрации - это просто chef’s kiss 🙏🏻), все процессы отлично налажены + есть хорошее внутреннее комьюнити и его прям очень стараются развивать и поддерживать. короче они крутые очень, все идите и читайте!!
Telegram
Системный Блокъ
Только не списывай точь-в-точь: автоматический поиск аллюзий и цитат в древнеримской литературе
Выявление цитат и аллюзий — важная задача филологов, справляться с которой до недавнего времени приходилось традиционными методами. Особенно сложной она оказывается…
Выявление цитат и аллюзий — важная задача филологов, справляться с которой до недавнего времени приходилось традиционными методами. Особенно сложной она оказывается…
Есть какая-то богословская шутка в том, что один из самых популярных оптимизаторов в глубоком обучении называется Adam. Вообще-то это акроним, Adaptive Moment Estimation. Но, учитывая, что речь идет об оптимизации функции потерь, то есть уменьшении ошибки, сами понимаете. Первый человек был без греха, а нам остается только оптимизировать. Извините.
RAntiquity
Третий модуль «Компьютерного анализа текста» #tar2024 (он же и 2025) подходит к концу, а значит я снова публикую текст и видео к урокам. Почти весь модуль посвящен деревьям и сетям 🕸️ 1) Тематическое моделирование с LDA (текст, видео). Датасет: новости Lenta.Ru.…
Вчера завершился четвертый модуль «Компьютерного анализа текста» #tar2024 (он же и 2025) — значит, время снова подводить итоги ✍️
Вот что мы успели🖼️ 🖼️ 🖼️ :
1️⃣ Пространственные данные (текст, видео). Датасет: римские амфитеатры из Collected Ancient World data sets, на дом — данные Министерства культуры о библиотеках в России 🗺
2️⃣ Регрессионный анализ (текст, видео). Данные из пакета {
3️⃣ Регрессионные модели с {
4️⃣ Бинарная классификация (текст, видео). Поговорили о линейно-дискриминантном анализе и наивном Байесе, а также воспроизвели знаменитый кейс «Записок Федералиста» в экосистеме {
5️⃣ Многоклассовая классификация (текст, видео). Поговорили о логистической регрессии с регуляризацией и опорных векторах. На занятии классифицировали русских писателей, а на дом отправился небольшой датасет британской прозы) 📉
6️⃣ Глубокое обучение (текст, видео). На новостном датасете из {🖼️
7️⃣ Приложения Shiny (текст, видео). Использовали обученные прошлый раз препроцессор и модель для строительства небольшого приложения Shiny. Потренировались разворачивать его с Connect Posit Cloud. 🛠
Осталась еще проверка последнего дз и еще некоторые мелочи, но в целом можно уже сказать, что мечта сбылась: от самых основ в сентябре мы плавно подошли к строительству приложений с нейросетевой начинкой💃
Конечно, многого коснулись только обзорно — и многое мне предстоит дорабатывать летом 🥹, но главная задача решена: показать удивительные возможности языка R вместе с конкретными примерами использования его в гуманитарных исследованиях📖
Спасибо моим студентам — за неустрашимость и творческий подход к делу.
Вот что мы успели
archdata
}: распределение поздней романо-британской керамики, произведенной в Оксфорде 🏺tidymodels
} (текст, видео). Предсказывали цену амазоновских книг по их названию, а потом провели минихакатон, предсказывая рейтинг отеля по тексту отзыва 📚🏖tidymodels
}. Давно хотела это сделать 🤓textdata
} изучили полносвязные нейросети и onehot-кодирование. Обучили свою первую модель Keras 🧠Осталась еще проверка последнего дз и еще некоторые мелочи, но в целом можно уже сказать, что мечта сбылась: от самых основ в сентябре мы плавно подошли к строительству приложений с нейросетевой начинкой
Конечно, многого коснулись только обзорно — и многое мне предстоит дорабатывать летом 🥹, но главная задача решена: показать удивительные возможности языка R вместе с конкретными примерами использования его в гуманитарных исследованиях
Спасибо моим студентам — за неустрашимость и творческий подход к делу.
Please open Telegram to view this post
VIEW IN TELEGRAM
VK Видео
Компьютерный анализ текста #24 Пространственные данные
Занятие 4 апреля 2025
RAntiquity
Вчера завершился четвертый модуль «Компьютерного анализа текста» #tar2024 (он же и 2025) — значит, время снова подводить итоги ✍️ Вот что мы успели 🖼️ 🖼️ 🖼️ : 1️⃣ Пространственные данные (текст, видео). Датасет: римские амфитеатры из Collected Ancient World…
А вот и приложение и код к нему: https://locusclassicus-news-app.share.connect.posit.cloud/
Коллега из ПСТГУ пишет в своем блоге, что раздел по {🥳
tmap
} пригодился для создания карты римских понтификов. Что ж, я очень рада: и тому, что все понтифики теперь на местах, и тому, что материалы курса оказываются полезны тем, для кого они предназначены Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Все побежали — и я побежала. Точнее, погнала: сделала модный bar chart race 🏇на основании публикаций о Платоне в #scopus
🎬 Делюсь секретами создания этой анимации:
🔧 Основные пакеты:
-
-
-
-
💡 Ключевые решения:
✅
✅
✅
✅
✅
Результат: 20-секундное видео, показывающее число страновых аффилиаций по годам в исследованиях Платона🇷🇺
🎬 Делюсь секретами создания этой анимации:
🔧 Основные пакеты:
-
ggplot2
— строим статичный график-
gganimate
— оживляем его-
scales
— красивое форматирование чисел-
viridis
— стильная цветовая палитра💡 Ключевые решения:
✅
coord_flip(clip = "off")
— переворачиваем график и позволяем тексту выходить за границы✅
scale_y_continuous(trans = "log10")
— логарифмическая шкала сжимает большие различия✅
transition_states()
— плавные переходы между годами с настройкой скорости✅
geom_text()
с динамическим позиционированием — подписи всегда на нужном месте✅
scale_x_reverse()
— ранжируем от 1-го места сверхуРезультат: 20-секундное видео, показывающее число страновых аффилиаций по годам в исследованиях Платона
Please open Telegram to view this post
VIEW IN TELEGRAM
🌍 Академический год почти завершен, но до конца июня предстоит еще несколько защит и экзаменов — и заключительный академический рывок, конференция «Reading Plato from the Global South» в Чунцине (Китай) 🇨🇳
🎓 Конференция пройдет под эгидой кафедры ЮНЕСКО ARCHAI (Университет Бразилиа) и Центра китайских и греческих цивилизаций.
🌟 25-27 июня в Юго-западном университете Чунцина соберутся представители платоноведения из 15 стран — от Токийского университета до Бостона, от Университета Буэнос-Айреса до Университета Крита.
🏛️ С коллегами из Ганы, Индии, Бразилии и других стран обсудим новые перспективы понимания античного наследия в том числе через призму незападных философских традиций.
🚀 Замысел этой встречи — создать уникальную глобальную сеть исследований и способствовать развитию платоноведения во всем мире, включая Россию 🇷🇺
👾 По этому поводу планирую представить количественный обзор глобальных трендов в платоноведении; предварительные слайды доступны по ссылке: “Mapping Platonic Scholarship in Scopus: A Bird’s-Eye View”
С новостями по теме вернусь, если долечу, уже скоро #plato_mapping #scopus #china2025
🎓 Конференция пройдет под эгидой кафедры ЮНЕСКО ARCHAI (Университет Бразилиа) и Центра китайских и греческих цивилизаций.
🌟 25-27 июня в Юго-западном университете Чунцина соберутся представители платоноведения из 15 стран — от Токийского университета до Бостона, от Университета Буэнос-Айреса до Университета Крита.
🏛️ С коллегами из Ганы, Индии, Бразилии и других стран обсудим новые перспективы понимания античного наследия в том числе через призму незападных философских традиций.
🚀 Замысел этой встречи — создать уникальную глобальную сеть исследований и способствовать развитию платоноведения во всем мире, включая Россию 🇷🇺
👾 По этому поводу планирую представить количественный обзор глобальных трендов в платоноведении; предварительные слайды доступны по ссылке: “Mapping Platonic Scholarship in Scopus: A Bird’s-Eye View”
С новостями по теме вернусь, если долечу, уже скоро #plato_mapping #scopus #china2025
Cátedra Unesco Archai
First Global Network for Platonic Studies Meeting: Reading Plato from the Global South
Unesco Cátedra Archai. First Plato's Global Scholarship Network Meeting: Reading Plato from the Global South. 2025