🧠 Если вы еще не заглядывали в раздел Digital Humanities на “Системном Блоке”, ставший призёром DH Awards 2024 🏆 – сейчас самое время!
Команда продолжает развивать и наполнять портал, и там вас ждут:
📘 Руководства по основным инструментам и подходам DH
📊 Примеры исследований: от анализа текстов до визуализации исторических данных
🧑💻 Подборки статей от исследователей и практиков
Заходите, знакомьтесь, пользуйтесь 👉 https://sysblok.ru/dh/
💬 Кстати, если есть темы, которые вам особенно интересны – пишите в комментариях, передадим команде!
Команда продолжает развивать и наполнять портал, и там вас ждут:
📘 Руководства по основным инструментам и подходам DH
📊 Примеры исследований: от анализа текстов до визуализации исторических данных
🧑💻 Подборки статей от исследователей и практиков
Заходите, знакомьтесь, пользуйтесь 👉 https://sysblok.ru/dh/
💬 Кстати, если есть темы, которые вам особенно интересны – пишите в комментариях, передадим команде!
Системный Блокъ
Digital Humanities, или Цифровые методы в гуманитарных науках: точка входа - Системный Блокъ
Что такое DH? Digital Humanities (DH) — это направление исследований, предполагающее использование цифровых методов для приобретения новых знаний в
RAntiquity
Ну вот например. И это только публикации с вхождением “Платон” в названии, то есть лишь некоторая часть того, что о нем пишется.
This media is not supported in your browser
VIEW IN TELEGRAM
Коллеги писали в комментариях к моему первому посту про доступ к Scopus через API, что компания Elsevier не очень щедро делится информацией, и это так. Но все же аффилиацию для авторов, количество цитирований и кое-что еще они отдают (и я даже узнала, какая самая цитируемая статья о Платоне, но об этом в другой раз).
Мысль сделать mapping современного платоноведения меня, тем не менее, не отпускает, поэтому я придумала две хитрости.
💠 Scopus отдает issn (eIssn), а с ними уже можно через {
💠 Попросить LLM добавить имя издателя по названию журнала и его issn. Получается небыстро, но, пожалуй, быстрее, чем вбивать руками в excel. Пример работы на видео.
Мне это по-прежнему кажется каким-то волшебством 🪄
Скорее всего, мои наукометрические опыты на этом не кончатся, поэтому добавляю новые теги #scopus #api #mapping_plato
Мысль сделать mapping современного платоноведения меня, тем не менее, не отпускает, поэтому я придумала две хитрости.
💠 Scopus отдает issn (eIssn), а с ними уже можно через {
rcrossref
} достать имя издателя. Сработало почти везде, но около 300 журналов и серий остались без домика, поэтому пришлось придумать хитрость №2.💠 Попросить LLM добавить имя издателя по названию журнала и его issn. Получается небыстро, но, пожалуй, быстрее, чем вбивать руками в excel. Пример работы на видео.
Мне это по-прежнему кажется каким-то волшебством 🪄
Скорее всего, мои наукометрические опыты на этом не кончатся, поэтому добавляю новые теги #scopus #api #mapping_plato
RAntiquity
Коллеги писали в комментариях к моему первому посту про доступ к Scopus через API, что компания Elsevier не очень щедро делится информацией, и это так. Но все же аффилиацию для авторов, количество цитирований и кое-что еще они отдают (и я даже узнала, какая…
Сегодня целый день занимаюсь проверкой и нормализацией датасета #scopus и узнала, что
💠 В мире есть два журнала “Левиафан”, и один из них посвящен Мелвиллу 🐳🐳🐳
💠 “Феникс”, журнал Канадской классической ассоциации, издается в США с 2003 г.😱 😱 😱
💠 В Голландии есть журнал о науке и вере под названием“Редиска” (ладно, шучу, Radix) 🥔 🥔 🥔
💠 Журналы под названием “Логос” издаются в Испании, Литве, России и США
на сегодня это все открытия
💠 В мире есть два журнала “Левиафан”, и один из них посвящен Мелвиллу 🐳🐳🐳
💠 “Феникс”, журнал Канадской классической ассоциации, издается в США с 2003 г.
💠 В Голландии есть журнал о науке и вере под названием
💠 Журналы под названием “Логос” издаются в Испании, Литве, России и США
на сегодня это все открытия
Please open Telegram to view this post
VIEW IN TELEGRAM
Aup-Online
Radix | Amsterdam University Press Journals Online
Vanaf 2025 is Amsterdam University Press de uitgever van Radix - dat is m.i.v. volume 51Radix is het wetenschappelijk kwartaaltijdschrift van ForumC. Het tijdschrift biedt een platform voor artikelen op het snijvlak van geloof, wetenschap en samenleving.…
RAntiquity
Коллеги писали в комментариях к моему первому посту про доступ к Scopus через API, что компания Elsevier не очень щедро делится информацией, и это так. Но все же аффилиацию для авторов, количество цитирований и кое-что еще они отдают (и я даже узнала, какая…
(продолжение)
💠 Если по issn gpt опознает издателя очень хорошо, то по названию книги, автору и году просто гадает, таким образом восполнить пробелы в данных #scopus не получилось
💠 Однако оказалось возможным подтянуть, во-первых, некоторые недостающие издательства, а во-вторых, аффилиации через openAlex.
💠 Недостающую информацию также получилось собрать по ORCID, причем работать с публичным API оказалось проще через {
💠 На финальном этапе пришлось нормализовывать написания стран (где-то полностью, где-то коды), добавлять вручную страновые аффилиации (где я в них уверена, например, если знаю, что человек всю жизнь проработал во Франции или в России) — и вообще многое делать руками.
💠 В итоге из 7,400 публикаций примерно 1300 остались без страновой аффилиации, еще около 1000 - без издателя. Это не так уж плохо.
💠 Зато первая разведка дала интересный результат: согласно Scopus, мы на 4-м месте в мире по числу платоноведческих публикаций.
💠 Это почти пасхальное чудо, учитывая непростые условия, в которых существуют наши гуманитарные науки. Количество, конечно, — это только число, надо смотреть цитируемость и многое другое. Это позже. Но количество тоже о чем-то говорит. Вот, например, в США есть научная инфраструктура, и публикаций о Платоне много. А вот в Кувейте или Зимбабве — почти нет. И кажется, хороший знак, что мы по этому показателю ближе к США, чем к Зимбабве.
С Праздником!
💠 Если по issn gpt опознает издателя очень хорошо, то по названию книги, автору и году просто гадает, таким образом восполнить пробелы в данных #scopus не получилось
💠 Однако оказалось возможным подтянуть, во-первых, некоторые недостающие издательства, а во-вторых, аффилиации через openAlex.
💠 Недостающую информацию также получилось собрать по ORCID, причем работать с публичным API оказалось проще через {
httr2
}, чем через rorcid (который уже не развивается). Но и там страновая аффилиация указана далеко не всегда, многие журналы ее не требуют и не пишут.💠 На финальном этапе пришлось нормализовывать написания стран (где-то полностью, где-то коды), добавлять вручную страновые аффилиации (где я в них уверена, например, если знаю, что человек всю жизнь проработал во Франции или в России) — и вообще многое делать руками.
💠 В итоге из 7,400 публикаций примерно 1300 остались без страновой аффилиации, еще около 1000 - без издателя. Это не так уж плохо.
💠 Зато первая разведка дала интересный результат: согласно Scopus, мы на 4-м месте в мире по числу платоноведческих публикаций.
💠 Это почти пасхальное чудо, учитывая непростые условия, в которых существуют наши гуманитарные науки. Количество, конечно, — это только число, надо смотреть цитируемость и многое другое. Это позже. Но количество тоже о чем-то говорит. Вот, например, в США есть научная инфраструктура, и публикаций о Платоне много. А вот в Кувейте или Зимбабве — почти нет. И кажется, хороший знак, что мы по этому показателю ближе к США, чем к Зимбабве.
С Праздником!
RAntiquity
Первые обобщения #plato_mapping #scopus
ясно одно: как ни меняй проекцию, платоновских исследований в Гренладии нет. непорядок
make Greenland great again
make Greenland great again
RAntiquity
Первые обобщения #plato_mapping #scopus
Коллеги в лс и в чате предложили поменять проекцию. Чтобы два раза не вставать — поменяла сразу палитру и шрифты.
То, что еще утром было quick and dirty, теперь прямо-таки красота (не спорьте).
#maps
То, что еще утром было quick and dirty, теперь прямо-таки красота (не спорьте).
#maps
This media is not supported in your browser
VIEW IN TELEGRAM
Давно хотела попробовать пакет {gganimate}, но не могла придумать, куда его применить. Наконец придумала 🎸
#plato_mapping
p.s. видео, а не гиф, чтобы можно было поставить на паузу или промотать, ну и ради музыки конечно
#plato_mapping
p.s. видео, а не гиф, чтобы можно было поставить на паузу или промотать, ну и ради музыки конечно
Please open Telegram to view this post
VIEW IN TELEGRAM
Дорогие друзья, мне надо срочно освободить lebensraum, отдам книги по программированию, самовывоз Отрадное
1) питон-сет
2) питон-nlp-сет
3) text mining in R set
Можете просто забрать, но если что-то из этого кажется вам ценным, взамен можете мне подарить бутылочку отечественного вина 😊
Фото сетов в комментариях
upd: книги по R обещаны
upd2: сет 1 тоже обещан
upd3: все книги скоро обретут новых читателей, спасибо))
1) питон-сет
2) питон-nlp-сет
3) text mining in R set
Можете просто забрать, но если что-то из этого кажется вам ценным, взамен можете мне подарить бутылочку отечественного вина 😊
Фото сетов в комментариях
upd: книги по R обещаны
upd2: сет 1 тоже обещан
upd3: все книги скоро обретут новых читателей, спасибо))
2025-05-28_Invitation_Alieva.pdf
164.8 KB
🗓 С любезного разрешения организаторов делюсь приглашением на семинар, огранизованный Техническим университетом Нюрнберга.
✍️ 28 мая в 4 p.m. (европейское время) буду рассказывать о большом стилометрическом эксперименте на материале платоновского корпуса.
📝 На русском языке этот материал пока не опубликован, на английском буду представлять впервые перед смешанной аудиторией классиков и специалистов по ML.
🔗 Ссылка на Zoom в прикрепленном файле. Ссылка на презентацию здесь.
✍️ 28 мая в 4 p.m. (европейское время) буду рассказывать о большом стилометрическом эксперименте на материале платоновского корпуса.
📝 На русском языке этот материал пока не опубликован, на английском буду представлять впервые перед смешанной аудиторией классиков и специалистов по ML.
🔗 Ссылка на Zoom в прикрепленном файле. Ссылка на презентацию здесь.
Наш человек в “Системном блоке” продолжает жечь глаголом https://www.group-telegram.com/sysblok/1170
Telegram
Системный Блокъ
Только не списывай точь-в-точь: автоматический поиск аллюзий и цитат в древнеримской литературе
Выявление цитат и аллюзий — важная задача филологов, справляться с которой до недавнего времени приходилось традиционными методами. Особенно сложной она оказывается…
Выявление цитат и аллюзий — важная задача филологов, справляться с которой до недавнего времени приходилось традиционными методами. Особенно сложной она оказывается…
Forwarded from античные лолы и кеки
вышел мой второй материал в Системном Блоке!! это примерно то же, что я рассказывала в конце марта уважаемым классикам на конференции в РГГУ, только теперь в форме лонгрида и со смешным названием
а вообще хочу сказать, что мне дико нравится работать с командой СБъ: при том что это полностью волонтерский проект, там задействовано очень много людей, которые к тому же знают, что делают (общая координация, редактура и их иллюстрации - это просто chef’s kiss 🙏🏻), все процессы отлично налажены + есть хорошее внутреннее комьюнити и его прям очень стараются развивать и поддерживать. короче они крутые очень, все идите и читайте!!
а вообще хочу сказать, что мне дико нравится работать с командой СБъ: при том что это полностью волонтерский проект, там задействовано очень много людей, которые к тому же знают, что делают (общая координация, редактура и их иллюстрации - это просто chef’s kiss 🙏🏻), все процессы отлично налажены + есть хорошее внутреннее комьюнити и его прям очень стараются развивать и поддерживать. короче они крутые очень, все идите и читайте!!
Telegram
Системный Блокъ
Только не списывай точь-в-точь: автоматический поиск аллюзий и цитат в древнеримской литературе
Выявление цитат и аллюзий — важная задача филологов, справляться с которой до недавнего времени приходилось традиционными методами. Особенно сложной она оказывается…
Выявление цитат и аллюзий — важная задача филологов, справляться с которой до недавнего времени приходилось традиционными методами. Особенно сложной она оказывается…
Есть какая-то богословская шутка в том, что один из самых популярных оптимизаторов в глубоком обучении называется Adam. Вообще-то это акроним, Adaptive Moment Estimation. Но, учитывая, что речь идет об оптимизации функции потерь, то есть уменьшении ошибки, сами понимаете. Первый человек был без греха, а нам остается только оптимизировать. Извините.
RAntiquity
Третий модуль «Компьютерного анализа текста» #tar2024 (он же и 2025) подходит к концу, а значит я снова публикую текст и видео к урокам. Почти весь модуль посвящен деревьям и сетям 🕸️ 1) Тематическое моделирование с LDA (текст, видео). Датасет: новости Lenta.Ru.…
Вчера завершился четвертый модуль «Компьютерного анализа текста» #tar2024 (он же и 2025) — значит, время снова подводить итоги ✍️
Вот что мы успели🖼️ 🖼️ 🖼️ :
1️⃣ Пространственные данные (текст, видео). Датасет: римские амфитеатры из Collected Ancient World data sets, на дом — данные Министерства культуры о библиотеках в России 🗺
2️⃣ Регрессионный анализ (текст, видео). Данные из пакета {
3️⃣ Регрессионные модели с {
4️⃣ Бинарная классификация (текст, видео). Поговорили о линейно-дискриминантном анализе и наивном Байесе, а также воспроизвели знаменитый кейс «Записок Федералиста» в экосистеме {
5️⃣ Многоклассовая классификация (текст, видео). Поговорили о логистической регрессии с регуляризацией и опорных векторах. На занятии классифицировали русских писателей, а на дом отправился небольшой датасет британской прозы) 📉
6️⃣ Глубокое обучение (текст, видео). На новостном датасете из {🖼️
7️⃣ Приложения Shiny (текст, видео). Использовали обученные прошлый раз препроцессор и модель для строительства небольшого приложения Shiny. Потренировались разворачивать его с Connect Posit Cloud. 🛠
Осталась еще проверка последнего дз и еще некоторые мелочи, но в целом можно уже сказать, что мечта сбылась: от самых основ в сентябре мы плавно подошли к строительству приложений с нейросетевой начинкой💃
Конечно, многого коснулись только обзорно — и многое мне предстоит дорабатывать летом 🥹, но главная задача решена: показать удивительные возможности языка R вместе с конкретными примерами использования его в гуманитарных исследованиях📖
Спасибо моим студентам — за неустрашимость и творческий подход к делу.
Вот что мы успели
archdata
}: распределение поздней романо-британской керамики, произведенной в Оксфорде 🏺tidymodels
} (текст, видео). Предсказывали цену амазоновских книг по их названию, а потом провели минихакатон, предсказывая рейтинг отеля по тексту отзыва 📚🏖tidymodels
}. Давно хотела это сделать 🤓textdata
} изучили полносвязные нейросети и onehot-кодирование. Обучили свою первую модель Keras 🧠Осталась еще проверка последнего дз и еще некоторые мелочи, но в целом можно уже сказать, что мечта сбылась: от самых основ в сентябре мы плавно подошли к строительству приложений с нейросетевой начинкой
Конечно, многого коснулись только обзорно — и многое мне предстоит дорабатывать летом 🥹, но главная задача решена: показать удивительные возможности языка R вместе с конкретными примерами использования его в гуманитарных исследованиях
Спасибо моим студентам — за неустрашимость и творческий подход к делу.
Please open Telegram to view this post
VIEW IN TELEGRAM
VK Видео
Компьютерный анализ текста #24 Пространственные данные
Занятие 4 апреля 2025
RAntiquity
Вчера завершился четвертый модуль «Компьютерного анализа текста» #tar2024 (он же и 2025) — значит, время снова подводить итоги ✍️ Вот что мы успели 🖼️ 🖼️ 🖼️ : 1️⃣ Пространственные данные (текст, видео). Датасет: римские амфитеатры из Collected Ancient World…
А вот и приложение и код к нему: https://locusclassicus-news-app.share.connect.posit.cloud/