RAntiquity
Но король плагинов и безусловный фаворит — это, друзья, плагин confetti. Я теперь его везде буду добавлять, чтобы жить веселее. Вот, кстати, первый опыт, та самая презентация для школьников: на любом слайде нажмите букву
c
и поделитесь ощущениями 🎊GitHub
GitHub - ArthurData/quarto-confetti: Send some 🎊
Send some 🎊. Contribute to ArthurData/quarto-confetti development by creating an account on GitHub.
Forwarded from Гуманитарии в цифре
«Цифровая среда»: Иван Бегтин расскажет об инструментах для работы с данными в гуманитарных науках
22 января состоится первое в этом году заседание «Цифровой среды» – научно-методического семинара Института цифровых гуманитарных исследований (DHRI) СФУ о Digital Humanities.
Один из самых интересных практиков Open Data, директор АНО «Информационная культура», создатель международного проекта Dateno и автор популярного телеграм-канала Иван Бегтин выступит с докладом «Дата-инженерия в цифровой гуманитаристике».
🔜 Присоединяйтесь к онлайн-семинару ровно через неделю.
Дата: 22 января
Начало: 14.00 (мск)/ 18.00 (крск)
🔗 Зарегистрироваться и добавить в календарь: здесь
#цифроваясреда #смотреть #слушать #данные #opendata
22 января состоится первое в этом году заседание «Цифровой среды» – научно-методического семинара Института цифровых гуманитарных исследований (DHRI) СФУ о Digital Humanities.
Один из самых интересных практиков Open Data, директор АНО «Информационная культура», создатель международного проекта Dateno и автор популярного телеграм-канала Иван Бегтин выступит с докладом «Дата-инженерия в цифровой гуманитаристике».
Дата: 22 января
Начало: 14.00 (мск)/ 18.00 (крск)
🔗 Зарегистрироваться и добавить в календарь: здесь
#цифроваясреда #смотреть #слушать #данные #opendata
Please open Telegram to view this post
VIEW IN TELEGRAM
Скимминг с {tidyllm}
…на случай, когда тг-бот капризничает
Источник. #llm
…на случай, когда тг-бот капризничает
library(tidyllm)
Sys.setenv(OPENAI_API_KEY = "sk-00000000")
conversation <- llm_message("Please summarize the key points from the provided PDF document.",
.pdf = "my.pdf") |>
chat(openai(.model = "gpt-4o"))
conversation |> get_reply(1) |> cat()
Источник. #llm
Forwarded from Vox medii aevi
Нишевый контент: многие занятия по digital humanities церемониально начинаются с упоминания Роберто Бузы, иезуита, который в 1949 году начал работать над Index Thomisticus. Иногда показывают его улыбающуюся фотографию в старости, ту, что привязана к википедии. А я сегодня набрела на посвященный ему тамблер, а там посмотрите, какой он прекрасный и юный. Сличает с распечаткой факсимиле свитков Мертвого моря.
RAntiquity
Неожиданно мой икеевский торшер настигла слава: лекция Алексея Вдовина для нашего курса “Критическое введение в DH” (2024) попала на БП в рубрику “Ученые по субботам”. https://www.group-telegram.com/prbezposhady/25875 Девочки, спасибо, продакшн старался.
Хотела написать сегодня скучный пост про неравенство треугольника и его роль в мировой стилометрии, но по случаю прихода новых подписчиков немного повангую. Геометрия никому не интересна, а футурология интересна всем.
Вот уже некоторое время я думаю об построении такого воркфлоу в R, который позволил бы филологу решать задачи от распознавания текста до его анализа, разметки и публикации с использованием LLM. Чтобы на входе, например, картинка, а на выходе — html.
Многие детали пока не ясны, но уже сейчас очевидно, что задача это вполне выполнимая, причем ее выполнение требует все меньше специальных навыков. У меня где-то лежит учебник по МО с объяснением, как использовать опорные векторы для оптического распознавания символов, но понятно, что сегодня никто не будет мучиться с SVM для решения такой задачи (рукописи — отдельная тема, но я ей и не занимаюсь). Основное ограничение пока — деньги, VPN, санкции и т.п. Но вот китайцы уже взялись за дело, так что, думаю, эти ограничения не навсегда.
Что тогда? Курсы программирования для гуманитариев выйдут из моды быстрее, чем туфли системы Мэри Джейн (это касается и моего курса, да), вернется спрос на людей, которые понимают, что со всем этим распознанным богатством делать. И тут нам главное не повторить судьбу икеевской акулы — всем внезапно стало надо, спекулянты ломят ценник, авито забит подделками, а оригинальный продукт всё, снят с производства.
Поэтому, не дожидаясь будущего, предлагаю немедленно переходить к изучению греческого и латыни🦈
Вот уже некоторое время я думаю об построении такого воркфлоу в R, который позволил бы филологу решать задачи от распознавания текста до его анализа, разметки и публикации с использованием LLM. Чтобы на входе, например, картинка, а на выходе — html.
Многие детали пока не ясны, но уже сейчас очевидно, что задача это вполне выполнимая, причем ее выполнение требует все меньше специальных навыков. У меня где-то лежит учебник по МО с объяснением, как использовать опорные векторы для оптического распознавания символов, но понятно, что сегодня никто не будет мучиться с SVM для решения такой задачи (рукописи — отдельная тема, но я ей и не занимаюсь). Основное ограничение пока — деньги, VPN, санкции и т.п. Но вот китайцы уже взялись за дело, так что, думаю, эти ограничения не навсегда.
Что тогда? Курсы программирования для гуманитариев выйдут из моды быстрее, чем туфли системы Мэри Джейн (это касается и моего курса, да), вернется спрос на людей, которые понимают, что со всем этим распознанным богатством делать. И тут нам главное не повторить судьбу икеевской акулы — всем внезапно стало надо, спекулянты ломят ценник, авито забит подделками, а оригинальный продукт всё, снят с производства.
Поэтому, не дожидаясь будущего, предлагаю немедленно переходить к изучению греческого и латыни
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Школа Юного Филолога НИУ ВШЭ | ШЮФ
Дорогие друзья!✨
🏛️ В грядущий понедельник приглашаем вас погрузиться в мир античных текстов на лекции «Вычислить Платона: Что могут сказать количественные методы о подлинности диалогов корпуса?»
📜 От некоторых античных авторов до наших дней сохранились лишь фрагменты, а другим, наоборот, традиция приписывает слишком много произведений. Таков случай Платона, о подлинности некоторых диалогов которого до сих пор идут споры. Зачем кому-то понадобились эти подделки? Как исследователи выявляют подложные тексты и как в этом помогают компьютерные методы?
🗝️ Обо всем этом поговорим 27 января в 18:10 с кандидатом филологических наук, доцентом Школы философии и культурологии НИУ ВШЭ и создателем греко-латинского клуба Antibarbari Ольгой Валерьевной Алиевой.
⬆️ Регистрация по ссылке: https://shkola-yunogo-filologa-vs.timepad.ru/event/3205638/
Please open Telegram to view this post
VIEW IN TELEGRAM
RAntiquity
Дорогие друзья!✨ 🏛️ В грядущий понедельник приглашаем вас погрузиться в мир античных текстов на лекции «Вычислить Платона: Что могут сказать количественные методы о подлинности диалогов корпуса?» 📜 От некоторых античных авторов до наших дней сохранились лишь…
Верный признак того, что ты уже не юный, — тебя начинают приглашать на школы юных.
Forwarded from THALATTA ΘΑΛΑΣΣΑ
наконец-то опубликовали текст секретного древнегреческого дневника парижского эллиниста девятнадцатого века!!! с трепетом ожидала этого события, от души поздравляю команду проекта LAGOOS и бегу читать, как Хазе ходил в библиотеку, на лекции и по гостям
LAGOOS [λαγωoς]
A Life in Ancient Greek: The Secret Diary of Karl Benedikt Hase (1780–1864)
Forwarded from sonja, a kick ass young lady
Сколько кошек было у Колетт?
🔘 🔘 🔘
В 1989 году Этьен Брюне опубликовал статью, где решил пересчитать животных во французской литературе 19-20 веков. Это стало возможно благодаря созданию Цифрового тезауруса французского языка (TLFi), который на тот момент насчитывал 2 500 текстов (по современным меркам, конечно, не очень много).
В качестве центрального автора Брюне выбрал Колетт, полагая, что её любовь к животным находит отражение и в её текстах. При помощи программы STELLA (которая визуализирует расчёты) Брюне анализирует частоту встречаемости животных в пяти произведениях Колетт, сравнивая их с текстами других французских авторов (среди них — Бовуар, Камю, Пруст и Селин):
⏪ ⏩
В ходе цифровой кулинарии выясняется, что чаще всего Колетт пишет про кошек (chat / chatte) — что особенно, по мнению Брюне, выделяет её на фоне других авторов, которые либо не особенно обращаются к животным в своих текстах, либо используют их в символическом значении. Или как пишет Брюне в заключении:
⏪ ⏩
А кошек у Колетт насчитали 198🙂
В 1989 году Этьен Брюне опубликовал статью, где решил пересчитать животных во французской литературе 19-20 веков. Это стало возможно благодаря созданию Цифрового тезауруса французского языка (TLFi), который на тот момент насчитывал 2 500 текстов (по современным меркам, конечно, не очень много).
В качестве центрального автора Брюне выбрал Колетт, полагая, что её любовь к животным находит отражение и в её текстах. При помощи программы STELLA (которая визуализирует расчёты) Брюне анализирует частоту встречаемости животных в пяти произведениях Колетт, сравнивая их с текстами других французских авторов (среди них — Бовуар, Камю, Пруст и Селин):
Мы предлагаем проверить, любит ли Колетт кошек или животных вообще [...] Вряд ли Колетт питала любовь к измерениям и подсчетам. Считать монетки это ещё куда ни шло. Но считать слова вместо того, чтобы их взвешивать! Считать животных вместо того, чтобы их гладить! Без сомнения, этот безумный проект никогда не приходил Колетт в голову — даже в те беспокойные вечера, когда счет овец, как говорят, помогал ей уснуть. Но чтобы успокоить Колетт и избавить её призрак от кошмара цифр, мы не покажем вам процесс их приготовления [la cuisine des chiffres ne sera pas montrée]. Достаточно знать, что эти кривые получаются в результате перекрестного умножения, квадратных корней и многих других ингредиентов, одни названия которых могут испортить вам аппетит, хотя компьютер переварит их без проблем.
В ходе цифровой кулинарии выясняется, что чаще всего Колетт пишет про кошек (chat / chatte) — что особенно, по мнению Брюне, выделяет её на фоне других авторов, которые либо не особенно обращаются к животным в своих текстах, либо используют их в символическом значении. Или как пишет Брюне в заключении:
В этом случае статистика лишь подтверждает ощущение очевидного. Это, конечно же, не является открытием, и мы добились лишь относительного прогресса в доказательстве, если не правильности [количественного] метода, то хотя бы того, что он не является ошибочным.
А кошек у Колетт насчитали 198
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
RAntiquity
Сколько кошек было у Колетт? 🔘 🔘 🔘 В 1989 году Этьен Брюне опубликовал статью, где решил пересчитать животных во французской литературе 19-20 веков. Это стало возможно благодаря созданию Цифрового тезауруса французского языка (TLFi), который на тот момент…
винтажные диаграммы + коты = DH здорового человека
RAntiquity
Вот тут кстати на SO инциировала обсуждение, как подключиться к API дипсика из среды R. Все работает, если дать денег (существенно меньше, чем просит OpenAI). Надо будет еще подумать, чтобы как в {ellmer} сразу структурированные данные извлекать, но это все позже, сейчас завал.
Может пока я буду думать, китайцы уже пакет напишут. Тогда и с ВПН можно было бы не мучиться (все, что работает через ВПН, практически невозможно демонстрировать в реальном времени на паре, например).
Может пока я буду думать, китайцы уже пакет напишут. Тогда и с ВПН можно было бы не мучиться (все, что работает через ВПН, практически невозможно демонстрировать в реальном времени на паре, например).
Stack Overflow
A call to DeepSeek API in R returns 401 error despite correct api-key
I am trying to chat from DeepSeek from R, and here is the code I use (since this model is not supported by {ellmer} or {tidyllm}.
Here is my code:
library(httr)
library(jsonlite)
# Set your DeepSe...
Here is my code:
library(httr)
library(jsonlite)
# Set your DeepSe...