К сегодняшнему 175-летию Коммунистического манифеста* выпустил версию 2.0 своего поста про нейрогенеративную революцию в интернете, расширенную и дополненную примерами раза в три. И картинки к нему сгенерировал в Midjourney. Я конечно визуальный валенок и aesthetically challenged, но по-моему она огонь рисует
*да, Германия очень способствует полевению, простите 🙂✊
*да, Германия очень способствует полевению, простите 🙂✊
Крутейший новый датасет вышел у Пушкинского дома (привет @tozhe_nauka):
Бытование литературных текстов в ГУЛАГе
“В датасете представлена роспись литературных текстов, бытовавших в советской пенитенциарной системе в 1917—1991 гг. Данные извлечены из текстов воспоминаний, публиковавшихся в 1928—2016 гг. В базу включены поэтические и прозаические тексты, а также упоминаемые авторы, учтена ситуация рецитации текстов, география их бытования и хронологические рамки. ”
https://doi.org/10.31860/openlit-2022.11-B007
Бытование литературных текстов в ГУЛАГе
“В датасете представлена роспись литературных текстов, бытовавших в советской пенитенциарной системе в 1917—1991 гг. Данные извлечены из текстов воспоминаний, публиковавшихся в 1928—2016 гг. В базу включены поэтические и прозаические тексты, а также упоминаемые авторы, учтена ситуация рецитации текстов, география их бытования и хронологические рамки. ”
https://doi.org/10.31860/openlit-2022.11-B007
Репозиторий открытых данных по русской литературе и фольклору
Бытование литературных текстов в ГУЛАГе
В датасете представлена роспись литературных текстов, бытовавших в советской пенитенциарной системе в 1917—1991 гг. Данные извлечены из текстов вос...
Вот и прошел год, как я уехал из России. Время подвести какие-то профессиональные итоги (неотделимые, впрочем, от всего остального)
1. Вообще-то я планировал в 2022 свалить не из РФ, а из DH. Потом наступило 24 февраля, и оказалось, что при выборе между DH и фашизмом DH выглядит просто превосходно. И вот я уже год работаю DH координатором в Университете Потсдама 🏛
2. Как ни дико это говорить, внезапная эвакуация случилась очень кстати в профессиональном смысле. В Вышке я бы почти наверняка еще минимум на год, а то и дольше, залип в режиме препода и, как и раньше, тратил бы 90% сил на увеселение студентов (такова моя природная склонность). Здесь же спектр дел сместился в сторону ресерча, помощи с ресерчем, обеспечения ресерча данными, анализа и визуализации этих данных, а также менеджмента, координации и немного смм-а. В плане саморазвития нынешняя ситуация сильно выгоднее того, что происходило в Вышке последние лет пять. Расту как академический дата-инженер, как воннаби-программист, как своеобразный менеджер DH-лабы (распределенной полувиртуальной лабы, но и то хлеб), ну и как ведущий академического твиттера/мастодона/инстаграма 🤳
3. По нормальному живому преподаванию (не в зуме) я тем не менее скучаю. Пары в зуме не удовлетворяют совершенно, а энергию все равно высасывают (хотя студенты и прекрасные в этом году). Но офлайн убила не война, а ковид, так что это не потеря 2022, а скорее потеря 2020. На январь 2022 мы преподавали в DH-маге в зуме, и вот до сих пор продолжаем там же 😵💫
4. Еще скучаю по живым собраниям Системного Блока. В России как известно слабость институтов компенсируется партизанщиной энтузиастов. В условиях полной дисфункции российской официально-институциональной академии партизанские проекты типа Блока или ЛШ заменяли многое, а в Европе такие форматы не растут — для этого нужна чисто русская разруха 😆 Ну, такая, когда “за что ни возьмись, всего нету”
5. При этом у меня нет ответа на вопрос, а сколько сил разумно тратить на сохранение потенциальных связей с Россией (в формате неформального участия во всяком научном, образовательном, просветительном и т.п.). И стоит ли их вообще тратить. Ничего хорошего я в ближайшие лет 10 там не жду, а “просвещение” в России после 24.02.2022 — это что-то типа попыток тушить лесной пожар из бочки. Может одно-два-три дерева отобьёте, если повезет, но в целом — пока не прогорит, не остановится. Стоит ли туда вообще лезть, или отойти и ждать пока прогорит, а силы потратить в какой-то менее враждебной среде? Я не знаю 🤷♂️
6. Что точно нужно — это сохранить себя. Физически, морально, ментально. Это не значит, что нужно уйти в спячку, совсем наоборот. Если случится возвращаться, то в очень запущенную Россию. Так что нужно себя максимально за эти условные 5-10 лет прокачать. Чем и займемся 💪 Благо мне повезло сильно больше чем многим: меня этот взрыв-2022 выкинул на очень приятные и плодородные берега с симпатичным народом, у которого есть чему поучиться. Жаловаться вообще грех, индо еще побредем
1. Вообще-то я планировал в 2022 свалить не из РФ, а из DH. Потом наступило 24 февраля, и оказалось, что при выборе между DH и фашизмом DH выглядит просто превосходно. И вот я уже год работаю DH координатором в Университете Потсдама 🏛
2. Как ни дико это говорить, внезапная эвакуация случилась очень кстати в профессиональном смысле. В Вышке я бы почти наверняка еще минимум на год, а то и дольше, залип в режиме препода и, как и раньше, тратил бы 90% сил на увеселение студентов (такова моя природная склонность). Здесь же спектр дел сместился в сторону ресерча, помощи с ресерчем, обеспечения ресерча данными, анализа и визуализации этих данных, а также менеджмента, координации и немного смм-а. В плане саморазвития нынешняя ситуация сильно выгоднее того, что происходило в Вышке последние лет пять. Расту как академический дата-инженер, как воннаби-программист, как своеобразный менеджер DH-лабы (распределенной полувиртуальной лабы, но и то хлеб), ну и как ведущий академического твиттера/мастодона/инстаграма 🤳
3. По нормальному живому преподаванию (не в зуме) я тем не менее скучаю. Пары в зуме не удовлетворяют совершенно, а энергию все равно высасывают (хотя студенты и прекрасные в этом году). Но офлайн убила не война, а ковид, так что это не потеря 2022, а скорее потеря 2020. На январь 2022 мы преподавали в DH-маге в зуме, и вот до сих пор продолжаем там же 😵💫
4. Еще скучаю по живым собраниям Системного Блока. В России как известно слабость институтов компенсируется партизанщиной энтузиастов. В условиях полной дисфункции российской официально-институциональной академии партизанские проекты типа Блока или ЛШ заменяли многое, а в Европе такие форматы не растут — для этого нужна чисто русская разруха 😆 Ну, такая, когда “за что ни возьмись, всего нету”
5. При этом у меня нет ответа на вопрос, а сколько сил разумно тратить на сохранение потенциальных связей с Россией (в формате неформального участия во всяком научном, образовательном, просветительном и т.п.). И стоит ли их вообще тратить. Ничего хорошего я в ближайшие лет 10 там не жду, а “просвещение” в России после 24.02.2022 — это что-то типа попыток тушить лесной пожар из бочки. Может одно-два-три дерева отобьёте, если повезет, но в целом — пока не прогорит, не остановится. Стоит ли туда вообще лезть, или отойти и ждать пока прогорит, а силы потратить в какой-то менее враждебной среде? Я не знаю 🤷♂️
6. Что точно нужно — это сохранить себя. Физически, морально, ментально. Это не значит, что нужно уйти в спячку, совсем наоборот. Если случится возвращаться, то в очень запущенную Россию. Так что нужно себя максимально за эти условные 5-10 лет прокачать. Чем и займемся 💪 Благо мне повезло сильно больше чем многим: меня этот взрыв-2022 выкинул на очень приятные и плодородные берега с симпатичным народом, у которого есть чему поучиться. Жаловаться вообще грех, индо еще побредем
А последняя версия Кандинского🤖👨🎨 от зеленого банка не так уж плоха! Если поиграть с промтами, вполне дотягивает до миджорни в некоторых стилях👌(аниме например):
Forwarded from Kandinsky
Результат генерации по запросу "девушка татарка ниндзя в национальном татарском костюме с восточным холодным оружием", стиль: anime
Вернемся к науке. У нас с Б.В. Ореховым наконец вышла статья про авторов-хулиганов, которые дурят Дельту почем зря вместе со своими воображаемыми друзьями… 🤣 Почитайте вот:
Forwarded from Вестник Digital Humanities
fqad012finaldraft.pdf
3 MB
У Бориса Орехова и Даниила Скоринкина вышла статья о взломе стилометрии многоликим португальским модернистом Фернандо Пессоа и человеком десятка биографий и национальностей Роменом Гари, который отметился уникальной ачивкой — взял дважды Гонкуровскую премию, вручаемую один раз. Как они это сделали? Читайте в статье. На законопослушном западе статья конечно за конским пэйволом (ибо капиталисты из Digital Scholarship in the Humanities своего 💷💷💷 не упустят). Но на Вятке свои порядки, так что в русском телеграме мы просто скинем вам pdf статьи, для порядка натыкав там колхозных вотермарок.. наслаждайтесь 💁♂️
"Христос воскрес из мертвых, смертью смерть поправ!" в представлении Кандинского. Стили 4К, artstation и аниме. Всем счастливой пасхи, ну и ХВ (расшифровка любая)
Stylo beats GPT: большие языковые модели не могут (пока) обмануть стилометрию
Этим вечером в Сиене закончилась главная итальянская DH-конференция AIUCD. Среди прочих докладов нас заинтересовал эксперимент по тестированию Delta на текстах, сгенерированных GPT3 и (чуть-чуть) ChatGPT.
🧪Чтобы проделать тест, исследователи нагенерировали в GPT3 текстов “в стиле” десяти английских авторов. Через API GPT3 они закидывали запросы вида “Напиши главу романа в стиле автора А”, “Напиши роман, имитирующий автора Б”, “Напиши рассказ так, как будто он написан автором В” и т.п. — всего 320 комбинаций. Так постепенно нагенерировали “текстоиды” (термин самих исследователей) длиной не менее 5000 слов. Эти текстоиды затем сравнивались с реальными текстами тех же авторов.
😔Результат пока что в пользу стилометрии: тексты GPT3 “в стиле” разных авторов похожи не на этих авторов , а друг на друга (см. картинку). Для ChatGPT, к которому у авторов статьи еще не было API, сделали эксперимент с одним автором (Диккенс), и там стайло тоже обмануть не удалось.
🤔 Причиной "неудач” языковых моделей в имитации авторского сигнала становится хроническое недоиспользование некоторых частотных слов. Например они редко используют отрицательные частицы (прям как некоторые из нас, не умеющие говорить “нет”), а еще модальные глаголы типа might.
🔗Ссылка на сборник AIUCD 2023 и нужную страницу со статьей про Delta vs GPT:
https://www.aiucd.it/wp-content/uploads/2023/06/2023_aiucd_la_memoria_digitale_v1.pdf#page=305
Этим вечером в Сиене закончилась главная итальянская DH-конференция AIUCD. Среди прочих докладов нас заинтересовал эксперимент по тестированию Delta на текстах, сгенерированных GPT3 и (чуть-чуть) ChatGPT.
🧪Чтобы проделать тест, исследователи нагенерировали в GPT3 текстов “в стиле” десяти английских авторов. Через API GPT3 они закидывали запросы вида “Напиши главу романа в стиле автора А”, “Напиши роман, имитирующий автора Б”, “Напиши рассказ так, как будто он написан автором В” и т.п. — всего 320 комбинаций. Так постепенно нагенерировали “текстоиды” (термин самих исследователей) длиной не менее 5000 слов. Эти текстоиды затем сравнивались с реальными текстами тех же авторов.
😔Результат пока что в пользу стилометрии: тексты GPT3 “в стиле” разных авторов похожи не на этих авторов , а друг на друга (см. картинку). Для ChatGPT, к которому у авторов статьи еще не было API, сделали эксперимент с одним автором (Диккенс), и там стайло тоже обмануть не удалось.
🤔 Причиной "неудач” языковых моделей в имитации авторского сигнала становится хроническое недоиспользование некоторых частотных слов. Например они редко используют отрицательные частицы (прям как некоторые из нас, не умеющие говорить “нет”), а еще модальные глаголы типа might.
🔗Ссылка на сборник AIUCD 2023 и нужную страницу со статьей про Delta vs GPT:
https://www.aiucd.it/wp-content/uploads/2023/06/2023_aiucd_la_memoria_digitale_v1.pdf#page=305
Цифровой филолог (Даня Скоринкин)
Stylo beats GPT: большие языковые модели не могут (пока) обмануть стилометрию Этим вечером в Сиене закончилась главная итальянская DH-конференция AIUCD. Среди прочих докладов нас заинтересовал эксперимент по тестированию Delta на текстах, сгенерированных…
Еще отметим объем итальянского сборника (437 страниц!) и представленность в нем всякого модного-нового-хайпового (большие языковые модели, распознавание рукописного текста, графы знаний). Я вот не могу представить себе сколько-нибудь сопоставимый сборник от русских DH*, даже если бы не было войны. А ведь Италия не то чтобы мировая DH-сверхдержава. В лучшем случае середнячок, не лидер даже в европейском масштабе..
Это просто к вопросу об отставании. Помните как наш президент мечтал догнать Португалию по ВВП, лет 10 гнался, не догнал, обиделся и решил, что лучше заняться чем-то более привычным вроде массовых убийств?
Вот русские DH по выхлопу сейчас тоже в районе какой-нибудь маленькой европейской страны типа Португалии. Хотя потенциала было достаточно чтоб выйти в лидеры. Но теперь уже и догонять никто не будет, бежать приказано в обратную сторону
* ладно, одна возможность все-таки есть: такой сборник мог бы целиком написать Борис Орехов, потому что он русский DH-атлант, который поднимает на своих плечах вообще всё сразу. Но личные подвиги одного героя не заменяют компетентной научной среды
Это просто к вопросу об отставании. Помните как наш президент мечтал догнать Португалию по ВВП, лет 10 гнался, не догнал, обиделся и решил, что лучше заняться чем-то более привычным вроде массовых убийств?
Вот русские DH по выхлопу сейчас тоже в районе какой-нибудь маленькой европейской страны типа Португалии. Хотя потенциала было достаточно чтоб выйти в лидеры. Но теперь уже и догонять никто не будет, бежать приказано в обратную сторону
* ладно, одна возможность все-таки есть: такой сборник мог бы целиком написать Борис Орехов, потому что он русский DH-атлант, который поднимает на своих плечах вообще всё сразу. Но личные подвиги одного героя не заменяют компетентной научной среды
Встретил на конференции Ревьюера 2, европейского зубра стилометрии и нашего старого знакомого. Он подошел ко мне и сказал:
“Первым делом я должен рассказать тебе, какой я плохой человек. Ты наверно догадался, что это я ревьюил вашу с БВО статью в DSH. То ревью было за неделю до войны. Когда началась война, я решил написать письмо главреду журнала, что они не должны печатать ученых из России. Но к счастью я поддался прокрастинации и не успел отослать письмо. И пока я прокрастинировал, я увидел твою подпись под письмом против войны. И из этого я делаю вывод, что прокрастинация — это хорошо”.
Имею сложные чувства по поводу этого признания. Однако обнялись.
“Первым делом я должен рассказать тебе, какой я плохой человек. Ты наверно догадался, что это я ревьюил вашу с БВО статью в DSH. То ревью было за неделю до войны. Когда началась война, я решил написать письмо главреду журнала, что они не должны печатать ученых из России. Но к счастью я поддался прокрастинации и не успел отослать письмо. И пока я прокрастинировал, я увидел твою подпись под письмом против войны. И из этого я делаю вывод, что прокрастинация — это хорошо”.
Имею сложные чувства по поводу этого признания. Однако обнялись.
Telegram
Ебаный DH
У Бориса Орехова и Даниила Скоринкина вышла статья о взломе стилометрии многоликим португальским модернистом Фернандо Пессоа и человеком десятка биографий и национальностей Роменом Гари, который отметился уникальной ачивкой — взял дважды Гонкуровскую премию…
Старые почтовые открытки со стебом над ослами-депутатами, дореволюционной архитектурой и милыми попугайчиками — теперь в телеграме!
(лайк, шер, подписка)
Многие знают, что Системный Блокъ — не просто медиа, а партизанский научный центр (а как еще в России существовать?). И уже полтора года там живет проект оцифровки, расшифровки и изучения старых почтовых открыток “Пишу тебе”. И вот наконец “Пишу тебе” дорос до собственного медиа. Подписывайтесь на телеграм канал проекта, теперь про открытки рассказывают там, а не в Системном Блоке, рассказывают больше и богаче: https://www.group-telegram.com/pishuteberu
Там тоже будут цифровые сюжеты: разметка и классификация объектов на открытках с помощью компьютерного зрения, изучение корпуса расшифрованных текстов количественными методами, картографирование почтовой переписки и GIS-ы, анализ метаданных…
(лайк, шер, подписка)
Многие знают, что Системный Блокъ — не просто медиа, а партизанский научный центр (а как еще в России существовать?). И уже полтора года там живет проект оцифровки, расшифровки и изучения старых почтовых открыток “Пишу тебе”. И вот наконец “Пишу тебе” дорос до собственного медиа. Подписывайтесь на телеграм канал проекта, теперь про открытки рассказывают там, а не в Системном Блоке, рассказывают больше и богаче: https://www.group-telegram.com/pishuteberu
Там тоже будут цифровые сюжеты: разметка и классификация объектов на открытках с помощью компьютерного зрения, изучение корпуса расшифрованных текстов количественными методами, картографирование почтовой переписки и GIS-ы, анализ метаданных…
Тут остроумнейшая Маша "сегодня в НКРЯ” обратила внимение, что в “Пишу тебе” есть своего рода “отдел загадок” — открытки, язык которых обозначен как “неизвестно”. И действительно, это все оч любопытно и я почти нигде не могу понять язык… Если вдруг вы что-то можете тут расшифровать — маякните в форме, указав роль “Расшифровщик-детектив”, будет круто
Google Docs
«Пишу тебе». Присоединиться к команде
«Пишу тебе» — крупнейший цифровой архив отправленных почтовых открыток, который развивается силами волонтеров.
Мы открытый проект, вы можете присоединиться к нашей команде и попробовать себя в разных ролях. В нашей команде есть люди из разных стран, университетов…
Мы открытый проект, вы можете присоединиться к нашей команде и попробовать себя в разных ролях. В нашей команде есть люди из разных стран, университетов…
Forwarded from сегодня я нашла в НКРЯ
Сегодня среда, уважаемые подписчики.
Немножко вас обману — сегодня пост не про НКРЯ, а про другой корпус.
В "Пишу тебе" (замечательный корпус открыток) наткнулась на прекрасный раздел, где язык открытки — "непонятно".
https://sysblok.ru/postcards/?postcards-keyword=&postcards-place-from=&postcards-place-to=&postcards-date-start=&postcards-date-end=&postcards-tags=&postcards-tags-values=&postcards-language=непонятно&postcards-status=
Посмотрите, может, сможете что-то расшифровать!
Вот лягушечки, например, тоже непонятные.
#некря
Немножко вас обману — сегодня пост не про НКРЯ, а про другой корпус.
В "Пишу тебе" (замечательный корпус открыток) наткнулась на прекрасный раздел, где язык открытки — "непонятно".
https://sysblok.ru/postcards/?postcards-keyword=&postcards-place-from=&postcards-place-to=&postcards-date-start=&postcards-date-end=&postcards-tags=&postcards-tags-values=&postcards-language=непонятно&postcards-status=
Посмотрите, может, сможете что-то расшифровать!
Вот лягушечки, например, тоже непонятные.
#некря