sysblok Telegram Group

Системный Блокъ

Что читают, осмысляют и о чём говорят на программах по DH?

Собрали три текста из блога DH-центра ИТМО @dhcenter, которые помогут понять контекст обучения цифровым методам в гуманитарных исследованиях и узнать больше о подходах и вопросах из мира DH.

От Стоунхенджа до Лас-Вегаса и Теории теории смартфона. Что читают на программе по Digital Humanities?

Подборка текстов, которые читают на магистерской программе по Digital Humanities. Узнаете, например, об исследовании языка и риторики мирового банка с 1946 по 2012 год. А ещё о том, почему три ключевых метафоры интернета — место, инструмент и способ быть (way of being), и как отловить их в собственной речи.

От Аристотеля до 3D-моделей тела. Три взгляда на визуализации

Сложный и насыщенный разговор культуролога Ольги Давыдовой, медиафилософа Алины Латыповой и дизайнера Трофима Попова об эстетических критериях, социальных аспектах и роли визуализации. Если готовы разобраться с понятиями «графезис», «колорема» и «коллективный эмпиризм», то точно узнаете больше о визуализациях в науке и в поэзии, а заодно и о том, кто считает их отличным инструментом, а кто — «проклятием гуманитарной мысли».

От UX до DH. Интервью про UX-исследования, Human-Computer Interaction и связь юикса с цифровой гуманитаристикой

Чем отличается UX от UX-исследований? Как они соотносятся с цифровой гуманитаристикой и DH-проектами? Юиксеры изучают пользователей или объекты в цифре? Ответы найдете в разговоре Алексея Евстифеева, UX-исследователя и координатора проектной группы по UX в Пушкине <цифровом>, и Полины Колозариди, академической руководительницы магистерской программы по DH в ИТМО.

🤖 «Системный Блокъ» @sysblok

Please open Telegram to view this post

VIEW IN TELEGRAM

3.7K viewsedited 11:26

Системный Блокъ

Пахучка пахучая и другие. Тест: угадайте растение по старинному названию

Что в семнадцатом веке называли мастикой? Какое растение скрывается за именем «поповская шапка»? А «попова скуфья»? Разбираемся в новом тесте «Системного Блока», который мы сделали на основе данных из базы PhytoLex (недавно мы уже рассказывали об этом проекте).

Чтобы в кулинарной книге XVIII века отличить оксиду от растения под названием апиюм селевестре (спойлер: это одно из названий сельдерея!), скорее проходите тест.

🤖 «Системный Блокъ» @sysblok

Please open Telegram to view this post

VIEW IN TELEGRAM

Системный Блокъ

Поповская шапка и провинциальный розен: угадаете ли вы растение по его старинному названию?

Как называли алоэ или шиповник травники XIII века или аптекари времен Петра Великого? Ученые из Европейского университета в Санкт-Петербурге создали базу данных PhytoLex, в которую внесли обозначения растений в источниках XI–XVIII веков по ботанике, медицине…

4.6K views16:21

Системный Блокъ

День биоразнообразия: агрегаторы и базы данных

Где искать данные о биологическом разнообразии планеты? Агрегаторы биологических данных появились не так давно, но сегодня с их помощью каждый ученый может получить миллионы записей из биологических баз на свой компьютер. Рассказываем об этом подробнее в международный день биоразнообразия.

🌱 Варианты баз данных

В случае биологии можно выделить таксономические базы и базы «коллекционные». Первые включают информацию о положении таксона в системе живого мира, валидных названиях, синонимах и родственных связях между таксонами (скажем, TROPICOS).

Коллекционные базы данных работают на уровне отдельных организмов и предоставляют информацию об их распространении, внешних признаках. Сюда же включены фотографии, записи голосов птиц, видео, последовательности ДНК и пр. Их, кстати, можно разделить «оцифрованные коллекции» и на «агрегаторы». Примером оцифрованных коллекций может служить портал Цифрового гербария МГУ имени М.В. Ломоносова, о котором мы рассказывали раньше.

🪴 Агрегаторы

Агрегаторы пополняются разными людьми и организациями. У каждого проекта свои требования к типам данных, их региональной приуроченности и т.д. Например, «GBIF» — база по распространению всех видов живых организмов. Она насчитывает более 3 миллионов записей из 113 856 датасетов. Скачать их может любой — достаточно пройти регистрацию на портале. А вот добавлять можно лишь от лица научных организаций и в определенном формате.

🌳 Другие примеры

Ещё несколько порталов, которые могут быть интересны не только ученым, но и всем любителям живой природы, собрали ниже.

iNaturalist – крупный международный портал, о котором мы рассказывали подробнее в отдельном посте. Их сообщество насчитывает 5 миллионов пользователей со всего мира, наблюдающих за природой. Сайт полностью русифицирован.

Avibase посвящена исключительно птицам и насчитывает 53 962 805 записей. Здесь можно выбрать свой регион и скачать для него список встречающихся птиц с фотографиями и базовой информацией. Портал частично переведен на русский язык.

На портале Млекопитающие России можно найти 277 844 записей и 111 689 фотографий млекопитающих страны. Пользователи могут добавлять свои данные в свободном режиме.

🤖 «Системный Блокъ» @sysblok

Please open Telegram to view this post

VIEW IN TELEGRAM

3.3K views16:21

Системный Блокъ

Google выпускает новые продукты, Claude 4 шантажирует пользователей, OpenAI покупает компанию Джони Айва

Рассказываем, что произошло в мире ИИ за последнее время.

Новинки от Google

Компания Google действует на всех фронтах и обновила целый ряд ИИ-инструментов.

• Модель Gemini 2.5 Pro получила режим Deep Think, который одновременно генерирует несколько цепочек рассуждений, что повышает качество ответов. Улучшения заметны в мультимодальных и математических тестах, а также при генерации кода. Обновлена также мини-модель Gemini 2.5 Flash.

• Анонсирован Project Mariner — агентная система для автоматизации задач на компьютере. Это прямой конкурент Operator от OpenAI и Computer Use от Anthropic.

• Вышли обновления Imagen и Veo: Veo 3 теперь создает реалистичные видео со звуком. Представлено приложение Flow для режиссеров: на основе Veo, Imagen и Gemini в нем можно выстраивать клипы и сцены для рассказа истории.

• Поиск Google теперь делает ИИ-выжимки результатов. С помощью новых функций в AI Mode можно получить сводку релевантных товаров без перехода по множеству сайтов — ИИ подберет и покажет предложения, а также оформит покупку. Компания также запустила виртуальную примерочную, с помощью которой пользователь перед покупкой может оценить, как на нем будет смотреться одежда.

• Анонсирован синхронный перевод речи для Google Meet. На старте поддерживается испанский язык, со временем список расширится.

• Запущена подписка Google AI Ultra, включающая доступ ко всем последним моделям и приложениям, 30 ТБ на Google Drive и YouTube Premium. Стоимость составит 250 долларов в месяц.

Обновления LLM от Anthropic

Компания Anthropic, один из главных конкурентов OpenAI, представила четвертую версию своей языковой модели. Поскольку продукты компании преимущественно применяются для автоматизации разработки в IT, ключевые улучшения коснулись способности генерировать код и автономно выполнять пользовательские задачи с помощью различных инструментов — браузера, командной строки и других.

Claude Opus 4 показал лучший результат среди агентов для разработки в тесте SWE-bench. Claude Sonnet 4 также продемонстрировал улучшенные возможности генерации кода, однако в остальных тестах его показатели остаются на уровне предыдущей версии Sonnet 3.7.

Anthropic заявила, что при запуске новинок применила повышенные меры безопасности. Также компания выпустила технический отчет, в котором описала результаты тестирования «поведения» новых моделей. В частности, выяснилось, что модель способна к шантажу, саботажу, обману и проявлению инициативы в некоторых случаях.

OpenAI купила компанию Джони Айва

Бывший дизайнер Apple Джони Айв — в его портфолио входят Mac, iPhone, iPad, Apple Watch, дизайн операционных систем — и гендиректор OpenAI Сэм Альтман объявили о слиянии своих компаний для разработки принципиально новых продуктов с искусственным интеллектом.

Сотрудничество между Айвом и командой OpenAI началось два года назад как неформальная работа креативного коллектива LoveFrom с создателями ChatGPT. Первоначальные идеи и эксперименты постепенно переросли в конкретные дизайнерские решения.

Год назад Айв совместно с бывшими топ-менеджерами Apple основал новую компанию io. OpenAI приобрела io (сумма сделки оценивается в 6,5 млрд долларов), чтобы более тесно взаимодействовать с исследовательскими и инженерными командами в Сан-Франциско. Айв и LoveFrom возьмут на себя ключевые дизайнерские и творческие функции в объединенной компании.

По словам основателей, цель проекта — создать новое семейство устройств, которые помогут людям учиться, исследовать мир и творить, используя возможности современного ИИ. Релиз первого продукта планируется в следующем году.

🤖 «Системный Блокъ» @sysblok

Please open Telegram to view this post

VIEW IN TELEGRAM

Системный Блокъ

Новая Llama 4, новый лидер Gemini 2.5 Pro, новые картинки от GPT - Системный Блокъ

Вышло новое поколение Llama, Gemini 2.5 Pro стала лучшей LLM, а GPT сильно улучшила генерацию изображений — что произошло в мире ИИ за последнее время.

2.7K viewsedited 13:34

Системный Блокъ

CLIP: нейросеть, которая понимает текст и картинки

Мультимодальные модели могут обрабатывать несколько видов данных одновременно. Например, они «понимают» не только текст, но и изображения и аудио. Сегодня рассказываем о нейросети CLIP, которая представляет изображения и тексты как единый тип данных, и рассмотрим, как это может быть полезно. Это — первый из серии наших материалов о мультимодальных нейросетях.

Кратко: как работают эти нейросети?

CLIP (Contrastive Language–Image Pre-training) была разработана в 2021 году компанией OpenAI, создавшей GPT. Contrastive в названии обозначает метод обучения нейросетей Contrastive learning, при котором нейросеть учится сравнивать/противопоставлять объекты на основе их семантического соответствия.

CLIP представляет изображения и текст как единую модальность (один тип данных). Другими словами, эта нейросеть строит универсальные численные представления для текстов и изображений, которые затем можно использовать для сравнения семантической схожести картинки и описания. Поэтому она отлично подходит для поисковиков, онлайн-магазинов и рынках стоковых изображений.

А еще CLIP можно использовать в паре с языковыми и генеративными моделями, тем самым наделяя их мультимодальными способностями. Такие модели могут генерировать изображения по текстовым описаниям, создавать описания изображений, анализировать визуальное содержание и выполнять другие задачи.

Подробно о работе мультимодальных нейросетей – с примерами, терминами и картинками с собаками, мы рассказали в полной версии материала. Из нее же узнаете о третьем применении CLIP и о том, способна ли она распознать на картинке банан, если он будет пиксельным, черно-белым или разрезанным на кусочки.

🤖 «Системный Блокъ» @sysblok

Please open Telegram to view this post

VIEW IN TELEGRAM

Системный Блокъ

Нейросеть CLIP: принцип работы мультимодальных векторных представлений

Что такое мультимодальные модели? Рассказываем, как нейросеть CLIP использует косинусную близость векторных представлений для сопоставления текстов и изображений и для чего это может быть полезно.

4.1K viewsedited 08:41

Системный Блокъ

Набор на Летнюю школу в мастерскую дата-журналистики закрывается через 3…2…1…

Вы ещё успеваете подать заявки в мастерскую «Системного Блока» @datajourschool на «Летней школе» на Волге до 1 июня включительно.

С 19 июля по 3 августа вы сможете бесплатно* научиться искать, собирать и обрабатывать данные, а затем — превращать их в красивые и понятные визуализации.

Узнать подробнее о наборе в мастерскую можно здесь, познакомиться с примерами наших визуализаций — в посте ниже.

Регистрация: https://nabor.letnyayashkola.org/

*Есть добровольный взнос на питание и проживание

🤖 «Системный Блокъ» @sysblok

Please open Telegram to view this post

VIEW IN TELEGRAM

Системный Блокъ

«Системный Блокъ» продолжает набор в мастерскую дата-журналистики на «Летней Школе»! UPD: Мы принимаем заявки от всех желающих до 1 июня❗️

Вы тоже любите данные, исследования, еду на костре и сосны? В июле «Летняя школа» на Волге открывает новый сезон. Во…

9.2K viewsedited 14:59

Системный Блокъ

От алкоголизма до книжного рынка: подборка инфографик «Системного Блока»

Наш дата-отдел регулярно исследует открытые данные и рассказывает о процессах в обществе и культуре России и мира с помощью инфографики. В этом посте собрали материалы прошлых лет о кино, песнях и метро России.

🚇 Метро в России

По количеству открытых станций метро в России тоже лидирует Москва: за 12 лет в стране построили меньше станций метро, чем в одной Москве в 2021 году. Например, в Санкт-Петербурге станцию Театральную не могут открыть с 2008 года. О текущей ситуации и перспективах метро в других городах можно узнать здесь.

🍾 Кому на Руси пить хорошо

Ещё одна важная и неочевидная статистика о России — потребление алкоголя в стране. Рост потребления алкоголя с 2018 по 2022 год мы отобразили на карточке, а о производстве рассказали здесь.

🎬 Кино по заказу Минкульта

С 2014 года Министерство культуры публикует приоритетные для кинопроизводства темы. Среди них — популяризация героизма и неоколониальная политика стран англосаксонского мира. Правда, большинство приоритетных фильмов не окупается в прокате. Узнать больше об этой статистике можно тут.

🎤 О чем поет Родина

В 2016 году появился официальный «каталог патриотической музыки». Оказалось, что каждое третье произведение из 8 тысяч позиций каталога посвящено войне. Прежде всего — Великой отечественной. О других войнах и темах в песнях каталога, можно узнать из инфографики и этого поста.

📸 Камеры в Москве

Москва входит в топ-30 городов по покрытию камерами: в городе как минимум 193 000 камер. Самая большая плотность покрытия — в Центральном округе, там на квадратный километр приходится 198 камер. Больше информации — в нашем посте.

📚 Книжный рынок

Политика России в 2022 году сильно сказалась на книжном рынке. Среди последствий: отсутствие полиграфического оборудования, интерес к «запрещенным» произведениям и изменения в топе самых издаваемых авторов. Подробнее — в тексте поста.

🤖 «Системный Блокъ» @sysblok

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

3.2K views14:59

Системный Блокъ

Бунтующий young, ностальгирующий adult: дата-исследование книжного рынка

Сегодня отмечается Международный день защиты детей. Поскольку подготовить ребенка к грядущим сложностям и переменам иногда способна хорошая книга, предлагаем вспомнить наше исследование, посвященное рынку young adult литературы.

Тираж книг для подростков и молодежи за последние 10 лет увеличился в два раза, а в young adult стали «переупаковывать» самые разные произведения. Узнать подробнее об этом сегменте книжного рынка и изменениях в нём за последние годы можно из этого поста, а пока предлагаем вам угадать, какого тега нет в топе раздела young adult в «Читай-городе».

🤖 «Системный Блокъ» @sysblok

Please open Telegram to view this post

VIEW IN TELEGRAM

2.5K views14:51

Системный Блокъ

Какого тега НЕТ в лидерах раздела young adult в «Читай-городе»?

Anonymous Quiz

Американские писатели

22%

Фэнтези о дворцовых интригах

571 voters2.5K views14:51

Системный Блокъ

Герои и драконы с привязкой к местности: как цифровая картография помогает исследовать мифы

Драконы, духи и герои древних легенд теперь бродят не только по туманным мирам — они появляются на привычных нам картах. Современные базы данных и GIS-технологии позволяют визуализировать фольклорные и мифологические сюжеты. Рассказываем о трех цифровых картах, которые помогут вам проследить путь Одиссея, найти все проклятые места в Ирландии и узнать, как Стоунхендж связан с Мерлином.

🧜🏼‍♂️ Myths on map: пути античных героев

Цифровая карта посвящена мифам Древней Греции. Здесь есть информация о героях, событиях, городах и античных текстах, в которых отражены легендарные сюжеты. Например, география перемещений Ахиллеса насчитывает 36 мест, а Геракла – 91. Ну а если вы до сих пор не дочитали список кораблей из «Илиады», то можете взглянуть хотя бы на список мест, откуда они прибыли, — это целых 218 названий.

🧌 Emerald Isle: в поисках лепреконов и сокровищ

Проект посвящен ирландским мифам, сказкам и историям о привидениях. На карте отмечены точки, связанные с разными сюжетами: с местами обитания чудовищ, с зарытыми сокровищами, с событиями из отдельных циклов легенд. Так, недалеко от Дублина обитает ирландский всадник без головы. Здесь же находится одно из проклятых мест, которых в Ирландии, судя по карте, немало.

🧙🏻‍♂️ A Map of Myth, Legend and Folklore: английские замки и привидения

Эта интерактивная карта разработана благотворительной организацией English Heritage, которая занимается сохранением объектов культурного наследия. Проект визуализирует более 1500 легенд и мифов распространенных в Англии. Истории разделены на категории: духи и призраки, мифические существа (например, драконы и великаны) и исторические легенды. К каждой точке добавлены иллюстрации, аудиозаписи рассказов и ссылки на исторические источники. Работает поиск по типам существ, временным периодам и регионам.

Подробнее об этих проектах и о цифровой революции в классификации мифов, узнаете из полной версии статьи.

Время чтения: 6,5 минут

🤖 «Системный Блокъ» @sysblok

Please open Telegram to view this post

VIEW IN TELEGRAM

Системный Блокъ

Мифы с привязкой к местности: как цифровая картография помогает фольклористам

«Системный Блок» рассказывает о том, как фольклористы с помощью цифровых карт визуализируют мифологические сюжеты. В нашем обзоре — проекты, посвященные греческой, ирландской и английской мифологии.

2.9K views15:51

Системный Блокъ

От поля битвы к байтам: как устроена Всемирная база данных исторических сражений

Какие страны воевали больше всего? Сколько было войн и где происходили ключевые битвы? Ответить на эти вопросы можно благодаря Всемирной базе данных исторических сражений, созданной в 2021 году. Она систематизирует данные о примерно 8000 сражений с древних времен по сегодняшний день. Рассказываем о ней подробнее в этом посте и новом материале.

Кратко: что за база?

World Historical Battles Database (WHBD) использует данные из Wikidata, Википедии и ряда других источников (например, Military Wiki). Здесь можно найти информацию о сторонах конфликта, географических координатах, времени и результатах битв.

Больше всего военных столкновений —согласно этой базе — было на территории США, следом с большим отрывом идут Франция и Италия. Создатель проекта предполагает несколько возможных объяснений таким показателям. Во-первых, на этих территориях действительно могло произойти больше сражений, чем в других регионах. Во-вторых, войны в этих регионах могли быть зафиксированы с большей вероятностью, и/или меньше записей могло быть утеряно. В-третьих, делом может быть в содержании исходных онлайн-источников.

О том, на какое время приходится пик военных конфликтов, как велась работа над созданием базы и чем WHBD отличается от похожих проектов, узнаете из полной версии статьи.

Время чтения: 9 минут

🤖 «Системный Блокъ» @sysblok

Please open Telegram to view this post

VIEW IN TELEGRAM

Системный Блокъ

Какие страны воевали чаще всего: о чем может рассказать Всемирная база данных исторических сражений

Хотите узнать, какие страны воевали чаще всего в истории? Сколько всего было войн? Всемирная база данных исторических сражений собрала статистику войн за 4000 лет — от битвы при Мегиддо до войны в Ираке.

2.4K views17:26

Системный Блокъ

<Цифровое> солнце русской поэзии

Сегодня день рождения Александра Сергеевича Пушкина. Если вы уже перечитали любимые стихи его авторства, а теперь хотите разом освоить все наследие писателя, то рекомендуем вам наш обзор семантического издания Пушкин <цифровой>.

Кратко: что это за проект?

Пушкин ⟨цифровой⟩ — уже третье семантическое издание текстов и персоналий «большой литературы» в русскоязычном веб-пространстве (есть ещё «Слово Толстого» от команды Tolstoy Digital и Chekhov Digital, о котором «Системный Блокъ» писал здесь и здесь). Над созданием проекта о Пушкине параллельно работают Институт русской литературы (Пушкинский Дом) и Санкт-Петербургский Федеральный исследовательский центр Российской академии наук, а DH-центр ИТМО разрабатывает интерфейсы для навигации, чтения и изучения материалов.

На сайте проекта можно найти основные тексты произведений Пушкина, его рукописи и материалы академического пушкиноведения с середины XIX века и до наших дней. В отдельном разделе представлены тексты-путеводители, которые помогут современному читателю лучше понять контекст произведений. Там, например, можно выяснить, что в стихотворении «Я помню чудное мгновенье…» Пушкин позаимствовал у Жуковского, Баратынского и Батюшкова, а также какой была в жизни вдохновившая это стихотворение Анна Керн.

Путеводители раскрывают культурный контекст, биографию людей пушкинского круга и поэтику текстов. Они параллельны и связаны одновременно. Каждый можно прочесть отдельно как лонгрид (на странице даже указано время чтения), а можно изучать все три слоя одновременно, листая само произведение и переходя по ссылкам.

Узнать, какие возможности открывает работа с порталом, как она устроена и какие дальнейшие планы есть у создателей проекта, можно из полной версии статьи.

Время чтения: 10,5 минут

🌞 «Системный Блокъ» @sysblok

Please open Telegram to view this post

VIEW IN TELEGRAM

Системный Блокъ

Пушкин : два века работы в одном интерактивном издании

Возможно ли собрать двухсотлетнее наследие Пушкина и пушкинистики в единую систему? Ответ — в статье. Рассказываем о проекте, который сэкономит фанатам поэта 58 лет чтения.

4.3K views17:46

Системный Блокъ

Grok в Telegram, обновление DeepSeek R1 и суперкомпьютер OpenAI в ОАЭ

Рассказываем, что произошло в мире ИИ за последнее время

Обновленный DeepSeek R1

Нашумевшая китайская языковая модель DeepSeek R1 получила обновление.

В тестах по математике и программированию улучшенная версия стала сравнима с лучшими коммерческими моделями — OpenAI o3 и Google Gemini 2.5 Pro. Модель стала реже галлюцинировать (выдавать фактологически неверные ответы), а также научилась использовать внешние инструменты (function calling): искать информацию в интернете, делать запросы к базам данных, выполнять код в среде разработки и т. д.

Модель, как и прежде, остается в открытом доступе и может использоваться в коммерческих целях.

OpenAI строит суперкомпьютер в ОАЭ

В рамках инициативы OpenAI For Countries компания анонсировала партнерство с ОАЭ. Согласно соглашению, OpenAI построит в стране вычислительный кластер, который заработает к 2026 году, а ОАЭ, в свою очередь, проинвестирует в американский проект Stargate — сеть суперкомпьютеров для обучения моделей ИИ.

Построенный кластер позволит интегрировать модели OpenAI на национальном уровне в государственные структуры, учебные заведения и систему здравоохранения с соблюдением требований к безопасности данных.

Проект Stargate был анонсирован вскоре после инаугурации Дональда Трампа и предполагает инвестиции в размере 500 млрд долларов на строительство серии дата-центров в США для развития и исследования искусственного интеллекта в течение четырех лет.

Инициатива OpenAI For Countries была представлена в мае в рамках проекта Stargate. Она предлагает помощь заинтересованным правительствам в создании «суверенной ИИ-инфраструктуры» в координации с правительством США.

Grok интегрируют в Telegram

Павел Дуров анонсировал глубокую интеграцию языковой модели Grok от лаборатории Илона Маска xAI в мессенджер Telegram.

ИИ-функции, которые появятся этим летом:

• удобный доступ к Grok — чат с моделью можно будет закрепить вверху списка всех чатов, а вопросы задавать через строку поиска,
• организация переписки — Grok будет категоризировать историю чатов по тематикам и создавать выжимки новых сообщений,
• помощь в создании контента — генерация развернутых сообщений на основе коротких черновиков, создание стикеров и аватарок,
• анализ информации — суммаризация данных из файлов и по ссылкам, проверка информации в каналах,
• модерация и автоответы — Grok сможет модерировать групповые чаты и отвечать на сообщения в бизнес-аккаунтах (например, сообщать рабочие часы или отвечать на частые вопросы).

Также Telegram получит 300 млн долларов инвестиций от xAI и 50% дохода с подписок на Grok, проданных через мессенджер.

🤖 «Системный Блокъ» @sysblok

Please open Telegram to view this post

VIEW IN TELEGRAM

2.4K views16:05

Системный Блокъ

Коллокации, эпиграфика и древняя ДНК: подборка новых тестов «Системного Блока»

Если в эту пятницу вам хочется и развлечься, и узнать что-то новое, наши новые тесты – отличное решение. Разберетесь, что такое огамическое письмо, что роднит «крокодиловых слез» и «зеленый свет» и какое открытие последних лет стало прорывом в палеогенетике.

Что такое коллокации и как они помогают гуманитариям?

Каждый, кто говорит по-русски, знает, что роль играют, условия выдвигают, а глаза бывают карими, но не коричневыми. Такие устойчивые словосочетания называются коллокациями, и существовать без них не может ни один язык. Мы уже рассказывали о том, как и зачем изучают этот феномен, а теперь предлагаем вам проверить свои знания. Готовы? Тогда проходите тест по ссылке!

Что вы знаете о цифровой эпиграфике?

Эпиграфика — это наука о надписях на камнях, керамике, металлах и других твердых материалах. С появлением цифровых технологий, таких как 3D-моделирование и фотограмметрия, процесс документирования памятников стал точнее и полнее. Мы рассказывали об эпиграфических корпусах и о расшифровке надписей — теперь предлагаем вам пройти тест.

Что и зачем изучает палеогенетика?

В последние десятилетия палеогенетика и биоинформатика стали мощным двигателем развития археологии. Ученые, работающие в этих направлениях, воссоздают историю наших предков через анализ их ДНК, чтобы узнать больше о миграциях и эволюции человека. Пройдите наш тест, чтобы вспомнить (или узнать!), как наука помогает расшифровывать загадки прошлого.

🤖 «Системный Блокъ» @sysblok

Please open Telegram to view this post

VIEW IN TELEGRAM

1.5K views14:46

Системный Блокъ

Хармс, Брюсов и «Гамлет»: цифровые методы в поиске интертекстуальных связей

Сегодня для поиска сходств между текстами можно не читать тысячи книг, а правильно обучить языковую модель, чтобы она сделала за вас хотя бы часть работы. В новой статье рассказываем о нескольких проектах, которые помогают изучать интертекстуальные связи, а еще о том, может ли их обнаружить обычная нейросеть.

Tesserae

C 2008 года на базе университета в Баффало осуществляется проект Tesserae, изначально созданный для поиска интертекстуальных связей между классическими древнегреческими, латинскими текстами (подробнее о нем мы рассказывали здесь). У проекта есть действующий онлайн-интерфейс и репозиторий.

InterIDEAS

«Философский» датасет InterIDEAS включает 45 тысяч страниц философских текстов, написанных с 1750 по 1950 год. В нём с помощью LLM и экспертов размечены обращения к книгам, идеологиям, религиям, историческим событиям, а также словам и поступкам других людей. Увы, свободного доступа к датасету пока нет.

WordWeb-IDEM

После проекта HyperHamlet, где были собраны всевозможные цитатные переклички с «Гамлетом» — от Сенеки до постов в социальных сетях, команда из Базельского университета взялась и за другие пьесы эпохи Возрождения. Сейчас в WordWeb-IDEM уже собрано более 1000 пьес и доступно несколько видов поиска по представленным текстам.

LLM

Сегодня LLM уже могут выполнять некоторые задачи по поиску параллелей в художественных текстах. Они позволяют перейти от поиска по ключевым словам к поиску «по смыслам», т. е. по содержательным пересечениям. Благодаря этому можно найти неочевидные пересечения в литературе. Например, вот такую пару цитат из текстов Брюсова и Хармса: «Старик, увидав девочку, остановился. Катя решилась спросить его. — Скажите, пожалуйста, как пройти в Вифлеем?» («Дитя и безумец», Брюсов); «Молодой человек почистил перчатками свои брюки и деликатным голосом спросил: — Скажите, дедушка, как тут пройти на небо?» («Молодой человек, удививший сторожа», Хармс).

Правда, пока работа по поиску отсылок и перекличек в литературе с помощью LLM — скорее перспективное направление, чем готовый реализованный проект. Подробнее о таком использовании языковых моделей, а также о других проектах, которые облегчают исследователям работу с интертекстом, узнаете из полной версии статьи.

Время чтения: 16 минут

🤖 «Системный Блокъ» @sysblok

Please open Telegram to view this post

VIEW IN TELEGRAM

Системный Блокъ

LLM для поиска интертекстуальности

Интертекст, цитаты, аллюзии и другие связи — всё это могут выявить большие языковые модели (LLM). Евгений Обухов, математик, литературовед, специалист по Computer Science, рассказывает об огромном потенциале LLM в поиске интертекстуальности в художественных…

1.2K views09:29

2025/06/16 00:38:32
Back to Top

HTML Embed Code:

<iframe width="100%" src="https://www.group-telegram.com/buyppe/webview?embed=1" title="Channel Webview" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>