Telegram Group Search
Обзор книги "Вымышленные истории" Борхеса

Недавно я задумался о том, как у меня со временем меняются литературные предпочтения.
В школьные времена я читал все книги из списков школьной литературы. Что-то нравилось, многое читал просто потому это требовали, что-то не понимал или мне не нравилось.

Потом, во время учёбы в университете и позже я перешёл на фантастику и фэнтези. Хотя сложно сказать, что перешёл - в списках школьной литературы встречалась советская и зарубежная фантастика, я и сам нередко читал её по своему желанию.

Но постепенно я перешёл именно на фэнтези - вначале российское, потом зарубежное. И стал читать не потому что "надо", а потому что нравилось. Как дополнительный бонус, читать на иностранных языках помогает улучшать уровень владения этим языками.

Плюс, многие произведения фэнтези удостаиваются литературных премий и затрагивают такие же актуальные для людей темы как и классика.

Но классику я не совсем забрасываю. Недавно вот читал "Мастера и Маргариту", на этот раз понял намного больше отсылок, чем при прочтении в школьные годы. Но сам стиль книги мне не особо понравился.

Несколько недель назад, из любопытства, решил почитать что-то из совсем другой классики и выбрал "Вымышленные истории" Борхеса (читал на испанском).

С одной стороны, это было впечатляюще. У Борхеса потрясающий талант к написанию коротких рассказов. Даже в рассказе на пять страниц он способен создать захватывающее повествование. Его истории полны отсылок к другим книгам, философским идеям и, иногда, неожиданным поворотам сюжета.
С другой стороны, меня они особо не заинтересовали. У меня возникло впечатление, что он пишет "для своих". Если ты не знаком с книгами, историческими моментами и философскими идеями, на которые он ссылается, многое теряется. А читать десятки книг чисто ради этого не хочется.
У меня возникала ассоциация с теорией математики: есть немало людей, которые её обожают и могут часами обсуждать детали, но большинству она неинтересна. И мне кажется, что с произведениями Борхеса — та же история. Есть аудитория, которая получает удовольствие от такого стиля повествования, но это явно не для всех. Да и повороты сюжета (которые впечатляют критиков) нередко можно угадать заранее.

Так что я восхищаюсь мастерством Борхеса, но этот автор не для меня.

#books
Deeplearning.ai course: MCP: Build Rich-Context AI Apps with Anthropic

Deeplearning.ai в последнее время выпускает мини-курсы один за другим, часто рекламные и поверхностные. Я некоторые из них смотрел - какие-то годные, какие-то нет.

Из свежего мне понравился курс по MCP в сотрудничестве с Anthropic.

Я как-то до этого не пробовал MCP, а этот курс помог понять как это работает. Курс короткий, но даёт годный пример того, как написать MCP server и client для получения желаемой информации с arvix.org.

#datascience
​​Claude 4

https://www.anthropic.com/news/claude-4

Среди прочего, Extended thinking with tool use - например, может думать при поиске в интернете
DRW - Crypto Market Prediction

Не знаю радоваться или плакать. На каггле запустили сореву по предсказанию цены крипты. Соревнование не официальное, а community, но приз - 25k$ в сумме.

Более того, орги сделали promotion video для рекламы соревнования.

#datascience
​​HuggingFace в разделе статей теперь суммаризирует статьи для совсем ленивых.
Лень прочитать статью? Читайте abstract. Лень читать abstract? Теперь есть "уникальная" возможность прочитать одно предложение самым главным.

Печально
​​Минутка ностальгии

Я открыл каггл впервые за долгое время и увидел, что один из моих ноутбуков получил золото неделю назад. Открыл его - а это ноутбук по соревнованию от Авито которое было 7 лет назад.
А казалось, что всё это было недавно...
​​Visual Planning: Let's Think Only with Images

Авторы предлагают новый подход — Visual Planning, где планирование выполняется не через текст, а с помощью последовательностей изображений, что особенно эффективно для задач с пространственной и геометрической логикой. И разработали VPRL — reinforcement learning фреймворк, основанный на GRPO.

Результаты выглядят неплохо. Интересно, насколько хорошо это сработает для соревнования ARC?

Paper
Code

Мои обзоры:
Personal blog
Medium
Linkedin Pulse

#paperreview
​​Мне недавно на почту пришло уведомление, что кто-то мне написал сообщение на Kaggle. Открываю - меня просят дать фидбек на ноутбук.
Смотрю ноутбук и прям с первых же строк появляется ощущение, что текст сгенерен chatgpt или чем-то подобным.

По приколу спросил ChatGPT: "What are the chances that this text is llm-generated?".
И от ответа стало как-то грустно. Оказывается, "Clear and Logical Flow", "Consistent Tone", "a strong grasp of domain knowledge", "Explanation Depth" - это всё признаки LLM.
Что же теперь получается: истинные признаки текста, написанного человеком - неструктурированный поток мысли без всякой глубины? 😅
​​Недавно я писал, что популярность StackOverflow сильно упала.

В попытке оживить платформу, владельцы платформы добавили новую фичу - Matches.

Эта идея полностью меняет суть платформы: вместо публичного вопроса и offline ответов/обсуждения к нему, предлагается вживую отвечать людям в личке.

Это работает так: когда вы открываете сайт, может появиться pop-up "A new user needs help" в котором будет видна часть вопроса. Если соглашаетесь помочь - будет, похоже, общение в формате чата. В настоящий момент работают только pop-up, возможность общения в чате пока не имплементирована.

У этого поста админов карма уже -209. Часть людей недовольна тем, что матчи происходят полурандомно (совсем не совпадают с историей ответов экспертов); другие недовольны самой концепцией - это переводит платформу с публичного форума в личное общение; третьи тем, что платформу пытаются превратить в некий вариант онлайн техподдержки - раньше можно было отвечать в "спокойном режиме", а теперь создаётся "sense of urgency".

Насколько я понимаю, основная мотивация - "The team identified that many newer users feel that Stack Overflow can be slow". Но решать это сменой парадигмы платформы мне кажется странным.

#datascience
Kaggle Hackathons

Каггле решил попробовать двинуться в новом направлении и выкатил новую фичу - Kaggle Hackathons. По факту это развитие идеи Analytics Competition.

Огранизатор хакатона может поставить любую задачу - сделать приложение, что-то сделать с помощью LLM, записать видео и так далее. Сабмиты делаются в виде Hackathon Writeup - пост на форуме со ссылкой на свой проект и подробным объяснением сделанного.

Медальки и очки за такое не дают, так что участие происходит только за призы от организаторов.

#datascience
​​SWE-rebench: An Automated Pipeline for Task Collection and Decontaminated Evaluation of Software Engineering Agents

Ребята из Nebius представили SWE-rebench — масштабируемый, автоматически обновляемый датасет из более чем 21к интерактивных Python-задач с GitHub для оценки LLM-агентов в задачах кодинга. Он решает две ключевые проблемы: нехватку реалистичных тренировочных данных и устаревание статических бенчмарков из-за контаминации. К этому прилагается contamination-free benchmark, показывающий, что результаты некоторых моделей на SWE-bench Verified могут быть переоценены.

Paper
Project
Dataset

Мои обзоры:
Personal blog
Medium
Linkedin Pulse

#paperreview
DevCrowd запускает новый опрос для дата-инженеров, аналитиков, дата-сайентистов, ML-инженеров и их руководителей.

Зачем участвовать?

– чтобы понять, какие задачи и инструменты сейчас в тренде,

– увидеть, как устроена работа у коллег в других продуктах,

– узнать, как растут зарплаты и роли в индустрии,

– получить данные, которые можно использовать для самодиагностики и карьерного планирования.

🗂 Пример прошлогоднего исследования — devcrowd.ru/ds24, мой пост.

📝 Опрос займёт 15 минут, результаты появятся в открытом доступе в августе.

👉 Пройти опрос
Cursor 1.0

Сегодня Cursor дошёл до версии 1.0!
https://www.cursor.com/en/changelog/1-0
Добавили бота для PR ревью, Background Agent для всех, агент для Jupyter Notebook, память и всякое остальное.

Обсуждение на ycombinator.

#datascience
​​- мы хотим AGI, мы хотим, чтобы агенты начали думать
- агенты пытаются делать что-то неожиданное
- нет, не так!!!
Monarch: a distributed execution engine for PyTorch

"Our overall goal is to deliver the high-quality user experience that people get from single-GPU PyTorch, but at cluster scale."
Официально от разработчиков PyTorch, выглядит интересно

https://github.com/pytorch-labs/monarch

#datascience
Anki vs AnkiPro - трагикомедия

В течение последних нескольких недель я наблюдал большое бурление в узких кругах.

Есть программа Anki - один из самых известных инструментов для создания и ревью flashcards.

Она бесплатная для большинства платформ кроме Apple - для iPhone/iPad есть платная версия AnkiMobile. Заплатил один раз - и полный доступ навсегда.

Юзеры любят платформу, но иногда появляются критикующие. Основные причины недовольства - древний интерфейс и желательно почитать хотя бы базовые мануалы перед началом использования.

Неудивительно, что появляются альтернативы и желающие заработать.
И вот довольно давно появилось новое приложение для iPhone/iPad - Anki Pro. Оно не от официальных разработчиков Anki, но название похожее и дизайн практически скопирован. Поэтому многие люди покупают его и думают, что это официальное приложение. Основные его плюсы - более современный и простой интерфейс, а также упрощённый доступ к большому количеству колод карт на разные темы. Из минусов - нет нормальной возможности экспорта из него; подписка, которая через несколько месяцев по стоимости перекрывает единоразовый платёж за официальное приложение; хуже алгоритм scheduling карточек; меньше кастомизации и так далее.

Разработчики настоящего Anki пытались что-то делать (вот тут рассказ), но ничего не получилось.
На форумах и реддите люди годами советовали людям не трогать AnkiPro, но не помогало.

И вдруг недавно, у разработчиков Anki Pro упал сервер... и у всех юзеров пропал доступ к своим карточкам. В реальном anki это невозможно, ибо всё хранится не только на сервере, но и на девайсах юзеров локально. И сервер лежал несколько дней, так что люди были реально недовольны.

Но дальше пошло ещё хуже. Есть аддон, который позволяет перенести данные с Anki Pro на настоящий Anki. Недовольные юзеры стали его использовать, чтобы перейти на настоящий Anki. Ответ разрабоов Anki Pro был просто эпичен и безумен - теперь, при попытке использовать этот аддон, людей перекидывает на видео Rick-roll...

Юзеры совсем охренели от этого. И у разработчиков Anki переполнилась чаша терпения - они начали регистрировать trademark.

Разработчики AnkiPro шустро переименовались в Noji. Точнее они удалили старой приложение и скопировали его под новым названием. Юзеры теперь не уверены в том, что их данные будут перенесены туда. Кто может - переходит на Anki.

Вот такая история.

#languages
​​The state of AI discourse on twitter
Beyond the 80/20 Rule: High-Entropy Minority Tokens Drive Effective Reinforcement Learning for LLM Reasonings

Авторы (разрабочики Qwen) показывают, что в RLVR для улучшения reasoning LLM ключевую роль играют high-entropy "forking tokens" — те, которые определяют ветвление хода рассуждений. Обновляя policy gradient только по этим 20% токенов, можно не только сохранить, но и улучшить качество reasoning (особенно на больших моделях), а обучение только на low-entropy токенах резко ухудшает результат.

Выглядит довольно интересно. Правда сработало только на Qwen-ах - авторы попробовали применить подход к LLAMA и заметных результатов не получили.

Paper
Project

Мои обзоры:
Personal blog
Medium
Linkedin Pulse

#paperreview
Forwarded from AI.Insaf
В Х пропушили библиотеку Memvid, у которой уже 5 тысяч ⭐️ на GitHub. Теперь вместо векторных баз данных предлагают хранить всё в видеофайлах, где каждый кадр — это QR-код. Правда, как справедливо заметили в комментариях, внутри всё равно крутится FAISS и те же векторные базы. Вот до чего доводит вайб-кодинг
​​Pride Month у инженеров
2025/06/11 10:14:20
Back to Top
HTML Embed Code: