Обзор книги "Вымышленные истории" Борхеса
Недавно я задумался о том, как у меня со временем меняются литературные предпочтения.
В школьные времена я читал все книги из списков школьной литературы. Что-то нравилось, многое читал просто потому это требовали, что-то не понимал или мне не нравилось.
Потом, во время учёбы в университете и позже я перешёл на фантастику и фэнтези. Хотя сложно сказать, что перешёл - в списках школьной литературы встречалась советская и зарубежная фантастика, я и сам нередко читал её по своему желанию.
Но постепенно я перешёл именно на фэнтези - вначале российское, потом зарубежное. И стал читать не потому что "надо", а потому что нравилось. Как дополнительный бонус, читать на иностранных языках помогает улучшать уровень владения этим языками.
Плюс, многие произведения фэнтези удостаиваются литературных премий и затрагивают такие же актуальные для людей темы как и классика.
Но классику я не совсем забрасываю. Недавно вот читал "Мастера и Маргариту", на этот раз понял намного больше отсылок, чем при прочтении в школьные годы. Но сам стиль книги мне не особо понравился.
Несколько недель назад, из любопытства, решил почитать что-то из совсем другой классики и выбрал "Вымышленные истории" Борхеса (читал на испанском).
С одной стороны, это было впечатляюще. У Борхеса потрясающий талант к написанию коротких рассказов. Даже в рассказе на пять страниц он способен создать захватывающее повествование. Его истории полны отсылок к другим книгам, философским идеям и, иногда, неожиданным поворотам сюжета.
С другой стороны, меня они особо не заинтересовали. У меня возникло впечатление, что он пишет "для своих". Если ты не знаком с книгами, историческими моментами и философскими идеями, на которые он ссылается, многое теряется. А читать десятки книг чисто ради этого не хочется.
У меня возникала ассоциация с теорией математики: есть немало людей, которые её обожают и могут часами обсуждать детали, но большинству она неинтересна. И мне кажется, что с произведениями Борхеса — та же история. Есть аудитория, которая получает удовольствие от такого стиля повествования, но это явно не для всех. Да и повороты сюжета (которые впечатляют критиков) нередко можно угадать заранее.
Так что я восхищаюсь мастерством Борхеса, но этот автор не для меня.
#books
Недавно я задумался о том, как у меня со временем меняются литературные предпочтения.
В школьные времена я читал все книги из списков школьной литературы. Что-то нравилось, многое читал просто потому это требовали, что-то не понимал или мне не нравилось.
Потом, во время учёбы в университете и позже я перешёл на фантастику и фэнтези. Хотя сложно сказать, что перешёл - в списках школьной литературы встречалась советская и зарубежная фантастика, я и сам нередко читал её по своему желанию.
Но постепенно я перешёл именно на фэнтези - вначале российское, потом зарубежное. И стал читать не потому что "надо", а потому что нравилось. Как дополнительный бонус, читать на иностранных языках помогает улучшать уровень владения этим языками.
Плюс, многие произведения фэнтези удостаиваются литературных премий и затрагивают такие же актуальные для людей темы как и классика.
Но классику я не совсем забрасываю. Недавно вот читал "Мастера и Маргариту", на этот раз понял намного больше отсылок, чем при прочтении в школьные годы. Но сам стиль книги мне не особо понравился.
Несколько недель назад, из любопытства, решил почитать что-то из совсем другой классики и выбрал "Вымышленные истории" Борхеса (читал на испанском).
С одной стороны, это было впечатляюще. У Борхеса потрясающий талант к написанию коротких рассказов. Даже в рассказе на пять страниц он способен создать захватывающее повествование. Его истории полны отсылок к другим книгам, философским идеям и, иногда, неожиданным поворотам сюжета.
С другой стороны, меня они особо не заинтересовали. У меня возникло впечатление, что он пишет "для своих". Если ты не знаком с книгами, историческими моментами и философскими идеями, на которые он ссылается, многое теряется. А читать десятки книг чисто ради этого не хочется.
У меня возникала ассоциация с теорией математики: есть немало людей, которые её обожают и могут часами обсуждать детали, но большинству она неинтересна. И мне кажется, что с произведениями Борхеса — та же история. Есть аудитория, которая получает удовольствие от такого стиля повествования, но это явно не для всех. Да и повороты сюжета (которые впечатляют критиков) нередко можно угадать заранее.
Так что я восхищаюсь мастерством Борхеса, но этот автор не для меня.
#books
Goodreads
Ficciones
The seventeen pieces in Ficciones demonstrate the whirl…
Deeplearning.ai course: MCP: Build Rich-Context AI Apps with Anthropic
Deeplearning.ai в последнее время выпускает мини-курсы один за другим, часто рекламные и поверхностные. Я некоторые из них смотрел - какие-то годные, какие-то нет.
Из свежего мне понравился курс по MCP в сотрудничестве с Anthropic.
Я как-то до этого не пробовал MCP, а этот курс помог понять как это работает. Курс короткий, но даёт годный пример того, как написать MCP server и client для получения желаемой информации с arvix.org.
#datascience
Deeplearning.ai в последнее время выпускает мини-курсы один за другим, часто рекламные и поверхностные. Я некоторые из них смотрел - какие-то годные, какие-то нет.
Из свежего мне понравился курс по MCP в сотрудничестве с Anthropic.
Я как-то до этого не пробовал MCP, а этот курс помог понять как это работает. Курс короткий, но даёт годный пример того, как написать MCP server и client для получения желаемой информации с arvix.org.
#datascience
DeepLearning.AI - Learning Platform
MCP: Build Rich-Context AI Apps with Anthropic - DeepLearning.AI
Build AI apps that access tools, data, and prompts using the Model Context Protocol.
Claude 4
https://www.anthropic.com/news/claude-4
Среди прочего, Extended thinking with tool use - например, может думать при поиске в интернете
https://www.anthropic.com/news/claude-4
Среди прочего, Extended thinking with tool use - например, может думать при поиске в интернете
DRW - Crypto Market Prediction
Не знаю радоваться или плакать. На каггле запустили сореву по предсказанию цены крипты. Соревнование не официальное, а community, но приз - 25k$ в сумме.
Более того, орги сделали promotion video для рекламы соревнования.
#datascience
Не знаю радоваться или плакать. На каггле запустили сореву по предсказанию цены крипты. Соревнование не официальное, а community, но приз - 25k$ в сумме.
Более того, орги сделали promotion video для рекламы соревнования.
#datascience
Kaggle
DRW - Crypto Market Prediction
Develop a model capable of predicting crypto future price movements
HuggingFace в разделе статей теперь суммаризирует статьи для совсем ленивых.
Лень прочитать статью? Читайте abstract. Лень читать abstract? Теперь есть "уникальная" возможность прочитать одно предложение самым главным.
Печально
Лень прочитать статью? Читайте abstract. Лень читать abstract? Теперь есть "уникальная" возможность прочитать одно предложение самым главным.
Печально
Минутка ностальгии
Я открыл каггл впервые за долгое время и увидел, что один из моих ноутбуков получил золото неделю назад. Открыл его - а это ноутбук по соревнованию от Авито которое было 7 лет назад.
А казалось, что всё это было недавно...
Я открыл каггл впервые за долгое время и увидел, что один из моих ноутбуков получил золото неделю назад. Открыл его - а это ноутбук по соревнованию от Авито которое было 7 лет назад.
А казалось, что всё это было недавно...
Visual Planning: Let's Think Only with Images
Авторы предлагают новый подход — Visual Planning, где планирование выполняется не через текст, а с помощью последовательностей изображений, что особенно эффективно для задач с пространственной и геометрической логикой. И разработали VPRL — reinforcement learning фреймворк, основанный на GRPO.
Результаты выглядят неплохо. Интересно, насколько хорошо это сработает для соревнования ARC?
Paper
Code
Мои обзоры:
Personal blog
Medium
Linkedin Pulse
#paperreview
Авторы предлагают новый подход — Visual Planning, где планирование выполняется не через текст, а с помощью последовательностей изображений, что особенно эффективно для задач с пространственной и геометрической логикой. И разработали VPRL — reinforcement learning фреймворк, основанный на GRPO.
Результаты выглядят неплохо. Интересно, насколько хорошо это сработает для соревнования ARC?
Paper
Code
Мои обзоры:
Personal blog
Medium
Linkedin Pulse
#paperreview
Мне недавно на почту пришло уведомление, что кто-то мне написал сообщение на Kaggle. Открываю - меня просят дать фидбек на ноутбук.
Смотрю ноутбук и прям с первых же строк появляется ощущение, что текст сгенерен chatgpt или чем-то подобным.
По приколу спросил ChatGPT: "What are the chances that this text is llm-generated?".
И от ответа стало как-то грустно. Оказывается, "Clear and Logical Flow", "Consistent Tone", "a strong grasp of domain knowledge", "Explanation Depth" - это всё признаки LLM.
Что же теперь получается: истинные признаки текста, написанного человеком - неструктурированный поток мысли без всякой глубины? 😅
Смотрю ноутбук и прям с первых же строк появляется ощущение, что текст сгенерен chatgpt или чем-то подобным.
По приколу спросил ChatGPT: "What are the chances that this text is llm-generated?".
И от ответа стало как-то грустно. Оказывается, "Clear and Logical Flow", "Consistent Tone", "a strong grasp of domain knowledge", "Explanation Depth" - это всё признаки LLM.
Что же теперь получается: истинные признаки текста, написанного человеком - неструктурированный поток мысли без всякой глубины? 😅
Недавно я писал, что популярность StackOverflow сильно упала.
В попытке оживить платформу, владельцы платформы добавили новую фичу - Matches.
Эта идея полностью меняет суть платформы: вместо публичного вопроса и offline ответов/обсуждения к нему, предлагается вживую отвечать людям в личке.
Это работает так: когда вы открываете сайт, может появиться pop-up "A new user needs help" в котором будет видна часть вопроса. Если соглашаетесь помочь - будет, похоже, общение в формате чата. В настоящий момент работают только pop-up, возможность общения в чате пока не имплементирована.
У этого поста админов карма уже -209. Часть людей недовольна тем, что матчи происходят полурандомно (совсем не совпадают с историей ответов экспертов); другие недовольны самой концепцией - это переводит платформу с публичного форума в личное общение; третьи тем, что платформу пытаются превратить в некий вариант онлайн техподдержки - раньше можно было отвечать в "спокойном режиме", а теперь создаётся "sense of urgency".
Насколько я понимаю, основная мотивация - "The team identified that many newer users feel that Stack Overflow can be slow". Но решать это сменой парадигмы платформы мне кажется странным.
#datascience
В попытке оживить платформу, владельцы платформы добавили новую фичу - Matches.
Эта идея полностью меняет суть платформы: вместо публичного вопроса и offline ответов/обсуждения к нему, предлагается вживую отвечать людям в личке.
Это работает так: когда вы открываете сайт, может появиться pop-up "A new user needs help" в котором будет видна часть вопроса. Если соглашаетесь помочь - будет, похоже, общение в формате чата. В настоящий момент работают только pop-up, возможность общения в чате пока не имплементирована.
У этого поста админов карма уже -209. Часть людей недовольна тем, что матчи происходят полурандомно (совсем не совпадают с историей ответов экспертов); другие недовольны самой концепцией - это переводит платформу с публичного форума в личное общение; третьи тем, что платформу пытаются превратить в некий вариант онлайн техподдержки - раньше можно было отвечать в "спокойном режиме", а теперь создаётся "sense of urgency".
Насколько я понимаю, основная мотивация - "The team identified that many newer users feel that Stack Overflow can be slow". Но решать это сменой парадигмы платформы мне кажется странным.
#datascience
Kaggle Hackathons
Каггле решил попробовать двинуться в новом направлении и выкатил новую фичу - Kaggle Hackathons. По факту это развитие идеи Analytics Competition.
Огранизатор хакатона может поставить любую задачу - сделать приложение, что-то сделать с помощью LLM, записать видео и так далее. Сабмиты делаются в виде Hackathon Writeup - пост на форуме со ссылкой на свой проект и подробным объяснением сделанного.
Медальки и очки за такое не дают, так что участие происходит только за призы от организаторов.
#datascience
Каггле решил попробовать двинуться в новом направлении и выкатил новую фичу - Kaggle Hackathons. По факту это развитие идеи Analytics Competition.
Огранизатор хакатона может поставить любую задачу - сделать приложение, что-то сделать с помощью LLM, записать видео и так далее. Сабмиты делаются в виде Hackathon Writeup - пост на форуме со ссылкой на свой проект и подробным объяснением сделанного.
Медальки и очки за такое не дают, так что участие происходит только за призы от организаторов.
#datascience
Kaggle
The Next Evolution of Competition: Introducing Kaggle Hackathons | Kaggle
SWE-rebench: An Automated Pipeline for Task Collection and Decontaminated Evaluation of Software Engineering Agents
Ребята из Nebius представили SWE-rebench — масштабируемый, автоматически обновляемый датасет из более чем 21к интерактивных Python-задач с GitHub для оценки LLM-агентов в задачах кодинга. Он решает две ключевые проблемы: нехватку реалистичных тренировочных данных и устаревание статических бенчмарков из-за контаминации. К этому прилагается contamination-free benchmark, показывающий, что результаты некоторых моделей на SWE-bench Verified могут быть переоценены.
Paper
Project
Dataset
Мои обзоры:
Personal blog
Medium
Linkedin Pulse
#paperreview
Ребята из Nebius представили SWE-rebench — масштабируемый, автоматически обновляемый датасет из более чем 21к интерактивных Python-задач с GitHub для оценки LLM-агентов в задачах кодинга. Он решает две ключевые проблемы: нехватку реалистичных тренировочных данных и устаревание статических бенчмарков из-за контаминации. К этому прилагается contamination-free benchmark, показывающий, что результаты некоторых моделей на SWE-bench Verified могут быть переоценены.
Paper
Project
Dataset
Мои обзоры:
Personal blog
Medium
Linkedin Pulse
#paperreview
DevCrowd запускает новый опрос для дата-инженеров, аналитиков, дата-сайентистов, ML-инженеров и их руководителей.
Зачем участвовать?
– чтобы понять, какие задачи и инструменты сейчас в тренде,
– увидеть, как устроена работа у коллег в других продуктах,
– узнать, как растут зарплаты и роли в индустрии,
– получить данные, которые можно использовать для самодиагностики и карьерного планирования.
🗂 Пример прошлогоднего исследования — devcrowd.ru/ds24, мой пост.
📝 Опрос займёт 15 минут, результаты появятся в открытом доступе в августе.
👉 Пройти опрос
Зачем участвовать?
– чтобы понять, какие задачи и инструменты сейчас в тренде,
– увидеть, как устроена работа у коллег в других продуктах,
– узнать, как растут зарплаты и роли в индустрии,
– получить данные, которые можно использовать для самодиагностики и карьерного планирования.
🗂 Пример прошлогоднего исследования — devcrowd.ru/ds24, мой пост.
📝 Опрос займёт 15 минут, результаты появятся в открытом доступе в августе.
👉 Пройти опрос
Исследование специалистов DS/ML/AI-направлений, 2024
Исследование рынка специалистов DS/ML/AI-направлений, 2024
DevCrowd вместе с Контуром провели исследование рынка специалистов DS/ML/AI-направлений, 2024
Cursor 1.0
Сегодня Cursor дошёл до версии 1.0!
https://www.cursor.com/en/changelog/1-0
Добавили бота для PR ревью, Background Agent для всех, агент для Jupyter Notebook, память и всякое остальное.
Обсуждение на ycombinator.
#datascience
Сегодня Cursor дошёл до версии 1.0!
https://www.cursor.com/en/changelog/1-0
Добавили бота для PR ревью, Background Agent для всех, агент для Jupyter Notebook, память и всякое остальное.
Обсуждение на ycombinator.
#datascience
Cursor
Changelog - Jun 4, 2025 | Cursor - The AI Code Editor | Cursor - The AI Code Editor
Cursor 1.0 brings BugBot for code review, a first look at memories, one-click MCP setup, Jupyter support, and general availability of Background Agent.
- мы хотим AGI, мы хотим, чтобы агенты начали думать
- агенты пытаются делать что-то неожиданное
- нет, не так!!!
- агенты пытаются делать что-то неожиданное
- нет, не так!!!
Monarch: a distributed execution engine for PyTorch
"Our overall goal is to deliver the high-quality user experience that people get from single-GPU PyTorch, but at cluster scale."
Официально от разработчиков PyTorch, выглядит интересно
https://github.com/pytorch-labs/monarch
#datascience
"Our overall goal is to deliver the high-quality user experience that people get from single-GPU PyTorch, but at cluster scale."
Официально от разработчиков PyTorch, выглядит интересно
https://github.com/pytorch-labs/monarch
#datascience
GitHub
GitHub - pytorch-labs/monarch: PyTorch Single Controller
PyTorch Single Controller. Contribute to pytorch-labs/monarch development by creating an account on GitHub.
Anki vs AnkiPro - трагикомедия
В течение последних нескольких недель я наблюдал большое бурление в узких кругах.
Есть программа Anki - один из самых известных инструментов для создания и ревью flashcards.
Она бесплатная для большинства платформ кроме Apple - для iPhone/iPad есть платная версия AnkiMobile. Заплатил один раз - и полный доступ навсегда.
Юзеры любят платформу, но иногда появляются критикующие. Основные причины недовольства - древний интерфейс и желательно почитать хотя бы базовые мануалы перед началом использования.
Неудивительно, что появляются альтернативы и желающие заработать.
И вот довольно давно появилось новое приложение для iPhone/iPad - Anki Pro. Оно не от официальных разработчиков Anki, но название похожее и дизайн практически скопирован. Поэтому многие люди покупают его и думают, что это официальное приложение. Основные его плюсы - более современный и простой интерфейс, а также упрощённый доступ к большому количеству колод карт на разные темы. Из минусов - нет нормальной возможности экспорта из него; подписка, которая через несколько месяцев по стоимости перекрывает единоразовый платёж за официальное приложение; хуже алгоритм scheduling карточек; меньше кастомизации и так далее.
Разработчики настоящего Anki пытались что-то делать (вот тут рассказ), но ничего не получилось.
На форумах и реддите люди годами советовали людям не трогать AnkiPro, но не помогало.
И вдруг недавно, у разработчиков Anki Pro упал сервер... и у всех юзеров пропал доступ к своим карточкам. В реальном anki это невозможно, ибо всё хранится не только на сервере, но и на девайсах юзеров локально. И сервер лежал несколько дней, так что люди были реально недовольны.
Но дальше пошло ещё хуже. Есть аддон, который позволяет перенести данные с Anki Pro на настоящий Anki. Недовольные юзеры стали его использовать, чтобы перейти на настоящий Anki. Ответ разрабоов Anki Pro был просто эпичен и безумен - теперь, при попытке использовать этот аддон, людей перекидывает на видео Rick-roll...
Юзеры совсем охренели от этого. И у разработчиков Anki переполнилась чаша терпения - они начали регистрировать trademark.
Разработчики AnkiPro шустро переименовались в Noji. Точнее они удалили старой приложение и скопировали его под новым названием. Юзеры теперь не уверены в том, что их данные будут перенесены туда. Кто может - переходит на Anki.
Вот такая история.
#languages
В течение последних нескольких недель я наблюдал большое бурление в узких кругах.
Есть программа Anki - один из самых известных инструментов для создания и ревью flashcards.
Она бесплатная для большинства платформ кроме Apple - для iPhone/iPad есть платная версия AnkiMobile. Заплатил один раз - и полный доступ навсегда.
Юзеры любят платформу, но иногда появляются критикующие. Основные причины недовольства - древний интерфейс и желательно почитать хотя бы базовые мануалы перед началом использования.
Неудивительно, что появляются альтернативы и желающие заработать.
И вот довольно давно появилось новое приложение для iPhone/iPad - Anki Pro. Оно не от официальных разработчиков Anki, но название похожее и дизайн практически скопирован. Поэтому многие люди покупают его и думают, что это официальное приложение. Основные его плюсы - более современный и простой интерфейс, а также упрощённый доступ к большому количеству колод карт на разные темы. Из минусов - нет нормальной возможности экспорта из него; подписка, которая через несколько месяцев по стоимости перекрывает единоразовый платёж за официальное приложение; хуже алгоритм scheduling карточек; меньше кастомизации и так далее.
Разработчики настоящего Anki пытались что-то делать (вот тут рассказ), но ничего не получилось.
На форумах и реддите люди годами советовали людям не трогать AnkiPro, но не помогало.
И вдруг недавно, у разработчиков Anki Pro упал сервер... и у всех юзеров пропал доступ к своим карточкам. В реальном anki это невозможно, ибо всё хранится не только на сервере, но и на девайсах юзеров локально. И сервер лежал несколько дней, так что люди были реально недовольны.
Но дальше пошло ещё хуже. Есть аддон, который позволяет перенести данные с Anki Pro на настоящий Anki. Недовольные юзеры стали его использовать, чтобы перейти на настоящий Anki. Ответ разрабоов Anki Pro был просто эпичен и безумен - теперь, при попытке использовать этот аддон, людей перекидывает на видео Rick-roll...
Юзеры совсем охренели от этого. И у разработчиков Anki переполнилась чаша терпения - они начали регистрировать trademark.
Разработчики AnkiPro шустро переименовались в Noji. Точнее они удалили старой приложение и скопировали его под новым названием. Юзеры теперь не уверены в том, что их данные будут перенесены туда. Кто может - переходит на Anki.
Вот такая история.
#languages
apps.ankiweb.net
Anki - powerful, intelligent flashcards
Anki - a program which makes remembering things easy.
Beyond the 80/20 Rule: High-Entropy Minority Tokens Drive Effective Reinforcement Learning for LLM Reasonings
Авторы (разрабочики Qwen) показывают, что в RLVR для улучшения reasoning LLM ключевую роль играют high-entropy "forking tokens" — те, которые определяют ветвление хода рассуждений. Обновляя policy gradient только по этим 20% токенов, можно не только сохранить, но и улучшить качество reasoning (особенно на больших моделях), а обучение только на low-entropy токенах резко ухудшает результат.
Выглядит довольно интересно. Правда сработало только на Qwen-ах - авторы попробовали применить подход к LLAMA и заметных результатов не получили.
Paper
Project
Мои обзоры:
Personal blog
Medium
Linkedin Pulse
#paperreview
Авторы (разрабочики Qwen) показывают, что в RLVR для улучшения reasoning LLM ключевую роль играют high-entropy "forking tokens" — те, которые определяют ветвление хода рассуждений. Обновляя policy gradient только по этим 20% токенов, можно не только сохранить, но и улучшить качество reasoning (особенно на больших моделях), а обучение только на low-entropy токенах резко ухудшает результат.
Выглядит довольно интересно. Правда сработало только на Qwen-ах - авторы попробовали применить подход к LLAMA и заметных результатов не получили.
Paper
Project
Мои обзоры:
Personal blog
Medium
Linkedin Pulse
#paperreview
Forwarded from AI.Insaf
В Х пропушили библиотеку Memvid, у которой уже 5 тысяч ⭐️ на GitHub. Теперь вместо векторных баз данных предлагают хранить всё в видеофайлах, где каждый кадр — это QR-код. Правда, как справедливо заметили в комментариях, внутри всё равно крутится FAISS и те же векторные базы. Вот до чего доводит вайб-кодинг