Telegram Group Search
​​Какой "стул" выбрать: Gemini или Claude?

Девушка получила диагноз: рак. Решила пожаловаться разным LLM. Ответы... очень разные.

Claude: сочувствую, держись. Ты - молодец, можем поговорить об этом.
Gemini: Мне не нравится тон твоего поста. Рак есть у миллионов людей, так что радуйся тому, что тебе доступно лечение и молчи. Можешь погуглить информацию о лечении. И будь позитивнее по отношению к другим людям

Вот такой alignment

https://x.com/venturetwins/status/1857100097861173503
​​Pokémon GO -> Large Geospatial Model

В наше время данные собирают всеми возможными путями. Niantic собирает данные от игроков Pokemon GO и создаёт свою Global Large Model для понимания мира. Это явно поможет разработкам в сфере AR. В настоящее время это используется в их Visual Positioning Service, плюс в Pokemon GO теперь игроки могут оставить своего покемона в каком-то месте, чтобы другие игроки могли с ним взаимодействовать.

Ещё они недавно опубликовали статью на схожую тему.

https://nianticlabs.com/news/largegeospatialmodel
​​Project Sid: Many-agent simulations toward AI civilization

Авторы статьи гоняли много экспериментов на 10-1000 AI-агентов с архитектурой PIANO, позволяющей им взаимодействовать друг с другом для кооперации. В итоге агенты научились специализироваться, создавать/изменять/соблюдать коллективные правила (типа системы налогов) и даже развивать культуру и религию. Авторы явно хорошо развлекались: распространение культуры было в виде мемов, а религией было пастафарианство (Церковь Летающего Макаронного Монстра) :)

В общем, читать было интересно и весело.

Paper link

Мои обзоры:
Personal blog
Medium
Linkedin Pulse

#paperreview
Как организовать эксперименты так, чтобы получить статью с желанным результатом

Думаю, что многим знакомы статьи по машинному обучению, где авторы поступают не совсем честно - неправильное разбиение на трейн/валидацию, манипуляция метриками и многое другое. Но это происходит и в других сферах

Недавно мне попалась на глаза статья с громким названием Handwriting but not typewriting leads to widespread brain connectivity: a high-density EEG study with implications for the classroom)(https://www.openread.academy/en/paper/reading?corpusId=503252214), решил почитать. Исследование было организовано просто "на отлично":

Было 36 студентов в качестве выборки (брали только праворуких). Ну да ладно, в исследованиях на людях часто бывает маленькая выборка. Их взяли на улице, то есть на территории университета и обещали дать билеты в кино стоимостью 15$. Просили написать или напечатать 15 слов (типа "paraply").
И вот как было дальше организовано. Если люди видели инструкцию "write", они должны были писать курсивом (стилусом в правой руке) на электронном экране. Если же они видели инструкцию "type", они должны были... печатать слова одним указательным пальцем правой руки. Мол, если бы люди печатали всеми пальцами, сложно было бы оценить эффект. И это ещё не все: когда люди печатали слова, они не видели введённый текст.

То есть при написании курсивом были довольно естественные условия, а при печатании - самые неестественные, которые можно было придумать.

Ну и сам результат: измеряли "brain electrical connectivity", получили, что эти паттерны намного более "elaborate" при написании текста, чем при печатании. И делают вывод: мол, в литературе это коррелирует с улучшением изучения нового материала, а значит и написание текста ручкой напрямую коррелирует с лучшим усваиванием материала.

Очень сомнительное исследование.

C другой стороны, если говорить про мой опыт, я использую и то, и другое. Когда мне нужен brainshorming - предпочитаю писать, в остальных случаях - печатать. Нюанс ещё в том, что у меня ужасный почерк и чтобы писать разборчиво, мне надо прилагать осознанные усилия и отвлекаться от того, о чём именно я пишу. А при печатании таких проблем не возникает - можно фокусироваться на сути.
​​Reverse Thinking Makes LLMs Stronger Reasoners

LLM всё не хотят думать, но люди их заставляют :) В статье авторы предлагают очередную попытку научить модель "рассуждать" лучше. Берут модель-учитель, для каждого исходного вопроса генерят обратный вопрос, и для обоих вопросов reasoning. Например: "У Джона 3 яблока, у Эммы 2 яблока; сколько у них всего яблок?" превращается в "У Джона и Эммы в сумме 5 яблок. Если у Эммы 2 яблока, сколько яблок у Джона?". Эдакая попытка заставить модель думать о вопросе с разных сторон. На этом учат модель-ученика.

Результаты положительные (а иначе статьи и не было бы): повышает точность моделей на 13.53%, демонстрирует sample efficiency, превосходя стандартный fine-tuning с 10% данных, и эффективно работает на out-of-distribution датасетах.

Paper link

Мои обзоры:
Personal blog
Medium
Linkedin Pulse

#paperreview
Annual Japanese Fest in Dubai

В прошлое воскресенье в Дубае прошел третий ежегодный Японский фестиваль https://linktr.ee/japanesefestival.
Я посещаю его уже второй раз, и это клёво. Было очень много людей, в основном японцев.
Сама площадка была разделено на две части.

Левая сторона была посвящена активностям. Там было много стендов с традиционными занятиями: Чайная церемония, икебана (аранжировка цветов), мастер-класс по оригами. Мне особенно понравился стенд с японской каллиграфией - мастер рисовала слова на веерах. Самые распространенные варианты - имена и пожелания благополучия. Кстати, она узнала меня - вспомнила, что я был там в прошлом году! Было много игр - стрельба, гача, перетягивание каната, ловля золотых рыбок и так далее. В основном это было ориентировано на детей, но взрослые тоже с удовольствием участовали.

Вторая часть площадки была отведена под еду и главную сцену. Там были разные выступления. Началось все с каллиграфии. Мастер со стенда рисовал на холстах два огромных кандзи. Было прям заметно, что махать огромной кистью ей было тяжело. К концу ее руки были полностью покрыты черной краской. Также были показательные выступления по кендо. И можно было посмотреть как дети бьют друг друга, то есть на демонстрацию карате.

И было много японских блюд. Мне понравилось мясо wagyu и уникальное мороженое - Hojicha Stracciatella Gelato. Его делают из японского обжаренного чая (да, именно обжаренного) и шоколадной крошкой.

Что было особенно приятно - я мог понимать большинство текстов и даже около 50% того, что говорили на главной сцене, благодаря изучению японского языка в этом году!

#life #dubai
​​Bojan Tunguz в своём репертуаре :)
​​When Duolingo characters break 4th wall

#languages
​​How to use AI to write articles about how to use AI as a product manager for your AI app on your journey to being replaced by an AI product manager

Andrew Ng опубликовал мини-блог пост AI Product Management. К сожалению, текст настолько generic, что его очень красочно описали на ycombinator
2025/02/06 18:20:29
Back to Top
HTML Embed Code: