avvablog Telegram Group

Авва

Андрей Карпати недавно опубликовал новое видео про то, как работают языковые модели, для широкой публики. Скорее всего, оно очень хорошее и стоит вашего внимания, если вы хотите разобраться, как устроен ChatGPT и другие такие модели - говорю "скорее всего", потому что целиком его не смотрел, там слишком мало для меня нового. Но Карпати всегда очень хорошо объясняет, по моему опыту.

Я хочу привлечь внимание к одному месту в его видео (1:47 в видео), где он сравнивает разные методики тренировки моделей на примерах "вопрос - ответ". Он дает такой пример: скажем, мы хотим, чтобы модель идеально отвечала на вопросы типа

Эмили купила 3 яблока и 2 апельсина. Каждый апельсин стоит $2, а всего она заплатила $13. Сколько стоит каждое яблоко?

Тогда мы можем сгенерировать много примеров вопросов такого вида и правильных ответов, и натренировать модель на них, вдонабок к тому, что она и так уже имеет; это назыается подкрутка, файн-тьюнинг.

(Это просто игрушечный пример: конкретно на этот вопрос любая ведущая модель сегодня и так ответит, но в реальности нам могут понадобиться более сложные вопросы и задачи).

Но вот вопрос, как сформулировать правильный ответ, к которому модель должна стремиться?

Два варианта:

Ответ: $3. Два апельсина по $2 каждый стоят вместе $4, значит, яблоки стоят $13-$4=$9, и каждое яблоко стоит $9/3 = $3.

Два апельсина по $2 каждый стоят вместе $4, значит, яблоки стоят $13-$4=$9, и всего есть три яблока, поэтому каждое яблоко стоит $9/3 = $3. Ответ: $3.

Карпати совершенно справедливо объясняет, что второй вариант ответа НАМНОГО ЛУЧШЕ, чем первый, в том смысле, что если мы будем использовать второй вариант при тренировки модели, она сможет решить больше задач, и более качественно.

Это верно вот почему, и это ключевой момент, который, наверное, многие недостаточно хорошо понимают про языковые модели: когда вы получаете ответ от модели, она выдает его буква за буквой (точнее токен за токеном, но разница в данном случае неважна), и каждый раз "думает" заново, какую букву выдать следующей, и при каждом таком размышлении ВИДИТ ВСЕ, ЧТО УЖЕ НАПИСАЛА.

Поэтому если модель натренировали отвечать по первому шаблону, то она начнет выдавать: "Ответ $", и в этот момент ей нужно будет сказать правильный ответ, основываясь только на условии задачи. А если по второму, она может выдавать промежуточные результаты: апельсины $4, осталось $9, всего 3 яблока, надо поделить - не "вписываясь" за какой-то определенный ответ до самого конца - и в конце выдавать этот ответ, используя в том числе свои же предыдущие промежуточные размышления.

То, что Карпати не говорит тут, а я добавлю: тот же самый трюк вы можете использовать не во время тренировки, а во время использования больших моделей типа ChatGPT. Когда вы задаете модели сложный вопрос - необязательно математический - для ответа на который надо учесть много факторов, всегда стоит попробовать сказать ей: "Не давай мне ответ сразу, сначала сделай все промежуточные вычисления и приведи их результаты, и только потом напиши окончательный ответ".

Или: "Я хочу попробовать сделать X таким-то способом. Не пиши мне сразу, хорошая это идея или нет, сначала приведи список доводов за и против, а также альтернатив, и в самом конце подытожь и дай свою рекомендацию".

Я почти всегда именно так прошу языковые модели на что-то сложное и неочидное мне ответить или порекомендовать, просто потому, что у меня в голове есть эта устоявшаяся картинка того, как модель отвечает буква за буквой, все время потребляя все окно контекста, включая уже сказанную часть ответа. Нередко это неважно, потому что модель и так "решила", какой ответ хочет дать, на основании вопроса, и ей не нужна помощь в виде своих же промежуточных шагов. Но именно на самых сложных и неочевидных для моделей вопросов это часто помогает. Как минимум стоит об этом помнить и попробовать так сформулировать, если обычный и самый простой вопрос ведет к неверному ответу или бреду.

5.3K viewsedited 12:04

Авва

Примечательное заявление от анонимных хозяев Anna's Archive, самой большой и полезной пираткой библиотеки в последние несколько лет. Десятки миллионов книг и академических статей в ней чрезвычайно нужны не только людям, но и большим языковым моделям - хоть им и скармливают "весь интернет", и хотя весь интернет намного больше по размеру, чем архив Анны, в пиратских библиотеках есть огромное количество экспертных знаний, которых нет в открытом доступе.

Я давно подозревал, что LLMы тренируют на пиратских библиотеках, скорее всего на архиве Анны, но прямое подтверждение пришло месяц назад, в статье китайских разработчиков Deepseek это прямо указано, хотя с точки зрения законов о копирайте нелегальность всего этого очевидна (но типа идите подавайте на нас в суд в Китае). А пару недель назад сообщили, что в иске против Meta утверждается, что они скачивали архив Анны и Либген.

Я очень сильно подозреваю, что где-то в глубине OpenAI сидят один или два человека, которые единственные знают все технические и финансовые подробности того, как архив Анны качается и вставляется в процесс тренировки их моделей. И меня не удивит, если то же верно для Гугла и моделей Gemini, несмотря на очевидный огромный легальный риск. Преимущество, которое дает моделям такой огромный набор данных высокого качества, слишком велико. Вполне возможно, что его просто не преодолеть другими способами, и если вы одна из 5-6 компаний, соревнующихся в борьбе топ-моделей, то либо вы находите способ использовать эти данные, либо остаетесь позади.

На фоне этой реальности Анна (ну мы не знаем, конечно, что это реальное имя) раскрывает тот факт, что они дали доступ на высокой скорости (чтобы все можно было скачать за разумное время) 30 компаниям, в том числе американским, благоразумно не называя никакие имена, кроме Deepseek, которые сами признались. И призывает реформировать копирайт - ограничить 20 годами, и в любом случае исключить из него компании, собирающие тексты для хранения и компьютерной обработки, а не перепродажи; чтобы не дать тем странам, где на закон могут без проблем наплевать в случае нужды (Китай в первую очередь) вырваться вперед в гонке за лучший искусственный интеллект. Я не верю, что такой призыв может сейчас сработать, но если легальные проблемы действительно затормозят ведущие западные модели и через полгода-год это станет очевидным? Тогда - кто знает?

annas-archive.org

Chinese LLMs (including DeepSeek) are trained on my illegal archive of books and papers — the largest in the world. The West needs to overhaul copyright law as a matter of national security.

6.4K views18:32

Авва

В Тиктоке и Твиттере - виральное видео женщины, которая спрашивает мужа, как это может быть, что он видит ее в зеркале, в то время как она держит перед собой полотенце, которое ее закрывает. "Как зеркало знает, что я делаю по другую сторону?", она спрашивает снова и снова, а мужчина отвечает "это называется отражение".

Многие обсмеяли этот ролик, но мне гораздо больше понравилась, наоборот, контрреакция на это высмеивание, когда люди пишут, что не понимать, как что-то устроено и пытаться понять и спрашивать - хорошо и достойно. Наверное, из-за того, что мы привыкли смотреть прямо перед собой в большие зеркала, роль той части зеркала, что не прямо перед нами, недостаточно интуитивно воспринимается. Люди как бы ощущают, что их зеркальное отражение должно приходить из какой-то "глубины внутри зеркала" прямо перед ними, даже если в итоге оно попадает в глаза человека, стоящего в стороне.

На самом деле мы видим женщину, потому что лучи света от ее лица летят в том числе вбок, попадают в часть зеркала, НЕ закрытую полотенцем, и, отражаясь от нее, попадают в камеру. Если на секунду представить, что часть зеркала справа от полотенца замазали черной краской, это станет сразу интуитивно понятно. На второй картинке есть схематическое объяснение.

5.4K viewsedited 22:41

Авва

В ЖЖ 10 лет назад наверное появилась такая фишка, что он автоматически сохраняет на сервере твой пост, пока ты пишешь его, и если не послал, а потом открыл в другом окне или на другом компьютере, предлагает загрузить и продолжить. В телеграме тоже такое есть.

В фейсбуке в 2025-м году до сих пор такого нет. А ведь тривиально с точки зрения программирования, по сравнению со всем тем, что там наворочено.

4.8K views10:16

Авва

Узнал о такой штуке, как аллюлоза. Это вид сахара, который встречается в небольших количествах в некоторых растениях, но в 90-х его научились производить с помощью ферментов. Он сладкий примерно как обычный сахар, но в нем В 10-20 РАЗ меньше калорий. Там идея в том, что молекулы немного по-другому расставлены (химический состав тот же, что у сахара, но в 3D шарики сцепились по-другому), и организм его почти не усваивает.

Выглядит, как мечта. На вкус тоже, между прочим. Не вполне ясно, почему вообще весь сахар не заменяют на аллюлозу.

(ИИ говорит, потому что дорогой, и потому что если очень много съесть, то у некоторых живот пучит, ведь он не усваивается. Вторая причина немного смешная, первая - да, есть такое; вот сегодня в магазине я видел мешок 400 грамм аллюлозы за 40 шекелей, это примерно $28/kg. Все равно для тех, кто на низкоуглеводной или кетодиете (и наверное для диабетиков? не знаю, надо проверять) это выглядит как чудо-добавка)

P.S. научное название псикоза (D-Psicose).

5.2K views10:52

Авва

У моей машины "умный" ключ, нет замка зажигания, просто кнопка, и машина заводится, если транспондер в ключе отвечает. Кроме того, еще из него высовывается собственно ключ для замка двери, и пульт для того, чтобы открыть/закрыть двери без замка. Три функции в одном устройстве, за которое фирма-производитель дерет сотни долларов, если потерял ключ (и нет китайских подделок - для этой конкретной модели), хотя я уверен, что электроники там доллара на два и железа с пластиком центов на пятнадцать. Или наоборот. Ненавижу.

В общем, один из двух ключей мы про... потеряли уже лет пять назад. А вчера я неожиданно на пустом месте потерял второй. Машина стоит запаркованная на улице около работы. Что делать, непонятно, обычного замочника вызывать бесполезно, он если и подберет ключ для двери, завести все равно не сможет. Звоню в фирменный автосервис, они такие: ну сейчас уже четыре часа дня, поздновато, давай завтра с утра вызывай эвакуатора, пусть машину к нам тянет, мы закажем болванку для ключа у фирмы-производителя, за день-два он наверное придет, нет, мы не можем сейчас сказать, сколько это будет стоить...

Поделился бедой с мужиком, который все знает (он менеджер офисного пространства, где мы снимаем офис). Ну и вышло, как обычно в таких случаях выходит в Израиле. Его зовут Моти. Я говорю, мол, так и так, сомневаюсь, тянуть мне нашину завтра в гараж, или пытаться звонить во всякие сервисы, которые мне гуглереклама подсовывает, такие типа ща-приедем-все-сделаем с нулем отзывов, они небось еще более конскую цену заломят. Моти говорит, подожди, я знаю чувака, который мне пару лет назад с таким помог, его зовут Дуду, позвони, скажи, что ты от меня. Я звоню Дуду, говорю, я от Моти. Дуду говорит, да-да, у меня есть парень, который делает эти вещи, его зовут Ярин, скажи, что ты от меня. Звоню Ярину, говорю, я от Дуду. Ярин говорит, да-да, я вообще-то не выезжаю по вызовам, у меня стационарная мастерская, но есть отличный чувак Сергей, который вызывает, скажи, что ты от меня. Звоню Сергею, говорю, я от Ярина. Не проблема, говорит Сергей, через два часа буду. Цена, конечно, конская, но во-первых, не настолько, как я ожидал, такая скромная лошадка, почти пони, а во-вторых, он объясняет (да я и так понимаю), что это из-за болванки для ключа, за которую фирма-производитель дерет свои сотни долларов.

Итак, восемь вечера, пустынная улица в промышленном районе, жуткий холод, типа плюс пять (не смейтесь слишком сильно; да, сейчас февраль, но в Израиле это очень холодно и очень странно). Приезжает мужичок по имени Сергей и начинает ловко взламывать мою машину, для начала. Мне было интересно, как это делается! Вот как: отверткой чуть отогнуть резиновую прокладку между дверью и крышей и не без усилий вставить туда плоский резиновый мешочек. К мешочку прикреплена груша, грушей надуваем мешочек и делаем зазор больше. Теперь в него проходит длинная толстая стальная проволока, специальным образом изогнутая, которой мы дотягиваемся до защелки замка на внутренней стороне двери, рядом с ручкой, и примерно с десятой попытки аккуратно ее переключаем, и дверь спокойно открывается.

(вокруг пустынно, но иногда проходят люди, и что они видят - стоят два мужика и взламывают машину. Почему не вызвать полицию, неясно. Ну если честно, то рядом стоит машина Сергея с открытым багажником с инструментами итд., то есть наверное они думают, что это "официально". Но мне всегда было интересно, почему воры и грабители машин не могут просто банально косплеить замочников. Может, они так и делают)

Сергей открывает капот и делает там что-то таинственное, чтобы включить систему настройки транспондера. Потом он достает драгоценную болванку для этой модели и перенастраивает машину и болванку на новый код. Дальше я думал, что он выточит ключ под замок двери, но он делает нечто более крутое, снимает замок с двери, разбирает его, и подгоняет замок под форму ключа на болванке. Оказывается, из замка вынимаются и вставляются в него многочисленные мелкие рамочки, которые и определяют его форму, и он аккуратно подбирает, как надо их правильно вставлять. Очень прикольно за этим

5.1K views11:57

Авва

наблюдать. Через 20 минут после начала работы я получил новый ключ и готовую к труду и обороне машину.

Пока Сергей работал, я наблюдал и расспрашивал. У него обычная легковушка, багажник которой полностью переоборудован под рабочую станцию. Три четверти багажника занимает шкафчик с ящичками, в которых аккуратно разложены инструменты, провода, и болванки для всех видов ключей всех моделей на свете, или по крайней мере тех, что имеют хождение в Израиле. Одну четверть - машинка для вырезания ключей, подключенная к 220 вольтам электричества, которые поступают от аккумулятора машины через инвертор. "Я раньше ездил на минивэне, но их часто воруют, это как сигнал для вора, что-то ценное внутри, а так по машине и не скажешь".

Когда он разбирал и собирал замок, я спросил, где он этому научился. "Самоучка. Есть школы, которые этому всему как бы учат, но это все очень плохо поставлено, они учат тебя нескольким самым простым и частым моделям. Я консультирую несколько таких школ, но вообще это гиблое дело. Люди из них выходят, почти ничего не умеют, работу найти трудно, много таких же вокруг, а если находят, часто портят машину. Кроме того, это еще надо уметь организовать. У меня есть болванки всех моделей, их нужно уметь доставать, знать, где есть китайские альтернативы, а где только через фирму. Есть модели, например такая-то Фольксвагена, где ключ стоит 2800 шекелей, и большая часть денег это не болванка даже, а файл с данными для кодирования, который хакеры продают на черном рынке, они их украли у фирмы. Ты можешь получить ключ честным образом, но он будет полтора месяца идти из-за границы."

"Вот этот твой ключ у меня сейчас один есть, но если ты хочешь еще один сделать, позвони мне через неделю, мне товарищ задолжал один такой, приедешь ко мне, сделаю намного дешевле. А еще лучше найди тот, что потерял, он теперь работать не будет, но я тебе бесплатно его перекодирую на новый код".

Сколько времени он этим занимается? "Ну лет восемь. До этого я двадцать лет был поваром". Поваром?? "Да-да, последние пятнадцать шеф-поваром. Надоело. А машины я с детства любил. В общем, у меня сначала друг увлекся этим делом, обучился, а потом меня уговорил попробовать. Полгода я практически за бесплатно работал вместе с ним, а потом начал сам".

Как он находит клиентов? "Только через связи. У меня вообще никогда не было никакой рекламы. Ни сайта, ни фейсбука, ничего. Куча автосервисов здесь в Ришоне, в Бат-Яме меня знают, когда к ним приезжает клиент с проблемой с ключами, они меня вызывают или направляют ко мне. И от клиента к клиенту."

5.0K views11:57

Авва

Если вы покупаете цифровые книги на Амазоне и у вас есть физический Киндл, на котором вы их читаете, у вас остался 1 день, чтобы легко и удобно скачать их и убрать DRM (защиту), чтобы можно было их читать где угодно, распечатывать, конвертировать итд.

Постараюсь вкратце объяснить.

Книги, купленные в Амазоне, попадают на ваш киндл двумя способами. Самый простой и тот, которым пользуются 99% людей - Киндл сам скачивает их (подключаясь к WiFi), когда вы их купили и нажимаете, чтобы прочесть. Но есть и второй способ - пойти на сайт Амазона, зайти в список всех своих книг (Your Account -> Content and Devices -> Books), на нужную книгу выбрать More Actions -> Download & transfer via USB, и указать, для какого девайса вы скачиваете (если у вас больше одного киндла, как у меня). Тогда вы получаете файл, который можете сами скопировать на Киндл, подключив его к компьютеру как флеш-диск, вручную или через программу типа Calibre.

Книги для Киндла зашифрованы ключом, который свой для каждого пользователя и девайса. Зашифрованную книгу можно открыть только на девайсе, для которого она была создана. Поэтому на первый взгляд неважно, как вы получаете файл с книгой - сам киндл скачивает, или вы с сайта, а потом переносите на него - это будет файл, зашифрованный для данного киндла, и прочитать можно только на нем, если не убрать защиту. Но есть нюансы.

Амазон поддерживает два разных формата для защищенный файлов, старый KF8 и новый KFX. Старый формат заключен в файлах с разширением .azw3. Книги нового формата KFX разбросаны по нескольким файлам, один из которых .azw, но его одного недостаточно. Долгое время KFX не могли взломать. Недавно это изменилось, но все равно с .azw3 (KF8) это намного проще делать. Но физические девайсы-Киндлы, кроме очень старых (шестилетней давности и больше) всегда скачивают новый формат KFX. Зато через сайт Амазона - второй способ получить файл - скачивается файл KF8, даже если он зашифрован "для" нового Киндла.

Поэтому самый простой и надежный способ убрать защиту такой: 1. Настроить плагин для снесения защиты в программе Calibre (самая известная и очень хорошая программа для менеджмента своей цифровой библиотеки, работы с девайсами итд.). 2. Скачать файл на компьютер через сайт Амазона. 3. Добавить скачанный файл в Calibre, при этом защита снимается автоматически (и это можно проверить, просто открыв книгу внутри Calibre - невозможно, если она зашифрована). Теперь у вас в Calibre есть освобожденная книга и она ваша навсегда, можете копировать ее в Киндл или другие девайсы, конвертировать итд. Подробно процесс объяснен например в этом видео: https://www.youtube.com/watch?v=oxgubolrcPo. Главные два шага в нем - это скачать и установить плагин с https://github.com/noDRM/DeDRM_tools/releases/tag/v10.0.9, и внести в его конфигурацию серийный номер своего киндла.

Но ЗАВТРА Амазон убивает возможность скачать файл с книгой с сайта. Они объявили об этом всего две недели назад. Поэтому этот способ убрать защиту и освободить свои книги будет недоступен. И я очень советую всем, у кого есть купленные на Амазоне книги, освободить их прямо сегодня.

После этого изменения, останутся пока что два способа убрать защиту.
Первый основан на том, что формат KFX все-таки взломали примерно год назад. Нужно установить в Калибри дополнительный плагин KFX Input Type, и с его помощью добавлять скачанные самим киндлом книги в формате KFX, добавлять их в Calibre, и снимать защиту через обычный плагин DeDRM. Это то, что я планирую делать.

Второй основан на сложном шаманском танце с бубенцами вокруг костра, в процессе которого вы устанавливаете конкретную старую версию Kindle4PC на ваш Windows, причем во время установки важно временно отключить интернет, чтобы она не сделала авто-апдейт, потом отключить апдейты, вернуть интернет, и в теории тогда можно будет внутри нее скачивать файлы в новом формате KFX, и из Calibre добавлять их, даже без конфигурации серийного номера. Я этого не пробовал и буду пробовать, только если предыдущий способ не сработает.

6.2K viewsedited 09:59

Авва

Издательство Кэмбридсжкого университета выпустило три разных серии академических изданий Шекспира (с разными подходами к тексту, комментариям итд.).

- "The Cambridge Shakespeare" (1863-1866)
- "The New Shakespeare" (1921-1949)
- "The New Cambridge Shakesperare" (1984-)

Внимание, вопрос: как они назовут четвертую серию, когда до нее дойдет дело?

4.5K views19:07

Авва

Хорошо бы был такой сервис, что оплачиваешь подписку, и раз в несколько недель - но не точно, а со случайным разбросом - к тебе ночью в дом проникают профессионалы, садятся за твои компьютеры и открывают ноутбуки, и абсолютно везде закрывают абсолютно все вкладки в браузерах, причем так, что в истории их нет и вообще никакого способа восстановить их не существует.

5.1K views23:23

Авва

Поразительно красивая визуализация гипотезы Коллатца.

Каждая веточка - это путь одного числа к 1, причем путь изгибается в одну сторону каждый раз, когда число делится на 2, и в другую - когда *3+1. В итоге все ветки сливаются в цил 4-2-1 в левой части. Интенсивность цвета указывает на более частые пути.

(все технические подробности)

P.S. ... that even the weariest river
winds somewhere safe to sea

5.5K viewsedited 10:12

Авва

Я заметил, что когда я запускаю команду git commit -m "причина..." в командной строке в Windows (если вы не программист, то просто примите за данное, что мне надо это часто делать), то она нормально работает, если нет закрывающих кавычек. Разумеется, я это обнаружил случайно, потому что палец сорвался на кнопку Enter, мне бы не пришло в голову самому попробовать такую извращенную идею.

Теперь передо мной стоит ужасная дилемма.

4.6K viewsedited 10:52

Авва

Проблема паттерн-матчинга далеко не решена в топ-моделях. Вот яркий пример (все скриншоты сделаны мной сегодня, версии моделей добавлены в скриншот, где нужно).

ChatGPT, Claude, Deepseek - все попадаются в ловушку. Grok 3 дает разумный ответ, но это не значит, что у него нет проблемы - просто конкретная формулировка для него оказалась слишком далека от паттерна. Если сформулировать по-английки и ближе к паттерну, он тоже выдает ерунду.

5.4K views06:48

Авва

Давно не покупал книг на бумаге, но захотелось чего-то для души, чего-то доброго. Книги о вечном, не всей этой мути в соц. сетях. Книги, с которой можно вечером в кровати полежать при теплом ламповом свете.

5.3K views12:30

Авва

Джин Хэкмен для меня - шериф из фильма "Непрощенный" Клинта Иствуида и грабитель из фильма "Грабеж" Дэвида Мэмета.

Rest in Peace.

Мишель Трахтенберг для меня - Дженни из "Евротура" и Дон Саммерс из "Баффи - истребительницы вампиров".

Rest in Peace.

P.S. Одна фраза, которую Хэкмен произносит в "Непрощенном", в сцене своей смерти, вошла у меня во внутренний лексикон. "I was building a house". Я иногда говорю ее себе в определенные моменты, когда реальность показывает, насколько ей наплевать на мои намерения. Это не совсем точное и понятное объяснение, но если хотите лучше, посмотрите этот фильм.

5.7K views14:18

Авва

Мне надо было посмотреть что-то в докторской диссертации по лингвистике за 1979 год из МИТ, я ее скачал и впечатлился тем, как начинается раздел благодарностей в начале:

(в переводе)

"В романе "Волшебная гора" Ганс Касторп чуть не погибает от переохлаждения. Как считается типичным для такого способа смерти, он испытывает огромную радость и внутренний покой. Завершение диссертации подобно смерти от переохлаждения, и я могу лишь поблагодарить тех, кто ускорил эту приятную кончину."

3.2K views17:53

Авва

В супермаркете на прилавке лежали рядом: гауда, гауда, выдержанная 500 дней, и гауда, выдержанная 1000 дней. Отошел от прилавка в задумчивости, размышляя о том, как они делятся опытом друг с другом, как тысячник поучает младших собратьев итд.

P.S. Напоминает также разные монастырские ордена в Anathem Стивенсона.

P.P.S. Оказывается, верно не только то, что американцы говорят "гуда", но и то, что голландцы говорят "хауда". Хауда, Харл!

2.7K views19:01

2025/03/04 04:43:04
Back to Top

HTML Embed Code:

<iframe width="100%" src="https://www.group-telegram.com/buyppe/webview?embed=1" title="Channel Webview" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>