Telegram Group Search
Дорогие коллеги!
В эти праздничные дни мы и группа НТР напоминаем вам не забывать о вечном и насущном — матане. Слушаем трек и раскладываем его в ряд Фурье в уме 😊
#ёжик_развлекается
«Толщина» пространства. Версия.
N-мерные шары. Парадокс.
Рассмотрим прямую (линию), принадлежащую обычному трехмерному евклидову геометрическому пространству. Считается, что прямая одномерна — имеет только одно измерение — длину. Но это возможно только в идеальном математическом мире, который умозрительный. Но в процессе обучения или работы, при передаче графической информации, для различения прямых, их надо просто начертить. В этом случае, прямая будет иметь не только протяженность-длину, но и ширину. И эта ширина — ненулевая. Уже после этого, передаваемая информация становится умозрительной, начинает принадлежать идеальному миру субъекта.
Эта ширина прямой минимальна, она как бы «стремится» к нулю, но не является нулевой. За счет ненулевой ширины можно разместить какое-то количество прямых в непосредственной близости одна от другой и какой-то набор таких прямых даст нам плоскость. Плоскость имеет две координаты, например, X и Y и является двумерной. Но и плоскость в третьем взаимно перпендикулярном направлении Z имеет ненулевую «толщину», аналогичную ширине прямой. Плоскость с нулевой толщиной была бы «невидима», то есть не существовала бы в физическом мире. С помощью подобной аналогии надо сделать вывод, что объект трехмерного геометрического пространства (допустим, что это куб) в четвертом направлении W, взаимно перпендикулярном к X, Y, Z, также имеет ненулевую толщину (обозначим её Δ).
Получается, в общем случае, что каждое геометрическое пространство с размерностью N имеет протяженность в пространстве с размерностью (N+1), которую можно условно назвать «толщиной» пространства и обозначить как Δ. При этом Δ ≈ 0, но Δ ≠ 0. Это справедливо для случая представления N-мерных геометрических пространств, которые представлены «слиянием» пространств с мерностью (N-1)
Описывая толщину пространства, мы установили, что куб имеет четвертое направление на оси W и «расстояние» на этой оси равно Δ. Но почему мы этого не наблюдаем? Здесь можно сказать, что в нашем трехмерном мире все геометрические объекты трехмерны — точка это маленький шарик, у которого есть ненулевой радиус, прямая — это «проволока», плоскость — «лист бумаги», а трехмерный куб — это, например, кубик из детского конструктора. То есть наше восприятие не только «не видит» продолжение трехмерного куба в четвертом направлении W, но также «не видит» измерения, меньше трех.
Наблюдатель-человек находится внутри воспринимаемого трехмерного пространства и не обнаруживает Δ на W, поскольку не может выйти за границы трехмерного объема, хотя каждая точка объема XYZ имеет и координату W, перпендикулярную XYZ, так же, как и каждая точка плоскости XY имеет направление Z, перпендикулярное XY. Также можно спросить — почему мы не можем нарисовать куб так, чтобы обнаружить 4ое измерение? На это надо сказать, что рисунок трехмерных объектов делается с помощью изометрии на плоскости (холсте — двумерном геометрическом пространстве) и является некоторой иллюзией. И если изображение трехмерного объекта искажено на плоскости, то четырехмерный объект на плоскости с какой-либо долей истинности изобразить крайне трудно. То есть, надо «отображать» 4-х мерный объект в 3-х мерный объем с помощью некоторой 3-х мерной изометрии. Но здесь тоже присутствует недочет, поскольку человек-наблюдатель «видит» только «переднюю» часть наблюдаемого объекта. И если изометрия на холсте — это следствие воспринимаемого 3-х мерного пространства (изометрическое изображение идет ПОСЛЕ созерцания), то 4-х мерный объект, невоспринимаемый визуально, еще сложнее истинно отобразить с помощью некоторой изометрии в 3-х мерном геометрическом пространстве.
Из вышесказанного можно сделать вывод, что первоначальное нольмерное пространство — точка — имеет протяженность во всех направлениях N-мерного геометрического пространства, которая равна Δ.
Будем считать, что N — бесконечно в физическом мире, что требует доказательства или опровержения. По этому случаю есть некоторые соображения. Существуют формулы для расчета объема в N-мерном евклидовом пространстве:
Объем куба:
V(N) = (2R)^N,R — радиус вписанного гипершара в гиперкуб,
N — размерность гиперкуба.
Объем гипершара четной и нечетной размерности:
V(2k) = ( (π^k) / k! ) * (R^2k),
V(2k+1) = ( ( 2 * (k!) * ((4π) ^ k) ) / ( 2k+1)! ) * ( R^(2k+1) ), k ≠ 1.
____________________________
N = 5
Объем куба: V(5) = (2R)^5 = 32 * R^5
k = 2
Объем шара: V(4) = ( (π^2) / 2! ) * R^4 ≈ 4,9348 * R^4,
V(5) = ( (2 * 2! * 16 * π^2) / 5!) * R^5 ≈ 5,263789 * R^5
Объем куба больше объема шара при N = 5
в V(куб)/V(шар) ≈ 6,0792 раз
____________________________
N = 10
Объем куба: V(10) = 1024 * R^10
k = 5
Объем шара: V(10) ≈ 2,5501 * R^10
Объем куба больше объема шара при N = 10
в V(куб)/V(шар) ≈ 401,5427 раз
____________________________
N = 26
Объем куба: V(26) = 67 108 864 * R^26
k = 13
Объем шара: V(26) ≈ 0,000466302 * R^26
Объем куба больше объема шара при N = 26
в V(куб)/V(шар) ≈ 143 916 920 871 раз.
____________________________
N = 48
Объем куба: V(48) = (2,814749767107 * 10^14) * R^48
k = 24
Объем шара: V(48) ≈ 0,00000000000137686 * R^48
Объем куба больше объема шара при N = 48
в V(куб)/V(шар) ≈ 2,044318305051 * 10^26 раз.
Исходя из представленных вычислений видно, что объем гипершара стремится к нулю при стремлении размерности пространства N к бесконечности.
Возможным объяснением может служить то, что, в том числе, у многомерного куба большое количество вершин-углов (2^N). А вершина куба — это «место, где шара нет». Например, у гиперкуба размерности N = 48 (2,814749767107 * 10^14) вершин-углов. При этом длина стороны равна по-прежнему 2R.
#ёжик_пишет
#ёжик_дискутирует
Уважаемые коллеги!
📚 Представляем вашему вниманию подборку книг на тему теории обобщённых функций!
Обобщённая функция или распределение — математическое понятие, обобщающее классическое понятие функции. Потребность в таком обобщении возникает во многих физических и математических задачах.
Понятие обобщённой функции даёт возможность выразить в математически корректной форме такие идеализированные понятия, как плотность материальной точки, точечного заряда, точечного диполя, (пространственную) плотность простого или двойного слоя, интенсивность мгновенного источника и т. д.
С другой стороны, в понятии обобщённой функции находит отражение тот факт, что реально нельзя измерить значение физической величины в точке, а можно измерять лишь её средние значения в малых окрестностях данной точки. Таким образом, техника обобщённых функций служит удобным и адекватным аппаратом для описания распределений различных физических величин. Математика начала XX века не имела нужных строгих формализмов для оперирования с новым классом зависимостей величин, открытых в физике.
Теория обобщённых функций интенсивно развивалась многими математиками и физиками-теоретиками, главным образом в связи с потребностями теоретической и математической физики и теории дифференциальных уравнений.
Вашему вниманию предлагается
📖 Владимиров В.С. «Обобщенные функции в математической физике»
▫️Кроме общей теории обобщенных функций, включающей преобразования Фурье и Лапласа, а также другие интегральные преобразования, в книге содержится ряд приложений к дифференциальным уравнениям в частных производных и математической физике.
• Обобщенные функции и их свойства.
• Интегральные преобразования обобщенных функций
• Некоторые приложения в математической физике
📖 Агранович М.С. «Обобщенные функции»
▫️Вводный курс по теории обобщенных функций (распределений), написанный на основе лекций, прочитанных автором в Независимом московском университете. Доступен старшекурсникам механико-математических и физико-математических факультетов университетов.
▫️Рассчитан в первую очередь на тех из них, кто специализируется по уравнениям в частных производных или уравнениям математической физики, но может быть полезен также начинающим математикам других направлений, включая прикладников, а также физикам и инженерам.
В курс включены краткий очерк общей теории уравнений в частных производных с постоянными коэффициентами в Rn и теорема Шварца о ядре.
📖 Дрожжинов Ю.Н., Завьялов Б.И. «Введение в теорию обобщенных функций»
▫️Настоящая брошюра содержит полугодовой курс Ю. Н. Дрожжинова и Б. И. Завьялова «Введение в теорию обобщенных функций», прочитанный в весеннем семестре 2006 года.
• Предварительные сведения и основные определения
• Топологические и метрические пространства
• Топологические векторные пространства (ТВП)
• Локально выпуклые топологические пространства (ЛВП)
• Теорема Хана–Банаха
• Бочечные и борнологические пространства
• Индуктивные пределы
• Пространства основных функций.
• Примеры
• Пространство обобщенных функции D'
• Обобщенные функции медленного роста. • Пространство S' (Rn)
• Преобразование Фурье обобщенных функций
• Преобразование Лапласа обобщенных функций
• Асимптотически однородные обобщенные функции
📖 Антосик П., Микусинский Я., Сикорский Р. «Теория обобщенных функций: секвенциальный подход»
▫️Теория обобщенных функций в настоящее время завоевала прочное место в арсенале современных математических методов, применяемых не только специалистами-математиками, но также физиками и инженерами. В книге известных польских математиков эта теория излагается исчерпывающим образом - от элементарных ее основ до более глубоких результатов, часть которых публикуется впервые.
▫️Простота и ясность изложения делают книгу доступной широкому кругу читателей, знакомых с математикой в объеме втузовского курса. Она представляет интерес и для специалистов-математиков.
📖 Гальперин И. «Введение в теорию обобщенных функций»
• Функции точки как функционалы.
• Операции над обобщенными функциями.
• Произведение обобщенных функций.
• Сходимость обобщенных функций.
• Непрерывность.
• Дифференциальные уравнения с обобщенными функциями.
• Свертка.
• Ряды Фурье для обобщенных функций.
📖 Демидов А.С. «Обобщенные функции в математической физике»
▫️В учебном пособии дается взаимосвязанное изложение ряда основных идей, понятий, результатов теории обобщенных функций и уравнений математической физики. Зародившись в недрах математического анализа и уравнений математической физики, теория обобщенных функций преобразила весь современный анализ и, прежде всего, уравнения математической физики.
▫️Поэтому элементы теории обобщенных функций стали необходимы студентам всех физико-математических специальностей. Что же касается студентов, специализирующихся по уравнениям математической физики, то им без знания основ теории обобщенных функций невозможно даже начать сколько-нибудь серьезную работу.
▫️Книга адресована студентам (включая студентов младших курсов) физико-математических специальностей. Она может быть полезна аспирантам и преподавателям.
📖 Микусинский Я., Сикорский Р. «Элементарная теория обобщенных функции» Выпуск 1
▫️Уже сравнительно давно физики и инженеры применяют различные «незаконные» математические приемы, пользуясь расходящимися рядами и интегралами, дельта-функциями типа функции Дирака и т. п.
▫️Математиками (главным образом советскими и французскими) разработана так называемая теория обобщенных функций, в рамках которой указанные выше приемы становятся вполне законными. В брошюрз польских математиков Я. Микусинского и Р. Сикорского дается элементарное введение в теорию обобщенных функций. На базе очень простого определения обобщенных функций авторы развивают основные понятия анализа этих функций: алгебраические действия, дифференцирование, интегрирование, сходимость последовательностей и рядов и т. п.
Для чтения брошюры достаточно знания математического анализа в объеме основного курса технических вузов.
▫️ Брошюра представляет интерес для широкого круга лиц, сталкивающихся с различными приложениями математики и желающих ознакомиться с новыми мощными средствами математического анализа.
📖 Микусинский Я., Сикорский Р. «Элементарная теория обобщённых функций» Выпуск II
▫️Возникновение теории обобщенных функций быстро привело к пересмотру аппарата классического анализа. Новая алгоритмика интересует теперь все более широкий круг специалистов, использующих математику в своей работе. Одна из задач брошюры Минусинского и Сикорского — удовлетворить эту потребность.
Второй выпуск „Теории обобщенных функций" совершенно не зависит от первого, с которым читатели познакомились по русскому переводу, выпущенному в 1959 г.
▫️Предмет второго выпуска — обобщенные функции многих переменных, метод — тот же, что и в первом выпуске: обобщенные функции определяются как „идеальные элементы", присоединяемые к множеству обычных функций подобно тому, как в проективной геометрии бесконечно удаленные точки присоединяются к множеству обычных точек.
▫️Этот метод был улучшен авторами, что сделало построения более свободными и общими.
В отличие от обобщенных функций только конечного порядка, рассматривавшихся в первом выпуске, во втором выпуске рассматриваются произвольные обобщенные функции.
#теория_обобщённых_функций
#обобщенные_функции
Для улучшения точности MCST и экономии времени расчетов применяют несколько подходов. Например, распараллеливают процесс построения дерева. Либо выбирают новый ход не случайно, а на основе некоторой оценочной функции. Такую оценочную функцию может выдавать нейросеть, натренированная на реальных сыгранных партиях. То есть нейросети скармливают позиции из сыгранных игр и подстраивают ее веса так, чтобы она правильно предсказывала исход игры, возникшей из данной позиции. Именно такой подход использует Альфа-зеро — она оценивает позицию на доске и выдает распределение вероятностей выигрышей для каждого возможного хода. Только она не использует данные о ранее сыгранных партиях. Для обучения она играла сама с собой и самостоятельно строила свою оценочную функцию.
-------
Более подробно о MCST и Альфа-зеро читайте в статьях:
Поиск по дереву методом Монте-Карло и крестики-нолики.
habr.com/ru/article...
Метод Монте-Карло для поиска в дереве.
habr.com/ru/article...
Monte Carlo Tree Search – beginners guide.
int8.io/monte-carl...
A step-by-step look at Alpha Zero and Monte Carlo Tree Search
joshvarty.github.io/AlphaZero/
AlphaGo Zero explained in one diagram.
medium.com/applied-da...
-------
Напоследок следует упомянуть проект Лила чесс-зеро (Leela Chess Zero).
en.wikipedia.org/wiki/Leela...
Его инициатор — бельгийсикй программист Жан-Карло Паскутто. Он возмутился, что Дипмайнд не выложила код Альфа-зеро в открытый доступ, и решил самостоятельно воспроизвести методику, описанную в статье.
К сожалению, у него не было мощных суперкомпьютеров, способных быстро выполнять MCTS, а на своих ресурсах он бы обучал нейросеть играть в шахматы несколько тысяч лет. "Это слишком долго", — сказал Жан-Карло, и решил распараллелить задачу среди неравнодушных пользователей интернета. В результате появился открытый шахматный ИИ движок LCZero.
lczero.org
Вы и сейчас можете подключиться к обучению Лилы, зайдя на сайт проекта и загрузив на комп специальный клиент:
github.com/LeelaChess...
-------
Таким образом получается, что чистый ИИ, не имеющий знаний о многочисленных шахматных комбинациях и окончаниях, вполне себе может обучиться играть в шахматы просто многократно играя в них. Опыт — это самая ценная вещь, которая у нас есть.
Вопрос закрыт, имхо)
#ёжик_пишет #алгоритмы
Как алгоритм "Monte Carlo Tree Search" помог чистому шахматному ИИ стать чемпионом.
-------
После предыдущего поста про сверхсложные задачи для ИИ у меня возникла дискуссия с читателем Ежика по поводу шахматного ИИ. Мы пытались выяснить, использует ли Альфа-зеро — наилучший, на данный момент, шахматный ИИ — таблицы шахматных комбинаций для оценки позиции и выбора хода? В частности мы говорили о таблицах шахматных окончаний Налимова — использовала ли их нейросеть на этапе обучения игре в шахматы или нет?
Если ответить кратко, то мы этого не знаем. Потому что Дипмайнд — разработчик Альфе-зеро — не выложила в открытый доступ код алгоритма, а всего лишь опубликовала его описание в статьях.
Silver D. et al. (2016)
Mastering the game of Go with deep neural networks and tree search.
doi.org/10.1038/na...
Silver D. (2018)
A general reinforcement learning algorithm that masters chess, shogi, and Go through self-play.
doi.org/10.1126/sc...
Как настоящие джентльмены, мы должны научным статьям доверять. Если так, то получается, что Альфа-зеро при рождении являла собой "tabula rasa" — чистую доску, на которой были записаны лишь правила шахматной игры и некоторые начальные оценочные функции. Всему остальному она научилась, сыграв сама с собой огромное количество партий.
А стать наилучшем ИИ по игре в шахматы, а также Го и другие игры, ей помог алгоритм Monte Carlo Tree Search (MCTS) — то бишь метод случайного поиска в дереве (если, конечно, я правильно перевел название алгоритма). Вот давайте его немного и рассмотрим.
--------
Как и все монтекарловские алгоритмы, MCTS до безобразия прост, эффективен, но требует невообразимого количества ресурсов для достижения хороших результатов.
Шахматный ИИ, как и человек, выбирает следующий ход, используя дерево ходов, возможных из текущей позиции. Так как возможных ходов обычно много, и на каждом следующем уровне количество ходов катастрофически увеличивается, то просчитать все варианты ходов не под силу никакому суперкомпьютеру. Поэтому шахматные алгоритмы используют различные приемы, оптимизирующие выбор наилучшего хода. MCTS как раз и является таким приемом.
-------
Представим каждую позицию узлом дерева. В его корень поместим текущую позицию. От нее проведем ветки к позициям возникающим после каждого хода, получив одноуровневое дерево с листьями.
А вот дальше мы не будем продолжать построение дерева от каждого узла, а выберем только один из листов случайным образом. А от него просчитаем партию до конца, каждый раз выбирая ходы случайным образом (вот он метод Монте-Карло!). В конце-концов мы получим какой-то исход, которому припишем целое число: -1 (проигрыш), 0 (ничья), 1 (выигрыш).
Запомним этот результат в листе (узле), с которого мы начали случайное построение дерева. И теперь опять случайным образом выберем один из листов, и от него просчитаем партию до конца, опять же случайным образом выбирая каждый ход.
После многократных повторений этой процедуры и пересчета значений в начальных узлах, мы припишем начальным ходам числовые значения — баллы, равные сумме реультирующих балов всех партий, построенных после этого хода случайным выбором ходов. Каждый балл, соотнесенный к общему количеству партий, покажет вероятность того, что данный конкретный ход приведет к выигрышу. Очевидно, чем больше случайных партий мы просчитаем, тем точнее эти веса будут отражать реальные вероятности выигрышей.
Дорогие коллеги,
Несколько дней тому назад я искал на своём компьютере некоторую информацию. Забегая вперёд, скажу, что то, что мне было нужно, я не нашёл. Зато, как это бывает обычно, нашёл много другого, весьма интересного!
В том числе мною была найдена брошюра Т.Г. Незбайло «Новая теория вычисления интеграла». В этой расширенной статье предлагается находить интеграл от функции через производную n-го порядка, записанную в специальном виде. И, как мне показалось, автор рассматривает алгоритмический метод вычисления неопределённых интегралов — задачу, которая, как мне известно, до сих пор считающуюся открытой.
Ну а сейчас несомненный успех поста о дробных производных, который был у нас в это воскресенье, подтолкнул меня опубликовать на Ёжике интересную статью Тиберия Георгиевича как можно быстрее.
Публикуем предисловие к этой работе, а если вас это заинтересует, почитайте саму брошюру, которая также прикрепляется к этому посту!
Бесконечно лало всегда больше чел ничего.
Основы теории дифференциального и интегрального исчисления заложены независимо в трудах Ньютона и Лейбница в период с 1666 по 1702 год И хотя с тех пор эта теория существенно обогатилась трудами многих выдающихся математиков: И. Бернулли, Л. Эйлера, Ж. Лагранжа, Коши, Лобачевского и других, она все же содержит нерешенную до настоящего фундаментальную проблему: данная теория не задает математический алгоритм операции интегрирования.
Действительно, алгоритм операции дифференцирования достаточно гладкой функции $f$ определяется формулой
\begin{equation*}
\frac{d}{d x} f(x)=\lim _{\delta \rightarrow 0} \frac{f(x+\delta)-f(x)}{\delta} \tag{1.0}
\end{equation*}
В то же время под неопределенным интегралом от этой же функции $f(x)$ понимается равенство:
\begin{equation*}
\int f(x) d x=F(x)+C, \tag{1.1}
\end{equation*}
где $C$ - произвольная постоянная, $F(x)$ - первообразная функции $f(x)$, т. е. любая функция, удовлетворяющая равенству:
\begin{equation*}
\frac{d}{d x} F(x)=f(x) \tag{1.2}
\end{equation*}
Посредством какого математического алгоритма, т. е. последовательности известных математических операций, можно перейти от функции $f(x)$ к первообразной $F(x)$, пока современной математике неизвестно. Таким образом, под вычислением неопределенного интеграла от функции $f(x)$, т. е. определением $\int f(x) dx$, понимается набор математических алгоритмов, когда посредством искусственных приемов: замены переменной интегрирования, использования формулы интегрирования по частям и т.д., производится преобразование выражения $f(x) d x$ к виду, который принадлежит к уже известному множеству интегралов (1.1). В том случае,
если это удается сделать, интеграл $\int f(x) dx$ считается вычисленным, если нет, то задача остается нерешенной.
Поскольку из формул (1.1) и (1.2) следует:
\begin{equation*}
\frac{d}{d x}\left(\int f(x) d x\right)=f(x), \tag{1.3}
\end{equation*}
то это означает, что операция интегрирования является обратной к операции дифференцирования.
Таким образом, между операциями дифференцирования и интегрирования существует некая связь, в определении которой и заключается задача настоящей работы. Устанавливается эта связь через исследование свойств $n$-й производной от функции $f$.
#ёжик_читает
#ёжик_дискутирует
Доказано, что игрок выигрывает, если выполнено неравенство W<A, где W — это случайная величина, составленная по следующему правилу: это двоичное разложение числа из [0,1], каждый бит определяется как дополнение результата соответствующей партии. Если в первой партии победа, то бит берем 0, если во второй поражение, то 1.
Так, если в первой партии поражение, то игрок проигрывает на первом ходу, если у него меньше 0.5. Правильно: у него A=0.0???, а W=0.1???>A.
Функция распределения F(x), то есть вероятность, что W<x, она же вероятность победы при данном капитале A=x, записывается как на рисунке. Здесь x с индексом — биты разложения числа х. Опечатки нет: последние символы именно "p умножить на х с индексом n".
Что такое первое слагаемое, при n=1? Это и есть px_n. Если оно не нуль, то первый бит (x_n) равен 1, то есть капитал 0.5 или больше. Если повезло (вероятность р), то всё, игра кончилась.
Второе слагаемое, при n=2. Если оно не нуль, то игра должна пережить первую партию (игрок выиграл, если у него меньше 0.5 или проиграл, если больше) и кончиться на второй.
Всё это довольно понятно, если вдуматься.
Эта функция монотонно возрастает, а значит, нет интервалов ненулевой длины, но с нулевой вероятностью.
В частности, если обозначить вероятность проигрыша в партии через q=1-p, то:
F(1/8)=p³, F(2/8)=p², p(3/8)=p²+p²q, F(4/8)=p,
F(5/8)=p+p²q, F(6/8)=p+pq, p(7/8)=p+pq+pq².
В случае p=q=0.5, всё довольно банально, F(x)=x. Однако при других значениях вероятности распределение сингулярно. Функция F(x) непрерывна, но имеет почти всюду производную, равную нулю. На рисунке график.
Доказательство не очень сложно, но выходит за рамки заметки. В другой раз.
Но вообще, такие функции, мягко говоря, нетипичны. Потому и радостно, когда они возникают в таких бытовых обстоятельствах.
Вторая величина, которая нас интересует, это G(x): среднее число игр до разорения или достижения цели, то есть до конца игры. Здесь x — опять начальный капитал игрока. Формулу опишу словами: это сумма по n от 0 до r(x)-1, где r(x) это длина двоичного разложения числа х, от произведения p с индексами x_i при i от 1 до n.
Здесь использовано соглашение, что если слагаемое пустое, то это 1. Таково первое, при n=0. Число r(x) есть ранг: длина двоичной дроби. Если дробь бесконечна, то и сумма тоже.
Первое слагаемое описывает первый ход. Если r=1 (то есть x=0.5), то он единственный. Если битов два, то слагаемых тоже два. Первое уловит первый ход, второе — второй. До него должно дойти дело, то есть первой партией дело не кончилось. Если битов два, то и ходов не более двух, так что сумма на этом кончается.
В самом деле, два бита — это либо 0.01, либо 0.11 в двоичном коде, или 0.25 или 0.75 в десятичном. Можно проиграть/выиграть первую партию — тогда все кончится на первом ходе. А можно сыграть первый ход, придя к 0.5 в обоих случаях, и вторым ходом всё решится.
Функция, при p≠0.5, непрерывна на бесконечных двоичных дробях и разрывна на конечных. Некоторые ее значения:
G(1/8)=1+p+p², G(2/8)=1+p, G(3/8)=1+p+pq, G(4/8)=1,
G(5/8)=1+q+pq, G(6/8)=1+q, G(7/8)=1+q+q².
А при x=0.1010101... в двоичном коде, или 2/3 в десятичном, получим
1+q(1+p)/(1-qp).
Если p=1, то q=0 и G=1. Правильно: если победа в кармане, то ставим 1/3 и выигрываем за один ход. Если наоборот, p=0, q=1, то G=2: поставим 1/3, проиграем, поставим остаток, проиграем. Два хода. А вот прочие случаи сложны...
Вот так вот. Функция, разрывная на всюду плотном множестве точек... Другая, непрерывная, но не абсолютно...И это в самой обычной задачке про орлянку с кривой монетой!
А вы изволите толковать про пятое измерение.
Заметка основана на статье Siegrist K. "How to gamble if you must", которая легко находится в Сети. Планирую осветить ее подробнее.
#теория_вероятностей
#парадоксы
#теория_функций
Меня очень радует, когда в обычных вроде как задачах воплощаются придуманные "монстры" высокой теории. Об одной такой жемчужине я расскажу сегодня.
Итак, вернемся к игре вроде орлянки, в которой игрок делает ставку и выигрывает с вероятностью p. Игра идет до тех пор, пока игрок не разорится, либо не достигнет заданной суммы A+В. Начинает он с некоторой суммы А.
Если он ставит по одной монете, то вероятность выигрыша и среднее число партий получается довольно просто с применением разностных уравнений.
Если р=0.5, то вероятность выиграть равна A/(A+B), среднее число партий равно АВ, где А и В выражены в ставках. Заметьте, что АВ может быть удивительно велико, хотя большинство игр намного короче. Например, при А=1 и В=1000 половина игр кончается на первом ходу, но АВ=1000. Реальное среднее намного меньше, так как надо отсечь очень длинные маловероятные игры, которые "никогда" не случаются, но свой вклад вносят. Если ограничить число партий (то есть, игра кончается либо разорением, либо разорением оппонента, либо исчерпанием лимита партий), то оценка сразу снижается. К примеру, у одного 1 ставка, у дргого тысяча ставокй, среднее число партий равно 1000, но если число партий ограничено 100, то среднее число партий равно 14.
Обсудим потом и эту задачу.
Если вероятность выиграть партию не равна 0.5, то формулы немного усложняются, но принципиально всё так же.
Такая тактика — ставить минимум — хороша, если p>0.5, то есть игра в пользу игрока. Более того, если разрешается ставить сколь угодно мало, то вероятность выигрыша может быть равна единице.
А вот если p<0.5, то есть игра не в пользу игрока, то оптимальна другая тактика. Надо ставить всё, что есть, либо ровно столько, сколько нужно для победы. Скажем, если цель сто монет и у вас на руках 20, то ставьте все 20. А если на руках 70, то ставьте 30.
Удобно считать капиталы дробными, цель равной 1, и работать на отрезке [0, 1].
Любопытно, что из этой оптимальной тактики можно получить другие оптимальные тактики! Причем простым масштабированием. Имея меньше 0.5, ставим целью 0.5; а имея больше, убираем 0.5 в карман, играя остальным и ставя целью 0.5. Эта тактика тоже оптимальна, но дает больше партий в среднем.
Поначалу кажется, что такая тактика означает одну партию, в которой либо победа, либо поражение — но нет. Так только в случае А=0.5. Во всех остальных можно выиграть за один ход (если А>0.5) или проиграть за один ход; а если игра не закончилась одним ходом, то будет новая игра. Например, если А=0.2 и игрок выиграл, то у него 0.4. Если опять повезло, то 0.8. Теперь он поставит 0.2 и может позволить себе проиграть. У него окажется 0.6 и можно играть дальше.
Давайте последим за числом партий. Если A=0.5, то игра в любом случае закончится за один ход: либо повезло и достиг 1, либо не повезло и разорился. Если А=0.25, то можно проиграть на первом ходу, но если выиграл, то получил 0.5 и следующий ход так и так последний. Аналогично в случае А=0.75. То есть партий не больше двух.
Удивительным образом, все зависит от двоичного разложения числа А. Если оно записано конечной двоичной дробью, то игра кончится за конечное число ходов. Например, пусть А=0.625, в двоичном коде 0.101. Считаем исход игры таким, чтобы можно было сыграть еще. Так, в первой партии игрок ставит 0.375 и проигрывает, сократив капитал до 0.25. Ставит всё и выигрывает, получив 0.5. Ставит всё, и теперь уж игра точно кончится, как уж повезет.
То есть, если за данный ход игра не кончилась, то новое А получается из предыдущего сдвигом на один двоичный разряд. Если А имеет вид 0.0ххх, то ставится все, и при победе А умножается на 2, что и есть сдвиг запятой. Если же А=0.1ххх, то ставится 1-А, и при проигрыше у игрока станет 2А-1, что означает сдвиг запятой и удаление целой части. То есть тоже сдвиг на один разряд.
Если разложение бесконечное, то игра может идти сколь угодно долго, хотя, конечно, вероятность длинной игры маленькая. Какая же?
2025/01/08 09:59:21
Back to Top
HTML Embed Code: