Telegram Group & Telegram Channel
#статистика_для_котиков

Я всегда считала, что мои шутки про статистику выше среднего, но, похоже, это была стандартная ошибка

Привет, коллега!

Когда-то я писала о мерах разброса и говорила, что такая вещь как стандартная ошибка среднего (SEM) не может использоваться как мера разброса. Штош, думаю теперь ты готов узнать почему.

Представь себе распределение зарплат всех-всех учёных в России. Как ты скорее всего догадываешься, оно будет ассиметричным. Теперь представь, что ты решил ездить на разные конференции и опрашивать по 50 учёных на каждой, узнавая какая у них зарплата Каждая конференция - это отдельная выборка с одинаковым количеством значений в ней. И для каждой выборки ты можешь посчитать выборочное среднее.

А теперь смотри какая крутая штука. Если ты возьмёшь все эти выборочные средние и сформируешь из них свою выборку с блекджеком и переменными, то она будет иметь нормальное распределение 🌈 Независимо от того, какое распределение имела генеральная совокупность.

Это следует из центральной предельной теоремы, которая гласит, что сумма большого количества слабо зависимых случайных величин имеет распределение, близкое к нормальному. Очень важно, что для работы этой теоремы мы должны опрашивать прям много учёных на каждой конференции, то есть n в выборках должно быть достаточно большим, иначе нормального распределения не будет. Условная граница стоит на 30 значениях: если их меньше - сорян, центральная предельная теорема не работает 😪

Наше новое распределение будем называть распределением выборочных средних. Так вот, как и у любого нормального распределения у него есть среднее и стандартное отклонение. В идеальной ситуации, где мы опросили по 50 учёных на бесконечном количестве конференций и не обанкротили наш институт, среднее распределения выборочных средних будет равно математическому ожиданию генеральной совокупности. В нашем случае - средней зарплате всех-всех учёных. А стандартное отклонение будет рассчитываться как стандартное отклонение генеральной совокупности, делённое на корень из количества значений в выборках, (в нашем случае из 50). И вот это стандартное отклонение распределения выборочных средних и называется стандартной ошибкой среднего (standard error mean, SEM)

Получается, если ты делаешь биологические повторности, то это тоже самое, что опросить учёных только на одной конференции и SEM как мера разброса для них будет попросту некорректна. И только для выборки из средних по многим независимым экспериментам, в каждом из которых будет более 30 биологических повторностей, можно использовать SEM. Но, если честно, я пока не встречала таких работ 🤷‍♂️

И что же получается, SEM это какая-то гипотетическая характеристика сферических коней в вакууме и она никому не нужна? Конечно же нет, без неё не получится рассчитать доверительные интервалы, о которых я расскажу уже в следующем посте про статистику.
Please open Telegram to view this post
VIEW IN TELEGRAM



group-telegram.com/ad_research/297
Create:
Last Update:

#статистика_для_котиков

Я всегда считала, что мои шутки про статистику выше среднего, но, похоже, это была стандартная ошибка

Привет, коллега!

Когда-то я писала о мерах разброса и говорила, что такая вещь как стандартная ошибка среднего (SEM) не может использоваться как мера разброса. Штош, думаю теперь ты готов узнать почему.

Представь себе распределение зарплат всех-всех учёных в России. Как ты скорее всего догадываешься, оно будет ассиметричным. Теперь представь, что ты решил ездить на разные конференции и опрашивать по 50 учёных на каждой, узнавая какая у них зарплата Каждая конференция - это отдельная выборка с одинаковым количеством значений в ней. И для каждой выборки ты можешь посчитать выборочное среднее.

А теперь смотри какая крутая штука. Если ты возьмёшь все эти выборочные средние и сформируешь из них свою выборку с блекджеком и переменными, то она будет иметь нормальное распределение 🌈 Независимо от того, какое распределение имела генеральная совокупность.

Это следует из центральной предельной теоремы, которая гласит, что сумма большого количества слабо зависимых случайных величин имеет распределение, близкое к нормальному. Очень важно, что для работы этой теоремы мы должны опрашивать прям много учёных на каждой конференции, то есть n в выборках должно быть достаточно большим, иначе нормального распределения не будет. Условная граница стоит на 30 значениях: если их меньше - сорян, центральная предельная теорема не работает 😪

Наше новое распределение будем называть распределением выборочных средних. Так вот, как и у любого нормального распределения у него есть среднее и стандартное отклонение. В идеальной ситуации, где мы опросили по 50 учёных на бесконечном количестве конференций и не обанкротили наш институт, среднее распределения выборочных средних будет равно математическому ожиданию генеральной совокупности. В нашем случае - средней зарплате всех-всех учёных. А стандартное отклонение будет рассчитываться как стандартное отклонение генеральной совокупности, делённое на корень из количества значений в выборках, (в нашем случае из 50). И вот это стандартное отклонение распределения выборочных средних и называется стандартной ошибкой среднего (standard error mean, SEM)

Получается, если ты делаешь биологические повторности, то это тоже самое, что опросить учёных только на одной конференции и SEM как мера разброса для них будет попросту некорректна. И только для выборки из средних по многим независимым экспериментам, в каждом из которых будет более 30 биологических повторностей, можно использовать SEM. Но, если честно, я пока не встречала таких работ 🤷‍♂️

И что же получается, SEM это какая-то гипотетическая характеристика сферических коней в вакууме и она никому не нужна? Конечно же нет, без неё не получится рассчитать доверительные интервалы, о которых я расскажу уже в следующем посте про статистику.

BY АДовый рисёрч




Share with your friend now:
group-telegram.com/ad_research/297

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

As such, the SC would like to remind investors to always exercise caution when evaluating investment opportunities, especially those promising unrealistically high returns with little or no risk. Investors should also never deposit money into someone’s personal bank account if instructed. Telegram was founded in 2013 by two Russian brothers, Nikolai and Pavel Durov. Given the pro-privacy stance of the platform, it’s taken as a given that it’ll be used for a number of reasons, not all of them good. And Telegram has been attached to a fair few scandals related to terrorism, sexual exploitation and crime. Back in 2015, Vox described Telegram as “ISIS’ app of choice,” saying that the platform’s real use is the ability to use channels to distribute material to large groups at once. Telegram has acted to remove public channels affiliated with terrorism, but Pavel Durov reiterated that he had no business snooping on private conversations. Under the Sebi Act, the regulator has the power to carry out search and seizure of books, registers, documents including electronics and digital devices from any person associated with the securities market. For example, WhatsApp restricted the number of times a user could forward something, and developed automated systems that detect and flag objectionable content.
from pl


Telegram АДовый рисёрч
FROM American