Telegram Group & Telegram Channel
#статистика_для_котиков

Я всегда считала, что мои шутки про статистику выше среднего, но, похоже, это была стандартная ошибка

Привет, коллега!

Когда-то я писала о мерах разброса и говорила, что такая вещь как стандартная ошибка среднего (SEM) не может использоваться как мера разброса. Штош, думаю теперь ты готов узнать почему.

Представь себе распределение зарплат всех-всех учёных в России. Как ты скорее всего догадываешься, оно будет ассиметричным. Теперь представь, что ты решил ездить на разные конференции и опрашивать по 50 учёных на каждой, узнавая какая у них зарплата Каждая конференция - это отдельная выборка с одинаковым количеством значений в ней. И для каждой выборки ты можешь посчитать выборочное среднее.

А теперь смотри какая крутая штука. Если ты возьмёшь все эти выборочные средние и сформируешь из них свою выборку с блекджеком и переменными, то она будет иметь нормальное распределение 🌈 Независимо от того, какое распределение имела генеральная совокупность.

Это следует из центральной предельной теоремы, которая гласит, что сумма большого количества слабо зависимых случайных величин имеет распределение, близкое к нормальному. Очень важно, что для работы этой теоремы мы должны опрашивать прям много учёных на каждой конференции, то есть n в выборках должно быть достаточно большим, иначе нормального распределения не будет. Условная граница стоит на 30 значениях: если их меньше - сорян, центральная предельная теорема не работает 😪

Наше новое распределение будем называть распределением выборочных средних. Так вот, как и у любого нормального распределения у него есть среднее и стандартное отклонение. В идеальной ситуации, где мы опросили по 50 учёных на бесконечном количестве конференций и не обанкротили наш институт, среднее распределения выборочных средних будет равно математическому ожиданию генеральной совокупности. В нашем случае - средней зарплате всех-всех учёных. А стандартное отклонение будет рассчитываться как стандартное отклонение генеральной совокупности, делённое на корень из количества значений в выборках, (в нашем случае из 50). И вот это стандартное отклонение распределения выборочных средних и называется стандартной ошибкой среднего (standard error mean, SEM)

Получается, если ты делаешь биологические повторности, то это тоже самое, что опросить учёных только на одной конференции и SEM как мера разброса для них будет попросту некорректна. И только для выборки из средних по многим независимым экспериментам, в каждом из которых будет более 30 биологических повторностей, можно использовать SEM. Но, если честно, я пока не встречала таких работ 🤷‍♂️

И что же получается, SEM это какая-то гипотетическая характеристика сферических коней в вакууме и она никому не нужна? Конечно же нет, без неё не получится рассчитать доверительные интервалы, о которых я расскажу уже в следующем посте про статистику.
Please open Telegram to view this post
VIEW IN TELEGRAM



group-telegram.com/ad_research/297
Create:
Last Update:

#статистика_для_котиков

Я всегда считала, что мои шутки про статистику выше среднего, но, похоже, это была стандартная ошибка

Привет, коллега!

Когда-то я писала о мерах разброса и говорила, что такая вещь как стандартная ошибка среднего (SEM) не может использоваться как мера разброса. Штош, думаю теперь ты готов узнать почему.

Представь себе распределение зарплат всех-всех учёных в России. Как ты скорее всего догадываешься, оно будет ассиметричным. Теперь представь, что ты решил ездить на разные конференции и опрашивать по 50 учёных на каждой, узнавая какая у них зарплата Каждая конференция - это отдельная выборка с одинаковым количеством значений в ней. И для каждой выборки ты можешь посчитать выборочное среднее.

А теперь смотри какая крутая штука. Если ты возьмёшь все эти выборочные средние и сформируешь из них свою выборку с блекджеком и переменными, то она будет иметь нормальное распределение 🌈 Независимо от того, какое распределение имела генеральная совокупность.

Это следует из центральной предельной теоремы, которая гласит, что сумма большого количества слабо зависимых случайных величин имеет распределение, близкое к нормальному. Очень важно, что для работы этой теоремы мы должны опрашивать прям много учёных на каждой конференции, то есть n в выборках должно быть достаточно большим, иначе нормального распределения не будет. Условная граница стоит на 30 значениях: если их меньше - сорян, центральная предельная теорема не работает 😪

Наше новое распределение будем называть распределением выборочных средних. Так вот, как и у любого нормального распределения у него есть среднее и стандартное отклонение. В идеальной ситуации, где мы опросили по 50 учёных на бесконечном количестве конференций и не обанкротили наш институт, среднее распределения выборочных средних будет равно математическому ожиданию генеральной совокупности. В нашем случае - средней зарплате всех-всех учёных. А стандартное отклонение будет рассчитываться как стандартное отклонение генеральной совокупности, делённое на корень из количества значений в выборках, (в нашем случае из 50). И вот это стандартное отклонение распределения выборочных средних и называется стандартной ошибкой среднего (standard error mean, SEM)

Получается, если ты делаешь биологические повторности, то это тоже самое, что опросить учёных только на одной конференции и SEM как мера разброса для них будет попросту некорректна. И только для выборки из средних по многим независимым экспериментам, в каждом из которых будет более 30 биологических повторностей, можно использовать SEM. Но, если честно, я пока не встречала таких работ 🤷‍♂️

И что же получается, SEM это какая-то гипотетическая характеристика сферических коней в вакууме и она никому не нужна? Конечно же нет, без неё не получится рассчитать доверительные интервалы, о которых я расскажу уже в следующем посте про статистику.

BY АДовый рисёрч




Share with your friend now:
group-telegram.com/ad_research/297

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

Telegram does offer end-to-end encrypted communications through Secret Chats, but this is not the default setting. Standard conversations use the MTProto method, enabling server-client encryption but with them stored on the server for ease-of-access. This makes using Telegram across multiple devices simple, but also means that the regular Telegram chats you’re having with folks are not as secure as you may believe. For Oleksandra Tsekhanovska, head of the Hybrid Warfare Analytical Group at the Kyiv-based Ukraine Crisis Media Center, the effects are both near- and far-reaching. Telegram, which does little policing of its content, has also became a hub for Russian propaganda and misinformation. Many pro-Kremlin channels have become popular, alongside accounts of journalists and other independent observers. The SC urges the public to refer to the SC’s I nvestor Alert List before investing. The list contains details of unauthorised websites, investment products, companies and individuals. Members of the public who suspect that they have been approached by unauthorised firms or individuals offering schemes that promise unrealistic returns Just days after Russia invaded Ukraine, Durov wrote that Telegram was "increasingly becoming a source of unverified information," and he worried about the app being used to "incite ethnic hatred."
from ru


Telegram АДовый рисёрч
FROM American