Telegram Group & Telegram Channel
#статистика_для_котиков

Ты ешь капусту, твой начальник мясо, а в среднем вы едите голубцы

Привет, коллега!

В прошлый раз мы формировали выборки, а значит настало время описательной статистики. И в ней принято различать меры центральной тенденции, то есть параметры, характеризующие центр распределения данных выборки.

▶️ Среднее арифметическое. Величина, знакомая всем ещё со школы. Не рекомендуется к использованию на дискретных данных, иначе можно случайно получить полтора землекопа. Среднее является очень коварной величиной, если распределение имеет ассиметричную форму, то есть больших или малых значений в нём больше. И также среднее очень чувствительно к выбросам. Допустим, у нас есть небольшая лаборатория, заведующий которой имеет зарплату 500к рублей, ведущий научный сотрудник получает 60к, младший - 40к, а два лаборанта - 10к. Средняя зарплата составит 124 тысячи, вполне можно жить и публиковать в отчётах. Но есть нюанс 🤔

▶️ Медиана. Представляет собой значение, при котором половина выборки больше него и половина выборки меньше. Гораздо меньше чувствительна к выбросам и лучше показывает центр несимметричного распределения. В нашем гипотетическом институте медиана будет равна 40 тысячам рублей. Уже не так радужно, поэтому медианные зарплаты в отчётах не любят 😰

▶️ Мода. Наиболее часто встречающееся значение в выборке. Единственная из всех мер, которая может применяться к качественным данным. Но в целом, биологами мода используется не очень часто ввиду малого размера выборок: на таких повторения значений редки, а если и случаются, то не всегда в центре распределения. В вышеупомянутом институте моду задают лаборанты и она будет равна 10 тысячам рублей.

Это три самые популярные меры центральной тенденции. Но что если я скажу тебе, что существуют и другие? Например,

▶️ Среднее геометрическое. Используется для расчёта среднего роста или изменения показателя во времени, когда важна пропорциональность. Возьмём нашего младшего научного сотрудника с зарплатой в 40к. Когда он три года назад устраивался на работу его зарплата была 35к. После первого года её проиндексировали на 7%, на второй год ещё на 4%, а в этом на 3%. Можно подумать, что среднегодовой прирост зарплаты составляет 4,7%, но на самом деле он равен 4.4%. Мелочь, а неприятно.

▶️ Среднее гармоническое. Используется, если есть отличия в характеристиках значений. Допустим, наши лаборанты работают 4 часа, а несчастный завлаб пашет 14 часов. Можно, конечно, посчитать среднее арифметическое от почасовой оплаты (472 руб/час), но среднее гармоническое будет корректнее (191 руб/час), поскольку оно учитывает, что большая часть часов оплачивается по меньшей ставке. Опять лаборанты испортили статистику по оплате труда в лаборатории 👊

▶️ Среднее взвешенное. Используют, если разные величины имеют разную важность. Бухгалтеры считают средневзвешенную зарплату вместо обычной средней арифметической, чтобы учитывать количество человек на более низкооплачиваемых должностях. В нашем случае средневзвешенная зарплата составит 122 тысячи рублей. Всё ещё не так плохо, как медиана и мода, потому что лаборанта с низкой зп всего два. Я, кстати, использую среднее взвешенное для расчёта оценки за доклады: оценке преподавателя присваивается больший вес по сравнению со студентами. Тогда даже если вся группа сговорилась и ставит 100 баллов друг другу - мнение преподавателя всё равно перевесит. Кстати, "веса" можно добавлять не только в расчёт среднего арифметического, как это сделала я в примерах выше, но и в формулы других средних.

▶️ Среднее квадратическое. В статистике чаще используется для расчёта отклонений и называется среднеквадратичным (стандартным) отклонением. Это характеризует разброс данных, что в целом является спойлером к следующему посту.

Так что ставь реакцию и подписывайся, если хочешь узнать, какие меры разброса существуют 😏
Please open Telegram to view this post
VIEW IN TELEGRAM



group-telegram.com/ad_research/114
Create:
Last Update:

#статистика_для_котиков

Ты ешь капусту, твой начальник мясо, а в среднем вы едите голубцы

Привет, коллега!

В прошлый раз мы формировали выборки, а значит настало время описательной статистики. И в ней принято различать меры центральной тенденции, то есть параметры, характеризующие центр распределения данных выборки.

▶️ Среднее арифметическое. Величина, знакомая всем ещё со школы. Не рекомендуется к использованию на дискретных данных, иначе можно случайно получить полтора землекопа. Среднее является очень коварной величиной, если распределение имеет ассиметричную форму, то есть больших или малых значений в нём больше. И также среднее очень чувствительно к выбросам. Допустим, у нас есть небольшая лаборатория, заведующий которой имеет зарплату 500к рублей, ведущий научный сотрудник получает 60к, младший - 40к, а два лаборанта - 10к. Средняя зарплата составит 124 тысячи, вполне можно жить и публиковать в отчётах. Но есть нюанс 🤔

▶️ Медиана. Представляет собой значение, при котором половина выборки больше него и половина выборки меньше. Гораздо меньше чувствительна к выбросам и лучше показывает центр несимметричного распределения. В нашем гипотетическом институте медиана будет равна 40 тысячам рублей. Уже не так радужно, поэтому медианные зарплаты в отчётах не любят 😰

▶️ Мода. Наиболее часто встречающееся значение в выборке. Единственная из всех мер, которая может применяться к качественным данным. Но в целом, биологами мода используется не очень часто ввиду малого размера выборок: на таких повторения значений редки, а если и случаются, то не всегда в центре распределения. В вышеупомянутом институте моду задают лаборанты и она будет равна 10 тысячам рублей.

Это три самые популярные меры центральной тенденции. Но что если я скажу тебе, что существуют и другие? Например,

▶️ Среднее геометрическое. Используется для расчёта среднего роста или изменения показателя во времени, когда важна пропорциональность. Возьмём нашего младшего научного сотрудника с зарплатой в 40к. Когда он три года назад устраивался на работу его зарплата была 35к. После первого года её проиндексировали на 7%, на второй год ещё на 4%, а в этом на 3%. Можно подумать, что среднегодовой прирост зарплаты составляет 4,7%, но на самом деле он равен 4.4%. Мелочь, а неприятно.

▶️ Среднее гармоническое. Используется, если есть отличия в характеристиках значений. Допустим, наши лаборанты работают 4 часа, а несчастный завлаб пашет 14 часов. Можно, конечно, посчитать среднее арифметическое от почасовой оплаты (472 руб/час), но среднее гармоническое будет корректнее (191 руб/час), поскольку оно учитывает, что большая часть часов оплачивается по меньшей ставке. Опять лаборанты испортили статистику по оплате труда в лаборатории 👊

▶️ Среднее взвешенное. Используют, если разные величины имеют разную важность. Бухгалтеры считают средневзвешенную зарплату вместо обычной средней арифметической, чтобы учитывать количество человек на более низкооплачиваемых должностях. В нашем случае средневзвешенная зарплата составит 122 тысячи рублей. Всё ещё не так плохо, как медиана и мода, потому что лаборанта с низкой зп всего два. Я, кстати, использую среднее взвешенное для расчёта оценки за доклады: оценке преподавателя присваивается больший вес по сравнению со студентами. Тогда даже если вся группа сговорилась и ставит 100 баллов друг другу - мнение преподавателя всё равно перевесит. Кстати, "веса" можно добавлять не только в расчёт среднего арифметического, как это сделала я в примерах выше, но и в формулы других средних.

▶️ Среднее квадратическое. В статистике чаще используется для расчёта отклонений и называется среднеквадратичным (стандартным) отклонением. Это характеризует разброс данных, что в целом является спойлером к следующему посту.

Так что ставь реакцию и подписывайся, если хочешь узнать, какие меры разброса существуют 😏

BY АДовый рисёрч




Share with your friend now:
group-telegram.com/ad_research/114

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

And indeed, volatility has been a hallmark of the market environment so far in 2022, with the S&P 500 still down more than 10% for the year-to-date after first sliding into a correction last month. The CBOE Volatility Index, or VIX, has held at a lofty level of more than 30. Under the Sebi Act, the regulator has the power to carry out search and seizure of books, registers, documents including electronics and digital devices from any person associated with the securities market. Official government accounts have also spread fake fact checks. An official Twitter account for the Russia diplomatic mission in Geneva shared a fake debunking video claiming without evidence that "Western and Ukrainian media are creating thousands of fake news on Russia every day." The video, which has amassed almost 30,000 views, offered a "how-to" spot misinformation. For tech stocks, “the main thing is yields,” Essaye said. Channels are not fully encrypted, end-to-end. All communications on a Telegram channel can be seen by anyone on the channel and are also visible to Telegram. Telegram may be asked by a government to hand over the communications from a channel. Telegram has a history of standing up to Russian government requests for data, but how comfortable you are relying on that history to predict future behavior is up to you. Because Telegram has this data, it may also be stolen by hackers or leaked by an internal employee.
from no


Telegram АДовый рисёрч
FROM American