Telegram Group & Telegram Channel
#статистика_для_котиков

Ты ешь капусту, твой начальник мясо, а в среднем вы едите голубцы

Привет, коллега!

В прошлый раз мы формировали выборки, а значит настало время описательной статистики. И в ней принято различать меры центральной тенденции, то есть параметры, характеризующие центр распределения данных выборки.

▶️ Среднее арифметическое. Величина, знакомая всем ещё со школы. Не рекомендуется к использованию на дискретных данных, иначе можно случайно получить полтора землекопа. Среднее является очень коварной величиной, если распределение имеет ассиметричную форму, то есть больших или малых значений в нём больше. И также среднее очень чувствительно к выбросам. Допустим, у нас есть небольшая лаборатория, заведующий которой имеет зарплату 500к рублей, ведущий научный сотрудник получает 60к, младший - 40к, а два лаборанта - 10к. Средняя зарплата составит 124 тысячи, вполне можно жить и публиковать в отчётах. Но есть нюанс 🤔

▶️ Медиана. Представляет собой значение, при котором половина выборки больше него и половина выборки меньше. Гораздо меньше чувствительна к выбросам и лучше показывает центр несимметричного распределения. В нашем гипотетическом институте медиана будет равна 40 тысячам рублей. Уже не так радужно, поэтому медианные зарплаты в отчётах не любят 😰

▶️ Мода. Наиболее часто встречающееся значение в выборке. Единственная из всех мер, которая может применяться к качественным данным. Но в целом, биологами мода используется не очень часто ввиду малого размера выборок: на таких повторения значений редки, а если и случаются, то не всегда в центре распределения. В вышеупомянутом институте моду задают лаборанты и она будет равна 10 тысячам рублей.

Это три самые популярные меры центральной тенденции. Но что если я скажу тебе, что существуют и другие? Например,

▶️ Среднее геометрическое. Используется для расчёта среднего роста или изменения показателя во времени, когда важна пропорциональность. Возьмём нашего младшего научного сотрудника с зарплатой в 40к. Когда он три года назад устраивался на работу его зарплата была 35к. После первого года её проиндексировали на 7%, на второй год ещё на 4%, а в этом на 3%. Можно подумать, что среднегодовой прирост зарплаты составляет 4,7%, но на самом деле он равен 4.4%. Мелочь, а неприятно.

▶️ Среднее гармоническое. Используется, если есть отличия в характеристиках значений. Допустим, наши лаборанты работают 4 часа, а несчастный завлаб пашет 14 часов. Можно, конечно, посчитать среднее арифметическое от почасовой оплаты (472 руб/час), но среднее гармоническое будет корректнее (191 руб/час), поскольку оно учитывает, что большая часть часов оплачивается по меньшей ставке. Опять лаборанты испортили статистику по оплате труда в лаборатории 👊

▶️ Среднее взвешенное. Используют, если разные величины имеют разную важность. Бухгалтеры считают средневзвешенную зарплату вместо обычной средней арифметической, чтобы учитывать количество человек на более низкооплачиваемых должностях. В нашем случае средневзвешенная зарплата составит 122 тысячи рублей. Всё ещё не так плохо, как медиана и мода, потому что лаборанта с низкой зп всего два. Я, кстати, использую среднее взвешенное для расчёта оценки за доклады: оценке преподавателя присваивается больший вес по сравнению со студентами. Тогда даже если вся группа сговорилась и ставит 100 баллов друг другу - мнение преподавателя всё равно перевесит. Кстати, "веса" можно добавлять не только в расчёт среднего арифметического, как это сделала я в примерах выше, но и в формулы других средних.

▶️ Среднее квадратическое. В статистике чаще используется для расчёта отклонений и называется среднеквадратичным (стандартным) отклонением. Это характеризует разброс данных, что в целом является спойлером к следующему посту.

Так что ставь реакцию и подписывайся, если хочешь узнать, какие меры разброса существуют 😏
Please open Telegram to view this post
VIEW IN TELEGRAM



group-telegram.com/ad_research/114
Create:
Last Update:

#статистика_для_котиков

Ты ешь капусту, твой начальник мясо, а в среднем вы едите голубцы

Привет, коллега!

В прошлый раз мы формировали выборки, а значит настало время описательной статистики. И в ней принято различать меры центральной тенденции, то есть параметры, характеризующие центр распределения данных выборки.

▶️ Среднее арифметическое. Величина, знакомая всем ещё со школы. Не рекомендуется к использованию на дискретных данных, иначе можно случайно получить полтора землекопа. Среднее является очень коварной величиной, если распределение имеет ассиметричную форму, то есть больших или малых значений в нём больше. И также среднее очень чувствительно к выбросам. Допустим, у нас есть небольшая лаборатория, заведующий которой имеет зарплату 500к рублей, ведущий научный сотрудник получает 60к, младший - 40к, а два лаборанта - 10к. Средняя зарплата составит 124 тысячи, вполне можно жить и публиковать в отчётах. Но есть нюанс 🤔

▶️ Медиана. Представляет собой значение, при котором половина выборки больше него и половина выборки меньше. Гораздо меньше чувствительна к выбросам и лучше показывает центр несимметричного распределения. В нашем гипотетическом институте медиана будет равна 40 тысячам рублей. Уже не так радужно, поэтому медианные зарплаты в отчётах не любят 😰

▶️ Мода. Наиболее часто встречающееся значение в выборке. Единственная из всех мер, которая может применяться к качественным данным. Но в целом, биологами мода используется не очень часто ввиду малого размера выборок: на таких повторения значений редки, а если и случаются, то не всегда в центре распределения. В вышеупомянутом институте моду задают лаборанты и она будет равна 10 тысячам рублей.

Это три самые популярные меры центральной тенденции. Но что если я скажу тебе, что существуют и другие? Например,

▶️ Среднее геометрическое. Используется для расчёта среднего роста или изменения показателя во времени, когда важна пропорциональность. Возьмём нашего младшего научного сотрудника с зарплатой в 40к. Когда он три года назад устраивался на работу его зарплата была 35к. После первого года её проиндексировали на 7%, на второй год ещё на 4%, а в этом на 3%. Можно подумать, что среднегодовой прирост зарплаты составляет 4,7%, но на самом деле он равен 4.4%. Мелочь, а неприятно.

▶️ Среднее гармоническое. Используется, если есть отличия в характеристиках значений. Допустим, наши лаборанты работают 4 часа, а несчастный завлаб пашет 14 часов. Можно, конечно, посчитать среднее арифметическое от почасовой оплаты (472 руб/час), но среднее гармоническое будет корректнее (191 руб/час), поскольку оно учитывает, что большая часть часов оплачивается по меньшей ставке. Опять лаборанты испортили статистику по оплате труда в лаборатории 👊

▶️ Среднее взвешенное. Используют, если разные величины имеют разную важность. Бухгалтеры считают средневзвешенную зарплату вместо обычной средней арифметической, чтобы учитывать количество человек на более низкооплачиваемых должностях. В нашем случае средневзвешенная зарплата составит 122 тысячи рублей. Всё ещё не так плохо, как медиана и мода, потому что лаборанта с низкой зп всего два. Я, кстати, использую среднее взвешенное для расчёта оценки за доклады: оценке преподавателя присваивается больший вес по сравнению со студентами. Тогда даже если вся группа сговорилась и ставит 100 баллов друг другу - мнение преподавателя всё равно перевесит. Кстати, "веса" можно добавлять не только в расчёт среднего арифметического, как это сделала я в примерах выше, но и в формулы других средних.

▶️ Среднее квадратическое. В статистике чаще используется для расчёта отклонений и называется среднеквадратичным (стандартным) отклонением. Это характеризует разброс данных, что в целом является спойлером к следующему посту.

Так что ставь реакцию и подписывайся, если хочешь узнать, какие меры разброса существуют 😏

BY АДовый рисёрч




Share with your friend now:
group-telegram.com/ad_research/114

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

Emerson Brooking, a disinformation expert at the Atlantic Council's Digital Forensic Research Lab, said: "Back in the Wild West period of content moderation, like 2014 or 2015, maybe they could have gotten away with it, but it stands in marked contrast with how other companies run themselves today." The regulator said it has been undertaking several campaigns to educate the investors to be vigilant while taking investment decisions based on stock tips. However, the perpetrators of such frauds are now adopting new methods and technologies to defraud the investors. "There are several million Russians who can lift their head up from propaganda and try to look for other sources, and I'd say that most look for it on Telegram," he said. Some people used the platform to organize ahead of the storming of the U.S. Capitol in January 2021, and last month Senator Mark Warner sent a letter to Durov urging him to curb Russian information operations on Telegram.
from sg


Telegram АДовый рисёрч
FROM American