Telegram Group & Telegram Channel
#статистика_для_котиков
Исходные данные определяют всё

Привет, коллега!

Есть в научных исследованиях такая страшная штука как статистический анализ результатов. Почему страшная? Потому что он почти никогда не бывает правильным и вызывает вопросы у многих рецензентов. Обычно, курс статистики ведётся математиками и часто проходит мимо своих слушателей, особенно он избегает биологов, химиков и медиков. Поэтому я когда-то разработала свой очень простой курс, ориентированный именно на применение статистики для научных исследований. Хотела продавать его под названием "Статистика для тех, у кого лапки", но руководство почему-то против такого названия 🤷‍♀️. Так что теперь буду абсолютно бесплатно делиться этими знаниями здесь)

Начинаю курс я обычно с цитаты «Существуют три вида лжи: ложь, наглая ложь и статистика». Очень часто специалистов в статистике и людей, которые ничего в ней не смыслят в ней, объединяет одно: они могут получить тот результат, который хотят получить. Разница в том, что первый сделает это грамотно. Кстати, при обработке данных клинических исследований биостатистик не должен знать ничего о группах, иначе он непреднамеренно может исказить результат.

И первый источник лжи в статистике - это конечно же исходные данные. Помните, я писала про красные светофоры и упоминала систематические ошибки отбора? Так вот же они, слева направо:

🎯 Ошибка техасского стрелка - выделение определённой части данных из выборки и последующая обработка как случайной выборки. Это как раз те самые светофоры, до начала исследования я фиксировала только те случаи, когда я опаздывала и горели красные светофоры, а все остальные игнорировала. Название взято из истории про то, как техасец сначала стреляет по амбару, а потом рисует мишень с центром в том месте, куда приходится больше всего попаданий. Эту ошибку мы встречаем каждый день и иногда она может привести к возникновению ложных научных гипотез. Я как-то потратила несколько месяцев на проверку идеи шефа о том, что у мышей одной трансгенной линии наблюдаются проблемы с суставами, если делать им инъекции тамоксифена. Он что-то такое наблюдал в те времена, когда сам работал, но видимо это было какое-то единичное событие.

😈 Предварительный отбор - набор испытуемых в группу по определённому критерию. Например, чтобы показать, что студенты Московского Громадного Училища умнее, чем студенты Мухосранского Государственного Университета, мы возьмём студентов 5 курса из первого вуза и первокурсников из второго и отправим их на олимпиаду.

✈️ Ошибка выжившего - данные имеются только по одной группе, а по другой их практически нет. Известный пример - это история про американские самолёты во вторую мировую войну. Самолёты возвращались на базу после вылета и на них оценивали расположение пробоин. И казалось, что надо укреплять эти места, поскольку в них фиксируются попадания. Но на самом деле самолёты, у которых пробоины были в других частях флюзеляжа, просто не вернулись на базу, не выжили. Менее известный пример - это сын маминой подруги, который всего на свете добился. Но на самом деле мы не знаем сколько сыновей маминых подруг умерло в нищете 😈

🕙 Уменьшение срока наблюдения - установка заведомо короткого срока эксперимента, чтобы получить наиболее выраженный эффект. Например, большинство людей (от 70 до 90% по разным данным) набирает вес после диет, но мы никогда этого не увидим на страницах фитнес-тренеров и диетологов. Ну а мы как исследователи в биомедицине, можем показать как здорово наш препарат снизил воспаление через пару часов, а что там через сутки - кого вообще волнует?

🗑 Ещё можно "почистить" полученные данные на предмет выбросов, благо существует много методов разной степени жёсткости, которые это делают. А иногда это делают и без анализа, просто крыса мордой не вышла и не место ей в нашей выборке.

В заключение хочется сказать, что статистика это всего лишь инструмент и она может быть использована как для поиска истины, так и для фальсификации результатов. И какую сторону выберешь ты?
Please open Telegram to view this post
VIEW IN TELEGRAM



group-telegram.com/ad_research/16
Create:
Last Update:

#статистика_для_котиков
Исходные данные определяют всё

Привет, коллега!

Есть в научных исследованиях такая страшная штука как статистический анализ результатов. Почему страшная? Потому что он почти никогда не бывает правильным и вызывает вопросы у многих рецензентов. Обычно, курс статистики ведётся математиками и часто проходит мимо своих слушателей, особенно он избегает биологов, химиков и медиков. Поэтому я когда-то разработала свой очень простой курс, ориентированный именно на применение статистики для научных исследований. Хотела продавать его под названием "Статистика для тех, у кого лапки", но руководство почему-то против такого названия 🤷‍♀️. Так что теперь буду абсолютно бесплатно делиться этими знаниями здесь)

Начинаю курс я обычно с цитаты «Существуют три вида лжи: ложь, наглая ложь и статистика». Очень часто специалистов в статистике и людей, которые ничего в ней не смыслят в ней, объединяет одно: они могут получить тот результат, который хотят получить. Разница в том, что первый сделает это грамотно. Кстати, при обработке данных клинических исследований биостатистик не должен знать ничего о группах, иначе он непреднамеренно может исказить результат.

И первый источник лжи в статистике - это конечно же исходные данные. Помните, я писала про красные светофоры и упоминала систематические ошибки отбора? Так вот же они, слева направо:

🎯 Ошибка техасского стрелка - выделение определённой части данных из выборки и последующая обработка как случайной выборки. Это как раз те самые светофоры, до начала исследования я фиксировала только те случаи, когда я опаздывала и горели красные светофоры, а все остальные игнорировала. Название взято из истории про то, как техасец сначала стреляет по амбару, а потом рисует мишень с центром в том месте, куда приходится больше всего попаданий. Эту ошибку мы встречаем каждый день и иногда она может привести к возникновению ложных научных гипотез. Я как-то потратила несколько месяцев на проверку идеи шефа о том, что у мышей одной трансгенной линии наблюдаются проблемы с суставами, если делать им инъекции тамоксифена. Он что-то такое наблюдал в те времена, когда сам работал, но видимо это было какое-то единичное событие.

😈 Предварительный отбор - набор испытуемых в группу по определённому критерию. Например, чтобы показать, что студенты Московского Громадного Училища умнее, чем студенты Мухосранского Государственного Университета, мы возьмём студентов 5 курса из первого вуза и первокурсников из второго и отправим их на олимпиаду.

✈️ Ошибка выжившего - данные имеются только по одной группе, а по другой их практически нет. Известный пример - это история про американские самолёты во вторую мировую войну. Самолёты возвращались на базу после вылета и на них оценивали расположение пробоин. И казалось, что надо укреплять эти места, поскольку в них фиксируются попадания. Но на самом деле самолёты, у которых пробоины были в других частях флюзеляжа, просто не вернулись на базу, не выжили. Менее известный пример - это сын маминой подруги, который всего на свете добился. Но на самом деле мы не знаем сколько сыновей маминых подруг умерло в нищете 😈

🕙 Уменьшение срока наблюдения - установка заведомо короткого срока эксперимента, чтобы получить наиболее выраженный эффект. Например, большинство людей (от 70 до 90% по разным данным) набирает вес после диет, но мы никогда этого не увидим на страницах фитнес-тренеров и диетологов. Ну а мы как исследователи в биомедицине, можем показать как здорово наш препарат снизил воспаление через пару часов, а что там через сутки - кого вообще волнует?

🗑 Ещё можно "почистить" полученные данные на предмет выбросов, благо существует много методов разной степени жёсткости, которые это делают. А иногда это делают и без анализа, просто крыса мордой не вышла и не место ей в нашей выборке.

В заключение хочется сказать, что статистика это всего лишь инструмент и она может быть использована как для поиска истины, так и для фальсификации результатов. И какую сторону выберешь ты?

BY АДовый рисёрч




Share with your friend now:
group-telegram.com/ad_research/16

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

He floated the idea of restricting the use of Telegram in Ukraine and Russia, a suggestion that was met with fierce opposition from users. Shortly after, Durov backed off the idea. "This time we received the coordinates of enemy vehicles marked 'V' in Kyiv region," it added. Anastasia Vlasova/Getty Images False news often spreads via public groups, or chats, with potentially fatal effects. Andrey, a Russian entrepreneur living in Brazil who, fearing retaliation, asked that NPR not use his last name, said Telegram has become one of the few places Russians can access independent news about the war.
from es


Telegram АДовый рисёрч
FROM American