Telegram Group & Telegram Channel
#статистика_для_котиков
Исходные данные определяют всё

Привет, коллега!

Есть в научных исследованиях такая страшная штука как статистический анализ результатов. Почему страшная? Потому что он почти никогда не бывает правильным и вызывает вопросы у многих рецензентов. Обычно, курс статистики ведётся математиками и часто проходит мимо своих слушателей, особенно он избегает биологов, химиков и медиков. Поэтому я когда-то разработала свой очень простой курс, ориентированный именно на применение статистики для научных исследований. Хотела продавать его под названием "Статистика для тех, у кого лапки", но руководство почему-то против такого названия 🤷‍♀️. Так что теперь буду абсолютно бесплатно делиться этими знаниями здесь)

Начинаю курс я обычно с цитаты «Существуют три вида лжи: ложь, наглая ложь и статистика». Очень часто специалистов в статистике и людей, которые ничего в ней не смыслят в ней, объединяет одно: они могут получить тот результат, который хотят получить. Разница в том, что первый сделает это грамотно. Кстати, при обработке данных клинических исследований биостатистик не должен знать ничего о группах, иначе он непреднамеренно может исказить результат.

И первый источник лжи в статистике - это конечно же исходные данные. Помните, я писала про красные светофоры и упоминала систематические ошибки отбора? Так вот же они, слева направо:

🎯 Ошибка техасского стрелка - выделение определённой части данных из выборки и последующая обработка как случайной выборки. Это как раз те самые светофоры, до начала исследования я фиксировала только те случаи, когда я опаздывала и горели красные светофоры, а все остальные игнорировала. Название взято из истории про то, как техасец сначала стреляет по амбару, а потом рисует мишень с центром в том месте, куда приходится больше всего попаданий. Эту ошибку мы встречаем каждый день и иногда она может привести к возникновению ложных научных гипотез. Я как-то потратила несколько месяцев на проверку идеи шефа о том, что у мышей одной трансгенной линии наблюдаются проблемы с суставами, если делать им инъекции тамоксифена. Он что-то такое наблюдал в те времена, когда сам работал, но видимо это было какое-то единичное событие.

😈 Предварительный отбор - набор испытуемых в группу по определённому критерию. Например, чтобы показать, что студенты Московского Громадного Училища умнее, чем студенты Мухосранского Государственного Университета, мы возьмём студентов 5 курса из первого вуза и первокурсников из второго и отправим их на олимпиаду.

✈️ Ошибка выжившего - данные имеются только по одной группе, а по другой их практически нет. Известный пример - это история про американские самолёты во вторую мировую войну. Самолёты возвращались на базу после вылета и на них оценивали расположение пробоин. И казалось, что надо укреплять эти места, поскольку в них фиксируются попадания. Но на самом деле самолёты, у которых пробоины были в других частях флюзеляжа, просто не вернулись на базу, не выжили. Менее известный пример - это сын маминой подруги, который всего на свете добился. Но на самом деле мы не знаем сколько сыновей маминых подруг умерло в нищете 😈

🕙 Уменьшение срока наблюдения - установка заведомо короткого срока эксперимента, чтобы получить наиболее выраженный эффект. Например, большинство людей (от 70 до 90% по разным данным) набирает вес после диет, но мы никогда этого не увидим на страницах фитнес-тренеров и диетологов. Ну а мы как исследователи в биомедицине, можем показать как здорово наш препарат снизил воспаление через пару часов, а что там через сутки - кого вообще волнует?

🗑 Ещё можно "почистить" полученные данные на предмет выбросов, благо существует много методов разной степени жёсткости, которые это делают. А иногда это делают и без анализа, просто крыса мордой не вышла и не место ей в нашей выборке.

В заключение хочется сказать, что статистика это всего лишь инструмент и она может быть использована как для поиска истины, так и для фальсификации результатов. И какую сторону выберешь ты?
Please open Telegram to view this post
VIEW IN TELEGRAM



group-telegram.com/ad_research/16
Create:
Last Update:

#статистика_для_котиков
Исходные данные определяют всё

Привет, коллега!

Есть в научных исследованиях такая страшная штука как статистический анализ результатов. Почему страшная? Потому что он почти никогда не бывает правильным и вызывает вопросы у многих рецензентов. Обычно, курс статистики ведётся математиками и часто проходит мимо своих слушателей, особенно он избегает биологов, химиков и медиков. Поэтому я когда-то разработала свой очень простой курс, ориентированный именно на применение статистики для научных исследований. Хотела продавать его под названием "Статистика для тех, у кого лапки", но руководство почему-то против такого названия 🤷‍♀️. Так что теперь буду абсолютно бесплатно делиться этими знаниями здесь)

Начинаю курс я обычно с цитаты «Существуют три вида лжи: ложь, наглая ложь и статистика». Очень часто специалистов в статистике и людей, которые ничего в ней не смыслят в ней, объединяет одно: они могут получить тот результат, который хотят получить. Разница в том, что первый сделает это грамотно. Кстати, при обработке данных клинических исследований биостатистик не должен знать ничего о группах, иначе он непреднамеренно может исказить результат.

И первый источник лжи в статистике - это конечно же исходные данные. Помните, я писала про красные светофоры и упоминала систематические ошибки отбора? Так вот же они, слева направо:

🎯 Ошибка техасского стрелка - выделение определённой части данных из выборки и последующая обработка как случайной выборки. Это как раз те самые светофоры, до начала исследования я фиксировала только те случаи, когда я опаздывала и горели красные светофоры, а все остальные игнорировала. Название взято из истории про то, как техасец сначала стреляет по амбару, а потом рисует мишень с центром в том месте, куда приходится больше всего попаданий. Эту ошибку мы встречаем каждый день и иногда она может привести к возникновению ложных научных гипотез. Я как-то потратила несколько месяцев на проверку идеи шефа о том, что у мышей одной трансгенной линии наблюдаются проблемы с суставами, если делать им инъекции тамоксифена. Он что-то такое наблюдал в те времена, когда сам работал, но видимо это было какое-то единичное событие.

😈 Предварительный отбор - набор испытуемых в группу по определённому критерию. Например, чтобы показать, что студенты Московского Громадного Училища умнее, чем студенты Мухосранского Государственного Университета, мы возьмём студентов 5 курса из первого вуза и первокурсников из второго и отправим их на олимпиаду.

✈️ Ошибка выжившего - данные имеются только по одной группе, а по другой их практически нет. Известный пример - это история про американские самолёты во вторую мировую войну. Самолёты возвращались на базу после вылета и на них оценивали расположение пробоин. И казалось, что надо укреплять эти места, поскольку в них фиксируются попадания. Но на самом деле самолёты, у которых пробоины были в других частях флюзеляжа, просто не вернулись на базу, не выжили. Менее известный пример - это сын маминой подруги, который всего на свете добился. Но на самом деле мы не знаем сколько сыновей маминых подруг умерло в нищете 😈

🕙 Уменьшение срока наблюдения - установка заведомо короткого срока эксперимента, чтобы получить наиболее выраженный эффект. Например, большинство людей (от 70 до 90% по разным данным) набирает вес после диет, но мы никогда этого не увидим на страницах фитнес-тренеров и диетологов. Ну а мы как исследователи в биомедицине, можем показать как здорово наш препарат снизил воспаление через пару часов, а что там через сутки - кого вообще волнует?

🗑 Ещё можно "почистить" полученные данные на предмет выбросов, благо существует много методов разной степени жёсткости, которые это делают. А иногда это делают и без анализа, просто крыса мордой не вышла и не место ей в нашей выборке.

В заключение хочется сказать, что статистика это всего лишь инструмент и она может быть использована как для поиска истины, так и для фальсификации результатов. И какую сторону выберешь ты?

BY АДовый рисёрч




Share with your friend now:
group-telegram.com/ad_research/16

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

Unlike Silicon Valley giants such as Facebook and Twitter, which run very public anti-disinformation programs, Brooking said: "Telegram is famously lax or absent in its content moderation policy." In addition, Telegram now supports the use of third-party streaming tools like OBS Studio and XSplit to broadcast live video, allowing users to add overlays and multi-screen layouts for a more professional look. The original Telegram channel has expanded into a web of accounts for different locations, including specific pages made for individual Russian cities. There's also an English-language website, which states it is owned by the people who run the Telegram channels. Lastly, the web previews of t.me links have been given a new look, adding chat backgrounds and design elements from the fully-features Telegram Web client.
from us


Telegram АДовый рисёрч
FROM American