Telegram Group & Telegram Channel
#статистика_для_котиков
Исходные данные определяют всё

Привет, коллега!

Есть в научных исследованиях такая страшная штука как статистический анализ результатов. Почему страшная? Потому что он почти никогда не бывает правильным и вызывает вопросы у многих рецензентов. Обычно, курс статистики ведётся математиками и часто проходит мимо своих слушателей, особенно он избегает биологов, химиков и медиков. Поэтому я когда-то разработала свой очень простой курс, ориентированный именно на применение статистики для научных исследований. Хотела продавать его под названием "Статистика для тех, у кого лапки", но руководство почему-то против такого названия 🤷‍♀️. Так что теперь буду абсолютно бесплатно делиться этими знаниями здесь)

Начинаю курс я обычно с цитаты «Существуют три вида лжи: ложь, наглая ложь и статистика». Очень часто специалистов в статистике и людей, которые ничего в ней не смыслят в ней, объединяет одно: они могут получить тот результат, который хотят получить. Разница в том, что первый сделает это грамотно. Кстати, при обработке данных клинических исследований биостатистик не должен знать ничего о группах, иначе он непреднамеренно может исказить результат.

И первый источник лжи в статистике - это конечно же исходные данные. Помните, я писала про красные светофоры и упоминала систематические ошибки отбора? Так вот же они, слева направо:

🎯 Ошибка техасского стрелка - выделение определённой части данных из выборки и последующая обработка как случайной выборки. Это как раз те самые светофоры, до начала исследования я фиксировала только те случаи, когда я опаздывала и горели красные светофоры, а все остальные игнорировала. Название взято из истории про то, как техасец сначала стреляет по амбару, а потом рисует мишень с центром в том месте, куда приходится больше всего попаданий. Эту ошибку мы встречаем каждый день и иногда она может привести к возникновению ложных научных гипотез. Я как-то потратила несколько месяцев на проверку идеи шефа о том, что у мышей одной трансгенной линии наблюдаются проблемы с суставами, если делать им инъекции тамоксифена. Он что-то такое наблюдал в те времена, когда сам работал, но видимо это было какое-то единичное событие.

😈 Предварительный отбор - набор испытуемых в группу по определённому критерию. Например, чтобы показать, что студенты Московского Громадного Училища умнее, чем студенты Мухосранского Государственного Университета, мы возьмём студентов 5 курса из первого вуза и первокурсников из второго и отправим их на олимпиаду.

✈️ Ошибка выжившего - данные имеются только по одной группе, а по другой их практически нет. Известный пример - это история про американские самолёты во вторую мировую войну. Самолёты возвращались на базу после вылета и на них оценивали расположение пробоин. И казалось, что надо укреплять эти места, поскольку в них фиксируются попадания. Но на самом деле самолёты, у которых пробоины были в других частях флюзеляжа, просто не вернулись на базу, не выжили. Менее известный пример - это сын маминой подруги, который всего на свете добился. Но на самом деле мы не знаем сколько сыновей маминых подруг умерло в нищете 😈

🕙 Уменьшение срока наблюдения - установка заведомо короткого срока эксперимента, чтобы получить наиболее выраженный эффект. Например, большинство людей (от 70 до 90% по разным данным) набирает вес после диет, но мы никогда этого не увидим на страницах фитнес-тренеров и диетологов. Ну а мы как исследователи в биомедицине, можем показать как здорово наш препарат снизил воспаление через пару часов, а что там через сутки - кого вообще волнует?

🗑 Ещё можно "почистить" полученные данные на предмет выбросов, благо существует много методов разной степени жёсткости, которые это делают. А иногда это делают и без анализа, просто крыса мордой не вышла и не место ей в нашей выборке.

В заключение хочется сказать, что статистика это всего лишь инструмент и она может быть использована как для поиска истины, так и для фальсификации результатов. И какую сторону выберешь ты?
Please open Telegram to view this post
VIEW IN TELEGRAM



group-telegram.com/ad_research/16
Create:
Last Update:

#статистика_для_котиков
Исходные данные определяют всё

Привет, коллега!

Есть в научных исследованиях такая страшная штука как статистический анализ результатов. Почему страшная? Потому что он почти никогда не бывает правильным и вызывает вопросы у многих рецензентов. Обычно, курс статистики ведётся математиками и часто проходит мимо своих слушателей, особенно он избегает биологов, химиков и медиков. Поэтому я когда-то разработала свой очень простой курс, ориентированный именно на применение статистики для научных исследований. Хотела продавать его под названием "Статистика для тех, у кого лапки", но руководство почему-то против такого названия 🤷‍♀️. Так что теперь буду абсолютно бесплатно делиться этими знаниями здесь)

Начинаю курс я обычно с цитаты «Существуют три вида лжи: ложь, наглая ложь и статистика». Очень часто специалистов в статистике и людей, которые ничего в ней не смыслят в ней, объединяет одно: они могут получить тот результат, который хотят получить. Разница в том, что первый сделает это грамотно. Кстати, при обработке данных клинических исследований биостатистик не должен знать ничего о группах, иначе он непреднамеренно может исказить результат.

И первый источник лжи в статистике - это конечно же исходные данные. Помните, я писала про красные светофоры и упоминала систематические ошибки отбора? Так вот же они, слева направо:

🎯 Ошибка техасского стрелка - выделение определённой части данных из выборки и последующая обработка как случайной выборки. Это как раз те самые светофоры, до начала исследования я фиксировала только те случаи, когда я опаздывала и горели красные светофоры, а все остальные игнорировала. Название взято из истории про то, как техасец сначала стреляет по амбару, а потом рисует мишень с центром в том месте, куда приходится больше всего попаданий. Эту ошибку мы встречаем каждый день и иногда она может привести к возникновению ложных научных гипотез. Я как-то потратила несколько месяцев на проверку идеи шефа о том, что у мышей одной трансгенной линии наблюдаются проблемы с суставами, если делать им инъекции тамоксифена. Он что-то такое наблюдал в те времена, когда сам работал, но видимо это было какое-то единичное событие.

😈 Предварительный отбор - набор испытуемых в группу по определённому критерию. Например, чтобы показать, что студенты Московского Громадного Училища умнее, чем студенты Мухосранского Государственного Университета, мы возьмём студентов 5 курса из первого вуза и первокурсников из второго и отправим их на олимпиаду.

✈️ Ошибка выжившего - данные имеются только по одной группе, а по другой их практически нет. Известный пример - это история про американские самолёты во вторую мировую войну. Самолёты возвращались на базу после вылета и на них оценивали расположение пробоин. И казалось, что надо укреплять эти места, поскольку в них фиксируются попадания. Но на самом деле самолёты, у которых пробоины были в других частях флюзеляжа, просто не вернулись на базу, не выжили. Менее известный пример - это сын маминой подруги, который всего на свете добился. Но на самом деле мы не знаем сколько сыновей маминых подруг умерло в нищете 😈

🕙 Уменьшение срока наблюдения - установка заведомо короткого срока эксперимента, чтобы получить наиболее выраженный эффект. Например, большинство людей (от 70 до 90% по разным данным) набирает вес после диет, но мы никогда этого не увидим на страницах фитнес-тренеров и диетологов. Ну а мы как исследователи в биомедицине, можем показать как здорово наш препарат снизил воспаление через пару часов, а что там через сутки - кого вообще волнует?

🗑 Ещё можно "почистить" полученные данные на предмет выбросов, благо существует много методов разной степени жёсткости, которые это делают. А иногда это делают и без анализа, просто крыса мордой не вышла и не место ей в нашей выборке.

В заключение хочется сказать, что статистика это всего лишь инструмент и она может быть использована как для поиска истины, так и для фальсификации результатов. И какую сторону выберешь ты?

BY АДовый рисёрч




Share with your friend now:
group-telegram.com/ad_research/16

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

So, uh, whenever I hear about Telegram, it’s always in relation to something bad. What gives? "We as Ukrainians believe that the truth is on our side, whether it's truth that you're proclaiming about the war and everything else, why would you want to hide it?," he said. And while money initially moved into stocks in the morning, capital moved out of safe-haven assets. The price of the 10-year Treasury note fell Friday, sending its yield up to 2% from a March closing low of 1.73%. On December 23rd, 2020, Pavel Durov posted to his channel that the company would need to start generating revenue. In early 2021, he added that any advertising on the platform would not use user data for targeting, and that it would be focused on “large one-to-many channels.” He pledged that ads would be “non-intrusive” and that most users would simply not notice any change. If you initiate a Secret Chat, however, then these communications are end-to-end encrypted and are tied to the device you are using. That means it’s less convenient to access them across multiple platforms, but you are at far less risk of snooping. Back in the day, Secret Chats received some praise from the EFF, but the fact that its standard system isn’t as secure earned it some criticism. If you’re looking for something that is considered more reliable by privacy advocates, then Signal is the EFF’s preferred platform, although that too is not without some caveats.
from br


Telegram АДовый рисёрч
FROM American