Telegram Group & Telegram Channel
#статистика_для_котиков
Исходные данные определяют всё

Привет, коллега!

Есть в научных исследованиях такая страшная штука как статистический анализ результатов. Почему страшная? Потому что он почти никогда не бывает правильным и вызывает вопросы у многих рецензентов. Обычно, курс статистики ведётся математиками и часто проходит мимо своих слушателей, особенно он избегает биологов, химиков и медиков. Поэтому я когда-то разработала свой очень простой курс, ориентированный именно на применение статистики для научных исследований. Хотела продавать его под названием "Статистика для тех, у кого лапки", но руководство почему-то против такого названия 🤷‍♀️. Так что теперь буду абсолютно бесплатно делиться этими знаниями здесь)

Начинаю курс я обычно с цитаты «Существуют три вида лжи: ложь, наглая ложь и статистика». Очень часто специалистов в статистике и людей, которые ничего в ней не смыслят в ней, объединяет одно: они могут получить тот результат, который хотят получить. Разница в том, что первый сделает это грамотно. Кстати, при обработке данных клинических исследований биостатистик не должен знать ничего о группах, иначе он непреднамеренно может исказить результат.

И первый источник лжи в статистике - это конечно же исходные данные. Помните, я писала про красные светофоры и упоминала систематические ошибки отбора? Так вот же они, слева направо:

🎯 Ошибка техасского стрелка - выделение определённой части данных из выборки и последующая обработка как случайной выборки. Это как раз те самые светофоры, до начала исследования я фиксировала только те случаи, когда я опаздывала и горели красные светофоры, а все остальные игнорировала. Название взято из истории про то, как техасец сначала стреляет по амбару, а потом рисует мишень с центром в том месте, куда приходится больше всего попаданий. Эту ошибку мы встречаем каждый день и иногда она может привести к возникновению ложных научных гипотез. Я как-то потратила несколько месяцев на проверку идеи шефа о том, что у мышей одной трансгенной линии наблюдаются проблемы с суставами, если делать им инъекции тамоксифена. Он что-то такое наблюдал в те времена, когда сам работал, но видимо это было какое-то единичное событие.

😈 Предварительный отбор - набор испытуемых в группу по определённому критерию. Например, чтобы показать, что студенты Московского Громадного Училища умнее, чем студенты Мухосранского Государственного Университета, мы возьмём студентов 5 курса из первого вуза и первокурсников из второго и отправим их на олимпиаду.

✈️ Ошибка выжившего - данные имеются только по одной группе, а по другой их практически нет. Известный пример - это история про американские самолёты во вторую мировую войну. Самолёты возвращались на базу после вылета и на них оценивали расположение пробоин. И казалось, что надо укреплять эти места, поскольку в них фиксируются попадания. Но на самом деле самолёты, у которых пробоины были в других частях флюзеляжа, просто не вернулись на базу, не выжили. Менее известный пример - это сын маминой подруги, который всего на свете добился. Но на самом деле мы не знаем сколько сыновей маминых подруг умерло в нищете 😈

🕙 Уменьшение срока наблюдения - установка заведомо короткого срока эксперимента, чтобы получить наиболее выраженный эффект. Например, большинство людей (от 70 до 90% по разным данным) набирает вес после диет, но мы никогда этого не увидим на страницах фитнес-тренеров и диетологов. Ну а мы как исследователи в биомедицине, можем показать как здорово наш препарат снизил воспаление через пару часов, а что там через сутки - кого вообще волнует?

🗑 Ещё можно "почистить" полученные данные на предмет выбросов, благо существует много методов разной степени жёсткости, которые это делают. А иногда это делают и без анализа, просто крыса мордой не вышла и не место ей в нашей выборке.

В заключение хочется сказать, что статистика это всего лишь инструмент и она может быть использована как для поиска истины, так и для фальсификации результатов. И какую сторону выберешь ты?
Please open Telegram to view this post
VIEW IN TELEGRAM



group-telegram.com/ad_research/16
Create:
Last Update:

#статистика_для_котиков
Исходные данные определяют всё

Привет, коллега!

Есть в научных исследованиях такая страшная штука как статистический анализ результатов. Почему страшная? Потому что он почти никогда не бывает правильным и вызывает вопросы у многих рецензентов. Обычно, курс статистики ведётся математиками и часто проходит мимо своих слушателей, особенно он избегает биологов, химиков и медиков. Поэтому я когда-то разработала свой очень простой курс, ориентированный именно на применение статистики для научных исследований. Хотела продавать его под названием "Статистика для тех, у кого лапки", но руководство почему-то против такого названия 🤷‍♀️. Так что теперь буду абсолютно бесплатно делиться этими знаниями здесь)

Начинаю курс я обычно с цитаты «Существуют три вида лжи: ложь, наглая ложь и статистика». Очень часто специалистов в статистике и людей, которые ничего в ней не смыслят в ней, объединяет одно: они могут получить тот результат, который хотят получить. Разница в том, что первый сделает это грамотно. Кстати, при обработке данных клинических исследований биостатистик не должен знать ничего о группах, иначе он непреднамеренно может исказить результат.

И первый источник лжи в статистике - это конечно же исходные данные. Помните, я писала про красные светофоры и упоминала систематические ошибки отбора? Так вот же они, слева направо:

🎯 Ошибка техасского стрелка - выделение определённой части данных из выборки и последующая обработка как случайной выборки. Это как раз те самые светофоры, до начала исследования я фиксировала только те случаи, когда я опаздывала и горели красные светофоры, а все остальные игнорировала. Название взято из истории про то, как техасец сначала стреляет по амбару, а потом рисует мишень с центром в том месте, куда приходится больше всего попаданий. Эту ошибку мы встречаем каждый день и иногда она может привести к возникновению ложных научных гипотез. Я как-то потратила несколько месяцев на проверку идеи шефа о том, что у мышей одной трансгенной линии наблюдаются проблемы с суставами, если делать им инъекции тамоксифена. Он что-то такое наблюдал в те времена, когда сам работал, но видимо это было какое-то единичное событие.

😈 Предварительный отбор - набор испытуемых в группу по определённому критерию. Например, чтобы показать, что студенты Московского Громадного Училища умнее, чем студенты Мухосранского Государственного Университета, мы возьмём студентов 5 курса из первого вуза и первокурсников из второго и отправим их на олимпиаду.

✈️ Ошибка выжившего - данные имеются только по одной группе, а по другой их практически нет. Известный пример - это история про американские самолёты во вторую мировую войну. Самолёты возвращались на базу после вылета и на них оценивали расположение пробоин. И казалось, что надо укреплять эти места, поскольку в них фиксируются попадания. Но на самом деле самолёты, у которых пробоины были в других частях флюзеляжа, просто не вернулись на базу, не выжили. Менее известный пример - это сын маминой подруги, который всего на свете добился. Но на самом деле мы не знаем сколько сыновей маминых подруг умерло в нищете 😈

🕙 Уменьшение срока наблюдения - установка заведомо короткого срока эксперимента, чтобы получить наиболее выраженный эффект. Например, большинство людей (от 70 до 90% по разным данным) набирает вес после диет, но мы никогда этого не увидим на страницах фитнес-тренеров и диетологов. Ну а мы как исследователи в биомедицине, можем показать как здорово наш препарат снизил воспаление через пару часов, а что там через сутки - кого вообще волнует?

🗑 Ещё можно "почистить" полученные данные на предмет выбросов, благо существует много методов разной степени жёсткости, которые это делают. А иногда это делают и без анализа, просто крыса мордой не вышла и не место ей в нашей выборке.

В заключение хочется сказать, что статистика это всего лишь инструмент и она может быть использована как для поиска истины, так и для фальсификации результатов. И какую сторону выберешь ты?

BY АДовый рисёрч




Share with your friend now:
group-telegram.com/ad_research/16

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

"He has kind of an old-school cyber-libertarian world view where technology is there to set you free," Maréchal said. "There is a significant risk of insider threat or hacking of Telegram systems that could expose all of these chats to the Russian government," said Eva Galperin with the Electronic Frontier Foundation, which has called for Telegram to improve its privacy practices. Telegram users are able to send files of any type up to 2GB each and access them from any device, with no limit on cloud storage, which has made downloading files more popular on the platform. Perpetrators of these scams will create a public group on Telegram to promote these investment packages that are usually accompanied by fake testimonies and sometimes advertised as being Shariah-compliant. Interested investors will be asked to directly message the representatives to begin investing in the various investment packages offered. The message was not authentic, with the real Zelenskiy soon denying the claim on his official Telegram channel, but the incident highlighted a major problem: disinformation quickly spreads unchecked on the encrypted app.
from ye


Telegram АДовый рисёрч
FROM American