Telegram Group & Telegram Channel
#статистика_для_котиков
Исходные данные определяют всё

Привет, коллега!

Есть в научных исследованиях такая страшная штука как статистический анализ результатов. Почему страшная? Потому что он почти никогда не бывает правильным и вызывает вопросы у многих рецензентов. Обычно, курс статистики ведётся математиками и часто проходит мимо своих слушателей, особенно он избегает биологов, химиков и медиков. Поэтому я когда-то разработала свой очень простой курс, ориентированный именно на применение статистики для научных исследований. Хотела продавать его под названием "Статистика для тех, у кого лапки", но руководство почему-то против такого названия 🤷‍♀️. Так что теперь буду абсолютно бесплатно делиться этими знаниями здесь)

Начинаю курс я обычно с цитаты «Существуют три вида лжи: ложь, наглая ложь и статистика». Очень часто специалистов в статистике и людей, которые ничего в ней не смыслят в ней, объединяет одно: они могут получить тот результат, который хотят получить. Разница в том, что первый сделает это грамотно. Кстати, при обработке данных клинических исследований биостатистик не должен знать ничего о группах, иначе он непреднамеренно может исказить результат.

И первый источник лжи в статистике - это конечно же исходные данные. Помните, я писала про красные светофоры и упоминала систематические ошибки отбора? Так вот же они, слева направо:

🎯 Ошибка техасского стрелка - выделение определённой части данных из выборки и последующая обработка как случайной выборки. Это как раз те самые светофоры, до начала исследования я фиксировала только те случаи, когда я опаздывала и горели красные светофоры, а все остальные игнорировала. Название взято из истории про то, как техасец сначала стреляет по амбару, а потом рисует мишень с центром в том месте, куда приходится больше всего попаданий. Эту ошибку мы встречаем каждый день и иногда она может привести к возникновению ложных научных гипотез. Я как-то потратила несколько месяцев на проверку идеи шефа о том, что у мышей одной трансгенной линии наблюдаются проблемы с суставами, если делать им инъекции тамоксифена. Он что-то такое наблюдал в те времена, когда сам работал, но видимо это было какое-то единичное событие.

😈 Предварительный отбор - набор испытуемых в группу по определённому критерию. Например, чтобы показать, что студенты Московского Громадного Училища умнее, чем студенты Мухосранского Государственного Университета, мы возьмём студентов 5 курса из первого вуза и первокурсников из второго и отправим их на олимпиаду.

✈️ Ошибка выжившего - данные имеются только по одной группе, а по другой их практически нет. Известный пример - это история про американские самолёты во вторую мировую войну. Самолёты возвращались на базу после вылета и на них оценивали расположение пробоин. И казалось, что надо укреплять эти места, поскольку в них фиксируются попадания. Но на самом деле самолёты, у которых пробоины были в других частях флюзеляжа, просто не вернулись на базу, не выжили. Менее известный пример - это сын маминой подруги, который всего на свете добился. Но на самом деле мы не знаем сколько сыновей маминых подруг умерло в нищете 😈

🕙 Уменьшение срока наблюдения - установка заведомо короткого срока эксперимента, чтобы получить наиболее выраженный эффект. Например, большинство людей (от 70 до 90% по разным данным) набирает вес после диет, но мы никогда этого не увидим на страницах фитнес-тренеров и диетологов. Ну а мы как исследователи в биомедицине, можем показать как здорово наш препарат снизил воспаление через пару часов, а что там через сутки - кого вообще волнует?

🗑 Ещё можно "почистить" полученные данные на предмет выбросов, благо существует много методов разной степени жёсткости, которые это делают. А иногда это делают и без анализа, просто крыса мордой не вышла и не место ей в нашей выборке.

В заключение хочется сказать, что статистика это всего лишь инструмент и она может быть использована как для поиска истины, так и для фальсификации результатов. И какую сторону выберешь ты?
Please open Telegram to view this post
VIEW IN TELEGRAM



group-telegram.com/ad_research/16
Create:
Last Update:

#статистика_для_котиков
Исходные данные определяют всё

Привет, коллега!

Есть в научных исследованиях такая страшная штука как статистический анализ результатов. Почему страшная? Потому что он почти никогда не бывает правильным и вызывает вопросы у многих рецензентов. Обычно, курс статистики ведётся математиками и часто проходит мимо своих слушателей, особенно он избегает биологов, химиков и медиков. Поэтому я когда-то разработала свой очень простой курс, ориентированный именно на применение статистики для научных исследований. Хотела продавать его под названием "Статистика для тех, у кого лапки", но руководство почему-то против такого названия 🤷‍♀️. Так что теперь буду абсолютно бесплатно делиться этими знаниями здесь)

Начинаю курс я обычно с цитаты «Существуют три вида лжи: ложь, наглая ложь и статистика». Очень часто специалистов в статистике и людей, которые ничего в ней не смыслят в ней, объединяет одно: они могут получить тот результат, который хотят получить. Разница в том, что первый сделает это грамотно. Кстати, при обработке данных клинических исследований биостатистик не должен знать ничего о группах, иначе он непреднамеренно может исказить результат.

И первый источник лжи в статистике - это конечно же исходные данные. Помните, я писала про красные светофоры и упоминала систематические ошибки отбора? Так вот же они, слева направо:

🎯 Ошибка техасского стрелка - выделение определённой части данных из выборки и последующая обработка как случайной выборки. Это как раз те самые светофоры, до начала исследования я фиксировала только те случаи, когда я опаздывала и горели красные светофоры, а все остальные игнорировала. Название взято из истории про то, как техасец сначала стреляет по амбару, а потом рисует мишень с центром в том месте, куда приходится больше всего попаданий. Эту ошибку мы встречаем каждый день и иногда она может привести к возникновению ложных научных гипотез. Я как-то потратила несколько месяцев на проверку идеи шефа о том, что у мышей одной трансгенной линии наблюдаются проблемы с суставами, если делать им инъекции тамоксифена. Он что-то такое наблюдал в те времена, когда сам работал, но видимо это было какое-то единичное событие.

😈 Предварительный отбор - набор испытуемых в группу по определённому критерию. Например, чтобы показать, что студенты Московского Громадного Училища умнее, чем студенты Мухосранского Государственного Университета, мы возьмём студентов 5 курса из первого вуза и первокурсников из второго и отправим их на олимпиаду.

✈️ Ошибка выжившего - данные имеются только по одной группе, а по другой их практически нет. Известный пример - это история про американские самолёты во вторую мировую войну. Самолёты возвращались на базу после вылета и на них оценивали расположение пробоин. И казалось, что надо укреплять эти места, поскольку в них фиксируются попадания. Но на самом деле самолёты, у которых пробоины были в других частях флюзеляжа, просто не вернулись на базу, не выжили. Менее известный пример - это сын маминой подруги, который всего на свете добился. Но на самом деле мы не знаем сколько сыновей маминых подруг умерло в нищете 😈

🕙 Уменьшение срока наблюдения - установка заведомо короткого срока эксперимента, чтобы получить наиболее выраженный эффект. Например, большинство людей (от 70 до 90% по разным данным) набирает вес после диет, но мы никогда этого не увидим на страницах фитнес-тренеров и диетологов. Ну а мы как исследователи в биомедицине, можем показать как здорово наш препарат снизил воспаление через пару часов, а что там через сутки - кого вообще волнует?

🗑 Ещё можно "почистить" полученные данные на предмет выбросов, благо существует много методов разной степени жёсткости, которые это делают. А иногда это делают и без анализа, просто крыса мордой не вышла и не место ей в нашей выборке.

В заключение хочется сказать, что статистика это всего лишь инструмент и она может быть использована как для поиска истины, так и для фальсификации результатов. И какую сторону выберешь ты?

BY АДовый рисёрч




Share with your friend now:
group-telegram.com/ad_research/16

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

If you initiate a Secret Chat, however, then these communications are end-to-end encrypted and are tied to the device you are using. That means it’s less convenient to access them across multiple platforms, but you are at far less risk of snooping. Back in the day, Secret Chats received some praise from the EFF, but the fact that its standard system isn’t as secure earned it some criticism. If you’re looking for something that is considered more reliable by privacy advocates, then Signal is the EFF’s preferred platform, although that too is not without some caveats. The channel appears to be part of the broader information war that has developed following Russia's invasion of Ukraine. The Kremlin has paid Russian TikTok influencers to push propaganda, according to a Vice News investigation, while ProPublica found that fake Russian fact check videos had been viewed over a million times on Telegram. To that end, when files are actively downloading, a new icon now appears in the Search bar that users can tap to view and manage downloads, pause and resume all downloads or just individual items, and select one to increase its priority or view it in a chat. In view of this, the regulator has cautioned investors not to rely on such investment tips / advice received through social media platforms. It has also said investors should exercise utmost caution while taking investment decisions while dealing in the securities market. The SC urges the public to refer to the SC’s I nvestor Alert List before investing. The list contains details of unauthorised websites, investment products, companies and individuals. Members of the public who suspect that they have been approached by unauthorised firms or individuals offering schemes that promise unrealistic returns
from id


Telegram АДовый рисёрч
FROM American