Статистика – это инструмент, который можно применять в разных областях науки. Без знаний о ней учёный не может делать верные выводы о результатах своего исследования. В некоторых университетах по медицинской статистике можно даже получить учёную степень! В этом разделе мы обсудим базовые статистические понятия, которыми наиболее часто оперируют в медицинской статистике, ведь без них в мире доказательной медицины никуда.
Статистические критерии и заветный p-value
Перед тем как проводить какое-то исследование, нужно чётко определить его цель. Именно она задаёт тон всей остальной работе, ведь, исходя из неё, исследователь сможет представить достижение цели в виде шагов. Эти шаги называются задачами. Допустим, вы хотите исследовать распространённость гриппа типа А среди школьников начальных классов школы № 1. Для этого нужно собрать все школьников, взять у них биологические образцы на анализы, провести эти анализы, а дальше уже сделать какие-то выводы. Всё это – последовательность шагов. Исходя из этой последовательности шагов и того, какие результаты мы хотим получить, выбираются соответствующие статистические методы обработки данных. Все школьники вместе образуют выборку, то есть это люди, которые были выбраны для проведения нашего эксперимента, наблюдения, опроса. Например, в этом случае нам будет вполне достаточно данных о том, сколько всего учеников учится в начальных классах и сколько из них заражены гриппом А.
Ситуация немного усложняется, если мы хотим проверить: кто же болеет гриппом чаще? Мальчики или девочки? Второклассники или третьеклассники? То есть теперь нам нужно ещё и сравнить результаты между группами испытуемых. Для того, чтобы тому, кто потом будет читать наш отчёт, было понятно, по какому признаку мы разделяли учеников, мы должны как-то охарактеризовать всю выборку школьников. Нужно будет указать информацию о том, сколько девочек, сколько мальчиков, сколько учеников какого класса вошло в итоговый статистический анализ. Тут важно помнить, что изначально мы принимаем, что никаких различий между группами не существует. Такое утверждение иначе называется нулевой гипотезой, Н0. В зависимости от цели исследования мы можем пытаться или доказать нулевую гипотезу, или опровергнуть её. Если окажется, что разница в заболеваемости гриппом между мальчиками и девочками всё же существует, мы напишем в отчёте, что нулевая гипотеза была отвергнута. Если же разницы в результатах не будет наблюдаться, мы напишем, что нулевая гипотеза была принята.
Но и это ещё не всё. Согласитесь, будет странно делать выводы о различиях в распространённости гриппа А в разных группах, если в одну группу входит только один человек, а в другую – двадцать. То есть наши группы должны быть каким-то образом сопоставимы. В них необязательно должно быть одинаковое количество человек. Допустимая разница в группах рассчитывается отдельно. Но если в одну группу войдёт 25 человек, а в другую – 26, мы всё равно сможем обработать такую информацию.
Сколько же человек должно вообще нужно исследовать для того, чтобы наши выводы стали корректными и могли применяться повсеместно? По данным сайта Statdata на 1 января 2017 года в России проживает около 8.5 млн детей в возрасте от 5 до 9 лет. Можно ли будет распространить наши результаты на все эти 8.5 млн детей? Нет, ведь наша выборка неидеальна. Мы выбрали только учеников из одной школы. Ситуация улучшится, если мы выберем для анализа данные об учениках из школы № 2? Совсем немного, ведь мы всё ещё находимся в одном городе. Мы хотим получить результаты, которые можно будет распространить на всю страну целиком, значит, нам надо подключить и другие города к нашему анализу.
То, что мы сейчас с вами проговорили, – это мысленная часть эксперимента, всего лишь подготовка к нему. Несмотря на то, что наше исследование казалось совсем простым, в итоге оказалось, что и в этом случае надо аккуратно подходить к делу. Анализ объёма выборки, который необходим для получения результатов исследования, – это крайне важный этап планирования эксперимента. Без проведения вычислений на этапе планирования исследователь может получить слишком маленький объём данных на выходе. В результате наше исследование будет ненадёжным. Если же исследователь, напротив, проводит исследование на очень большой выборке, то он рискует получить слишком много данных. Избыточность данных для статистического анализа не беда, но вот потраченное время и ресурсы могут быть очень ценными. Если речь идёт о клинических испытаниях, то здесь к вопросу о высчитывании необходимой выборки подходят со всем тщанием (конечно, если речь идёт о