Когда проводится любое исследование, как правило, нет возможности включить в него все интересующие нас объекты.
Допустим, мы ищем лекарство от нового вируса. Мы не можем включить в исследование всех заболевших этим вирусом.
И даже, если бы мы смогли каким-то образом изучить всех существующих пациентов, мы никак не сможем понять, как будет протекать заболевание у будущих пациентов.
Таким образом, лаборатория, которая разрабатывает лекарство от вируса, будет испытывать его не на всех пациентах, а на какой-то группе.
Все заболевшие новым вирусом пациенты образуют генеральную совокупность, а группа, которую отобрали тестирования нового лекарства — это выборка.
Важно! выборка должна быть репрезентативна, т.е. должна полно и достоверно отображать признаки той совокупности, частью которой она является.
В нашем примере группу исследуемых надо подобрать так, чтобы распределение по полу, возрасту и другим признакам было примерно таким же, как и во всей популяции заболевших.
Репрезентативность выборки, так же, как и грамотное планирование, и правильная структура самого исследования — это основные условия для получения достоверных результатов.
Допустим, в ходе исследований мы выяснили, что наблюдается взаимосвязь между длительностью приема лекарства и наличием осложнений от болезни.
Можно ли выводы, полученные на исследовании группы пациентов (выборке), перенести на всех заболевших? Ведь есть вероятность того, что при увеличении числа пациентов связь станет не такой выраженной или и вовсе будет отсутствовать. Как же понять наверняка есть связь (зависимость) или нет?
Чтобы выяснить наличие или отсутствие связи нам и понадобится статистическая проверка гипотез.
Выдвигаем «нулевую гипотезу» H0: взаимосвязь между длительностью приема лекарств и наличие осложнений от болезни отсутствует.
Соответственно, альтернативная гипотеза H1 будет говорить, что связь есть.
Теперь у нас есть 4 варианта:
— отвергнуть нулевую гипотезу, когда в действительности она неверна — это правильные решения.
Но кроме этого, мы можем и совершить ошибки:
— принять нулевую гипотезу, когда в действительности она неверна — ошибка II рода (вероятность совершить такую ошибку обозначается β).
Что в реальности | Статистическое решение | |
H0 не отклоняется | H0 отклоняется | |
H0 верна | Правильное решение Доверительная вероятность равна 1-α |
ошибка I рода (α — вероятность ошибки I рода) |
H0 неверна | ошибка II рода (β — вероятность ошибки II рода) |
Правильное решение Мощность критерия равна 1-β |
Ошибка I рода очень критична, поэтому, чтобы снизить ее вероятность, α задают довольно малым, обычно 0.05 (т.е 5%).
Формулировка «Критически значимым определим уровень α=0.05» означает, что статистически значимыми признаются результаты, когда вероятность совершить ошибку I рода получается не более 5%.
Итак,
Т.е с помощью выбранного критерия мы рассчитываем p-value и сравниваем его с заданным уровнем α.
Статистически значимым считается уровень вероятности меньший, чем критический уровень α, который фиксированно задается для каждого исследования.
Обычно принимают, что должно быть p < 0.05 .
И еще один, довольно не очевидный вывод из всего написанного:
Следует помнить, что статистически значимые результаты не всегда могут быть достоверными (лучше лишний раз перепроверить все этапы исследования!) и наоборот, достоверные результаты не обязаны быть статистически значимыми.