Памятка по выбору статистического критерия

Для того, чтобы выбрать статистический критерий, нужно понимать структуру самого исследования и то, какие параметры анализируются, т.е с какими данными нам предстоит работать.
То, какого типа у нас переменная накладывает существенные ограничения на то, что мы можем с ней делать.

В самом общем виде данные можно разделить на 2 типа: количественные и качественные.

Количественные переменные отображают, как можно догадаться из названия, количество чего-то и, в свою очередь, подразделяются на дискретные и непрерывные.
Качественные переменные — это переменные, которые отражают свойство или качество объектов. Их тоже можно поделить на 2 подтипа: номинальные и порядковые.

Подробнее о типах переменных

Уточнение:
На самом деле, подтип количественной переменной (дискретная она или непрерывная) не имеет значения при выборе статистического критерия.
А имеет значение то, как эта переменная распределена. Принципиально важной характеристикой переменной является нормальность ее распределения (построив гистограмму, можно примерно оценить форму распределения, а применив критерий Шапиро-Уилка — точно удостовериться в том, является ли распределение нормальным).
Например, параметрическая статистика работает только для нормально распределенных величин.
Для исследования количественных переменных с распределением, отличным от нормального, используются непараметрические методы.


С основными типами данных разобрались.
Теперь выделим три принципиально важных группы переменных, которые влияют на выбор статистического критерия:
— количественные переменные с нормальным распределением;
— количественные переменные с другим распределением и порядковые переменные;
— номинальные переменные.

Чтобы перейти, наконец к выбору статистического критерия, нам еще нужно знать, какие у нас условия исследования, т.е с какими выборками мы работаем — независимыми или связанными.
Например, когда мы берем две разные группы данных и сравниваем в них какой-то параметр (например, среднее), то такие выборки — независимые.
Связанные выборки получаются, когда мы наблюдаем за одной группой, но в разных состояниях (например, группа пациентов до и после лечения).

Стентон Гланц «Медико-биологическая статистика».
Звездочкой (*) в таблице на видео отмечены критерии, которые можно применять только при условии равенства дисперсий.

Вид переменной Независимые выборки Зависимые выборки
две группы \ больше групп две группы \ больше групп
Количественный (нормальное распределение) Критерий Стьюдента* \ Дисперсионный анализ* Критерий Стьюдента (для зависимых выборок)* \ Дисперсионный анализ (для повторных измерений)*
Порядковый и количественный (распределение, отличное от нормального) Критерий Манна-Уитни \ Критерий Крускала-Уоллиса Критерий Вилкоксона \ Критерий Фридмана
Качественные, номинальные Критерий Хи-квадрат \ Критерий Хи-квадрат Критерий Мак-Немара \ Критерий Кокрена

Добавить комментарий