ANOVA по рангам - ANOVA on ranks

В статистике одной из целей дисперсионного анализа (ANOVA) является анализ различий в средних значениях между группами. Статистика теста F предполагает независимость наблюдений, однородные дисперсии и нормальность популяции . ANOVA по рангам - это статистика, разработанная для ситуаций, когда было нарушено предположение о нормальности.

Логика теста F на средствах

F статистика представляет собой отношение числителя к знаменателю. Рассмотрим случайно выбранных субъектов, которые впоследствии случайным образом распределяются по группам A, B и C. В соответствии с истинностью нулевой гипотезы вариабельность (или сумма квадратов) оценок по некоторой зависимой переменной будет одинаковой в каждой группе. При делении на степени свободы (т. Е. На основе количества испытуемых в группе) получается знаменатель отношения F.

Считайте среднее значение для каждой группы баллом и вычислите вариабельность (опять же сумму квадратов) этих трех баллов. При делении на его степени свободы (т. Е. На основе количества групп) получается числитель отношения F.

При истинности нулевой гипотезы выборочное распределение отношения F зависит от степеней свободы числителя и знаменателя.

Смоделируйте лечение, применяемое к группе A, увеличивая каждый балл на X. (Эта модель поддерживает базовое предположение об однородных дисперсиях. На практике редко, если не невозможно, увеличение X в среднем по группе происходит за счет увеличения оценка каждого члена на X.) Это сдвинет распределение X единиц в положительном направлении, но не окажет никакого влияния на изменчивость внутри группы. Однако теперь разброс между средними баллами трех групп увеличится. Если результирующее соотношение F увеличивает значение до такой степени, что оно превышает порог того, что составляет редкое событие (так называемый альфа-уровень), считается, что тест Anova F отклоняет нулевую гипотезу о равных средних между тремя группами в в пользу альтернативной гипотезы о том, что по крайней мере одна из групп имеет большее среднее (которым в этом примере является группа A).

Устранение нарушения нормальности населения

Ранжирование - это одна из многих процедур, используемых для преобразования данных, которые не соответствуют предположениям о нормальности . Коновер и Иман представили обзор четырех основных типов преобразований рангов (RT). Один метод заменяет каждое исходное значение данных на его ранг (от 1 для наименьшего до N для наибольшего). Эта основанная на рангах процедура была рекомендована как устойчивая к аномальным ошибкам, устойчивая к выбросам и очень эффективная для многих распределений. Это может привести к известной статистике (например, к результатам ранжирования двух независимых выборок по сумме рангов Вилкоксона / U- критерию Манна-Уитни ) и обеспечивает требуемую надежность и повышенную статистическую мощность . Например, исследования методом Монте - Карло показали , что преобразование ранга в двух независимых выборок т-тест макет может быть успешно расширен на одну сторону независимых выборок ANOVA, а также два независимых выборок многомерный Хотеллинга T 2 раскладок Коммерческие статистические программные пакеты (например, SAS) последовали рекомендации для аналитиков данных по прогону их наборов данных через процедуру ранжирования (например, PROC RANK) до проведения стандартного анализа с использованием параметрических процедур.

Отказ ранжирования в факторном ANOVA и других сложных схемах

ANOVA по рангам означает, что стандартный дисперсионный анализ рассчитывается на основе данных, преобразованных по рангам . Также было предложено проведение факторного дисперсионного анализа по рангам исходных оценок. Однако исследования методом Монте-Карло и последующие асимптотические исследования показали, что ранговое преобразование не подходит для проверки эффектов взаимодействия в факторном плане 4x3 и 2x2x2. По мере того, как количество эффектов (т. Е. Основное, взаимодействие) становится ненулевым, и по мере увеличения величины ненулевых эффектов увеличивается ошибка типа I , что приводит к полному отказу статистики с таким высоким значением, как 100% вероятность принятия ложноположительного решения. Точно так же было обнаружено, что преобразование рангов все чаще терпит неудачу в макете двух зависимых выборок по мере увеличения корреляции между оценками до и после тестирования. Было также обнаружено, что проблема частоты ошибок типа I обострилась в контексте анализа ковариации, особенно по мере увеличения корреляции между ковариантой и зависимой переменной.

Преобразование рангов

Вариантом преобразования рангов является «квантильная нормализация», при которой к рангам применяется дополнительное преобразование, так что результирующие значения имеют определенное распределение (часто нормальное распределение с указанными средним значением и дисперсией). Дальнейший анализ нормированных по квантилю данных может затем предположить, что это распределение вычисляет значения значимости. Тем не менее, два конкретных типа вторичных преобразований, случайные нормальные оценки и преобразование ожидаемых нормальных оценок, как было показано, значительно увеличивают ошибки типа I и серьезно снижают статистическую мощность.

Нарушение гомоскедастичности

ANOVA по рангам никогда не рекомендовался, если исходное предположение об однородных дисперсиях было нарушено либо само по себе, либо в сочетании с нарушением предположения о нормальности популяции. В общем, ранговая статистика становится ненадежной в отношении ошибок типа I для отклонений от гомоскедастичности даже быстрее, чем параметрические аналоги, которые разделяют то же предположение.

Дальнейшая информация

Кепнер и Вакерли обобщили литературу, отметив, что «к концу 1980-х объем литературы по методам лучевой терапии быстро увеличивался по мере того, как появлялись новые идеи, как положительные, так и отрицательные, относительно полезности метода. Обеспокоенные тем, что методы лучевой терапии будут использоваться неправильно, Савиловский и др. (1989, стр. 255) предостерегали практиков, чтобы они избегали использования этих тестов «за исключением тех конкретных ситуаций, когда характеристики тестов хорошо известны». По словам Хеттманспергера и Маккина, «Савиловский (1990) дает превосходный обзор непараметрических подходов к тестированию на взаимодействие» в ANOVA.

Ноты