Тест дальности Тьюки - Tukey's range test

Диапазон тест Тьюки , также известный как тест Тьюков , метод Тьюков , честный тест значимости Тьюки , или HSD Тьюки ( честно значимая разница ) тест , является одностадийной множественным сравнением процедуры и статистическим тест . Его можно использовать для поиска средств, которые существенно отличаются друг от друга.

Названный в честь Джона Тьюки , он сравнивает все возможные пары средних и основан на стьюдентизированном распределении диапазонов ( q ) (это распределение похоже на распределение t из t- теста . См. Ниже).

Тест Тьюки сравнивает средства каждого лечения со средствами любого другого лечения; то есть он применяется одновременно к множеству всех попарных сравнений

и определяет любую разницу между двумя средними значениями, превышающую ожидаемую стандартную ошибку . Коэффициент достоверности для набора , когда все размеры выборки равны, точно для любого . Для неравных размеров выборки коэффициент достоверности больше 1 - α. Другими словами, метод Тьюки консервативен при неравных размерах выборки .

Предположения

  1. Проверяемые наблюдения независимы внутри групп и между ними.
  2. Группы, связанные с каждым средним в тесте, распределены нормально .
  3. Внутригрупповая дисперсия одинакова для всех групп, связанных с каждым средним значением в тесте ( однородность дисперсии ).

Статистика теста

Тест Тьюки основан на формуле, очень похожей на t- критерий. Фактически, тест Тьюки - это, по сути, t- тест , за исключением того, что он корректирует частоту ошибок в семье .

Формула теста Тьюки:

где Y A - большее из двух сравниваемых средних, Y B - меньшее из двух сравниваемых средних, а SE - стандартная ошибка суммы средних.

В этом Q сек значения можно сравнить с д значением из распределения стьюдентизированного диапазона . Если в Q сек значения больше , чем критическое значение д & alpha ;, полученной из распределения, два средства , как говорит , будет значительно отличаться на уровне .

Поскольку нулевая гипотеза для теста Тьюки утверждает, что все сравниваемые средние значения принадлежат одной и той же совокупности (т. Е. Μ 1 = μ 2 = μ 3 = ... = μ k ), средние должны быть нормально распределены (согласно центральной предельной теореме ). Это приводит к предположению о нормальности теста Тьюки.

Распределение стьюдентизированного диапазона ( q )

В методе Тьюки используется стьюдентизированное распределение диапазонов . Предположим, что мы берем выборку размера n из каждой из k популяций с одинаковым нормальным распределением N ( μ , σ 2 ) и предполагаем, что min - наименьшее из этих средних значений выборки, а max - наибольшее из этих средних значений выборки, и предположим, что S 2 - дисперсия объединенной выборки из этих выборок. Тогда следующая случайная величина имеет распределение по стьюдентизированному диапазону.

Это значение q является основой критического значения q , основанного на трех факторах:

  1. α ( частота ошибок типа I или вероятность отклонения истинной нулевой гипотезы)
  2. k (количество популяций)
  3. df (количество степеней свободы ( N  -  k ), где N - общее количество наблюдений)

Распределение q сведено в таблицу и фигурирует во многих учебниках по статистике. В некоторых таблицах распределение q представлено без фактора. Чтобы понять, что это за таблица, мы можем вычислить результат для k  = 2 и сравнить его с результатом t-распределения Стьюдента с теми же степенями свободы и тем же  α . Кроме того, R предлагает кумулятивную функцию распределения ( ) и функцию квантиля ( ) для  q . ptukeyqtukey

Пределы уверенности

Доверительные пределы Тьюки для всех парных сравнений с доверительной вероятностью не менее 1 - α равны

Обратите внимание, что точечная оценка и оценочная дисперсия такие же, как и для одиночного попарного сравнения. Единственное различие между доверительными границами для одновременных сравнений и доверительных интервалов для одного сравнения - это кратность оцененного стандартного отклонения.

Также обратите внимание, что размеры выборки должны быть одинаковыми при использовании подхода стьюдентизированного диапазона. - стандартное отклонение всего дизайна, а не только двух сравниваемых групп. Возможна работа с неравными объемами выборки. В этом случае необходимо вычислить оценочное стандартное отклонение для каждого попарного сравнения, как это было формализовано Клайдом Крамером в 1956 году, поэтому процедуру для неравных размеров выборки иногда называют методом Тьюки – Крамера, который выглядит следующим образом:

где n i и n j - размеры групп i и j соответственно. Также применяются степени свободы для всего дизайна.   

Смотрите также

Примечания

дальнейшее чтение

  • Монтгомери, Дуглас К. (2013). Дизайн и анализ экспериментов (восьмое изд.). Вайли. Раздел 3.5.7.

внешние ссылки