Тест дальности Тьюки - Tukey's range test

Диапазон тест Тьюки , также известный как тест Тьюков , метод Тьюков , честный тест значимости Тьюки , или HSD Тьюки ( честно значимая разница ) тест , является одностадийной множественным сравнением процедуры и статистическим тест . Его можно использовать для поиска средств, которые существенно отличаются друг от друга.

Названный в честь Джона Тьюки , он сравнивает все возможные пары средних и основан на стьюдентизированном распределении диапазонов ( q ) (это распределение похоже на распределение t из t- теста . См. Ниже).

Тест Тьюки сравнивает средства каждого лечения со средствами любого другого лечения; то есть он применяется одновременно к множеству всех попарных сравнений

{\ Displaystyle \ му _ {я} - \ му _ {j} \,}

и определяет любую разницу между двумя средними значениями, превышающую ожидаемую стандартную ошибку . Коэффициент достоверности для набора , когда все размеры выборки равны, точно для любого . Для неравных размеров выборки коэффициент достоверности больше 1 - α. Другими словами, метод Тьюки консервативен при неравных размерах выборки . ${\ displaystyle 1- \ alpha}$ ${\ Displaystyle 0 \ Leq \ альфа \ Leq 1}$

Предположения

Проверяемые наблюдения независимы внутри групп и между ними.
Группы, связанные с каждым средним в тесте, распределены нормально .
Внутригрупповая дисперсия одинакова для всех групп, связанных с каждым средним значением в тесте ( однородность дисперсии ).

Статистика теста

Тест Тьюки основан на формуле, очень похожей на $t-$ критерий. Фактически, тест Тьюки - это, по сути, $t-$ тест , за исключением того, что он корректирует частоту ошибок в семье .

Формула теста Тьюки:

{\ displaystyle q_ {s} = {\ frac {Y_ {A} -Y_ {B}} {SE}},}

где $Y$ _A - большее из двух сравниваемых средних, $Y$ _B - меньшее из двух сравниваемых средних, а SE - стандартная ошибка суммы средних.

В этом $Q сек$ значения можно сравнить с $д$ значением из распределения стьюдентизированного диапазона . Если в $Q сек$ значения больше , чем критическое значение $д & alpha$ ;, полученной из распределения, два средства , как говорит , будет значительно отличаться на уровне . ${\ Displaystyle \ альфа: 0 \ Leq \ альфа \ Leq 1}$

Поскольку нулевая гипотеза для теста Тьюки утверждает, что все сравниваемые средние значения принадлежат одной и той же совокупности (т. $Е. Μ$ ₁ = $μ$ ₂ = $μ$ ₃ = ... = $μ k$ ), средние должны быть нормально распределены (согласно центральной предельной теореме ). Это приводит к предположению о нормальности теста Тьюки.

Распределение стьюдентизированного диапазона ( q )

В методе Тьюки используется стьюдентизированное распределение диапазонов . Предположим, что мы берем выборку размера n из каждой из k популяций с одинаковым нормальным распределением N ( μ , σ ² ) и предполагаем, что _min - наименьшее из этих средних значений выборки, а _max - наибольшее из этих средних значений выборки, и предположим, что S ² - дисперсия объединенной выборки из этих выборок. Тогда следующая случайная величина имеет распределение по стьюдентизированному диапазону. ${\ displaystyle {\ bar {y}}}$ ${\ displaystyle {\ bar {y}}}$

{\ displaystyle q = {\ frac {{\ overline {y}} _ {\ max} - {\ overline {y}} _ {\ min}} {S {\ sqrt {2 / n}}}}}

Это значение q является основой критического значения q , основанного на трех факторах:

α ( частота ошибок типа I или вероятность отклонения истинной нулевой гипотезы)
k (количество популяций)
df (количество степеней свободы ( N - k ), где N - общее количество наблюдений)

Распределение q сведено в таблицу и фигурирует во многих учебниках по статистике. В некоторых таблицах распределение q представлено без фактора. Чтобы понять, что это за таблица, мы можем вычислить результат для k = 2 и сравнить его с результатом t-распределения Стьюдента с теми же степенями свободы и тем же α . Кроме того, R предлагает кумулятивную функцию распределения ( ) и функцию квантиля ( ) для q . ${\ displaystyle {\ sqrt {2}}}$ ptukeyqtukey

Пределы уверенности

Доверительные пределы Тьюки для всех парных сравнений с доверительной вероятностью не менее 1 - α равны

{\ displaystyle {\ bar {y}} _ {i \ bullet} - {\ bar {y}} _ {j \ bullet} \ pm {\ frac {q _ {\ alpha; k; Nk}} {\ sqrt { 2}}} {\ widehat {\ sigma}} _ {\ varepsilon} {\ sqrt {\ frac {2} {n}}} \ qquad i, j = 1, \ ldots, k \ quad i \ neq j. }

Обратите внимание, что точечная оценка и оценочная дисперсия такие же, как и для одиночного попарного сравнения. Единственное различие между доверительными границами для одновременных сравнений и доверительных интервалов для одного сравнения - это кратность оцененного стандартного отклонения.

Также обратите внимание, что размеры выборки должны быть одинаковыми при использовании подхода стьюдентизированного диапазона. - стандартное отклонение всего дизайна, а не только двух сравниваемых групп. Возможна работа с неравными объемами выборки. В этом случае необходимо вычислить оценочное стандартное отклонение для каждого попарного сравнения, как это было формализовано Клайдом Крамером в 1956 году, поэтому процедуру для неравных размеров выборки иногда называют методом Тьюки – Крамера, который выглядит следующим образом: ${\ displaystyle {\ widehat {\ sigma}} _ {\ varepsilon}}$

{\ displaystyle {\ bar {y}} _ {i \ bullet} - {\ bar {y}} _ {j \ bullet} \ pm {\ frac {q _ {\ alpha; k; Nk}} {\ sqrt { 2}}} {\ widehat {\ sigma}} _ {\ varepsilon} {\ sqrt {{\ frac {1} {n}} _ {i} + {\ frac {1} {n}} _ {j} }} \ qquad}

где n _i и n _j - размеры групп i и j соответственно. Также применяются степени свободы для всего дизайна.

Смотрите также

Примечания

дальнейшее чтение

Монтгомери, Дуглас К. (2013). Дизайн и анализ экспериментов (восьмое изд.). Вайли. Раздел 3.5.7.

внешние ссылки

Электронный справочник статистических методов NIST / SEMATECH: метод Тьюки

Languages

In other projects