Дисперсионный анализ - Analysis of variance


Из Википедии, свободной энциклопедии

Дисперсионный анализ ( ANOVA ) представляет собой совокупность статистических моделей и связанных с ними процедур оценки (таких , как «вариации» среди и между группами) используется для анализа различий между группой средств в образце . ANOVA был разработан статистиком и эволюционной биологии Рональда Фишера . В условиях ANOVA, наблюдаемая дисперсия в том или ином переменном разбиваются на компоненты , относящиеся к различным источникам вариации. В своей простейшей форме, ANOVA обеспечивает статистический тест ли население означает несколько групп равны, и , следовательно , обобщающий т-TEST более двух групп. ANOVA полезно для сравнения (тестирования) три или более группы средств для статистической значимости . Это концептуально подобно несколько из двух образцов т-тестов , но является более консервативным, что приводит к меньшему количеству типа I ошибки , и, следовательно , подходит для широкого круга практических задач.

содержание

история

В то время как дисперсионный анализ достиг плоды в 20 - м веке, прошлое простираться веков в прошлое согласно Стиглер. Они включают в себя проверку гипотезы, разбиение сумм квадратов, экспериментальных методик и аддитивная модель. Лаплас выполнял проверку гипотезы в 1770. Разработка методов наименьших квадратов Лапласа и Гаусса около 1800 предложен усовершенствованный способ объединения наблюдений (над существующей практикой затем используются в астрономии и геодезии). Он также инициировал много исследования вкладов сумм квадратов. Лапласа знал , как оценить дисперсию от остаточного (а не общих) сумм квадратов. К 1827, Лапласа использует наименьших квадратов методы для решения проблем ANOVA относительно измерений атмосферных приливов. До 1800 года , астрономы выделяли ошибки наблюдений в результате времени реакции (в « личное уравнении ») , и были разработаны методы снижения ошибок. Экспериментальные методы , используемые в исследовании личного уравнения были впоследствии приняты новой областью психологии, разработанной сильными (факторный) экспериментальные методы , к которым рандомизации и ослепления скоро добавлены. Красноречивое нематематическое объяснение модели аддитивных эффектов было доступно в 1885 году.

Рональд Фишер ввел термин дисперсию и предложил свой формальный анализ в 1918 статье Корреляции между родственниками по Предположени- менделирующего наследования . Его первое применение дисперсионного анализа был опубликован в 1921 году анализа дисперсии стали широко известны после включения в 1925 г. книги Фишера Статистические методы для научных работников .

Модели рандомизации были разработаны несколькими исследователями. Первый из них был опубликован на польском на Ежи Нейман в 1923 году.

Одним из атрибутов ANOVA, обеспечивших его ранняя популярность была вычислительная элегантностью. Структура аддитивной модели позволяет решение для коэффициентов аддитивных по простой алгебре, а не с помощью матричных вычислений. В эпоху механических калькуляторов эта простота была критической. Определение статистической значимости также необходим доступ к таблицам функции F, которые были поставлены на ранних текстах статистики.

Мотивирование пример

Не подходит.
ярмарка подходит
Очень хорошо подходит

Дисперсионный анализ может быть использован в качестве исследовательского инструмента для объяснения наблюдений. Выставка собак является хорошим примером. Выставка собак не является случайной выборки породы: это , как правило , ограничивается собак , которые являются взрослые, чистопородный, и в качестве примера. Гистограмма веса собаки из шоу может правдоподобно быть довольно сложным, как и распределение желто-оранжевого цвета , показанного на иллюстрациях. Предположим , мы хотим предсказать , вес собаки , основываясь на определенном наборе характеристик каждой собаки. Один из способов сделать это, чтобы объяснить распределение веса путем деления населения собаки на группы на основе этих характеристик. Успешная группировка будет разделить собак , такие , что (а) каждая группа имеет низкую дисперсию веса собак (то есть группа является относительно однородным) и (б) средняя каждой группы отличается (если две группы имеют одинаковое среднее значение, то оно не разумно сделать вывод о том , что группы, на самом деле, отдельно любым значащим способом).

На рисунках справа, группы идентифицированы как X 1 , X 2 и т.д. В первой иллюстрации, собаки делятся в зависимости от продукта (взаимодействия) два двоичных групп: молодых противами старого, и короткошерстные против длинного -haired (например, группа 1 молоды, короткошерстные собаки, группа 2 молоды, длинношерстные собаки и т.д.). Поскольку распределения веса собаки в каждой из групп (показанных синим цветом) имеет относительно большую дисперсию, и так как средство очень похожи между группами, группировка собак по этим характеристикам не дает эффективный способ , чтобы объяснить изменение веса собаки зная , какая группа собака в не позволяет прогнозировать его вес намного лучше , чем просто зная собаку в выставке собак. Таким образом, эта группировка не может объяснить различия в общем распределении (желто-оранжевый).

Попытка объяснить распределение веса путем группировки собак в качестве домашних животных против рабочей породы и менее спортивных против более спортивного , вероятно , будет несколько более успешной (справедливая формой). Самые тяжелые шоу собаки, вероятно, будут большие, сильные, рабочие породы, а породы держали в качестве домашних животных , как правило, меньше , и , следовательно , легче. Как показано на втором рисунке, то есть распределение отклонений, которые значительно меньше , чем в первом случае, и средства являются более различимыми. Тем не менее, значительное совпадение распределений, например, означает , что мы не можем отличить X 1 и X 2 надежно. Группировка собак в соответствии с койнфлипом может производить распределения , которые выглядят одинаково.

Попытка объяснить вес породы, скорее всего, производят очень хорошее прилегание. Все чихуахуа свет и все St Бернардс тяжелы. Различие в массах между сеттеров и пойнтеров не оправдывает отдельных пород. Дисперсионный анализ дает формальные инструменты, чтобы оправдать эти интуитивные суждения. Обычное использование метода является анализ экспериментальных данных, разработка моделей. Этот метод имеет ряд преимуществ по сравнению с корреляцией: не все данных должны быть числовыми и один результатом методы является суждением в уверенности в объяснительных отношениях.

Справочная информация и терминология

ANOVA является формой статистической проверки гипотез широко используется при анализе экспериментальных данных. Результат теста (рассчитывается от нулевой гипотезы и образец) называется статистически значимым , если это считается маловероятным, что произошло случайно, предполагая истинность нулевой гипотезы . Статистически значимый результат, если вероятность ( р -значение ) меньше , чем заранее заданный порог (уровень значимости), оправдывает отказ от нулевой гипотезы , но только тогда , когда априорная вероятность нулевой гипотезы не является высокой.

В типичном применении ANOVA, нулевая гипотеза состоит в том, что все группы случайные выборки из одной и той же популяции. Например, при изучении влияния различных методов лечения на аналогичных образцах пациентов, нулевая гипотеза будет то, что все процедуры имеют тот же эффект (возможно, отсутствует). Отклонение нулевой гипотезы принимается в виду, что различия в наблюдаемых эффектах между группами лечения вряд ли из-за случайности.

По построению, проверка гипотез ограничивает скорость ошибок I типа (ложные срабатывания) на уровень значимости. Экспериментаторы также хотят ограничить ошибки типа II (ложные негативы). Скорость ошибок типа II в значительной степени зависит от размера образца (скорость больше , для небольших образцов), уровня значимости (когда стандарт доказательства высок, шансы с видом на открытие также высоки) и величину эффекта (меньшего размера эффекта более склонны к типу II ошибки).

Терминология ANOVA в основном из статистического планирования экспериментов . Экспериментатор регулирует факторы и меры реагирования в попытке определить эффект. Факторы , которые назначены экспериментальные установки с помощью комбинации рандомизации и блокировки , чтобы обеспечить достоверность результатов. Ослепление держит беспристрастное взвешивание. Ответы показывают изменчивость, которая частично является результатом эффекта и частично случайной ошибкой.

ANOVA является синтезом нескольких идей и используются для различных целей. Как следствие, трудно определить сжато или точно.

«Классическая» ANOVA для сбалансированных данных делает три вещи одновременно:

  1. Как исследовательский анализ данных , дисперсионный анализ использует собой разложение данных присадка, и его сумма квадратов показывает дисперсию каждого компонента разложения (или, что эквивалентно, каждый набор условий линейной модели).
  2. Сравнения средних квадратов, наряду с F -тестом  ... позволяют тестировать вложенную последовательность моделей.
  3. Тесно связана с ANOVA представляет собой линейную модель согласуется с оценками коэффициентов и стандартных ошибок.

Короче говоря, ANOVA представляет собой статистический инструмент, используемый несколько способов, чтобы разработать и утвердить объяснение наблюдаемых данных.

Дополнительно:

  1. Это вычислительно элегантный и относительно устойчив к нарушениям его предположений.
  2. Дисперсионный анализ обеспечивает сильный (многократный сравнение образца) статистический анализ.
  3. Она была адаптирована к анализу различных экспериментальных конструкций.

В результате: ANOVA «уже давно пользуется статусом быть наиболее часто используемых (некоторые говорят, злоупотреблял) статистический метод в психологическом исследовании.» ANOVA «вероятно, наиболее полезный метод в области статистического вывода.»

ANOVA трудно научить, особенно для сложных экспериментов, с разделенным сюжетом конструкции является пресловутым. В некоторых случаях правильное применение метода лучше всего определяется задачей распознавания образов с последующим консультацией классического авторитетного теста.

Дизайн-оф-экспериментов термины

(Сгущенное от "NIST Engineering Статистика Handbook":. Раздел 5.7 Глоссарий DOE терминологии.)

Сбалансированный дизайн
Экспериментальный дизайн, где все клетки (т.е. комбинации лечения) имеют одинаковое число наблюдений.
блокировка
График проведения лечения комбинации в экспериментальном исследовании, что любые эффекты на экспериментальных результаты из-за известное изменение сырья, операторы, машины и т.д., концентрируется в уровнях блокировки переменного. Причина блокировки является изоляция системного эффекта и предотвратить его затенение основных эффектов. Блокировка достигается за счет ограничения рандомизации.
дизайн
Набор экспериментальных прогонов, который позволяет подгонку конкретной модели и оценку эффектов.
DOE
Дизайн экспериментов. Подход к решению проблем с участием сбора данных, которые будут поддерживать в силе, оправданные и обоснованные выводы.
эффект
Как изменения настроек фактора изменяет реакцию. Эффект одного фактора также называют основной эффект.
ошибка
Необъяснимое изменение в коллекции наблюдений. МЭ обычно требуют понимания как случайной ошибки и отсутствие пригонки ошибки.
Экспериментальная установка
Юридическое лицо, к которому применяется конкретное комбинированное лечение.
факторы
Процесс входа, который манипулирует исследователь, чтобы вызвать изменение выходного сигнала.
Недостаток-в-форме ошибки
Ошибка, которая возникает, когда анализ не включает одну или несколько важных условий или факторов, от модели процесса. В том числе репликация в УОО допускает разделение экспериментальной ошибки в ее компоненты: отсутствие прилегания и случайной (чистая) ошибки.
модель
Математическая зависимость, которая относится изменения в заданном ответ на изменения одного или нескольких факторов.
случайная ошибка
Ошибка, что происходит из-за естественные вариации в процессе. Случайные ошибки, как правило, предполагается, что нормальное распределение с нулевым средним и постоянной дисперсией. Случайная ошибка также называется ошибкой эксперимента.
Случайность
График распределения обработки материала и для проведения лечения в комбинации ЕГО таким образом, что условия в один прогоне ни зависят от условий предыдущего запуска, ни предсказать условия в последующих запусках.
копирование
Выполнение такой же комбинированное лечение более чем один раз. В том числе репликации позволяет оценку случайной ошибки независимо от любого недостатка пригонки ошибки.
Ответы
Выход (ы) процесса. Иногда называется зависимой переменной (s).
лечение
Лечение представляет собой специфическое сочетание уровней факторов, действие которых должно быть по сравнению с другими способами лечения.

Классы моделей

Есть три класса моделей, используемых при анализе дисперсии, и они описаны здесь.

Модели с фиксированными эффектами

Модель фиксированных эффектов (класс I) , из дисперсионного анализа относится к ситуациям , в которых экспериментатор относится один или несколько процедуры для субъектов эксперимента , чтобы убедиться в том , что переменная отклике изменить значение. Это позволяет экспериментатору оценить диапазоны значений переменных отклика , что лечение будет генерировать в популяции в целом.

модели случайных эффектов

Случайные эффекты модель (класс II) используется , когда лечение не являются фиксированными. Это происходит , когда различные уровни фактора оцифровываются с большим населением. Поскольку сами уровни являются случайными величинами , некоторые предположений и метод контрастных процедур (мульти-переменным обобщение простых различий) отличается от модели фиксированных эффектов.

модели смешанных эффектов

Смешанные эффекты модель (класс III), приведена экспериментальные факторы как стационарные, так и со случайными эффектами типов, с соответствующим различными интерпретациями и анализом для этих двух типов.

Пример: Учебные эксперименты могут быть выполнены в отделении колледжа или университета, чтобы найти хороший вводный учебник, с каждым текст считается лечением. Модель с фиксированными эффектами будет сравнить список текстов кандидатов. Модель случайных эффектов будет определить, существуют ли существенные различия между списком случайно выбранных текстов. Модель смешанных эффектов будет сравнивать (фиксировано) возложенные тексты произвольно выбранных альтернатив.

Определение фиксированное и случайные эффекты оказались призрачными, с конкурирующими определениями, возможно, ведущими к лингвистической трясине.

Предположения

Дисперсионный анализ был изучен из нескольких подходов, наиболее распространенные из которых использует линейную модель , которая связывает реакцию на лечение и блоки. Обратите внимание , что модель линейна по параметрам , но может быть нелинейными по уровням факторов. Интерпретация легко , когда данные сбалансирован по факторам , но гораздо более глубокое понимание необходимо для несбалансированных данных.

Анализ Учебник с использованием нормального распределения

Дисперсионный анализ может быть представлен в терминах линейной модели , что делает следующие предположения относительно распределения вероятностей ответов:

Отдельные предположения модели учебника предполагают , что ошибки независимо друг от друга, одинаково, и распределены нормально для моделей с фиксированными эффектами, то есть, что ошибки ( ) независимы и

Рандомизация на основе анализа

В рандомизированном контролируемом эксперименте , лечение случайным образом назначены экспериментальные установки, после экспериментального протокола. Эта рандомизация цели и объявлено до эксперимента проводятся. Цель случайного присваивания используются для проверки значимости нулевой гипотезы, следуя идеи Пирса и Рональд Фишер . Этот анализ проекта на основе был обсужден и разработан Фрэнсис Дж Анскомбы на опытной станции Rothamsted и Oscar Кемпторна в Университете штата Айова . Kempthorne и его студенты делают предположение блока обработка аддитивности , который обсуждается в книгах Кемпторна и Дэвид Р. Кокс .

Блок обработки аддитивности

В своей простейшей форме, предположение блок обработки аддитивности утверждает , что наблюдаемый отклик от экспериментальной установки при получении лечения можно записать в виде суммы ответа аппарата и лечение эффекта , то есть

Допущение блок обработки аддитивности следует , что для любого лечения , то го лечения имеет точно такой же эффект на каждом эксперименте единицы.

Предположение блок обработки аддитивности , как правило , не может быть непосредственно фальсифицировано , в соответствии с Коксом и Кемпторном. Тем не менее, многие последствия лечебно-единичном аддитивности могут быть фальсифицированы. Для рандомизированного эксперимента предположение блок обработки аддитивности означает , что дисперсия постоянна для всех видов лечения. Таким образом, с помощью противопоставления , необходимое условие для блока обработки аддитивности является то , что дисперсия постоянна.

Использование блока обработки аддитивности и рандомизации аналогична конструкции логического вывода на основе , которая является стандартом в конечно-популяции выборки обследования .

Производная линейная модель

Kempthorne использует рандомизацию-распределение и предположение блок обработки аддитивности для получения производной линейной модели , очень похожей на модель учебника обсуждался ранее. Испытуемые статистики этой производной линейная модели тесно аппроксимировать тестовые статистиками соответствующей нормальной линейной модели, в соответствии с теоремой аппроксимации и исследованиями моделирования. Однако, существует различие. Так , например, рандомизации на основе результатов анализа в небольшой , но (строго) отрицательной корреляции между наблюдениями. При анализе рандомизации на основе, нет никакого предположения о нормальном распределении и , конечно , не допущения о независимости . Напротив, наблюдения зависят !

Анализ рандомизации на основе имеет тот недостаток, что его экспозиция включает в себя утомительную алгебру и значительное время. Поскольку анализ рандомизации на основе сложна и тесно сближены подходом с использованием обычной линейной модели, большинство учителей подчеркивают нормальный линейный модельный подход. Немного статистики возражают против модели на основе анализа сбалансированных рандомизированных экспериментов.

Статистические модели для данных наблюдений

Однако, когда применяется к данным из нерандомизированных экспериментов или исследований наблюдений , основанный на модели анализа не хватает ордера на рандомизации. Для данных наблюдений, вывод доверительных интервалов необходимо использовать субъективные модели, как подчеркнул Р. Фишер и его последователями. На практике оценка лечения побочных эффектов от наблюдательных исследований , как правило, часто противоречива. На практике, «статистические модели» и данные наблюдений полезны предложившие гипотезы , которые следуют рассматривать очень осторожно со стороны общественности.

Резюме предположений

Нормальная модель на основе анализа ANOVA предполагает независимость, нормальность и однородность дисперсий остатков. Анализ рандомизации на основе предполагает только однородность дисперсий остатков (как следствие блок обработки аддитивности) и использует процедуру рандомизации эксперимента. Оба эти анализы требуют гомоскедастичности , как предположение для анализа нормальной модели и , как следствие рандомизации и аддитивности для анализа рандомизации основы.

Тем не менее, исследование процессов, изменяющих отклонения , а не средства ( так называемое дисперсионными эффекты) было успешно проведено с использованием ANOVA. Там нет нет необходимых допущений для ANOVA в полной общности, но F -test используется для проверки гипотезы ANOVA имеет предположение и практические ограничения , которые имеют постоянный интерес.

Проблемы , которые не удовлетворяют условия ANOVA часто могут быть преобразованы , чтобы удовлетворить условия. Свойство блока обработка аддитивности не инвариантно относительно «изменения масштаба», так что статистики часто используют преобразования для достижения элементарной обработки аддитивности. Если переменная отклика будут следовать параметрическому семейству вероятностных распределений, то статистик может указывать (в протоколе для эксперимента или наблюдательного исследования) , что ответы будут преобразованы , чтобы стабилизировать дисперсию. Кроме того , статистик может определить , что логарифмические преобразования применяются к ответам, которые , как полагают следовать мультипликативные моделям. Согласно Коши функционального уравнения теоремы, то логарифм является единственным непрерывным преобразованием , которое превращает реальное умножение в дополнение.

Характеристики

Дисперсионный анализ используется в анализе сравнительных экспериментов, в которых только разница в результатах представляет интерес. Статистическая значимость эксперимента определяется отношением двух дисперсий. Это соотношение не зависит от нескольких возможных изменений в экспериментальных наблюдения: Добавление постоянная для всех наблюдений не изменяет значение. Умножив все наблюдения на константу не изменяет значение. Так ANOVA статистический результат значение не зависит от постоянного смещения и масштабирования ошибок, а также единиц измерения , используемых в выражении наблюдений. В эпохе механического расчета было принято вычесть константу из всех наблюдений (когда эквивалентно сбросив ведущие цифры) для упрощения ввода данных. Это является примером данных кодирования .

логика

Расчеты ANOVA можно охарактеризовать как вычисление количества средних значений и дисперсии, деление двух дисперсий и сравнивая отношение к значению справочника для определения статистической значимости. Вычисление лечебного эффекта является то тривиальным, «эффект любого лечения оценивается как разность между средним значением наблюдений, которые получают лечение и общее среднее».

Разбиение суммы квадратов

ANOVA использует традиционную стандартизацию терминологии. Определительное уравнение образца дисперсии является , где делитель называется степени свободы (DF), суммирование называется суммой квадратов (SS), то результат называется средним квадратом (МС) и квадраты терминов являются отклонением от выборочное среднее. Дисперсионный анализ оценивает 3 образец дисперсии: в общей дисперсии на основе всех отклонений наблюдений от общего среднего, в дисперсии ошибки на основе всех отклонений наблюдений от их соответствующих средств лечения, а также лечение дисперсии. Дисперсии лечения основана на отклонениях лечения средства от общего среднего, результат умножается на числе наблюдений в каждой обработке , чтобы учесть разность между дисперсией наблюдений и дисперсией средств.

Фундаментальный метод является разбиение общей суммы квадратов SS на компоненты , связанные с эффектами , используемых в модели. Например, модель для упрощенного ANOVA с одним типом лечения на разных уровнях.

Число степеней свободы DF может быть разделена таким же образом: один из этих компонентов (что для ошибок) определяет хи-квадрат распределение , которое описывает соответствующую сумму квадратов, в то время как то же самое верно и для «лечения» , если есть нет эффекта лечения.

Смотрите также Lack-в-форме суммы квадратов .

F -test

F -test используется для сравнения факторов общего отклонения. Например, в одном направлении, или однофакторного ANOVA, статистическая значимость проверяется путем сравнения для тестовой статистики F

где MS является средний квадрат, = число обработок и = общее число случаев

к F -распределения с , степенями свободы. Использование F -распределения является естественным кандидатом , потому что тестовая статистика представляет собой отношение два масштабированных суммы квадратов , каждый из которых следует масштабированным х-квадрат распределение .

Ожидаемое значение F является (где п является обработка размера выборки) , который равен 1 для лечения без эффекта. Поскольку значения F увеличение выше 1, то доказательство становится все более несовместимым с нулевой гипотезой. Два очевидные экспериментальные методы повышения F увеличивают размер выборки и уменьшая дисперсию ошибок с помощью плотного экспериментального контроля.

Есть два способа заключения тестов гипотезы ANOVA, оба из которых производят один и тот же результат:

  • Метод учебника сравнить наблюдаемое значение F с критическим значением F определяется из таблиц. Критическое значение F является функцией от степеней свободы числителя и знаменателя , и уровня значимости (а). Если F ≥ F Critical , нулевая гипотеза отвергается.
  • Метод компьютера вычисляет вероятность (р-значение) значения F, большего или равного наблюдаемую величину. Нулевая гипотеза отвергается, если эта вероятность меньше или равен уровню значимости (а).

ANOVA F -test , как известно, почти оптимальным в смысле минимизации ложных отрицательных ошибок при фиксированной скорости ложных положительных ошибок (т.е. максимальной мощности при фиксированном уровне значимости). Например, чтобы проверить гипотезу о том , что различные медицинские процедурах имеют точно такой же эффект, F -TEST «ы р -значение близко аппроксимирует тест перестановок » ы р-значения : приближение особенно близко , когда конструкция является сбалансированной. Такие тесты перестановки характеризуют тесты с максимальной мощностью против всех альтернативных гипотез , как заметили Розенбаум. ANOVA F -test (от нулевой гипотезы , что все процедуры имеют точно такой же эффект) рекомендуется в качестве практического теста, из - за своей надежности против многих альтернативных распределений.

Расширенная логика

Дисперсионный анализ состоит из отдельных частей; источники Разбиение дисперсии и проверки гипотез могут быть использованы по отдельности. ANOVA используется для поддержки других статистических инструментов. Регрессионный сначала используются, чтобы соответствовать более сложным моделям данных, то дисперсионный анализ используется для сравнения моделей с целью выбора простых моделей (R), которые адекватно описывают данные. «Такие модели могут быть стройным без каких-либо ссылок на ANOVA, но ANOVA инструменты, то можно было бы использовать, чтобы сделать какой-то смысл подобранными моделей, а также для проверки гипотез о партиях коэффициентов.» «[W] е думать дисперсионный анализ как способ понимания и структурирования многоуровневых моделей, не в качестве альтернативы регрессии, но в качестве инструмента для обобщения сложного многомерного умозаключения ...»

Для одного фактора

Простейший эксперимент подходит для анализа ANOVA является полностью рандомизированным экспериментом с одним фактором. Более сложные эксперименты с одного фактора связаны с ограничениями на рандомизации и включают в себя полностью рандомизированные блоки и латинские квадраты (и варианты: греко-латинских квадратов и т.д.). Более сложные эксперименты имеют много сложностей множество факторов. Относительно полное обсуждение анализа (моделей, резюме данных, ANOVA таблица) в полностью рандомизированном эксперименте доступно .

При наличии нескольких факторов

ANOVA обобщается на изучение эффектов нескольких факторов. Когда эксперимент включает наблюдения на всех комбинациях уровней каждого фактора, его называют факториала . Факторные эксперименты являются более эффективными , чем ряд отдельных экспериментов фактора и эффективность растет как число факторов возрастают. Следовательно, факторные конструкции активно используются.

Использование дисперсионного анализа для изучения влияния нескольких факторов имеет осложнение. В 3-дисперсионном анализе с факторами х, у и г, модель дисперсионного анализа включает в себя условия для главных эффектов (х, у, z) и условий для взаимодействия (х, хг, уг, XYZ). Все условия требуют проверки гипотез. Распространение условий взаимодействия увеличивает риск того, что некоторые испытания гипотезы произведет ложный положительный результат случайно. К счастью, опыт говорит о том, что высокие взаимодействия порядка редки. Способность обнаруживать взаимодействия является одним из основных преимуществ множественного коэффициента ANOVA. Тестирование одного фактора , в то время скрывает взаимодействия, но , по- видимому производит противоречивые результаты эксперимента.

Следует с осторожностью при встрече взаимодействия; Условия испытания взаимодействия первого и расширить анализ за пределами ANOVA, если взаимодействия найдены. Тексты различаются по их рекомендации относительно продолжения процедуры ANOVA после встретив взаимодействия. Взаимодействие усложняет интерпретацию экспериментальных данных. Ни расчеты значимости, ни предполагаемые эффекты лечения не могут быть приняты по номинальной стоимости. «Значительное взаимодействие часто маскирует значение основных эффектов.» Графические методы рекомендуются для улучшения понимания. Регресс часто бывает полезно. Продолжительное обсуждение взаимодействий доступно в Cox (1958). Некоторые взаимодействия могут быть удалены (преобразования), тогда как другие не могут.

Различные методы используются с несколькими факторного дисперсионного анализа для снижения затрат. Один метода , используемый в факторных конструкциях является минимизация репликации (возможно , не репликации с поддержкой аналитической хитрости ) и объединять группы , когда обнаруживаются эффекты статистически (или практически) незначительны. Эксперимент со многими незначительными факторами может разрушиться в один с несколькими факторами , поддерживаемых многими повторениями.

Работали числовые примеры

Многочисленные полностью работали численные примеры доступны в стандартных учебниках и в Интернете. Простой случай использует одну сторону (один фактор) анализ.

Связанный анализ

Некоторый анализ необходим для поддержки проектирования эксперимента , а другой анализ выполняется после того, как изменения в факторах , формально нашел для получения статистически значимых изменений в ответах. Поскольку экспериментирование является итеративным, результаты одного эксперимента изменить планы на следующие эксперименты.

Подготовительный анализ

Количество экспериментальных установок

При проектировании эксперимента, число экспериментальных единиц планируются удовлетворить цели эксперимента. Экспериментирование часто последовательное.

Ранние эксперименты часто предназначены для обеспечения среднее непредвзятых оценок результатов лечения и экспериментальной ошибки. Последующие эксперименты часто предназначены для проверки гипотезы о том, что лечебный эффект имеет важное величину; в этом случае число экспериментальных единиц выбираются так, что эксперимент в рамках бюджета и имеет достаточную мощность, среди других целей.

Отчетность Анализ размера образца, как правило, требуется в психологии. «Предоставление информации о размере выборки и процессе, который привел к образцу решений размера.» Анализ, который написан в экспериментальном протоколе до проведения эксперимента, рассматривается в грантовых заявок и административных советов по рассмотрению.

Помимо анализа мощности, существует менее формальные методы для выбора количества экспериментальных единиц. Они включают в себя графические методы, основанные на ограничении вероятность ложных отрицательных ошибок, графические методы, основанные на ожидаемое увеличение вариации (выше остатков) и методов, основанных на достижении желаемого доверительного интервала.

анализ мощности

Анализ питания часто применяется в контексте ANOVA, чтобы оценить вероятность успешного отвергнуть нулевую гипотезу , если мы предполагаем некоторую ANOVA дизайн, размер эффекта в популяции, размер выборки и значение уровня. Анализ мощности может помочь в разработке дизайна исследований позволяют определить , какой размер выборки будет необходимо для того , чтобы иметь реальный шанс отвергнуть нулевую гипотезу , когда альтернативная гипотеза верна.

размер эффекта

Некоторые стандартизированные меры эффекта были предложены для ANOVA резюмировать прочность связи между предиктором (ами) и зависимым переменным или общей стандартизированной разностью полной модели. Оценки Стандартизированного эффекта размера облегчают сравнение результатов различных исследований и дисциплин. Однако, в то время как стандартные размеры эффекта, как правило, используются в большей части профессиональной литературы, нестандартизированная мера величины эффекта, который имеет сразу «значимые» единицы могут быть предпочтительнее для целей отчетности.

Последующий анализ

Это всегда целесообразно, чтобы тщательно рассмотреть выбросы. Они оказывают непропорционально большое влияние на статистические выводы и часто являются результатом ошибок.

подтверждение модели

Это разумно , чтобы проверить , что предположения ANOVA были выполнены. Остаточные рассмотрены или проанализирован для подтверждения гомоскедастичности и валовой нормальности. Остаточные должны иметь вид (нулевой среднее нормальное распределение) шум при построении графика в зависимости от времени что - либо в том числе и смоделированных значений данных. Тенденции намекают на взаимодействиях между факторами или среди наблюдений. Одно правило: «Если наибольший стандартное отклонение меньше , чем в два раза наименьшее стандартное отклонение, мы можем использовать методы , основанные на предположении о равной стандартных отклонений , и наши результаты будут еще приблизительно правильно»

Последующие тесты

Статистически значимый эффект в ANOVA часто следует с одной или более различными последующими испытаниями. Это может быть сделано для того , чтобы оценить , какие группы отличаются от которых других групп или для тестирования различных других сфокусированных гипотез. Последующие тесты часто отличаются с точки зрения того, являются ли они планировали ( априори ) или постфактум . Плановые испытания определяются , прежде чем посмотреть на данные и после специальных тестов выполняются после просмотра данных.

Часто один из «лечения» не имеется, поэтому группа лечения может выступать в качестве контроля. Тест Даннета (модификация т -TEST) испытания , имеет ли каждый из других групп лечения такое же среднее значение в качестве контроля.

Постфактум тесты , такие как тест диапазона Тьюки наиболее часто сравнивать каждую группу означает , с любой другой группой среднего и обычно включают некоторый метод контроля за I типа ошибок. Сравнения, которые обычно планируются, может быть простым или составным. Простые сравнения сравнить одна группа означает , с одной другой группой среднего. Сложные сравнения , как правило , сравнить два набора групп означает , где один набор состоит из двух или более групп (например, сравнить среднюю группу означает группу А, В и С с группой D). Сравнения могут также посмотреть на тестах тенденции, такие как линейные и квадратичные отношений, когда независимая переменная включает в себя упорядоченные уровни.

После ANOVA с тестами множественного сравнения парного была подвергнута критике по нескольким причинам. Есть много таких тестов (10 в одной таблице) и рекомендации по их использованию неопределенны или противоречивы.

Учебные проекты

Есть несколько типов ANOVA. Многие статистики основывают ANOVA на разработке эксперимента , особенно по протоколу , который определяет случайное назначение процедур субъектов; Описание указанного протокола о механизме назначения должно включать спецификацию структуры лечения и любую блокировки . Кроме того , общий для применения ANOVA к данным наблюдений с использованием соответствующей статистической модели.

Некоторые популярные конструкции используют следующие типы ANOVA:

  • Односторонний ANOVA используется для проверки различий между двумя или более независимыми группами (средства), например , различные уровни применения мочевины в культуре, или различных уровней действия антибиотика на нескольких различных видов бактерий, или различные уровни влияния некоторой медицины по группам пациентов. Однако, если эти группы не быть независимыми, и есть порядок в группах (например, легкая, средняя и тяжелая болезнь), или в дозе лекарственного средства (например, 5 мг / мл, 10 мг / мл, 20 мг / мл) приведены в той же группе пациентов, то оценка линейного тренда следует использовать. Как правило, однако, односторонний ANOVA используется для проверки различий между по крайней мере , три групп, так как в случае два группы может быть покрыт т-тестом . Когда есть только два средства для сравнения, то Т-тест и дисперсионный анализ F -test эквивалентны; соотношение между ANOVA и т задается F  =  T 2 .
  • Факторный ANOVA используется , когда экспериментатор хочет изучить эффекты взаимодействия между процедурами.
  • Повторные меры ANOVA используются , когда одни и те же предметы используются для каждой обработки (например, в продольном исследовании ).
  • Многофакторный дисперсионный анализ (MANOVA) используется при наличии более одной переменной отклика .

Предостережения

Сбалансированные эксперименты (те с равным размером выборки для каждой обработки) относительно легко интерпретировать; Несбалансированные эксперименты предлагают больше сложности. Для одного-фактора ( в одну сторону) ANOVA, корректировка для несбалансированного данных легко, но неуравновешенный анализ недостатков как надежность и мощность. Для более сложных конструкций отсутствие баланса приводит к дальнейшим осложнениям. «Свойство ортогональности главных эффектов и взаимодействий , присутствующих в сбалансированных данных не переносится в несбалансированном случай. Это означает , что обычный анализ методик дисперсии не применяется. Следовательно, анализ неуравновешенных факториалов намного сложнее , чем для сбалансированного конструкции «. В общем случае, «Анализ дисперсии также может быть применен к несбалансированным данным, но тогда суммы квадратов, средних квадратов, и F -ratios будут зависеть от порядка , в котором рассматривается источники вариации.» Простейшие методы обработки неуравновешенных восстановления данных баланса либо выбрасывая данных или путем синтеза недостающих данных. Более сложные методы используют регрессию.

Дисперсионный анализ (частично) испытание статистической значимости. Американская Психологическая Ассоциация придерживается той точки зрения, что просто представления статистической значимости является недостаточным и отчетности доверительные границы является предпочтительным.

В то время как дисперсионный анализ является консервативным (в поддержании уровня значимости) против множественных сравнений в одном измерении, это не является консервативным против сравнений в нескольких измерениях.

Обобщения

ANOVA считается частным случаем линейной регрессии , которая в свою очередь является частным случаем общей линейной модели . Все считают замечания быть сумма модели (FIT) и остаточной (ошибка) , чтобы быть сведено к минимуму.

Тест Крускала-Уоллиса и тест Фридмана являются непараметрические тесты, которые не зависят от предположения о нормальности.

Подключение к линейной регрессии

Ниже мы делаем очистить связь между многоходовой ANOVA и линейной регрессии.

Линейно переупорядочить данные таким образом , что наблюдение , связанные с ответом и факторами , где обозначают различные факторы , и представляет собой общее количество факторов. В однонаправленной ANOVA и в двух направлениях ANOVA . Кроме того, мы предполагаем , что фактор имеет уровни, а именно . Теперь мы можем один горячий закодировать разлагается в одномерный вектор .

Функция один горячее кодирования определяется таким образом, что ввод является

Вектор представляет собой объединение всех вышеуказанных векторов для всех . Таким образом, . Для того , чтобы получить полное общее -WAY ANOVA взаимодействия мы должны объединить все дополнительное слагаемое взаимодействия в векторе , а затем добавить свободный член. Пусть этот вектор будет .

В этих обозначениях в месте, мы теперь имеем точную связь с линейной регрессии. Мы просто регресс ответ против вектора . Однако, есть беспокойство по поводу идентифицируемости. Для преодоления таких проблем , мы предполагаем , что сумма параметров в пределах каждого набора взаимодействий равна нулю. Отсюда, можно использовать F -статистик или другие методы , чтобы определить значимость отдельных факторов.

пример

Можно рассмотреть пример взаимодействия 2-полосной, где мы предполагаем, что первый фактор имеет 2 уровня, а второй фактор имеет 3 уровня.

Определить , если и , если , то есть это один горячий кодирования первого фактора и является одной горячей кодирование второго фактора.

При этом,

где последний член представляет собой термин перехватывать. Для более конкретного примера предположим, что
Затем,

Смотрите также

Сноски

Заметки

Рекомендации

  • Анскомб, FJ (1948). «Обоснованность сравнительных экспериментов». Журнал Королевского статистического общества. Серия А (General) . 111 (3): 181-211. DOI : 10,2307 / 2984159 . JSTOR  2984159 . MR  0030181 .
  • Бейли, Р. (2008). Дизайн сравнительных экспериментов . Cambridge University Press. ISBN  978-0-521-68357-9 . главы Предварительная публикация доступны в режиме онлайн.
  • Belle, Джеральд Ван (2008). Статистические правила большого пальца (2 - е изд.). Hoboken, NJ: Wiley. ISBN  978-0-470-14448-0 .
  • Cochran, William G .; Кокс, Гертруда М. (1992). Экспериментальные проекты (2 - е изд.). Нью - Йорк: Wiley. ISBN  978-0-471-54567-5 .
  • Коэн, Якоб (1988). Статистический анализ мощности для наук поведения (2 - е изд.). Routledge ISBN  978-0-8058-0283-2
  • Коэн, Якоб (1992). «Статистика сила праймер». Psychological Bulletin . 112 (1): 155-159. DOI : 10,1037 / 0033-2909.112.1.155 . PMID  19565683 .
  • Кокс, Дэвид Р. (1958). Планирование экспериментов . Печатается в ISBN  978-0-471-57429-3
  • Кокс, DR (2006). Принципы статистического вывода . Кембридж Нью - Йорк: Cambridge University Press. ISBN  978-0-521-68567-2 .
  • Фридман, Дэвид А. (2005). Статистические модели: теория и практика , Cambridge University Press. ISBN  978-0-521-67105-7
  • Гельман, Эндрю (2005). «Дисперсионный анализ? Почему это более важно , чем когда - либо». Летопись статистики . 33 : 1-53. Arxiv : математика / 0504499 . DOI : 10,1214 / 009053604000001048 .
  • Гельман, Эндрю (2008). «Дисперсия, анализ». Новый словарь Palgrave экономики (2 - е изд.). Basingstoke, Гемпшир Нью - Йорк: Palgrave Macmillan. ISBN  978-0-333-78676-5 .
  • Hinkelmann, Klaus & Kempthorne, Оскар (2008). Разработка и анализ экспериментов . I и II (второе издание). Wiley. ISBN  978-0-470-38551-7 .
  • Хауэлл, Дэвид С. (2002). Статистические методы психологии (5 - е изд.). Pacific Grove, CA: Duxbury / Thomson Learning. ISBN  978-0-534-37770-0 .
  • Kempthorne, Оскар (1979). Проектирование и анализ экспериментов (Corrected переиздание (1952) Wiley -е изд.). Роберт Е. Кригер. ISBN  978-0-88275-105-4 .
  • Lehmann, EL (1959) Проверка статистических гипотез. John Wiley & Sons.
  • Монтгомери, Дуглас С. (2001). Проектирование и анализ экспериментов (5 - е изд.). Нью - Йорк: Wiley. ISBN  978-0-471-31649-7 .
  • Мур, Дэвид С. & МакКейб, Джордж П. (2003). Введение в практику статистики (4e). WH Freeman & Co. ISBN  0-7167-9657-0
  • Розенбаум, Пол Р. (2002). Наблюдательные исследования (2 - е изд.). Нью - Йорк: Springer-Verlag. ISBN  978-0-387-98967-9
  • Шефф, Генри (1959). Дисперсионный анализ . Нью - Йорк: Wiley.
  • Стиглер, Стивен М. (1986). История статистики: измерение неопределенности до 1900 года . Кембридж, Массачусетс: Belknap Пресс Гарвардского университета. ISBN  978-0-674-40340-6 .
  • Уилкинсон, Лиланд (1999). «Статистические методы в психологии журналов; Руководство и пояснения». Американский психолог . 5 (8): 594-604. CiteSeerX  10.1.1.120.4818 . DOI : 10,1037 / 0003-066X.54.8.594 .

дальнейшее чтение

  • Box, Г. ер (1953). «Non-нормальность и тесты на дисперсий». Biometrika . 40 (3/4): 318-335. DOI : 10,1093 / Biomet / 40.3-4.318 . JSTOR  2333350 .
  • Box, ПВС (1954). «Некоторые теоремы о квадратичных формах , применяемых в исследовании дисперсионного анализа проблем, И. Влияния неравенства дисперсионного в одноходовой классификации». Анналы математической статистики . 25 (2): 290. DOI : 10,1214 / АОМ / 1177728786 .
  • Box, ПВС (1954). «Некоторые теоремы о квадратичных формах , применяемых в исследовании дисперсионного анализа проблем, II. Эффекты неравенства дисперсионного и корреляции между ошибками в двухсторонней классификации». Анналы математической статистики . 25 (3): 484. DOI : 10,1214 / АОМ / 1177728717 .
  • Caliński, Тадеуш; Кагеяма, Санпей (2000). Блок конструкции: A Рандомизация подход, том I : Анализ . Lecture Notes в области статистики. 150 . Нью - Йорк: Springer-Verlag. ISBN  978-0-387-98578-7 .
  • Кристенсен, Рональд (2002). Plane ответы на сложные вопросы: Теория линейных моделей (третье издание). Нью - Йорк: Springer. ISBN  978-0-387-95361-8 .
  • Кокс, Дэвид Р. & Рид, Нэнси М. (2000). Теория проектирования экспериментов . (Chapman & Hall / CRC). ISBN  978-1-58488-195-7
  • Фишер, Ronald (1918). «Исследование в области растениеводства вариации. I. экспертиза выхода одетого зерна из Broadbalk» (PDF) . Журнал сельскохозяйственной науки . 11 (2): 107-135. DOI : 10,1017 / S0021859600003750 . ЛВП : 2440/15170 . Архивировано из оригинального (PDF) 12 июня 2001 года.
  • Фридман, Дэвид А. ; Пизани, Роберт; Первс, Роджер (2007) Статистика , 4 - е издание. WW Нортон & Company ISBN  978-0-393-92972-0
  • Hettmansperger, TP; МакКин, JW (1998). Эдвард Арнольд, ред. Устойчивые непараметрические статистические методы . Библиотека Кендалла статистики. Том 5 (первый ред.). New York: John Wiley & Sons, Inc. с XIV + 467 стр.. ISBN  978-0-340-54937-7 . MR  1604954 .
  • Лентнер, Marvin; Томас Бишоп (1993). Экспериментальное проектирование и анализ (второе издание). PO Box 884, Blacksburg, VA 24063: Valley Book Company. ISBN  978-0-9616255-2-8 .
  • Tabachnick, Барбара Г. & Файделл, Linda S. (2007). Использование многомерной статистики (5 - е изд.). Бостон: Pearson International издание. ISBN  978-0-205-45938-4
  • Wichura, Michael J. (2006). Бескоординатная подход к линейным моделям . Кембридж серии в статистических и вероятностные математики. Cambridge: Cambridge University Press. стр. XIV + 199. ISBN  978-0-521-86842-6 . MR  2283455 .
  • Пхадке, Мадхава S. (1989). Качество Engineering с использованием прочной конструкции . Нью - Джерси: Prentice Hall PTR. ISBN  978-0-13-745167-8 .

внешняя ссылка