Дизайн повторных мероприятий - Repeated measures design

План повторных измерений - это план исследования, который включает в себя несколько измерений одной и той же переменной, проводимых на одних и тех же или совпадающих субъектах либо в разных условиях, либо в течение двух или более периодов времени. Например, повторные измерения собираются в продольном исследовании, в котором оцениваются изменения во времени.

Кроссовер исследования

Популярным методом повторных измерений является перекрестное исследование . Перекрестное исследование - это продольное исследование, в котором субъекты получают последовательность различных видов лечения (или воздействий). В то время как перекрестные исследования могут быть обсервационными , многие важные перекрестные исследования являются контролируемыми экспериментами . Кроссоверы часто используются для экспериментов во многих научных дисциплинах , например в психологии , образовании , фармацевтике и здравоохранении , особенно в медицине.

Рандомизированные контролируемые перекрестные эксперименты особенно важны в здравоохранении. В рандомизированном клиническом исследовании , субъекты рандомизированы лечения. Когда такое испытание представляет собой дизайн с повторными измерениями, субъектов случайным образом распределяют по последовательности лечения. Перекрестное клиническое испытание - это дизайн с повторными измерениями, в котором каждому пациенту случайным образом назначается последовательность курсов лечения, включая как минимум два лечения (одно из которых может быть стандартным лечением или плацебо ): Таким образом, каждый пациент переходит от одного лечения другому.

Почти все перекрестные конструкции имеют «баланс», что означает, что все субъекты должны получать одинаковое количество курсов лечения и что все субъекты участвуют в течение одинакового количества периодов. В большинстве перекрестных испытаний каждый субъект получает все виды лечения.

Однако многие дизайны с повторными измерениями не являются пересекающимися: например, для продольного исследования последовательных эффектов повторных курсов лечения не нужно использовать какой-либо « кроссовер » (Vonesh & Chinchilli; Jones & Kenward).

Использует

  • Ограниченное количество участников - дизайн с повторяющимися измерениями снижает разброс оценок эффектов лечения, позволяя делать статистические выводы по меньшему количеству субъектов.
  • Эффективность. Планы с повторяющимися измерениями позволяют быстрее завершить многие эксперименты, поскольку для завершения всего эксперимента необходимо обучить меньшее количество групп. Например, эксперименты, в которых каждое условие занимает всего несколько минут, тогда как обучение выполнению задач занимает столько же, если не больше времени.
  • Лонгитюдный анализ. Дизайн повторяющихся измерений позволяет исследователям отслеживать, как участники меняются с течением времени, как в долгосрочной, так и в краткосрочной ситуации.

Заказать эффекты

Эффекты порядка могут возникать, когда участник эксперимента может выполнить задание, а затем выполнить его снова. Примеры эффектов порядка включают повышение производительности или снижение производительности, что может быть связано с эффектами обучения, скукой или усталостью. Влияние эффектов порядка может быть меньше в долгосрочных продольных исследованиях или за счет уравновешивания с использованием перекрестного дизайна .

Уравновешивание

В этом методе две группы выполняют одинаковые задачи или находятся в одинаковых условиях, но в обратном порядке. Из двух задач или условий формируются четыре группы.

Уравновешивание
Задача / условие Задача / условие Замечания
Группа А
1
2
Группа A сначала выполняет задачу / условие 1, затем задачу / условие 2.
Группа B
2
1
Группа B сначала выполняет задачу / условие 2, затем задачу / условие 1.

Уравновешивание пытается учесть два важных источника систематических вариаций в этом типе дизайна: практика и эффект скуки. И то, и другое могло бы в противном случае привести к разной результативности участников из-за их знакомства или усталости от лечения.

Ограничения

Может оказаться невозможным для каждого участника присутствовать во всех условиях эксперимента (т.е. временные ограничения, место проведения эксперимента и т. Д.). Субъекты с тяжелыми заболеваниями, как правило, выпадают из лонгитюдных исследований, потенциально искажая результаты. В этих случаях предпочтительны модели со смешанными эффектами , поскольку они могут работать с отсутствующими значениями.

Средняя регрессия может повлиять на условия со значительными повторениями. Созревание может повлиять на исследования, которые продолжаются со временем. События вне эксперимента могут изменить реакцию между повторениями.

Повторные измерения ANOVA

Дисперсионный анализ повторных измерений (RANOVA) - широко используемый статистический подход к планам повторных измерений. В таких планах фактор повторных измерений (качественная независимая переменная) является фактором внутри субъектов, в то время как зависимая количественная переменная, по которой измеряется каждый участник, является зависимой переменной.

Разделение ошибки

Одним из самых больших преимуществ rANOVA, как и в случае с планами с повторными измерениями в целом, является возможность разделения изменчивости из-за индивидуальных различий. Рассмотрим общую структуру F-статистики :

F = Обработка MS / Ошибка MS = ( Обработка SS / Обработка df ) / ( Ошибка SS / Ошибка df )

В дизайне между субъектами есть элемент расхождения из-за индивидуальных различий, который сочетается с условиями лечения и ошибок:

Всего SS = Обработка SS + Ошибка SS
df Итого = n - 1

В дизайне с повторными измерениями можно отделить вариабельность субъектов от терминов обработки и ошибок. В таком случае вариабельность может быть разбита на вариабельность между курсами лечения (или эффекты внутри субъектов, за исключением индивидуальных различий) и вариабельность внутри лечения. Вариабельность внутри лечения может быть далее разделена на вариабельность между субъектами (индивидуальные различия) и ошибки (за исключением индивидуальных различий):

Сумма SS = Лечение SS (исключая индивидуальные различия) + Субъекты SS + Ошибка SS
df Всего = df Лечение (внутри субъектов) + df между субъектами + ошибка df = ( k - 1) + ( n - 1) + (( n - k ) ( n - 1))

Что касается общей структуры F-статистики, ясно, что при разделении вариативности между субъектами, F-значение будет увеличиваться, потому что сумма квадратов ошибки будет меньше, что приведет к меньшему MSError. Примечательно, что разбиение на вариативность снижает степень свободы от F-теста, поэтому вариативность между субъектами должна быть достаточно значительной, чтобы компенсировать потерю степеней свободы. Если вариабельность между субъектами мала, этот процесс может фактически уменьшить F-значение.

Предположения

Как и при любом статистическом анализе, следует соблюдать определенные допущения, чтобы оправдать использование этого теста. Нарушения могут умеренно или серьезно повлиять на результаты и часто приводят к раздуванию ошибки типа 1 . При использовании rANOVA применяются стандартные одномерные и многомерные допущения. Однофакторные допущения:

  • Нормальность - для каждого уровня фактора внутри субъектов зависимая переменная должна иметь нормальное распределение .
  • Сферичность - баллы разницы, вычисленные между двумя уровнями фактора внутри субъектов, должны иметь одинаковую дисперсию для сравнения любых двух уровней. (Это предположение применимо только в том случае, если существует более двух уровней независимой переменной.)
  • Случайность. Случаи должны быть получены на основе случайной выборки, а оценки разных участников должны быть независимыми друг от друга.

RANOVA также требует, чтобы выполнялись некоторые многомерные допущения, потому что многомерный тест проводится по разностным оценкам. Эти предположения включают:

  • Многовариантная нормальность - баллы разницы обычно многомерно распределяются в популяции.
  • Случайность - отдельные случаи должны быть получены на основе случайной выборки, а баллы разницы для каждого участника не зависят от баллов другого участника.

F тест

Как и в случае с другим анализом дисперсионных тестов, rANOVA использует F-статистику для определения значимости. В зависимости от количества внутрисубъектных факторов и нарушений допущений необходимо выбрать наиболее подходящий из трех тестов:

  • Стандартный одномерный тест ANOVA F - этот тест обычно используется, учитывая только два уровня фактора внутри субъектов (т.е. временная точка 1 и временная точка 2). Этот тест не рекомендуется при более чем двух уровнях внутрисубъектного фактора, потому что в таких случаях обычно нарушается допущение о сферичности.
  • Альтернативный одномерный тест - эти тесты учитывают нарушения предположения о сферичности и могут использоваться, когда фактор внутри субъектов превышает 2 уровня. F-статистика такая же, как в стандартном одномерном ANOVA F-тесте, но связана с более точным p-значением. Эта коррекция выполняется путем уменьшения степени свободы для определения критического значения F. Обычно используются две поправки: поправка Гринхауса – Гейссера и поправка Хюйна – Фельдта. Поправка Гринхауса – Гейссера более консервативна, но решает общую проблему увеличения изменчивости с течением времени в плане повторных измерений. Поправка Хюйна – Фельдта менее консервативна, но не решает проблемы увеличения изменчивости. Было предложено использовать нижнюю часть Huynh – Feldt с меньшими отклонениями от сферичности, а по Greenhouse – Geisser - при больших отклонениях.
  • Многомерный тест - этот тест не предполагает сферичности, но также является очень консервативным.

Размер эффекта

Одна из наиболее часто описываемых статистических величин размера эффекта для rANOVA - это частичный квадрат эта-квадрата (η p 2 ). Также часто используется многомерная η 2, когда предположение о сферичности было нарушено, и сообщается статистика многомерного теста. Третья статистика величины эффекта, о которой сообщается, представляет собой обобщенное значение η 2 , которое сравнимо с η p 2 в однофакторном дисперсионном анализе с повторными измерениями. Было показано, что это лучшая оценка величины эффекта с другими тестами внутри субъектов.

Предостережения

RANOVA - не всегда лучший статистический анализ для планов с повторными измерениями. RANOVA уязвим для эффектов от пропущенных значений, вменения, неодинаковых моментов времени между объектами и нарушений сферичности. Эти проблемы могут привести к смещению выборки и завышению частоты ошибок типа I. В таких случаях может быть лучше рассмотреть возможность использования линейной смешанной модели .

Смотрите также

Заметки

использованная литература

Планирование и анализ экспериментов

  • Джонс, Байрон; Кенвард, Майкл Г. (2003). Дизайн и анализ перекрестных испытаний (второе изд.). Лондон: Чепмен и Холл.
  • Вонеш, Эдвард Ф. и Чинчилли, Вернон Г. (1997). Линейные и нелинейные модели для анализа повторных измерений . Лондон: Чепмен и Холл.

Исследование продольных данных

  • Давидиан, Мари ; Дэвид М. Гилтинан (1995). Нелинейные модели для данных повторных измерений . Монографии Chapman & Hall / CRC по статистике и прикладной вероятности. ISBN   978-0-412-98341-2 .
  • Фитцморис, Гарретт; Давидиан, Мари; Вербеке, Герт; Molenberghs, Geert, eds. (2008). Продольный анализ данных . Бока-Ратон, Флорида: Чепмен и Холл / CRC. ISBN   978-1-58488-658-7 .
  • Джонс, Байрон; Кенвард, Майкл Г. (2003). Дизайн и анализ перекрестных испытаний (второе изд.). Лондон: Чепмен и Холл.
  • Ким, Кевин и Тимм, Нил (2007). « « Ограниченная MGLM и модель кривой роста »(Глава 7)». Одномерные и многомерные общие линейные модели: теория и приложения с SAS (с 1 CD-ROM для Windows и UNIX) . Статистика: Учебники и монографии (2-е изд.). Бока-Ратон, Флорида: Chapman & Hall / CRC. ISBN   978-1-58488-634-1 .
  • Колло, Тыну и фон Розен, Дитрих (2005). « « Многомерные линейные модели »(глава 4), особенно« Модель кривой роста и расширения »(глава 4.1)». Расширенная многомерная статистика с матрицами . Математика и ее приложения. 579 . Нью-Йорк: Спрингер. ISBN   978-1-4020-3418-3 .
  • Кширсагар, Анант М. и Смит, Уильям Бойс (1995). Кривые роста . Статистика: учебники и монографии. 145 . Нью-Йорк: ISBN Marcel Dekker, Inc.   0-8247-9341-2 .
  • Пан, Цзянь-Синь и Фанг, Кай-Тай (2002). Модели кривой роста и статистическая диагностика . Серии Спрингера в статистике. Нью-Йорк: Springer-Verlag. ISBN   0-387-95053-2 .
  • Себер, GAF & Wild, CJ (1989). « « Модели роста (Глава 7) » ». Нелинейная регрессия . Ряд Уайли в вероятности и математической статистике: вероятность и математическая статистика. Нью-Йорк: John Wiley & Sons, Inc., стр. 325–367. ISBN   0-471-61760-1 .
  • Тимм, Нил Х. (2002). « « Общая модель MANOVA (GMANOVA) »(Глава 3.6.d)». Прикладной многомерный анализ . Тексты Springer в статистике. Нью-Йорк: Springer-Verlag. ISBN   0-387-95347-7 .
  • Вонеш, Эдвард Ф. и Чинчилли, Вернон Г. (1997). Линейные и нелинейные модели для анализа повторных измерений . Лондон: Чепмен и Холл. (Комплексное изложение теории и практики)
  • Конавей, М. (1999, 11 октября). Дизайн повторных мероприятий. Получено 18 февраля 2008 г. с http://biostat.mc.vanderbilt.edu/twiki/pub/Main/ClinStat/repmeas.PDF.
  • Минке, А. (1997, январь). Проведение анализа повторных измерений: соображения экспериментального дизайна. Получено 18 февраля 2008 г. с сайта Ericae.net: http://ericae.net/ft/tamu/Rm.htm.
  • Шонесси, JJ (2006). Методы исследования в психологии. Нью-Йорк: Макгроу-Хилл.

внешние ссылки