Ограниченная рандомизация - Restricted randomization

В статистике , ограничено рандомизации происходит в проектировании экспериментов и , в частности , в контексте рандомизированных экспериментов и рандомизированных контролируемых испытаний . Ограниченная рандомизация позволяет избежать интуитивно неудовлетворительного распределения лечения по экспериментальным единицам, сохраняя при этом теоретические преимущества рандомизации. Например, в клиническом испытании нового предлагаемого лечения ожирения по сравнению с контролем экспериментатор хотел бы избежать результатов рандомизации, в которой новое лечение назначалось только самым тяжелым пациентам.

Эта концепция была введена Фрэнком Йейтсом (1948) и Уильямом Дж. Юденом (1972) «как способ избежать неправильных пространственных схем лечения в запланированных экспериментах».

Пример вложенных данных

Рассмотрим пакетный процесс, при каждом запуске которого используются 7 пластин монитора. План также требует измерения переменной отклика на каждой пластине на каждой из 9 площадок. План выборки имеет иерархическую или вложенную структуру: запуск партии - это самый верхний уровень, второй уровень - это отдельная пластина, а третий уровень - сайт на пластине.

Общий объем данных, сгенерированных за один запуск пакета, составит 7 · 9 = 63 наблюдения. Один из подходов к анализу этих данных - вычислить среднее значение всех этих точек, а также их стандартное отклонение и использовать эти результаты в качестве ответов для каждого прогона.

Предлагаемый выше анализ данных не является абсолютно неправильным, но при этом теряется информация, которую можно было бы получить в противном случае. Например, сайт 1 на пластине 1 физически отличается от сайта 1 на пластине 2 или на любой другой пластине. То же верно для любого из сайтов на любой из вафель. Точно так же пластина 1 в прогоне 1 физически отличается от пластины 1 в прогоне 2 и так далее. Чтобы описать эту ситуацию, говорят, что сайты вложены в пластины, а пластины вложены в прогоны.

Вследствие такой вложенности существуют ограничения на рандомизацию, которая может иметь место в эксперименте. Такая ограниченная рандомизация всегда приводит к вложенным источникам вариации. Примерами вложенных вариаций или ограниченной рандомизации, обсуждаемых на этой странице, являются планы с разделением и полосой .

Целью эксперимента с этим типом плана отбора проб обычно является уменьшение вариабельности из-за участков на пластинах и пластинах в циклах (или партиях) в процессе. Участки на пластинах и пластины в партии становятся источниками нежелательных отклонений, и исследователь стремится сделать систему устойчивой к этим источникам - другими словами, в таком эксперименте можно рассматривать пластины и площадки как факторы шума.

Поскольку пластины и площадки представляют собой нежелательные источники вариаций и поскольку одна из целей заключается в снижении чувствительности процесса к этим источникам вариаций, рассмотрение пластин и площадок как случайных эффектов при анализе данных является разумным подходом. Другими словами, вложенная вариация часто является другим способом обозначить вложенные случайные эффекты или вложенные источники шума. Если факторы «пластины» и «участки» трактовать как случайные эффекты, то можно оценить компонент дисперсии, обусловленный каждым источником вариации, с помощью методов дисперсионного анализа . После получения оценок компонентов дисперсии исследователь может определить самый большой источник вариации в экспериментальном процессе, а также определить величины других источников вариации по отношению к самому большому источнику.

Вложенные случайные эффекты

Если у эксперимента или процесса есть вложенные варианты, эксперимент или процесс имеет несколько источников случайных ошибок, которые влияют на его результат. Наличие вложенных случайных эффектов в модели - это то же самое, что наличие вложенных вариаций в модели.

Сплит-сюжетные проекты

Планы с разделенным графиком являются результатом, когда во время эксперимента произошел определенный тип ограниченной рандомизации. Простой факторный эксперимент может привести к схеме с разделенным графиком из-за того, как эксперимент проводился на самом деле.

Во многих промышленных экспериментах часто возникают три ситуации:

  1. некоторые из представляющих интерес факторов может быть «трудно изменить», в то время как остальные факторы легко изменить. В результате порядок, в котором запускаются комбинации лечения для эксперимента, определяется порядком этих «трудно изменяемых» факторов.
  2. экспериментальные единицы обрабатываются вместе как партия для одного или нескольких факторов в конкретной комбинации лечения
  3. экспериментальные единицы обрабатываются индивидуально, одна за другой, для одной и той же комбинации лечения без сброса настроек коэффициента для этой комбинации лечения.

Экспериментальные примеры с разделенным графиком

Эксперимент, проводимый в одной из трех вышеперечисленных ситуаций, обычно приводит к дизайну с разделенным графиком. Рассмотрим эксперимент по изучению гальванического покрытия алюминия (неводным) на медных полосках. Три представляющих интерес фактора: ток (A); температура раствора (Т); и концентрация раствора гальванического агента (S). Скорость покрытия - это измеренный отклик. Всего для эксперимента доступно 16 медных полосок. Комбинации лечения, которые должны быть запущены (ортогонально масштабированные), перечислены ниже в стандартном порядке (т. Е. Они не были рандомизированы):

Комбинации лечения с ортогональной шкалой из 2 3 полных факториалов
Текущий Температура Концентрация
−1 −1 −1
−1 −1 +1
−1 +1 −1
−1 +1 +1
+1 −1 −1
+1 −1 +1
+1 +1 −1
+1 +1 +1

Пример: некоторые факторы трудно изменить

Рассмотрите возможность проведения эксперимента при первом из перечисленных выше условий, при этом коэффициент концентрации раствора гальванического агента (S) трудно изменить. Поскольку этот коэффициент трудно изменить, экспериментатор хотел бы рандомизировать комбинации обработки, чтобы коэффициент концентрации раствора имел минимальное количество изменений. Другими словами, рандомизация циклов обработки до некоторой степени ограничивается уровнем коэффициента концентрации раствора.

В результате комбинации обработки могут быть рандомизированы так, чтобы сначала выполнялись циклы лечения, соответствующие одному уровню концентрации (-1). На каждую медную полоску наносят индивидуальное покрытие, что означает, что только одна полоска за раз помещается в раствор для данной комбинации обработки. После завершения четырех прогонов с низким уровнем концентрации раствора раствор изменяется на высокий уровень концентрации (1), и выполняются оставшиеся четыре цикла эксперимента (где снова каждая полоска наносится на пластинки индивидуально).

После завершения одной полной реплики эксперимента выполняется вторая реплика с набором из четырех медных полосок, обработанных для заданного уровня концентрации раствора перед изменением концентрации и обработкой оставшихся четырех полосок. Обратите внимание, что уровни для оставшихся двух факторов все еще могут быть рандомизированы. Кроме того, уровень концентрации, который запускается первым в циклах репликации, также может быть рандомизирован.

Проведение эксперимента таким образом приводит к дизайну с разделением на участки . Концентрация раствора известна как фактор всего графика, а факторы подграфика - это текущая температура и температура раствора.

Дизайн с разделенным участком включает более одной экспериментальной единицы размера . В этом эксперименте экспериментальная единица одного размера представляет собой отдельную медную полоску. Обработки или факторы, которые были применены к отдельным полоскам, - это температура раствора и сила тока (эти факторы менялись каждый раз, когда в раствор помещалась новая полоска). Другой экспериментальный блок большего размера представляет собой набор из четырех медных полос. Обработка или фактор, который был применен к набору из четырех полосок, - это концентрация раствора (этот коэффициент был изменен после обработки четырех полосок). Экспериментальная единица меньшего размера называется экспериментальной единицей подзаголовка , тогда как экспериментальная единица большего размера упоминается как единица целого участка .

Для этого эксперимента есть 16 экспериментальных единиц подсюжета. Температура раствора и ток являются факторами подзаграждения в этом эксперименте. В этом эксперименте есть четыре экспериментальных единицы целого участка. Концентрация раствора является фактором всего участка в этом эксперименте. Поскольку существует два размера экспериментальных единиц, в модели есть два члена ошибки: один соответствует ошибке всего графика или экспериментальной единице всего графика, а другой соответствует ошибке части графика или экспериментальной единице части графика.

Таблица ANOVA для этого эксперимента будет выглядеть частично следующим образом:

Таблица частичного дисперсионного анализа
Источник DF
Репликация 1
Концентрация 1
Ошибка (весь график) = Rep × Conc 1
Температура 1
Rep × Temp 1
Текущий 1
Репутация × Текущий 1
Темп × Конц 1
Повтор × Температура × Конц 1
Температура × Ток 1
Rep × Temp × Current 1
Текущий × Конц 1
Повтор × Текущее × Конц. 1
Темп × Ток × Конц 1
Ошибка (подграфик) = Rep × Temp × Current × Conc 1

Первые три источника относятся к уровню всего участка, а следующие 12 - к частям участка. Для поиска статистически значимых терминов можно использовать нормальный график вероятности 12 оценок членов подзаголовка .

Пример: пакетный процесс

Рассмотрите возможность проведения эксперимента при втором перечисленном выше условии (т. Е. Периодическом процессе), при котором в раствор одновременно помещаются четыре медные полоски. Определенный уровень тока может быть приложен к отдельной полосе в растворе. Используются те же 16 комбинаций лечения (повторение 2–3 факториала), что и в первом сценарии. Однако способ проведения эксперимента будет другим. Существует четыре комбинации обработки температуры раствора и концентрации раствора: (-1, -1), (-1, 1), (1, -1), (1, 1). Экспериментатор случайным образом выбирает одну из этих четырех процедур для настройки первой. В раствор помещают четыре медные полоски. Две из четырех полосок случайным образом назначаются низкому уровню тока. Остальные две полоски назначены на высокий уровень тока. Покрытие выполняется, и измеряется отклик. Выбирается вторая комбинация обработки температуры и концентрации, и выполняется та же процедура. Это сделано для всех четырех комбинаций температуры / концентрации.

Проведение эксперимента таким образом также приводит к дизайну с разделенным графиком, в котором факторами всего участка теперь являются концентрация раствора и температура раствора, а фактором подзаголовка является текущий.

В этом эксперименте экспериментальная единица одного размера снова представляет собой отдельную медную полоску. Обработка или фактор, который применялся к отдельным полоскам, является текущим (этот коэффициент менялся каждый раз для другой полоски в растворе). Другой экспериментальный блок большего размера, опять же, представляет собой набор из четырех медных полос. Обработки или факторы, которые были применены к набору из четырех полосок, включают концентрацию раствора и температуру раствора (эти факторы были изменены после обработки четырех полосок).

Экспериментальная единица меньшего размера снова упоминается как экспериментальная единица подзаговора. Для этого эксперимента есть 16 экспериментальных единиц подсюжета. Текущий - фактор подзаговора в этом эксперименте.

Экспериментальная единица большего размера - это экспериментальная единица всего участка. В этом эксперименте есть четыре экспериментальных единицы целого графика, и концентрация раствора и температура раствора являются факторами всего графика в этом эксперименте.

Есть два размера экспериментальных единиц, и в модели есть два члена ошибки: один, который соответствует ошибке всего графика или экспериментальной единице всего графика, и другой, который соответствует ошибке части графика или экспериментальной единице части графика.

Частично ANOVA для этого эксперимента выглядит следующим образом:

Таблица частичного дисперсионного анализа
Источник DF
Концентрация 1
Температура 1
Ошибка (весь график) = Conc × Temp 1
Текущий 1
Conc × Current 1
Температура × Ток 1
Conc × Temp × Current 1
Ошибка (подзаговор) 8

Первые три источника поступают с уровня всего участка, а следующие 5 - с уровня подзаговора. Поскольку существует 8 степеней свободы для члена ошибки подзаголовка, эту MSE можно использовать для проверки каждого эффекта, который включает ток.

Пример: экспериментальные единицы обрабатываются индивидуально

Рассмотрите возможность проведения эксперимента по третьему сценарию, указанному выше. В растворе одновременно находится только одна медная полоска. Однако две полоски, одна при низком токе, а другая при высоком токе, обрабатываются одна за другой при одинаковых настройках температуры и концентрации. После обработки двух полосок концентрация изменяется, а температура сбрасывается на другую комбинацию. Две полоски снова обрабатываются одна за другой при заданной температуре и концентрации. Этот процесс продолжается до тех пор, пока не будут обработаны все 16 медных полос.

Проведение эксперимента таким образом также приводит к дизайну с разделенным графиком, в котором факторами всего участка снова являются концентрация раствора и температура раствора, а фактор подзаголовка является текущим. В этом эксперименте экспериментальная единица одного размера представляет собой отдельную медную полоску. Обработка или фактор, который применялся к отдельным полоскам, является текущим (этот коэффициент менялся каждый раз для другой полоски в растворе). Другая или более крупная экспериментальная установка представляет собой набор из двух медных полос. Обработки или факторы, которые были применены к паре из двух полосок, - это концентрация раствора и температура раствора (эти факторы были изменены после обработки двух полосок). Экспериментальная единица меньшего размера называется экспериментальной единицей подзаговора.

Для этого эксперимента есть 16 экспериментальных единиц подсюжета. Текущий - это фактор подзаговора в эксперименте. В этом эксперименте восемь экспериментальных единиц с целым участком. Концентрация раствора и температура раствора являются факторами всего графика. В модели есть два члена ошибки: один соответствует ошибке всего графика или экспериментальной единице всего графика, а второй соответствует ошибке подзаголовка или экспериментальной единице подзаголовка.

ANOVA для этого (третьего) подхода частично выглядит следующим образом:

Таблица частичного дисперсионного анализа
Источник DF
Концентрация 1
Температура 1
Conc * Temp 1
Ошибка (весь сюжет) 4
Текущий 1
Conc × Current 1
Температура × Ток 1
Conc × Temp × Current 1
Ошибка (подзаговор) 4

Первые четыре члена берутся из анализа всего участка, а следующие 5 членов берутся из анализа подзаговора. Обратите внимание, что у нас есть отдельные условия ошибок как для всего графика, так и для эффектов подзаголовка, каждый из которых основан на 4 степенях свободы.

Как видно из этих трех сценариев, одно из основных различий между планами с разделенным графиком и простыми факторными планами - это количество экспериментальных единиц разного размера в эксперименте. Планы с разделенным графиком имеют более одной экспериментальной единицы размера, т. Е. Более одного члена ошибки. Поскольку эти планы включают разные размеры экспериментальных единиц и разные дисперсии, стандартные ошибки различных сравнений средних включают одну или несколько дисперсий. Определение подходящей модели для плана с разделенным участком включает в себя возможность идентифицировать каждый размер экспериментальной единицы. Способ определения экспериментальной единицы относительно структуры дизайна (например, полностью рандомизированный план по сравнению с рандомизированным полным планом блока ) и структуры лечения (например, полный факторный анализ 2–3 , половинная доля разрешения V, двумерная дробь). способ лечения, структура с контрольной группой и т. д.). В результате наличия более чем одной экспериментальной единицы размера подходящей моделью, используемой для анализа планов с разделенными участками, является смешанная модель .

Если данные эксперимента анализируются с использованием только одного члена ошибки в модели, из результатов можно сделать вводящие в заблуждение и неверные выводы.

Ленточные конструкции

Подобно плану с разделенными участками, план с полосами может быть получен, когда во время эксперимента произошел какой-либо тип ограниченной рандомизации. Простой факторный план может привести к плану полосовой в зависимости от того, как проводился эксперимент. Планирование ленточных диаграмм часто является результатом экспериментов, которые проводятся на двух или более этапах процесса, в которых каждый этап процесса является периодическим, т. Е. Для завершения каждой комбинации обработки в эксперименте требуется более одного этапа обработки, при этом экспериментальные единицы обрабатываются вместе в каждом процессе. шаг. Как и в случае с разделенным графиком, планы с ленточным графиком возникают, когда рандомизация в эксперименте каким-либо образом ограничивается. В результате ограниченной рандомизации, которая имеет место в планах с ленточными диаграммами, существует несколько размеров экспериментальных единиц. Следовательно, существуют разные условия ошибок или разные дисперсии ошибок, которые используются для проверки факторов, представляющих интерес в проекте. В традиционном дизайне полосового участка используются экспериментальные единицы трех размеров.

Пример ленточного графика: два шага и три факторных переменных

Рассмотрим следующий пример из полупроводниковой промышленности. Для эксперимента требуется этап имплантации и этап отжига. Как на этапе отжига, так и на этапе имплантации необходимо проверить три фактора. Процесс имплантации включает 12 пластин в партии, и имплантация одной пластины при определенных условиях нецелесообразна и не представляет собой экономичное использование имплантера. В печи отжига можно обрабатывать до 100 пластин.

Настройки двухуровневого факторного плана для трех факторов на этапе имплантации обозначены (A, B, C), а двухуровневый факторный план для трех факторов на этапе отжига обозначены (D, E, F ). Также присутствуют эффекты взаимодействия между факторами имплантата и факторами отжига. Таким образом, этот эксперимент содержит три размера экспериментальных единиц, каждая из которых имеет уникальный член ошибки для оценки значимости эффектов.

Чтобы придать реальный физический смысл каждой экспериментальной установке в приведенном выше примере, рассмотрите каждую комбинацию этапов имплантации и отжига как отдельную пластину. Партия из восьми пластин сначала проходит этап имплантации. Комбинация лечения 3 в факторах A, B и C является первым запуском лечения имплантатом. Эта обработка имплантатом применяется ко всем восьми пластинам одновременно. После завершения первого имплантационного лечения другой набор из восьми пластин имплантируется с лечебной комбинацией 5 факторов A, B и C. Это продолжается до тех пор, пока последняя партия из восьми пластин не имплантируется с лечебной комбинацией 6 факторов A, B и C. После того, как все восемь комбинаций обработки факторов имплантата были выполнены, начинается этап отжига. Первая комбинация обработки отжигом, которую нужно запустить, представляет собой комбинацию обработки 5 факторов D, E и F. Эта комбинация обработки отжигом применяется к набору из восьми пластин, причем каждая из этих восьми пластин поступает из одной из восьми комбинаций обработки имплантата. После того, как эта первая партия пластин была отожжена, вторая обработка отжигом применяется ко второй партии из восьми пластин, причем эти восемь пластин поступают от каждой из восьми комбинаций имплантационной обработки. Это продолжается до тех пор, пока последней партии из восьми пластин не будет имплантирована определенная комбинация факторов D, E и F.

Проведение эксперимента таким образом приводит к плану полосовой делянки с тремя размерами экспериментальных единиц. Набор из восьми пластин, которые имплантируются вместе, является экспериментальной единицей для факторов имплантации A, B и C и для всех их взаимодействий. Есть восемь экспериментальных единиц для факторов имплантата. Другой набор из восьми пластин отжигается вместе. Этот другой набор из восьми пластин является экспериментальной единицей второго размера и экспериментальной единицей для факторов отжига D, E и F и для всех их взаимодействий. Экспериментальная установка третьего размера представляет собой отдельную пластину. Это экспериментальная единица для всех эффектов взаимодействия между факторами имплантата и факторами отжига.

Фактически, приведенное выше описание схемы ленточной диаграммы представляет один блок или одну копию этого эксперимента. Если эксперимент не содержит репликации, а модель имплантата содержит только основные эффекты и двухфакторные взаимодействия, член трехфакторного взаимодействия A * B * C (1 степень свободы) обеспечивает член ошибки для оценки эффектов в пределах экспериментальная установка имплантата. Использование аналогичной модели для экспериментальной установки отжига дает член трехфакторного взаимодействия D * E * F для члена ошибки (1 степень свободы) для эффектов в экспериментальной установке отжига.

Смотрите также

Рекомендации

дальнейшее чтение

Для более подробного обсуждения этих конструкций и соответствующих процедур анализа см .:

  • Милликен, Джорджия; Джонсон, DE (1984). Анализ беспорядочных данных . 1 . Нью-Йорк: Ван Ностранд Рейнхольд.
  • Миллер, А. (1997). «Конфигурация ленточного графика дробных факториалов». Технометрика . 39 (2): 153–161. DOI : 10.2307 / 1270903 . JSTOR   1270903 .

внешняя ссылка

 Эта статья включает материалы, являющиеся  общественным достоянием, с веб-сайта Национального института стандартов и технологий https://www.nist.gov .