Подтверждающий факторный анализ - Confirmatory factor analysis

В статистике , анализ Подтверждающего фактора ( CFA ) представляет собой особый вид факторного анализа , наиболее часто используемый в социальных исследованиях. Он используется для проверки того , согласуются ли показатели конструкта с пониманием исследователем природы этого конструкта (или фактора). Таким образом, цель подтверждающего факторного анализа состоит в том, чтобы проверить, соответствуют ли данные предполагаемой модели измерения. Эта предполагаемая модель основана на теории и / или предыдущих аналитических исследованиях. CFA был впервые разработан Йорескогом (1969) и основывается на более старых методах анализа валидности конструктов, таких как MTMM Matrix, описанных в Campbell & Fiske (1959), и заменяет их .

В подтверждающем факторном анализе исследователь сначала вырабатывает гипотезу о том, какие факторы, по его мнению, лежат в основе используемых показателей (например, « Депрессия » является фактором, лежащим в основе инвентаризации депрессии Бека и шкалы оценки депрессии Гамильтона ), и могут налагать ограничения на модель. исходя из этих априорных гипотез. Налагая эти ограничения, исследователь заставляет модель соответствовать своей теории. Например, если предполагается, что существует два фактора, влияющих на ковариацию в измерениях, и что эти факторы не связаны друг с другом, исследователь может создать модель, в которой корреляция между фактором A и фактором B ограничена нулем. Затем можно получить показатели соответствия модели, чтобы оценить, насколько хорошо предложенная модель отражает ковариацию между всеми элементами или показателями модели. Если ограничения, наложенные исследователем на модель, несовместимы с данными выборки, то результаты статистических тестов соответствия модели будут указывать на плохое соответствие, и модель будет отклонена. Если посадка плохая, это может быть связано с тем, что некоторые предметы измеряют несколько факторов. Также может быть, что некоторые элементы внутри фактора больше связаны друг с другом, чем другие.

Для некоторых приложений требование «нулевых нагрузок» (для индикаторов, которые не должны нагружать определенный фактор) было сочтено слишком строгим. Недавно разработанный метод анализа, «исследовательское моделирование структурным уравнением», определяет гипотезы о связи между наблюдаемыми показателями и их предполагаемыми первичными скрытыми факторами, а также позволяет оценить нагрузки с другими скрытыми факторами.

Статистическая модель

В подтверждающем факторном анализе исследователи обычно заинтересованы в изучении степени, в которой отклики на вектор наблюдаемых случайных величин p x 1 могут быть использованы для присвоения значения одной или нескольким ненаблюдаемым переменным η . Исследование в основном осуществляется путем оценки и оценки загрузки каждого элемента, используемого для выявления аспектов ненаблюдаемой скрытой переменной. То есть y [i] - это вектор наблюдаемых ответов, предсказанных ненаблюдаемой скрытой переменной , которая определяется как:

,

где - вектор p x 1 наблюдаемых случайных величин, - ненаблюдаемые скрытые переменные и - матрица p x k, где k равно количеству скрытых переменных. Так, несовершенные меры , модель также состоит из ошибок, . Оценки в случае максимального правдоподобия (ML), полученные путем итеративной минимизации функции соответствия,

где - ковариационная матрица дисперсии, подразумеваемая предлагаемой моделью факторного анализа, а - наблюдаемая ковариационная матрица дисперсии. То есть находятся значения для свободных параметров модели, которые минимизируют разницу между подразумеваемой моделью ковариационной матрицей и наблюдаемой ковариационной матрицей дисперсии.

Альтернативные стратегии оценки

Хотя для оценки моделей CFA использовались многочисленные алгоритмы, метод максимального правдоподобия (ML) остается основной процедурой оценки. При этом модели CFA часто применяются к условиям данных, которые отклоняются от нормальных теоретических требований для достоверной оценки ML. Например, социологи часто оценивают модели CFA с ненормальными данными и показателями, масштабируемыми с использованием дискретных упорядоченных категорий. Соответственно, были разработаны альтернативные алгоритмы, учитывающие различные условия данных, с которыми сталкиваются прикладные исследователи. Альтернативные оценки были охарактеризованы в два основных типа: (1) робастные и (2) ограниченные информации оценки.

Когда ML реализуется с данными, которые отклоняются от предположений нормальной теории, модели CFA могут давать смещенные оценки параметров и вводящие в заблуждение выводы. Робастная оценка обычно пытается исправить проблему путем корректировки нормальной теоретической модели χ 2 и стандартных ошибок. Например, Саторра и Бентлер (1994) рекомендовали использовать оценку машинного обучения обычным способом с последующим делением модели χ 2 на меру степени многомерного эксцесса. Дополнительным преимуществом надежных оценщиков машинного обучения является их доступность в общем программном обеспечении SEM (например, LAVAAN).

К сожалению, робастные оценщики машинного обучения могут оказаться непригодными в условиях обычных данных. В частности, когда показатели масштабируются с использованием нескольких категорий ответов (например, не согласен , нейтральный , согласен ), надежные оценщики машинного обучения, как правило, работают плохо. Оценщики с ограниченной информацией, такие как взвешенный метод наименьших квадратов (WLS), вероятно, являются лучшим выбором, когда явные индикаторы принимают порядковую форму. В целом, оценщики с ограниченной информацией обращаются к порядковым индикаторам, используя полихорические корреляции для соответствия моделям CFA. Полихорические корреляции отражают ковариацию между двумя скрытыми переменными, когда наблюдается только их категоризованная форма, что достигается в основном за счет оценки пороговых параметров.

Исследовательский факторный анализ

И исследовательский факторный анализ (EFA), и подтверждающий факторный анализ (CFA) используются для понимания общей дисперсии измеряемых переменных, которая, как полагают, связана с фактором или латентной конструкцией. Однако, несмотря на это сходство, EFA и CFA представляют собой концептуально и статистически разные анализы.

Цель EFA - выявить факторы на основе данных и максимизировать объясненную дисперсию. От исследователя не требуется иметь никаких конкретных гипотез о том, сколько факторов возникнет, и какие элементы или переменные будут включать эти факторы. Если эти гипотезы существуют, они не учитываются и не влияют на результаты статистического анализа. Напротив, CFA оценивает априорные гипотезы и в значительной степени руководствуется теорией. Анализ CFA требует, чтобы исследователь заранее выдвинул гипотезу о количестве факторов, независимо от того, коррелированы ли эти факторы, и какие элементы / меры влияют и отражают какие факторы. Таким образом, в отличие от исследовательского факторного анализа , где все нагрузки могут изменяться, CFA допускает явное ограничение определенных нагрузок равным нулю.

EFA часто считается более подходящим, чем CFA, на ранних этапах разработки шкалы, потому что CFA не показывает, насколько хорошо ваши элементы влияют на негипотетические факторы. Еще один веский аргумент в пользу первоначального использования ОДВ заключается в том, что неверное указание количества факторов на ранней стадии разработки шкалы, как правило, не будет обнаружено подтверждающим факторным анализом. На более поздних стадиях разработки шкалы подтверждающие методы могут предоставить больше информации за счет явного противопоставления конкурирующих структур факторов.

ОДВ иногда указывается в исследованиях, когда CFA может быть лучшим статистическим подходом. Утверждалось, что CFA может быть ограничительным и неуместным при использовании в исследовательских целях. Однако идея о том, что CFA является исключительно «подтверждающим» анализом, иногда может вводить в заблуждение, поскольку индексы модификации, используемые в CFA, носят в некоторой степени исследовательский характер. Индексы модификации показывают улучшение соответствия модели, если конкретный коэффициент не ограничивается. Точно так же EFA и CFA не обязательно должны быть взаимоисключающими анализами; Утверждалось, что EFA является разумным продолжением плохо подходящей модели CFA.

Структурное моделирование уравнение

Программное обеспечение для моделирования структурных уравнений обычно используется для выполнения подтверждающего факторного анализа. LISREL , EQS, AMOS, Mplus и пакет lavaan в R - популярные программы. CFA также часто используется в качестве первого шага для оценки предлагаемой модели измерения в модели структурного уравнения. Многие правила интерпретации, касающиеся оценки соответствия модели и модификации модели при моделировании структурными уравнениями, в равной степени применимы к CFA. CFA отличается от моделирования структурным уравнением тем, что в CFA нет направленных стрелок между скрытыми факторами . Другими словами, в то время как в CFA не предполагается, что факторы напрямую вызывают друг друга, SEM часто определяет конкретные факторы и переменные как причинные по своей природе. В контексте SEM CFA часто называют «моделью измерения», а отношения между скрытыми переменными (с направленными стрелками) называют «структурной моделью».

Оценка соответствия модели

В CFA используется несколько статистических тестов, чтобы определить, насколько хорошо модель соответствует данным. Обратите внимание, что хорошее соответствие между моделью и данными не означает, что модель «правильная», или даже что она объясняет большую часть ковариации. «Хорошая подгонка модели» означает только то, что модель правдоподобна. При сообщении результатов подтверждающего факторного анализа настоятельно рекомендуется сообщать: а) предлагаемые модели, б) любые внесенные изменения, в) меры, определяющие каждую скрытую переменную, г) корреляции между скрытыми переменными, д) любую другую относящуюся к делу информацию. , например, используются ли ограничения. Что касается выбора статистики соответствия модели для отчета, не следует просто сообщать статистику, которая оценивает наилучшее соответствие, хотя это может быть заманчивым. Хотя существует несколько различных мнений, Клайн (2010) рекомендует указывать критерий хи-квадрат, среднеквадратичную ошибку аппроксимации (RMSEA), сравнительный индекс соответствия (CFI) и стандартизованный среднеквадратичный остаток (SRMR).

Индексы абсолютной пригодности

Индексы абсолютного соответствия определяют, насколько хорошо априорная модель соответствует или воспроизводит данные. Индексы абсолютного соответствия включают, помимо прочего, критерий хи-квадрат, RMSEA, GFI, AGFI, RMR и SRMR.

Критерий хи-квадрат

Критерий хи-квадрат указывает на разницу между наблюдаемой и ожидаемой ковариационной матрицей . Значения, близкие к нулю, указывают на лучшее соответствие; меньшая разница между ожидаемой и наблюдаемой ковариационной матрицей. Статистику хи-квадрат также можно использовать для прямого сравнения соответствия вложенных моделей данным. Однако одна трудность с критерием соответствия модели хи-квадрат заключается в том, что исследователи могут не отклонить несоответствующую модель в малых размерах выборки и отклонить подходящую модель в больших размерах выборки. В результате были разработаны другие меры соответствия.

Среднеквадратичная ошибка аппроксимации

Среднеквадратичная ошибка аппроксимации (RMSEA) позволяет избежать проблем, связанных с размером выборки, путем анализа несоответствия между гипотетической моделью с оптимально выбранными оценками параметров и ковариационной матрицей совокупности. RMSEA находится в диапазоне от 0 до 1, причем меньшие значения указывают на лучшее соответствие модели. Значение 0,06 или меньше указывает на приемлемую подгонку модели.

Среднеквадратичный остаток и стандартизованный среднеквадратичный остаток

Среднеквадратичный остаток (RMR) и стандартизированный среднеквадратичный остаток (SRMR) являются квадратным корнем из расхождения между выборочной ковариационной матрицей и ковариационной матрицей модели. Однако RMR может быть несколько сложно интерпретировать, поскольку его диапазон основан на шкалах показателей в модели (это становится сложно, когда у вас есть несколько показателей с разными шкалами; например, два вопросника, один по шкале от 0 до 10. , другой по шкале от 1 до 3). Стандартизированная среднеквадратичная невязка устраняет эту трудность в интерпретации и составляет от 0 до 1, при этом значение 0,08 или менее указывает на приемлемую модель.

Индекс согласия и скорректированный индекс согласия

Индекс согласия (GFI) - это мера соответствия между гипотетической моделью и наблюдаемой ковариационной матрицей. Скорректированный индекс согласия (AGFI) корректирует GFI, на который влияет количество индикаторов каждой скрытой переменной. GFI и AGFI находятся в диапазоне от 0 до 1, при этом значение более 0,9 обычно указывает на приемлемое соответствие модели.

Индексы относительной подгонки

Индексы относительного соответствия (также называемые «индексами возрастающего соответствия» и «индексами сравнительного соответствия») сравнивают хи-квадрат для гипотетической модели с одним из «нулевой» или «базовой» модели. Эта нулевая модель почти всегда содержит модель, в которой все переменные не коррелированы, и, как следствие, имеет очень большой хи-квадрат (что указывает на плохое соответствие). Индексы относительного соответствия включают нормированный индекс соответствия и сравнительный индекс соответствия.

Нормированный индекс соответствия и ненормированный индекс соответствия

Нормированный индекс соответствия (NFI) анализирует несоответствие между значением хи-квадрат гипотетической модели и значением хи-квадрат нулевой модели. Тем не менее, NFI имеет тенденцию к отрицательной предвзятости. Ненормированный индекс соответствия (NNFI; также известный как индекс Такера – Льюиса, поскольку он был построен на индексе, сформированном Такером и Льюисом в 1973 году) решает некоторые проблемы отрицательного смещения, хотя значения NNFI могут иногда выходить за рамки диапазон от 0 до 1. Значения как для NFI, так и для NNFI должны находиться в диапазоне от 0 до 1, с порогом 0,95 или больше, указывающим на хорошее соответствие модели.

Сравнительный индекс соответствия

Индекс сравнительного соответствия (CFI) анализирует соответствие модели, исследуя несоответствие между данными и гипотетической моделью, при этом корректируя проблемы размера выборки, присущие критерию соответствия модели хи-квадрат и нормированному индексу соответствия. Значения CFI варьируются от 0 до 1, причем большие значения указывают на лучшее соответствие. Раньше считалось, что значение CFI 0,90 или больше указывает на приемлемое соответствие модели. Однако недавние исследования показали, что необходимо значение больше 0,90, чтобы гарантировать, что неправильно указанные модели не будут считаться приемлемыми. Таким образом, значение CFI 0,95 или выше в настоящее время считается показателем хорошего соответствия.

Идентификация и недооценка

Чтобы оценить параметры модели, модель должна быть правильно идентифицирована. То есть количество оцененных (неизвестных) параметров ( q ) должно быть меньше или равно количеству уникальных дисперсий и ковариаций среди измеряемых переменных; р ( р + 1) / 2. Это уравнение известно как «правило t». Если имеется слишком мало информации, на которой можно основывать оценки параметров, модель считается недооцененной, и параметры модели не могут быть оценены надлежащим образом.

Смотрите также

использованная литература

дальнейшее чтение

  • Браун, TA (2006). Подтверждающий факторный анализ для прикладных исследований . Нью-Йорк: Гилфорд.
  • ДиСтефано, К., и Хесс, Б. (2005). Использование подтверждающего факторного анализа для проверки конструкции: эмпирический обзор. Журнал психообразовательной оценки , 23 , 225-241.
  • Харрингтон, Д. (2009). Подтверждающий факторный анализ. Нью-Йорк: Издательство Оксфордского университета.
  • Маруяма, GM (1998). Основы моделирования структурными уравнениями . Таузенд-Оукс, Калифорния: Сейдж.

внешние ссылки