Логический анализ - Boolean analysis

Булев анализ был введен Фламентом (1976). Целью логического анализа является обнаружение детерминированных зависимостей между элементами анкеты или аналогичными структурами данных в наблюдаемых образцах ответов. Эти детерминированные зависимости имеют форму логических формул, соединяющих элементы. Предположим, например, что анкета содержит элементы ij и  k . Примеры таких детерминированных зависимостей: i  →  j , i  ∧  j  →  k и i  ∨  j  →  k .

Начиная с основной работы Фламента (1976), было разработано несколько различных методов булевого анализа. См., Например, Buggenhaut and Degreef (1987), Duquenne (1987), анализ дерева элементов Leeuwe (1974), Schrepp (1999) или Theuns (1998). Эти методы имеют общую цель - вывести детерминированные зависимости между элементами анкеты на основе данных, но различаются алгоритмами для достижения этой цели.

Логический анализ - это исследовательский метод для обнаружения детерминированных зависимостей между элементами. Обнаруженные зависимости необходимо подтвердить в последующих исследованиях. Методы булевого анализа не предполагают, что обнаруженные зависимости полностью описывают данные. Могут быть и другие вероятностные зависимости. Таким образом, логический анализ пытается обнаружить интересные детерминированные структуры в данных, но не преследует цель раскрыть все структурные аспекты в наборе данных. Поэтому имеет смысл использовать другие методы, например, анализ скрытых классов , вместе с логическим анализом.

Области применения

Исследование детерминированных зависимостей имеет некоторые традиции в педагогической психологии . Предметы представляют в этой области обычно навыки или познавательные способности субъектов. Барт и Айрасиан (1974) используют булев анализ, чтобы установить логические последствия для набора задач Пиаже . Другими примерами в этой традиции являются иерархии обучения Ганье (1968) или теория структурного обучения Скандуры (1971).

Есть несколько попыток использовать логический анализ, особенно анализ дерева элементов, для построения пространств знаний из данных. Примеры можно найти у Held and Korossy (1998) или Schrepp (2002).

Методы булевого анализа используются в ряде исследований в области социальных наук для понимания структуры дихотомических данных. Барт и Крус (1973) используют, например, логический анализ для установления иерархического порядка элементов, описывающих социально неприемлемое поведение. Янссенс (1999) использовал метод булевого анализа для исследования процесса интеграции меньшинств в систему ценностей доминирующей культуры. Ромм (1995a) представил логический сравнительный анализ в науках об управлении и применил его при исследовании процессов самоорганизации в командах менеджеров (Romme 1995b).

Отношения с другими сферами

Булев анализ имеет некоторое отношение к другим областям исследований. Существует тесная связь между логическим анализом и пространствами знаний . Теория пространств знаний обеспечивает теоретическую основу для формального описания человеческих знаний. Область знаний в этом подходе представлена ​​набором Q проблем. Затем знания предмета в предметной области описываются подмножеством проблем из Q, которые он или она может решить. Этот набор называется состоянием знаний предмета. Из-за зависимостей между элементами (например, если решение элемента j подразумевает решение элемента i ), не все элементы набора мощности Q , как правило, будут возможными состояниями знаний. Набор всех возможных состояний знаний называется структурой знаний . Методы логического анализа могут использоваться для построения структуры знаний из данных (например, Theuns, 1998 или Schrepp, 1999). Основное различие между обеими областями исследований заключается в том, что логический анализ концентрируется на извлечении структур из данных, в то время как теория пространства знаний фокусируется на структурных свойствах связи между структурой знаний и логическими формулами, которые ее описывают.

С теорией пространства знаний тесно связан формальный анализ понятий (Ganter and Wille, 1996). Подобно теории пространства знаний, этот подход концентрируется на формальном описании и визуализации существующих зависимостей. Формальный анализ понятий предлагает очень эффективные способы построения таких зависимостей на основе данных с упором на выражения «если-то» (« последствия »). Существует даже метод, называемый исследованием атрибутов , для извлечения всех последствий из труднодоступных данных.

Другая связанная область - интеллектуальный анализ данных . Data Mining занимается извлечением знаний из больших баз данных. Несколько алгоритмов интеллектуального анализа данных извлекают из базы данных зависимости вида j → i (называемые правилами ассоциации ).

Основное различие между логическим анализом и извлечением ассоциативных правил при интеллектуальном анализе данных заключается в интерпретации извлеченных следствий. Целью логического анализа является извлечение последствий из данных, которые (за исключением случайных ошибок в поведении ответа) верны для всех строк в наборе данных. Для приложений интеллектуального анализа данных достаточно обнаружить последствия, которые соответствуют заранее определенному уровню точности.

Например, в маркетинговом сценарии интересно найти последствия, которые верны для более чем x% строк в наборе данных. Интернет-магазин может быть заинтересован, например, в поиске значений формы. Если клиент заказывает книгу A, он также заказывает книгу B, если они выполняются более чем на 10% имеющихся данных о клиентах.

Ссылки

  • Фламент, К. (1976). L'analyse booleenne de questionnaire. Париж: Мутон.
  • Buggenhaut, J., & Degreef, E. (1987). О методах дихотомизации в булевом анализе анкет. В EE Roskam & R. Suck (Eds.), Математическая психология в прогрессе (стр. 447–453). Амстердам, Нью-Йорк: Северная Голландия.
  • Duquenne, В. (1987). Концептуальные последствия между атрибутами и некоторыми свойствами представления для конечных решеток. В B. Ganter, R. Wille & KE Wolff (Eds.), Beiträge zur Begriffsanalyse: Vorträge der Arbeitstagung Begriffsanalyse, Дармштадт 1986 (стр. 213–239). Мангейм: BI Wissenschafts-Verlag.
  • Леуве, Ван Дж. Ф. Дж. (1974). Анализ дерева предметов. Nederlands Tijdschrift voor de Psychologie, 29, 475–484.
  • Шрепп, М. (1999). Об эмпирическом построении последствий для двузначных тестовых заданий. Журнал математических социальных наук, 38 (3), 361–375.
  • Теунс, П. (1998). Создание пространства знаний с помощью логического анализа данных совместной встречаемости. В книге CE Dowling, FS Roberts и P. Theuns (Eds.), Recent Progress in Mathematical Psychology (стр. 173–194). Хиллсдейл, Нью-Джерси: Эрлбаум.
  • Барт, WA, и Airasian PW (1974). Определение порядка семи задач Пиаже теоретико-упорядочивающим методом. Журнал педагогической психологии, 66 (2), 277–284.
  • Ганье, RM (1968). Иерархии обучения. Педагогическая психология, 6, 1–9.
  • Скандура JM (1971). Детерминистское теоретизирование в структурном обучении: три уровня эмпиризма. Журнал структурного обучения, 3, 21–53.
  • Барт, WM, и Крус, DJ (1973). Теоретико-упорядоченный метод определения иерархии между элементами. Образовательные и психологические измерения, 33, 291–300.
  • Янссенс Р. (1999). Булевский подход к измерению групповых процессов и отношений. Концепция интеграции в качестве примера. Математические социальные науки, 38, 275–293.
  • Хелд, Т., и Коросси, К. (1998). Анализ данных как эвристика для установления теоретически обоснованных структур элементов. Zeitschrift für Psychologie, 206, 169–188.
  • Гантер Б. и Вилле Р. (1996). Formale Begriffsanalyse: Mathematische Grundlagen. Берлин: Springer.
  • Ромм, AGL (1995). Булев сравнительный анализ качественных данных. Качество и количество, 29, 317-329.
  • Ромм, AGL (1995). Самоорганизующиеся процессы в командах топ-менеджмента: логический сравнительный подход. Журнал бизнес-исследований, 34, 11-34.
  • Шрепп, М. (2003). Метод анализа иерархических зависимостей между элементами анкеты. Методы психологического исследования - онлайн, 19, 43–79.