Формально, пусть будет независимая выборка из n из N ≥ n различных слоев с общим средним μ . Предположим далее, что это вероятность включения случайно выбранной особи в суперпопуляции, принадлежащей к i- му слою. Оценка суммы Хансена и Гурвица (1943) дается как:
а оценка Хорвица – Томпсона для среднего значения определяется выражением:
В байесовской вероятностной структуре рассматривается доля лиц в целевой популяции, принадлежащих к i- му слою. Следовательно, это можно рассматривать как оценку полной выборки лиц в i- м слое. Оценки Хорвиц-Томпсон также могут быть выражены в виде предела взвешенной начальной загрузки передискретизации оценки среднего. Его также можно рассматривать как частный случай множественных подходов к вменению .
Для планов пост-стратифицированных исследований оценка и выполняется в отдельные этапы. В таких случаях вычислить дисперсию непросто. Для получения согласованных оценок дисперсии оценки Хорвица – Томпсона могут применяться методы повторной выборки, такие как бутстрап или складной нож. «Обзорный» пакет для R проводит анализ постстратифицированных данных с использованием оценки Хорвица – Томпсона.
Доказательство беспристрастной оценки Хорвица-Томпсона среднего
Можно показать, что оценка Хорвица – Томпсона несмещена при оценке математического ожидания оценки Хорвица – Томпсона следующим образом:
Известно, что стратегия Хансена-Гурвица (1943) уступает стратегии Хорвица-Томпсона (1952), связанной с рядом процедур выборки с вероятностью включения, пропорциональной размеру (IPPS).