Оценка Хорвица – Томпсона - Horvitz–Thompson estimator

В статистике , то оценка Хорвиц-Томпсон , названная в честь Daniel G. Хорвиц и Donovan J. Thompson, является методом оценки общих и среднего значения псевдо-населения в стратифицированной выборке . Обратное вероятностное взвешивание применяется для учета различных пропорций наблюдений внутри слоев целевой совокупности. Оценщик Хорвица – Томпсона часто применяется при анализе обследований и может использоваться для учета недостающих данных , а также многих источников вероятностей неравного выбора .

Метод

Формально, пусть будет независимая выборка из n из N ≥ n различных слоев с общим средним μ . Предположим далее, что это вероятность включения случайно выбранной особи в суперпопуляции, принадлежащей к i- му слою. Оценка суммы Хансена и Гурвица (1943) дается как: ${\ Displaystyle Y_ {я}, я = 1,2, \ ldots, n}$ ${\ displaystyle \ pi _ {я}}$

{\ displaystyle {\ hat {Y}} _ {HT} = \ sum _ {i = 1} ^ {n} \ pi _ {i} ^ {- 1} Y_ {i},}

а оценка Хорвица – Томпсона для среднего значения определяется выражением:

{\ displaystyle {\ hat {\ mu}} _ {HT} = N ^ {- 1} {\ hat {Y}} _ {HT} = N ^ {- 1} \ sum _ {i = 1} ^ { n} \ pi _ {i} ^ {- 1} Y_ {i}.}

В байесовской вероятностной структуре рассматривается доля лиц в целевой популяции, принадлежащих к i- му слою. Следовательно, это можно рассматривать как оценку полной выборки лиц в i- м слое. Оценки Хорвиц-Томпсон также могут быть выражены в виде предела взвешенной начальной загрузки передискретизации оценки среднего. Его также можно рассматривать как частный случай множественных подходов к вменению . ${\ displaystyle \ pi _ {я}}$ ${\ displaystyle \ pi _ {i} ^ {- 1} Y_ {i}}$

Для планов пост-стратифицированных исследований оценка и выполняется в отдельные этапы. В таких случаях вычислить дисперсию непросто. Для получения согласованных оценок дисперсии оценки Хорвица – Томпсона могут применяться методы повторной выборки, такие как бутстрап или складной нож. «Обзорный» пакет для R проводит анализ постстратифицированных данных с использованием оценки Хорвица – Томпсона. ${\ displaystyle \ pi}$ ${\ displaystyle \ mu}$ ${\ displaystyle {\ hat {\ mu}} _ {HT}}$

Доказательство беспристрастной оценки Хорвица-Томпсона среднего

Можно показать, что оценка Хорвица – Томпсона несмещена при оценке математического ожидания оценки Хорвица – Томпсона следующим образом: ${\ displaystyle \ mathbf {E} {\ bar {X}} _ {n} ^ {HT}}$

{\ displaystyle \ mathbf {E} {\ bar {X}} _ {n} ^ {HT} = \ mathbf {E} {\ frac {1} {N}} \ sum _ {i = 1} ^ {n } {\ frac {\ mathbf {X} _ {I_ {i}}} {\ pi _ {I_ {i}}}}}

{\ displaystyle = \ mathbf {E} {\ frac {1} {N}} \ sum _ {i = 1} ^ {N} {\ frac {X_ {i}} {\ pi _ {i}}} 1_ {i \ in D_ {n}}}

{\ displaystyle = \ sum _ {b = 1} ^ {B} P (D_ {n} ^ {(b)}) \ left [{\ frac {1} {N}} \ sum _ {i = 1} ^ {N} {\ frac {X_ {i}} {\ pi _ {i}}} 1_ {i \ in D_ {n} ^ {(b)}} \ right]}

{\ displaystyle = {\ frac {1} {N}} \ sum _ {i = 1} ^ {N} {\ frac {X_ {i}} {\ pi _ {i}}} \ sum _ {b = 1} ^ {B} 1_ {i \ in D_ {n} ^ {(b)}} P (D_ {n} ^ {(b)})}

{\ displaystyle = {\ frac {1} {N}} \ sum _ {i = 1} ^ {N} \ left ({\ frac {X_ {i}} {\ pi _ {i}}} \ right) \ pi _ {i}}

{\ displaystyle = {\ frac {1} {N}} \ sum _ {i = 1} ^ {N} X_ {i}}

{\ displaystyle {\ text {где}} ~ D_ {n} = \ {x_ {1}, x_ {2}, ..., x_ {n} \}}

Известно, что стратегия Хансена-Гурвица (1943) уступает стратегии Хорвица-Томпсона (1952), связанной с рядом процедур выборки с вероятностью включения, пропорциональной размеру (IPPS).

использованная литература

внешние ссылки

Веб-сайт пакета опросов для R

Languages

In other projects

Оценка Хорвица – Томпсона - Horvitz–Thompson estimator

СОДЕРЖАНИЕ

Метод

Доказательство беспристрастной оценки Хорвица-Томпсона среднего

использованная литература

внешние ссылки