Данные подсчета - Count data

В статистических данных , данные счета является тип статистических данных , тип данных , в котором наблюдения может принимать только неотрицательные целые значения {0, 1, 2, 3, ...}, и где эти числа возникают из подсчета , а чем рейтинг . Статистическая обработка данных подсчета отличается от обработки двоичных данных , в которых наблюдения могут принимать только два значения, обычно представленных 0 и 1, и от порядковых данных , которые также могут состоять из целых чисел, но где отдельные значения попадают в произвольная шкала и только относительный рейтинг важен

Подсчет переменных

Отдельный фрагмент данных подсчета часто называют переменной подсчета . Когда такая переменная рассматривается как случайная величина , для представления ее распределения обычно используются пуассоновское , биномиальное и отрицательное биномиальное распределение.

Графическая экспертиза

Графическому исследованию данных подсчета может способствовать использование преобразований данных, выбранных так, чтобы иметь свойство стабилизации дисперсии выборки. В частности, преобразование квадратного корня может использоваться, когда данные могут быть аппроксимированы распределением Пуассона (хотя другие преобразования имеют умеренно улучшенные свойства), тогда как обратное преобразование синуса доступно, когда предпочтительнее биномиальное распределение .

Связь данных подсчета с другими переменными

Здесь переменная count будет рассматриваться как зависимая переменная . Статистические методы, такие как метод наименьших квадратов и дисперсионный анализ , предназначены для работы с непрерывными зависимыми переменными. Их можно адаптировать для работы с данными подсчета с помощью преобразований данных, таких как преобразование квадратного корня , но такие методы имеют несколько недостатков; они в лучшем случае являются приблизительными и оценивают параметры , которые часто трудно интерпретировать.

Распределение Пуассона может служить основой для некоторого анализа данных подсчета, и в этом случае может использоваться регрессия Пуассона . Это частный случай класса обобщенных линейных моделей, который также содержит определенные формы модели, способные использовать биномиальное распределение ( биномиальная регрессия , логистическая регрессия ) или отрицательное биномиальное распределение, где предположения модели Пуассона нарушаются, в частности, когда диапазон значений счета ограничен или при наличии избыточной дисперсии .

Смотрите также

дальнейшее чтение

  • Кэмерон, AC ; Триведи, ПК (2013). Регрессионный анализ книги данных счетчика (второе изд.). Издательство Кембриджского университета. ISBN 978-1-107-66727-3.
  • Хильбе, Джозеф М. (2011). Отрицательная биномиальная регрессия (второе изд.). Издательство Кембриджского университета. ISBN 978-0-521-19815-8.
  • Винкельманн, Райнер (2008). Эконометрический анализ данных подсчета (Пятое изд.). Springer. DOI : 10.1007 / 978-3-540-78389-3 . ISBN 978-3-540-77648-2.