Частота (статистика) - Frequency (statistics)

Гистограмма времени в пути (на работу), перепись США 2000 года. Гистограммы отображают частоту наблюдений, происходящих в определенных диапазонах значений.

В статистике частота (или абсолютная частота ) из события является число раз происходило наблюдение / записано в эксперименте или исследовании. Эти частоты часто графически представлены в виде гистограмм .

Типы

Накопленная частота является сумма абсолютных частот всех событий на уровне или ниже определенной точки в упорядоченном списке событий.

В Относительная частота (илиэмпирическая вероятность) события - это абсолютная частота,нормированнаяна общее количество событий:

Значения для всех событий могут быть нанесены на график для получения частотного распределения .

В случае , когда для некоторых , pseudocounts может быть добавлен.

Изображения

Ниже приведены некоторые часто используемые методы изображения частоты:

Гистограммы

Гистограмма представляет собой представление табулированных частот, показанных в виде смежных прямоугольников или квадратов (в некоторых случаях), построенных на дискретных интервалах (бинах), с площадью, пропорциональной частоте наблюдений в интервале. Высота прямоугольника также равна плотности частот интервала, т. Е. Частоте, деленной на ширину интервала. Общая площадь гистограммы равна количеству данных. Гистограмма также может быть нормализована с отображением относительных частот. Затем он показывает долю случаев, которые попадают в каждую из нескольких категорий , с общей площадью, равной 1. Категории обычно указываются как последовательные, неперекрывающиеся интервалы переменной. Категории (интервалы) должны быть смежными и часто выбираются одинакового размера. Прямоугольники гистограммы нарисованы так, чтобы они касались друг друга, чтобы указать, что исходная переменная является непрерывной.

Гистограммы

Пример гистограммы с категориальной переменной "Страна" для дискретного набора данных.
Пример горизонтальной трехмерной гистограммы

Гистограмма или гистограмма является диаграммой с прямоугольными барами с длинами , пропорциональными значения , которые они представляют. Полосы могут быть нанесены вертикально или горизонтально. Вертикальную гистограмму иногда называют столбчатой ​​диаграммой.

Таблица распределения частот

Распределение частот таблица представляет собой расположение значений , что один или несколько переменных принимают в образце . Каждая запись в таблице содержит частоту или количество появлений значений в определенной группе или интервале, и, таким образом, таблица суммирует распределение значений в выборке. Пример показан ниже

Классифицировать Степень согласия Число
1 Полностью согласен 20
2 Отчасти согласен 30
3 Не уверен 20
4 Несколько не согласен 15
5 Категорически не согласен 15

Интерпретация

В соответствии с интерпретацией частот от вероятности , предполагается , что в качестве длины серии испытаний неограниченно возрастает, доля экспериментов , в которых происходит данное событие будет подходить фиксированное значение, известное как предельной относительной частоты .

Эту интерпретацию часто противопоставляют байесовской вероятности . Фактически, термин «частотный» впервые был использован М.Г. Кендаллом в 1949 году в отличие от байесовцев , которых он называл «нечастотниками». Он заметил

3 .... мы можем в общих чертах различить два основных отношения. Один принимает вероятность как «степень рациональной веры» или какую-то подобную идею ... второй определяет вероятность в терминах частоты возникновения событий или относительных пропорций в «популяциях» или «коллективах»; (стр.101)
...
12. Можно подумать, что различия между частотниками и нечастицами (если я могу их так назвать) в значительной степени обусловлены различиями в областях, которые они, как предполагается, охватывают. (стр.104)
...
Я утверждаю, что это не так ... Существенное различие между частотниками и нечастицами, я думаю, состоит в том, что первые, стремясь избежать чего-либо, относящегося к вопросам общественного мнения, стремятся определить вероятность в терминах объективные свойства населения, реальные или гипотетические, тогда как последние - нет. [курсив в оригинале]

Смотрите также

использованная литература