Центральная предельная теорема - Central limit theorem

В теории вероятностей , то центральные предельная теорема ( ЦПТ ) устанавливает , что во многих ситуациях, когда независимые случайные величины суммируются, их должным образом нормированная сумма стремится к нормальному распределению (неформально кривой колокол ) , даже если сами исходные переменные не являются нормально распределены. Теорема является ключевым понятием в теории вероятностей, потому что она подразумевает, что вероятностные и статистические методы, которые работают для нормальных распределений, могут быть применимы ко многим задачам, связанным с другими типами распределений. Эта теорема претерпела множество изменений за время формального развития теории вероятностей. Предыдущие версии теоремы датируются 1811 годом, но в своей современной общей форме этот фундаментальный результат теории вероятностей был точно сформулирован еще в 1920 году, тем самым служа мостом между классической и современной теорией вероятностей.

Если есть случайные выборки , взятые из популяции с общим средним и конечной дисперсией , и , если это выборочное среднее , то предельная форма распределения, , является стандартным нормальным распределением.

Например, предположим, что получена выборка, содержащая множество наблюдений , причем каждое наблюдение генерируется случайным образом таким образом, чтобы не зависеть от значений других наблюдений, и что вычисляется среднее арифметическое наблюдаемых значений. Если эта процедура выполняется много раз, центральная предельная теорема гласит, что распределение вероятностей среднего будет близко приближаться к нормальному распределению. Простым примером этого является то, что если кто- то подбрасывает монету много раз , вероятность получить заданное количество орлов будет приближаться к нормальному распределению со средним значением, равным половине общего количества подбрасываний. На пределе бесконечного числа флипов оно будет равно нормальному распределению.

Центральная предельная теорема имеет несколько вариантов. В своем обычном виде случайные величины должны быть одинаково распределены. В вариантах сходимость среднего к нормальному распределению также происходит для неидентичных распределений или для независимых наблюдений, если они соответствуют определенным условиям.

Самая ранняя версия этой теоремы, согласно которой нормальное распределение может использоваться как приближение к биномиальному распределению , - это теорема де Муавра – Лапласа .

Независимые последовательности

Распределение «сглаживается» суммированием , показывая исходную плотность распределения и три последующих суммирования; подробнее см. иллюстрацию к центральной предельной теореме .
Какой бы ни была форма распределения населения, выборочное распределение стремится к гауссову, а его дисперсия определяется центральной предельной теоремой.

Классический CLT

Пусть будет случайной выборкой размера, то есть последовательностью независимых и одинаково распределенных (iid) случайных величин, взятых из распределения ожидаемого значения, заданного как, и конечной дисперсии, заданной как . Предположим, нас интересует выборочное среднее

этих случайных величин. По закону больших чисел выборочные средние почти наверняка сходятся (и, следовательно, также сходятся по вероятности ) к ожидаемому значению как . Классическая центральная предельная теорема описывает размер и форму распределения стохастических флуктуаций вокруг детерминированного числа во время этой сходимости. Точнее, это указывает , что , как становится больше, распределение разности между средней пробы и ее предела , когда умноженной на коэффициент ( то есть ) приближается к нормальному распределению со средним 0 и дисперсией . Для достаточно больших n распределение близко к нормальному распределению со средним значением и дисперсией . Полезность теоремы заключается в том, что распределение приближается к нормальному, независимо от формы распределения индивида . Формально теорему можно сформулировать следующим образом:

Линдеберг – Леви CLT. Предположим , это последовательность iid случайных величин с и . Затем по мере приближения к бесконечности случайные величины сходятся по распределению к нормальному :

В случае , сходимость в средствах распределения , что кумулятивные функции распределения по сходиться точечно к ВПРУ от распределения: для каждого вещественного числа ,

где - стандартный нормальный cdf, оцениваемый в . Сходимость равномерна в том смысле, что

где обозначает точную верхнюю грань (или супремум ) множества.

Ляпунов ЦЛТ

Теорема названа в честь русского математика Александра Ляпунова . В этом варианте центральной предельной теоремы случайные величины должны быть независимыми, но не обязательно одинаково распределенными. Теорема также требует , чтобы случайные величины имеют моменты некоторого порядка , и что темпы роста этих моментов ограничены условием Ляпунова , приведенное ниже.

Ляпунов ЦЛТ. Предположим , это последовательность независимых случайных величин, каждая из которых имеет конечное ожидаемое значение и дисперсию . Определять

Если для некоторых , условие Ляпунова

выполняется, то сумма сходится по распределению к стандартной нормальной случайной величине, которая стремится к бесконечности:

На практике обычно проще всего проверить условие Ляпунова .

Если последовательность случайных величин удовлетворяет условию Ляпунова, то она также удовлетворяет условию Линдеберга. Однако обратное утверждение неверно.

Lindeberg CLT

В тех же условиях и с теми же обозначениями, что и выше, условие Ляпунова можно заменить следующим, более слабым (из Линдеберга в 1920 г.).

Предположим, что для каждого

где - индикаторная функция . Тогда распределение стандартизированных сумм

сходится к стандартному нормальному распределению .

Многомерный CLT

Доказательства, использующие характеристические функции, могут быть распространены на случаи, когда каждый индивидуум является случайным вектором в , со средним вектором и матрицей ковариации (среди компонентов вектора), и эти случайные векторы независимы и одинаково распределены. Суммирование этих векторов производится покомпонентно. Многомерная центральная предельная теорема утверждает, что при масштабировании суммы сходятся к многомерному нормальному распределению .

Позволять

быть k -вектором. Жирный шрифт означает, что это случайный вектор, а не случайная (одномерная) переменная. Тогда сумма случайных векторов будет

и в среднем

и поэтому

Многомерная центральная предельная теорема утверждает, что

где ковариационная матрица равна

Скорость сходимости определяется следующим результатом типа Берри – Эссеена :

Теорема. Пусть будут независимые -значные случайные векторы, каждый из которых имеет нулевое среднее значение. Пиши и считай обратимым. Пусть будет -мерный гауссовский с тем же средним и той же ковариационной матрицей, что и . Тогда для всех множеств выпуклых ,

где универсальная постоянная, , и обозначает евклидову норму о .

Неизвестно, нужен ли фактор .

Обобщенная теорема

Центральная предельная теорема утверждает, что сумма ряда независимых и одинаково распределенных случайных величин с конечной дисперсией будет стремиться к нормальному распределению по мере роста числа переменных. Обобщение Гнеденко и Колмогорова утверждает, что сумма ряда случайных величин со степенным хвостом ( паретианским хвостом ) распределений, убывающими как где (и, следовательно, имеющими бесконечную дисперсию), будет стремиться к устойчивому распределению по мере роста числа слагаемых. . Если тогда сумма сходится к устойчивому распределению с параметром устойчивости, равному 2, то есть к распределению Гаусса.

Зависимые процессы

CLT при слабой зависимости

Полезным обобщением последовательности независимых одинаково распределенных случайных величин является перемешивание случайных величин в дискретное время; «смешивание» означает, грубо говоря, что случайные величины, удаленные друг от друга во времени, почти независимы. В эргодической теории и теории вероятностей используется несколько видов перемешивания. См особенно сильное перемешивание (также называемый α-перемешивания) , определенный в котором так называемый сильный коэффициент смешения .

Упрощенная формулировка центральной предельной теоремы при сильном перемешивании:

Теорема. Предположим, что это стационарный и -смешивающийся с и что и . Обозначим , тогда предел

существует, а если тогда сходится по распределению к .

По факту,

где ряд абсолютно сходится.

Предположение о том, не может быть опущено, так как асимптотическая нормальность не выполняется для где еще одна стационарной последовательности .

Существует более сильная версия теоремы: предположение заменяется на , а предположение заменяется на

Наличие такового обеспечивает вывод. Для энциклопедической трактовки предельных теорем в условиях перемешивания см. ( Bradley 2007 ).

Разница по мартингейлу CLT

Теорема . Пусть мартингал удовлетворяет

  • по вероятности при n → ∞ ,
  • для каждого е > 0 , а п → ∞ ,

затем сходится по распределению к as .

Внимание: ограниченное ожидание не следует путать с условным ожиданием .

Замечания

Доказательство классической CLT

Центральная предельная теорема имеет доказательство с использованием характеристических функций . Это похоже на доказательство (слабого) закона больших чисел .

Предположим, что это независимые и одинаково распределенные случайные величины, каждая из которых имеет среднее значение и конечную дисперсию . У суммы есть среднее значение и дисперсия . Рассмотрим случайную величину

где на последнем шаге мы определили новые случайные величины , каждая с нулевым средним и единичной дисперсией ( ). Характеристическая функция от задается

где на последнем шаге мы использовали тот факт, что все они одинаково распределены. Характеристическая функция есть, по теореме Тейлора ,

где есть « немного о нотации » для некоторой функции , которая стремится к нулю быстрее . В пределе показательной функции ( ) характеристическая функция равна

В пределе исчезают все члены высшего порядка . Правая часть равна характеристической функции стандартного нормального распределения , из чего следует через теорему Леви о непрерывности, что распределение воли приближается как . Следовательно, выборочное среднее

таково, что

сходится к нормальному распределению , из которого следует центральная предельная теорема.

Сходимость до предела

Центральная предельная теорема дает только асимптотическое распределение . В качестве приближения для конечного числа наблюдений оно обеспечивает разумное приближение только тогда, когда оно близко к пику нормального распределения; требуется очень большое количество наблюдений, чтобы простираться до хвоста.

Сходимость в центральной предельной теореме равномерна, поскольку предельная кумулятивная функция распределения непрерывна. Если третий центральный момент существует и конечен, то скорость сходимости по крайней мере порядка (см. Теорему Берри – Эссеена ). Метод Стейна можно использовать не только для доказательства центральной предельной теоремы, но и для оценки скорости сходимости выбранных метрик.

Сходимость к нормальному распределению монотонна, в том смысле , что энтропия в возрастает монотонно к тому из нормального распределения.

Центральная предельная теорема применима, в частности, к суммам независимых и одинаково распределенных дискретных случайных величин . Сумма дискретных случайных величин по-прежнему является дискретной случайной величиной , так что мы сталкиваемся с последовательностью дискретных случайных величин, чья кумулятивная функция распределения вероятностей сходится к кумулятивной функции распределения вероятностей, соответствующей непрерывной переменной (а именно нормальному распределению ). . Это означает, что если мы построим гистограмму реализаций суммы n независимых идентичных дискретных переменных, кривая, соединяющая центры верхних граней прямоугольников, образующих гистограмму, сходится к гауссовой кривой, когда n приближается к бесконечности, это соотношение будет известна как теорема де Муавра – Лапласа . В статье о биномиальном распределении подробно описывается такое применение центральной предельной теоремы в простом случае дискретной переменной, принимающей только два возможных значения.

Связь с законом больших чисел

Закон больших чисел, а также центральная предельная теорема являются частичными решениями общей проблемы: «Каково предельное поведение S n, когда n приближается к бесконечности?» В математическом анализе асимптотические ряды являются одним из самых популярных инструментов, используемых для решения таких вопросов.

Предположим, у нас есть асимптотическое разложение :

Разделив обе части по φ 1 ( п ) и переходя к пределу будет производить 1 , коэффициент термина высшего порядка в разложении, который представляет собой скорость , при которой е ( п ) изменяется в его переднем плане.

Неформально, можно сказать: « е ( п ) возрастает примерно как в 1 φ 1 ( п ) ». Взяв разницу между f ( n ) и ее приближением, а затем разделив на следующий член в разложении, мы приходим к более тонкому утверждению о f ( n ) :

Здесь можно сказать, что разница между функцией и ее приближением растет примерно как a 2 φ 2 ( n ) . Идея состоит в том, что разделение функции на соответствующие нормализующие функции и рассмотрение ограничивающего поведения результата может многое рассказать нам об ограничивающем поведении самой исходной функции.

Неформально нечто подобное происходит, когда сумма S n независимых одинаково распределенных случайных величин X 1 ,…, X n изучается в классической теории вероятностей. Если каждое X i имеет конечное среднее μ , то по закону больших чисел S n/пμ . Если вдобавок каждое X i имеет конечную дисперсию σ 2 , то по центральной предельной теореме

где ξ распределяется как N (0, σ 2 ) . Это обеспечивает значения первых двух констант в неформальном разложении

В случае, когда X i не имеет конечного среднего или дисперсии, сходимость смещенной и масштабированной суммы также может происходить с различными коэффициентами центрирования и масштабирования:

или неофициально

Распределения Ξ, которые могут возникать таким образом, называются стабильными . Ясно, что нормальное распределение является стабильным, но существуют и другие стабильные распределения, такие как распределение Коши , для которых не определены среднее значение или дисперсия. Коэффициент масштабирования b n может быть пропорционален n c для любого c1/2; она также может быть умножена на медленно меняющуюся функцию от п .

Закон повторного логарифма специфицирует , что происходит «между» в законе больших чисел и центральной предельной теоремы. В частности, в нем говорится, что нормализующая функция n log log n , промежуточная по размеру между n закона больших чисел и n центральной предельной теоремы, обеспечивает нетривиальное предельное поведение.

Альтернативные формулировки теоремы

Функции плотности

Плотности суммы двух или более независимых переменных является сверткой их плотностей (если существуют эти плотности). Таким образом, центральную предельную теорему можно интерпретировать как утверждение о свойствах функций плотности при свертке: свертка ряда функций плотности стремится к нормальной плотности по мере неограниченного увеличения числа функций плотности. Эти теоремы требуют более сильных гипотез, чем приведенные выше формы центральной предельной теоремы. Теоремы этого типа часто называют локальными предельными теоремами. См. У Петрова конкретную локальную предельную теорему для сумм независимых и одинаково распределенных случайных величин .

Характерные функции

Поскольку характеристическая функция свертки является произведением характеристических функций задействованных плотностей, центральная предельная теорема имеет еще одну формулировку: произведение характеристических функций ряда функций плотности становится близким к характеристической функции нормальной плотности при неограниченном увеличении числа функций плотности при указанных выше условиях. В частности, к аргументу характеристической функции должен применяться соответствующий коэффициент масштабирования.

Эквивалентное утверждение можно сделать о преобразованиях Фурье , поскольку характеристическая функция по существу является преобразованием Фурье.

Расчет дисперсии

Пусть S n будет суммой n случайных величин. Многие центральные предельные теоремы предоставляют такие условия, что S n / Var ( S n ) сходится по распределению к N (0,1) (нормальное распределение со средним 0, дисперсией 1) при n → ∞ . В некоторых случаях можно найти константу σ 2 и функцию f (n) такие, что S n / (σ n⋅f ( n ) ) сходится по распределению к N (0,1) при n → ∞ .

Лемма. Пусть последовательность вещественных и строго стационарных случайных величин с для всех , , и . Построить

  1. Если абсолютно сходится , а потом что и где .
  2. Если дополнительно и сходится в распределении к as, то также сходится в распределении к as .

Расширения

Произведения положительных случайных величин

Логарифм продукта просто сумма логарифмов сомножителей. Следовательно, когда логарифм произведения случайных величин, принимающих только положительные значения, приближается к нормальному распределению, сам продукт приближается к логарифмически нормальному распределению . Многие физические величины (особенно масса или длина, которые зависят от масштаба и не могут быть отрицательными) являются продуктами различных случайных факторов, поэтому они подчиняются логнормальному распределению. Эту мультипликативную версию центральной предельной теоремы иногда называют законом Гибрата .

В то время как центральная предельная теорема для сумм случайных величин требует условия конечной дисперсии, соответствующая теорема для произведений требует соответствующего условия, что функция плотности интегрируема с квадратом.

За пределами классических рамок

Асимптотическая нормальность, то есть сходимость к нормальному распределению после соответствующего сдвига и масштабирования, является явлением гораздо более общим, чем классическая структура, рассмотренная выше, а именно суммы независимых случайных величин (или векторов). Время от времени появляются новые рамки; единой объединяющей основы пока нет.

Выпуклое тело

Теорема. Существует последовательность ε n ↓ 0, для которой выполняется следующее. Пусть n ≥ 1 , и пусть случайные величины X 1 ,…, X n имеют логарифмически вогнутую плотность соединений f такую, что f ( x 1 ,…, x n ) = f (| x 1 |,…, | x n | ) для всех x 1 ,…, x n и E ( X2
к
) = 1
для всех k = 1,…, n . Тогда распределение

является ε п -близкого к N (0,1) в общей вариации расстоянии .

Эти два ε n -близких распределения имеют плотности (фактически, логарифмически вогнутые плотности), таким образом, общее расстояние дисперсии между ними является интегралом абсолютного значения разницы между плотностями. Сходимость в полной вариации сильнее слабой.

Важным примером логарифмической плотности является функция, постоянная внутри данного выпуклого тела и исчезающая снаружи; она соответствует равномерному распределению на выпуклом теле, что объясняет термин «центральная предельная теорема для выпуклых тел».

Другой пример: f ( x 1 ,…, x n ) = const · exp (- (| x 1 | α + ⋯ + | x n | α ) β ), где α > 1 и αβ > 1 . Если β = 1, то f ( x 1 ,…, x n ) факторизуется в const · exp (- | x 1 | α )… exp (- | x n | α ), что означает , что X 1 ,…, X n независимы. . Однако в целом они зависимы.

Условие f ( x 1 ,…, x n ) = f (| x 1 |,…, | x n |) гарантирует, что X 1 ,…, X n имеют нулевое среднее и некоррелированы ; тем не менее, они не обязательно должны быть независимыми или даже попарно независимыми . Кстати, попарная независимость не может заменить независимость в классической центральной предельной теореме.

Вот результат типа Берри – Эссеена .

Теорема. Пусть X 1 ,…, X n удовлетворяют условиям предыдущей теоремы, тогда

для всех a < b ; здесь C - универсальная (абсолютная) постоянная . Более того, для любых c 1 ,…, c n таких, что c2
1
+ ⋯ + c2
п
= 1
,

Распределение X 1 + ⋯ + X n/пне обязательно должен быть приблизительно нормальным (фактически, он может быть однородным). Однако распределение c 1 X 1 + ⋯ + c n X n близко к N (0,1) (по общему расстоянию вариации) для большинства векторов ( c 1 ,…, c n ) в соответствии с равномерным распределением на сфера c2
1
+… + C2
п
= 1
.

Лакунарный тригонометрический ряд

Теорема ( Салем - Зигмунд ): Пусть U - случайная величина, равномерно распределенная на (0,2π) , и X k = r k cos ( n k U + a k ) , где

  • n k удовлетворяют условию лакунарности: существует q > 1 такое, что n k + 1qn k для всех k ,
  • r k таковы, что
  • 0 ≤ a k <2π .

потом

сходится по распределению к N (0,1/2) .

Гауссовы многогранники

Теорема. Пусть A 1 ,…, A n - независимые случайные точки на плоскости 2, каждая из которых имеет двумерное стандартное нормальное распределение. Пусть K n - выпуклая оболочка этих точек, а X n - площадь K n. Тогда

сходится по распределению к N (0,1), когда n стремится к бесконечности.

То же самое верно и для всех измерений больше 2.

Многогранник К п называется гауссовой случайной многогранник.

Аналогичный результат верен для числа вершин (многогранника Гаусса), числа ребер и фактически граней всех размерностей.

Линейные функции ортогональных матриц

Линейная функция матрицы M - это линейная комбинация ее элементов (с заданными коэффициентами), M ↦ tr ( AM ), где A - матрица коэффициентов; см. След (линейная алгебра) # Внутренний продукт .

Случайная ортогональная матрица называется равномерно распределенной, если ее распределение является нормированной мерой Хаара на ортогональной группе O ( n , ) ; см. Матрица вращения # Матрицы равномерного случайного вращения .

Теорема. Пусть M - случайная ортогональная матрица размера n × n, распределенная равномерно, а A - фиксированная матрица размера n × n, такая что tr ( AA *) = n , и пусть X = tr ( AM ) . Тогда распределение X близко к N (0,1) в метрике полной вариации с точностью до2 3/п - 1.

Подпоследовательности

Теорема. Пусть случайные величины X 1 , X 2 ,… ∈ L 2 (Ω) таковы, что X n → 0 слабо в L 2 (Ω) и X
п
→ 1
слабо в L 1 (Ω) . Тогда существуют целые числа n 1 < n 2 <⋯ такие, что

сходится по распределению к N (0,1), когда k стремится к бесконечности.

Случайное блуждание по кристаллической решетке

Центральная предельная теорема может быть установлена ​​для простого случайного блуждания по кристаллической решетке (бесконечный абелев накрывающий граф над конечным графом) и используется для проектирования кристаллических структур.

Приложения и примеры

Простой пример

Этот рисунок демонстрирует центральную предельную теорему. Средние выборки генерируются с использованием генератора случайных чисел, который извлекает числа от 0 до 100 из равномерного распределения вероятностей. Это показывает, что увеличение размера выборки приводит к тому, что 500 измеренных выборочных средних более близко распределяются относительно среднего по генеральной совокупности (в данном случае 50). Он также сравнивает наблюдаемые распределения с распределениями, которые можно было бы ожидать от нормализованного гауссовского распределения, и показывает значения хи-квадрат, которые количественно определяют качество подбора (подгонка хороша, если приведенное значение хи-квадрат меньше или приблизительно равно единице). Входными данными в нормализованную функцию Гаусса является среднее значение выборки (~ 50) и среднее стандартное отклонение выборки, деленное на квадратный корень из размера выборки (~ 28,87 / n ), которое называется стандартным отклонением среднего ( поскольку это относится к разбросу выборочных средств).

Простой пример центральной предельной теоремы - бросание множества одинаковых несмещенных игральных костей. Распределение суммы (или среднего) выпавших чисел будет хорошо аппроксимировано нормальным распределением. Поскольку реальные величины часто представляют собой сбалансированную сумму многих ненаблюдаемых случайных событий, центральная предельная теорема также дает частичное объяснение преобладания нормального распределения вероятностей. Это также оправдывает приближение статистики большой выборки к нормальному распределению в контролируемых экспериментах.

Сравнение функций плотности вероятности ** p ( k ) для суммы n справедливых 6-сторонних игральных костей, чтобы показать их сходимость к нормальному распределению с увеличением n в соответствии с центральной предельной теоремой. На нижнем правом графике сглаженные профили предыдущих графиков масштабируются, накладываются друг на друга и сравниваются с нормальным распределением (черная кривая).
Еще одно моделирование с использованием биномиального распределения. Были сгенерированы случайные 0 и 1, а затем рассчитаны их средние для размеров выборки от 1 до 512. Обратите внимание, что по мере увеличения размера выборки хвосты становятся тоньше, а распределение становится более концентрированным вокруг среднего.

Реальные приложения

Опубликованная литература содержит ряд полезных и интересных примеров и приложений, относящихся к центральной предельной теореме. Один источник приводит следующие примеры:

  • Распределение вероятностей для общего расстояния, пройденного при случайном блуждании (смещенном или несмещенном), будет иметь тенденцию к нормальному распределению .
  • Подбрасывание большого количества монет приведет к нормальному распределению общего количества решек (или, что эквивалентно, общего количества решек).

С другой точки зрения, центральная предельная теорема объясняет обычное появление «колоколообразной кривой» в оценках плотности, применяемых к реальным данным. В таких случаях, как электронный шум, экзаменационные оценки и т. Д., Мы часто можем рассматривать одно измеренное значение как средневзвешенное значение множества небольших эффектов. Затем, используя обобщения центральной предельной теоремы, мы можем увидеть, что это часто (хотя и не всегда) приводит к окончательному распределению, которое является приблизительно нормальным.

В общем, чем больше измерение похоже на сумму независимых переменных с равным влиянием на результат, тем больше нормальности оно демонстрирует. Это оправдывает обычное использование этого распределения для замены эффектов ненаблюдаемых переменных в таких моделях, как линейная модель .

Регресс

Регрессионный анализ и, в частности, обычный метод наименьших квадратов указывает, что зависимая переменная зависит в соответствии с некоторой функцией от одной или нескольких независимых переменных с дополнительным членом ошибки . Различные типы статистического вывода о регрессии предполагают, что член ошибки имеет нормальное распределение. Это предположение может быть оправдано, если предположить, что член ошибки на самом деле является суммой многих независимых членов ошибки; даже если отдельные члены ошибки не распределены нормально, по центральной предельной теореме их сумма может быть хорошо аппроксимирована нормальным распределением.

Другие иллюстрации

Учитывая его важность для статистики, доступен ряд статей и компьютерных пакетов, демонстрирующих сходимость, заложенную в центральной предельной теореме.

История

Голландский математик Хенк Теймс пишет:

Центральная предельная теорема имеет интересную историю. Первая версия этой теоремы была постулирована математиком французского происхождения Абрахамом де Муавром, который в замечательной статье, опубликованной в 1733 году, использовал нормальное распределение для аппроксимации распределения числа орлов в результате множества подбрасываний честной монеты. Это открытие намного опередило свое время и было почти забыто, пока знаменитый французский математик Пьер-Симон Лаплас не спас его из безвестности в своей монументальной работе « Аналитическая теория вероятностей» , которая была опубликована в 1812 году. Лаплас расширил открытие Де Муавра, аппроксимируя бином. распределение с нормальным распределением. Но, как и в случае с Де Муавром, открытие Лапласа не привлекло особого внимания в его время. Лишь в конце XIX века важность центральной предельной теоремы была осознана, когда в 1901 году русский математик Александр Ляпунов дал ей общие определения и точно доказал, как она работает математически. В настоящее время центральная предельная теорема считается неофициальным сувереном теории вероятностей.

Сэр Фрэнсис Гальтон описал центральную предельную теорему следующим образом:

Я не знаю ничего более впечатляющего в воображении, чем чудесная форма космического порядка, выраженная «Законом частоты ошибок». Закон был бы олицетворен греками и обожествлен, если бы они знали о нем. Он царит безмятежно и в полном самоуничижении среди самого дикого смятения. Чем больше толпа и чем больше очевидная анархия, тем совершеннее ее власть. Это высший закон безрассудства. Всякий раз, когда берется большая выборка хаотических элементов и выстраивается в порядке их величины, неожиданная и самая красивая форма регулярности оказывается скрытой все время.

Фактический термин «центральная предельная теорема» (по-немецки: «zentraler Grenzwertsatz») впервые был использован Джорджем Полей в 1920 году в названии статьи. Полиа назвал теорему «центральной» из-за ее важности в теории вероятностей. Согласно Ле Каму, французская школа вероятностей интерпретирует слово центральный в том смысле, что «оно описывает поведение центра распределения в противоположность его хвостам». Реферат статьи Полиа о центральной предельной теореме вероятностного исчисления и проблеме моментов в 1920 г. переводится следующим образом.

Появление гауссовой плотности вероятности 1 = e - x 2 в повторяющихся экспериментах, в ошибках измерений, которые приводят к комбинации очень многих и очень маленьких элементарных ошибок, в процессах диффузии и т. Д., Можно объяснить, а также хорошо: известно по той же предельной теореме, которая играет центральную роль в исчислении вероятностей. Настоящего первооткрывателя этой предельной теоремы следует назвать Лапласом; вполне вероятно, что его строгое доказательство было впервые дано Чебыщефом, а его наиболее точную формулировку, насколько мне известно, можно найти в статье Ляпунова . ...

Полное изложение истории теоремы с подробным описанием основополагающей работы Лапласа, а также вкладов Коши , Бесселя и Пуассона предоставлено Халдом. Ганс Фишер приводит два исторических отчета, один из которых охватывает развитие от Лапласа до Коши, а второй - вклад фон Мизеса , Поли , Линдеберга , Леви и Крамера в 1920-е годы. Ле Кам описывает период около 1935 года. Бернштейн представляет историческую дискуссию, посвященную работе Пафнутия Чебышева и его учеников Андрея Маркова и Александра Ляпунова, которая привела к первым доказательствам CLT в общих условиях.

Любопытная сноска к истории центральной предельной теоремы является то , что доказательство результата аналогичны 1922 Линдеберг ЦПТА было предметом Алан Тьюринг «s 1934 стипендий Диссертации на Королевский колледж в Кембриджском университете . Только после отправки работы Тьюринг узнал, что она уже доказана. Следовательно, диссертация Тьюринга не была опубликована.

Смотрите также

Примечания

использованная литература

внешние ссылки