Квадратные отклонения от среднего значения (SDM) используются в различных расчетах. В теории вероятностей и статистике определение дисперсии - это либо ожидаемое значение SDM (при рассмотрении теоретического распределения ), либо его среднее значение (для фактических экспериментальных данных). Вычисления для дисперсионного анализа включают разбиение суммы SDM.
Вступление
Понимание используемых вычислений значительно улучшается за счет изучения статистической ценности
E
(
Икс
2
)
{\ displaystyle \ operatorname {E} (X ^ {2})}
, где - оператор ожидаемого значения.
E
{\ displaystyle \ operatorname {E}}
Для случайной величины со средним и дисперсией ,
Икс
{\ displaystyle X}
μ
{\ displaystyle \ mu}
σ
2
{\ displaystyle \ sigma ^ {2}}
σ
2
знак равно
E
(
Икс
2
)
-
μ
2
.
{\ displaystyle \ sigma ^ {2} = \ operatorname {E} (X ^ {2}) - \ mu ^ {2}.}
Следовательно,
E
(
Икс
2
)
знак равно
σ
2
+
μ
2
.
{\ displaystyle \ operatorname {E} (X ^ {2}) = \ sigma ^ {2} + \ mu ^ {2}.}
Из вышесказанного можно вывести следующее:
E
(
∑
(
Икс
2
)
)
знак равно
п
σ
2
+
п
μ
2
,
{\ Displaystyle \ OperatorName {E} \ left (\ sum \ left (X ^ {2} \ right) \ right) = n \ sigma ^ {2} + n \ mu ^ {2},}
E
(
(
∑
Икс
)
2
)
знак равно
п
σ
2
+
п
2
μ
2
.
{\ displaystyle \ operatorname {E} \ left (\ left (\ sum X \ right) ^ {2} \ right) = n \ sigma ^ {2} + n ^ {2} \ mu ^ {2}.}
Выборочная дисперсия
Сумма квадратов отклонений, необходимых для расчета дисперсии выборки (до принятия решения о делении на n или n - 1), проще всего рассчитать как
S
знак равно
∑
Икс
2
-
(
∑
Икс
)
2
п
{\ Displaystyle S = \ сумма х ^ {2} - {\ гидроразрыва {\ влево (\ сумма х \ вправо) ^ {2}} {п}}}
Из двух производных ожиданий, приведенных выше, ожидаемое значение этой суммы равно
E
(
S
)
знак равно
п
σ
2
+
п
μ
2
-
п
σ
2
+
п
2
μ
2
п
{\ displaystyle \ operatorname {E} (S) = n \ sigma ^ {2} + n \ mu ^ {2} - {\ frac {n \ sigma ^ {2} + n ^ {2} \ mu ^ {2 }} {n}}}
что подразумевает
E
(
S
)
знак равно
(
п
-
1
)
σ
2
.
{\ displaystyle \ operatorname {E} (S) = (n-1) \ sigma ^ {2}.}
Это эффективно доказывает использование делителя n - 1 при вычислении несмещенной выборочной оценки σ 2 .
Разделение - дисперсионный анализ
В ситуации, когда данные доступны для k различных групп лечения, имеющих размер n i, где i варьируется от 1 до k , тогда предполагается, что ожидаемое среднее значение для каждой группы равно
E
(
μ
я
)
знак равно
μ
+
Т
я
{\ displaystyle \ operatorname {E} (\ mu _ {i}) = \ mu + T_ {i}}
и дисперсия каждой экспериментальной группы не отличается от дисперсии популяции .
σ
2
{\ displaystyle \ sigma ^ {2}}
Согласно нулевой гипотезе о том, что лечение не оказывает никакого эффекта, каждое из значений будет равно нулю.
Т
я
{\ displaystyle T_ {i}}
Теперь можно вычислить три суммы квадратов:
Физическое лицо
я
знак равно
∑
Икс
2
{\ Displaystyle I = \ сумма х ^ {2}}
E
(
я
)
знак равно
п
σ
2
+
п
μ
2
{\ displaystyle \ operatorname {E} (I) = n \ sigma ^ {2} + n \ mu ^ {2}}
Лечение
Т
знак равно
∑
я
знак равно
1
k
(
(
∑
Икс
)
2
/
п
я
)
{\ Displaystyle Т = \ сумма _ {я = 1} ^ {к} \ влево (\ влево (\ сумма х \ вправо) ^ {2} / п_ {я} \ вправо)}
E
(
Т
)
знак равно
k
σ
2
+
∑
я
знак равно
1
k
п
я
(
μ
+
Т
я
)
2
{\ displaystyle \ operatorname {E} (T) = k \ sigma ^ {2} + \ sum _ {i = 1} ^ {k} n_ {i} (\ mu + T_ {i}) ^ {2}}
E
(
Т
)
знак равно
k
σ
2
+
п
μ
2
+
2
μ
∑
я
знак равно
1
k
(
п
я
Т
я
)
+
∑
я
знак равно
1
k
п
я
(
Т
я
)
2
{\ displaystyle \ operatorname {E} (T) = k \ sigma ^ {2} + n \ mu ^ {2} +2 \ mu \ sum _ {i = 1} ^ {k} (n_ {i} T_ { i}) + \ sum _ {i = 1} ^ {k} n_ {i} (T_ {i}) ^ {2}}
При нулевой гипотезе о том, что методы лечения не вызывают различий и все они равны нулю, ожидание упрощается до
Т
я
{\ displaystyle T_ {i}}
E
(
Т
)
знак равно
k
σ
2
+
п
μ
2
.
{\ displaystyle \ operatorname {E} (T) = k \ sigma ^ {2} + n \ mu ^ {2}.}
Комбинация
C
знак равно
(
∑
Икс
)
2
/
п
{\ Displaystyle С = \ влево (\ сумма х \ вправо) ^ {2} / п}
E
(
C
)
знак равно
σ
2
+
п
μ
2
{\ Displaystyle \ OperatorName {E} (C) = \ sigma ^ {2} + п \ mu ^ {2}}
Суммы квадратов отклонений
Согласно нулевой гипотезе, различие любой пары I , T и C не содержит никакой зависимости только от .
μ
{\ displaystyle \ mu}
σ
2
{\ displaystyle \ sigma ^ {2}}
E
(
я
-
C
)
знак равно
(
п
-
1
)
σ
2
{\ Displaystyle \ OperatorName {E} (IC) = (n-1) \ sigma ^ {2}}
общие квадраты отклонений или общая сумма квадратов
E
(
Т
-
C
)
знак равно
(
k
-
1
)
σ
2
{\ Displaystyle \ OperatorName {E} (TC) = (k-1) \ sigma ^ {2}}
Отклонения в квадрате лечения, также известные как сумма квадратов
E
(
я
-
Т
)
знак равно
(
п
-
k
)
σ
2
{\ Displaystyle \ OperatorName {E} (IT) = (nk) \ sigma ^ {2}}
остаточные квадраты отклонений, иначе называемые остаточной суммой квадратов
Константы ( n - 1), ( k - 1) и ( n - k ) обычно называют числом степеней свободы .
Пример
В очень простом примере пять наблюдений возникают в результате двух обработок. Первая обработка дает три значения 1, 2 и 3, а вторая обработка дает два значения 4 и 6.
я
знак равно
1
2
1
+
2
2
1
+
3
2
1
+
4
2
1
+
6
2
1
знак равно
66
{\ displaystyle I = {\ frac {1 ^ {2}} {1}} + {\ frac {2 ^ {2}} {1}} + {\ frac {3 ^ {2}} {1}} + {\ frac {4 ^ {2}} {1}} + {\ frac {6 ^ {2}} {1}} = 66}
Т
знак равно
(
1
+
2
+
3
)
2
3
+
(
4
+
6
)
2
2
знак равно
12
+
50
знак равно
62
{\ displaystyle T = {\ frac {(1 + 2 + 3) ^ {2}} {3}} + {\ frac {(4 + 6) ^ {2}} {2}} = 12 + 50 = 62 }
C
знак равно
(
1
+
2
+
3
+
4
+
6
)
2
5
знак равно
256
/
5
знак равно
51,2
{\ displaystyle C = {\ frac {(1 + 2 + 3 + 4 + 6) ^ {2}} {5}} = 256/5 = 51,2}
Давая
Суммарные квадраты отклонений = 66 - 51,2 = 14,8 с 4 степенями свободы.
Квадрат отклонений лечения = 62 - 51,2 = 10,8 с 1 степенью свободы.
Остаточные квадратные отклонения = 66 - 62 = 4 с 3 степенями свободы.
Двусторонний дисперсионный анализ
Следующий гипотетический пример показывает урожайность 15 растений, подверженных двум различным изменениям окружающей среды и трех различных удобрений.
Дополнительный CO 2
Дополнительная влажность
Без удобрений
7, 2, 1
7, 6
Нитрат
11, 6
10, 7, 3
Фосфат
5, 3, 4
11, 4
Рассчитываются пять сумм квадратов:
Фактор
Расчет
Сумма
σ
2
{\ displaystyle \ sigma ^ {2}}
Физическое лицо
7
2
+
2
2
+
1
2
+
7
2
+
6
2
+
11
2
+
6
2
+
10
2
+
7
2
+
3
2
+
5
2
+
3
2
+
4
2
+
11
2
+
4
2
{\ displaystyle 7 ^ {2} + 2 ^ {2} + 1 ^ {2} + 7 ^ {2} + 6 ^ {2} + 11 ^ {2} + 6 ^ {2} + 10 ^ {2} + 7 ^ {2} + 3 ^ {2} + 5 ^ {2} + 3 ^ {2} + 4 ^ {2} + 11 ^ {2} + 4 ^ {2}}
641
15
Удобрение × Окружающая среда
(
7
+
2
+
1
)
2
3
+
(
7
+
6
)
2
2
+
(
11
+
6
)
2
2
+
(
10
+
7
+
3
)
2
3
+
(
5
+
3
+
4
)
2
3
+
(
11
+
4
)
2
2
{\ displaystyle {\ frac {(7 + 2 + 1) ^ {2}} {3}} + {\ frac {(7 + 6) ^ {2}} {2}} + {\ frac {(11+ 6) ^ {2}} {2}} + {\ frac {(10 + 7 + 3) ^ {2}} {3}} + {\ frac {(5 + 3 + 4) ^ {2}} { 3}} + {\ frac {(11 + 4) ^ {2}} {2}}}
556.1667
6
Удобрения
(
7
+
2
+
1
+
7
+
6
)
2
5
+
(
11
+
6
+
10
+
7
+
3
)
2
5
+
(
5
+
3
+
4
+
11
+
4
)
2
5
{\ displaystyle {\ frac {(7 + 2 + 1 + 7 + 6) ^ {2}} {5}} + {\ frac {(11 + 6 + 10 + 7 + 3) ^ {2}} {5 }} + {\ frac {(5 + 3 + 4 + 11 + 4) ^ {2}} {5}}}
525,4
3
Среда
(
7
+
2
+
1
+
11
+
6
+
5
+
3
+
4
)
2
8
+
(
7
+
6
+
10
+
7
+
3
+
11
+
4
)
2
7
{\ displaystyle {\ frac {(7 + 2 + 1 + 11 + 6 + 5 + 3 + 4) ^ {2}} {8}} + {\ frac {(7 + 6 + 10 + 7 + 3 + 11 +4) ^ {2}} {7}}}
519.2679
2
Композитный
(
7
+
2
+
1
+
11
+
6
+
5
+
3
+
4
+
7
+
6
+
10
+
7
+
3
+
11
+
4
)
2
15
{\ displaystyle {\ frac {(7 + 2 + 1 + 11 + 6 + 5 + 3 + 4 + 7 + 6 + 10 + 7 + 3 + 11 + 4) ^ {2}} {15}}}
504,6
1
Наконец, можно вычислить суммы квадратов отклонений, необходимые для дисперсионного анализа .
Фактор
Сумма
σ
2
{\ displaystyle \ sigma ^ {2}}
Общее
Среда
Удобрения
Удобрение × Окружающая среда
Остаточный
Физическое лицо
641
15
1
1
Удобрение × Окружающая среда
556.1667
6
1
−1
Удобрения
525,4
3
1
−1
Среда
519.2679
2
1
−1
Композитный
504,6
1
−1
−1
−1
1
Квадратные отклонения
136,4
14,668
20,8
16,099
84,833
Степени свободы
14
1
2
2
9
Смотрите также
Рекомендации
^ Настроение и Graybill: Введение в теорию статистики (Макгроу Хилл)
<img src="https://en.wikipedia.org/wiki/Special:CentralAutoLogin/start?type=1x1" alt="" title="" width="1" height="1" style="border: none; position: absolute;">