Средний и прогнозируемый ответ - Mean and predicted response

В линейной регрессии , средний отклик и предсказал отклика являются значениями зависимой переменной , рассчитанной из параметров регрессии и при заданном значении независимой переменной. Значения этих двух ответов одинаковы, но их расчетные отклонения различаются.

Задний план

При прямой подгонке модель

где - переменная ответа , - объясняющая переменная , ε i - случайная ошибка, и - параметры. Среднее и прогнозируемое значение отклика для данного объяснительного значения x d определяется выражением

в то время как фактический ответ будет

Выражения для значений и дисперсий и даны в линейной регрессии .

Средний ответ

Поскольку данные в этом контексте определяются как пары ( x , y ) для каждого наблюдения, средний ответ при заданном значении x , скажем, x d , является оценкой среднего значений y в совокупности в точке x значение x d , то есть . Дисперсия среднего отклика определяется выражением

Это выражение можно упростить до

где m - количество точек данных.

Чтобы продемонстрировать это упрощение, можно использовать тождество

Прогнозируемый ответ

Предсказал ответ распределение прогнозируемое распределение остатков в данной точке х г . Таким образом, дисперсия определяется выражением

Вторая строка следует из того факта, что она равна нулю, потому что новая точка прогноза не зависит от данных, используемых для соответствия модели. Кроме того, ранее был рассчитан срок для среднего ответа.

Поскольку (фиксированный, но неизвестный параметр, который можно оценить), дисперсия прогнозируемого отклика определяется выражением

Доверительные интервалы

Эти доверительные интервалы вычисляются . Таким образом, доверительный интервал предсказанного ответа шире, чем интервал среднего ответа. Это ожидается интуитивно - дисперсия совокупности значений не уменьшается при выборке из нее, потому что случайная величина ε i не уменьшается, но дисперсия среднего значения уменьшается с увеличением выборки, потому что дисперсия в и уменьшаются, поэтому средний отклик (прогнозируемое значение отклика) становится ближе к .

Это аналогично разнице между дисперсией генеральной совокупности и дисперсией выборочного среднего для генеральной совокупности: дисперсия генеральной совокупности является параметром и не изменяется, но дисперсия выборочного среднего уменьшается с увеличением выборки.

Общая линейная регрессия

Общая линейная модель может быть записана как

Следовательно, поскольку общее выражение для дисперсии среднего отклика имеет вид

где S - ковариационная матрица параметров, заданная формулой

Ссылки

  • Draper, NR; Смит, Х. (1998). Прикладной регрессионный анализ (3-е изд.). Джон Вили. ISBN 0-471-17082-8.