Непараметрическая регрессия - Nonparametric regression

Непараметрическая регрессия - это категория регрессионного анализа, в которой предиктор не принимает заранее заданную форму, а строится в соответствии с информацией, полученной из данных. То есть не предполагается параметрической формы для отношения между предикторами и зависимой переменной. Непараметрическая регрессия требует больших размеров выборки, чем регрессия, основанная на параметрических моделях, потому что данные должны содержать структуру модели, а также оценки модели.

Определение

В непараметрической регрессии, мы имеем случайные величины и и предположим следующее соотношение:

где - некоторая детерминированная функция. Линейная регрессия - это ограниченный случай непараметрической регрессии, где предполагается, что она аффинная. Некоторые авторы используют более сильное предположение об аддитивном шуме:

где случайная величина - это "шумовой член" со средним 0. Без предположения, что принадлежит определенному параметрическому семейству функций, невозможно получить несмещенную оценку для , однако большинство оценок согласованы при подходящих условиях.

Список универсальных алгоритмов непараметрической регрессии

Это неполный список алгоритмов, подходящих для задач непараметрической регрессии.

Примеры

Регрессия гауссовского процесса или кригинг

В регрессии гауссовского процесса, также известной как кригинг, для кривой регрессии предполагается гауссовский априор. Предполагается, что ошибки имеют многомерное нормальное распределение, а кривая регрессии оценивается по ее апостериорной моде . Гауссовский априор может зависеть от неизвестных гиперпараметров, которые обычно оцениваются эмпирическим методом Байеса . Гиперпараметры обычно определяют предварительное ядро ​​ковариации. В случае, если ядро ​​также должно быть выведено непараметрическим образом из данных, можно использовать критический фильтр .

Сглаживающие сплайны интерпретируются как апостериорная мода регрессии гауссовского процесса.

Регрессия ядра

Пример кривой (красная линия), соответствующей небольшому набору данных (черные точки) с непараметрической регрессией с использованием сглаживания ядра Гаусса. Розовая заштрихованная область иллюстрирует функцию ядра, применяемую для получения оценки y для заданного значения x. Функция ядра определяет вес, присвоенный каждой точке данных при оценке целевой точки.

Регрессия ядра оценивает непрерывную зависимую переменную по ограниченному набору точек данных путем свертки местоположений точек данных с помощью функции ядра - приблизительно говоря, функция ядра указывает, как «размыть» влияние точек данных, чтобы их значения могли быть используется для прогнозирования стоимости для ближайших местоположений.

Деревья регрессии

Алгоритмы обучения дерева решений могут применяться, чтобы научиться предсказывать зависимую переменную на основе данных. Хотя исходная формулировка дерева классификации и регрессии (CART) применялась только для прогнозирования одномерных данных, эту структуру можно использовать для прогнозирования многомерных данных, включая временные ряды.

Смотрите также

Рекомендации

дальнейшее чтение

внешние ссылки