Модель серого ящика - Grey box model

В математике , статистике и вычислительном моделировании модель серого ящика объединяет частичную теоретическую структуру с данными для завершения модели. Теоретическая структура может варьироваться от информации о гладкости результатов до моделей, которым нужны только значения параметров из данных или существующей литературы. Таким образом, почти все модели представляют собой модели «серого ящика», в отличие от « черного ящика», где не предполагается форма модели, или моделей « белого ящика», которые являются чисто теоретическими. Некоторые модели принимают особую форму, такую ​​как линейная регрессия или нейронная сеть . У них есть специальные методы анализа. В частности, методы линейной регрессии намного более эффективны, чем большинство нелинейных методов. Модель может быть детерминированной или стохастической (т.е. содержать случайные компоненты) в зависимости от ее планируемого использования.

Форма модели

Общий случай - это нелинейная модель с частичной теоретической структурой и некоторыми неизвестными частями, полученными из данных. Модели с непохожими теоретическими структурами необходимо оценивать индивидуально, возможно, с использованием имитационного отжига или генетических алгоритмов .

В рамках конкретной структуры модели может потребоваться найти параметры или отношения переменных параметров. Для конкретной структуры произвольно предполагается, что данные состоят из наборов векторов подачи f , векторов продукта p и векторов рабочих условий c . Обычно c будет содержать значения, извлеченные из f , а также другие значения. Во многих случаях модель может быть преобразована в функцию вида:

м (ж, р, д)

где векторная функция m дает ошибки между данными p и предсказаниями модели. Вектор q дает некоторые переменные параметры, которые являются неизвестными частями модели.

Параметры q изменяются в зависимости от условий эксплуатации c способом, который предстоит определить. Это отношение может быть определено как q = Ac, где A - матрица неизвестных коэффициентов, а c, как в линейной регрессии, включает постоянный член и, возможно, преобразованные значения исходных рабочих условий для получения нелинейных соотношений между исходными рабочими условиями и q. . Затем нужно выбрать, какие члены в A не равны нулю, и присвоить их значения. Завершение модели становится задачей оптимизации для определения ненулевых значений в A, что минимизирует ошибки m (f, p, Ac) по данным.

Завершение модели

После выбора ненулевых значений оставшиеся коэффициенты в A могут быть определены путем минимизации m ( f , p , Ac ) по данным относительно ненулевых значений в A , обычно с помощью нелинейных наименьших квадратов . Выбор ненулевых членов может быть выполнен методами оптимизации, такими как имитация отжига и эволюционные алгоритмы . Также нелинейный метод наименьших квадратов может обеспечить оценки точности для элементов A, которые можно использовать, чтобы определить, значительно ли они отличаются от нуля, тем самым обеспечивая метод выбора термина .

Иногда можно вычислить значения q для каждого набора данных напрямую или нелинейным методом наименьших квадратов . Затем более эффективная линейная регрессия может использоваться для прогнозирования q с использованием c, таким образом выбирая ненулевые значения в A и оценивая их значения. Как только ненулевые значения найдены, нелинейный метод наименьших квадратов можно использовать в исходной модели m (f, p, Ac) для уточнения этих значений.

Третий метод - это инверсия модели , которая преобразует нелинейную m ( f , p , Ac ) в приближенную линейную форму в элементах A , которую можно исследовать, используя эффективный выбор терминов и оценку линейной регрессии. Для простого случая единственного значения q ( q = a T c ) и оценки q * значения q . Положив d q  =  a T c  -  q *, получаем

m (f, p, a T c) = m (f, p, q * + d q) ≈ m (f, pq *) + d q m '(f, p, q *) = m (f, pq *) + (a T c - q *) m '(f, p, q *)

так что Т теперь в линейном положении со всеми другими терминами , известными, и , таким образом , могут быть проанализированы с помощью линейной регрессии методов. Для более чем одного параметра метод расширяется напрямую. После проверки того, что модель была улучшена, этот процесс можно повторять до сходимости. Этот подход имеет преимущества, заключающиеся в том, что не требуется, чтобы параметры q можно было определить из отдельного набора данных, а линейная регрессия основана на исходных условиях ошибки.

Проверка модели

При наличии достаточного количества данных рекомендуется разделить их на отдельный набор для построения модели и один или два набора для оценки . Это можно повторить с использованием нескольких выборок из набора построений и усреднения полученных моделей или использования их для оценки различий в прогнозах.

Статистический тест, такой как критерий хи-квадрат для остатков, не особенно полезен. Критерий хи-квадрат требует известных стандартных отклонений, которые редко доступны, а неудавшиеся тесты не дают указаний на то, как улучшить модель. Существует ряд методов для сравнения как вложенных, так и невложенных моделей. Сюда входит сравнение прогнозов модели с повторяющимися данными.

Попытка предсказать остатки m (,) с рабочими условиями c с использованием линейной регрессии покажет, можно ли предсказать остатки. Остатки, которые невозможно предсказать, дают мало шансов на улучшение модели с использованием текущих условий эксплуатации. Термины, которые действительно предсказывают остатки, являются перспективными терминами, которые следует включить в модель для улучшения ее характеристик.

Приведенный выше метод инверсии модели может использоваться как метод определения возможности улучшения модели. В этом случае отбор ненулевых слагаемых не столь важно и линейное предсказание может быть выполнено с использованием значительных собственных векторов на регрессионной матрицы . Значения в A, определенные таким образом, необходимо подставить в нелинейную модель, чтобы оценить улучшения в ошибках модели. Отсутствие значительного улучшения указывает на то, что имеющиеся данные не могут улучшить текущую форму модели с использованием определенных параметров. В модель можно вставить дополнительные параметры, чтобы сделать этот тест более полным.

Смотрите также

Рекомендации