Прогнозируемое представление состояния - Predictive state representation
В информатике , предсказание состояния представление ( PSR ) является способом смоделировать состояние управляемой динамической системы из истории действий , предпринятых и в результате наблюдений. PSR фиксирует состояние системы как вектор прогнозов для будущих тестов (экспериментов), которые могут быть выполнены в системе. Тест - это последовательность пар действие-наблюдение, и его предсказание - это вероятность того, что последовательность-наблюдение теста произойдет, если бы последовательность действий-теста была выполнена в системе. Одним из преимуществ использования PSR является то, что прогнозы напрямую связаны с наблюдаемыми величинами. Это отличается от других моделей динамических систем, таких как частично наблюдаемые марковские процессы принятия решений (POMDP), где состояние системы представлено как распределение вероятностей по ненаблюдаемым номинальным состояниям.
Рекомендации
- Литтман, Майкл Л .; Ричард С. Саттон ; Сатиндер Сингх (2002). «Прогнозные представления состояния» (PDF) . Достижения в системах обработки нейронной информации 14 (NIPS) . С. 1555–1561.
- Сингх, Сатиндер; Майкл Р. Джеймс; Мэтью Р. Рудари (2004). "Предсказательные представления состояний: новая теория моделирования динамических систем" (PDF) . Неопределенность в искусственном интеллекте: материалы двадцатой конференции (UAI) . С. 512–519.
- Вевиора, Эрик Уолтер (2008), Моделирование распределений вероятностей с помощью прогнозных представлений состояний (PDF)
Эта статья об искусственном интеллекте незавершена . Вы можете помочь Википедии, расширив ее . |