Смешанный логит - Mixed logit

Смешанный логит - это полностью общая статистическая модель для изучения дискретных вариантов . Он преодолевает три важных ограничения стандартной логит-модели , допуская случайные вариации вкуса у разных лиц, выбирающих, неограниченные шаблоны замены между вариантами выбора и корреляцию в ненаблюдаемых факторах с течением времени. Смешанный логит может выбрать любое распределение для случайных коэффициентов, в отличие от пробита, который ограничен нормальным распределением. Это называется «смешанный логит», потому что вероятность выбора представляет собой смесь логитов с распределением смешения. Было показано, что смешанная логит-модель может аппроксимировать с любой степенью точности любую истинную случайную полезную модель дискретного выбора при условии соответствующей спецификации переменных и распределения коэффициентов.

Случайная вариация вкуса

Коэффициенты вкуса стандартной логит-модели фиксированы, что означает, что они одинаковы для всех. У смешанного логита разные логиты для каждого человека (т. Е. Для каждого лица, принимающего решения).

В стандартной модели логита полезность человека в качестве альтернативы равна:

с участием

~ iid экстремальное значение

Для модели смешанного логита эта спецификация обобщается, позволяя быть случайным. Полезность человека для альтернативы в модели смешанного логита:

с участием

~ iid экстремальное значение

где θ - параметры распределения s по генеральной совокупности, такие как среднее значение и дисперсия .

При условии , что вероятность того, что человек выберет альтернативу, является стандартной логит-формулой:

Однако, поскольку она случайна и неизвестна, (безусловная) вероятность выбора является интегралом этой логит-формулы по плотности .

Эта модель также называется логит-моделью случайных коэффициентов, поскольку является случайной величиной. Это позволяет наклонам полезности (т. Е. Предельной полезности) быть случайными, что является расширением модели случайных эффектов, в которой только пересечение было стохастическим.

Любая функция плотности вероятности может быть указана для распределения коэффициентов в генеральной совокупности, т. Е. Для . Чаще всего используется обычный дистрибутив, в основном из-за его простоты. Для коэффициентов, которые принимают один и тот же знак для всех людей, таких как коэффициент цены, который обязательно отрицателен, или коэффициент желаемого атрибута, используются распределения с поддержкой только с одной стороны от нуля, такие как логнормальное. Когда коэффициенты не могут логически быть неограниченно большими или маленькими, часто используются ограниченные распределения, такие как треугольные или треугольные распределения.

Неограниченные шаблоны замены

Модель смешанного логита может представлять общий шаблон замещения, поскольку она не демонстрирует ограничительную независимость логита от свойства нерелевантных альтернатив (IIA). Процентное изменение человека «S безусловная вероятность выбора альтернативы дается процентное изменение в м - й атрибут альтернативы (в эластичности по отношению к ) является

где это м го элемента . Из этой формулы можно увидеть, что десятипроцентное сокращение для необязательно означает (как в случае с логитом) десятипроцентное сокращение для каждой другой альтернативы . Причина в том, что относительные проценты зависят от корреляции между условной вероятностью того, что человек выберет альтернативу, и условной вероятностью того, что человек выберет альтернативу из различных вариантов .

Корреляция ненаблюдаемых факторов во времени

Стандартный logit не принимает во внимание какие-либо ненаблюдаемые факторы, которые сохраняются во времени для данного лица, принимающего решения. Это может быть проблемой, если вы используете панельные данные, которые представляют повторяющийся выбор с течением времени. Применяя стандартную логит-модель к панельным данным, вы делаете допущение, что ненаблюдаемые факторы, влияющие на выбор человека, являются новыми каждый раз, когда человек делает выбор. Это очень маловероятное предположение. Чтобы учесть как случайные вариации вкуса, так и корреляцию ненаблюдаемых факторов во времени, полезность для респондента n для альтернативы i в момент времени t определяется следующим образом:

где нижний индекс t - измерение времени. Мы по-прежнему делаем предположение логита, которое является экстремальным значением iid. Это означает, что это не зависит от времени, людей и альтернатив. по сути, это просто белый шум. Тем не менее, корреляция во времени и по альтернативам возникает из общего эффекта «s», которые входят в полезность в каждый период времени и для каждой альтернативы.

Чтобы подробно изучить корреляцию, предположим, что β нормально распределены со средним значением и дисперсией . Тогда уравнение полезности принимает следующий вид:

и η - результат стандартной нормальной плотности. После перестановки уравнение выглядит следующим образом:

где собраны ненаблюдаемые факторы . От ненаблюдаемых факторов не зависит от времени и не зависит от времени или альтернатив.

Тогда ковариация между альтернативами и равна,

а ковариация между временем и равна

Задавая X соответствующим образом, можно получить любой образец ковариации во времени и альтернативы.

При условии , вероятность последовательности выборов, сделанных человеком, является просто произведением логит-вероятности каждого индивидуального выбора этого человека:

поскольку не зависит от времени. Тогда (безусловная) вероятность последовательности выборов - это просто интеграл этого произведения логитов по плотности .

Моделирование

К сожалению, нет закрытой формы для интеграла, который входит в вероятность выбора, и поэтому исследователь должен моделировать P n . К счастью для исследователя, моделирование P n может быть очень простым. Необходимо выполнить четыре основных шага

1. Возьмите функцию плотности вероятности, которую вы указали для «вкусовых» коэффициентов. То есть возьмите розыгрыш и обозначьте его для представления первого розыгрыша.

2. Рассчитайте . (Условная вероятность.)

3. Повторите много раз для .

4. Усредните результаты.

Тогда формула для моделирования будет выглядеть следующим образом:

где R - общее количество розыгрышей, взятых из раздачи, а r - одна розыгрыш.

Как только это будет сделано, у вас будет значение вероятности каждой альтернативы i для каждого респондента n.

Смотрите также

дальнейшее чтение

Рекомендации