Смешанный логит - Mixed logit

Смешанный логит - это полностью общая статистическая модель для изучения дискретных вариантов . Он преодолевает три важных ограничения стандартной логит-модели , допуская случайные вариации вкуса у разных лиц, выбирающих, неограниченные шаблоны замены между вариантами выбора и корреляцию в ненаблюдаемых факторах с течением времени. Смешанный логит может выбрать любое распределение для случайных коэффициентов, в отличие от пробита, который ограничен нормальным распределением. Это называется «смешанный логит», потому что вероятность выбора представляет собой смесь логитов с распределением смешения. Было показано, что смешанная логит-модель может аппроксимировать с любой степенью точности любую истинную случайную полезную модель дискретного выбора при условии соответствующей спецификации переменных и распределения коэффициентов. ${\ displaystyle f}$ ${\ displaystyle f}$

Случайная вариация вкуса

Коэффициенты вкуса стандартной логит-модели фиксированы, что означает, что они одинаковы для всех. У смешанного логита разные логиты для каждого человека (т. Е. Для каждого лица, принимающего решения). ${\ displaystyle \ beta}$ ${\ displaystyle \ beta}$ ${\ displaystyle \ beta}$

В стандартной модели логита полезность человека в качестве альтернативы равна: ${\ displaystyle n}$ ${\ displaystyle i}$

{\ displaystyle U_ {ni} = \ beta x_ {ni} + \ varepsilon _ {ni}}

с участием

{\ displaystyle \ varepsilon _ {ni}}

~ iid экстремальное значение

Для модели смешанного логита эта спецификация обобщается, позволяя быть случайным. Полезность человека для альтернативы в модели смешанного логита: ${\ displaystyle \ beta _ {n}}$ ${\ displaystyle n}$ ${\ displaystyle i}$

{\ displaystyle U_ {ni} = \ beta _ {n} x_ {ni} + \ varepsilon _ {ni}}

с участием

{\ displaystyle \ varepsilon _ {ni}}

~ iid экстремальное значение

{\ Displaystyle \ квад \ бета _ {п} \ сим е (\ бета | \ тета)}

где θ - параметры распределения s по генеральной совокупности, такие как среднее значение и дисперсия . ${\ displaystyle \ beta _ {n}}$ ${\ displaystyle \ beta _ {n}}$

При условии , что вероятность того, что человек выберет альтернативу, является стандартной логит-формулой: ${\ displaystyle \ beta _ {n}}$ ${\ displaystyle n}$ ${\ displaystyle i}$

{\ displaystyle L_ {ni} (\ beta _ {n}) = {\ frac {e ^ {\ beta _ {n} X_ {ni}}} {\ sum _ {j} e ^ {\ beta _ {n } X_ {nj}}}}}

Однако, поскольку она случайна и неизвестна, (безусловная) вероятность выбора является интегралом этой логит-формулы по плотности . ${\ displaystyle \ beta _ {n}}$ ${\ displaystyle \ beta _ {n}}$

{\ displaystyle P_ {ni} = \ int L_ {ni} (\ beta) f (\ beta | \ theta) d \ beta}

Эта модель также называется логит-моделью случайных коэффициентов, поскольку является случайной величиной. Это позволяет наклонам полезности (т. Е. Предельной полезности) быть случайными, что является расширением модели случайных эффектов, в которой только пересечение было стохастическим. ${\ displaystyle \ beta _ {n}}$

Любая функция плотности вероятности может быть указана для распределения коэффициентов в генеральной совокупности, т. Е. Для . Чаще всего используется обычный дистрибутив, в основном из-за его простоты. Для коэффициентов, которые принимают один и тот же знак для всех людей, таких как коэффициент цены, который обязательно отрицателен, или коэффициент желаемого атрибута, используются распределения с поддержкой только с одной стороны от нуля, такие как логнормальное. Когда коэффициенты не могут логически быть неограниченно большими или маленькими, часто используются ограниченные распределения, такие как треугольные или треугольные распределения. ${\ Displaystyle е (\ бета | \ тета)}$ ${\ displaystyle S_ {b}}$

Неограниченные шаблоны замены

Модель смешанного логита может представлять общий шаблон замещения, поскольку она не демонстрирует ограничительную независимость логита от свойства нерелевантных альтернатив (IIA). Процентное изменение человека «S безусловная вероятность выбора альтернативы дается процентное изменение в м - й атрибут альтернативы (в эластичности по отношению к ) является ${\ displaystyle n}$ ${\ displaystyle i}$ ${\ displaystyle j}$ ${\ displaystyle P_ {ni}}$ ${\ displaystyle x_ {nj} ^ {m}}$

{\ displaystyle Elasticity_ {P_ {ni}, x_ {nj} ^ {m}} = - {\ frac {x_ {nj} ^ {m}} {P_ {ni}}} \ int \ beta ^ {m} L_ {ni} (\ beta) L_ {nj} (\ beta) f (\ beta) d \ beta = -x_ {nj} ^ {m} \ int \ beta ^ {m} L_ {nj} (\ beta) { \ frac {L_ {ni} (\ beta)} {P_ {ni}}} f (\ beta) d \ beta}

где это м го элемента . Из этой формулы можно увидеть, что десятипроцентное сокращение для необязательно означает (как в случае с логитом) десятипроцентное сокращение для каждой другой альтернативы . Причина в том, что относительные проценты зависят от корреляции между условной вероятностью того, что человек выберет альтернативу, и условной вероятностью того, что человек выберет альтернативу из различных вариантов . ${\ displaystyle \ beta ^ {m}}$ ${\ displaystyle \ beta}$ ${\ displaystyle P_ {ni}}$ ${\ displaystyle P_ {nj}}$ ${\ displaystyle n}$ ${\ displaystyle i, L_ {ni},}$ ${\ displaystyle n}$ ${\ displaystyle j, L_ {nj},}$ ${\ displaystyle \ beta}$

Корреляция ненаблюдаемых факторов во времени

Стандартный logit не принимает во внимание какие-либо ненаблюдаемые факторы, которые сохраняются во времени для данного лица, принимающего решения. Это может быть проблемой, если вы используете панельные данные, которые представляют повторяющийся выбор с течением времени. Применяя стандартную логит-модель к панельным данным, вы делаете допущение, что ненаблюдаемые факторы, влияющие на выбор человека, являются новыми каждый раз, когда человек делает выбор. Это очень маловероятное предположение. Чтобы учесть как случайные вариации вкуса, так и корреляцию ненаблюдаемых факторов во времени, полезность для респондента n для альтернативы i в момент времени t определяется следующим образом:

{\ displaystyle U_ {nit} = \ beta _ {n} X_ {nit} + \ varepsilon _ {nit}}

где нижний индекс t - измерение времени. Мы по-прежнему делаем предположение логита, которое является экстремальным значением iid. Это означает, что это не зависит от времени, людей и альтернатив. по сути, это просто белый шум. Тем не менее, корреляция во времени и по альтернативам возникает из общего эффекта «s», которые входят в полезность в каждый период времени и для каждой альтернативы. ${\ Displaystyle \ varepsilon}$ ${\ Displaystyle \ varepsilon}$ ${\ Displaystyle \ varepsilon}$ ${\ displaystyle \ beta}$

Чтобы подробно изучить корреляцию, предположим, что β нормально распределены со средним значением и дисперсией . Тогда уравнение полезности принимает следующий вид: ${\ displaystyle {\ bar {\ beta}}}$ ${\ displaystyle \ sigma ^ {2}}$

{\ displaystyle U_ {nit} = ({\ bar {\ beta}} + \ sigma \ eta _ {n}) X_ {nit} + \ varepsilon _ {nit}}

и η - результат стандартной нормальной плотности. После перестановки уравнение выглядит следующим образом:

{\ displaystyle U_ {nit} = {\ bar {\ beta}} X_ {nit} + (\ sigma \ eta _ {n} X_ {nit} + \ varepsilon _ {nit})}

{\ displaystyle U_ {nit} = {\ bar {\ beta}} X_ {nit} + e_ {nit}}

где собраны ненаблюдаемые факторы . От ненаблюдаемых факторов не зависит от времени и не зависит от времени или альтернатив. ${\ displaystyle e_ {nit} = \ sigma \ eta _ {n} X_ {nit} + \ varepsilon _ {nit}}$ ${\ Displaystyle \ varepsilon _ {нит}}$ ${\ displaystyle \ sigma \ eta _ {n} X_ {nit}}$

Тогда ковариация между альтернативами и равна, ${\ displaystyle i}$ ${\ displaystyle j}$

{\ displaystyle Cov (e_ {nit}, e_ {njt}) = \ sigma ^ {2} (X_ {nit} X_ {njt})}

а ковариация между временем и равна ${\ displaystyle t}$ ${\ displaystyle q}$

{\ displaystyle Cov (e_ {nit}, e_ {niq}) = \ sigma ^ {2} (X_ {nit} X_ {niq})}

Задавая X соответствующим образом, можно получить любой образец ковариации во времени и альтернативы.

При условии , вероятность последовательности выборов, сделанных человеком, является просто произведением логит-вероятности каждого индивидуального выбора этого человека: ${\ displaystyle \ beta _ {n}}$

{\ displaystyle L_ {n} (\ beta _ {n}) = \ prod _ {t} {\ frac {e ^ {\ beta _ {n} X_ {nit}}} {\ sum _ {j} e ^ {\ beta _ {n} X_ {njt}}}}}

поскольку не зависит от времени. Тогда (безусловная) вероятность последовательности выборов - это просто интеграл этого произведения логитов по плотности . ${\ Displaystyle \ varepsilon _ {нит}}$ ${\ displaystyle \ beta}$

{\ displaystyle P_ {ni} = \ int L_ {n} (\ beta) f (\ beta | \ theta) d \ beta}

Моделирование

К сожалению, нет закрытой формы для интеграла, который входит в вероятность выбора, и поэтому исследователь должен моделировать P _n . К счастью для исследователя, моделирование P _n может быть очень простым. Необходимо выполнить четыре основных шага

1. Возьмите функцию плотности вероятности, которую вы указали для «вкусовых» коэффициентов. То есть возьмите розыгрыш и обозначьте его для представления первого розыгрыша. ${\ Displaystyle е (\ бета | \ тета)}$ ${\ displaystyle \ beta ^ {r}}$ ${\ displaystyle r = 1}$