Конструкция механизма - Mechanism design

Диаграмма Стэнли Райтера выше иллюстрирует игру в дизайн механизмов. Верхнее левое пространство изображает пространство типов, а верхнее правое пространство X - пространство результатов. Социальный выбор функция отображает профиль типа к результату. В играх с конструкцией механизмов агенты отправляют сообщения в игровой среде . Равновесие в игре может быть разработано , чтобы реализовать какую - либо социальную функцию выбора .

Проектирование механизмов - это область экономики и теории игр, в которой используется подход , ориентированный на цели, для разработки экономических механизмов или стимулов для достижения желаемых целей в стратегических условиях , когда игроки действуют рационально . Поскольку она начинается в конце игры, а затем идет в обратном направлении, ее также называют теорией обратной игры . Он имеет широкое применение, начиная от экономики и политики в таких областях , как дизайн рынка , теории аукционов и теории общественного выбора к сетевым-системам (интернет междоменной маршрутизации, авторы поиска аукционов).

При проектировании механизмов изучаются концепции решений для класса приватно-информационных игр. Леонид Гурвич объясняет, что «в задаче проектирования целевая функция является главной« данностью », а механизм - неизвестным. Таким образом, проблема проектирования является «обратной» традиционной экономической теории, которая обычно посвящена анализу работы данного механизма ». Итак, две отличительные особенности этих игр:

  • что "дизайнер" игры выбирает структуру игры, а не наследует ее
  • что дизайнер заинтересован в исходе игры

Нобелевская мемориальная премия по экономическим наукам 2007 года была присуждена Леониду Гурвицу , Эрику Маскину и Роджеру Майерсону «за то, что они заложили основы теории конструкции механизмов».

Интуиция

В интересном классе байесовских игр один игрок, называемый «принципалом», хотел бы обусловить свое поведение информацией, которая в частном порядке известна другим игрокам. Например, директор хочет знать истинное качество подержанной машины, которую продает продавец. Он ничего не может узнать, просто спросив продавца, потому что в его интересах исказить истину. Однако в разработке механизмов у принципала есть одно преимущество: он может разработать игру, правила которой могут повлиять на других, чтобы они действовали так, как он хотел.

Без теории конструкции механизмов проблему директора было бы трудно решить. Ему придется рассмотреть все возможные игры и выбрать ту, которая лучше всего влияет на тактику других игроков. Кроме того, доверитель должен будет делать выводы от агентов, которые могут ему лгать. Благодаря конструкции механизма и, в частности, принципу раскрытия информации , принципал должен учитывать только те игры, в которых агенты правдиво сообщают свою личную информацию.

Фонды

Механизм

Игра в разработку механизмов - это игра с частной информацией, в которой один из агентов, называемый принципалом, выбирает структуру выплаты. Следуя Харшаньи  ( 1967 ), агенты получают секретные «сообщения» от природы, содержащие информацию, относящуюся к выплатам. Например, сообщение может содержать информацию об их предпочтениях или качестве товара для продажи. Мы называем эту информацию «типом» агента (обычно отмечается и соответственно пространство типов ). Затем агенты сообщают директору о типе (обычно отмеченном шляпой ), который может быть стратегической ложью. После отчета принципалу и агентам выплачиваются выплаты в соответствии со структурой выплат, выбранной принципалом.

Время игры:

  1. Принципал подчиняется механизму, который предоставляет результат как функцию сообщаемого типа.
  2. Агенты сообщают, возможно, нечестно, типовой профиль
  3. Механизм выполнен (агенты получают результат )

Чтобы понять, кто что получает, принято делить результат на распределение товаров и денежный перевод, где означает распределение товаров, предоставленных или полученных, в зависимости от типа, и означает денежный перевод как функцию тип.

В качестве эталона дизайнер часто определяет, что произойдет, если будет полная информация. Определить функция социального выбора, отображающая (истинный) типовой профиль непосредственно на распределение полученных или предоставленных товаров,

Напротив, механизм сопоставляет отчетный профиль типа с результатом (опять же, как распределение товаров, так и денежный перевод ).

Принцип откровения

Предлагаемый механизм представляет собой байесовскую игру (игру частной информации), и при правильном ее ведении игра имеет байесовское равновесие по Нэшу . В состоянии равновесия агенты выбирают свои отчеты стратегически в зависимости от типа

В такой обстановке трудно найти байесовское равновесие, потому что оно включает в себя поиск стратегий наилучшего реагирования агентов и наилучший вывод из возможной стратегической лжи. Благодаря широкому результату, называемому принципом откровения, независимо от механизма, дизайнер может ограничить внимание равновесием, в котором агенты правдиво сообщают о типе. Принцип откровения гласит: «Каждому байесовскому равновесию по Нэшу соответствует байесовская игра с таким же исходом равновесия, но в которой игроки правдиво сообщают о типе».

Это очень полезно. Этот принцип позволяет найти байесовское равновесие, предполагая, что все игроки правдиво сообщают тип (с учетом ограничения совместимости стимулов ). Одним ударом он избавляет от необходимости рассматривать либо стратегическое поведение, либо ложь.

Его доказательство вполне прямое. Предположим байесовскую игру, в которой стратегия и выигрыш агента являются функциями его типа и того, что делают другие . По определению, стратегия равновесия агента i - это ожидаемая полезность Нэша:

Просто определите механизм, который побудит агентов выбрать одно и то же равновесие. Проще всего определить механизм, обязывающий играть за них равновесные стратегии агентов .

При таком механизме агенты, конечно, считают оптимальным выявление типа, поскольку механизм в любом случае использует стратегии, которые они сочли оптимальными. Формально выбираем такой, что

Реализуемость

Разработчик механизма обычно надеется либо

  • разработать механизм, который "реализует" функцию социального выбора
  • найти механизм, который максимизирует некоторый критерий ценности (например, прибыль)

Для реализации функции социального выбора , чтобы найти некоторую передаточную функцию , которая мотивирует агент , чтобы выбрать . Формально, если профиль стратегии равновесия в рамках механизма соответствует тому же распределению товаров, что и функция общественного выбора,

мы говорим, что механизм реализует функцию социального выбора.

Благодаря принципу откровения разработчик обычно может найти передаточную функцию для реализации социального выбора, решив связанную с ним игру, рассказывающую правду. Если агенты сочтут оптимальным сообщать о типе правдивых сведений,

мы говорим, что такой механизм действительно реализуем (или просто «реализуем»). Затем задача состоит в том, чтобы найти правдиво реализуемую и приписать эту передаточную функцию исходной игре. Распределение действительно реализуемо, если существует передаточная функция такая, что

которое также называется ограничением совместимости стимулов (IC).

В приложениях условие IC является ключом к описанию формы любым полезным способом. При определенных условиях он может даже аналитически выделить передаточную функцию. Кроме того, иногда добавляется ограничение на участие ( индивидуальная рациональность ), если агенты имеют возможность не играть.

Необходимость

Рассмотрим ситуацию, в которой у всех агентов есть функция полезности, зависящая от типа . Рассмотрим также распределение товаров с векторной оценкой и размером (которое допускает количество товаров) и предположим, что оно является кусочно-непрерывным по отношению к своим аргументам.

Функция реализуема, только если

всякий раз, когда и и x непрерывны в точке . Это необходимое условие, которое выводится из условий первого и второго порядка задачи оптимизации агента в предположении правдивости.

Его значение можно понять из двух частей. Первая часть говорит о том, что предельная скорость замещения агента (MRS) увеличивается в зависимости от типа,

Короче говоря, агенты не скажут правду, если механизм не предлагает более выгодные условия для агентов более высокого уровня. В противном случае более высокие типы, столкнувшись с любым механизмом, который наказывает высокие типы за сообщение, будут лгать и объявлять, что они являются низшими типами, нарушая ограничение IC правдивости. Вторая часть - это условие монотонности, ожидающее своего появления,

что, если быть положительным, означает, что более высоким типам нужно давать больше добра.

У этих двух частей есть потенциал для взаимодействия. Если для некоторого диапазона типов контракт предлагал меньшее количество для более высоких типов , возможно, механизм мог бы компенсировать, предоставляя более высокие типы скидки. Но такой договор уже существует для низкотипных агентов, поэтому это решение патологическое. Такое решение иногда возникает в процессе поиска механизма. В этих случаях его необходимо « погладить ». В среде с нескольких исправными также возможно для дизайнера наградить агент с более одного товаром для замены меньше других (например , масло для маргарина ). Множественные хорошие механизмы - постоянная проблема в теории проектирования механизмов.

Достаточность

Документы по разработке механизмов обычно делают два допущения для обеспечения возможности реализации:

Это известно под несколькими названиями: условие однократного пересечения, условие сортировки и условие Спенса – Миррлиза. Это означает, что функция полезности имеет такую ​​форму, что тип MRS агента увеличивается.

Это техническое условие, ограничивающее темпы роста MRS.

Этих допущений достаточно, чтобы гарантировать, что любая монотонность реализуема ( существует, который может ее реализовать). Кроме того, в настройке «один-хороший» условие однократного пересечения является достаточным, чтобы обеспечить возможность реализации только монотонного , поэтому разработчик может ограничить свой поиск монотонным .

Выделенные результаты

Теорема об эквивалентности доходов

Викри  ( 1961 ) дает знаменитый результат, заключающийся в том, что любой участник большого класса аукционов гарантирует продавцу такой же ожидаемый доход и что ожидаемый доход - лучшее, что может сделать продавец. Это так, если

  1. Покупатели имеют идентичные оценочные функции (которые могут зависеть от типа).
  2. Типы покупателей распределяются независимо
  3. Типы покупателей выбираются из непрерывного распределения
  4. Распределение типов имеет свойство монотонной степени опасности.
  5. Механизм продает товар покупателю с наивысшей оценкой.

Последнее условие является ключевым для теоремы. Подразумевается, что для того, чтобы продавец получил более высокий доход, он должен рискнуть и передать товар агенту с более низкой оценкой. Обычно это означает, что он должен рискнуть вообще не продавать предмет.

Механизмы Викри – Кларка – Гровса

Модель аукциона Викри (1961) была позже расширена Кларком  ( 1971 ) и Гроувсом для решения проблемы общественного выбора, в которой расходы на общественный проект несут все агенты, например, строить ли муниципальный мост. Получающийся в результате механизм «Викри-Кларка-Гроувса» может мотивировать агентов выбирать социально эффективное распределение общественного блага, даже если агенты имеют частно известные оценки. Другими словами, он может разрешить « трагедию общин » - при определенных условиях, в частности, при квазилинейной полезности или если не требуется баланс бюджета.

Рассмотрим ситуацию, в которой количество агентов имеет квазилинейную полезность с частными оценками, где валюта оценивается линейно. Дизайнер VCG разрабатывает механизм, совместимый со стимулами (следовательно, правдиво реализуемый), для получения истинного профиля типа, из которого разработчик реализует социально оптимальное распределение.

Умный механизм VCG - это то, как он мотивирует правдивое откровение. Это устраняет стимулы к искажению информации, наказывая любого агента ценой искажения, которое он вызывает. Среди отчетов, которые может сделать агент, механизм VCG допускает «нулевой» отчет, в котором говорится, что он безразличен к общественному благу и заботится только о переводе денег. Это эффективно удаляет агента из игры. Если агент выбирает тип сообщения, механизм VCG взимает с агента плату, если его отчет является ключевым , то есть если его отчет изменяет оптимальное распределение x, чтобы нанести вред другим агентам. Оплата рассчитывается

который суммирует искажения полезности других агентов (а не его собственные), вызванные отчетом одного агента.

Теорема Гиббарда – Саттертуэйта.

Гиббард  ( 1973 ) и Саттертуэйт  ( 1975 ) приводят результат о невозможности, аналогичный по духу теореме о невозможности Эрроу . Для очень общего класса игр могут быть реализованы только «диктаторские» функции социального выбора.

Функция общественного выбора f () является диктаторской, если один агент всегда получает наиболее предпочтительное распределение благ,

Теорема утверждает, что в общих условиях любая реально реализуемая функция общественного выбора должна быть диктаторской, если:

  1. X конечно и содержит не менее трех элементов
  2. Предпочтения рациональны

Теорема Майерсона – Саттертуэйта

Майерсон и Саттертуэйт ( 1983 ) показывают, что для двух сторон не существует эффективного способа торговать товаром, если каждая из них имеет секретные и вероятностно разные оценки, без риска вынудить одну сторону торговать в убыток. Это один из самых замечательных отрицательных результатов в экономике - своего рода отрицательное зеркало фундаментальных теорем экономики благосостояния .

Примеры

Ценовая дискриминация

Миррлис  ( 1971 ) вводит настройку, в которой передаточную функцию t () легко найти . Из-за своей актуальности и управляемости это обычное дело в литературе. Рассмотрим настройку с одним хорошим и одним агентом, в которой агент имеет квазилинейную утилиту с параметром неизвестного типа.

и в котором принципал имеет более раннюю CDF по сравнению с типом агента . Принципал может производить товары с выпуклой предельной стоимостью c ( x ) и хочет максимизировать ожидаемую прибыль от сделки.

в соответствии с условиями IC и IR

Принципал здесь - монополист, пытающийся установить максимальную прибыль ценовую схему, в которой он не может определить тип клиента. Типичный пример - это авиакомпания, устанавливающая тарифы для деловых людей, туристов и студентов. Из-за условия IR он должен давать каждому типу достаточно хорошую сделку, чтобы побудить к участию. Из-за условия IC он должен давать каждому типу достаточно хорошую сделку, чтобы этот тип предпочел эту сделку сделке любого другого.

Уловка, предложенная Миррлисом (1971), состоит в том, чтобы использовать теорему об огибающей, чтобы исключить передаточную функцию из ожидания максимизации,

Интеграция,

где - некоторый тип индекса. Заменив совместимость со стимулом на максиму,

после интеграции по частям. Эта функция может быть максимизирована поточечно.

Поскольку он уже совместим со стимулами, разработчик может отказаться от ограничения IC. Если функция полезности удовлетворяет условию Спенса – Миррлиса, то существует монотонная функция. Ограничение IR можно проверить в состоянии равновесия и соответственно увеличить или уменьшить график сборов. Кроме того, обратите внимание на наличие в выражении степени опасности . Если распределение типов обладает свойством монотонного отношения рисков, FOC достаточно для решения для t (). Если нет, то необходимо проверить, выполняется ли ограничение монотонности (см. Выше достаточность ) повсюду в графиках распределения и сборов. Если нет, то дизайнер должен использовать глажку Майерсона.

Майерсон гладильная

Можно найти товар или график цен, который удовлетворяет условиям первого порядка, но не является монотонным. В таком случае необходимо «утюжить» график, выбрав какое-то значение, при котором функция будет сглажена.

В некоторых приложениях разработчик может решить условия первого порядка для графиков цен и распределения, но обнаружит, что они не являются монотонными. Например, в квазилинейной настройке это часто происходит, когда отношение рисков само по себе не является монотонным. Согласно условию Спенса-Миррлиса оптимальные графики цен и распределения должны быть монотонными, поэтому разработчик должен исключить любой интервал, в течение которого график меняет направление, сглаживая его.

Наглядно, что происходит это дизайнер считает оптимальным сгусток определенных типов вместе и дают им один и тот же контракт. Обычно дизайнер мотивирует более высокие типы выделиться, предлагая им более выгодную сделку. Если количество более высоких типов на марже недостаточно, разработчик не считает целесообразным предоставлять более низким типам уступку (так называемую информационную ренту ), чтобы взимать более высокие типы по контракту, зависящему от типа.

Рассмотрим принципала монополиста, продающего агентам с квазилинейной полезностью, как в приведенном выше примере. Предположим, что график распределения, удовлетворяющий условиям первого порядка, имеет один внутренний пик в точке и одну внутреннюю впадину в точке , показанной справа.

  • Следуя Майерсону (1981), сгладьте его, выбрав удовлетворительный
    где - функция, обратная к отображению x, и - функция, обратная к отображению x в . То есть возвращает a до внутреннего пика и возвращает a после внутренней впадины.
  • Если немонотонная область граничит с границей пространства типов, просто установите соответствующую функцию (или обе) для типа границы. Если есть несколько регионов, см. Учебник для итеративной процедуры; может случиться так, что нужно гладить более одной кормушки вместе.

Доказательство

Доказательство использует теорию оптимального управления. Он рассматривает набор интервалов в немонотонной области, по которым он может сгладить график. Затем он пишет гамильтониан, чтобы получить необходимые условия для a в пределах интервалов

  1. что удовлетворяет монотонность
  2. для которых ограничение монотонности не связывает границы интервала

Условие два гарантирует, что выполнение задачи оптимального управления повторно соединится с расписанием в исходной задаче на границах интервала (без скачков). Любой объект, удовлетворяющий необходимым условиям, должен быть плоским, потому что он должен быть монотонным и все же повторно соединяться на границах.

Как и прежде, максимизировать ожидаемый выигрыш от принципала, но на этот раз с учетом ограничения монотонности

и использовать для этого гамильтониан с теневой ценой

где - переменная состояния и элемент управления. Как обычно при оптимальном управлении, уравнение эволюции затрат должно удовлетворять

Воспользовавшись условием 2, обратите внимание, что ограничение монотонности не является обязательным на границах интервала,

означает, что условие переменной стоимости может быть интегрировано и также равно 0

Среднее искажение излишка основного долга должно быть 0. Чтобы сгладить график, найдите такое, чтобы его обратное изображение отображалось в интервал, удовлетворяющий вышеуказанному условию.

Смотрите также

Заметки

Рекомендации

дальнейшее чтение

Внешние ссылки