Введение в калибровочную теорию - Introduction to gauge theory

Калибровочная теория представляет собой тип теории в физике . Слово « калибр» означает измерение , толщину, промежуточное расстояние (как на железнодорожных путях ) или результирующее количество единиц на определенный параметр (количество петель в дюйме ткани или количество свинцовых шариков в фунте боеприпасов ). Современные теории описывают физические силы в терминах полей , например, электромагнитного поля , гравитационного поля и полей, которые описывают силы между элементарными частицами . Общая особенность этих теорий поля состоит в том, что фундаментальные поля нельзя измерить напрямую; однако можно измерить некоторые связанные величины, такие как заряды, энергии и скорости. Например, предположим, что вы не можете измерить диаметр свинцового шара, но вы можете определить, сколько свинцовых мячей, равных во всех отношениях, необходимо для получения фунта. Используя количество шаров, элементарную массу свинца и формулу для вычисления объема шара по его диаметру, можно косвенно определить диаметр одного свинцового шара. В теориях поля разные конфигурации ненаблюдаемых полей могут приводить к одинаковым наблюдаемым величинам. Преобразование из одной такой конфигурации поля в другую называется калибровочным преобразованием ; отсутствие изменения измеримых величин, несмотря на преобразование поля, является свойством, называемым калибровочной инвариантностью . Например, если бы вы могли измерить цвет свинцовых шариков и обнаружить, что при изменении цвета вы все еще умещаете то же количество шариков в фунте, свойство «цвет» покажет калибровочную инвариантность . Поскольку любой вид инвариантности относительно преобразования поля считается симметрией , калибровочную инвариантность иногда называют калибровочной симметрией . Как правило, любая теория, обладающая свойством калибровочной инвариантности, считается калибровочной теорией.

Например, в электромагнетизме электрическое и магнитное поля E и B наблюдаемы, а потенциалы V («напряжение») и A ( векторный потенциал ) - нет. При калибровочном преобразовании, при котором к V добавляется константа, в E или B не происходит заметных изменений .

С появлением квантовой механики в 1920-х годах и с последовательным развитием квантовой теории поля важность калибровочных преобразований неуклонно возрастала. Калибровочные теории ограничивают законы физики, потому что все изменения, вызванные калибровочным преобразованием, должны нейтрализовать друг друга, если они записаны в терминах наблюдаемых величин. В течение 20 века физики постепенно осознавали, что все силы ( фундаментальные взаимодействия ) возникают из-за ограничений, налагаемых локальными калибровочными симметриями , и в этом случае преобразования меняются от точки к точке в пространстве и времени . Пертурбативная квантовая теория поля (обычно используемая для теории рассеяния) описывает силы в терминах частиц, передающих силу, называемых калибровочными бозонами . Природа этих частиц определяется характером калибровочных преобразований. Кульминацией этих усилий стала Стандартная модель , квантовая теория поля, которая точно предсказывает все фундаментальные взаимодействия, кроме гравитации .

История и значение

Самой ранней теорией поля, имеющей калибровочную симметрию, была формулировка электродинамики Максвелла в 1864–65 (« Динамическая теория электромагнитного поля »). Важность этой симметрии оставалась незамеченной в самых ранних формулировках. Точно так же незамеченным Гильберт вывел уравнения общей теории относительности Эйнштейна, постулировав симметрию при любом изменении координат. Позже Герман Вейль , вдохновленный успехом общей теории относительности Эйнштейна , в 1919 г. предположил (как оказалось, ошибочно), что инвариантность при изменении масштаба или «колеи» (термин, вдохновленный различными ширинами колеи железных дорог) также может быть локальная симметрия электромагнетизма. Хотя выбор Вейля датчика был неправильным, название «датчик» закрепилось за подходом. После развития квантовой механики Вейль, Фок и Лондон изменили свой выбор калибровки, заменив масштабный коэффициент изменением фазы волны и успешно применив его к электромагнетизму. Калибровочная симметрия была математически обобщена в 1954 году Чен Нин Янгом и Робертом Миллсом в попытке описать сильные ядерные взаимодействия . Эта идея, получившая название теории Янга – Миллса , позже нашла применение в квантовой теории поля слабого взаимодействия и ее объединении с электромагнетизмом в электрослабой теории.

Важность калибровочных теорий физики проистекает из их огромного успеха в обеспечении единой основы для описания квантово-механического поведения в электромагнетизма , в слабой силы и мощной силой . Эта калибровочная теория, известная как Стандартная модель , точно описывает экспериментальные предсказания относительно трех из четырех фундаментальных сил природы.

В классической физике

Электромагнетизм

Исторически первым обнаруженным примером калибровочной симметрии был классический электромагнетизм . Статическое электрическое поле можно описать с помощью электрического потенциала (напряжения), который определяется в каждой точке пространства, и в практической работе принято считать Землю в качестве физического эталона, определяющего нулевой уровень потенциала, или земля . Но физически измерить можно только разность потенциалов, поэтому вольтметр должен иметь два щупа и может отображать только разницу напряжений между ними. Таким образом, можно было выбрать определение всех разностей напряжений относительно некоторого другого стандарта, а не Земли, что привело бы к добавлению постоянного смещения. Если потенциал является решением уравнений Максвелла, то после этого калибровочного преобразования новый потенциал также является решением уравнений Максвелла, и никакой эксперимент не может различить эти два решения. Другими словами, законы физики электричества и магнетизма (то есть уравнения Максвелла) инвариантны относительно калибровочного преобразования. Уравнения Максвелла обладают калибровочной симметрией.

Переходя от статического электричества к электромагнетизму, у нас есть второй потенциал, магнитный векторный потенциал A , который также может претерпевать калибровочные преобразования. Эти преобразования могут быть локальными. То есть вместо добавления константы к V можно добавить функцию, которая принимает разные значения в разных точках пространства и времени. Если A также изменяется определенным образом соответствующим образом, то получаются те же поля E и B. Подробная математическая связь между полями E и B и потенциалами V и A приведена в статье « Установка калибровки» вместе с точным изложением природы калибровочного преобразования. Важным моментом здесь является то, что поля остаются неизменными при калибровочном преобразовании, и поэтому уравнения Максвелла по- прежнему выполняются.

Калибровочная симметрия тесно связана с сохранением заряда . Предположим, что существует некоторый процесс, с помощью которого можно ненадолго нарушить сохранение заряда, создав заряд q в определенной точке пространства, 1, переместив его в какую-то другую точку 2, а затем уничтожив. Можно представить, что этот процесс соответствует закону сохранения энергии. Мы могли бы постулировать правило, гласящее, что для создания заряда требуется ввод энергии E 1 = qV 1, а при его разрушении высвобождается E 2 = qV 2 , что казалось бы естественным, поскольку qV измеряет дополнительную энергию, запасенную в электрическом поле из-за существования заряд в определенный момент. Вне интервала, в течение которого существует частица, закон сохранения энергии будет соблюдаться, потому что чистая энергия, высвобождаемая при создании и разрушении частицы, qV 2 - qV 1 , будет равна работе, совершенной при перемещении частицы из 1 в 2, qV 2 - qV 1 . Но хотя этот сценарий спасает сохранение энергии, он нарушает калибровочную симметрию. Калибровочная симметрия требует, чтобы законы физики были инвариантными по отношению к преобразованию , что означает, что ни один эксперимент не должен иметь возможность измерить абсолютный потенциал без ссылки на какой-либо внешний стандарт, такой как электрическое заземление. Но предлагаемые правила E 1 = QV 1 и E 2 = QV 2 для энергий созидания и разрушения бы позволить экспериментатору определить абсолютный потенциал, просто путем сравнения затрат энергии , необходимые для создания заряда д в определенной точке в пространстве в случае, когда потенциал равен и соответственно. Вывод состоит в том, что если калибровочная симметрия сохраняется и сохраняется энергия, то заряд должен сохраняться.

Декартова сетка координат на этом квадрате была искажена преобразованием координат, так что существует нелинейная связь между старыми (x, y) координатами и новыми. Уравнения общей теории относительности Эйнштейна остаются в силе в новой системе координат. Такие изменения системы координат являются калибровочными преобразованиями общей теории относительности.

Общая теория относительности

Как обсуждалось выше, калибровочные преобразования для классической (т. Е. Неквантовой) общей теории относительности представляют собой произвольные преобразования координат. Технически преобразования должны быть обратимыми, и как преобразование, так и обратное к нему должны быть гладкими, в том смысле, что их можно дифференцировать произвольное количество раз.

Пример симметрии в физической теории: трансляционная инвариантность

Некоторые глобальные симметрии при изменении координат предшествуют как общей теории относительности, так и концепции калибровки. Например, Галилей и Ньютон ввели понятие трансляционной инвариантности , развитие от аристотелевской концепции, согласно которой разные места в космосе, такие как земля и небо, подчиняются разным физическим правилам.

Предположим, например, что один наблюдатель исследует свойства атома водорода на Земле, другой - на Луне (или любом другом месте во Вселенной), наблюдатель обнаружит, что их атомы водорода проявляют полностью идентичные свойства. Опять же, если бы один наблюдатель исследовал атом водорода сегодня, а другой - 100 лет назад (или в любое другое время в прошлом или будущем), оба эксперимента снова дали бы полностью идентичные результаты. Инвариантность свойств атома водорода относительно времени и места исследования этих свойств называется трансляционной инвариантностью.

Вспоминая наших двух наблюдателей разного возраста: время в их экспериментах сдвинуто на 100 лет. Если время, когда старший наблюдатель проводил эксперимент, было t , время современного эксперимента составляет t +100 лет. Оба наблюдателя открывают одни и те же законы физики. Поскольку свет от атомов водорода в далеких галактиках может достигать Земли после того, как он путешествовал по космосу в течение миллиардов лет, в действительности можно проводить такие наблюдения, охватывающие периоды времени почти до Большого взрыва , и они показывают, что законы физика всегда была такой же.

Другими словами, если в теории мы изменим время t на t +100 лет (или действительно любой другой сдвиг во времени), теоретические предсказания не изменятся.

Другой пример симметрии: инвариантность уравнения поля Эйнштейна относительно произвольных преобразований координат.

В общей теории относительности Эйнштейна такие координаты, как x , y , z и t , не только «относительны» в глобальном смысле перемещений, таких как вращения и т. Д., Но становятся полностью произвольными, так что, например, можно полностью определить новая временная координата согласно некоторому произвольному правилу, например , где имеет размерность времени, и все же уравнения Эйнштейна будут иметь ту же форму.

Инвариантность формы уравнения относительно произвольного преобразования координат принято называть общей ковариантностью , а уравнения с этим свойством - записанными в ковариантной форме. Общая ковариантность - это частный случай калибровочной инвариантности.

Уравнения Максвелла также могут быть выражены в общековариантной форме, которая так же инвариантна относительно общего преобразования координат, как уравнение поля Эйнштейна.

В квантовой механике

Квантовая электродинамика

До появления квантовой механики единственным хорошо известным примером калибровочной симметрии был электромагнетизм, и общее значение этой концепции не было полностью понято. Например, было неясно, являются ли поля E и B или потенциалы V и A фундаментальными величинами; если первое, то калибровочные преобразования можно рассматривать не более чем как математический трюк.

Эксперимент Ааронова – Бома

Двухщелевая дифракционная и интерференционная картина

В квантовой механике частица, такая как электрон, также описывается как волна. Например, если эксперимент с двойной щелью проводится с электронами, то наблюдается волнообразная интерференционная картина. Электрон имеет наибольшую вероятность быть обнаруженным в местах, где части волны, проходящей через две щели, находятся в фазе друг с другом, что приводит к конструктивной интерференции . Частота электронной волны связана с кинетической энергией отдельной электронной частицы через квантово-механическое соотношение E = hf . Если в этом эксперименте нет электрических или магнитных полей, то энергия электрона постоянна, и, например, будет высокая вероятность обнаружения электрона вдоль центральной оси эксперимента, где по симметрии две части волны находятся в фазе.

Но теперь предположим, что электроны в эксперименте подвержены воздействию электрических или магнитных полей. Например, если электрическое поле будет наложено на одну сторону оси, но не на другую, это повлияет на результаты эксперимента. Часть электронной волны, проходящая через эту сторону, колеблется с другой скоростью, поскольку к ее энергии добавлено - эВ , где - е - заряд электрона, а V - электрический потенциал. Результаты эксперимента будут разными, потому что фазовые соотношения между двумя частями электронной волны изменились, и, следовательно, места конструктивной и деструктивной интерференции будут смещены в ту или иную сторону. Здесь возникает электрический потенциал, а не электрическое поле, и это является проявлением того факта, что именно потенциалы, а не поля имеют фундаментальное значение в квантовой механике.

Схема эксперимента с двумя щелями, в котором можно наблюдать эффект Ааронова-Бома: электроны проходят через две щели, интерферируя на экране наблюдения, при этом интерференционная картина смещается при включении магнитного поля B в цилиндрическом соленоиде, отмеченном синим цветом на диаграмму.

Объяснение с потенциалами

Возможны даже случаи, когда результаты эксперимента различаются при изменении потенциалов, даже если ни одна заряженная частица никогда не подвергается воздействию другого поля. Одним из таких примеров является эффект Ааронова – Бома , показанный на рисунке. В этом примере включение соленоида вызывает только магнитное поле B внутри соленоида. Но соленоид расположен так, что электрон не может пройти через его внутреннюю часть. Если бы кто-то считал поля фундаментальными величинами, то можно было бы ожидать, что результаты эксперимента останутся неизменными. На самом деле результаты разные, потому что включение соленоида изменяет векторный потенциал A в области, через которую проходят электроны. Теперь, когда было установлено, что фундаментальными являются потенциалы V и A , а не поля E и B , мы можем видеть, что калибровочные преобразования, которые изменяют V и A , имеют реальное физическое значение, а не просто математические. артефакты.

Калибровочная инвариантность: результаты экспериментов не зависят от выбора калибровки потенциалов.

Обратите внимание, что в этих экспериментах единственная величина, которая влияет на результат, - это разность фаз между двумя частями электронной волны. Предположим, мы представляем две части электронной волны в виде крошечных часов, каждая с одной стрелкой, которая движется по кругу, отслеживая свою собственную фазу. Хотя этот рисунок игнорирует некоторые технические детали, он сохраняет важные здесь физические явления. Если оба тактовых генератора ускоряются на одинаковую величину, соотношение фаз между ними не меняется, и результаты экспериментов одинаковы. Не только это, но даже нет необходимости изменять скорость каждого тактового сигнала на фиксированную величину. Мы могли изменять угол стрелки на каждых часах на переменную величину θ, где θ может зависеть как от положения в пространстве, так и от времени. Это не повлияет на результат эксперимента, поскольку окончательное наблюдение местоположения электрона происходит в одном месте и в одном месте, так что фазовый сдвиг в «часах» каждого электрона будет одинаковым, и два эффекта отменит. Это еще один пример калибровочного преобразования: оно локальное и не меняет результатов экспериментов.

Резюме

Таким образом, калибровочная симметрия приобретает все большее значение в контексте квантовой механики. В приложении квантовой механики к электромагнетизму, т.е. квантовой электродинамике , калибровочная симметрия применима как к электромагнитным, так и к электронным волнам. Эти две калибровочные симметрии на самом деле тесно связаны. Если, например, к электронным волнам применяется калибровочное преобразование θ, то необходимо также применить соответствующее преобразование к потенциалам, которые описывают электромагнитные волны. Калибровочная симметрия необходима для того, чтобы сделать квантовую электродинамику перенормируемой теорией, т. Е. Такой, в которой расчетные предсказания всех физически измеримых величин конечны.

Типы калибровочных симметрий

Описание электронов в вышеприведенном подразделе как маленьких часов, по сути, является изложением математических правил, согласно которым фазы электронов должны складываться и вычитаться: они должны рассматриваться как обычные числа, за исключением случая, когда результат вычисления выходит за пределы диапазона 0≤θ <360 °, мы заставляем его «оборачиваться» в разрешенный диапазон, охватывающий круг. Другими словами, фазовый угол, скажем, 5 ° считается полностью эквивалентным углу 365 °. Эксперименты подтвердили это проверяемое утверждение об интерференционных картинах, образованных электронными волнами. За исключением свойства "наложения", алгебраические свойства этой математической структуры точно такие же, как у обычных действительных чисел.

В математической терминологии электронные фазы при сложении образуют абелеву группу , называемую круговой группой или U (1). «Абелева» означает, что сложение коммутирует , так что θ + φ = φ + θ. Группа означает, что дополнение связывает и имеет элемент идентичности , а именно «0». Кроме того, для каждой фазы существует обратное, такое что сумма фазы и обратного к ней равна 0. Другими примерами абелевых групп являются целые числа при сложении, 0 и отрицании, и ненулевые дроби при произведении, 1 и обратном.

Калибровочная фиксация витого цилиндра.

В качестве способа визуализации выбора калибра подумайте, можно ли определить, был ли цилиндр перекручен. Мы не можем сказать, есть ли на цилиндре неровности, отметины или царапины. Однако мы могли бы нарисовать произвольную кривую вдоль цилиндра, определяемую некоторой функцией θ ( x ), где x измеряет расстояние вдоль оси цилиндра. После того, как этот произвольный выбор (выбор калибра) был сделан, становится возможным обнаружить его, если кто-то позже повернет цилиндр.

В 1954 году Чен Нин Ян и Роберт Миллс предложили обобщить эти идеи на некоммутативные группы. Некоммутативная калибровочная группа может описывать поле, которое, в отличие от электромагнитного поля, взаимодействует само с собой. Например, общая теория относительности утверждает, что гравитационные поля обладают энергией, а специальная теория относительности заключает, что энергия эквивалентна массе. Следовательно, гравитационное поле индуцирует еще одно гравитационное поле. В ядерных силах также имеет эту самовзаимодействующую собственность.

Калибровочные бозоны

Удивительно, но калибровочная симметрия может дать более глубокое объяснение существования взаимодействий, таких как электрические и ядерные взаимодействия. Это происходит из типа калибровочной симметрии, связанной с тем фактом, что все частицы данного типа экспериментально неотличимы друг от друга. Представьте себе, что Алиса и Бетти - идентичные близнецы, помеченные при рождении браслетами с надписью A и B. Поскольку девочки идентичны, никто не сможет сказать, поменялись ли они местами при рождении; метки A и B произвольные, их можно менять местами. Такая постоянная смена идентичностей подобна глобальной калибровочной симметрии. Существует также соответствующая локальная калибровочная симметрия, которая описывает тот факт, что от одного момента к другому Алиса и Бетти могли меняться ролями, пока никто не смотрел, и никто не мог бы сказать. Если мы заметим, что любимая ваза мамы разбита, мы можем только сделать вывод, что вина лежит на одном или другом близнеце, но мы не можем сказать, виновата ли вина 100% Алиса и 0% Бетти, или наоборот. Если Алиса и Бетти на самом деле являются квантово-механическими частицами, а не людьми, то у них также есть волновые свойства, в том числе свойство суперпозиции , которое позволяет произвольно складывать, вычитать и смешивать волны. Отсюда следует, что мы даже не ограничены полной заменой личности. Например, если мы наблюдаем, что определенное количество энергии существует в определенном месте в космосе, нет никакого эксперимента, который мог бы сказать нам, является ли эта энергия 100% A и 0% B, 0% A и 100% B или 20 % A и 80% B или какая-то другая смесь. Тот факт, что симметрия является локальной, означает, что мы не можем даже рассчитывать на то, что эти пропорции останутся неизменными при распространении частиц в пространстве. Детали того, как это представлено математически, зависят от технических вопросов, касающихся спинов частиц, но для наших настоящих целей мы рассматриваем бесспиновые частицы, для которых оказывается, что перемешивание может быть задано некоторым произвольным выбором калибровки θ ( x ), где угол θ = 0 ° представляет 100% A и 0% B, θ = 90 ° означает 0% A и 100% B, а промежуточные углы представляют смеси.

Согласно принципам квантовой механики, частицы на самом деле не имеют траекторий в пространстве. Движение можно описать только в терминах волн, а импульс p отдельной частицы связан с ее длиной волны λ соотношением p  =  h / λ . С точки зрения эмпирических измерений, длину волны можно определить только путем наблюдения за изменением волны между одной точкой в ​​пространстве и другой близлежащей точкой (математически, путем дифференцирования ). Волна с более короткой длиной волны колеблется быстрее и, следовательно, быстрее изменяется между соседними точками. Теперь предположим, что мы произвольно закрепили датчик в одной точке пространства, сказав, что энергия в этом месте составляет 20% A и 80% B. Затем мы измеряем две волны в некоторой другой, близкой точке, чтобы определить их длины волн. Но есть две совершенно разные причины, по которым волны могли измениться. Они могли измениться, потому что они колебались с определенной длиной волны, или они могли измениться, потому что калибровочная функция изменилась со смеси 20–80 на, скажем, 21–79. Если мы проигнорируем вторую возможность, результирующая теория не сработает; Появятся странные расхождения в импульсе, нарушающие принцип сохранения импульса. Что-то в теории надо менять.

Опять же, есть технические проблемы, связанные со спином, но в нескольких важных случаях, включая электрически заряженные частицы и частицы, взаимодействующие посредством ядерных сил, решение проблемы состоит в том, чтобы приписать физическую реальность калибровочной функции θ ( x ). Мы говорим, что если функция θ осциллирует, она представляет новый тип квантово-механической волны, и эта новая волна имеет свой собственный импульс p  =  h / λ , который, оказывается, исправляет несоответствия, которые в противном случае нарушили бы сохранение импульса. . В контексте электромагнетизма частицы A и B будут заряженными частицами, такими как электроны, а квантово-механическая волна, представленная θ, будет электромагнитным полем. (Здесь мы игнорируем технические вопросы, связанные с тем фактом, что электроны на самом деле имеют спин 1/2, а не нулевой спин. Это чрезмерное упрощение является причиной того, что калибровочное поле θ оказывается скалярным, тогда как электромагнитное поле фактически представлено вектор, состоящий из V и A. ) Результатом является то, что у нас есть объяснение наличия электромагнитных взаимодействий: если мы попытаемся построить калибровочно-симметричную теорию идентичных невзаимодействующих частиц, результат не будет самосогласованным и может быть восстановлен только путем добавления электрических и магнитных полей, которые заставляют частицы взаимодействовать.

Хотя функция θ ( x ) описывает волну, законы квантовой механики требуют, чтобы она также обладала свойствами частиц. В случае электромагнетизма частицей, соответствующей электромагнитным волнам, является фотон. Обычно такие частицы называют калибровочными бозонами , где термин «бозон» относится к частице с целым спином. В простейших версиях теории калибровочные бозоны безмассовые, но также можно построить версии, в которых они имеют массу, как в случае калибровочных бозонов, передающих силы ядерного распада.

Рекомендации

дальнейшее чтение

Эти книги предназначены для широкого круга читателей и включают минимум математики.