Первичная структура белка - Protein primary structure

Protein primary structure Protein secondary structure Protein tertiary structure Protein quaternary structure
Изображение выше содержит интерактивные ссылки.
Интерактивная схема , по структуре белка , используя PCNA в качестве примера. ( PDB : 1AXC )

Белок первичная структура представляет собой линейную последовательность из аминокислот в пептид или белок . По соглашению, первичная структура белка начинается от аминоконца (N) до карбоксильного конца (C). Биосинтез белка чаще всего осуществляется рибосомами в клетках. Пептиды также можно синтезировать в лаборатории. Первичные структуры белков могут быть напрямую секвенированы или выведены из последовательностей ДНК .

Формирование

Биологические

Аминокислоты полимеризуются через пептидные связи с образованием длинной основной цепи, вдоль которой выступают различные боковые цепи аминокислот. В биологических системах белки производятся во время трансляции рибосомами клетки . Некоторые организмы могут также производить короткие пептиды путем синтеза нерибосомных пептидов , которые часто используют аминокислоты, отличные от стандартных 20, и могут быть циклизованы, модифицированы и сшиты.

Химическая

Пептиды можно синтезировать химическим путем с помощью ряда лабораторных методов. Химические методы обычно синтезируют пептиды в порядке, обратном (начиная с C-конца) биологическому синтезу белка (начиная с N-конца).

Обозначение

Последовательность белка обычно обозначается строкой букв, в которой перечислены аминокислоты, начиная с аминоконцевого конца и заканчивая карбоксильным концом. Для обозначения 20 встречающихся в природе аминокислот, а также смесей или неоднозначных аминокислот можно использовать трехбуквенный или однобуквенный код (аналогично обозначению нуклеиновых кислот ).

Пептиды могут быть секвенированы напрямую или выведены из последовательностей ДНК . Сейчас существуют большие базы данных последовательностей, которые сопоставляют известные белковые последовательности.

Обозначение 20 природных аминокислот
Аминокислота 3 буквы 1 буква
Аланин Ала А
Аргинин Arg р
Аспарагин Asn N
Аспарагиновая кислота Жерех D
Цистеин Cys C
Глютаминовая кислота Glu E
Глутамин Gln Q
Глицин Gly грамм
Гистидин Его ЧАС
Изолейцин Иль я
Лейцин Лея L
Лизин Lys K
Метионин Встретились M
Фенилаланин Phe F
Пролайн Pro п
Серин Сер S
Треонин Thr Т
Триптофан Trp W
Тирозин Тюр Y
Валин Вал V
Неоднозначное обозначение аминокислот
Символ Описание Представленные остатки
Икс Любая аминокислота или неизвестная Все
B Аспартат или аспарагин D, N
Z Глутамат или глутамин E, Q
J Лейцин или изолейцин Я, Л
Φ Гидрофобный V, I, L, F, W, M
Ω Ароматный F, W, Y, H
Ψ Алифатический V, I, L, M
π Небольшой P, G, A, S
ζ Гидрофильный S, T, H, N, Q, E, D, K, R, Y
+ Положительно заряженный K, R, H
- Отрицательно заряженный D, E

Модификация

В общем, полипептиды представляют собой неразветвленные полимеры, поэтому их первичная структура часто может быть определена последовательностью аминокислот вдоль их основной цепи. Однако белки могут стать поперечно-сшитыми, чаще всего дисульфидными связями , и первичная структура также требует указания сшивающих атомов, например, указания цистеинов, участвующих в дисульфидных связях белка. Другие поперечные сшивки включают десмозин .

Изомеризация

Хиральные центры полипептидной цепи могут подвергаться рацемизации . Хотя это не меняет последовательность, это влияет на химические свойства последовательности. В частности, L- аминокислоты, обычно присутствующие в белках, могут спонтанно изомеризоваться по атому с образованием D- аминокислот, которые не могут быть расщеплены большинством протеаз . Кроме того, пролин может образовывать стабильные транс-изомеры по пептидной связи.

Посттрансляционная модификация

Наконец, белок может претерпевать множество посттрансляционных модификаций , которые кратко описаны здесь.

N-концевая аминогруппа полипептида может быть модифицирована ковалентно, например,

Рис.1 N-концевое ацетилирование
  • ацетилирование
Положительный заряд на N-концевой аминогруппе можно устранить, заменив ее ацетильной группой (блокирование N-концевой группы).
  • формилирование
N-концевой метионин, обычно обнаруживаемый после трансляции, имеет N-конец, заблокированный формильной группой. Эта формильная группа (а иногда и сам остаток метионина, если за ним следует Gly или Ser) удаляется ферментом деформилазой .
  • пироглутамат
Рис.2 Образование пироглутамата из N-концевого глутамина
N-концевой глутамин может атаковать сам себя, образуя циклическую пироглутаматную группу.
  • миристоилирование
Аналогично ацетилированию. Вместо простой метильной группы миристоильная группа имеет хвост из 14 гидрофобных атомов углерода, что делает ее идеальной для закрепления белков на клеточных мембранах .

С-концевая карбоксилатная группа полипептида также может быть модифицирована, например,

Рис.3 С-концевое амидирование
  • аминирование (см. рисунок)
С-конец также можно заблокировать (таким образом, нейтрализуя его отрицательный заряд) аминированием.
  • гликозилфосфатидилинозитол (GPI) присоединение
Гликозилфосфатидилинозит (GPI) представляет собой большую гидрофобную простетическую группу фосфолипидов, которая прикрепляет белки к клеточным мембранам . Он присоединяется к С-концу полипептида через амидную связь, которая затем соединяется с этаноламином, оттуда с различными сахарами и, наконец, с липидным фрагментом фосфатидилинозитола.

Наконец, боковые цепи пептида также можно модифицировать ковалентно, например,

  • фосфорилирование
Помимо расщепления, фосфорилирование , возможно, является наиболее важной химической модификацией белков. Фосфатная группа может быть присоединена к гидроксильной группе боковой цепи остатков серина, треонина и тирозина, добавляя отрицательный заряд на этом участке и производя неприродную аминокислоту. Такие реакции катализируются киназами, а обратная реакция - фосфатазами. Фосфорилированные тирозины часто используются в качестве «ручек», с помощью которых белки могут связываться друг с другом, тогда как фосфорилирование Ser / Thr часто вызывает конформационные изменения, предположительно из-за введенного отрицательного заряда. Эффекты фосфорилирования Ser / Thr иногда можно моделировать путем мутации остатка Ser / Thr на глутамат.
Универсальное название для набора очень распространенных и очень разнородных химических модификаций. Фрагменты сахара могут быть присоединены к гидроксильным группам боковой цепи Ser / Thr или к амидным группам боковой цепи Asn. Такие присоединения могут выполнять множество функций, от увеличения растворимости до сложного распознавания. Любое гликозилирование можно заблокировать определенными ингибиторами, такими как туникамицин .
В этой модификации боковая цепь аспарагина или аспартата атакует следующую пептидную связь, образуя симметричный сукцинимидный промежуточный продукт. Гидролиз промежуточного продукта дает либо аспартат, либо β-аминокислоту изо (Asp). В случае аспарагина любой из продуктов приводит к потере амидной группы, следовательно, к «дезамидированию».
Остатки пролина могут быть гидроксилатами по любому из двух атомов, как и лизин (по одному атому). Гидроксипролин является важным компонентом коллагена , который становится нестабильным при его потере. Реакция гидроксилирования катализируется ферментом, которому требуется аскорбиновая кислота (витамин С), дефицит которой приводит к многим заболеваниям соединительной ткани, таким как цинга .
Некоторые белковые остатки могут быть метилированы, в первую очередь положительные группы лизина и аргинина . Остатки аргинина взаимодействуют с фосфатным остовом нуклеиновой кислоты и обычно образуют водородные связи с остатками оснований, особенно гуанином , в комплексах белок-ДНК. Остатки лизина могут быть метилированы однократно, дважды и даже трижды. Однако метилирование не изменяет положительный заряд боковой цепи.
Ацетилирование аминогрупп лизина химически аналогично ацетилированию N-конца. Однако функционально ацетилирование остатков лизина используется для регулирования связывания белков с нуклеиновыми кислотами. Отмена положительного заряда лизина ослабляет электростатическое притяжение (отрицательно заряженных) нуклеиновых кислот.
  • сульфатирование
Тирозины могут сульфатироваться на их атоме. Несколько необычно, что эта модификация происходит в аппарате Гольджи , а не в эндоплазматическом ретикулуме . Подобно фосфорилированным тирозинам, сульфатированные тирозины используются для специфического распознавания, например, в рецепторах хемокинов на поверхности клетки. Как и фосфорилирование, сульфатирование добавляет отрицательный заряд к ранее нейтральному сайту.
  • пренилирование и пальмитоилирование
Гидрофобные изопреновые (например, фарнезильная, геранильная и геранилгеранильная группы) и пальмитоильные группы могут быть добавлены к атому остатков цистеина для закрепления белков на клеточных мембранах . В отличие от GPI и миритоильных якорей, эти группы не обязательно добавляются на концах.
  • карбоксилирование
Относительно редкая модификация, которая добавляет дополнительную карбоксилатную группу (и, следовательно, двойной отрицательный заряд) к боковой цепи глутамата, образуя остаток Gla. Это используется для усиления связывания с ионами «твердых» металлов, таких как кальций .
  • АДФ-рибозилирование
Большая АДФ-рибозильная группа может переноситься на несколько типов боковых цепей в белках с гетерогенными эффектами. Эта модификация является мишенью для сильных токсинов разрозненных бактерий, например, холерного вибриона , Corynebacterium diphtheriae и Bordetella pertussis .
Различные полноразмерные свернутые белки могут быть присоединены на своих С-концах к аммониевым группам боковой цепи лизинов других белков. Убиквитин является наиболее распространенным из них и обычно сигнализирует о том, что белок, меченный убиквитином, должен быть разрушен.

Большинство модификаций полипептидов, перечисленных выше, происходят посттрансляционно , то есть после того, как белок был синтезирован на рибосоме , обычно в эндоплазматическом ретикулуме , субклеточной органелле эукариотической клетки.

Многие другие химические реакции (например, цианилирование) были применены к белкам химиками, хотя их нет в биологических системах.

Расщепление и лигирование

Помимо перечисленных выше, наиболее важной модификацией первичной структуры является расщепление пептидов (путем химического гидролиза или протеазами ). Белки часто синтезируются в неактивной форме-предшественнике; обычно N-концевой или C-концевой сегмент блокирует активный сайт белка, подавляя его функцию. Белок активируется отщеплением ингибирующего пептида.

Некоторые белки даже способны расщепляться. Как правило, гидроксильная группа серина (редко треонина) или тиольная группа остатка цистеина будет атаковать карбонильный углерод предыдущей пептидной связи, образуя тетраэдрически связанный промежуточный продукт [классифицируемый как гидроксиоксазолидин (Ser / Thr) или гидрокситиазолидин ( Cys) промежуточный]. Этот промежуточный продукт имеет тенденцию превращаться в амидную форму, вытесняя атакующую группу, поскольку амидной форме обычно способствует свободная энергия (предположительно из-за сильной резонансной стабилизации пептидной группы). Однако дополнительные молекулярные взаимодействия могут сделать амидную форму менее стабильной; вместо этого удаляется аминогруппа, в результате чего вместо пептидной связи образуется сложноэфирная (Ser / Thr) или тиоэфирная (Cys) связь. Эта химическая реакция называется ацильным сдвигом NO .

Связь сложный эфир / тиоэфир может быть разделена несколькими способами:

  • Простой гидролиз расщепляет полипептидную цепь, где смещенная аминогруппа становится новым N-концом. Это видно по созреванию гликозиласпарагиназы.
  • Реакция β-элиминирования также расщепляет цепь, но приводит к образованию пирувоильной группы на новом N-конце. Эта пирувоильная группа может использоваться в качестве ковалентно присоединенного каталитического кофактора в некоторых ферментах, особенно декарбоксилазах, таких как S-аденозилметиониндекарбоксилаза (SAMDC), которые используют электроноакцепторную способность пирувоильной группы.
  • Внутримолекулярная переэтерификация с образованием разветвленного полипептида. В интеинах новая сложноэфирная связь разрывается внутримолекулярной атакой аспарагина, который вскоре станет С-концом.
  • Межмолекулярная переэтерификация может переносить целый сегмент от одного полипептида к другому, как это видно при автопроцессинге белка Hedgehog.

Сжатие последовательности

Компрессия аминокислотных последовательностей - сравнительно сложная задача. Существующие специализированные компрессоры аминокислотных последовательностей ниже, чем компрессоры последовательностей ДНК, в основном из-за характеристик данных. Например, моделирование инверсий сложнее из-за обратной потери информации (от аминокислот до последовательности ДНК). Текущий компрессор данных без потерь, который обеспечивает более высокое сжатие, - это AC2. AC2 смешивает различные контекстные модели с использованием нейронных сетей и кодирует данные с использованием арифметического кодирования.

История

Предположение, что белки представляют собой линейные цепи α-аминокислот, было сделано почти одновременно двумя учеными на той же конференции в 1902 году, 74-м заседании Общества немецких ученых и врачей, проходившем в Карлсбаде. Франц Хофмайстер сделал это предложение утром, основываясь на своих наблюдениях за реакцией биурета в белках. Через несколько часов за Хофмайстером последовал Эмиль Фишер , который собрал множество химических деталей, подтверждающих модель пептидной связи. Для полноты картины предположение, что белки содержат амидные связи, было сделано еще в 1882 г. французским химиком Э. Гримо.

Несмотря на эти данные и более поздние доказательства того, что протеолитически расщепленные белки давали только олигопептиды, идея о том, что белки представляют собой линейные неразветвленные полимеры аминокислот, не была принята сразу. Некоторые уважаемые ученые, такие как Уильям Эстбери, сомневались, что ковалентные связи были достаточно прочными, чтобы удерживать вместе такие длинные молекулы; они опасались, что тепловое возбуждение может расколоть такие длинные молекулы. Герман Штаудингер столкнулся с аналогичными предрассудками в 1920-х годах, когда утверждал, что каучук состоит из макромолекул .

Таким образом, возникло несколько альтернативных гипотез. Гипотеза коллоидного белка утверждала, что белки представляют собой коллоидные сборки более мелких молекул. Эта гипотеза была опровергнута в 1920-х годах измерениями ультрацентрифугирования Теодором Сведбергом, которые показали, что белки имеют четко определенную воспроизводимую молекулярную массу, и электрофоретическими измерениями Арне Тизелиуса, которые показали, что белки представляют собой отдельные молекулы. Вторая гипотеза, то циклолы гипотеза выдвинута Дороти Wrinch , предложила , что линейный полипептид подвергнулся химические циклолы перегруппировка С = О + HN C (OH) -N , что сшиты его основой амидных групп, образуя двухмерную ткань . Другие первичные структуры белков были предложены различными исследователями, такие как дикетопиперазин модель из Эмиля абдергальден и модель пиррола / пиперидина в Troensegaard в 1942 г. Несмотря на то, никогда не давало много веры, эти альтернативные модели были окончательно опровергнуты , когда Фредерик Зангер успешно секвенировать инсулин и кристаллографическое определение миоглобина и гемоглобина Максом Перуцем и Джоном Кендрю .

Первичная структура в других молекулах

Можно сказать, что любой гетерополимер с линейной цепью имеет «первичную структуру» по аналогии с использованием термина для белков, но это использование редко по сравнению с чрезвычайно распространенным использованием в отношении белков. В РНК , которая также имеет обширную вторичную структуру , линейную цепь оснований обычно называют просто «последовательностью», как в ДНК (которая обычно образует линейную двойную спираль с небольшой вторичной структурой). Другие биологические полимеры, такие как полисахариды, также можно рассматривать как имеющие первичную структуру, хотя их использование не является стандартным.

Отношение к вторичной и третичной структуре

Первичная структура биологического полимера в значительной степени определяет трехмерную форму ( третичную структуру ). Последовательность белка можно использовать для прогнозирования локальных особенностей , таких как сегменты вторичной структуры или трансмембранные области. Однако сложность сворачивания белка в настоящее время не позволяет предсказать третичную структуру белка только по его последовательности. Знание структуры подобной гомологичной последовательности (например, члена того же семейства белков ) позволяет с высокой точностью предсказывать третичную структуру путем моделирования гомологии . Если доступна полноразмерная последовательность белка, можно оценить ее общие биофизические свойства , такие как изоэлектрическая точка .

Семейства последовательностей часто определяются кластеризацией последовательностей , а проекты структурной геномики нацелены на создание набора репрезентативных структур для покрытия пространства последовательностей возможных неизбыточных последовательностей.

Смотрите также

Примечания и ссылки