Генетический код - Genetic code

Генетический код является набором правил , используемых живыми клетки , чтобы перевести информацию , закодированную в пределах генетического материала ( ДНК или мРНК последовательностей нуклеотидных триплетов или кодонов ) в белки . Трансляция осуществляется рибосомой , которая связывает протеиногенные аминокислоты в порядке, заданном информационной РНК (мРНК), используя молекулы транспортной РНК (тРНК) для переноса аминокислот и считывания мРНК по трем нуклеотидам за раз. Генетический код всех организмов очень похож и может быть выражен в простой таблице с 64 записями.

Ряд кодонов в части молекулы информационной РНК (мРНК). Каждый кодон состоит из трех нуклеотидов , обычно соответствующих одной аминокислоте . Нуклеотиды сокращенно обозначаются буквами A, U, G и C. Это мРНК, в которой используется U ( урацил ). Вместо этого ДНК использует Т ( тимин ). Эта молекула мРНК будет инструктировать рибосому синтезировать белок в соответствии с этим кодом.

Кодоны указывают, какая аминокислота будет добавлена ​​следующей во время синтеза белка . За некоторыми исключениями, трехнуклеотидный кодон в последовательности нуклеиновой кислоты определяет одну аминокислоту. Подавляющее большинство генов кодируется по единой схеме (см. Таблицу кодонов РНК ). Эта схема часто упоминаются как канонические или стандартным генетический код, или просто с генетическим кодом, хотя вариантные коды (например, в митохондриях ) существует.

Генетический код - это экземпляр кода . Сравните с исходным кодом , кодексом закона и языком .

История

Генетический код

Попытки понять, как кодируются белки, начались после того , как в 1953 году была открыта структура ДНК . Джордж Гамов постулировал, что для кодирования 20 стандартных аминокислот, используемых живыми клетками для создания белков, необходимо использовать наборы из трех оснований, что позволило бы получить максимум 4 3 = 64 аминокислоты.

Кодоны

Крика, Бреннер, Барнетта и Уоттс-Тобин эксперимент впервые продемонстрировали , что кодоны состоят из трех оснований ДНК. Маршалл Ниренберг и Генрих Дж. Маттай были первыми, кто раскрыл природу кодона в 1961 году.

Они использовали бесклеточной системы для перевода с поли урацил РНК - последовательности (т.е. UUUUU ...) и обнаружил , что полипептид , который они синтезировали состоял только из аминокислоты фенилаланина . Таким образом, они пришли к выводу, что кодон UUU определяет аминокислоту фенилаланин.

За этим последовало экспериментов в Северо Очоа лаборатории о том , что показано , что поли - аденин - последовательность РНК (ААААА ...) кодируется для полипептида поли- лизина и что поли цитозин последовательности РНК (ККККК ...) кодируется для полипептид поли- пролина . Следовательно, кодон AAA определяет аминокислоту лизин , а кодон CCC определяет аминокислоту пролин . Затем с использованием различных сополимеров было определено большинство оставшихся кодонов.

Последующая работа Хар Гобинд Хорана определила остальную часть генетического кода. Вскоре после этого Роберт У. Холли определил структуру транспортной РНК (тРНК), адапторной молекулы, которая облегчает процесс трансляции РНК в белок. Эта работа была основана на более ранних исследованиях Очоа, которые принесли последнему Нобелевскую премию по физиологии и медицине в 1959 году за работу по энзимологии синтеза РНК.

Продолжая эту работу, Ниренберг и Филип Ледер раскрыли триплетную природу кода и расшифровали его кодоны. В этих экспериментах различные комбинации мРНК пропускались через фильтр, содержащий рибосомы , компоненты клеток, которые переводят РНК в белок. Уникальные триплеты способствовали связыванию специфических тРНК с рибосомой. Ледер и Ниренберг в своих экспериментах смогли определить последовательности 54 из 64 кодонов. Хорана, Холли и Ниренберг получили Нобелевскую премию 1968 года за свою работу.

Три стоп-кодона были названы первооткрывателями Ричардом Эпштейном и Чарльзом Стейнбергом. «Янтарь» был назван в честь их друга Харриса Бернстайна, фамилия которого в переводе с немецкого означает «янтарь». Два других стоп-кодона были названы «охра» и «опал», чтобы сохранить тему «названий цветов».

Расширенные генетические коды (синтетическая биология)

В широкой академической аудитории широко принята концепция эволюции генетического кода от исходного и неоднозначного генетического кода к четко определенному («замороженному») коду с репертуаром из 20 (+2) канонических аминокислот. Однако есть разные мнения, концепции, подходы и идеи, что лучше всего изменить экспериментальным путем. Предлагаются даже модели, которые предсказывают «точки входа» для инвазии синтетических аминокислот в генетический код.

С 2001 года 40 неприродных аминокислот были добавлены в белок путем создания уникального кодона (перекодирования) и соответствующей пары трансфер-РНК: аминоацил-тРНК-синтетаза, чтобы кодировать его с различными физико-химическими и биологическими свойствами для использования в качестве инструмент для изучения структуры и функции белков или для создания новых или улучшенных белков.

Х. Мураками и М. Сисидо расширили некоторые кодоны до четырех и пяти оснований. Стивен А. Беннер сконструировал функциональный 65-й ( in vivo ) кодон.

В 2015 году Н. Будиса , Д. Сёлль и соавторы сообщили о полной замене всех 20 899 остатков триптофана (кодонов UGG) на неестественный тиенопирролаланин в генетическом коде бактерии Escherichia coli .

В 2016 году был создан первый стабильный полусинтетический организм. Это была (одноклеточная) бактерия с двумя синтетическими основаниями (называемыми X и Y). Основания пережили деление клеток.

В 2017 году исследователи из Южной Кореи сообщили, что они создали мышь с расширенным генетическим кодом, которая может производить белки с неестественными аминокислотами.

В мае 2019 года исследователи в рамках важной вехи в работе сообщили о создании новой синтетической (возможно, искусственной ) формы жизнеспособной жизни , варианта бактерии Escherichia coli , путем сокращения естественного числа 64 кодонов в бактериальном геноме до 59 кодонов. вместо этого, чтобы кодировать 20 аминокислот .

Функции

Рамки считывания в последовательности ДНК области митохондриального генома человека, кодирующей гены MT-ATP8 и MT-ATP6 (черные: положения от 8,525 до 8,580 в последовательности доступа NC_012920). Есть три возможных рамки считывания в прямом направлении 5 '→ 3', начиная с первой (+1), второй (+2) и третьей позиции (+3). Для каждого кодона (квадратные скобки) аминокислота задается митохондриальным кодом позвоночных либо в рамке +1 для MT-ATP8 (красный цвет), либо в рамке +3 для MT-ATP6 (синий цвет). В МТ-ATP8 гены завершается с TAG стоп - кодона (красная точка) в кадре +1. Ген MT-ATP6 начинается с кодона ATG (синий кружок для аминокислоты M) в рамке +3.

Рамка для чтения

Рамка считывания определяется начальным триплетом нуклеотидов, с которого начинается трансляция. Он устанавливает рамку для серии последовательных неперекрывающихся кодонов, которая известна как « открытая рамка считывания » (ORF). Например, строка 5'-AAATGAACG-3 '(см. Рисунок), если она читается с первой позиции, содержит кодоны AAA, TGA и ACG; если читать со второй позиции, он содержит кодоны AAT и GAA; и если читать с третьей позиции, он содержит кодоны ATG и AAC. Таким образом, каждая последовательность может быть прочитана в направлении 5 '→ 3' в трех рамках считывания , каждая из которых дает, возможно, отдельную аминокислотную последовательность: в данном примере Lys (K) -Trp (W) -Thr (T), Asn (N) -Glu (E) или Met (M) -Asn (N) соответственно (при трансляции с митохондриальным кодом позвоночных). Когда ДНК двухцепочечная, определяются шесть возможных рамок считывания : три в прямой ориентации на одной цепи и три в обратной ориентации на противоположной цепи. Кодирующие белки рамки определяются стартовым кодоном , обычно первым кодоном AUG (ATG) в последовательности РНК (ДНК).

У эукариот открытые рамки считывания в экзонах часто прерываются интронами .

Старт и стоп кодоны

Трансляция начинается с кодона инициации цепи или стартового кодона . Одного стартового кодона недостаточно для начала процесса. Соседние последовательности, такие как последовательность Шайна-Дальгарно в E. coli, и факторы инициации также необходимы для начала трансляции. Наиболее распространенным стартовым кодоном является AUG, который читается как метионин или, у бактерий, как формилметионин . Альтернативные стартовые кодоны в зависимости от организма включают «GUG» или «UUG»; эти кодоны обычно представляют собой валин и лейцин соответственно, но в качестве стартовых кодонов они переводятся как метионин или формилметионин.

У трех стоп-кодонов есть названия: UAG - янтарный , UGA - опаловый (иногда также называемый умброй ) и UAA - охра . Стоп-кодоны также называют «терминирующими» или «бессмысленными» кодонами. Они сигнализируют о высвобождении растущего полипептида из рибосомы, потому что ни одна родственная тРНК не имеет антикодонов, комплементарных этим стоп-сигналам, позволяя фактору высвобождения вместо этого связываться с рибосомой.

Эффект мутаций

Примеры заметных мутаций, которые могут произойти у человека.

В процессе репликации ДНК иногда возникают ошибки при полимеризации второй цепи. Эти ошибки, мутации , могут влиять на фенотип организма , особенно если они происходят в кодирующей белок последовательности гена. Частота ошибок обычно составляет 1 ошибку на каждые 10–100 миллионов оснований - из-за способности ДНК-полимераз «корректировать» .

Миссенс-мутации и бессмысленные мутации являются примерами точечных мутаций, которые могут вызывать генетические заболевания, такие как серповидно-клеточная анемия и талассемия соответственно. Клинически важные миссенс-мутации обычно изменяют свойства кодируемого аминокислотного остатка в основном, кислотном, полярном или неполярном состояниях, тогда как бессмысленные мутации приводят к стоп-кодону .

Мутации, которые нарушают последовательность рамки считывания за счет инсерций ( вставок или делеций ) не кратных 3 нуклеотидным основаниям, известны как мутации со сдвигом рамки считывания . Эти мутации обычно приводят к полностью отличной трансляции от оригинала и, вероятно, вызывают считывание стоп-кодона , что усекает белок. Эти мутации могут нарушать функцию белка и поэтому редко встречаются в последовательностях, кодирующих белок in vivo . Одна из причин, по которой наследование мутаций сдвига рамки считывания является редким, заключается в том, что, если транслируемый белок необходим для роста под давлением отбора, с которым сталкивается организм, отсутствие функционального белка может вызвать смерть до того, как организм станет жизнеспособным. Мутации со сдвигом рамки могут привести к тяжелым генетическим заболеваниям, таким как болезнь Тея – Сакса .

Хотя большинство мутаций, изменяющих белковые последовательности, вредны или нейтральны, некоторые мутации имеют преимущества. Эти мутации могут позволить мутантному организму противостоять определенным стрессам окружающей среды лучше, чем организмы дикого типа , или более быстро воспроизводиться. В этих случаях мутация, как правило, становится более распространенной в популяции в результате естественного отбора . Вирусы , использующие РНК в качестве своего генетического материала, имеют быструю скорость мутаций, что может быть преимуществом, поскольку эти вирусы, таким образом, быстро развиваются и, таким образом, уклоняются от защитных реакций иммунной системы . В больших популяциях организмов, размножающихся бесполым путем, например, E. coli , могут одновременно возникать множественные полезные мутации. Это явление называется клональной интерференцией и вызывает конкуренцию между мутациями.

Вырождение

Группировка кодонов по молярному объему аминокислотных остатков и гидропатичности . Более подробная версия доступна.
Оси 1, 2, 3 - это первая, вторая и третья позиции в кодоне. 20 аминокислот и стоп-кодоны (X) показаны однобуквенным кодом .

Вырождение - это избыточность генетического кода. Этот термин был дан Бернфилдом и Ниренбергом. Генетический код имеет избыточность, но не неоднозначен ( полную корреляцию см. В таблицах кодонов ниже). Например, хотя кодоны GAA и GAG определяют глутаминовую кислоту (избыточность), ни один из них не определяет другую аминокислоту (без двусмысленности). Кодоны, кодирующие одну аминокислоту, могут различаться в любом из трех положений. Например, аминокислота лейцин определяется кодонами Y U R или CU N (UUA, UUG, CUU, CUC, CUA или CUG) (разница в первом или третьем положении указывается с использованием обозначения IUPAC ), а аминокислота серин определяется кодонами UC N или AG Y (UCA, UCG, UCC, UCU, AGU или AGC) (разница в первом, втором или третьем положении). Практическое следствие избыточности состоит в том, что ошибки в третьем положении триплетного кодона вызывают только молчащую мутацию или ошибку, которая не повлияет на белок, потому что гидрофильность или гидрофобность поддерживается эквивалентной заменой аминокислот; например, кодон NUN (где N = любой нуклеотид) имеет тенденцию кодировать гидрофобные аминокислоты. NCN дает аминокислотные остатки небольшого размера и умеренной гидропатичности ; NAN кодирует гидрофильные остатки среднего размера. Генетический код настолько хорошо структурирован с точки зрения гидропатичности, что математический анализ ( разложение по сингулярным значениям ) 12 переменных (4 нуклеотида x 3 положения) дает замечательную корреляцию (C = 0,95) для прогнозирования гидропатичности кодируемой аминокислоты непосредственно из триплетная нуклеотидная последовательность без трансляции. Обратите внимание, что в таблице ниже восемь аминокислот вообще не подвержены мутации в третьем положении кодона, тогда как на рисунке выше мутация во втором положении, вероятно, вызовет радикальное изменение физико-химических свойств кодируемая аминокислота. Тем не менее, изменения в первой позиции кодонов более важны, чем изменения во второй позиции в глобальном масштабе. Причина может заключаться в том, что изменение заряда (с положительного на отрицательный или наоборот) может происходить только при мутациях в первом положении определенных кодонов, но не при изменении второго положения любого кодона. Такое изменение заряда может иметь драматические последствия для структуры или функции белка. Этот аспект, возможно, был в значительной степени недооценен предыдущими исследованиями.

Предвзятость использования кодонов

Частота кодонов, также известная как систематическая ошибка использования кодонов , может варьироваться от вида к виду с функциональными последствиями для контроля трансляции .

Таблица частот кодонов генома человека
Частота кодонов генома человека
Кодон AA Дробная часть Freq Число Кодон AA Дробная часть Freq Число Кодон AA Дробная часть Freq Число Кодон AA Дробная часть Freq Число
UUU F 0,46 17,6 714 298 УКУ S 0,19 15,2 618 711 UAU Y 0,44 12.2 495 699 UGU C 0,46 10,6 430 311
UUC F 0,54 20,3 824 692 UCC S 0,22 17,7 718 892 ОАК Y 0,56 15.3 622 407 UGC C 0,54 12,6 513 028
UUA L 0,08 7,7 311 881 УЦА S 0,15 12.2 496 448 UAA * 0,30 1.0 40 285 UGA * 0,47 1.6 63 237
UUG L 0,13 12,9 525 688 UCG S 0,05 4.4 179 419 UAG * 0,24 0,8 32 109 UGG W 1,00 13,2 535 595
CUU L 0,13 13,2 536 515 CCU п 0,29 17,5 713 233 CAU ЧАС 0,42 10.9 441 711 CGU р 0,08 4.5 184 609
CUC L 0,20 19,6 796 638 CCC п 0,32 19,8 804 620 САС ЧАС 0,58 15.1 613 713 CGC р 0,18 10,4 423 516
CUA L 0,07 7.2 290 751 CCA п 0,28 16,9 688 038 CAA Q 0,27 12,3 501 911 CGA р 0,11 6.2 250 760
CUG L 0,40 39,6 1 611 801 CCG п 0,11 6.9 281 570 CAG Q 0,73 34,2 1,391,973 CGG р 0,20 11,4 464 485
AUU я 0,36 16.0 650 473 ACU Т 0,25 13,1 533 609 AAU N 0,47 17.0 689 701 AGU S 0,15 12.1 493 429
AUC я 0,47 20,8 846 466 АКК Т 0,36 18,9 768 147 AAC N 0,53 19,1 776 603 AGC S 0,24 19,5 791 383
AUA я 0,17 7,5 304 565 ACA Т 0,28 15.1 614 523 AAA K 0,43 24,4 993 621 AGA р 0,21 12.2 494 682
АВГУСТ M 1,00 22,0 896 005 АЧГ Т 0,11 6.1 246 105 AAG K 0,57 31,9 1,295,568 AGG р 0,21 12.0 486 463
ГУ V 0,18 11.0 448 607 GCU А 0,27 18,4 750 096 ГАУ D 0,46 21,8 885 429 ГГУ грамм 0,16 10,8 437 126
GUC V 0,24 14,5 588 138 GCC А 0,40 27,7 1 127 679 GAC D 0,54 25,1 1 020 595 GGC грамм 0,34 22,2 903 565
GUA V 0,12 7.1 287 712 GCA А 0,23 15,8 643 471 GAA E 0,42 29,0 1,177,632 GGA грамм 0,25 16,5 669 873
GUG V 0,46 28,1 1 143 534 GCG А 0,11 7,4 299 495 GAG E 0,58 39,6 1 609 975 GGG грамм 0,25 16,5 669 768

Альтернативные генетические коды

Нестандартные аминокислоты

В некоторых белках нестандартные аминокислоты заменяются стандартными стоп-кодонами в зависимости от ассоциированных сигнальных последовательностей в матричной РНК. Например, UGA может кодировать селеноцистеин, а UAG может кодировать пирролизин . Селеноцистеин стал считаться 21-й аминокислотой, а пирролизин - 22-й. В отличие от селеноцистеина, UAG, кодируемый пирролизином, транслируется с участием специальной аминоацил-тРНК синтетазы . И селеноцистеин, и пирролизин могут присутствовать в одном организме. Хотя генетический код обычно фиксируется в организме, ахеальный прокариот Acetohalobium arabaticum может расширять свой генетический код с 20 до 21 аминокислоты (за счет включения пирролизина) в различных условиях роста.

Вариации

Генетический код логотипа на Globobulimina pseudospinescens митохондриального генома. На логотипе слева направо показаны 64 кодона, предсказанные альтернативы показаны красным цветом (относительно стандартного генетического кода). Красная линия: стоп-кодоны. Высота каждой аминокислоты в стопке показывает, как часто она выравнивается с кодоном в гомологичных доменах белка. Высота стека указывает на поддержку прогноза.

Варианты стандартного кода были предсказаны в 1970-х годах. Первый был открыт в 1979 году исследователями митохондриальных генов человека . После этого было обнаружено множество небольших вариантов, включая различные альтернативные митохондриальные коды. Эти второстепенные варианты, например, включают трансляцию кодона UGA в виде триптофана у видов Mycoplasma и трансляцию CUG в виде серина, а не лейцина у дрожжей «клады CTG» (таких как Candida albicans ). Поскольку вирусы должны использовать тот же генетический код, что и их хозяева, модификации стандартного генетического кода могут мешать синтезу или функционированию вирусного белка. Однако вирусы, такие как тотивирусы , адаптировались к модификации генетического кода хозяина. У бактерий и архей обычными стартовыми кодонами являются GUG и UUG. В редких случаях некоторые белки могут использовать альтернативные стартовые кодоны. Удивительно, но вариации в интерпретации генетического кода существуют также в человеческих генах, кодируемых ядром: в 2016 году исследователи, изучающие трансляцию малатдегидрогеназы, обнаружили, что примерно в 4% мРНК, кодирующих этот фермент, стоп-кодон естественным образом используется для кодирования аминокислоты триптофан и аргинин. Этот тип перекодирования вызывается контекстом стоп-кодонов с высоким уровнем считывания и называется функциональным считыванием трансляций .

Варианты генетических кодов, используемых организмом, могут быть выведены путем идентификации высококонсервативных генов, кодируемых в этом геноме, и сравнения использования его кодонов с аминокислотами в гомологичных белках других организмов. Например, программа FACIL выводит генетический код, ища, какие аминокислоты в доменах гомологичных белков чаще всего совпадают с каждым кодоном. Полученные вероятности аминокислот для каждого кодона отображаются в логотипе генетического кода, который также показывает поддержку стоп-кодона.

Несмотря на эти различия, все известные природные коды очень похожи. Механизм кодирования одинаков для всех организмов: трехосновные кодоны, тРНК , рибосомы, чтение в одном направлении и перевод отдельных кодонов в отдельные аминокислоты. Самые крайние вариации встречаются у некоторых инфузорий, где значение стоп-кодонов зависит от их положения в мРНК. Находясь близко к 3'-концу, они действуют как терминаторы, в то время как во внутренних положениях они либо кодируют аминокислоты, как у Condylostoma magnum, либо запускают рибосомный сдвиг рамки считывания, как у Euplotes .

Источник

Генетический код - ключевая часть истории жизни , согласно одной из версий, самовоспроизводящиеся молекулы РНК предшествовали жизни, какой мы ее знаем. Это гипотеза мира РНК . Согласно этой гипотезе, любая модель возникновения генетического кода тесно связана с моделью перехода от рибозимов (ферментов РНК) к белкам как основным ферментам в клетках. В соответствии с гипотезой о мире РНК, молекулы транспортной РНК, по-видимому, эволюционировали раньше современных аминоацил-тРНК синтетаз , поэтому последняя не может быть частью объяснения ее паттернов.

Гипотетический случайно возникший генетический код дополнительно мотивирует биохимическую или эволюционную модель его происхождения. Если бы аминокислоты были случайным образом отнесены к триплетным кодонам, было бы 1,5 × 10 84 возможных генетических кода. Это число определяется путем расчета количества способов, которыми 21 элемент (20 аминокислот плюс одна остановка) может быть помещен в 64 ячейки, при этом каждый элемент используется хотя бы один раз. Однако распределение кодонов в генетическом коде неслучайно. В частности, генетический код группирует определенные назначения аминокислот.

Аминокислоты, которые участвуют в одном и том же пути биосинтеза, обычно имеют одно и то же первое основание в своих кодонах. Это могло быть эволюционным реликтом раннего, более простого генетического кода с меньшим количеством аминокислот, который позже эволюционировал, чтобы кодировать больший набор аминокислот. Он также может отражать стерические и химические свойства, которые оказали другое влияние на кодон во время его эволюции. Аминокислоты со схожими физическими свойствами также имеют похожие кодоны, что снижает проблемы, вызванные точечными мутациями и ошибочными переводами.

Учитывая неслучайную схему генетического триплетного кодирования, разумная гипотеза происхождения генетического кода может касаться нескольких аспектов таблицы кодонов, таких как отсутствие кодонов для D-аминокислот, вторичные образцы кодонов для некоторых аминокислот, ограничение синонимичных положения к третьему положению, небольшой набор только из 20 аминокислот (вместо числа, приближающегося к 64), и связь паттернов стоп-кодонов с паттернами аминокислотного кодирования.

Три основные гипотезы касаются происхождения генетического кода. Многие модели относятся к одному из них или к гибриду:

  • Случайное замораживание: генетический код был создан случайным образом. Например, ранние тРНК- подобные рибозимы могли иметь различное сродство к аминокислотам, при этом кодоны, возникающие из другой части рибозима, демонстрировали случайную изменчивость. Как только было закодировано достаточное количество пептидов , любое серьезное случайное изменение генетического кода было бы летальным; следовательно, он стал «замороженным».
  • Стереохимическое сродство: генетический код является результатом высокого сродства между каждой аминокислотой и ее кодоном или антикодоном; последний вариант подразумевает, что молекулы пре-тРНК соответствовали своим соответствующим аминокислотам по этому сродству. Позже в ходе эволюции это совпадение было постепенно заменено совпадением аминоацил-тРНК синтетаз.
  • Оптимальность: генетический код продолжал развиваться после своего первоначального создания, так что текущий код максимизирует некоторую функцию приспособленности , обычно некоторую минимизацию ошибок.

Гипотезы касались множества сценариев:

  • Химические принципы регулируют специфическое взаимодействие РНК с аминокислотами. Эксперименты с аптамерами показали, что некоторые аминокислоты обладают избирательным химическим сродством к своим кодонам. Эксперименты показали, что из 8 протестированных аминокислот 6 демонстрируют некоторую ассоциацию триплет-аминокислота РНК.
  • Биосинтетическое расширение. Генетический код вырос из более простого более раннего кода в процессе «биосинтетического расширения». Первобытная жизнь «открыла» новые аминокислоты (например, как побочные продукты метаболизма ) и позже включила некоторые из них в механизм генетического кодирования. Хотя было найдено много косвенных доказательств того, что в прошлом использовалось меньшее количество типов аминокислот, точные и подробные гипотезы о том, какие аминокислоты вошли в код и в каком порядке, являются спорными. Однако несколько исследований показали, что Gly, Ala, Asp, Val, Ser, Pro, Glu, Leu, Thr могут принадлежать к группе аминокислот раннего присоединения, тогда как Cys, Met, Tyr, Trp, His, Phe могут принадлежать к группе добавленных позже аминокислот.
  • Естественный отбор привел к назначению кодонов генетического кода, что минимизирует эффекты мутаций . Недавняя гипотеза предполагает, что триплетный код был получен из кодов, которые использовали более длинные, чем триплетные кодоны (например, квадруплетные кодоны). Декодирование длиннее, чем триплет, увеличит избыточность кодонов и будет более устойчивым к ошибкам. Эта функция может позволить точное декодирование в отсутствие сложных трансляционных механизмов, таких как рибосома , например, до того, как клетки начали создавать рибосомы.
  • Информационные каналы: теоретико-информационные подходы моделируют процесс трансляции генетического кода в соответствующие аминокислоты как подверженный ошибкам информационный канал. Собственный шум (то есть ошибка) в канале ставит организм перед фундаментальным вопросом: как можно сконструировать генетический код, чтобы противостоять шуму, при этом точно и эффективно транслируя информацию? Эти модели «скорость-искажение» предполагают, что генетический код возник в результате взаимодействия трех конфликтующих эволюционных сил: потребности в различных аминокислотах, устойчивости к ошибкам и минимальных затрат на ресурсы. Код возникает при переходе, когда отображение кодонов в аминокислоты становится неслучайным. Появление кода регулируется топологией, определяемой вероятными ошибками, и связано с проблемой раскраски карты .
  • Теория игр: модели, основанные на сигнальных играх, сочетают в себе элементы теории игр, естественного отбора и информационных каналов. Такие модели использовались, чтобы предположить, что первые полипептиды, вероятно, были короткими и имели неферментативную функцию. Теоретико-игровые модели предполагают, что организация цепочек РНК в клетках могла быть необходима для предотвращения «обманчивого» использования генетического кода, то есть предотвращения распространения древнего эквивалента вирусов в мире РНК.
  • Стоп-кодоны: кодоны для остановки трансляции также представляют собой интересный аспект проблемы происхождения генетического кода. В качестве примера решения проблемы эволюции стоп-кодонов было высказано предположение, что стоп-кодоны таковы, что они с наибольшей вероятностью прервут трансляцию раньше в случае ошибки сдвига кадра . Напротив, некоторые стереохимические молекулярные модели объясняют происхождение стоп-кодонов как «нераспознаваемое».

Смотрите также

использованная литература

дальнейшее чтение

внешние ссылки