Мультилокусная типизация последовательностей - Multilocus sequence typing

Мультилокусное типирование последовательностей ( MLST ) - это метод молекулярной биологии для типирования множественных локусов . Процедура характеризует изоляты микробных видов с использованием последовательностей ДНК внутренних фрагментов нескольких генов домашнего хозяйства . Используются приблизительно 450-500 п.н. внутренних фрагментов каждого гена, поскольку их можно точно секвенировать на обеих цепях с помощью автоматического секвенатора ДНК. Для каждого гена домашнего хозяйства различные последовательности, присутствующие в пределах одного вида бактерий, назначаются как отдельные аллели, и для каждого изолята аллели в каждом из локусов определяют аллельный профиль или тип последовательности (ST).

Первая схема MLST была разработана для Neisseria meningitidis , возбудителя менингококкового менингита и сепсиса . С момента своего появления для исследования эволюционной истории MLST использовалась не только для патогенов человека, но и для патогенов растений.

Принцип

MLST непосредственно измеряет вариации последовательности ДНК в наборе генов домашнего хозяйства и характеризует штаммы по их уникальным аллельным профилям. Принцип MLST прост: метод включает амплификацию ПЦР с последующим секвенированием ДНК . Нуклеотидные различия между штаммами можно проверить на различном количестве генов в зависимости от желаемой степени дискриминации.

Рабочий процесс MLST включает: 1) сбор данных, 2) анализ данных и 3) анализ мультилокусных последовательностей. На этапе сбора данных окончательная идентификация вариации достигается путем определения нуклеотидной последовательности фрагментов гена. На этапе анализа данных всем уникальным последовательностям присваиваются номера аллелей, объединяются в профиль аллелей и присваивается тип последовательности (ST). Если обнаруживаются новые аллели и ST, они после проверки сохраняются в базе данных. На заключительном этапе анализа MLST родство изолятов определяется путем сравнения аллельных профилей. Исследователи проводят эпидемиологические и филогенетические исследования, сравнивая ST различных клональных комплексов. В процессе секвенирования и идентификации создается огромный набор данных, поэтому биоинформатические методы используются для упорядочивания, управления, анализа и объединения всех биологических данных.

Чтобы найти баланс между приемлемой мощностью идентификации, временем и стоимостью типирования штамма, в лабораториях обычно используют от семи до восьми «домашних» генов. Цитируя Staphylococcus aureus в качестве примера, в типировании MLST используются семь генов домашнего хозяйства. Эти гены включают карбаматкиназу ( arcC ), шикиматдегидрогеназу ( aroE ), глицеринкиназу ( glpF ), гуанилаткиназу ( gmk ), фосфат-ацетилтрансферазу ( pta ), триозофосфат-изомеразу ( tpi ) и ацетил-кофермент A-ацетилтрансферазу ( y- ацетилтрансфераза ). Сайт MLST. Однако нередко используется до десяти генов домашнего хозяйства. Для Vibrio vulnificus используются гены домашнего хозяйства: глюкозо-6-фосфат-изомераза ( glp ), ДНК-гираза, субъединица B ( gyrB ), малат-лактатдегидрогеназа ( mdh ), метионил-тРНК-синтетаза ( metG ), фосфорибозиламиноимидазолсинтетаза ( purM ). треониндегидрогеназа ( dtdS ), диаминопимелатдекарбоксилаза ( lysA ), альфа-субъединица трансгидрогеназы ( pntA ), дигидрооротаза ( pyrC ) и триптофаназа ( tnaA ). Таким образом, количество и тип генов домашнего хозяйства, опрошенных MLST, могут отличаться от вида к виду.

Для каждого из этих генов домашнего хозяйства различные последовательности назначаются как аллели, а аллели в локусах обеспечивают аллельный профиль. Затем серия профилей может быть маркером идентификации для типирования штамма. Последовательности, которые различаются даже в одном нуклеотиде, назначаются как разные аллели, и весовой коэффициент не дается, чтобы учесть количество нуклеотидных различий между аллелями, поскольку мы не можем различить, являются ли различия в нескольких нуклеотидных сайтах результатом множественных точечных мутаций или единственной рекомбинационный обмен. Большое количество потенциальных аллелей в каждом из локусов дает возможность различать миллиарды различных аллельных профилей, и можно ожидать, что штамм с наиболее распространенным аллелем в каждом локусе будет случайно встречаться примерно один раз из 10 000 изолятов. Несмотря на то, что MLST обеспечивает высокую дискриминационную способность, накопление нуклеотидных изменений в генах домашнего хозяйства является относительно медленным процессом, а аллельный профиль бактериального изолята достаточно стабилен во времени, чтобы этот метод был идеальным для глобальной эпидемиологии.

Родство изолятов отображается в виде дендрограммы, построенной с использованием матрицы попарных различий между их аллельными профилями, eBURST или минимального остовного дерева (MST). Дендрограмма - это всего лишь удобный способ отображения тех изолятов, которые имеют идентичные или очень похожие аллельные профили, которые, как можно предположить, происходят от общего предка; отношения между изолятами, которые различаются более чем по трем из семи локусов, вероятно, будут ненадежными и не должны использоваться для вывода их филогении. MST соединяет все выборки таким образом, чтобы суммарное расстояние всех ветвей дерева было минимальным.

В качестве альтернативы, родственность изолятов также может быть проанализирована с помощью MultiLocus Sequence Analysis ( MLSA ). При этом не используются присвоенные аллели, а вместо этого конкатенируются последовательности генных фрагментов генов домашнего хозяйства и эта конкатенированная последовательность используется для определения филогенетических взаимоотношений. В отличие от MLST, этот анализ указывает на более высокое сходство между последовательностями, отличающимися только одним нуклеотидом, и более низкое сходство между последовательностями с множественными нуклеотидными различиями. В результате этот анализ больше подходит для организмов с клональной эволюцией и менее подходит для организмов, в которых рекомбинационные события происходят очень часто. Его также можно использовать для определения филогенетических отношений между близкородственными видами. Термины MLST и MLSA очень часто считаются взаимозаменяемыми. Однако это неверно, поскольку каждый метод анализа имеет свои отличительные особенности и применение. Следует соблюдать осторожность, чтобы использовать правильный термин.

Сравнение с другими техниками

Более ранние подходы к серологическому типированию были разработаны для дифференциации бактериальных изолятов, но иммунологическое типирование имеет недостатки, такие как зависимость от нескольких антигенных локусов и непредсказуемая реактивность антител с различными антигенными вариантами. Было предложено несколько схем молекулярного типирования для определения родства патогенов, таких как гель-электрофорез в импульсном поле ( PFGE ), риботипирование и дактилоскопия на основе ПЦР . Но эти методы выделения подтипов, основанные на бэндинге ДНК, не обеспечивают значимого эволюционного анализа. Несмотря на то, что многие исследователи считают PFGE «золотым стандартом», многие штаммы не поддаются типированию с помощью этого метода из-за деградации ДНК во время процесса (мазки из геля).

Подход MLST отличается от мультилокусного ферментного электрофореза (MLEE), который основан на различной электрофоретической подвижности (EM) нескольких основных метаболических ферментов. Аллели в каждом локусе определяют ЕМ своих продуктов, поскольку разные аминокислотные последовательности ферментов приводят к разной подвижности и разным полосам при прохождении на геле. Родство изолятов затем можно визуализировать с помощью дендрограммы, созданной на основе матрицы попарных различий между электрофоретическими типами. Этот метод имеет более низкое разрешение, чем MLST, по нескольким причинам, все из которых связаны с тем фактом, что разнообразие ферментативных фенотипов является лишь показателем разнообразия последовательностей ДНК. Во-первых, ферменты могут иметь разные аминокислотные последовательности, но при этом не иметь достаточно разных ЭМ, чтобы давать четкие полосы. Во-вторых, «молчащие мутации» могут изменять последовательность ДНК гена без изменения кодируемых аминокислот. В-третьих, фенотип фермента может легко изменяться в ответ на условия окружающей среды и плохо влиять на воспроизводимость результатов MLEE - распространенными модификациями ферментов являются фосфорилирование, связывание кофакторов и расщепление транспортных последовательностей. Это также ограничивает сопоставимость данных MLEE, полученных разными лабораториями, тогда как MLST предоставляет портативные и сопоставимые данные последовательностей ДНК и имеет большой потенциал для автоматизации и стандартизации.

MLST не следует путать со штрих-кодированием ДНК . Последний представляет собой таксономический метод, который использует короткие генетические маркеры для распознавания определенных видов эукариот. Он основан на том факте, что митохондриальная ДНК (мтДНК) или некоторые части цистрона рибосомной ДНК имеют относительно высокую скорость мутаций, что приводит к значительным вариациям в последовательностях между видами. Методы мтДНК возможны только у эукариот (поскольку у прокариот отсутствуют митохондрии), тогда как MLST, хотя изначально был разработан для прокариот, теперь находит применение у эукариот и, в принципе, может применяться в любом царстве.

Преимущества и применение

MLST очень однозначен и портативен. Между лабораториями можно обмениваться материалами, необходимыми для определения ST. Последовательности праймеров и протоколы доступны в электронном виде. Он воспроизводимый и масштабируемый. MLST автоматизирован, сочетает в себе достижения в области высокопроизводительного секвенирования и биоинформатики с известными методами популяционной генетики. Данные MLST можно использовать для исследования эволюционных взаимоотношений между бактериями. MLST обеспечивает хорошую дискриминационную способность для дифференциации изолятов.

Применение MLST огромно и предоставляет ресурс для научных, общественных и ветеринарных сообществ, а также для пищевой промышленности. Ниже приведены примеры приложений MLST.

Campylobacter

Campylobacter - распространенный возбудитель бактериальных инфекционных кишечных заболеваний, обычно возникающих из-за недоваренной птицы или непастеризованного молока. Однако его эпидемиология плохо изучена, поскольку вспышки выявляются редко, поэтому источники и пути распространения вспышки нелегко отследить. Кроме того,геномы Campylobacter генетически разнообразны и нестабильны с частой меж- и внутригеномной рекомбинацией, а также фазовой изменчивостью, что затрудняет интерпретацию данных, полученных с помощью многих методов типирования. До недавнего времени с применением техники MLSTтипирование Campylobacter достигло большого успеха и было добавлено в базу данных MLST. По состоянию на 1 мая 2008 г.база данных Campylobacter MLST содержит 3516 изолятов и около 30 публикаций, в которых MLST используется или упоминается в исследованиях Campylobacter ( http://pubmlst.org/campylobacter/ ).

Neisseria meningitidis

MLST предоставил более богатую картину бактерий в человеческих популяциях и вариантов штаммов, которые могут быть патогенными для человека, растений и животных. Техника MLST была впервые использована Maiden et al. (1) охарактеризовать Neisseria meningitidis с использованием шести локусов. Применение MLST четко разрешило основные менингококковые клоны, которые, как известно, ответственны за инвазивные заболевания во всем мире. Для повышения уровня дискриминирующей способности между основными инвазивными клонами в настоящее время используются семь локусов, которые были приняты многими лабораториями в качестве метода выбора для характеристики изолятов менингококка. Хорошо известно, что рекомбинационные обмены обычно происходят у N. meningitidis , что приводит к быстрой диверсификации менингококковых клонов. MLST успешно предоставил надежный метод характеристики клонов в пределах других видов бактерий, у которых скорость клональной диверсификации обычно ниже.

Золотистый стафилококк

S. aureus вызывает ряд заболеваний. Устойчивый к метициллину S. aureus ( MRSA ) вызывает растущие опасения по поводу его устойчивости почти ко всем антибиотикам, кроме ванкомицина. Однако наиболее серьезныеинфекции S. aureus в сообществе и многие в больницах вызываются метициллин-чувствительными изолятами (MSSA), и было мало попыток идентифицировать гипервирулентные клоны MSSA, связанные с серьезным заболеванием. Поэтому MLST был разработан для обеспечения однозначного метода характеристики клонов MRSA и для идентификации клонов MSSA, связанных с серьезным заболеванием.

Streptococcus pyogenes

S. pyogenes вызывает различные заболевания, от фарингита до опасного для жизни импетиго, включая некротический фасциит. Разработана схема MLST для S. pyogenes . В настоящее время база данных ( mlst.net ) содержит аллельные профили изолятов, которые отражают мировое разнообразие организмов, и изоляты от серьезных инвазивных заболеваний.

грибковые микроорганизмы албиканс

C. albicans является грибковым патогеном человека и вызывает внутрибольничные инфекции кровотока. Метод MLST использовался для характеристикиизолятов C. albicans . Комбинация аллелей в разных локусах приводит к уникальным типам диплоидных последовательностей, которые можно использовать для различения штаммов. Было показано, что MLST успешно применяется для изучения эпидемиологии C. albicans в больнице, а также разнообразияизолятов C. albicans, полученных из различных экологических ниш, включая людей и животных-хозяев.

Cronobacter

Род Cronobacter состоит из 7 видов. До 2007 г. этим организмам было присвоено единое видовое название Enterobacter sakazakii . Cronobacter MLST первоначально был применен для различения между С. sakazakii и С. malonaticus потому что 16S рДНК последовательность не всегда достаточно точно, и Биотипирование слишком субъективно. Схема Cronobacter MLST использует 7 аллелей; atpD , fusA , glnS , gltB , gyrB , infB и ppsA, дающие сцепленную последовательность 3036 п.н. для филогенетического анализа (MLSA) и сравнительной геномики. MLST также использовался для официального признания новых видов Cronobacter . Этот метод выявил сильную связь между одной генетической линией, типом последовательности 4 (ST4), и случаями неонатального менингита. Сайт Cronobacter MLST находится по адресу http://www.pubMLST.org/cronobacter .

Ограничения

MLST лучше всего подходит для популяционно-генетических исследований, но это дорого. Из-за сохранения последовательности в генах домашнего хозяйства MLST иногда не хватает дискриминирующей способности для дифференциации штаммов бактерий, что ограничивает его использование в эпидемиологических исследованиях. Для повышения дискриминирующей способности MLST был разработан подход к типированию последовательностей по мультивирулентным локусам (MVLST) с использованием Listeria monocytogenes . MVLST расширяет преимущества MLST, но нацелен на гены вирулентности, которые могут быть более полиморфными, чем гены домашнего хозяйства. Популяционная генетика - не единственный фактор, влияющий на эпидемию. Факторы вирулентности также играют важную роль в возникновении болезней, и популяционные генетические исследования не позволяют их контролировать. Это связано с тем, что вовлеченные гены часто сильно рекомбинируют и мобильны между штаммами по сравнению с генетической структурой популяции. Таким образом, например, для Escherichia coli идентификация штаммов, несущих гены токсинов, более важна, чем оценка распространенных штаммов на основе популяционной генетики.

Появление технологий секвенирования второго поколения сделало возможным получение информации о последовательностях по всему бактериальному геному при относительно скромных затратах и ​​усилиях, и теперь MLST можно назначать на основе информации о последовательности всего генома, а не секвенировать каждый локус отдельно, как это было раньше. практика, когда впервые был разработан MLST. Секвенирование всего генома обеспечивает более обширную информацию для дифференциации бактериальных штаммов (MLST использует приблизительно 0,1% геномной последовательности для определения типа, игнорируя остальную часть бактериального генома). Например, полногеномное секвенирование многочисленных изолятов показало, что одна ветвь MLST ST258 Klebsiella pneumoniae состоит из двух различных генетических клад, что дает дополнительную информацию об эволюции и распространении этих организмов с множественной лекарственной устойчивостью и опровергает предыдущую гипотезу о единственном клональное происхождение ST258.

Базы данных

Базы данных MLST содержат эталонные аллельные последовательности и типы последовательностей для каждого организма, а также выделяют эпидемиологические данные. Веб-сайты содержат программное обеспечение для опроса и анализа, которое позволяет пользователям запрашивать свои аллельные последовательности и типы последовательностей. MLST широко используется в качестве инструмента для исследователей и работников здравоохранения.

Большинство баз данных MLST размещено на 2 веб-серверах, которые в настоящее время расположены в Имперском колледже в Лондоне ( mlst.net ) и в Оксфордском университете ( pubmlst.org ).

Базы данных, размещенные на каждом сайте, различны и содержат специфичные для организма референсные последовательности аллелей и списки ST для отдельных организмов.

Чтобы облегчить сбор и форматирование используемых последовательностей, был разработан простой и бесплатный плагин для Firefox ( ссылка ).

использованная литература

внешние ссылки

журнальные статьи