Наука

В референсном геноме человека отсутствует 30 миллионов кусочков ДНК

ДНК

В течение последних 17 лет большинство ученых во всем мире использовали в качестве эталона геном одного человека, в котором, как теперь оказалось, отсутствует около 300 миллионов кусочков ДНК, обнаруженных у 910 человек африканского происхождения, — пишет sciencedaily.com со ссылкой на Nature Genetics.

Этот референсный геном представляет собой общий репрезентативный пример генетического кода человека. Известный как эталонный геном GRCh38, он периодически обновляется последовательностями ДНК других людей, но в новом анализе ученые из Университета Джонса Хопкинса показали, что коллективные геномы 910 человек африканского происхождения имеют большой кусок — около 300 миллионов кусочков генетического материала, отсутствующий в базовом эталонном геноме.

«Существует гораздо больше последовательностей человеческой ДНК, чем мы изначально думали», — говорит Стивен Зальцберг, доктор философии, профессор Bloomberg по биомедицинской инженерии, профессор информатике и биостатистике в Университете Джона Хопкинса.

Знание различий в геномах среди популяций имеет важное значение для исследования и позволяет выявить, почему некоторые люди или группы людей могут быть более или менее восприимчивыми к таким распространенным состояниям, как сердечные заболевания, рак и диабет. По словам Зальцберга, ученым необходимо создать больше референсных геномов, которые будут отражать особенности разных популяций людей.

«Весь мир полагается на то, что по существу является единственным эталонным геномом, и когда конкретный анализ ДНК не соответствует референсному образцу и вы выбрасываете эти несогласованные последовательности, вы можете вместе с ними потерять ответы и подсказки, которые ищете» — говорит Зальцберг.

Рэйчел Шерман, первый автор исследования и аспирант в области компьютерных наук в Университете Джона Хопкинса, говорит: «Если вы ученый, который ищет вариации генома, связанные с состоянием, которое распространено в определенной популяции, вам нужно сравнить отдельные геномы с эталонным геномом, более представительным для конкретно этой группы населения».

В частности, мировой референсный геном был собран из последовательностей нуклеиновых кислот небольшого числа анонимных добровольцев. Другие исследователи позже определили, что 70% эталонного генома происходит от одного человека, который был наполовину европейцем и наполовину африканцем, а остальные последовательности ДНК взяты от нескольких лиц европейского и китайского происхождения.

«Эти результаты подчеркивают важность исследований популяций из разных слоев общества и их предков для создания всеобъемлющей и инклюзивной картины генома человека, — сказал Джеймс П. Кили, доктор философии, директор отдела болезней легких в Национальном центре сердца, легких и крови, которые поддержали исследование. — Более полная картина генома человека может привести к лучшему пониманию различий в рисках заболеваний у разных групп населения».

Для нового анализа Зальцберг и Шерман собрали ДНК у 910 особей африканского происхождения, которые живут в 20 регионах по всему миру, включая США, Центральную Африку и Карибский бассейн.

Многие исследователи ищут небольшие различия между эталонным геномом и геномами лиц, которых они изучают, — иногда это только одно изменение пар химических оснований в ДНК. Эти небольшие изменения называются однонуклеотидными полиморфизмами или SNP.

Однако команда Зальцберга фокусируется на больших вариациях генома. «SNPs хорошо действуют, чтобы выяснить родословную индивидуума, но они не работают, чтобы определить генетические вариации, которые могут способствовать общим условиям и заболеваниям, — говорит Зальцберг. -Некоторые условия могут быть вызваны изменениями в больших участках генома».

За двухлетний период Зальцберг и Шерман проанализировали ДНК-последовательности 910 человек, ища секторы ДНК длиной не менее 1000 пар оснований, которые не соответствовали эталонному геному. «Внутри этих последовательностей ДНК сокрыто то, что делает одного человека уникальным», — говорит Шерман.

Они собрали эти последовательности и искали параллели и дублирования, отфильтровывая последовательности короче 1000 пар оснований, а также ДНК, вероятно, связанные с бактериями, которые встречаются у всех людей.

Затем они сравнили собранные последовательности всех 910 индивидуумов с стандартным эталонным геномом, чтобы найти то, что Зальцберг называет, «фрагменты ДНК, которые у вас есть, а у меня нет».

В целом, они нашли 300 миллионов базовых пар оснований ДНК, что составляет около 10 процентов от предполагаемого размера всего генома человека, которые не учитывал референсный геном. В самой большой части уникальной ДНК, которую они обнаружили, содержалось 152 000 пар нуклеотидов, но большинство блоков имели 1000-5000 пар нуклеотидов.

Небольшая часть этих последовательностей ДНК может пересекаться с генами, которые кодируют белки или другие клеточные функции, но, по словам Зальцберга, они не отображали функцию каждой последовательности.

Они также не смогли найти последовательности, которые коррелировали бы с астмой. Но Зальцберг объясняет: «Пока вы не осмотрите пейзаж, вы не сможете понять, что полезно».

Источник: sciencedaily.com