Логотип проекта
Проект Человеческий Геном
(англ. The Human Genome Project,
HGP
) — международный научно-исследовательский проект, главной целью которого было определить последовательность нуклеотидов, которые составляют ДНК, и идентифицировать 20—25 тыс. генов в человеческом геноме[1]. Этот проект называют крупнейшим международным сотрудничеством, когда-либо проводившимся в биологии[2]; он стал основой для международного проекта Genome Project-write[3].
Проект начался в 1990 году, под руководством Джеймса Уотсона под эгидой Национальной организации здравоохранения США. В 2000 году был выпущен рабочий черновик структуры генома, полный геном — в 2003 году, однако и сегодня дополнительный анализ некоторых участков ещё не закончен. Частной компанией Celera Corporation был запущен аналогичный параллельный проект, завершённый несколько ранее международного. Основной объём секвенирования был выполнен в университетах и исследовательских центрах США, Канады и Великобритании. Кроме очевидной фундаментальной значимости, определение структуры человеческих генов является важным шагом для разработки новых медикаментов и развития других аспектов здравоохранения.
Хотя целью проекта по расшифровке генома человека является понимание строения генома человеческого вида, проект также фокусировался и на нескольких других организмах, среди которых бактерии, в частности, Escherichia coli
, насекомые, такие как мушка дрозофила, и млекопитающие, например, мышь.
Изначально планировалось определение последовательности более трёх миллиардов нуклеотидов, содержащихся в гаплоидном человеческом геноме. Затем несколько групп объявили о попытке расширить задачу до секвенирования диплоидного генома человека, среди них международный проект HapMap (англ.), «Applied Biosystems», «Perlegen», «Illumina», «JCVI», «Personal Genome Project» и «Roche-454».
Геном любого отдельно взятого организма (исключая однояйцевых близнецов и клонированных животных) уникален, поэтому определение последовательности человеческого генома в принципе должно включать в себя и секвенирование многочисленных вариаций каждого гена. Однако, в задачи проекта «Геном человека» не входило определение последовательности всей ДНК, находящейся в человеческих клетках; а некоторые гетерохроматиновые области (в общей сложности около 8 %) остаются несеквенированными до сих пор.
Проект
Предпосылки
Проект стал кульминацией нескольких лет работы поддержанной министерством энергетики США, в частности семинаров проводившихся в 1984[4] и 1986 годах, и последовавшими действиями[5] министерства энергетики[6]. Отчёт 1987 года указывает: «Окончательной целью данного начинания является понимание человеческого генома» и «знание человеческого генома так же необходимо для прогресса медицины и других наук о здоровье, как знание анатомии было необходимо для достижения её нынешнего состояния». Поиски технологий, подходящих для решения предложенной задачи, начинались ещё во второй половине 1980-х годов[7].
Начиная с 1988 года, главой Национального центра исследований человеческого генома в Национальной организации здравоохранения США (NIH) был Джеймс Уотсон. В 1992 году его вынудили уйти в отставку, в основном из-за несогласия с позицией его руководителя, Бернадины Хили (англ.) по вопросам патентования генов (англ.). В апреле 1993 его заменил Френсис Коллинз, а в 1997 году название центра было изменено на Национальный институт исследований человеческого генома (англ.) (NHGRI).
Трёхмиллиардный проект был формально запущен в 1990 году министерством энергетики США и Национальным институтом здравоохранения, и ожидалось, что он продлится 15 лет. Помимо США, в международный консорциум вошли генетики Китая, Франции, Германии, Японии и Великобритании.
В силу широкой международной кооперации и новых достижений в области геномики (особенно в секвенировании), а также значительных достижений в вычислительной технике, «черновик» генома был закончен в 2000 году (о чём было объявлено совместно президентом США Биллом Клинтоном и британским премьер-министром Тони Блэром 26 июня 2000 года[8]). Продолжение секвенирования привело к объявлению в апреле 2003 года о почти полном завершении работы, на два года раньше, чем планировалось[9]. В мае 2006 года была пройдена другая веха на пути к завершению проекта, когда в журнале «Nature» была опубликована последовательность последней хромосомы — хромосомы 1[10].
Завершённость
Репликация ДНК
Существуют многочисленные определения «полной последовательности человеческого генома». Согласно некоторым из них, геном уже полностью секвенирован, а согласно другим, этого ещё предстоит добиться. В популярной прессе было множество статей, сообщающих о «завершении» генома. На данный момент завершается этап секвенирования генома, то есть определения порядка расположения нуклеотидов в нуклеиновых цепях человеческой ДНК. Собственно работы по интерпретации результатов секвенирования еще впереди. Это и будет расшифровка или прочтение генома. График истории расшифровки проекта показывает, что большая часть по секвенированию человеческого генома была закончена в конце 2003 года. Однако ещё остаётся несколько регионов, которые считаются незаконченными:
- Прежде всего, центральные регионы каждой хромосомы, известные как центромеры, которые содержат большое количество повторяющихся последовательностей ДНК; их сложно секвенировать при помощи современных технологий. Центромеры имеют длину миллионы (возможно десятки миллионов) пар нуклеотидов, и, по большому счёту, остаются несеквенированными.
- Во-вторых, концы хромосом, называемые теломерами, также состоящие из повторяющихся последовательностей, и по этой причине в большинстве из 46 хромосом их расшифровка не завершена. Точно не известно, какая часть последовательности остаётся не расшифрованной до теломер, но как и с центромерами, существующие технологические ограничения препятствуют их секвенированию.
- В-третьих, в геноме каждого индивидуума есть несколько локусов, которые содержат членов мультигенных семейств, которые также сложно расшифровать с помощью основного на сегодняшний день метода фрагментирования ДНК. В частности, эти семейства кодируют белки, важные для иммунной системы.
- Кроме перечисленных регионов, остаётся ещё несколько брешей, разбросанных по всему геному, некоторые из которых довольно крупные, но есть надежда, что все они будут закрыты в ближайшие годы.
Бо́льшая часть остающейся ДНК сильно повторяющаяся, и маловероятно, что она содержит гены, однако это останется неизвестным, пока они не будут полностью секвенированы. Понимание функций всех генов и их регуляции остается далеко неполным. Роль мусорной ДНК, эволюция генома, различия между индивидуумами и многие другие вопросы по-прежнему являются предметом интенсивных исследований в лабораториях всего мира.
Цели
Последовательность человеческой ДНК сохраняется в базах данных, доступных любому пользователю через Интернет. Национальный центр биотехнологической информации США (и его партнёрские организации в Европе и Японии) хранят геномные последовательности в базе данных известной как GenBank, вместе с последовательностями известных и гипотетических генов и белков. Другие организации, к примеру Калифорнийский Университет в Санта-Круз (англ.)[11] и Ensembl[12] поддерживают дополнительные данные и аннотации, а также мощные инструменты для визуализации и поиска в этих базах. Были разработаны компьютерные программы для анализа данных, потому что сами данные без таких программ интерпретировать практически невозможно.
Процесс идентификации границ генов и других мотивов в необработанных последовательностях ДНК называется аннотацией генома (англ.) и относится к области биоинформатики. Эту работу при помощи компьютеров выполняют люди, но они делают её медленно и, чтобы удовлетворять требованиями высокой пропускной способности проектов секвенирования геномов, здесь также всё шире используют специальные компьютерные программы. Лучшие на сегодняшний день технологии аннотации используют статистические модели основанные на параллелях между последовательностями ДНК и человеческим языком, пользуясь такими концепциями информатики как формальные грамматики.
Другая, часто упускаемая из виду цель проекта «Геном человека» — исследование этических, правовых и социальных последствий расшифровки генома. Важно исследовать эти вопросы и найти наиболее подходящие решения до того, как они станут почвой для разногласий и политических проблем.
Все люди имеют в той или иной степени уникальные геномные последовательности. Поэтому данные, опубликованные проектом «Геном человека», не содержат точной последовательности геномов каждого отдельного человека. Это комбинированный геном небольшого количества анонимных доноров. Полученная геномная последовательность является основой для будущей работы по идентификации разницы между индивидуумами. Основные усилия здесь сосредоточены на выявлении однонуклеотидного полиморфизма.
Почти все цели, которые ставил перед собой проект, были достигнуты быстрее, чем предполагалось. Проект по расшифровке генома человека был закончен на два года раньше, чем планировалось. Проект поставил разумную, достижимую цель секвенирования 95 % ДНК. Исследователи не только достигли её, но и превзошли собственные предсказания, и смогли секвенировать 99,99 % человеческой ДНК. Проект не только превзошёл все цели и выработанные ранее стандарты, но и продолжает улучшать уже достигнутые результаты.
Как были достигнуты результаты
Первое бумажное издание человеческого генома, выставляется в лондонском музее Wellcome Collection
Проект финансировался правительством США через Национальный Институт Здравоохранения и британским благотворительным обществом Wellcome Trust, которое финансировало Институт Сенгера, а также множество других групп по всему свету. Финансирование распределялось между несколькими крупными центрами секвенирования включая Whitehead Institute (англ.), Институт Сенгера, Университет Вашингтона в Сент-Луисе и Baylor College of Medicine (англ.).
Геном был разбит на небольшие участки, примерно по 150 000 пар нуклеотидов в длину. Эти куски затем встраивали в вектор, известный как Искусственная бактериальная хромосома или BAC. Эти векторы созданы из бактериальных хромосом, измененных методами генной инженерии. Векторы, содержащие гены, затем можно вставлять в бактерии, где они копируются бактериальными механизмами репликации. Каждый из кусочков генома потом секвенировали раздельно методом дробовика, и затем все полученные последовательности собирали воедино уже в виде компьютерного текста. Размеры полученных больших кусков ДНК, собираемых для воссоздания структуры целой хромосомы, составляли около 150 000 пар нуклеотидов. Такая система известна под именем «иерархического метода дробовика», потому что вначале геном разбивается на куски разного размера, положение которых в хромосоме должно быть заранее известно.
Содержание программы «Геном человека»
В 1990 году начался международный проект
«Геном человека», которым руководил Джеймс Уотсон. Его целью было выяснить, в какой последовательности выстраиваются нуклеотиды в ДНК, и выявить около 25 000 генов в человеке. Благодаря этому проекту человек должен был получить полное представление о формировании ДНК и расположению всех его составляющих частей, а также механизм построения гена.
Стоит уточнить, что программа не ставила своей задачей определить всю последовательность нуклеиновой кислоты в клетках, а лишь только некоторых областей. Началась она в 1990 году, но только в 2000 был выпущен черновик работы, а полное исследование завершено — в 2003 году. Исследование последовательности длиться до сих пор и 8% гетерохроматиновых областей все еще не определены.
Цели и задачи
Как любой научный проект, «Геном человека» ставил перед собой конкретные цели и задачи. Изначально ученые собирались выявить последовательности 3 млрд нуклеотидов и более. Затем отдельные группы исследователей выразили желание попутно определить также последовательность биополимеров, которая бывает аминокислотной или нуклеотидной. В итоге главные цели проекта
выглядели следующим образом:
- Создать карту генома;
- Создать карту человеческих хромосом;
- Выявить последовательность формирования полипептидов;
- Сформировать методологию хранения и анализа собранной информации;
- Создать технологию, которая поможет в достижении всех указанных выше целей.
Данный список задач упускает не менее важную, но не такую очевидную – это изучение этических, правовых и социальных последствий подобных исследований. Вопрос наследственности может вызывать разногласия среди людей и повлечь серьезные конфликты, поэтому ученые поставили за цель обнаружить решения этих конфликтов до их возникновения.
Достижения
Наследственные последовательности – это уникальное явление
, которое наблюдается в организме каждого человека в той или иной форме.
Именно поэтому все данные, которые опубликовали исследователи проекта, не имеют точной и определенной последовательности. Несмотря на это, главным достижением является выполнение всех поставленных целей.
Проект достиг всех поставленных задач раньше, чем исследователи предполагали. К концу проекта они расшифровали около 99,99 % ДНК, хотя ученые ставили перед собой задачу секвенировать только 95% данных.
Сегодня, несмотря на успех проекта, остаются все еще
неисследованные участки
дезоксирибонуклеиновых кислот.
В итоге исследовательской работы было определено сколько генов в организме человека (около 20—25 тыс. генов в геноме), и все они охарактеризованы:
- количество;
- расположение;
- структурно-функциональные особенности.
Геном человека — исследования, расшифровка
Расшифровка человеческого генома
Сопоставление данных общего и частного проектов
Крейг Вентер
В 1998 году американский исследователь Крейг Вентер и его фирма Celera Corporation запустили аналогичное исследование, финансированное частным капиталом. В начале 1990-х, когда проект «Геном человека» только начинал работу, Вентер тоже работал в Национальном институте здоровья США. Целью его собственного $300-миллионного проекта Celera Corporation было более быстрое и дешёвое секвенирование человеческого генома, чем в $3-миллиардном государственном проекте.
Celera Corporation использовала более рискованную разновидность метода фрагментации генома (метода дробовика), которую использовали ранее для секвенирования бактериальных геномов размером до шести миллионов пар нуклеотидов в длину, но никогда для чего-либо столь большого, как человеческий геном, состоящий из трёх миллиардов пар нуклеотидов.
Вначале Celera Corporation анонсировала, что она будет добиваться патентной защиты «всего лишь 200 или 300» генов, но позднее внесла поправки, что ищет «защиту интеллектуальной собственности» на «полное описание важнейших структур», составляющих примерно 100—300 целей. Наконец фирма подала[13] предварительные патентные заявки на 6500 целых или частичных генов. Celera Corporation также обещала опубликовать результаты своей работы согласно условиям «Бермудского заявления (англ.)» 1996 года, выпуская новые данные ежеквартально (проект «Геном человека» выпускал новые данные ежедневно), однако, в отличие от проекта с государственным финансированием, фирма не даёт разрешения на свободное распространение или коммерческое использование своих данных.
В марте 2000 года президент США Билл Клинтон заявил, что последовательность генома не может быть запатентована и должна быть свободно доступна для всех исследователей. После заявления президента акции компании Celera Corporation сильно упали, что потянуло вниз весь биотехнологический сектор Nasdaq, потерявший около 50 миллиардов долларов рыночной капитализации за два дня.
Хотя рабочий вариант генома был анонсирован в июне 2000 года, Celera Corporation и учёные, работавшие в проекте «Геном человека», опубликовали детали своей работы только в феврале 2001 года. Специальные выпуски журнала «Nature» (который публиковал научные статьи государственного проекта[14]) и журнала «Science» (который опубликовал статью «Celera»[15]) описали методы, использовавшиеся для производства черновика последовательности, и предложили её анализ. Эти черновики покрывали примерно 83 % генома (90 % эухроматиновых регионов с 150 000 брешей, а также содержали порядок и ориентацию многих всё ещё не законченных сегментов). В феврале 2001 года, во время подготовки совместных публикаций, были выпущены пресс-релизы, говорящие о том, что проект был завершён обеими группами. В 2003 и 2005 гг. были анонсированы улучшенные черновики, содержавшие приблизительно 92 % последовательности.
Соревнование очень хорошо сказалось на проекте, заставив участников государственного проекта модифицировать свою стратегию, чтобы ускорить ход работы. Вначале конкуренты согласились объединить результаты, но союз распался после того, как Celera Corporation отказалась сделать свои результаты доступными через публичную базу данных GenBank с неограниченным доступом для всех пользователей. Celera Corporation включила данные проекта «Геном человека» в собственную последовательность, однако запретила попытки использовать свои данные для всех сторонних пользователей.
«Геном человека» — это наиболее известный из многих международных геномных проектов, нацеленных на секвенирование ДНК конкретного организма. В настоящее время знание последовательности человеческой ДНК приносит наиболее ощутимую пользу. Кроме того, важные достижения в биологии и медицине ожидаются в результате секвенирования модельных организмов, в число которых входят мыши, дрозофилы, Danio rerio
, дрожжи, нематоды, некоторые растения и множество микробов и паразитов.
В 2004 году исследователи из Международного Консорциума по Секвенированию Человеческого Генома (англ. International Human Genome Sequencing Consortium) (IHGSC) проекта «Геном человека» огласили новую оценку числа генов в человеческом геноме составившую от 20 до 25 тыс.[16] Ранее предсказывалось от 3 до 40 тыс., а в начале проекта оценки доходили до 2 млн. Это число продолжает колебаться, и в настоящее время ожидается, что ещё в течение многих лет не удастся прийти к согласию по поводу точного количества генов в человеческом геноме.
История частного проекта
Детали по данной теме смотри в статье История генетики
.
В 1976 году Уолтером Фирсом[en]и его командой в Университете Гента (Гент, Бельгия) был определён первый полный геном вируса — бактериофага MS2[en][17]. Идея техники фрагментирования ДНК (англ. shotgun) пришла от использования алгоритма, который комбинировал информацию о последовательности от многих небольших фрагментов ДНК для реконструирования генома. Эту технику ввёл Сенгер, чтобы секвенировать геном фага Фи-X174 (англ.), вируса, который инфицирует бактерии (бактериофаг); это был первый ещё в 1977 году полностью секвенированный геном (последовательность ДНК)[18]. Техника была названа «shotgun sequencing» (метод дробовика), потому что геном дробится на множество кусочков, как будто в него выстрелили из дробовика. Чтобы масштабировать метод, и секвенирование, и сборку генома нужно было автоматизировать, что и произошло в 1980-х.
В 1995 году было показано, что данная техника применима к секвенированию первого бактериального генома (1,8 миллиона пар нуклеотидов) свободно живущего организма Haemophilus influenzae
[19] и первого генома животного (~100 млн пар оснований)[20]. Метод включает использование автоматизированных секвенаторов, что позволяет определять более длинные индивидуальные последовательности (в то время однократно получалось приблизительно 500 пар нуклеотидов). Пересекающиеся последовательности размером примерно в 2000 пар нуклеотидов «читали» в двух направлениях, это были критические элементы, создание которых повлекло за собой разработку первых компьютерных программ сборки генома, необходимых для реконструирования больших регионов ДНК, известных под названием контиги (‘contigs’).
Три года спустя, в 1998 году, заявление только что созданной компании Celera Corporation о том, что она собирается масштабировать метод фрагментирования ДНК на человеческий геном, в некоторых кругах было встречено скептически. Техника фрагментирования разрывает ДНК на фрагменты различных размеров, от 2 до 300 тыс. пар нуклеотидов в длину, образуя то, что называется «библиотекой ДНК». Затем ДНК «читают» с помощью автоматического секвенатора кусками по 800 пар нуклеотидов длиной с обоих концов каждого фрагмента. С помощью сложного алгоритма сборки и суперкомпьютера, кусочки собирают воедино, после чего геном может быть реконструирован из миллионов коротких фрагментов длиной в 800 пар нуклеотидов. Успех как государственного, так и частного проектов зависел от новой, более высоко автоматизированной капиллярной секвенирующей ДНК машины, которая называлась Applied Biosystems 3700
. Она прогоняла цепочки ДНК через необычайно тонкую капиллярную трубку, а не через плоский гель, как это делали в ранних моделях секвенаторов. Ещё более критическим фактором была разработка новой, более масштабной программы сборки генома, ассемблера, который мог бы обрабатывать 30-50 миллионов последовательностей, требующихся для секвенирования всего человеческого генома. В то время такой программы не существовало. Одним из первых крупных проектов в Celera Corporation стала разработка данного ассемблера, который был написан параллельно с созданием большой, высокоавтоматизированной фабрики секвенирования геномов. Разработка ассемблера велась под руководством Брайена Рамоса (англ. Brian Ramos). Первая версия появилась в 2000 году, когда команда Celera Corporation объединила силы с профессором Джеральдом Рубином (англ.) для секвенирования генома фруктовой мушки
Drosophila melanogaster
методом фрагментирования генома[21]. Собрав 130 миллионов пар нуклеотидов, программа обработала по меньшей мере в 10 раз больше данных, чем любой ранее собранный из результатов метода фрагментирования геном. Год спустя команда Celera Corporation опубликовала свою сборку трёх миллиардов пар нуклеотидов человеческого генома.
Как были достигнуты результаты
IHGSC для ориентации и проверки правильности сборки последовательности каждой человеческой хромосомы использовал секвенирование концевых фрагментов в сочетании с картированием больших (около 100 тыс. пар оснований) плазмидных клонов, полученных методом фрагментирования генома, а также применял метод фрагментирования меньших субклонов тех же плазмид, а также множество других данных[14].
Группа Celera Corporation понимала важность метода фрагментирования генома и тоже использовала саму последовательность, чтобы ориентировать и найти правильное местоположение секвенированных фрагментов внутри хромосомы. Однако компания использовала и публично доступные данные из проекта «Геном человека», чтобы контролировать процесс сборки и ориентации, что поставило под вопрос независимость её данных[15][22][23].
Проект «ГЕНОМ ЧЕЛОВЕКА»?
Цель проекта — выяснить последовательности азотистых оснований и положения генов (картирование) в каждой молекуле ДНК каждой клетки человека, что открыло бы причины наследственных заболеваний и пути к их лечению. В проекте заняты тысячи специалистов со всего мира: биологов, химиков, математиков, физиков и техников. Это один из самых дорогих научных проектов в истории. В 1990 г. на него потрачено 60 млн долл., в 1991 г. — 135 млн, в 1992–1995 гг. — от 165 до 187 млн в год , а в 1996–1998 гг. только США израсходовали 200, 225 и 253 млн
Интерес к уже полученным результатам огромен: самые цитируемые в 1998 г. авторы (не только в генетике или биологии, но во всех областях науки) Марк Адамс и Крэйг Вентер из Института исследований генома в штате Мэриленд (США) — частной компании, занимающейся только составлением «генных карт».
ВЕХИ ПРОЕКТА
Проект состоит из пяти основных этапов:
- составление карты, на которой помечены гены, отстоящие друг от друга не более, чем на 2 млн оснований, на языке специалистов, с разрешением 2 Мб (Мегабаза — от английского слова «base» — основание);
- завершение физических карт каждой хромосомы с разрешением 0,1 Мб;
- получение карты всего генома в виде набора описанных по отдельности клонов (0,005 Мб);
- к 2004 г. полное секвенирование ДНК (разрешение 1 основание);
- нанесение на карту с разрешением в 1 основание всех генов человека (к 2005 г.). Когда эти этапы будут завершены, исследователи определят все функции генов, а также биологические и медицинские применения результатов.
ТРИ КАРТЫ
В ходе проекта создают три типа карт хромосом: генетические, физические и секвенсовые (от англ. sequence — последовательность). Выявить все гены, присутствующие в геноме, и установить расстояния между ними — значит локализовать каждый ген в хромосомах. Такие генетические карты помимо инвентаризации генов и указания их положений ответят на исключительно важный вопрос о том, как гены определяют те или иные признаки организма. Ведь многие признаки зависят от нескольких генов, часто расположенных в разных хромосомах, и знание положения каждого из них позволит понять, как происходит дифференцировка (специализация) клеток, органов и тканей, а также как успешнее лечить генетические заболевания. В 20-е и 30-е годы, когда создавалась хромосомная теория наследственности, выяснение положения каждого гена привело к тому, что на генетических картах сначала дрозофилы, а затем кукурузы и ряда других видов удалось отметить особые точки, как тогда говорили, «генетические маркеры» хромосом. Анализ их положения в хромосомах помог снабдить генетические карты хромосом человека новыми сведениями. Первые данные о положении отдельных генов появились еще в 60-е годы. С тех пор они множились лавинообразно, и в настоящее время известно положение уже десятков тысяч генов. Три года назад разрешение генетической карты составляло 10 Мб (для некоторых участков — даже 5 Мб).
Другое направление исследований — составление физических карт хромосом. Еще в 60-е годы цитогенетики стали окрашивать хромосомы, чтобы выявить на них особые поперечные полосы. После окрашивания полосы было видно в микроскоп. Между полосами и генами удалось установить соответствие, что позволило изучать хромосомы по-новому. Позже научились «метить» молекулы ДНК (радиоактивными или флуоресцентными метками) и следить за присоединением этих меток к хромосомам, что значительно повысило разрешение их структуры: до 2 Мб, а потом и до 0,1 Мб (при делении клеток). В 70-е годы научились «разрезать» ДНК на участки специальными (рестрикционными) ферментами, распознающими короткие отрезки ДНК, в которых информация записана в виде палиндромов — сочетаний, читаемых одинаково от начала к концу и от конца к началу. Так возникли рестрикционные карты хромосом. Использование современных физических и химических методов и средств улучшило разрешение физических карт в сотни раз.
Наконец, разработка методов секвенирования (изучения точных последовательностей нуклеотидов в ДНК) открыла путь к созданию секвенсовых карт с рекордным на сегодня разрешением (на этих картах будет указано положение всех нуклеотидов в ДНК).
ДВА ПОДХОДА
Число хромосом и их длина различны у разных биологических видов. В клетках бактерий всего одна хромосома. Так, размер генома бактерии Mycoplasma genita-lium 0,58 Мб (в нем 470 генов), у бактерии кишечной палочки (Escherichia coli) в геноме 4200 генов (4,2 Мб), у растения Arabi-dopsis thaliana — 25 тыс. генов (100 Мб), у плодовой мушки Droso-phila melanogaster — 10 тыс. генов (120 Мб). В ДНК мыши и человека 50–60 тыс. генов (3000 Мб). Конечно, для составления карт столь разных объектов одни и те же методы неприменимы, поэтому используют два разных по методологии подхода. В первом делят ДНК на небольшие куски и, изучив их по отдельности, воссоздают всю структуру, Этот подход увенчался успехом при составлении сравнительно простых карт. Для более сложных геномов эффективнее второй подход. В этих случаях неразумно делить молекулу ДНК на короткие куски, удобные для детального изучения. Их оказалось бы так много, что путаница в последовательностях была бы неразрешимой. Поэтому, принимаясь за расшифровку, молекулу делят, наоборот, на как можно более длинные куски и сравнивают их в надежде найти общие концевые участки. Если это удается, куски объединяют, после чего процедуру повторяют. С совершенствованием компьютеров и математических методов обработки информации объединенные по такому принципу куски становятся все крупнее, постепенно приближаясь к целой молекуле. Этот подход, в частности, позволил составить генетическую карту 3-й хромосомы дрозофилы.
КЛАДЕЗЬ НОВЫХ ТЕХНОЛОГИЙ
Важный аспект проекта «Геном человека» — разработка новых методов исследований. Еще до старта проекта был развит ряд весьма эффективных методов цитогенетических исследований (теперь их называют методами первого поколения). Среди них: создание и применение упомянутых рестрикционных ферментов; получение гибридных молекул, их клонирование и перенос участков ДНК с помощью векторов в клетки-доноры (чаще всего — кишечной палочки или дрожжей); синтез ДНК на матрицах информационной РНК; секвенирование генов; копирование генов с помощью специальных устройств; способы анализа и классификации молекул ДНК по плотности, массе, структуре.
В последние 4–5 лет благодаря проекту «Геном человека» разработаны новые методы (методы второго поколения), в которых почти все процессы полностью автоматизированы. Почему это направление стало центральным? Самая маленькая хромосома клеток человека содержит ДНК длиной 50 Мб, самая большая (хромосома 1) — 250 Мб. До 1996 г. наибольший участок ДНК, выделяемый из хромосом с помощью реактивов, имел длину 0,35 Мб, а на лучшем оборудовании их структура расшифровывалась со скоростью 0,05–0,1 Мб в год при стоимости 1–2 долл. за основание. Иными словами, только на эту работу понадобилось бы примерно 30 тыс. дней (почти век) и 3 млрд долл.
Совершенствование технологии к 1998 г. повысило производительность до 0,1 Мб в день (36,5 Мб в год) и понизило стоимость до 0,5 долл. за основание. Использование новых электромеханических устройств, которые к тому же потребляют меньше реактивов, позволит уже в 1999 г. ускорить работы еще в 5 раз (к 2003 г. планируется довести скорость расшифровки до 500 Мб в год) и уменьшить стоимость до 0,25 долл. за основание (для человеческой ДНК еще дешевле).
ГЕНЫ В БАНКЕ
За последние шесть лет созданы международные банки данных о последовательностях нуклеотидов в ДНК разных организмов (GenBank / EMBL / pBJ) и о последовательностях аминокислот в белках (PIR / SwissPot). Любой специалист может воспользоваться собранной там информацией в исследовательских целях. Решение о свободном доступе к информации далось нелегко. Ученые, юристы, законодатели немало потрудились, чтобы воспрепятствовать намерениям коммерческих фирм патентовать все результаты проекта и превратить эту область науки в бизнес.
РЕЗУЛЬТАТЫ
Расшифрованные геномы. 1995 г. — бактерия Hemophilus influenza;. 1996 г. — клетка дрожжей (6 тыс. генов, 12,5 Мб); 1998 г. — круглый червь Caenorhabditis elegans (19 тыс. генов, 97 Мб). Основные результаты завершенных этапов проекта изложены в журнале «Science» (1998. Vol. 282, № 5396,. Р. 2012–2042).
Изученные гены человека. За 1995 г. длина участков ДНК человека с установленной последовательностью оснований увеличилась почти в 10 раз. Но хотя прогресс был налицо, результат за год составил менее 0,001% от того, что предстояло сделать. Но уже к июлю 1998 г. было расшифровано почти 9% генома, а затем каждый месяц появлялись новые значительные результаты. Изучив большое число копий генов в виде сДНК и сопоставив их последовательности с участками хромосомной ДНК, к ноябрю 1998 г. расшифровали 30 261 ген (примерно половина генома).
Функции генов. Результаты завершенной части проекта позволяют судить о роли двух третей генов в образовании и функционировании органов и тканей человеческого организма. Оказалось, что больше всего генов нужно для формирования мозга и поддержания его активности, а меньше всего для создания эритроцитов — лишь 8.
Другие организмы. Когда составлялась программа исследований по проекту, решили сначала отработать методы на более простых моделях. Поэтому на первом этапе реализации проекта изучили 8 разных представителей мира микроорганизмов, а к концу 1998 г. — уже 18 организмов с размерами генома от 1 до 20 Мб. В их числе представители многих родов бактерий: архебактерии, спирохеты, хламидобактерии, кишечная палочка, возбудители пневмоний, сифилиса, гемофилии, метанобразующие бактерии, микоплазмы, риккетсии, цианобактерии. Как уже упоминалось, завершен генетический анализ одноклеточного эукариота — дрожжей Saccharomy-ces cerevisae и первого многоклеточного животного — червя C. elegans.
Повреждения генов и наследственные болезни. Из 10 тыс. известных заболеваний человека около 3 тыс. — наследственные болезни. Они необязательно наследуются (передаются потомкам). Просто вызваны они нарушениями наследственного аппарата, то есть генов (в том числе в соматических клетках, а не только в половых). Выявление молекулярных причин «поломки» генов — важнейший результат проекта. Число изученных болезнетворных генов быстро растет, и через 3–4 года мы познаем все 3 тыс. генов, ответственных за те или иные патологии. Это поможет разобраться в генетических программах развития и функционирования человеческого организма, в частности, понять причины рака и старения. Знание молекулярных основ заболеваний поможет их ранней диагностике, а значит, и более успешному лечению. Адресное снабжение лекарствами пораженных клеток, замена больных генов здоровыми, управление обменом веществ и многие другие мечты фантастов на наших глазах превращаются в реальные методы современной медицины.
Молекулярные механизмы эволюции. Зная строение геномов, ученые приблизятся к разгадке механизмов эволюции. В частности, такого ее этапа, как деление живых существ на прокариоты и эукариоты. До последнего времени к прокариотам относили архебактерии, по многим признакам отличающиеся от других представителей этой группы микроорганизмов, но также состоящие всего из одной клетки без обособленного ядра, но с молекулой ДНК в виде двойной спирали. Когда год назад геном архебактерий расшифровали, стало ясно, что это отдельная ветвь на эволюционном древе.
ЧТО ДАЛЬШЕ?
Главная стратегическая задача на будущее — изучить вариации ДНК (на уровне отдельных нуклеотидов) в разных органах и клетках отдельных индивидуумов и выявить эти различия. Обычно одиночные мутации в ДНК человека встречаются в среднем на тысячу неизмененных оснований. Анализ таких вариаций позволит не только создавать индивидуальные генные портреты и тем самым лечить любые болезни, но и определять различия между популяциями и регионы повышенного риска, делать заключения о необходимости первоочередной очистки территорий от тех или иных загрязнений и выявлять производства, опасные для геномов персонала.
(подробнее www.erudition.ru
)
Доноры генома
В межгосударственном проекте «Геном человека» (HGP), исследователи из IHGSC взяли у большого числа доноров образцы крови (женщин) и спермы (мужчин). Из числа собранных образцов источником ДНК стали лишь несколько. Таким образом, личности доноров были скрыты, чтобы ни доноры, ни учёные не могли знать, чья именно ДНК была секвенирована. Во всём проекте были использованы многочисленные клоны ДНК из различных библиотек (англ.). Большинство из этих библиотек были созданы доктором Питером де Хонгом (англ. Pieter J. de Jong). Неформально сообщалось, и в сообществе генетиков хорошо известно, что большая часть ДНК в государственном проекте получена от единственного анонимного донора — мужчины из Буффало (кодовое название RP11)[24].
Учёные HGP использовали белые кровяные клетки из крови двух мужчин и двух женщин доноров (случайно выбранных из 20 образцов каждого пола) — каждый донор стал источником отдельной библиотеки ДНК. Одна из этих библиотек (RP11) использовалась значительно больше, чем другие по соображениям качества. Небольшой технический нюанс заключается в том, что мужские образцы содержали только половину количества ДНК, поступившего из X и Y хромосом в сравнении с другими 22 хромосомами (аутосомами); это происходит потому, что каждая мужская клетка (сперматозоид) содержит только одну и одну Y-хромосому, а не две, как другие клетки.
Хотя главная секвенирующая фаза проекта «Геном человека» завершена, исследования изменчивости ДНК продолжаются в международном проекте HapMap, цель которого состоит в идентификации структуры групп однонуклеотидного полиморфизма (SNP) (которые называются гаплотипами). Образцы ДНК для HapMap получены от, в общей сложности, 270 человек: народа Йоруба в Ибадане (Нигерия), японцев из Токио, китайцев из Пекина и французского источника Centre d’Etude du Polymorphisms Humain (англ.) (CEPH
), который состоит из резидентов США, имеющих происхождение из западной и Северной Европы.
В проекте компании Celera Genomics для секвенирования использовалась ДНК, поступившая от пяти различных человек. Крейг Вентер, основатель компании и бывший в то время главным научным руководителем Celera Genomics, позднее сообщил (в публичном письме в журнал «Science»), что его ДНК была одним из 21 образцов в общем фонде, 5 из которых были отобраны для использования в проекте[25][26].
4 сентября 2007 года, команда под руководством Крейга Вентера опубликовала полную последовательность его собственной ДНК[27], впервые сняв покров тайны с шестимиллиарднонуклеотидной последовательности генома единственного человека.
Перспективы
Работа над интерпретацией данных генома находится всё ещё в своей начальной стадии. Ожидается, что детальное знание человеческого генома откроет новые пути к успехам в медицине и биотехнологии. Ясные практические результаты проекта появились ещё до завершения работы. Несколько , начали предлагать простые способы проведения генетических тестов, которые могут показать предрасположенность к различным заболеваниям, включая рак молочной железы, нарушения свёртываемости крови, кистозный фиброз, заболевания печени и многим другим. Также ожидается, что информация о геноме человека поможет поиску причин возникновения рака, болезни Альцгеймера и другим областям клинического значения и, вероятно, в будущем может привести к значительным успехам в их лечении.
Также ожидается множество полезных для биологов результатов. Например, исследователь, изучающий определённую форму рака может сузить свой поиск до одного гена. Посетив базу данных человеческого генома в сети, этот исследователь может проверить что другие учёные написали об этом гене включая (потенциально) трёхмерную структуру его производного белка, его функции, его эволюционную связь с другими человеческими генами или с генами в мышах или дрожжах или дрозофиле, возможные пагубные мутации, взаимосвязь с другими генами, тканями тела в которых ген активируется, заболеваниями, связанными с этим геном или другие данные.
Более того, глубокое понимание процесса заболевания на уровне молекулярной биологии может предложить новые терапевтические процедуры. Учитывая установленную огромную роль ДНК в молекулярной биологии и её центральную роль в определении фундаментальных принципов работы клеточных процессов, вероятно, что расширение знаний в данной области будет способствовать успехам медицины в различных областях клинического значения, которые без них были бы невозможны.
Анализ сходства в последовательностях ДНК различных организмов также открывает новые пути в исследовании теории эволюции. Во многих случаях вопросы эволюции теперь можно ставить в терминах молекулярной биологии. И в самом деле, многие важнейшие вехи в истории эволюции (появление рибосомы и органелл, развитие эмбриона, иммунной системы позвоночных) можно проследить на молекулярном уровне. Ожидается что этот проект прольёт свет на многие вопросы о сходстве и различиях между людьми и нашими ближайшими сородичами (приматами, а на деле и всеми млекопитающими).
Проект определения разнообразия человеческого генома (англ.) (HGDP), отдельное исследование, нацеленное на картирование участков ДНК, которые различаются между этническими группами.[28] В будущем HGDP, вероятно, сможет получить новые данные в области контроля заболеваний, развития человека и антропологии. HGDP может открыть секреты уязвимости этнических групп к отдельным заболеваниям и подсказать новые стратегии для их преодоления (см. Раса и здоровье (англ.)). Он может также показать, как человеческие популяции адаптировались к этим заболеваниям.
Особые перспективы исследования генома человека открывают методы секвенирования нового поколения. В связи с развитием новых методов значительно упростился и ускорился процесс секвенирования генома. Это позволяет проводить секвенирование большого количества геномов человека для определения однонуклеотидного полиморфизма (проект 1000 геномов). Кроме того, секвенирование нового поколения позволило начать проект по картированию элементов генома (регуляторных и других последовательностей) — ENCODE.
Удешевление методов секвенирования уже сейчас позволяет определять последовательность генома отдельного человека в терапевтических целях.
Проект «Геном человека»: десять лет спустя
Дина Мясникова, обозреватель журнала «Экология и жизнь»
«Экология и жизнь» №12, 2010
Проект «Геном человека» является наиболее амбициозной биологической исследовательской программой за всю историю науки. Знание генома человека внесет неоценимый вклад в развитие медицины и биологии человека. Исследования человеческого генома так же необходимо человечеству, как когда-то было необходимо знание человеческой анатомии. Осознание этого пришло в 1980-х, и это привело к тому, что появился проект «Геном человека». В 1988-м с аналогичной идеей выступил выдающийся российский молекулярный биолог и биохимик, академик А. А. Баев (1904–1994). С 1989 г. и в США, и в СССР функционируют соответствующие научные программы; позднее возникла Международная организация по изучению генома человека (HUGO). Вклад России в международное сотрудничество признан в мире: 70 отечественных исследователей являются членами HUGO.
Итак, прошло 10 лет с того времени, когда проект «Геном человека» был завершен. Есть повод вспомнить, как это было…
В 1990 г. при поддержке министерства энергетики США, а также Великобритании, Франции, Японии, Китая и Германии, был запущен этот трехмиллиардный проект. Возглавил его д-р Фрэнсис Коллинз, глава International Human Genome Sequencing Consortium
. Целями проекта являлись:
- идентификация 20 000–25 000 генов ДНК;
- определение последовательности 3 млрд. пар химических оснований, составляющих ДНК человека, и сохранение этой информации в базе данных;
- усовершенствование приборов для анализа данных;
- внедрение новейших технологий в область частного использования;
- исследование этических, правовых и социальных вопросов, возникающих при расшифровке генома.
В 1998 г. аналогичный проект был запущен д-ром Крейгом Вентером и его . Д-р Вентер поставил перед своей командой задачу более быстрого и дешевого секвенирования человеческого генома (в отличие от трехмиллиардного международного проекта, бюджет проекта д-ра Вентера ограничивался 300 млн долл.). Кроме того, не собиралась открывать доступ к своим результатам.
6 июня 2000 г. президент США и премьер-министр Великобритании объявили о расшифровке человеческого генетического кода, и таким образом соревнование закончилось. На самом деле, был опубликован рабочий черновик человеческого генома, и лишь к 2003 г. он был расшифрован практически полностью, хотя и сегодня все еще проводят дополнительный анализ некоторых участков генома.
Тогда умы ученых были взбудоражены необыкновенными возможностями: новые, действующие на генетическом уровне лекарства, а значит, не за горами создание «персональной медицины», настроенной точно под генетический характер каждого отдельно взятого человека. Существовали, конечно, и опасения, что может быть создано генетически зависимое общество, в котором людей буду делить на высшие и низшие классы по их ДНК и соответственно ограничивать их возможности. Но все же была надежда, что этот проект окажется столь же прибыльным, сколь и Интернет.
И вдруг все затихло… надежды не оправдались… казалось, что 3 млрд долл., вложенных в эту затею, выброшены на ветер.
Нет, не совсем так. Быть может, полученные результаты не столь грандиозны, как предполагалось во времена зарождения проекта, но они позволят достичь в будущем значительных успехов в различных областях биологии и медицины.
В результате исполнения проекта «Геном человека» был создан открытый банк генокода. Общедоступность полученной информации позволила многим исследователям ускорить свою работу. Ф. Коллинз привел в качестве иллюстрации такой пример: «Поиск гена фиброзно-кистозной дегенерации был успешно завершен в 1989 г., что стало результатом нескольких лет исследований моей лаборатории и еще нескольких других и стоило США около 50 млн долл. Сейчас это способен сделать смышленый выпускник университета за несколько дней, и все, что ему понадобится, — это Интернет, несколько недорогих реактивов, термоциклический аппарат для увеличения специфичности сегментов ДНК и доступ к ДНК-секвенатору, читающему ее по световым сигналам».
Еще один важный результат проекта — дополнение истории человека. Раньше все данные об эволюции были почерпнуты из археологических находок, а расшифровка генокода не только дала возможность подтвердить теории археологов, но в будущем позволит точнее узнать историю эволюции как человека, так и биоты в целом. Как предполагается, анализ сходства в последовательностях ДНК различных организмов сможет открыть новые пути в исследовании теории эволюции, и во многих случаях вопросы эволюции теперь можно будет ставить в терминах молекулярной биологии. Такие важнейшие вехи в истории эволюции, как появление рибосомы и органелл, развитие эмбриона, иммунной системы позвоночных, можно будет проследить на молекулярном уровне. Ожидается, что это позволит пролить свет на многие вопросы о сходстве и различиях между людьми и нашими ближайшими сородичами: приматами, неандертальцем (чей генокод недавно был реконструирован из 1,3 млрд фрагментов, подвергавшихся тысячелетнему разложению и загрязненных генетическими следами археологов, державших в руках останки этого существа), а также и всеми млекопитающими, и ответить на вопросы: какой же ген делает нас Homo sapiens
, какие гены отвечают за наши поразительные таланты? Таким образом, поняв, как прочитать информацию о нас в генокоде, мы сможем узнать, как гены влияют на физические и умственные характеристики и даже на наше поведение. Возможно, в будущем, посмотрев на генетический код, можно будет не только предсказать, как будет выглядеть человек, но и, к примеру, будет ли у него актерский талант. Хотя, естественно, никогда нельзя будет это определить со 100%-ной точностью.
Кроме того, межвидовое сравнение покажет, чем отличается один вид от другого, как они разошлись на эволюционном древе. Межпопуляционное сравнение покажет, как этот вид эволюционирует. Сравнение ДНК отдельных особей внутри популяции покажет, чем объясняется различие особей одного вида, одной популяции. Наконец, сравнение ДНК различных клеток внутри одного организма поможет понять, как происходит дифференцирование тканей, как они развиваются и что идет не так в случае заболеваний, таких например, как рак.
Вскоре после расшифровки большей части генокода в 2003 г., ученые обнаружили, что существует гораздо меньше генов, чем они ожидали, но впоследствии убедились в противоположном. Традиционно ген определяли как участок ДНК, который кодирует белок. Однако, расшифровывая генокод, ученые выяснили, что 98,5% участков ДНК не кодируют белки, и назвали эту часть ДНК «бесполезной». И выяснилось, что эти 98,5% участков ДНК имеют едва ли не большее значение: именно эта часть ДНК отвечает за ее функционирование. Например, определенные участки ДНК содержат инструкции для получения похожих на ДНК, но небелковых молекул, так называемых двухцепочечных РНК. Эти молекулы являются частью молекулярно-генетического механизма, контролирующего активность гена (РНК-интерференция). Некоторые двухцепочечные РНК могут подавлять гены, препятствуя синтезу их белковых продуктов. Таким образом, если данные участки ДНК также считать генами, то их количество удвоится. В итоге исследования изменилось само представление о генах, и сейчас ученые считают, что ген — это единица наследственности, которую нельзя понимать как просто участок ДНК, кодирующий белки.
Можно сказать, что химический состав клетки — ее «хард», а информация, закодированная в ДНК, — предварительно загруженный «софт». Никто раньше и не предполагал, что клетка является чем-то большим, чем просто совокупностью составных частей, и что для ее построения недостаточно закодированной в ДНК информации, что столь же важным является процесс саморегулирования генома — и путем сообщения между соседними генами, и путем воздействия других молекул клетки.
Открытый доступ к информации позволит объединить опыт врачей, информацию о патологических случаях, результаты многолетнего изучения отдельных особей, и потому станет возможным соотнести генетическую информацию с данными анатомии, физиологии, поведения человека. И уже это сможет привести к лучшей медицинской диагностике и прогрессу в лечении.
Например, исследователь, изучающий определенную форму рака, сможет сузить круг поиска до одного гена. Сверив свои данные с данными открытой базы генома человека, он сможет проверить, что другие написали об этом гене, включая (потенциально) трехмерную структуру его производного белка, его функции, его эволюционную связь с другими генами человека или с генами мышей, дрожжей или дрозофилы, возможные пагубные мутации, взаимосвязь с другими генами, тканями тела, в которых ген активируется, заболеваниями, связанными с этим геном, или другие данные.
Более того, понимание хода заболевания на уровне молекулярной биологии позволит создать новые терапевтические методы. Учитывая, что ДНК играет огромную роль в молекулярной биологии, а также ее центральное значение в функционировании и принципах работы живых клеток, углубление знаний в этой области откроет путь для новых методов лечения и открытий в различных областях медицины.
Наконец, и «персональная медицина» теперь кажется уже более реальной задачей. Д-р Уиллс выразил надежду, что лечение заболеваний путем замены поврежденного участка ДНК нормальным станет возможным уже в следующее десятилетие. Сейчас проблемой, препятствующей развитию такого метода лечения, является то, что ученые не умеют доставлять ген в клетку. Пока единственный известный способ доставки — заражение животного вирусом с необходимыми генами, но это опасный вариант. Однако д-р Уиллс предполагает, что в скором времени в этом направлении будет совершен прорыв.
Сегодня уже существуют простые способы проведения генетических тестов, которые могут показать предрасположенность к различным заболеваниям, включая рак молочной железы, нарушение свертываемости крови, кистозный фиброз, заболевания печени и др. Такие заболевания, как рак, болезнь Альцгеймера, диабет, как было выяснено, связаны не с общими для всех, а с огромным количеством редких, практически индивидуальных мутаций (причем не в одном гене, а в нескольких; например, мышечную дистрофию Шарко-Мари-Тут может вызвать мутация 39 генов), в результате чего эти болезни трудно поддаются диагностике и воздействию медицинских препаратов. Именно это открытие является одним из камней преткновения «персональной медицины», поскольку, прочитав генокод человека, пока невозможно точно определить состояние его здоровья. Исследуя генокоды разных людей, ученые были разочарованы результатом. Около 2000 участков ДНК человека статистически относилось к «болезненным», которые при этом не всегда относились к работающим генам, т. е. не представляли угрозы. Похоже, что эволюция избавляется от мутаций, вызывающих болезнь, до того, как они станут общими.
Проводя исследования, группа ученых в Сиэтле обнаружила, что из всего человеческого генокода лишь 60 генов претерпевают спонтанную мутацию каждое поколение. При этом мутировавшие гены могут вызвать различные заболевания. Так, если у каждого из родителей было по одному «испорченному» и одному «неиспорченному» гену, то у детей болезнь может и не проявиться или проявится в очень слабой форме, если они получат один «испорченный» и один «неиспорченный» ген, но если ребенок унаследует оба «испорченных» гена, то это может привести к болезни. К тому же, поняв, что общечеловеческие болезни вызываются индивидуальным мутациями, ученые пришли к выводу, что необходимо исследовать полностью весь генокод человека, а не его отдельные участки.
Несмотря на все затруднения, уже созданы первые генетические лекарства против рака, которые блокируют эффекты генетических отклонений, приводящих к росту опухолей. Также недавно было одобрено лекарство от остеопороза, которое основывается на том, что болезнь вызывается гиперактивностью определенного гена. Последнее достижение — проведение анализа биологических жидкостей на присутствие мутации определенного гена для диагностики рака толстой кишки. Такой тест позволит избавить людей от неприятной процедуры колоноскопии.
Итак, привычная биология ушла в прошлое, наступил час новой эры науки: постгеномной биологии. Она полностью развенчала идею витализма, и хотя в него уже больше столетия не верил ни один биолог, новая биология не оставила места и для призраков.
Не только интеллектуальные озарения играют важную роль в науке. Такие технические прорывы, как телескоп в астрономии, микроскоп в биологии, спектроскоп в химии, приводят к неожиданным и замечательным открытиям. Похожую революцию в геномике производят сейчас мощные компьютеры и информация, содержащаяся в ДНК.
Закон Мура говорит о том, что компьютеры увеличивают свою мощность вдвое примерно каждые два года. Таким образом, за последнее десятилетие их мощность возросла более чем в 30 раз при постоянно снижающейся цене. В геномике пока нет имени для аналогичного закона, но его следовало бы назвать законом Эрика Лэндера — по имени главы Broad Institute
(
Cambridge
,
Massachusetts
, крупнейший американский центр, занимающийся расшифровкой ДНК). Он подсчитал, что по сравнению с прошлым десятилетием цена расшифровки ДНК снизилась на сотни тысяч долларов. При расшифровке последовательности геномов в
International Human Genome Sequencing Consortium
использовали метод, разработанный еще в 1975 г. Ф. Сенджером, что заняло 13 лет и стоило 3 млрд долл. А значит, расшифровка генетического кода была под силу только мощным компаниям или центрам по исследованию генетической последовательности. Сейчас, используя последние устройства для расшифровки от (
San Diego
,
California
), человеческий геном может быть прочитан за 8 дней, и стоить это будет около 10 тыс. долл. Но и это не предел. Другая калифорнийская и
з Менло Парка, разработала способы, позволяющие прочитать геном всего с одной молекулы ДНК. Вполне возможно, что скоро расшифровка генома будет занимать минут 15 и стоить менее 1000 долл. Аналогичные разработки существуют и в «Oxford Nanopore Technologies»
(Великобритания). Раньше фирмы использовали решетки проб ДНК (ДНК-чипы) и искали определенные генетические символы — SNP. Сейчас известно несколько десятков таких символов, но есть основания предполагать, что среди трех миллиардов «букв» генетического кода их гораздо больше.
До недавнего времени полностью было расшифровано всего несколько генокодов (в проекте «Геном человека» были использованы кусочки генокода множества людей, а затем собраны в единое целое). Среди них генокоды К. Вентера, Дж. Уотсона, д-ра Ст. Куэйка, двух корейцев, китайца, африканца, а также больного лейкемией, национальность которого ныне уже трудно установить. Теперь, с постепенным усовершенствованием техники чтения последовательностей генов, станет возможным расшифровка генокода все большего и большего числа людей. В будущем свой генокод сможет прочитать любой человек.
Кроме стоимости расшифровки, важным показателем является его точность. Считается, что приемлемым уровнем является не более одной ошибки в 10 000–100 000 символов. Сейчас уровень точности находится на уровне 1 ошибки в 20 000 символов.
На настоящий момент в США ведутся споры по поводу патентования «расшифрованных» генов. Однако многие исследователи считают, что патентование генов станет препятствием для развития науки. Главная стратегическая задача будущего сформулирована следующим образом: изучить однонуклеотидные вариации ДНК в разных органах и клетках отдельных индивидуумов и выявить различия между индивидуумами. Анализ таких вариаций даст возможность не только подойти к созданию индивидуальных генных «портретов» людей, что, в частности, позволит лучше лечить болезни, но и определить различия между популяциями, выявлять географические районы повышенного «генетического» риска, что поможет давать четкие рекомендации о необходимости очистки территорий от загрязнения и выявлять производства, на которых есть большая опасность поражения геномов персонала.
SNP — одиночный генетический символ, который меняется от человека к человеку. Его открыли специалисты «International HapMap Project
», изучая такую мутацию генокода, как однонуклеотидный полиморфизм. Целью проекта по картированию участков ДНК, различных для разных этнических групп, был поиск уязвимости этих групп к отдельным заболеваниям и возможностей их преодоления. Эти исследования могут также подсказать, как человеческие популяции адаптировались к различным заболеваниям.
Примечания
- Роберт Крулвич (англ. Robert Krulwich). Раскалывая код жизни (англ. Cracking the Code of Life)
[Телешоу]. PBS. ISBN 1-5375-16-9. - the largest international collaboration ever undertaken in biology
https://www.theguardian.com/environment/2015/mar/16/what-is-the-wellcome-trust - The Center of Excellence for Engineering Biology | GP-write (англ.). The Center of Excellence for Engineering Biology. Проверено 24 июня 2020.
- Cook-Deegan R (1989). «The Alta Summit, December 1984». Genomics5
: 661-663. DOI:10.1016/0888-7543(89)90042-6. - Report on the Human Genome Initiative for the Office of Health and Environmental Research
- Barnhart, Benjamin J. (1989). «DOE Human Genome Program». Human Genome Quarterly1
: 1. Retrieved 2005-02-03. - DeLisi, Charles (2001). «Genomes: 15 Years Later A Perspective by Charles DeLisi, HGP Pioneer». Human Genome News11
: 3-4.. - White House Press Release. Проверено 22 июля 2006. Архивировано 20 марта 2012 года.
- BBC NEWS / Science/Nature / Human genome finally complete. Проверено 22 июля 2006. Архивировано 20 марта 2012 года.
- Guardian Unlimited / UK Latest / Human Genome Project finalised (недоступная ссылка — история
). Проверено 22 июля 2006. - UCSC Genome Browser Home
- Ensembl Genome Browser
- BBC News | SCI/TECH | Human gene patents defended
- ↑ 12
International Human Genome Sequencing Consortium (2001). «Initial sequencing and analysis of the human genome.» (PDF).
Nature409
: 860?921. DOI:10.1038/35057062. - ↑ 12
Venter, JC, et al (2001). «The sequence of the human genome.» (PDF).
Science291
: 1304?1351. DOI:10.1126/science.1058040. PMID 11181995. - IHGSC (2004). «Finishing the euchromatic sequence of the human genome.». Nature431
: 931-945. DOI:10.1038/nature03001. - Fiers W, Contreres R, Duerinck F, Haegeman G, Iserentant D, Merregaert J, Min Jou W, Molemans F, Raeymaekers A, Van den Berghe A, Volckaert G, Ysebaert M. Complete nucleotide sequence of bacteriophage MS2 RNA: primary and secondary structure of the replicase gene, Nature. 1976 Apr 8;260(5551):500-7.
- Sanger F, Air GM, Barrell BG, Brown NL, Coulson AR, Fiddes CA, Hutchison CA, Slocombe PM, Smith M., Nucleotide sequence of bacteriophage phi X174 DNA, Nature. 1977 Feb 24;265(5596):687-95
- Fleischmann, R. D. et al. (1995). «Whole-genome random sequencing and assembly of Haemophilus influenzae Rd.». Science269
: 496?512. DOI:10.1126/science.7542800. PMID 7542800. - C. elegans Sequencing Consortium (1998). «Genome sequence of the nematode C. elegans
: A platform for investigating biology.».
Science282
: 2012-18. DOI:10.1126/science.282.5396.2012. PMID 9851916. - Adams, MD. et al. (2000). «The genome sequence of Drosophila melanogaster
.».
Science287
: 2185?2195. DOI:10.1126/science.287.5461.2185. PMID 10731132. - Waterston RH, Lander ES, Sulston JE (2002). «On the sequencing of the human genome». Proc Natl Acad Sci U S A.99
: 3712-6. DOI:10.1073/pnas.042692499. PMID 11880605. - Waterston RH, Lander ES, Sulston JE (2003). «More on the sequencing of the human genome». Proc Natl Acad Sci U S A.100
: 3022-4. DOI:10.1073/pnas.0634129100. PMID 12631699. - Osoegawa, Kazutoyo (2001). «A Bacterial Artificial Chromosome Library for Sequencing the Complete Human Genome». Genome Research11
: 483-496. DOI:10.1101/gr.169601. PMID 11230172. - Kennedy D (2002). «Not wicked, perhaps, but tacky». Science297
: 1237. DOI:10.1126/science.297.5585.1237. PMID 12193755. - Venter D (2003). «A Part of the Human Genome Sequence». Science299
: 1183-1184. DOI:10.1126/science.299.5610.1183. PMID 12595674. - Levy S, Sutton G, Ng PC, Feuk L, Halpern AL, et al. (2007). «The Diploid Genome Sequence of an Individual Human». PLoS Biology5
(10): e254. DOI:10.1371/journal.pbio.0050254. - Human Genome Diversity Project