ГЕНОМИКА - КЛЮЧЕВОЕ СЛОВО НОВОЙ БИОЛОГИИ
В российской национальной программе важное место занимают, помимо структурного и функционального анализа генома, два направления исследований: компьютерный анализ генома и медицинские приложения - медицинская геномика.
Создано программное обеспечение, позволяющее опознавать кодирующие и некодирующие участки генома по анализу нуклеотидной последовательности, а затем это компьютерное предсказание проверять экспериментально; организованы базы данных в Москве, Новосибирске, Пущине, где систематизируются непрерывно пополняющиеся сведения о геномике человека.
Благодаря тому что в мире идентифицировано множество генов, ответственных за многие болезни человека, в том числе онкологические, наследственные, нейродегенеративные, возникли и бурно прогрессируют два направления медицинской геномики - геномная диагностика, а также поиск и идентификация не только "больных" генов, ответственных за те или иные патологии, но и генов, определяющих предрасположенность ко многим тяжелым болезням человека. Медико-генетические центры Москвы, Санкт-Петербурга, Томска, Новосибирска активно используют и развивают методы геномной диагностики, включая дородовую (пренатальную).
В 1999 г. в нашей стране можно было диагностировать не менее 30 различных заболеваний, главным образом наследственных: болезнь Альцгеймера, болезнь Гоше, атаксию, муковисцидоз, мышечную дистрофию Дюшенна, дистонию, гемофилию А и В, миотоническую дистрофию, нейрофиброматоз 1-го типа, фенилкетонурию, серповидно-клеточную анемию, талассемию, синдром хрупкости Х-хромосомы, хорею Хантингтона, наследуемый рак молочных желез и яичников и др.
В 1999 г. в рамках российской программы работали около 400 исследователей в составе примерно 100 групп из 30 научных учреждений РАН и РАМН, госцентров и университетов. За достижения в геномике 16 российских ученых удостоены премии имени А.А. Баева, учрежденной Научным советом по программе "Геном человека" в честь организатора и первого руководителя геномной программы России.
Как далеко продвинулись структурные исследования генома человека в мире? Приведу только две цифры. Пять лет назад за год в мире расшифровывали несколько миллионов нуклеотидных пар ДНК, и это воспринималось как замечательное достижение. На исходе 1999 г. американская фирма "Celera", возглавляемая выдающимся исследователем и организатором Г. Вентером, расшифровывает (секвенирует) не менее 10 млн. нуклеотидных пар в сутки. На фирме секвенирование ДНК осуществляют около 250 приборов, снабженных роботами, которые функционируют в автоматическом режиме и передают всю информацию непосредственно в банки данных, где она систематизируется, аннотируется и становится доступной ученым всего мира.
Вентер официально объявил, что "Celera" планирует завершить расшифровку генома человека к концу 2001 г. В свою очередь Консорциум европейских и японских центров расшифровки структуры ДНК сообщил, что ту же цель планирует достичь к 2003 г. Очевидно, что это соревнование (независимо от того, кто придет к финишу первым) в ближайшие два-три года завершится достижением эпохальной цели - познанием всего наследственного материала человека на уровне его точного химического строения. Вероятно, в истории человечества трудно найти что-либо сопоставимое с этим событием по его общетеоретическим последствиям и практическому значению. Может быть, оно сравнимо с открытием электричества или путей использования атомной энергии, может быть, с выходом человека в космос, но в любом случае знаменует окончание одной эры и начало новой, как минимум, в биологии и медицине, а скорее, во всем естествознании.
Таблица 1. Сравнение размеров геномов и числа генов
Организмы | Размер генома,
млн. п.н. |
Число генов,
тыс. |
Плотность, тыс. п.н./ген |
Бактерии Дрожжи Нематода Человек |
0.5-5 12 97 3000 |
0.47-4.29 6 19 80-100 |
1-1.7 2 5 >30 |
Исследования генома человека с самого начала потянули за собой, как паровоз, исследования геномов огромного числа других организмов, гораздо более простых (табл. 1). Их расшифровка ведется во все возрастающем темпе и объеме параллельно с изучением человеческого генома. Что же сделано конкретно к концу 1999 г.?
Известна полная геномная структура свыше 100 микроорганизмов (табл. 2), среди которых как обычные бактерии, в том числе вызывающие многие тяжелые заболевания человека и животных, так и архебактерии - особое царство живой природы, находящееся как бы между клеточными организмами (эукариоты) и истинными бактериями (прокариоты).
Таблица2. Геномы некоторых микроорганизмов, расшифрованные в 1995-1998 годах
Название | Размер генома,
млн. п.н. |
Число генов | Свойства |
Mycoplasma genitalius
Mycoplasma pneumoniae Ricketsia provazekii Treponema pallidum Helicohacter pylori Haemophilus influenzae Mycobacterium tuherculosus Escherichia coli К 12 Metanococcus jannaschii Pyrococcus horikoshii |
0.580 0.816 0.112 1.138 1.668 1.830 4.412 4.639 1.660 1.739 |
468 677 834 1041 1590 1073 3924 4288 1738 2061 |
Возбудитель урогенитального
воспаления Возбудитель пневмонии Возбудитель сыпного тифа Возбудитель сифилиса Вызывает язву желудка Возбудитель менингитов, отитов и др. Возбудитель туберкулеза Энтеробактерия Автотроф Анаэроб Термофил Метаноген Анаэроб Гипертермофил |
Мы знаем полное строение генома пекарских дрожжей - первого одноклеточного эукариотического организма (гриб, согласно биологической классификации) и полную структуру генома первого многоклеточного организма - круглого червя (нематоды), завершена расшифровка ДНК первого насекомого - плодовой мушки дрозофилы и первого растения - арабидопсиса. Круг объектов непрерывно расширяется, в частности весьма активно расшифровывается геном риса - одной из основных продовольственных культур. У человека уже известно строение ДНК двух самых маленьких хромосом - 21-й и 22-й. Все это вместе создало основы сравнительной геномики.
Приведем только один пример того, что дает этот подход, из практики работы нашей лаборатории (рис. 1). Сравнение у разных видов фрагментов белков, выполняющих одну и ту же функцию в белковом синтезе, позволило выявить общий структурный мотив, а последующее изменение структуры этого мотива путем так называемого направленного мутагенеза - его функциональную важность. Из суммы данных структурной и сравнительной геномики можно делать далеко идущие выводы о молекулярной эволюции организмов, что составляет предмет еще одного раздела геномики - эволюционной.
Парадоксальность ситуации, складывающейся сейчас в геномике, состоит в том, что объем информации, которым располагают исследователи, намного больше того, что можно осмыслить, проанализировать и использовать в экспериментальной работе. Поэтому развитие новых математических методов, вычислительной техники, программного обеспечения, совершенствование способов описания и хранения геномной информации становятся чрезвычайно актуальными. Этими проблемами активно занимается биоинформатика, включающая в себя и геноинформатику.
Биоинформатика анализирует ситуацию как бы на четырех тесно связанных друг с другом уровнях (табл. 3). Первый - это генетический текст, то есть нуклеотидная последовательность ДНК; второй - тоже текст, но сначала в форме РНК, а затем в форме аминокислотной последовательности белка; следующий, третий уровень -пространственная структура белка. Как известно, она целиком определяется первичной структурой, а экспериментально устанавливается с помощью рентгеноструктурного анализа кристаллов белков или с помощью ядерного магнитного резонанса в растворе для белков небольшого размера.
Таблица 3. Некоторые банки данных (БД) по биоинформатике
Наименование БД | Краткое описание |
GenBank | БД по нуклеотидным последовательностям |
SwissProt | Аннотированный БД по аминокислотным последовательностям белков |
PIR | Аннотированный БД по аминокислотным последовательностям белков, организованным в соответствии с гомологией и таксономией |
PDB | БД по трехмерной структуре биологических макромолекул |
OWL | Невырожденная комплексная БД по структурам белков из SwissProt, PIR (1-3), GenBank и NRL-3D |
NDB | БД по нуклеиновым кислотам, включает структуры ДНК и РНК вместе с их трехмерными изображениями |
PROSITE | БД паттернов функционально значимых участков белков |
ProDom | БД по доменам белков |
ProteinMotionsDatabase | БД по динамике белков, включающая многоуровневую классификацию движения петель, доменов и субъединиц |
PROMISE | БД по простетическим группам и ионам металла в активных центрах белков |
RELIBASE | Полная БД по лиганд-рецепторным комплексам |
OMIM | Каталог генов человека и генетически обусловленных заболеваний |
LIGAND | БД по ферментативным реакциям |
dbCFC | БД по кодирующим ДНК цитокинов |
ReLiBase | БД по анализу лиганд-рецепторных комплексов в PDB |
Хотя методы предсказания трехмерной структуры белка (вторичной и третичной структуры) по его аминокислотной последовательности все еще крайне неточны, тем не менее благодаря тому, что в банках данных уже есть информация о трехмерной структуре сотен белков, можно на ее основе, используя сведения о нуклеотидной и аминокислотной последовательностях неизвестного белка, предсказывать во многих случаях и трехмерную структуру с достаточной точностью. Наконец, последний, четвертый уровень - это предсказание функции белка на основании знания его первичной структуры и предсказанной трехмерной структуры. Таким образом, структурная и сравнительная геномика через биоинформатику как бы переходят в новый раздел геномики, который обычно называют функциональной геномикой (рис. 2).

Совершенно очевидно, что близящееся завершение эры структурной геномики человека и многих других организмов означает перенос фокуса внимания исследователей на биоинформатику и функциональную геномику. Ни у кого нет сомнений, что первое десятилетие XXI в. будет эрой функциональной геномики и биоинформатики. Если в геномную эру (1989-1999) ключевым словом было "ДНК", то скоро ключевым словом, безусловно, станет "белок". Такова диалектика новой биологии.
источник: Киселев Лев Львович - член-корреспондент РАН,
заведующий лабораторией Института молекулярной биологии им. В.А.
Энгельгардта РАН, председатель научного совета
Российской национальной
программы "Геном человека" Министерства науки и технологий
РФ.