«Считается» — потому что сразу стало понятно, что сама по себе последовательность трех миллиардов нуклеотидов человеческой ДНК мало говорит о том, как она работает. #учимсясмти
Даже если мы знаем, в какие «слова» (гены) складываются генетические «буквы» (нуклеотиды), смысл многих «слов» пока остается тайной — мы не понимаем, как именно работают многие гены (не говоря уже о массе регуляторных участков ДНК). В обоих проектах по расшифровке человеческого генома в конечном счете полностью прочитали ДНК только двух людей — руководителя одного из двух проектов Крэйга Вентера и одного из создателей двуспиральной модели ДНК Джеймса Уотсона. Однако очевидно, что все мы разные. Наши индивидуальные особенности записаны в наших генах: цвет глаз, рост и т.п. Более того, в геноме находится информация и о нашей предрасположенности к заболеваниям: мутации в ДНК могут повышать или понижать риск возникновения той или иной болезни. Поэтому геном каждого отдельного человека, как, впрочем, и любого другого живого существа, можно считать в своем роде уникальным.
Но из одного, двух и даже десятка расшифрованных геномов отдельных индивидов нельзя выделить достоверную статистическую информацию, например о том, что мутация в каком-нибудь гене повышает риск развития злокачественной опухоли. Это как если бы вы захотели провести социологическое исследование, но опросили лишь пару своих знакомых. Какие-то данные вы, несомненно, получите, но вот отражать общую картину они вряд ли будут. Чтобы узнать общую закономерность и чтобы она была достоверной, нужно по максимуму увеличить число опрошенных. Тот же принцип работает и с генетической информацией: чтобы надежно определить влияние мутации на работу гена, нужна большая статистическая выборка. Иными словами, чтобы понять, что означает генетическая информация, нам нужно прочитать геномы как можно большего числа людей.
В области расшифровки генома за последнее десятилетие произошел заметный прогресс, в первую очередь в смысле доступности методов секвенирования (определения нуклеотидной последовательности). Если на первый геном ушло 10 лет, усилия сотен, если не тысяч, человек и миллион, а то и миллиард, долларов, то сейчас технологии позволяют секвенировать геном одного человека за сумму порядка одной тысячи долларов. Это сделало расшифровку генома доступной для обычных людей и послужило мощным толчком к развитию персонифицированной медицины. Собственно, тут мы подходим к вопросу о том, для чего все это надо и что хочет от этого получить наука, а что — простые граждане?
Огромное число организаций по всему миру занимается генетическими исследованиями: и крупные национальные центры, и академические институты, и фармацевтические компании, и молодые стартапы. Все вместе они генерируют огромный объем данных, который растет в геометрической прогрессии. Сегодня речь идет уже о величине порядка нескольких петабайт (1 петабайт = 1024 терабайт) информации — сравнимый объем данных ежегодно генерирует Большой адронный коллайдер. Их нужно где-то хранить, к ним нужно организовать доступ, их нужно быстро обрабатывать. Научное сообщество давно осознало, что свободный доступ к такой информации будет полезен всем участникам, занимающимся генетикой. Так появились открытые базы данных, содержащие генетическую информацию самых разных живых организмов: плодовых мух (FlyBase), паразитов (WormBase), крыс (Rat Genome Database), шпорцевых лягушек (XenBase). Результаты сравнения геномов различных организмов бывают порой весьма забавными: к примеру, выяснилось, что у человека и шпорцевой лягушки был общий предок, который жил порядка 360 миллионов лет назад.
А как обстоят дела с генетическими данными самого человека? Тут ситуация немного сложнее. Геном человека необходимо изучать, чтобы понять молекулярные, клеточные, физиологические механизмы работы нашего тела и, может быть, научиться ими управлять или хотя бы корректировать в них неполадки. Для исследований генетики старения и наследственных заболеваний, предрасположенности к раку и многих других развиваются технические средства: разрабатываются и совершенствуются технологии секвенирования, создается инфраструктура для работы с геномными данными.
Многие IT-компании обратились в сторону Life Sciences — наук о живом. Например, компания IBM развивает проект IBM Watson Health — систему поддержки принятия решений в медицинской диагностике. Суть системы состоит в том, что суперкомпьютер, анализируя огромный массив неструктурированной информации (научные статьи, истории болезни, методики лечения и многое другое), может дать ответ на вопрос, чем болен пациент. По замыслу разработчиков это должно снизить вероятность постановки неправильного диагноза и, как следствие, неправильного лечения. Насколько успешно компьютер сможет заменить доктора Хауса — покажет время. Другой крупный производитель систем хранения и обработки информации — компания EMC — активно занимается разработкой «облачной» инфраструктуры для работы с геномными данными в медицинских и научных организациях. Биоинформатика сейчас становится тем звеном, которое может объединить знания и возможности исследователей, врачей и инженеров во благо человечества.
Государства и крупные научные центры запускают проекты по созданию базы геномов тысяч и даже миллионов людей, выделяя для этого солидное финансирование. Мы недавно писали про научный проект Московского государственного университета «Ноев ковчег» по созданию национального банка-депозитария живых систем, хотя в целом Россия пока сильно отстает от других стран в сфере генетических технологий. В Китае, к примеру, запустили проект, целью которого станет расшифровка генома миллиона человек, миллиона животных и растений и миллиона микроорганизмов. Крейг Вентер, один из тех, кто первым расшифровал человеческий геном, анонсировал, что к 2020 году собирается секвенировать миллион геномов. В Германии планируют прочитать геномы 200 000 человек и далее наблюдать за их здоровьем на протяжении 30 лет. Есть проекты по поиску связей между вероятностью развития сердечно-сосудистых заболеваний и особенностями ДНК, опирающиеся на наблюдения за тысячами людей в течение 20 лет и более.
Можно и дальше приводить примеры, но их объединяет одно — масштабность исследований, их продолжительность и огромный массив данных, которые будут генерироваться на протяжении экспериментов. Чтобы облегчить доступность информации и обмен ею, создаются различные объединения, цель которых — разработать единые стандарты и методики. Разрозненные генетические банки данных объединяются в национальные и межнациональные структуры — так же, как в свое время стандартизировались протоколы обмена информацией по Сети. Но все это техническая сторона вопроса, которая, без сомнения, будет развиваться и возможности которой мы, может быть, еще даже не представляем. А что с другой стороны? Как генетические данные будут менять жизнь людей?
Тут есть целый ряд проблем, для которых пока нет однозначных решений, и касаются они даже не тех возможностей, которые может нам дать генетика, а того, как мы сможем воспринять новые факты о нас самих. Например, уже сейчас существует ряд генетических тестов, позволяющих установить мутацию в том или ином гене, которая связана с повышенной вероятностью развития определенных онкологических заболеваний. Однако наличие такой мутации в геноме вовсе не означает, что вы непременно заболеете, — мутация лишь повышает вероятность того, что это произойдет. Подобные выводы обычно основываются на том, что у исследованной ранее группы людей была выявлена зависимость между наличием этой мутации и риском заболеть. Насколько точны подобные оценки, можно установить, только исследовав очень большую выборку пациентов и одновременно исключив множество других несущественных факторов. Как раз на накопление подобной информации и направлены «миллионные» проекты по расшифровке генома, а также проекты длительностью несколько десятков лет. Накапливая все больше информации, мы сможем лучше узнать, как мы устроены.
Как бы то ни было, сейчас мы относимся к своему будущему, как к черному ящику. Готово ли человечество к тем знаниям, которые мы получим, посветив в этот ящик фонариком? Как изменится сознание человека, если он с самого детства будет знать, что, например, вероятность развития рака мозга у него в несколько десятков раз выше, чем среднестатистическая? Кому могут быть доступны такие данные? Могут ли родители узнать, что ожидает в будущем их детей еще до их рождения? Сейчас мы еще не знаем ни границ наших возможностей, ни того, сколько времени понадобится науке, чтобы от стадии получения подобных знаний перейти к их использованию.
И здесь словосочетание «генетический банк» приобретает дополнительный смысл. Это не только базы данных, содержащие расшифрованные геномы, но и своего рода вклад нынешнего поколения в развитие биотехнологий, воспользоваться которыми смогут, скорее всего, только наши потомки; долгосрочный вклад, который потом вернется с большими процентами в виде бесценного знания. При одном условии — что банк не «лопнет», а «вкладами» не воспользуются в преступных и неэтичных целях. Однако это уже зона ответственности не одной лишь науки...
Источник: «Наука и жизнь»
Присоединяйтесь — мы покажем вам много интересного
Присоединяйтесь к ОК, чтобы подписаться на группу и комментировать публикации.
Комментарии 1