Раскодируй мне ген

 Почему одни считают биоинформатику наукой будущего, а другие — занятием для неудачников  18 января, 07:00
подходящие темы
Раскодируй мне ген
Фотографии Сергея Ковалёва

Многие века единственным способом исследования живых существ для биологов было наблюдение, а основным инструментом — скальпель. Пока не был открыт геном, организмы, казалось, состояли только из органов. Теперь учёные добрались в исследованиях до уровня ДНК, а главным их инструментом стал компьютер. Так на стыке биологии и математического моделирования возникла новая наука — биоинформатика. Лаборатории, где ею занимаются, есть в Институтах цитологии и генетики и химической биологии и фундаментальной медицины СО РАН. Недавно третья «зеркальная» открылась в Новосибирском госуниверситете. Корреспондент Сиб.фм пообщался с известным российским биоинформатиком Михаилом Гельфандом и сотрудниками лаборатории, чтобы понять, как учёные отслеживают эволюцию на генном уровне, делают науку без всяких приборов и зачем уходят в биоинформатики после работы в банке.

Раньше учёным приходилось сравнивать ДНК вручную: печатать на бумаге нуклеотидные последовательности, потом вырезать напечатанные строчки, подставлять друг под друга и таким способом искать сходные участки. Тогда речь шла о десятках и сотнях нуклеотидов или аминокислот. В современном мире для анализа данных нужны специальные инструменты. Их набор и предоставляет биоинформатика.


Геном — это находящийся в каждой клетке организма набор числа генов

Чтобы понять, как именно функционируют живые организмы на уровне клеток, необходимо проанализировать тысячи собираемых по всему миру геномов, в том числе древних людей, животных или растений. Эволюционные биологи-экспериментаторы получают из их древней ДНК геном, а биоинформатики его расшифровывают и обрабатывают полученные данные. Благодаря вторым первые могут сравнивать древние и современные геномы. Это позволяет изучать эволюцию видов и пытаться предсказывать дальнейшее развитие всех живых существ. В перспективе анализ генома позволит научиться легко лечить сложные болезни и значительно увеличить продолжительность жизни.

Биоинформатика, как все науки, делится на прикладную и фундаментальную. Прикладная — это расшифровка данных последовательностей геномов и структуры белков. С её помощью можно ответить на вопрос, как работает клетка в целом, что делает определённый белок, как регулируется нужный ген и прочее. А фундаментальная биоинформатика — это эволюционная молекулярная биология.


Нуклеотидная последовательность — «расшифрованная» последовательность ДНК

Наука для неудачников

Ещё летом, на школе «Русского репортёра», мы с ребятами стояли у лагерной кухни и наблюдали, как улыбающийся и очень бородатый дядечка чистит картофель и трёт морковь, а перед лекцией курит трубку. Это был доктор биологических наук, профессор факультета биоинженерии и биоинформатики МГУ Михаил Гельфанд. В декабре 2015 года учёный приехал в Новосибирск, и найти местечко в кафе, где он выступал с лекцией о ДНК, оказалось непросто. Речь шла не только о сути дисциплины, но и о профессиональных перспективах учёных:

— Я бы сказал, что биоинформатика — раздел биологии, но не научный, а методический; это набор средств, которые связаны с анализом массовых данных. Когда их много, требуется компьютер, чтобы их осмыслить, потому что в голове они не поместятся, — говорит Гельфанд.

Раньше я говорил, что биоинформатика — наука для неудачников, потому что в неё идут математики, которые не умеют доказывать теоремы, и биологи, у которых пробирки в руках не держатся.


Нуклеотиды — составные части ДНК и РНК. Цепочки обоих типов состоят из молекул нуклеотидов четырёх видов: аденин (A), гуанин (G), цитозин © и тимин (T)

Евгений Кунин — человек, у которого самый большой в мире индекс Хирша — на меня обижался за эту фразу, потому что он биолог. Про него ходили легенды, что он в лаборатории — полный дизастер, то есть, катастрофа, и он очень быстро ушёл в биоинформатику, где сделал кучу совершенно потрясающих вещей. Недавно он, наконец, «раскололся», примирился со своим прошлым. Да и биоинформатика теперь — самостоятельная профессия, которой можно учиться с самого начала.

В 1980-е годы ещё не было понятия «учить биоинформатику» — ты её делал. Я тогда каждую неделю ходил в Библиотеку естественных наук и просматривал все статьи о биоинформатике, какие выходили. Сейчас это нереально — ты работаешь в своей области и приходится выбирать, что нужно читать, что не нужно.

По сути биоинформатика — это анализ биологических данных, специально полученных в расчёте на то, что их будут потом обрабатывать на компьютере. Их сопоставление и правильное с ними оперирование позволяет биологам-экспериментаторам делать нетривиальную биологию. Это я называю полезной прикладной биоинформатикой — делать биологию, глядя на большое количество экспериментальных данных, специально полученных в расчёте на то, что они будут потом с помощью компьютера обрабатываться.


«Логика случая» Евгения Кунина — книга о природе и происхождении биологической эволюции

Дальше есть тщательно скрываемый секрет, что есть фундаментальная биоинформатика, но я её называю бесполезной. Успешные биоинформатики занимаются именно ей, а полезное у них получается в качестве отходов производства. И эта бесполезная биоинформатика — эволюционная молекулярная биология, но проку от неё биологам нет. Она занимается тем, что отвечает на вопросы, как развивались те живые системы, которые сейчас работают, как они возникли? Ведь, например, у человека и лягушки был общий предок, но где пошло разделение, как оно происходило, что получились два разных существа? Мне безумно нравится изучать древнюю ДНК. По-моему, это самое интересное, что вообще бывает.

То, что тысячи лет назад все со всеми трахались — это же очень прикольно! Ну как так?

Жили неандертальцы, пришли кроманьонцы, у них появились детишки. Теперь мы видим потомков этих браков. Интересно посмотреть, как животные жили, как люди одомашнивали лошадей, коров, собак, чем отличаются породы. Была, например, чудесная алтайская собака, у которой ближайшие родственники жили в Америке ещё до Колумба!

Например, мы занимаемся регуляцией транскрипции, то есть, синтеза белков у бактерий. Мы уже в некоторых случаях можем сказать, как эти бактерии исторически развивались. С одной стороны, это бесполезное упражнение, но с другой мы можем предсказать кучу функций современных белков.

Бактерии — довольно простые существа, поэтому ими приятно заниматься, но не стоит забывать о многоклеточных организмах, если мы хотим понимать ещё и эволюцию. Для этого необходимо лучше знать эмбриональное развитие.

Раньше не было технических средств для изучения эмбриогенеза на ранней стадии — всё было на анатомическом уровне, например, геккелевские красивые рисуночки ранних зародышей. Видимо, это было враньём. И всё это — примеры «бесполезной» фундаментальной биоинформатики.


Популяризатор эволюционной доктрины Эрнст Геккель подделал рисунки эмбрионов животных, чтобы увеличить их сходство с человеком и подчеркнуть тем самым родственные связи организмов

А сейчас можно просто закачать информацию в компьютер и сравнить, увидеть, как молекулярные изменения в ранних зародышах транслируются потом в морфологические различия. А побочным продуктом будет понимание развития уродств, генная терапия и тому подобное. Вот это будет страшно круто! Вот это я называю полезной прикладной биоинформатикой.

В общем-то, сейчас биоинформатика — это уже мейнстрим. Этим надо заниматься, если нужен кусок хлеба на старость. Биология будет развиваться, потому что все хотят жить дольше и кушать лучше, а биологии без биоинформатики уже не бывает, как собственно, любой современной науки без обработки данных. Вот ты в физике высоких энергий получаешь два петабайта информации в час — в голове это не уложишь.

Мы не понимаем биологию

Во вновь созданной «Зеркальной лаборатории структурной биоинформатики и молекулярного моделирования НГУ» занимаются исследованием болезни Альцгеймера, от которой в настоящее время не существует лекарства. У заведующей Анастасии Бакулиной свой взгляд на науку:

— Хотите, я вам скажу такое определение биоинформатики, которое я слышала от очень уважаемой женщины, которая преподаёт в университете:

«Знаете, бывают такие люди, которые руками ничего не делают, а занимаются интеллектуальным онанизмом. Они называют себя биоинформатиками».

Биология, как наука, а не как область знаний, имеет дело с очень сложными объектами, из которых учёные получают много больших данных. С ними-то и нужно работать. Хотя есть мнение, что некоторые биологи-экспериментаторы не любят биоинформатиков, мол, им всё слишком легко даётся: не нужно проводить эксперименты, чтобы писать научные статьи. Можно просто взять данные, «положить» в компьютерную программу, обработать их и что-то получить.

Сейчас есть проблема с биологией — мы её не понимаем. Мы можем сказать, что понимаем физику, потому что процесс её развития — последовательное упрощение законов.

Есть средневековые трактаты, где были сотни законов по механике, а потом «пришёл» Ньютон — и всё, три закона осталось.


Как в Бердске производят ферменты, востребованные в лабораториях всего мира

То есть физика смогла всё упростить до такого состояния, что человек всё понимает. Биология этого сделать не смогла. Сможет ли? Вопрос открытый. Поэтому там, где физикам достаточно посидеть и подумать, биологам нужны специальные методы обработки. Сейчас способов получать данные становится всё больше и больше, есть масса установок для изучения чего-то биологического — они за один эксперимент выдают много материала, который надо как-то обрабатывать. Поэтому роль биоинформатики во всём мире растёт.

Наша лаборатория занимается изучением болезни Альцгеймера, и мне кажется, это самое важное направление, потому что раку и сердечно-сосудистым заболеваниям посвящено много исследований. Мы уже много чего знаем о них и на многое можем повлиять. А с Альцгеймером всё плохо: мы примерно знаем, что происходит в мозге, но не понимаем, почему. Есть масса теорий, объясняющих, что там может происходить, но нет той, которая бы полностью всё объясняла.

Вторая проблема — нет лекарственных препаратов, которые действительно бы помогали в этой болезни. Мы знаем, что состояние человека ухудшается, приведёт его к смерти, но всё, что можем делать — снимать симптомы. И люди с этим заболеванием — это большие финансовые расходы, которые идут впустую, ведь мы понимаем, что человек не вылечится. Я считаю, что самое большое достижение в терапии болезни Альцгеймера за последние 100 лет — подгузники для взрослых.

Важность решения этой проблемы будет расти, потому что увеличивается продолжительность жизни во всё мире.

Пока что наша лаборатория не может предложить какие-то варианты терапии, но мы близки к тому, чтобы предсказывать наследственные предрасположенности к этому. Но тут встаёт этический вопрос: а насколько люди хотят это знать?


Исследования болезни Альцгеймера вошли в число приоритетных для СО РАН в 2015 году

В Академгородке есть несколько лабораторий по биоинформатике, например, в Институте цитологии и генетики СО РАН. Но анализ пространственных структур белка у нас (в СО РАН, — прим. Сиб.фм) сильно отстаёт, а есть очень много задач, связанных с этим, которые мы решаем.

Во-первых, молекулярные биологи изучают в основном молекулы белков. Но при этом учёные часто не знают, как они выглядят, а мы как раз можем их показать на экране компьютера или распечатанными на 3D-принтере. Так исследователи видят, с чем работают, а человеческий мозг так устроен, что когда он что-то видит, то гораздо лучше может понять свойства наблюдаемого.

Во-вторых, мы можем проектировать новые молекулы, а наши коллеги их потом синтезируют и проверяют их свойства. В-третьих, если уже кто-то что-то насинтезировал, мы можем попытаться объяснить, что там внутри происходит. Например, смоделировать, как работает белок. Это сложно, но мы к этому стремимся.

Дешёвая наука

— Когда я защищал кандидатскую диссертацию, в конце 2010-м году, было всего лишь два научных совета по биоинформатике: в Москве и у нас, в Новосибирске, — рассказывает научный сотрудник Лаборатории эволюционной биоинформатики и теоретической генетики ИциГ СО РАН Дмитрий Ощепков, — Тусовка была очень тесная — все друг друга знали, ездили практически одним составом на научные конференции.

Тогда в биоинформатики часто шли люди с изначальным образованием не в биологии. Например, Михаил Гельфанд закончил сначала механико-математический факультет, я — физфак. Сейчас биоинформатика заняла практически все ниши биологии — информации столько, что без компьютерной обработки не обойтись. Особенно когда появились технологии массового секвенирования.

Сейчас львиная доля прорывных исследований делается с помощью компьютерных программ, часть биоинформатики превратилась просто в рутинную обработку информации, но и науки хватает.


Секвенирование — определение последовательности нуклеотидов в гене, по сути, его расшифровка

Такая работа подразумевает многозадачность: сразу можно многими интересными вещами заниматься, не отходя от компьютера. Сейчас и данных, и методов для их обработки куча, не то что раньше, когда по крупицам их собирали: биологи проводят эксперимент, поверхностно обрабатывают, дальше берут, что им нужно, а остальное, ненужное, «заливают» в виртуальные банки. А у тебя, биоинформатика, если есть интерес, ты просто берёшь сырую информацию и перерабатываешь своими методами в разных сочетаниях. Сейчас данных точно больше, чем людей, всего просто не успеваешь. Биоинформатика в тренде. Это одна из самых динамических наук в наше время.

В Московскую школу биоинформатики, по словам Гельфанда, может прийти кто угодно. Например, у него была аспирантка, которая захотела заниматься биоинформатикой после окончания экономического факультета и трёх лет работы в банке.

— Но в основном приходят уже сложившиеся экспериментальные биологи, которые просто хотят выучить новый набор приёмов, и математики с программистами, которые идут с идеей, что есть новая область, и в неё надо целиком погрузиться.

Как говорят учёные, биоинформатикой может заниматься практически любой человек, знающий азы биологии и информатики. В специальных виртуальных банках «лежит» много «сырых» биологических данных в открытом доступе, поэтому молодым учёным есть на чём учиться и делать пусть маленькие, но научные открытия. Кроме того, биоинформатика — наука дешёвая, ведь нужен всего лишь компьютер и никаких приборов.

ВКонтакте
G+
OK
 
Новости партнёров
Комментарии

Редакция Сиб.фм призывает к конструктивной и взвешенной дискуссии по теме опубликованного материала. Недопустимы и удаляются комментарии, которые нарушают действующее законодательство, содержат призывы к агрессии, оскорбления любого характера, либо не относятся к теме публикации. Редакция не несёт ответственности за содержание комментариев.

самое популярное
присоединяйтесь!