Что такое мокрая биология
Великий секвенатор: кто такие биоинформатики и что они изучают
В новый выпуск подкаста «Сушите вёсла» зашёл руководитель научной группы Института биоинформатики Юрий Барбитов. Обсудили профессию биоинформатика и всё вокруг неё: чем похожа на Data Science, почему полезна для человечества и как продвигает науку.
«Сушите вёсла» — подкаст про разработку, аналитику, тестирование и всё, что связано с созданием IT-продуктов. Его ведут разработчики red_mad_robot Артём Кулаков и Рома Чорыев. В эпизоде #16 обсудили, что происходит, когда информатика пересекается с биологией, и Юрий Барбитов попробовал объяснить нам простыми словами про геном, секвенирование и «мокрых биологов».
Ниже подкаст и ответы на несколько горячих вопросов про биоинформатику.
Тайминг
1:50 — как попасть в биоинформатику;
4:30 — что такое биоинформатика;
10:20 — чем похожа на data science;
17:02 — секвенатор и секвенирование;
23:35 — как развивается биоинформатика и почему она важна;
29:30 — риски в работе с данными и в лабораториях;
35:17 — стоимость биоинформатических исследований;
40.00 — про платформы Folding at Home, World Community Grid;
50:25 — проблема с массивами данных в биоинформатике;
55:15 — в каком состоянии находится биоинформатический софт;
1:00:50 — где хранятся данные;
1:05:09 — проблемы с хранилищами данных;
1:15:00 — как обучиться на биоинформатика.
Что такое биоинформатика
Юрий считает, что у каждого специалиста своё представление о том, что это за область науки. Но герою выпуска ближе такое определение — биоинформатики придумывают, как обрабатывать большие массивы биологических данных, чтобы получить из них конкретные научные результаты.
Эта дисциплина немного похожа на эксперименты в биологии, когда учёный в лаборатории проводит опыты, занимается исследованиями и получает результаты. По словам Юрия, его коллеги называют это «мокрой биологией».
«Мокрый биолог» делает в лаборатории разные манипуляции с живыми клетками, потом куда-то их засевает, пересевает, смешивает растворы. Человек, который занимается биоинформатикой, — dry biologist («сухой биолог»). Он, как и все программисты, выполняет рутинные задачи — пишет программы, скрипты, а потом их запускает. Отличие в том, что работа биоинформатика похожа на работу дата-сайентиста. Нужно не только написать, как обработать входные данные, и получить из них что-то. Ещё надо придумать, как всё это дело применить и как интерпретировать полученные результаты.
С какими данными работает биоинформатик
Впервые биоинформатику применили, когда люди начали заниматься геномом — это набор молекул ДНК с наследственной информацией. Геном есть у всех живых существ — от бактерий до людей. Если прочитать его и узнать всё про наследственную информацию, человечество научится исправлять наследственные ошибки, подбирать новые методы терапии и т.д.
Проблема в том, что наследственная информация очень большая — это очень длинный текст. Геном человека состоит из трёх миллиардов символов. Чтобы с ним правильно работать, его нужно для начала расшифровать.
Юрий Барбитов
руководитель научной группы Института биоинформатики
Представьте, что у вас была пачка газет и её сначала взорвали, а потом нужно попытаться этот «пазл» составить обратно, собрать исходную газетную страницу из разорванных кусочков. Примерно так работает прочитывание генетических текстов.
В основе расшифровки генома — метод секвенирования. Это прочитывание, восстановление последовательности. Биолог берёт длинную цепочку символов генома и «разрезает» на небольшие кусочки. Затем использует секвенаторы (молекулярно-биологические приборы) — они помогают реконструировать последовательность символов в каждом кусочке. Секвенатор выдаёт набор прочитанных последовательностей — они и станут исходными данными для биоинформатики.
Артём Кулаков
архитектор специальных проектов red_mad_robot
Если совсем на мой рабоче-крестьянский уровень опуститься, секвенатор — это такой специальный биологический компьютер. Мы в него что-то капаем, а он нам на экране буковки показывает.
Кто попадает в биоинформатику — биологи или айтишники
Это наука на стыке двух областей — биологии и информатики. Поэтому в неё приходят программисты и биологи. Наш гость пришёл со стороны биологии. Поступил в СПбГУ на биофак, работал на кафедре, специализировался на генетике. Параллельно слушал онлайн-курсы по программированию, а потом узнал про биоинформатику.
В какой-то момент коллеги сказали: «Раз тебе это так интересно, то лучше просто получить дополнительное образование по биоинформатике». Так я и попал в Институт биоинформатики.
Почему недостаточно описательной биологии и где искать лекарство от рака
По словам Юрия, биоинформатика развивается очень активно, потому что для биологии и медицины уже недостаточно описательных исследований. Нужно проанализировать всё то, что человечество открыло за это время.
Практически всё, что можно было описать, уже описано. В последние 50 лет биология перешла на уровень, когда нужно не просто описать, как выглядит зверушка, где она обитает и что делает. Биология хочет знать, как это всё работает. Она пытается понять, как устроены живые организмы.
Исследования в биоинформатики — это дорого?
Необязательно. Прочитать геном одного человека стоит около тысячи долларов. Современные приборы позволяют читать геномы нескольких десятков человек. Но биоинформатика — это довольно хрупкая наука. Если «мокрый биолог» допустил ошибку в лаборатории или реагент изначально оказался некачественным, всё исследование нужно будет проводить заново. Из-за этого увеличится и бюджет, конечно же.
Многие исследования времязатратные. Ты долго-долго растил какую-то культуру раковых клеток и что-то с ними хотел сделать. А потом кто-нибудь пришел и не вытер ноги при входе в лабораторию или не надел халат правильно. Что-то попало в твою культуру, и всё сдохло.
О проблемах в профессии
#1 — колоссальные объёмы данных. Один прочитанный геном человека — это 100 гигабайт данных. Представьте, что вам нужно секвенировать сотни геномов.
В Великобритании люди пытаются отсеквенировать геномы всех новорожденных в течение кучи лет. Понятно, что это уже миллионы отдельных образцов, миллионы прочитанных геномов. И каждый, соответственно, по 100 гигабайт сырых данных. Это начинает уходить в космос по части объёма информации.
Данных уже так много, а найти эффективный метод для проверки гипотезы очень сложно. Учёные работали по-разному, получили разные результаты — и вся эта информация лежит в разных местах. Ну и как итог — собрать её из разных работ от разных людей очень непросто. Это может быть очень затратно и по времени, и по финансам.
#2 — биоинформатический софт. Некоторые часто используемые программы активно разрабатывают и улучшают, но они заточены под стандартные задачи.
С таким программами можно работать. Но если задача хотя бы чуть-чуть является нестандартной и люди пишут какие-то новые инструменты, разрабатывают новые алгоритмы для решения какой-то менее популярной задачи, получается софт в ужасном состоянии.
Например, вижу статью про «десять биоинформатических инструментов», которые помогают решить конкретную какую-то задачу. Наверное, восемь из десяти программ уже не работают. Потому что человек удалил свой репозиторий на GitHub или вообще залил софт на какой-то, прости господи, SourceForge, где он и погиб. Так что либо софта вообще нет, либо его невозможно скомпилировать без длительного и больного исправления всех багов, которые автор туда внёс.
Как обучиться на биоинформатика и где искать работу
Юрий подробно рассказал, чему обучаться, чтобы попасть в биоинформатику. Послушайте, начиная с 1:15:00. Если вкратце — обучение недорогое, но долгое. Предложений на рынке мало, но на крутых спецов спрос всегда есть. Нужно самому искать проекты и задачи, предлагать помощь и обрастать контактами.
Если прямо фокусироваться на том, чтобы войти в область полноценно и с перспективой, обучение потребует больших временных инвестиций. Но это вполне может стать парт-тайм работой на 20 часов в неделю минимум.
Полезные материалы
Онлайн-курсы на Stepik (для тех, кто не имеет бэкграунда в биологии):
Что такое мокрая биология
Колесо обозрения запись закреплена
От генной инженерии до «мокрой биологии»: подборка направлений
Биотехнология, генная инженерия, биоинформатика и многое другое, чем могут заниматься биологи. Хотите узнать об этом подробнее? Вот наш краткий гайд.
Полевая биология
Включает в себя все истинно натуралистские области, такие как зоология, ботаника, микология, экология и так далее. Работа по этому направлению часто требует выездов «в поле», полевые биологи отправляются в научные экспедиции для сбора и изучения материалов.
Лабораторная биология
Как вы уже могли догадаться, здесь — чисто лабораторные исследования, без экспедиций. В рамках лабораторной биологии можно специализироваться на генетике, молекулярной биологии, биохимии. Конечно, «лаба» и «поле» часто идут рука об руку, ведь для молекулярных исследований нужны материалы, а для материалов из экспедиций нужна обработка информации.
«Мокрая биология»
Эта сфера включает в себя «работу ручками»: взаимодействие с реактивами, подопытными животными, клеточными культурами и прочим.
«Сухая биология», или биоинформатика
Специалисты по биоинформатике работают на компьютере: они занимаются анализом экспериментальной информации, баз данных, пишут программы для научно-биологических целей, строят модели. «Сухая» и «мокрая» биология сосуществуют: нет эксперимента без анализа данных и нет данных без эксперимента.
Биотехнология
Цель биотехнологов — получение желаемого продукта для технологических нужд и в промышленных масштабах. Например, выращивание водорослей для добавления в спортивные продукты питания.
Генная инженерия
Здесь занимаются созданием генномодифицированных организмов (ГМО) и работой с ними. Нет, это не то, что вы подумали. Генная инженерия не создает химер, сверхумных динозавров и гибридов людей с пауками. В основном это небольшие точечные изменения в организмах, которые необходимы для исследований. Например, создание бактериального штамма, устойчивого к определенному агенту, или выведение грибных клеток, у которых флуоресцирует какой-нибудь мембранный белок. Еще ученые могут создавать новые сорта растений.
Биоэтика
Раздел, отвечающий за этическую составляющую исследований. Почему человека до сих пор не клонировали? Это запрещено международной биоэтической комиссии. Именно биоэтика уберегает нас от исследований на людях, жестокого обращения с лабораторными животными.
Биофизика
Смежная область науки, изучающая физическую составляющую биологических процессов.
Биомедицинская инженерия
Скорее инженерная область, чем биологическая. Тут занимаются конструированием медицинского оборудования.
Биохимия и молекулярная биология
Обе специализируются на молекулярных взаимодействиях и химических процессах, только первая больше занимается белками, а вторая — нуклеиновыми кислотами, то есть ДНК, генетикой и наследственностью.
Микробиология
Математическая биология
Ученые этого направления занимаются построением математических моделей и математическим описанием биологических процессов и явлений.
Биомедицина
Дисциплина, применяющая новые биологические открытия на практике, используется в медицине. Разработка новых препаратов и техник лечения, генная терапия и многое другое — вот что вас ждет в этой сфере.
Юрий Пеков. О биотехнологиях и популярных профессиях
– Чем занимается компания «Бластим»?
– Подбором персонала в области биотехнологий — биоинформатиков, менеджеров, «мокрых» биологов (о том, кто это такие, речь пойдет ниже — прим. сайта). Кроме того, у нас есть сайт с вакансиями для специалистов в этом сегменте, и мы проводим курсы по биоинформатике.
– Какое определение вы бы дали биотехнологиям?
– Я бы сказал, что это совокупность «мокрых» наук и биоинформатики. «Мокрые» науки — практические области, требующие наличия лаборатории, работы с реактивами, постановки экспериментов. Это биохимия, научная биология, биофизика, биоинженерия, молекулярная биология. А биоинформатику условно можно назвать теоретической областью, совокупностью методов, благодаря которым можно решать конкретные вопросы из области биологии. Например, расшифровывать информацию, которую выдают приборы-анализаторы, разрабатывать программы для предсказания структуры каких-либо веществ. Этот сегмент «завязан» с работой на компьютере, построением алгоритмов, анализом данных.
– Какие вузы готовят специалистов в области биоинформатики?
– Я бы выделил факультет биоинженерии и биоинформатики МГУ, а также магистратуру «Анализ данных в биологии и медицине» в НИУ Высшей школе экономики, над программой которой мы работали. Также образование в области биотехнологий можно получить на кафедре биоинформатики факультета биологической и медицинской физики МФТИ, магистерской программе «Биомедицинские науки и технологии» Сколковского института науки и технологий, кафедре биотехнологии фармацевтического факультета МГМУ им. И.М. Сеченова, кафедре биоинформатики медико-биологического факультета РНИМУ им. Н.И. Пирогова. В Санкт-Петербурге нужные знания для работы в области биотеха дадут на кафедре математических и информационных технологий СПбАУ РАН и кафедре прикладной математики Института прикладной математики и механики СПбПУ. Есть программы в регионах: специальность «Биоинженерия и биоинформатика» в химико-биологическом институте БФУ им. И. Канта (Калининград), кафедра биоинформатики факультета вычислительной математики и кибернетики ННГУ (Нижний Новгород), кафедра биоинформатики и медицинской кибернетики, Институт фундаментальной медицины и биологии КФУ (Казань), специальность «Биоинженерия и биоинформатика» на факультете биотехнологии и биологии МГУ им. Н.П. Огарева (Саранск), специальность «Биоинженерия и биоинформатика» кафедры биохимии и биотехнологии, технологический факультет ВГУИТ (Воронеж), кафедра биоинженерии и биоинформатики Института приоритетных технологий ВолГУ (Волгоград), специальность «Биоинженерия и биоинформатика», биологический факультет СГУ (Саратов), специальность «Биоинженерия и биоинформатика» в Институте биологии ТюмГУ (Тюмень), а также кафедра информационной биологии на факультете естественных наук НГУ (Новосибирск). Более подробно обо всех программах можно узнать на сайте «Бластим».
– А какие профессии в области биотехнологий сейчас самые востребованные?
– Нужны и менеджеры, и «мокрые» биологи, и биоинформатики. Весьма востребованы специалисты по секвенированию. Секвенирование следующего поколения — это перспективная технология, которая дает возможность «разглядеть», из каких нуклеотидов состоит ДНК, в каком порядке они расположены. Важно, что этот метод позволяет одновременно прочитать сразу несколько участков генома, что существенно ускоряет процесс и делает его более дешевым. Поскольку в геноме зашифрованы все особенности организма, секвенирование используют и в медицине, и в науке. Сейчас не хватает людей, которые могут делать этот анализ: подготавливать образцы, работать с оборудованием.
– Как стать таким специалистом, в чем нужно разбираться?
– В биохимии, генной инженерии, биологии — в целом, стандартных «мокрых» науках. И, конечно, нужен опыт работы с приборами. Всегда в цене хорошее фундаментальное образование в топовых университетах. Оно позволит впоследствии переквалифицироваться и уйти в эту область. После выпуска из университета молодой специалист может пойти работать в лабораторию — МГУ, Московского физико-технического института, Высшей школы экономики — шлифовать свои навыки и становиться профессионалом.
– А если человек хочет заниматься не фундаментальной наукой, а бизнесом, куда он может пойти работать?
– Специалисты по секвенированию нужны в фармацевтических компаниях (например, «Пептек», «Астеллас»), в таких центрах как «Евроген», Genotek, «Атлас» — там требуются люди, которые будут ставить эксперименты и анализировать полученные результаты. Технология развивается, дешевеет, и очевидно, что число компаний, которые занимаются этим, будет расти. Конечно, набравшись опыта, специалист по секвенированию может подняться по карьерной лестнице. Работающий в лаборатории — стать старшим научным сотрудником, затем — заведующим. Тот, кто трудится в компании, может быть старшим специалистом, начальником отдела, а после и всей лаборатории.
– А чем занимаются биоинформатики?
– Можно сказать, что тем же секвенированием, только со стороны информатики. Прибор выдает данные, и тут в дело вступают эти специалисты. Биоинформатики анализируют полученную информацию, интерпретируют ее, сравнивают с геномами, которые уже известны, находят мутации.
– Если подросток живет в небольшом городе, и у него нет возможности учиться на специализированном факультете, какое образование он может выбрать, чтобы стать биоинформатиком?
– Биоинформатика — это сближение биологии и информатики. В мое время в эту область приходили люди из биологии, сейчас же биологи чаще идут в биоинженерию, а биоинформатиками становятся математики, физики и программисты. Опыт показывает, что биологу сложно освоить программирование и погрузиться в глубины математики, проще программисту дать азы биологии. Поэтому лучше начать с бакалавриата по программированию или математике, а потом получить недостающие знания на курсах. К примеру, существуют школы биоинформатики с разными программами: для биологов, которым нужно наверстать программирование, и для программистов, которым не хватает знаний в биологии.
Компания «Бластим» также проводит курсы, но это — скорее возможность получить дополнительные знания для профессионала, который уже работает в данной области, но, к примеру, ни разу не сталкивался с секвенированием или с информацией, полученной благодаря этому анализу. Мы рассказываем о программах, в которых можно работать, методах и типах данных.
– Какой язык программирования стоит учить подростку, который хочет стать биоинформатиком?
– Python, но также не помешает и R. Python — универсальный язык, а R чаще используют для статистики. Не стоит забывать и о биологии — знание этого предмета пригодится в дальнейшем.
– Где обычно работают биоинформатики?
– В тех же лабораториях, где и «мокрые» биологи, в компаниях, где нужны информатики. Биоинформатиков сейчас немного, поэтому эти специалисты очень востребованы. А в будущем, с развитием технологий, станут нужны еще больше.
– Наличие каких личных качеств существенно облегчит жизнь биоинформатику?
– Нужно понимать, что это работа не столько с людьми, сколько с идеями, приборами и компьютерами. Поэтому стоит учитывать: если человек любит общаться, то делать это прямо на рабочем месте не получится. Еще, конечно, нужно не бояться работы с большим объемом информации.
– А кого из «мокрых» биологов чаще всего хотят получить работодатели?
– Весьма востребованы биохимики. Это специалисты, которые занимаются выделением и очисткой белка. К примеру, биохимик может культивировать клетки, в которые предварительно вставлен какой-либо белок. Затем этот белок выделяют, очищают, ну а дальше он может идти на различные нужды — на производство лекарств, пищевых ферментов. Такие специалисты нужны практически в любой компании, которая что-либо производит: и в фармацевтической, и в фирмах, занимающихся пищевой, легкой или аграрной промышленностью. И, конечно, в биохимиках заинтересованы лаборатории, которые ищут и исследуют новые вещества, лекарства, работают с клетками.
– А как человек, решивший, что он хочет быть биохимиком, может реализовать свою мечту? Какие предметы нужно учить?
– Еще в школе нужно учить химию и биологию, а затем поступить на кафедру биохимии, которая может быть как на биологическом, так и на химическом факультете. Сейчас существует множество вузов, выпускающих биохимиков.
– Может ли школьник заранее понять, что ему понравится работать в сегменте биотехнологий? Как, проучившись четыре года в бакалавриате, не разочароваться в профессии и не жалеть о потерянном времени?
– В идеале интересующимся биотехнологиями подросткам с 9-го класса полезно регулярно ходить в лаборатории. Ведь студенты пишут курсовые и в процессе опробуют будущую работу, а дети лишены такой возможности и поэтому школьнику сложно быть уверенным, что выбранная специальность действительно будет ему по душе. К счастью, некоторые лаборатории устраивают экскурсии, на которых можно познакомиться с практической стороной будущей специальности. Прекрасные летние школы, где старшеклассники могут узнать о биотехнологиях от ведущих специалистов, проводит Zimin Foundation (Школа молекулярной и теоретической биологии — прим. сайта). Школы проходят в Испании, но, если у родителей есть возможность, непременно стоит отправить туда ребенка.
– Сколько получают люди, работающие в сегменте биотехнологий?
– На стартовых позициях — 50–60 тысяч. Немного — и именно поэтому так важно, чтобы это занятие приносило удовольствие, тогда будет желание идти на работу. Зарплата растет вместе с опытом, и у профессионалов, занимающих высокие руководящие должности, занимающихся инновационными разработками, обучающих других, она может достигать двухсот тысяч и больше.
– Как вы думаете, какое будущее ждет биотехнологии? Будут ли востребованы перечисленные вами специалисты через пару десятков лет?
– Это зависит от развития технологий, которое довольно трудно предсказать. Вероятно, секвенирование генома будет продолжать пользоваться спросом, ведь в будущем оно станет гораздо более дешевым и доступным. Еще одна перспективная область, которая продолжит развиваться и вскоре выйдет на новый уровень — редактирование генома. Эта технология появилась года 2–3 назад в лабораториях и пока что в них и остается, но, если все пойдет по плану, она позволит изменять геномы людей. Метод можно будет использовать для профилактики и терапии многих наследственных заболеваний. Вероятно, удастся лечить и некоторые «старческие» болезни. В теории больному диабетом можно будет вставить ген, производящий инсулин, и тем самым вылечить его. Фантазировать можно до бесконечности. Пока это не реализовано, но понятно, как это можно сделать. Но, конечно, помимо излечения с помощью редактирования генома, человечество по-прежнему будет нуждаться в новых лекарствах, 3D-печати органов. Есть вероятность, что технология 3D-печати будет использоваться не только в медицине, но и в пищевой промышленности. Как знать, возможно, напечатать стейк в итоге окажется дешевле, чем вырастить корову.
– В какую область может уйти биотехнолог, который захочет попробовать себя в чем-то новом?
– Уйти в менеджеры — это универсальный способ. Причем, менеджером можно работать в той же компании, где до этого человек трудился, предположим, биохимиком. Он уже разбирается в отрасли, и ему будет гораздо легче, чем человеку «со стороны». Это продавая черепицу, можно быстро начать ориентироваться в продукции. В области медицины и биологии все не так просто, поэтому в менеджеры предпочитают брать людей с профильным образованием.
Если биоинформатик хорош в программировании, он может уйти в эту область или стать аналитиком данных. Причем, это не обязательно должно быть связано с медициной и биологией. Он запросто может оперировать банковскими данными.
Также всегда можно остаться в своей профессии, но уйти в другую область. К примеру, человек, работавший в пищевой промышленности, может податься в науку. И наоборот.
– Какие фильмы вы можете посоветовать посмотреть людям, интересующимся биотехнологиями?
– «Гаттаку». Это, скорее, фильм не о самих биотехнологиях, а о последствиях их использования, но, как мне кажется, такое будущее вполне возможно. Я думаю, рано или поздно все люди будут генномодифицированными, за исключением ярых противников этой технологии. Ситуация будет аналогична вакцинации в современном мире. Мы все привиты, но существуют отдельные люди, которые не вакцинированы сами и отказываются прививать своих детей. В принципе, это хорошо. Эволюцию двигают случайные мутации, изменения и естественный отбор. Возможно, некое меньшинство, чем-то отличающееся от других, в настоящий момент живет хуже, потому что условия среды для него не подходят. Однако рано или поздно условия изменятся, большинство окажется неприспособленным и вымрет, а это меньшинство, напротив, станет процветать. Поэтому пускай люди имеют разное образование, думают по-разному, отличаются друг от друга. Общество должно быть разношерстным — это повышает его выживаемость.