Биоинформатика: «закодированная» жизнь
21 августа 2018
http://www.sbras.info/articles/sciencestruct/bioinformatika-zakodirovannaya-zhizn
В Новосибирске открылась XI интернациональная конференция «Биоинформатика и регуляция структуры геномов». Приближение к пониманию генетических механизмов старения и разгадки процессов мышления, электронные поликлиники, автоматизированное земледелие, «скоростная» селекция новых сортов сельскохозяйственных растений — так будут выглядеть плоды союза точных и естественных наук.
«За последние 20 лет в науках о жизни произошла и методическая, и концептуальная революция, связанная с появлением высокоэффективных методов расшифровки геномов. На уровне генов кодируется информация, обеспечивающая формирование всех характеристик организмов, включая те, которые нужны для развития и взаимодействия с окружающей средой и контроля процессов воспроизведения жизни. Фактически биоинформатика стала интегративной наукой, так как какие бы данные, касающиеся живых систем, мы не получали, они должны быть спроецированы на гены, и от этого уровня необходимо подняться вверх до фенотипических признаков, — рассказывает директор ФИЦ «Институт цитологии и генетики СО РАН академик Николай Александрович Колчанов. — Мы гордимся тем, что наш институт и Новосибирский государственный университет стояли у основания мировой биоинформатики, они ещё в 1968 году осознали важность математической биологии, из которой выросла эта наука. Подход, связанный с интеграцией биоинофрматики и системной биологии, — это тоже в сильной степени достижение нашей научной школы».
Задачи биоинформатики: компьютерный анализ геномной ДНК, изучение работы экспрессии генов, интерпретация больших объёмов генетических данных. Первая конференция по биоинформатике состоялась в Новосибирске в 1998 году. Теперь, 20 лет спустя, здесь собралось 890 участников из 33 стран, они прочитают около 300 лекций и сделают около 300 постерных сообщений.
Эта конференция является мультконференцией — здесь рассматриваются проблемы математики и супервычислений, связанные с биоинформатикой и системной биологией, проблемы медицинских и сельскохозяйственных наук, когнитивных процессов (принятия решений и распознавания ситуации). Также будут подниматься вопросы собственно биоинформатики и системной биологии и их интеграционных междисциплинарных взаимодействии с другими науками о жизни и о Земле.
Селекция машин
Большое внимание на конференции будет уделено генетике растений. Сегодня прочитать геном отдельного растения можно дешево и быстро (буквально недавно был расшифрован геном пшеницы, ИЦиГ СО РАН принимал а этом немалое участие). Теперь исследователей интересует взаимосвязь между генами и фенотипическими признаками растений, такими как устойчивость к засухе, заболеваниям, высокая продуктивность. Чтобы их сопоставить, селекционеру нужно вручную, с блокнотиком исследовать сотни тысяч растений и проанализировать огромные наборы данных.
«Смысл направления, в котором мы работаем и которое мы развиваем в институте и университете, — это попытка автоматизировать процесс сбора данных по характеристикам растений. Чтобы можно было за разумное время разумным количеством человек собрать информацию о характеристиках, форме, размере тысяч и тысяч растений, их устойчивости к заболеваниям и использовать эту информацию для сопоставления и изучения мутаций», — говорит заведующий лабораторией эволюционной биоинформатики и теоретической генетики ИЦиГ СО РАН кандидат биологических наук Дмитрий Аркадьевич Афонников.
Подразумеваются, в первую очередь, технологии, основанные на обработке цифровых изображений и базах данных. Например, автоматические теплицы, в которых «сам собой» осуществляется процесс измерения характеристик растений. Представьте: к ростку подъезжает цифровая камера, фотографирует, получает трехмерный образ, отправляет его в программу, где сразу «выстраивается» динамика роста и показываются другие изменения. Фактически селекционеру не нужно ходить в теплицу, за него это делает специальная программа.
Второе направление — анализ спутниковых данных, когда с помощью спутников или беспилотников можно будет анализировать посевы на устойчивость к заболеваниям. А третье — это использование мобильных устройств, при помощи которых в поле, минуя записи в бумажных полевых дневниках, исследователи сразу будут заносить информацию в программу.
Такие технологии сегодня уже активно развиваются за рубежом. С сентября этого учебного года на факультете информационных технологий НГУ начинает работать кафедра биоинформатики, где будут готовить специалистов по анализу геномов и фенотипических признаков изображений.
«В итоге мы сможем выводить новые сорта, устойчивые к заболеваниям и имеющие высокую продуктивность. Кроме того, эти технологии сильно изменят проведение научного процесса в сельском хозяйстве: резко повысится эффективность анализа данных. Уже собранная информация по фенотипам и характеристикам растений будет внесена в базы данных, и можно будет автоматизировать процесс определения генов, которые отвечают за тот или иной признак», — отмечает Дмитрий Афонников.
Электронный доктор
Другое крупное направление — медицина. Прежде всего фундаментальная и диагностическая, а также генетический анализ социально значимых заболеваний, в том числе и болезней психики, проблемы моделирования этих заболеваний на животных.
Например, разработанная в ИЦиГ СО РАН и Институте математики имени С. Л. Соболева программа «Gene Discovery» позволяет предложить подходы, основанные на анализе закономерностей.
«Природа настолько разнообразна, что найти строгие закономерности очень сложно. Мы должны быть беспристрастными, а для этого необходимо перебирать огромное количество вариантов взаимосвязи, оценивая их достоверность. Этот подход является абсолютно оригинальным, и аналогов у него нет», — говорит Николай Колчанов.
Другие работы ИЦиГ СО РАН направлены на исследование того, как происходит процесс принятия решений. Проводятся работы, направленные на одновременное изучение электрофизиологических характеристики мозга и генетических особенностей пациентов. «Чтобы вы понимали, насколько это сложно: существует порядка 200 систем, контролирующих функционирование мозга и нервной системы, и около 2000 генов, которые завязаны на эти процессы», — отмечает академик Колчанов.
«Сейчас почти все данные в медицине (особенно диагностические) — это фактически большие данные. То есть любая рентгенограмма является не картинкой, а набором больших данных. Также лабораторные исследования — если ещё 20—30 лет назад все анализы умещались буквально на одной страничке, там было порядка 15—20 показателей, то сейчас реестр данных в фирмах, которые занимаются лабораторными исследованиями, занимает толстый прайс-лист, несколько десятков страниц, где представлено несколько сотен технологий», — рассказывает руководитель Научно-исследовательского института клинической и экспериментальной лимфологии — филиала ИЦиГ СО РАН доктор медицинских наук Андрей Юрьевич Летягин.
Для каждого человека количество этих данных из года в год увеличивается. Например, раньше электрокардиограмму у пациента снимали нередко лишь один раз в жизни, а сегодня уже существуют умные девайсы, сделанные в виде часов, которые будут делать ЭКГ практически постоянно и отсылать эти результаты на пункт расшифровки. Если человеку угрожает опасность наступления внезапной смерти, по этим кардиограммам специалисты могут поставить диагноз сразу и оказать помощь заранее — например, вызвать бригаду скорой помощи. Такие электронные поликлиники уже работают в Москве, они «ведут» пациентов с риском наступления внезапной смерти, и отслеживают пульсовые характеристики и ЭКГ на расстоянии.
«Эти программы заменяют не терапевта, а некоторые его функции. Конечно, врач может сесть и просмотреть эти 20 тысяч электрокардиограмм, но это займет у него слишком много времени, и он может не успеть спасти пациента. Здесь стоит вопрос, с какой скоростью всё это будет делаться, и анализ должен осуществляться в масштабе реального времени, чтобы скорая помощь успела доехать до человека», — говорит Андрей Летягин.
Диана Хомякова
Фото Екатерины Пустоляковой (1), Юлии Поздняковой (2), с сайта pixabay.com (анонс)