В РАН обсудили проблемы цифровизации науки
3 октября в здании президиума Российской академии наук (РАН) прошел II Форум Digital Science «Цифровая наука – мировые тренды и «большие данные» в российском контексте». Главными спикерами форума стали вице-президент РАН академик Алексей Хохлов, заместитель министра науки и высшего образования РФ Марина Боровская и генеральный директор Digital Science в России Игорь Осипов.
Форум открылся приветственным словом вице-президента РАН Алексея Хохлова. В своем выступлении он отметил, что в последние годы мы активно говорим о цифровой экономике и цифровом сервисе и о том, как цифровизация изменила и продолжает изменять жизнь людей. Важно понимать, что первой областью, которая подверглась сильнейшему влиянию цифровизации, была именно наука.
Хохлов напомнил, как это было в семидесятые годы: ученые писали свои статьи аккуратным, почти каллиграфическим почерком, чтобы передать их машинисткам на перепечатку. Затем приходилось проверять набранный машинисткой текст на предмет научных ошибок — все это занимало очень много времени. Сегодня же это можно сделать в считанные минуты, а затем сразу же отправить своим коллегам-ученым в любую точку мира, от соседнего города до далеких материков.
Это меняет и характер публикации в журналах. Опубликовать статью сегодня совершенно не сложно в сравнении с прошлыми годами — всю необходимую информацию можно запросить в Интернете за считанные секунды. Изменился и характер проведения научных конференций: если раньше ученым было принципиально встретиться лицом к лицу и пообщаться с глазу на глаз, то сегодня это не так важно, а принять участие в конференции можно не выходя из дома. Научные конференции тоже перешли в онлайн формат. цифровые методы проникают и в оценку деятельности ученых.
Но вместе с удобством и ускорением возможности передачи и обмена информацией появились и особые проблемы в digital-среде, решением которых и занимается компания Digital Science. Российская академия наук активно сотрудничает с ней и, по словам Хохлова, это сотрудничество протекает очень продуктивно. Поэтому РАН планирует сотрудничать с Digital Science и в будущем.
Заместитель министра науки и высшего образования РФ Марина Боровская также отметила, что в последние годы цифровизация серьезно изменила жизнь людей. В частности, значительно ускорился процесс обмена и передачи информации, а также ее хранения. Боровская напомнила, как ученые носили большие папки со своими статьями и научными результатами с собой — сегодня же у них есть возможность создать собственное "облако" и иметь доступ к своим научным трудам в любом месте и в любое время.
В связи с этим, Марина Боровская видит необходимость создания электронного доступа к таким коллекциям научных статей и монографий для всех ученых и исследователей во всем мире. "Не только статья и публикация важна в качестве оцифрованной истории, гораздо важнее доступ к коллекциям, которые помогают нам строить исследования в любой области науки", — сказала Боровская. Организовав электронный доступ к этим каталогам для наших партнеров, мы облегчим и ускорим наше сотрудничество и взаимодействие. Создание и укрупнение доступного интеллектуального потенциала — одна из главных целей современной науки.
Генеральный директор Digital Science в России Игорь Осипов рассказал о современной экосистеме науки. По его мнению, она обусловлена фундаментальным расширением типов данных и скоростью работы с ними. Существует несколько этапов научной работы, через которые проходит каждый ученый: первый этап занимает от одного до пяти лет и включает в себя получение грантов, научные исследования, конференции, и как результат — публикацию статьи. Затем начинается второй этап, в который входит обсуждение статьи ученого в Интернете, цитирование статьи другими учеными, клинические исследования, получение патентов и оформление документации. Второй этап, как результат первого, занимает многие годы.
Роман Гуринович рассказал о развитии технологий мега "big-data" в науке. Он отметил, что доступных статей, например, по биомедицине — бесчисленное множество. Но на самом деле, когда мы начинаем искать подробное описание отдельного процесса, вплоть до молекулярного уровня, мы не находим ни одной подходящей статьи. Проблема состоит в том, что то самое бесчисленное множество научных статей никак не связано между собой в том смысле, что между ними нет никакой цепочки.
Зачастую многие научные материалы написаны естественным, а потому неструктурированным языком, который не воспринимается машинами. Решением этой проблемы могут стать специальные программы, которые преобразуют естественный неструктурированный язык в машиночитаемый. Соответственно, машина начинает общаться с ученым на преобразованном, понятном ей языке, и потому с легкостью выдает ему всю необходимую научную информацию.
Заместитель директора ФИАН им. Лебедева РАН, эксперт цифровых платформ Олег Иванов