НАУКА И ОБЩЕСТВО
2004.02.001. ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ В НАУЧНЫХ И ИНЖЕНЕРНЫХ ИССЛЕДОВАНИЯХ.
IT and 8&Е science and engineering indicators. - 2002. - Chap.8. - Р.23-29 // http://www.nsf.gov/sbe/srs/seind02/intro.htm.
Ключевые слова: информационные технологии, научно-
исследовательская деятельность, компьютерное моделирование, научные коммуникации, виртуальные лаборатории, электронные библиотеки, электронные журналы, электронные архивы.
Реферируемый материал - один из разделов доклада «Индикаторы науки и техники», который президент США раз в два года представляет конгрессу. В нем отражены последние данные о состоянии науки США, системы образования и положении наукоемкой промышленности на мировом рынке. Отдельная глава доклада посвящена информационным технологиям (ИТ), в частности их роли в научных исследованиях.
Создатели ИТ - ученые и инженеры - являются самыми первыми и активными пользователями собственного изобретения, которое, в свою очередь, играет революционизирующую роль в развитии научнотехнической сферы. ИТ оказывают огромное влияние на все стороны ее жизнедеятельности: на сбор и использование информации, на то, как проводится исследование, как создаются новые виды продукции и технологических процессов, как происходит обмен научно-технической информацией. Специальных исследований, изучающих влияние ИТ на сферу исследований и разработок (ИР), немного. Задачей раздела является обобщение материалов по данной теме, появившихся в последние годы.
ИТ и ИР. ИТ дали в руки исследователей и инженеров новые мощные инструменты для моделирования процессов и изделий, а также для симуляции их поведения в самых разных условиях. Благодаря ИТ
стало возможным собирать, хранить и делать доступными для всех огромные массивы данных. Научное знание сегодня хранится и распространяется совсем не так, как 100 или даже 50 лет назад. Современные ИТ позволяют совместно использовать вычислительные ресурсы и уникальные исследовательские инструменты людям, находящимся в удаленных друг от друга местах, а также дают возможность вести коллективные исследования очень большим группам специалистов. Прогресс как аппаратного, так и программного обеспечения постоянно поддерживают новые методики ИР, которые позволяют науке охватить новые, более глубокие проблемы. Программное обеспечение сыграло решающую роль в создании суперкомпьютеров, использующих тысячи микропроцессоров, в разработке систем безопасности, защиты от несанкционированного проникновения, в управлении рассредоточенными информационными массивами и т. д.
В разных областях ИР роль ИТ неодинакова: например, физика высоких энергий, динамика жидких сред, аэронавтика, исследования атмосферы и климата давно уже немыслимы без использования мощных вычислительных систем. Возможность собрать, обработать крупный объем данных, организовать обмен ими играет важную роль в астрономии, изучении геосферы и биосферы. Сравнительно недавно вычислительная техника стала широко и активно использоваться и в общественных и гуманитарных науках. В биологии за последние 10-15 лет она стала жизненно необходимой, хотя до этого почти не применялась.
Особенно эффективным современным инструментом ИР является компьютерное моделирование и симуляция сложных процессов и систем. Виртуальные эксперименты заменяют реальные в тех случаях, когда последние по каким-либо причинам невозможны или нерациональны: например, моделирование климатических процессов для предсказания погоды, виртуальные эксперименты с плазмой, моделирование молекулярных биологических структур, виртуальное материаловедение, физика высоких энергий, космология, взрывы, в том числе ядерные. Важную роль играет новая техника в наглядной визуализации результатов подобных экспериментов в доступной для оценки специалистами форме. Компьютерная симуляция широко используется также при конструировании и виртуальных испытаниях автомобилей, самолетов и других машин и механизмов на прочность и технологичность в изготовлении, при проверке эргономики, безопасности, удобства обслуживания. Это позволяет
обойтись без изготовления пробных макетов и их переделки, экономит время, материалы и деньги.
В последнее десятилетие наблюдается стремительный прогресс компьютерной техники, предназначенной для выполнения такого рода экспериментов. Так, Министерство энергетики США в рамках программы «Проект ускоренного развития стратегических вычислений» (Accelerated strategic computing initiative) уже в декабре 1996 г. ввело в строй первый компьютер с быстродействием 1 трлн. операций в сек. (1 тера/сек.). В июне 2000 г. заработал компьютер с быстродействием 12,6 тераоп/сек., а к 2005 г. предполагается запустить машину, выполняющую 100 тераоп/сек., имеющую 50 терабайт памяти и архив емкостью 130 петабайт1. Исследования, финансируемые Агентством перспективных проектов Минобороны, НАСА и Национальным агентством безопасности, направлены на оценку технической возможности создания ЭВМ мощностью 1015 операций в сек. (1 петафло/сек.).
Машины такой мощности будут использоваться в генетике, например, при исследовании трехмерной атомной структуры и динамического поведения продукции генов, функций конкретных генов и их последовательностей, насчитывающих тысячи единиц; при моделировании климата, мировой финансовой системы; при моделировании авиакосмических аппаратов и новых типов автомобилей; при разработке новых лекарственных препаратов. Фирма «Celera genomics corporation», лидер в области геномики и протеомики2, в содружестве с корпорацией «Compaq» и Сандийской национальной лабораторией разрабатывают специальное программное обеспечение для суперкомпьютеров с быстродействием в пределах от 100 тераоп до 1 петафлоп/сек. (с.8-24).
Еще одно направление применения ИТ в исследовательской работе - это создание и использование крупных баз данных, причем в последние годы многие из них стали общедоступны через Интернет. Примерами такого рода баз могут служить мировой Банк белковых структур (Protein data bank), Банк данных об экспериментах в условиях микрогравитации Европейского космического агентства (ESA microgravity database), Банк результатов мониторинга поверхности Земли, полученных с помощью искусственных спутников Земли за последние 40 лет (The earth resources observation systems data center), Банк данных о цунами. Последний содер-
1 Tera и peta - приставки, используемые для обозначения величин, кратных соответственно 1012 и 1015.
2 Протеомика - исследование и конструирование белковых структур.
жит информацию о цунами, происходивших с 49 г. до н.э. и до сегодняшнего дня в Средиземном и Карибском морях, в Атлантическом, Индийском и Тихом океанах.
Огромную роль играют ИТ в организации новых форм современных научных коммуникаций на основе Интернета и Всемирной паутины. Существуют по крайней мере пять видов таких коммуникаций: электронные журналы (пакет отредактированных статей, распространяемый в электронной форме); гибридные журналы (отрецензированные статьи, журналы как в электронной, так и в бумажной печатной форме); электронные препринты (серверы, на которых авторы размещают свои материалы в форме препринтов); электронные нерецензируемые публикации в виде листков новостей, статей, рабочих документов; персональные страницы в сети. Об интенсивности подобного рода коммуникаций можно судить на примере лосанджелесского сервера препринтов, начало которому было положено в 1991 г. физиком П.Джинспаргом (в1шра^). В 2001 г. на сервер ежемесячно поступало более 2,5 тыс. новых материалов из разных областей физики, астрономии и математики, и ежедневно регистрировалось в среднем 100 тыс. обращений (поиск, чтение, размещение). В некоторых разделах физики сервер стал основной формой общения специалистов. Сегодня в разных районах мира функционируют 17 зеркальных сайтов для более легкого доступа к интересующим материалам. Правда, такой вид общения популярен главным образом среди физиков. Среди молекулярных биологов, к примеру, традиционно обмен препринтами происходит только в рамках небольших групп: они по-прежнему предпочитают печатные журналы. Медики считают практику публикации нерецензированных материалов просто опасной: ими может воспользоваться кто угодно, в том числе и неспециалисты. Не являются популярными электронные серверы у океанографов, климатологов и специалистов по исследованию атмосферы. Что же касается электронных журналов, публикующих отрецензированные и отредактированные статьи и являющихся чаще всего электронной версией обычного печатного журнала или дополнением к нему, то их число довольно быстро увеличивается. Справочник, изданный в 2000 г. Ассоциацией исследовательских библиотек, насчитывает 3915 таких журналов, тогда как в 1997 г. их было 1049 (с. 26).
Электронная периодика и электронные информационные коммуникации имеют целый ряд преимуществ. Найти с их помощью нужную информацию гораздо легче, не нужно беспокоиться и по поводу отсутст-
вия какого-нибудь номера журнала в библиотеке. Кроме того, объем электронных журналов не ограничен, в нем возможно мультимедийное представление материалов. Можно вместе со статьей поместить программу, обогащая таким образом материал и облегчая дальнейшую работу с ним. Любой документ может быть дополнен комментариями читателей, электронная почта позволяет вступить в контакт с автором. В конечном счете электронные коммуникации ускоряют распространение научной информации и тем самым повышают производительность научного труда. Однако здесь есть один «подводный камень»: быстро переориентируясь на новые направления, боясь отстать, специалист рискует слишком рано отказаться от других путей, не исчерпав их возможностей, и, не исключено, потерять что-то ценное.
Заметно выигрывают от электронизации библиотеки: они могут обслужить большее количество читателей, которые находясь дома или в офисе, могут получить доступ к нужной им информации. Электронные архивы занимают во много раз меньше места, чем комплекты журналов, доступ к ним через Интернет возможен из любого уголка мира. А некоторые издательства объявили, что медицинскими электронными журналами студенты-медики, сотрудники исследовательских лабораторий и правительственных медицинских учреждений могут пользоваться бесплатно.
Все перечисленные выше особенности информации в электронной форме способствуют все более широкому ее распространению. Однако остается ряд моментов, которые в какой-то мере препятствуют этому. Во-первых, электронные публикации типа препринтов не могут полностью заменить публикации в солидных научных журналах, в которых ведется большая кропотливая работа: каждую статью рецензируют, возможно, даже неоднократно, редактируют; «слабый» материал не публикуют; подбирают и помещают вместе статьи, близкие по тематике. Университеты и фирмы, нанимая научных сотрудников на работу или рассматривая вопрос о повышении их по службе, принимают такие публикации во внимание. Препринты такого контроля не проходят и соответственно не столь авторитетны. Во-вторых, существуют экономические препятствия. Это касается электронных журналов, осуществляющих рецензирование и редактирование. Именно на эти «операции» расходуются основные средства и в обычном, и в электронном журнале; но в последнем - нужны дополнительные расходы на специальную технику и на форматирование рукописи для электронной публикации. Еще одна экономическая про-
блема связана с тем, что могут пострадать издатели. Если они предоставляют лицензию на свой сайт университетской библиотеке, то журнал в электронном виде становится доступен любому, кто пользуется компьютерной сетью кампуса. Соответственно могут сократиться число индивидуальных подписчиков и доходы издательства. Кроме того, те же рекламодатели предпочитают печатные журналы электронным. В настоящее время издатели ищут варианты ценовой политики, которые исключили бы потери. Вариантов испытывается много. Одни проводят подписку на электронную и на печатную версии раздельно, причем первая может быть дороже или дешевле второй. Другие распространяют электронные версии как бесплатное приложение к печатной. Третьи издают в электронной форме только некоторые статьи, рассматривая это как рекламу печатного издания. Единой унифицированной практики нет. Обычно все же электронные журналы защищены от неавторизованного проникновения паролями или иными применяемыми в сети Интернет способами. В-третьих, весьма непросто поддерживать электронные архивы. Со временем электронные носители портятся, деградируют, меняются электронные форматы. До сих пор не найдено технического решения этих проблем. Известно также, что электронный текст легко подправить, слегка изменить, осовременить. В связи с этим возникает ряд вопросов. Допустима ли правка или надо хранить оригинал без всяких изменений? Надо ли хранить журнал или газету в полном виде или достаточно создать базу данных из отдельных статей, так что их можно будет находить и извлекать, в индивидуальном порядке, но восстановить газету в таком виде, как она выходила в свет, будет уже невозможно? Неясно также, какие организации должны нести ответственность за длительное хранение периодики - издательства или библиотеки? Как быть с охраной авторских прав? Словом, в области издания, хранения и использования печатной информации в электронном формате остается много вопросов, до конца не решенных.
Еще одна область интенсивного использования ИТ в научной деятельности - это сотрудничество, коллективные ИР, при которых члены исследовательского коллектива территориально разбросаны и объединяются с помощью компьютерной сети и электронной почты. Такого рода сотрудничество развивается в целом ряде областей науки вследствие сложности исследуемых проблем, а также потому, что финансирующие ИР учреждения поощряют такие формы организации работ, охотно поддерживают «команды» специалистов разных дисциплин, изучающих
проблему комплексно, с разных углов зрения. Наглядным показателем расширения такого рода сотрудничества является рост числа совместных публикаций ученых из разных организаций или разных стран. С 1986 по 1997 г. число статей, подготовленных совместно представителями десяти и более организаций, выросло с 40 до 375, т.е. почти в 10 раз, а десяти и более стран - с 12 до 165 (с.28).
За последнее десятилетие создан целый ряд сложных программных продуктов, поддерживающих виртуальные лаборатории. Сегодня через Интернет возможно коллективное использование крупных исследовательских установок типа синхротрона, как если бы несколько таких установок находились в разных местах и были объединены в одну сеть; возможны видеоконференции, коллективный доступ к базам данных, к компьютерным моделям, к так называемым «белым доскам», на которых каждый участник обсуждения может «набрасывать» свои соображения и т.д. Уже появился специальный термин «коллаборатория» (collaboratory), обозначающий коллектив, географически разобщенный, но связанный воедино с помощью ИТ. Пилотные проекты таких исследований финансировались национальным научным фондом (ННФ), Министерством энергетики США, другими ведомствами. В настоящее время пилотная стадия уже пройдена, и многие финансируемые федеральным правительством крупные исследовательские проекты имеют «коллабораторную составляющую». Примерами таких проектов могут служить: проект исследования мозга человека, финансируемый Национальными институтами здоровья, в котором участвуют несколько университетов и госпиталей; проект моделирования и симуляции землетрясений, финансируемый ННФ, виртуально объединяющий около 20 экспериментальных установок ряда университетов и государственных лабораторий (вибростолы, центрифуги, бассейн для искусственного цунами, полевые модельные системы, станции наблюдения за сейсмической активностью); проект распределенной вычислительной суперсистемы (Distributed terascale facility), способной выполнять до 11,6 трлн. операций в сек. и имеющей память емкостью 450 трлн. байт, которая объединит суперкомпьютерные центры в Иллинойсе и Калифорнии, Аргонскую национальную лабораторию около Чикаго и Калифорнийский технологический институт в Пасадене.
Несмотря на бесспорный успех таких проектов, некоторые исследователи сомневаются в том, что коллаборатории, использующие ИТ, могут стать полными аналогами коллективов, в которых сотрудники об-
щаются лицом к лицу. Они считают, что заменить богатство оттенков такого общения техническими средствами невозможно. Косвенным подтверждением этому может служить тот факт, что такая форма сотрудничества распространяется гораздо медленнее, чем другие основанные на Интернете формы. «Практика и рутина групповых исследований предусматривают наличие общего физического пространства, и перевод привычных приемов в пространство виртуальное может оказаться трудным» (с. 29). Наиболее выгодной коллаборатория может стать для аспирантов и ученых, не входящих в элитную категорию, т.е. тех, кто по экономическим причинам не может позволить себе много путешествовать. Для ведущих специалистов распространение такого вида ИР может создать трудности, связанные с одновременным участием в нескольких проектах. Так или иначе, появление коллаборатории ставит перед организаторами науки и науковедами ряд вопросов. Станет ли эта форма нормой для крупномасштабных исследований, осуществляемых силами нескольких организаций? Будут ли такие исследования более открытыми, чем сегодня, для неэлитарных слоев научных работников? Как повлияет внедрение основанных на ИТ коллабораторий на продуктивность ИР? Ответов на эти вопросы, основанных на серьезном фактическом материале, пока нет.
А.Н.Авдулов