Научная статья на тему 'Идентификация авторов и персональные данные в электронно-библиотечных системах'

Идентификация авторов и персональные данные в электронно-библиотечных системах Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
438
77
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
АВТОРИТЕТНЫЕ ДАННЫЕ / ИДЕНТИФИКАЦИЯ АВТОРА / ПЕРСОНАЛЬНЫЕ ДАННЫЕ / ЭЛЕКТРОННЫЕ КОЛЛЕКЦИИ / СЕМАНТИЧЕСКИЙ WEB

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Стрелкова Елена Валентиновна

Рассмотрены некоторые вопросы развития электронных каталогов и национальной системы авторитетных файлов в инновационной деятельности библиотек: цитируемость авторов, проект РИНЦ и альтернативная графика в библиографических записях; электронные коллекции в пространстве библиотечных ресурсов и мемориальные объекты в системе источников краеведческого характера. Изложены проблемы формирования полнотекстовых ресурсов на текущей стадии развития Интернет-пространства.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Стрелкова Елена Валентиновна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The article is dedicatedto certain issues of development of electronic library indexes andthe nationalsystem of authority files within the innovation activity of libraries: the citation rate of authors, Russian Scientific Citation Index andalternative graphics for bibliographic notes; institutionalrepository for the scope of library resources andmemorialobjects in the system of regionalnaturalhistory sources. The issues of arranging full-text sources at the current stage of cyberspace development are set forth

Текст научной работы на тему «Идентификация авторов и персональные данные в электронно-библиотечных системах»

Информационные и телекоммуникационные технологии в образовании

УДК 004. 658: 025. 347

Е.В. Стрелкова

ИДЕНТИФИКАЦИЯ АВТОРОВ И ПЕРСОНАЛЬНЫЕ ДАННЫЕ В ЭЛЕКТРОННО-БИБЛИОТЕЧНЫХ СИСТЕМАХ

Электронные ресурсы библиотек, интегрированные системой лингвистического обеспечения и сервисами телекоммуникационных каналов связи, служат для специалистов отрасли средством предоставления услуг и выпуска библиотечной продукции. Основу этой деятельности составляет работа по ведению двух типов электронных каталогов. В первом случае обеспечивается поиск информации о содержании библиотечных фондов и условиях доступа к единицам хранения, во втором - каталоги дают возможность перехода (по результатам успешного поиска) от библиографической записи (БЗ) к содержанию источника: каталоги для поиска, или каталоги для поиска и управления доступом.

Дополнительно настройками пользовательского интерфейса и качеством записей определяется круг фактографической, адресной и справочной информации, предоставляемой читателю в автоматизированном режиме.

Основанием для достоверности и актуальности библиографической информации служит авторитетная работа, по ее результатам формируются авторитетные данные - часть справочного аппарата лингвистического обеспечения. Их объединяет использование:

кодированной информации (в системе форматов машиночитаемой каталогизации);

общероссийских справочных ресурсов; системы авторитетных/нормативных файлов (национальных, отраслевых, локальных).

Авторитетный файл - совокупность авторитетных, ссылочных и справочных записей, в которых представлена необходимая информация о точках доступа библиографической записи.

В модели функциональных требований к библиографическим записям (FRBR - Functional Requirements for Bibliographic Records) и авторитетным данным (FRAD - Functional Requirements for Authority Data) лицо, род и организация составляют вторую, а концепция, предмет, событие и место - третью группу объектов по отношению к произведению (его выражению, воплощению, физической единице или экземпляру). Любой из этих объектов может иметь предметные связи с произведением. В единой электронной среде нормализованные формы имен индивидуальных авторов, персоналий, имен коллективных авторов, унифицированных заглавий, географических названий, тематических предметных рубрик и связанные с ними даты, события, факты становятся частью современной системы справочно-

Барков, Владимир Александрович (1939-2001)

Источники:

1. НТВ СПбГПУ. 1996. №1(3).

2. СПбГПУ. Биографии. СПб. : Гуманистика, 2006.

3. Профессора СПбГТУ. В 2-х ч. СПб., 1999.

Фундаментальная библиотека Санкт-Петербургского государственного политехнического университета 10.09.2009

Рис. 1. Пример вывода авторитетных данных локального авторитетного файла ФБ СПбГПУ

библиографического обслуживания [1], вписываются в концепцию международных принципов машиночитаемой каталогизации.

Вместе с тем полнотекстовые электронные ресурсы, не обеспеченные системой каталогизации, предоставляют пользователям за счет применения сетевых технологий эффективные сервисы поиска и доступа к источникам различной природы: электронным копиям произведений литературы, искусства, науки. Библиотеки все чаще включают такие ресурсы в структуру своих фондов и одновременно создают собственные электронные коллекции, архивы, библиотеки - участвуют в инновационной деятельности, связанной с информатизацией общества в целом.

В Концепции инновационной политики Российской Федерации на 1998-2000 гг. инновация (нововведение) определена как «конечный результат инновационной деятельности, получивший реализацию в виде нового или усовершенствованного продукта, реализуемого на рынке, нового или усовершенствованного технологического процесса, используемого в практической деятельности» [2]. Направления развития сетевого пространства позволяют ставить задачи распознавания образов, делают возможным поиск данных и получение информации, например, за счет универсальных идентификаторов ресурсов (URI -Uniform Resource Identifier), системы описания ресурсов RDF (Resource Description Framework), механизмов логического вывода для неполных данных.

Для библиотечной сети инновационные задачи во многом связаны с объективной оценкой конкурентоспособности предоставляемых пользователям сервисов при соблюдении традиции организационной культуры отдельно взятой библиотеки и в соответствии с ее долгосрочными планами работы. К ним относится и стратегия взаимоиспользования ресурсов локального, отраслевого, корпоративного, национального уровня при создании и ведении авторитетных файлов

(АФ).

Авторитетный контроль в ходе машиночитаемой каталогизации сочетается с задачами предоставления информации целевым группам пользователей. Физическое лицо одновременно может выступать в роли создателя произведения, тогда библиотека заинтересована в получении данных об авторе, раскрывающих весь круг его публикаций, и быть пользователем разнообразных ин-

формационных систем, которые все в большей степени нуждаются в получении и обработке подробных сведений о личности пользователя, его профессиональных интересах, социальной принадлежности, устоявшихся предпочтениях. Библиотеки осваивают технологии Web 2.0, не снимая с себя обязательств легитимного раскрытия информации о читателях и авторах произведений и используя методики персонификации пользовательского интерфейса в целях адресного предоставления информационно-библиографических услуг. Создание для пользователя виртуального «Личного кабинета», «Личной папки» стало технологической нормой современных библиотечных сервисов.

Проектная деятельность по внедрению технологий Web 2.0 сделала рядовой процедуру авторизации пользователей при обращении к сетевым ресурсам. Защита информации личного характера от несанкционированного распространения согласно законодательным нормам, в первую очередь - закона «О персональных данных», должна обеспечиваться при обработке персональных данных держателями баз данных, но также зависит и от уровня информационной, правовой культуры самих пользователей [3, 4].

На практике этот подход пока воспринимается как ужесточение формализации предоставления услуг. Например, нельзя сообщать читателю сведения о другом пользователе на основе служебной базы данных, даже в случае, когда эта информация поможет ускорить возврат и последующую выдачу искомой книги. Или без подготовки и утверждения локальных нормативных актов, регламентирующих использование данных персонального характера, недопустимо раскрытие данных о читателе в целях его идентификации при выявлении круга авторов произведений, отнесенных к объектам интеллектуальной собственности организации. Внедрение такой тактики взаимодействия с пользователями делает универсальным алгоритм предоставления услуг как по схеме взаимодействия «человек - машина», так и при совместной работе машин без участия человека.

Предоставление сведений персонального характера в проектах, связанных с «Библиотекой 2.0», имеет несколько другую нагрузку, т. к. позволяет читателю стать участником, например, нормализации данных в библиотечных сетях. С 2005 г. немецкий раздел Wikipedia совместно

с библиотечными специалистами, создающими PND (Personennamendatei), организовал проект «Немецкие объединенные нормативные файлы личных имен». Примерно 20 % из 600 тыс. статей на немецком языке составляли тогда статьи о персоналиях. Очевидно, что метаданные этих статей и авторитетного файла личных имен Немецкой национальной библиотеки (DNB - Deutsche Nationalbibliothek) возможно было сопоставить с целью установления совпадений: имя, альтернативные имена, дата, место рождения и смерти, описание персоны. Программный инструментарий, созданный при участии разработчиков из среды пользователей, позволил делать в библиотечном каталоге поиск метаданных, а на следующем шаге выполнять сверку метаданных PND и Wikipedia. Пользователь сети решал, является ли результат соответствием и следует ли добавить идентификатор и номер записи PND к статье. С помощью шаблона была создана ссылка от статьи к каталогу DNB. После этого можно выполнять поиск с учетом нормализованных записей: пользователи энциклопедии становятся пользователями и библиотечного ресурса. За две недели силами пользователей Wikipedia более 22 тыс. статей было связано с авторитетными данными PND.

В практике ведения каталогов, создаваемых средствами АБИС «Руслан», прием по визуализации полей авторитетных записей (АЗ), применяется с 2000 г. Вместе с появлением страниц справочных сетевых ресурсов, созданных библиотечными специалистами, выполняется сопоставление метаданных авторитетных записей и полнотекстовых материалов. Например, в Ленинградской областной детской библиотеке среди источников авторитетных данных указывается ссылка на именной раздел автора на Региональном сайте детских библиотек [5]. Фундаментальная библиотека Санкт-Петербургского государственного политехнического университе-

та (ФБ СПбГПУ) связывает авторитетную запись со страницами сетевого справочника «Политех в лицах» [6].

В практике ведения Регионального сайта детских библиотек сведения об авторах дополняются и актуализируются в сотрудничестве с авторами или официальными представителями их интересов. Справочное издание «Политех в лицах» обновляется на основе выгрузки из библиографических, авторитетных и полнотекстовых баз данных ФБ СПбГПУ. Обратная связь для участия пользователей в развитии этих ресурсов обеспечивалась режимом переписки по электронной почте, но сейчас может быть переведена на wiki-технологию, т. к. есть предпосылки реализации такого сотрудничества библиотекарей и пользователей при устоявшихся навыках работы в сетевой среде.

Одной из причин раскрытия сведений об авторах в библиотеках, отражающих результаты научных исследований, стала оценка цитируемости авторов и участие в проекте Российского индекса научного цитирования (РИНЦ), «ориентированного на продвижение в сети Интернет российских научных изданий, разработку инструментариев и сервисов для аналитики, науко- и библиометри-ческих исследований и измерений научной деятельности» [7].

Фундаментальная библиотека СПбГПУ, участвуя в проекте РИНЦ, расширила с лета 2009 г. спектр создаваемых авторитетных записей. Для создания авторитетного файла имен индивидуального автора ведется контрольный массив записей об авторах журнала «Научно-технические ведомости СПбГПУ» (НТВ), издаваемого с 1995 г. Назначение массива нормативных записей во многом ориентировано на выявление авторов, сведения о которых не отражены в предметных рубриках, связанных с персоналиями. Особенность круга авторов НТВ - наличие публикаций

200#1$aГагарин$bА.Г.$f1855-1920$gАндрей Григорьевич$скнязь

300##$аРусский ученый и инженер. В 1900-1907 гг. - директор Петербургского политехнического института.

810##$аБСЭ 3-е изд. Т.5, с.623.

810##$аСанкт-Петербургский государственный политехнический университет в XX - начале XXI века: исторические очерки о его руководителях. СПб., 2005, с.11-51. 810##$аДиректора-ректоры Политехнического <иК1^йр://ру1.тШЬ.пеуа.тМг/6.Ьт1>$ЬПортрет

Рис. 2. Фрагмент содержания авторитетной записи ФБ СПбГПУ

в Электронной библиотеке ФБ СПбГПУ (ЭБ ФБ СПбГПУ) и отсутствие печатной версии этих материалов, что делает необходимым поиск информации об авторах ЭБ ФБ СПбГПУ в источниках, представленных на сепаратных носителях. Записи в каталоге ЭБ ФБ СПбГПУ формируются в единой методике машиночитаемой каталогизации, принятой в библиотеке при использовании АБИС «Руслан». Каталог удаленного доступа (OPAC -Online Public Access Catalog) ФБ СПбГПУ относится к каталогам первого типа, OPAC ЭБ ФБ СПбГПУ по результатам поиска предоставляет информацию об условиях доступа к полнотекстовому источнику (доступ пользователей локальной сети библиотеки, сети вуза или сети Интернета) и разрешенных видах использования объекта хранения ЭБ ФБ СПбГПУ. Выпуски НТВ приняты в качестве отправной точки для создания авторитетной записи и сопоставления имен, как авторитетный и репрезентативный печатный источник сведений

06 авторах и авторских коллективах, опубликовавших результаты своих исследований.

Для выпусков НТВ 2009 г. в базах ЭК ФБ СПбГПУ обеспечены полный охват аналитической росписи статей и нормализация полей

7_блока БЗ в формате RUSMARC (первичная,

альтернативная или вторичная интеллектуальная ответственность за интеллектуальное или художественное содержание произведения: 700, 701 и 702 поля соответственно). Для авторитетных записей введен маркер «автор_СПбГПУ», разработан критерий и правила его установки. В электронной форме подготовлена Инструкция по созданию и редактированию авторитетных/ нормативных записей для индивидуальных имен автора (в части записей x-типа). Содержание инструкции дополняется вместе с практикой применения методики Российской национальной библиотеки (РНБ) и опубликованных результатов проекта по созданию Виртуального международного авторитетного файла имен (VIAF - Virtual International Authority File) [8].

Проект VIAF имеет 4 ступени:

1. Соединение существующих записей.

2. Создание сервера - Поиск и получение информации.

3. Продолжающаяся поддержка - (Open Archive Initiative - Harvesting) в отношении открытой архивной информации.

4. Заявки конечного пользователя - Предоставление информации.

На сайте проекта, создаваемого с 2003 г., на текущем отрезке времени представлены библиотеки-партнеры VIAF. Многие из них используют международные форматы серии MARC21 и представляют тезаурусы в форме авторитетных/нормативных файлов. Масштабы работ к концу 2005 г., когда участниками VIAF были только Библиотека Конгресса (LC - Library of Congress) и Национальная немецкая библиотека (DDB - Die Deutsche Bibliothek) совместно с Объединением библиотек Баварии (BVB -Bibliotheksverbund Bayern), характеризуют цифры. Америка для сопоставления пар имен в автоматизированном режиме предоставляла 4,2 млн АЗ и 9,3 млн БЗ, Германия - 2,6 млн АЗ DDB и 15 млн БЗ (DDB совместно BVB). Среди первоначальных целей проекта предусматривалось решение таких универсальных для всех каталогизирующих организаций задач, как сопоставление пар имен с различной графикой написания: «расщепление» одинаковых форм имени для разных авторов, слияние разных форм имен одного автора, поиск алгоритмов для сравнения записей [9].

В практике работы ФБ СПбГПУ на массиве в 3912 авторитетных записей в формате RUSMARC фамилия «Иванов» встречается 36 раз в 56-ти нормализованных по 7_блоку БЗ.

Для идентификации авторов и раскрытия сведений о них используются только открытые источники или сведения регистрационных листов Лицензионных договоров на право использования произведения при передаче электронных докумен-

Иванов

Вадим Михайлович Владимир Михайлович Владимир Михайлович 1956-

B.Н.

Владимир Николаевич 1956-Виктор Павлович Владимир Петрович Вячеслав Петрович Дмитрий Владимирович [1] Дмитрий Владимирович [2] К.М.

Константин Михайлович 1963-

C.В.

Сергей Викторович Сергей Владимирович

Рис. 3. Часть списка однофамильцев в массиве авторов НТВ в ФБ СПбГПУ

Таблица 1

Авторитетные данные на сайте РНБ

Dewar Т. Дюар Т.

Dewar Т. (1864-1930) Дюар Т. (1864-1930)

001: Яи\КЬЯ\АИТН\7788618 001: Яи\КЬЯ\АИТН\7788617

200: 1$8eng$7ba$aDewar$bТ.$f1864- 200: 1$8rus$7ca$aДюар$bТ.$f1864-

1930$§Тошшу 1930$gТомми

300: 0 $aАнглийский предприниматель, 300: 0 $aАнглийский предприниматель,

производитель виски. производитель виски.

400: 1$8eng$7ba$aDewar$bТ. Я.$А864- 400: 1$8rus$7ca$aДюар$bТ. РЖ1864-

1930$gТhomas Robert$5z 1930$gТомас Роберт$5z

700: 1$5z$8rus$7ca$aДюар$bТ.$f1864- 700: 1$8rus$7ca$aДьюар$bТ. Р.$А864-

1930$gТомми 1930$gТомас Роберт$5z

700: 1$5z$8eng$7ba$aDewar$bТ.$f1864-

1930$gТoшшy

тов в ЭБ ФБ СПбГПУ. Для АЗ имен индивидуального автора принято решение о «маске» или шаблоне, по которому сведения об авторе отражаются в полях, доступных пользователям электронно-библиотечных систем на правомерной основе.

Например, по письменному разрешению автора его год рождения вносится в 200 поле АЗ, что автоматически приводит к обнародованию этой информации для неограниченного числа пользователей и переводу в статус общедоступных персональных данных. По закону «О персональных данных» в общедоступные источники могут включаться: фамилия, имя, отчество, год и место рождения, адрес, абонентский номер, сведения о профессии и иные персональные данные, предоставленные субъектом персональных данных.

Сведения служебного характера, относящиеся к категории примечаний каталогизатора, недоступны внешним пользователям и защищены от несанкционированного доступа. Законом «О персональных данных» определено, что «общедоступные персональные данные - персональные данные, доступ

неограниченного круга лиц к которым предоставлен с согласия субъекта персональных данных или на которые в соответствии с федеральными законами не распространяется требование соблюдения конфиденциальности» [3, 10].

В оценке эффективности научной деятельности организации индекс цитирования ее журналов и публикаций в целом сочетается с индексом цитируемости авторов публикаций. Первым шагом для получения этих данных необходимо определить, какой критерий следует применять, определяя принадлежность автора к организации. После установления соответствия имени индивидуального автора утвержденному критерию в записях авторитетного файла для каждого из принятых параллельных заголовков создается отдельная авторитетная/нормативная запись. В этих записях параллельные заголовки выполняют роль авторитетных заголовков, для которых при необходимости формируются ссылки в полях блоков

4_и 5_, а также примечания в полях блока 3_.

Записи, созданные для параллельных заголовков,

Таблица 2

Представление авторитетных данных в кириллице и латинице по системе А

Кириллица Латиница

А а А а

В в V V

Д д D а

Е е Е е

Е ё Е ё

И и I 1

I i I 1

Л л Ь 1

Кириллица Латиница

М м М т

О о О о

П п Р Р

Р р Я г

Т т Т 1

Ф ф F f

Х х Н Ъ

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Ч ч С с

Система А: Fëdorov, МШаЛ Ре!шу1с Система Б: Fedorov, МшИаЛ Рей^юИ

связываются между собой с помощью полей связи блока 7__ .

Транслитерация кирилловского письма латинским алфавитом по ГОСТ 7.79-2000 (ISO 9) может выполняться по системе с использованием диакритики (система А) или по системе Б - за счет схемы с использованием буквосочетаний. В системе авторитетных записей национального уровня используется диакритика, в локальных авторитетных файлах более распространена система Б, т. к. она ориентирована на удобство набора имени автора в альтернативной графике.

Приведенный пример показывает, насколько существенным является вопрос о гармонизации форм авторитетных записей и оценке погрешности поиска информации об авторах, публикующих свои работы на иностранных языках.

Для авторов русскоязычных изданий из баз ЭК ФБ СПбГПУ по разработанной схеме выполняется выгрузка данных, определяется степень совпадений имен авторов статей НТВ при условии, что каждая из статей написана при участии хотя бы одного автора СПбГПУ.

НТВ за 2009 г. (НТВ-2009) - 24 выпуска, 998 записей.

Все авторы внесены в базу РИНЦ.

В АФ «Авторы» ФБ СПбГПУ (на 13.05.2010):

- 3693 записи на индивидуального автора;

- из них 1606 отмечены служебным маркером «автор_СПбГПУ».

355 статей из НТВ-2009 создано при участии 439 авторов СПбГПУ.

294 статьи опубликованы авторами СПбГПУ со статусом первичной интеллектуальной ответственности (первый или единственный автор статьи).

587 раз авторы СПбГПУ выступили в статусе соавторов в 355 статьях НТВ-2009.

Каждый из этих авторов может быть представлен в Электронной библиотеке ФБ СПбГПУ. Для установления связи АЗ с аналитической росписью статей и описанием полнотекстовых электронных ресурсов используются регистрационные листы служебных произведений и Лицензионных договоров на право использования произведений. Эти документы становятся источником вариантных форм имен индивидуального автора, т. к. печатные материалы обычно проходят предварительную редакционно-издательскую обработку, а электронные публикации в большей степени относятся к препринтам или не имеющим статуса издания сетевым документам.

К установлению связи форм имени приводят анализ списков литературы в текстах источников, имена соавторов и близкая тематика публикаций - основные приемы работы в проекте VIAF.

Этот метод, например, подтвердил раскрытие имени кандидата технических наук, а в настоящее время - академика РАН Васильева Юрия Сергеевича, президента СПбГПУ:

БЗ на автореферат была отредактирована после анализа массивов записей (Васильев Ю.С. -435 БЗ), проводимого при подготовке к обновлению страниц сетевого справочного издания «Политех в лицах». Указанные в автореферате публикации автора уже были ранее нормализованы по 7_блоку БЗ (Васильев Ю.С^ШРЗТи

sub\108303 - 240 БЗ) и стали основанием принятия решения об установлении связи БЗ на автореферат и АЗ на имя автора.

Через нормализацию библиографических баз данных формируются условия для построения

[200]$аАльаззех$ЬД.С^Джамиль Самех

[810]$аНТВ СПбГПУ 2007. №4(52), т.2.$Ьаспирант каф. АВТ ФТК СПбГПУ (2007) [200]$аАль-Аззих$ЬД.С^Джамиль Самих

[810]$аНТВ СПбГПУ. 2007. №2.$Ьаспирант, доц. каф. АВТ ФТК СПбГПУ (2007)

Рис. 4. Раскрытие вариантных форм имени в полях авторитетной записи

Васильев, Юрий Сергеевич. Методика технико-экономических расчетов параметров каналов гидроэлектростанций : автореф. дис. ... канд. техн. наук / Ю. С. Васильев ; Всесоюзный научно-исследовательский институт гидротехники имени Б. Е. Веденеева. - Л., 1962. — 18, [1] с. : ил. — Библиогр.: с.19._

Рис. 5. Вывод библиографической записи в ЭК ФБ СПбГПУ, связанной с АЗ

схем поиска и извлечения информации без участия человека в среде Semantic Web. Для перспективы автоматизированного поиска информации за счет связывания словарей терминов с контентом, когда нормализованные данные библиографических баз отражаются в схеме «таксономия-словарь-тезаурус», методы ведения локальных авторитетных/нормативных файлов необходимо согласовать на отраслевом и корпоративном уровне взаимодействия, учитывая, что международная схема авторитетных/нормативных файлов не предполагает создания авторитетных файлов внутри корпораций.

Большое значение в идентификации авторов имеет графическая информация и фотоматериалы. Не всегда они помогают раскрыть инициалы, но, например, удостоверить, что автор действительно был аспирантом СПбГПУ в момент подготовки к конференции молодых ученых, может официальная публикация фотографии на странице университетского сайта. Фотографии и другие архивные материалы библиотечного хранения все чаще используются для оцифровки результатов краеведческих исследований. Иногда цифровая копия включается в ресурсы библиотеки, а оригинал документа остается у владельца. Также источниками идентификации сведений об авторе могут быть надписи и владельческие знаки на мемориальных объектах, комментарии к черновикам или рукописям, запись голоса автора, кино- и видеоматериалы. Часть этих источников традиционно описывается в каталогах библиотек, но все больше вопросов вызывает необходимость создания машиночитаемых записей на помещенные в электронные коллекции цифровые объекты, для оригиналов которых нет практики каталогизации.

Конвенция Совета Европы о защите личности в связи с автоматической обработкой персональных данных была принята 28.01.1981. Еще тогда было сформулировано, что «персональные данные» означают информацию, касающуюся конкретного или могущего быть идентифицированным лица («субъекта данных») [11]. В ракурсе правовых аспектов раскрытия содержания архивных материалов личного характера (в целях сохранения в цифровой форме источников для настоящей и будущей исследовательской деятельности) применимы такие документы, как заявление ИФЛА о доступе к информации, соотносимой с личностью и комментарии Пленума Верховного Суда, связанные с уточнением во-

просов по введению в действие четвертой части Гражданского кодекса РФ [12, 13]. Оба документа касаются проблемы раскрытия сведений о личности, которые могут быть без ведома их владельца использованы в целях киберпреступлений, когда виртуальный образ может стать подменой действий реального физического лица. Ни при каких обстоятельствах библиотека не может допускать халатности по отношению к такой опасности, поэтому все действия по оцифровке источников и результатов краеведческих исследований должны быть обеспечены нормативно-методическими документами и локальными правовыми актами.

Как и в проекте сопоставления имен PND и статей Wikipedia, проект VIАF использует в качестве категорий точек совпадений персональные данные. К сильной категории отнесены имя автора и даты жизни. Информация о годе рождения -к средней категории. Погрешность в 1 год считается допустимой. Дополнительная информация о форме имени вносится соответственно в поле 670 МАЯС21 (УВД и 810 ЯШМАЯС (РНБ).

В практике создания авторитетных записей о персоналиях ФБ СПбГПУ опирается на правило, по которому АЗ создаются на основании каталогизируемых источников: при наличии публикации о персоне, поступившей в фонд библиотеки. Пропорция АЗ в файле «Рубрики» аналогична приведенной статистке Wikipedia: из 16-ти тыс. использованных в ЭК ФБ СПбГПУ предметных рубрик к персоналиям относятся четыре тыс. (3981/16397 - 24 %). Особенность АЗ на имена авторов проявляется в необходимости мониторинга сведений об авторе для актуализации авторитетных данных и снижения дублирования записей. Записи о персоналиях-авторах не требуют такого оперативного обновления, как в отношении авторов, не представленных в справочных и энциклопедических изданиях: молодых авторов, создателей малоформатных и малотиражных произведений. Доля пересечений АЗ из файла «Авторы» и персоналий из файла «Рубрики» составляет десятки записей (3693&3981=31). В ФБ СПбГПУ ведется электронный справочник «Пер-соналии_СПбГПУ», записи которого создаются с использованием полей ЯиБМАЯС. В них отражаются сведения о лицах, связанных с Санкт-Петербургским государственным политехническим университетом с момента его создания до настоящего времени. Подтверждение этих связей основано на общедоступных источниках, архив-

ных материалах и документах [14]. БЗ с записями справочника не объединяются. Доля пересечений справочника «Персоналии_СПбГПУ» и файла «Авторы» (2427&3693=336), соотношение записей с маркером «автор_СПбГПУ» с записями в справочнике 336/1606 - 21 %, что является одной из характеристик достоверности публикуемой информации. Методика VIAF и РНБ предусматривает сохранение «истории заблуждений», т. е. сохранение отвергнутых версий АЗ. Для локальных, а в перспективе - корпоративных, файлов это существенная задача, т. к. РНБ создает связи БЗ и АЗ в объеме поступлений, регулируемых законом «Об обязательном экземпляре документов», а записи на локальном уровне охватывают значительную долю сетевых ресурсов, не депонируемых в фондах национальных библиотек [15]. Возникает противоречие между необходимостью отражения в АЗ все более полного представления сведений об авторе в целях оперативного и достоверного получения необходимой информации, если не в открытых для широкого круга пользователей полях, то хотя бы в полях служебного назначения, и требований конфиденциальности в отношении информации, все более относимой к категории «личной информации» (PII - Personally Identifiable Information).

В программе секции 08/11, Секции по автоматизации, форматам и каталогизации, на XV конференции РБА в 2010 г. были представлены

СПИСОК Л

1. Декларация о международных принципах каталогизации [Текст]//Новости Международной федерации библиотечных ассоциаций и учреждений.-2008. -№ 6(75).-С. 15-22.

2. О Концепции инновационной политики Российской Федерации на 1998-2000 годы [Электронный ресурс]: постановление Правительства Рос. Федерации от 24.07.1998 № 832//Информационно-правовой портал «Гарант».-Режим доступа: http://base.garant. ru/179112.htm.

3. О персональных данных [Электронный ресурс]: федеральный закон от 27.07.2006 № 152-ФЗ// Информационно-правовая система «Консультант Плюс».-[М.], 1997-2010.-Режим доступа: http://base.consultant.ru/cons/cgi/online.cgi?req=doc; base=LAW;n=103154.

4. Национальный узел Интернет-безопасности в России [Электронный ресурс].-Режим доступа: http://www.saferunet.ru.

5. Региональный сайт детских библиотек [Электронный ресурс]/Ленинградская областная детская

доклады об опыте работы с авторитетными записями в Томском государственном университете и Томском политехническом университете, каждый из них представлял собой анализ эффективности использования методик ведения системы национальных авторитетных/нормативных файлов в работе с авторитетными данными на локальном уровне [16]. Президентской библиотекой имени Б.Н. Ельцина были предложены доклады о состоянии дел в области каталогизации архивных материалов и планов о создании национальной версии формата на базе RUSMARC, сопоставимого по возможностям с зарубежной практикой использования MARC21.

Идентификация авторов - необходимое условие повышения эффективности поиска в информационных системах библиотек всех типов. Электронно-библиотечные системы, ориентированные, прежде всего, на задачи высшей школы, неизбежно накапливают и обрабатывают персональные данные о современных авторах, публикующих свои произведения на различных видах носителей. Соблюдение баланса между защитой информации о личности и использованием персональных данных - актуальная задача междисциплинарного характера, т. к. нормализованные данные об авторах являются основой для наукометрических исследований публикационной активности в сфере образования и науки.

ГЕРАТУРЫ

библиотека.-[СПб.], 1998-2010.-Режим доступа: http://deti.spb.ru.

6. Директора-ректоры Политехнического [Электронный ресурс]: справочное издание / Санкт-Петербургский государственный политехнический университет. Фундаментальная библиотека.-СПб., 2006-2007.-(Политех в лицах).-Режим доступа: http://pvl.unilib.neva.ru/dr.

7. Научная электронная библиотека «eLIBRARY. RU» [Электронный ресурс].-М., [Б. г.].-Режим доступа: http://www.elibrary.ru.

8. VIAF: The Virtual International Authority File [Электронный ресурс]/ОСЬС.-[Б. м.], 2010.-Режим доступа: http://viaf.org/.

9. VIAF (Виртуальный международный авторитетный файл) : авторитетные файлы имен, связывающие Немецкую библиотеку и Библиотеку Конгресса США/Р. Беннетт [и др.]//Новости Международной федерации библиотечных ассоциаций и учреждений. -2007. -№ 6(69).-С. 35-43.

10. Письмо Министерства образования и

науки Российской Федерации от 16.12.2009 № ИК-1766/03 во исполнение поручения Президента Российской Федерации от 31.10.2009 № ПР-2920 [Электронный ресурс]/Электронная библиотека «КнигаФонд».-[Б. м.], 2008-2010.-Режим доступа: http://www.knigafund.ru/docs/ob_obespechenii_ dostupom_k_ebs.pdf.

11. Конвенция Совета Европы о защите личности в связи с автоматической обработкой персональных данных от 28 января 1981 г. с изменениями 1999 г. [Электронный ресурс]//Защита информации открытого доступа: [сайт]/Компания «Информзащита».-М., 1995-2010.-Режим доступа: http://www.zki.infosec.ru/ law/personal/doc/137/.

12. Заявление ИФЛА о доступе к информации, соотносимой с личностью, в архивных записях [Текст]// Новости Международной федерации библиотечных ассоциаций и учреждений.-2009.-№ 3(78).-С. 12-13.

13. О некоторых вопросах, возникающих в связи с введением в действие части четвертой Гражданского

кодекса Российской Федерации [Электронный ресурс]: постановление Пленума Верховного Суда Рос. Федерации и Пленума Высшего Арбитражного Суда Рос. Федерации от 26.03.2009 № 5/29//Информационно-правовой портал «Гарант».-Режим доступа: http:// www.garant.ru/hotlaw/doc/135099.htm.

14. Об архивном деле в Российской Федерации [Электронный ресурс]: федеральный закон от 22.102004 № 125-ФЗ//Информационно-правовая система «Консультант Плюс».-Режим доступа: http://base.consultant. ru/cons/cgi/onlme.cgi?req=doc;base=LAW;n=76997.

15. Об обязательном экземпляре документов [Электронный ресурс]: федеральный закон от 29.12.1996 № 77-ФЗ://Информационно-правовая система «Консультант Плюс». -Режим доступа: http://base.consultant.ru/ cons/cgi/onlme.cgi?req=doc;base=LAW;n=78626.

16. Материалы XV Конференции РБА [Электронный ресурс]//РБА: [сайт]/Российская библиотечная ассоциация.-[СПб.], 2005-2010.-Режим доступа: http://www.rba.ru/conference/tomsk/programm.pdf.

УДК 004.942

А.Д. Тазетдинов

О РЕЗУЛЬТАТАХ ПРИМЕНЕНИЯ МАТЕМАТИЧЕСКОМ МОДЕЛИ ПРОЦЕССА УСВОЕНИЯ ЗНАНИЙ В ЕСТЕСТВЕННО-ЯЗЫКОВОЙ ОБУЧАЮЩЕЙ СИСТЕМЕ

Необходимость проверки обоснованности научных положений, выводов и рекомендаций, выдвинутых в работах [1-4], и связанных с разработкой математической модели усвоения знаний, требовала проведения эксперимента. Цель исследования - проблема повышения качества обучения в современных условиях интенсификации обучения, которая, по мнению автора, может быть решена за счет внедрения в учебный процесс новейших компьютерных технологий обучения.

Эксперимент проводился с применением специально разработанного естественно-языкового модуля для компьютерной обучающей среды Moodle [5], использующего в своей работе созданные математические модели. Модуль позволяет имитировать наиболее эффективный на сегодняшний день механизм личностно-ориентированного диалогового репетиторского обучения.

Методика проведения и результаты эксперимента

Посредством сравнения оценок, выставленных преподавателями студентам контрольной и экспериментальной групп, осуществлялась проверка следующих гипотез:

Н0 - уровень понимания учебного материала (УМ) студентами стохастически (вероятностно) зависит от их уровня обучаемости, т. е. естественно-языковая обучающая система не оказывает существенного влияния на уровень понимания УМ;

Н - различия в уровне понимания УМ между обоими распределениями достаточно значительны и связаны с использованием естественноязыковой обучающей системы.

Эксперимент проводился на базе Международного банковского института в Санкт-Петербурге

i Надоели баннеры? Вы всегда можете отключить рекламу.