Научная статья на тему 'Идентификационные признаки исполнителя текстового электронного документа'

Идентификационные признаки исполнителя текстового электронного документа Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
457
88
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ИДЕНТИФИКАЦИЯ / ТЕКСТОВЫЙ ЭЛЕКТРОННЫЙ ДОКУМЕНТ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Комаров И. М., Третьяков М. Ю.

В статье рассматривается возможность идентификации исполнителя текстового электронного. Приводятся признаки характеризующие автоматизированное рабочее место и признаки исполнителя текстового электронного документа.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Комаров И. М., Третьяков М. Ю.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Идентификационные признаки исполнителя текстового электронного документа»

УДК 34.98.065

ИДЕНТИФИКАЦИОННЫЕ ПРИЗНАКИ ИСПОЛНИТЕЛЯ ТЕКСТОВОГО ЭЛЕКТРОННОГО ДОКУМЕНТА

И.М. КОМАРОВ11 М.Ю. ТРЕТЬЯКОВ21

Белгородский государственный национальный исследовательский университет

1) e-mail: [email protected] e-mail: [email protected]

В статье рассматривается возможность идентификации исполнителя текстового электронного. Приводятся признаки характеризующие автоматизированное рабочее место и признаки исполнителя текстового электронного документа.

Ключевые слова: идентификация, текстовый электронный документ.

В настоящее время вопрос о конкретном исполнителе электронного документа, изготовленного с использованием компьютера, затруднен, так как под одним условным именем в системе могут работать несколько человек. Используемая при наборе текста версия программного продукта и изменения, вносимые в шаблон, используемый по умолчанию, а также формат, в котором сохраняется документ, влияют на стабильность процесса следообразования. При исследовании признаков находящихся в теле электронного документа, в первую очередь, необходимо ознакомиться с требованиями, предъявляемыми к оформлению текстовой электронной документации в организации. Наличие таких требований, вынуждает исполнителя использовать определенные параметры, которые нельзя изменять, а значит, информационная значимость этих признаков оказывается низкой и непригодной для установления исполнителя.

Существует ряд методов и подходов к анализу клавиатурного почерка1,2,3,4,5,6,7,8 учитывающие биометрические параметры клавиатурного почерка, представленные в виде усредненных значений длительности событий клавиатуры. Предложенные методики к сожалению, не могут быть применимы для современной экспертизы электронных доку-

1 Joyce R., Gupta G. Identity authorization based on keystroke latencies // Commun. ACM 33 (2) (1990) PP. 168-176.

2 Monrose F., Rubin A.D. Authentication via keystroke dynamics / / Fourth ACM Conference on Computer and Communication Security, 1997, PP. 48-56. Monrose F., Rubin A.D. Keystroke dynamics as a biometric for authentication // Future Generation Computer System 16 (2000) PP. 351-359.

3 Иванов А.И. Биометрическая идентификация личности по динамике подсознательных движений. -Пенза: Изд-во Пенз-го гос. ун-та, 2000. - 188 с.

4 Гузик В.Ф. Десятерик М.Н. Биометрический метод аутентификации пользователя. // Известия ТРТУ -ТРТУ, Таганрог. - 2000. - №2(16). - С. 139-144.

5 Иванов А.И. Биометрическая идентификация личности по динамике подсознательных движений -Пенза: Изд-во Пенз. гос. ун-та, 2000. - 188 с.

6 Широчкин В.П., Кулик А.В., Марченко В.В. «Динамическая аутентификация на основе анализа клавиатурного почерка». //http://www.masters.donntu.edu.ua/2002/fVti/aslamov/files/bio_autentification.htm

7 Лепёшкин О.М., Скубицкий А.В. Разработка подхода к распознаванию биометрического портрета пользователя по клавиатурному почерку на основе методов нелинейной динамики / Информационное противодействие угрозам терроризма. - 2008. - № 11. - С. 102 - 112. http: //www.contrterror.tsure.ru/site / magazine11 / 03-11.htm.

8 Брюхомицкий Ю.А., Казарин М.Н. Выделение информативных биометрических параметров в системах клавиатурного мониторинга // Информационное противодействие угрозам терроризма. Научно-практический журнал №14. 2010. - С. 139-143., Брюхомицкий Ю.А., Казарин М.Н. Многосвязное представление биометрических параметров в системах клавиатурного почерка // Информационное противодействие угрозам терроризма. Научно-практический журнал №14. 2010. - С. 144-148., Брюхомицкий Ю.А Распознавание клавиатурного почерка на основе использования статистических оценок плотности распределения // Информационное противодействие угрозам терроризма. Научно-практический журнал №14. 2010. - С. 149-154.

252 НАУЧНЫЕ ВЕДОМОСТИ № Серия Философия. Социология. Право.

I ШI 2013. № 9 (152). Выпуск 24

ментов в полном объеме9, что связано с высоким уровнем развития в текстовых редакторах функций автозамены и проверки орфографии10.

Не смотря на существующую классификацию признаков пригодных для идентификации электронного документа11 приходиться констатировать, что авторы упустили ряд важных с криминалистической точки зрения признаков сохраняющихся в теле документа.

Основная часть

К признакам, позволяющим установить автоматизированное рабочее место (персональный компьютер), на котором был подготовлен исследуемый электронный документ, относятся в первую очередь свойства документа представляющие собой метаданные -данные непосредственно о самом документе. Настройки свойств по умолчанию включают размер файла и его тип, первоначальное название документа, автора и статистику типа числа знаков, слов абзацев и страниц. Программы генерируют значения многих из этих свойств автоматически. Например, вычисляет все статистические данные, основанные на содержании документа, и текущие значения для свойств Автор и Компания, которые вводятся при установке программы12. В свойствах также может отображаться дата создания, последнего сохранения, последнего вывода на печать, количество редакций и общее время редактирования. Кроме этого текстовый электронный документ включает в себя признаки, характеризующие настройки конкретного экземпляра программного продукта, среди которых наиболее существенными являются признаки, формируемые шаблоном документа.

Под параметрами шаблона понимают большую группу настроек, используемых соответствующими программами по умолчанию для облегчения работы пользователя по созданию текстового документа. Эти настройки сохраняются в файле с конкретным именем и расширением, имеют условные наименования и значения, наиболее близко подходящие для большинства документов, подготавливаемых пользователем. Изменение данных значений пользователем при создании документа или группы документов влечет сохранение этих параметров в теле файла документа13.

Криминалистическая значимость параметров шаблона может рассматриваться с точки зрения необходимости решения задачи установления общего источника происхождения документов. При этом указанная задача решается, как в условиях наличия двух электронных документов с последующим их сравнением между собой, так и при наличии электронного документа и документа, изготовленным традиционным способом, что также предполагает последующее их сравнение (под традиционным документом здесь имеется в виду документ, подготовленный на компьютере и распечатанный на бумажном носителе с помощью знакосинтезирующих устройств).

Среди признаков позволяющих установить исполнителя электронного документа, можно выделить следующие подгруппы:

1. Признаки, отражающие содержание и построение текстового документа, сформированное пользователем без использования шаблона.

1.1. Признаки, отражающие пространственную ориентацию фрагментов текста, являются значимыми при сравнении двух электронных документов и электронного документа с «бумажным».

1.1.1. Расположение текста и его фрагментов относительно срезов листа бумаги, их взаиморасположение. Под самостоятельными фрагментами документа подразумевались: наименования, даты, расшифровка подписей, резолюции, заголовки, обращения, номера страниц и т.д. Под расположением текста в целом, подразумевалось его размещение относительно срезов листа бумаги: наличие, локализация, размер полей; размер отступов от верхнего и нижнего краев страницы. Данные значения измеряются в сантиметрах.

9 Комиссаров А.Ю., Подлесный А.В. Идентификация пользователя ЭВМ и автора программного продукта: Метод. рекомендации. М.: ЭКЦ МВД России, 1996., - С. 13.

10 МакФедрис П. Раскрытие тайн Microsoft office 2003 / Пол Мак Федрис - М.: НТ Пресс, 2007. - С. 19.

11 Ковалюх Е.А., Шухнин М.Н. Классификация признаков электронных документов, подготовленных в текстовом редакторе Microsoft Word / / Судебная экспертиза. - 2008. - С. 73-81.

12 МакФедрис П. Раскрытие тайн Microsoft office 2003 / Пол Мак Федрис - М.: НТ Пресс, 2007 С. 32.

13 Столяров А.М., Столярова Е.С. Уроки по Microsoft Word для менеджеров и не только... / Столяров А.М., Столярова Е.С. - М.: НТ Пресс, 2007. - 224 с.

Серия Философия. Социология. Право. 2013. № 9 (152). Выпуск 24

1.1.2. Размещение начального движения в первой строке абзаца (абзацный отступ). Измеряется в сантиметрах. Каким образом он выполнен: табуляцией, пробелами или верхним колонтитулом.

1.1.3. Интервал между последней строкой предыдущего и первой строкой последующего абзацев. У некоторых исполнителей может отличаться от межстрочного интервала, это связанно с желанием более четко отделить абзацы друг от друга, хотя данный параметр используется в практике крайне редко и скорее может свидетельствовать об использовании материалов скопированных из Интернета. Признак четко прослеживается как при сравнении двух электронных документов, так и электронного документа с «бумажным».

1.1.4. Величина межстрочного интервала - расстояние между основаниями знаков, расположенных в смежных строках. Значения межстрочного интервала соответствуют аналогичным значениям, используемым в пишущих машинах, который может быть одинарным (1), полуторным (1,5), двойным (2) и т.д. Значения этого параметра существенны при сравнении двух электронных документов и электронного документа с «бумажным». Данный параметр при оформлении большинства документов является жестко детерминированным, его использование при идентификации зависит от требований предъявляемых к документу.

1.1.5. Размер интервалов между словами и масштаб межзнакового интервала. При сравнении двух электронных документов интервал между словами может измеряться в количестве пробелов или табуляций. Это связано с тем, что в электронных документах значение обычного пробела не имеет фиксированного значения, а изменяется в зависимости от количества и размера слов в строке. Расположение интервалов в тексте также определяется и наличием настройки расстановки переносов. Надо отметить, что одним из характерных признаков сканированного документа через программу ABBY FINE READER является наличие скрытых переносов, которые четко отображаются при включении опции показывать непечатные знаки

1.1.6. Размещение знаков препинания, относительно предшествующего слова: может быть вплотную к предшествующему слову или отделено от него пробелом.

1.1.7. Использование разрывов страниц, разрывов разделов свидетельствует о наличии у пользователя соответствующих навыков и представлений об использовании данных функций.

1.1.8. Использование символов и специальных знаков могут свидетельствовать, как о высоком уровне владения программным продуктом, так и использовании Интернета при подготовке документа.

1.1.9. Непечатаемые символы - символы окончания абзаца, пробелы, условные переносы, символы табуляции, скрытый текст и др.14.

1.1.10. Использование надстрочных и подстрочных знаков в тексте.

1.1.11. Наличие скрытых гиперссылок в тексте.

1.1.12. Наличие уровней для заголовков в тексте и автоматическое оглавление.

1.1.13. Наличие режима рецензирования в тексте.

2. Исполнительские признаки письменной речи проявляются как в электронных, так и в традиционных документах

2.1. Акцентирование - выделение фрагментов текста может осуществляться с помощью параметров шрифта (курсивом, жирным шрифтом, изменением вида шрифта, изменением цвета шрифта), подчеркиванием, цветом, при этом выбранный цвет выделения также будет индивидуализировать исполнителя.

Использование определенных сокращений и наличие устойчивых ошибок: орфографических, пунктуационных, грамматических. Здесь нужно отметить, что данные признаки могут проявляться даже при наличии в текстовом редакторе функции подчеркивания или исправления ошибок ввиду того, что пользователь зачастую пренебрегает этими возможностями или отключает указанные функции. Особое внимание необходимо обра-

14 Глушаков С.В. Microsoft Word 2007 / С.В. Глушаков, А.С. Сурядный, М.А. Струков. - изд. 3-е, доп. и пе-рераб. - М.: АСТ: АСТ МОСКВА, 2009. - С. 63.

тить на такую функцию текстового редактора как статистика убочитаемости15. Результаты проверки на удобочитаемость основаны на величине среднего числа слогов в слове и слов в предложении. Проверка удобочитаемости по Флешу оценивает текст по 100-балльной шкале. Чем выше значение, тем проще понять документ.

Проверка удобочитаемости по школьному тесту по Флешу-Кинкейду используется для оценки текстов на экзаменах в школах США. Например, значение 8,0 означает, что этот документ может понять ученик восьмого класса.

В целом статистика удобочитаемости включает следующие характеристики документа:

• общее количество: слов в тексте, символов, абзацев, предложений.

• среднее количество: предложений в абзаце, слов в предложении, символов в слове.

• показатели легкости чтения: уровень образования, легкость чтения, число сложных фраз, благозвучие.

При анализе текста можно просмотреть и общую статистику, включающую такие параметры как число страниц, слов, знаков без пробелов, знаков с пробелами, абзацев и строк.

2.3. Способ написания отдельных слов: дат, сумм, неологизмов, профессионализмов, архаизмов, жаргонизмов и т.д.

2.4. Формат цифр, используемый для нумерации страниц документа.

3. Признаки, характеризующие навык владения программным обеспечением, позволяющим создавать текстовые документы.

3.1. Вид программного продукта, применявшегося для подготовки электронного документа. Такие программы можно разделить на три класса:

1. Текстовые редакторы - программы, рабочее поле которых представлено в виде строго фиксированного количества строк и столбцов, в связи с чем, невозможно произвольно менять местоположение символов (Microsoft Word);

2. Программы верстки - программы, представляющие текст в виде объектов, позиционировать, которые возможно любым способом. Позволяют в явном виде задавать параметры отдельных фрагментов документа (Page Maker);

3. Программы, используемые для распознавания и последующей обработки изображения текста, полученного с помощью сканера, с последующим переводом обработанной информации в формат текстового редактора (Fine Reader).

Все перечисленные программы позволяют создать текстовый документ, но обладают разными возможностями, поэтому использование их зависит от задач, которые ставит перед собой пользователь и тех навыков работы с программами, которыми он обладает.

3.2. Использование пользователем шаблонов стандартных документов, а также измененных шаблонов, применяемых конкретным программным продуктом по умолчанию (особенности исследования этого признака указаны выше при описании параметров шаблона, в данном же разделе значение имеет то, как пользователи определенного квалификационного уровня будут использовать указанные возможности).

3.3. Работа с инструментарием программы. Способы форматирования текста.

Исследование этих признаков возможно лишь в случае при сравнении двух электронных документов ввиду того, что в тексте на бумажном носителе отображается лишь конечное значение отформатированного текста, а не способ, каким это форматирование было достигнуто.

3.3.1. Способ установления отступа в первой строке абзаца (абзацный отступ).

3.3.2. Способ воздействия на размер расстояний между словами. Расстояния между словами в текстовом редакторе Microsoft Word, выставленные с помощью «пробела» не имеют фиксированного значения, а зависят от размера и количества слов в строке, при этом их значение может существенно варьироваться, что в некоторых случаях придает фрагментам текста не вполне эстетичный вид. Так, например, происходит при увеличении отрыва заглавных букв инициалов от фамилии. Особенно четко это проявляется при

15 Джонсон С. Microsoft Word 2007 / Джонсон Стив; пер. с англ. Вернигорова В.А. - М. НТ Пресс, 2008. -С. 267.

установлении выравнивания текста по «ширине» в отсутствии возможности переноса слов.

3.3.3. Использование шрифтов, их размеров, надстрочных и подстрочных символов. Исследовать данный признак представляется возможным как при сравнении двух электронных документов, так и электронного документа с «бумажным».

3.3.4. Использование форматирования абзацев. Возможности форматирования абзацев заключаются в установлении отступов, табуляции, увеличение межстрочного интервала сверху и снизу абзаца, установка переносов и деление на страницы.

3.3.5. Использование стилей. Стиль является комплексным понятием и содержит указания, как по форматированию символов, так и по форматированию абзацев.

3.3.6. Использование колонтитулов. Колонтитулами называют области, расположенные в верхнем и нижнем поле каждой страницы документа. В колонтитул обычно вставляется текст или рисунок (номер страницы, дата печати документа, эмблема организации, название документа, имя файла, фамилия автора и т. п.), который должен быть напечатан внизу или вверху каждой страницы документа.

3.3.7. Использование сносок. Правильность их применения.

3.3.8. Использование возможностей создания нумерованных списков.

3.3.9. Способы выделения текста цветом, или другими приемами.

3.3.10. Использование в тексте уровней.

3.4. Особенности и закономерности возникновения орфографических и пунктуационных ошибок.

Исследование исполнительских признаков письменной речи (уровень владения орфографическими и пунктуационными навыками) важен при сравнении двух электронных документов и электронного документа с «бумажным».

Выводы

Обобщая материал, можно с уверенностью утверждать, что электронные документы могут и должны использоваться в качестве источников доказательства по уголовному делу. На исследование электронного документа, как доказательства должны быть распространены процессуальные нормы, касающиеся документа вообще. Установление содержания электронных документов, относящихся к событию преступления, места, времени, а также иных существенных обстоятельств их подготовки кардинально меняет темп и результативность расследования уголовного дела, позволяет быстро и эффективно противодействовать сговору, круговой поруке обвиняемых, минимизировать негативные последствия уничтожения ими письменных документов, а в целом - адекватно реагировать на реальные условия, в которых осуществляется расследование преступлений.

При исследовании признаков находящихся в теле электронного документа, в первую очередь, необходимо ознакомиться с требованиями, предъявляемыми к оформлению текстовой электронной документации в организации. Наличие таких требований, вынуждает исполнителя использовать определенные параметры, которые нельзя изменять, а значит, информационная значимость этих признаков оказывается низкой и непригодной для установления исполнителя.

Признаки, присутствующие в теле электронного текстового документа можно разбить на следующие группы:

• признаки, позволяющие установить автоматизированное рабочее место пользователя.

• признаки, позволяющие установить лицо, подготовившее электронный документ.

Признаки эти тесно переплетаются, поскольку настройки шаблона, который характеризует рабочее место, могут изменяться самим пользователем без изменения шаблона и в этом случае уже являться признаками исполнителя электронного документа.

Необходимо учитывать совокупность признаков, поскольку навык владения одним из признаков, а также типом используемого текстового редактора при подготовке документа. Выделенные в работе признаки, могут быть использованы экспертами при установления одного исполнителя по двум электронным документам.

Электронный текстовый документ не может существовать как таковой. Поэтому и конструированию подлежит не только электронный документ, но и правовая система,

256 НАУЧНЫЕ ВЕДОМОСТИ | | Серия Философия. Социология. Право.

2013. №9(152). Выпуск 24

частью которой он является. Иначе говоря, нужно создать процедуры экспертизы электронных документов, которые стали бы столь же убедительными для суда, сколь убедительными являются привычные методы анализа бумажных документов. Затем нужно законодательно поддержать их и, наконец, ввести такие экспертизы в регулярную судебную практику.

Список литературы

1. Joyce R., Gupta G. Identity authorization based on keystroke latencies // Commun. ACM 33 (2) (1990) PP. 168-176.

2. Monrose F., Rubin A.D. Authentication via keystroke dynamics // Fourth ACM Conference on Computer and Communication Security, 1997, PP. 48-56. Monrose F., Rubin A.D. Keystroke dynamics as a biometric for authentication // Future Generation Computer System 16 (2000) PP. 351-359.

3. Иванов А.И. Биометрическая идентификация личности по динамике подсознательных движений. - Пенза: Изд-во Пенз-го гос. ун-та, 2000. - 188 с.

4. Гузик В.Ф. Десятерик М.Н. Биометрический метод аутентификации пользователя. // Известия ТРТУ - ТРТУ, Таганрог. - 2000. - №2(16). - С. 139-144.

5. Иванов А.И. Биометрическая идентификация личности по динамике подсознательных движений - Пенза: Изд-во Пенз. гос. ун-та, 2000. - 188 с.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

6. Широчкин В.П., Кулик А.В., Марченко В.В. «Динамическая аутентификация на основе анализа клавиатурного почерка». //http://www.masters.donntu.edu.ua/2002/fvti/aslamov/iiles/bio_autentification.htm

7. Лепёшкин О.М., Скубицкий А.В. Разработка подхода к распознаванию биометрического портрета пользователя по клавиатурному почерку на основе методов нелинейной динамики / Информационное противодействие угрозам терроризма. - 2008. - № 11. - С. 102 - 112. http://www.contrterror.tsure.ru/site/magazine11/03-11.htm.

8. Брюхомицкий Ю.А., Казарин М.Н. Выделение информативных биометрических параметров в системах клавиатурного мониторинга // Информационное противодействие угрозам терроризма. Научно-практический журнал №14. 2010. С. 139-143.,

9. Брюхомицкий Ю.А., Казарин М.Н. Многосвязное представление биометрических параметров в системах клавиатурного почерка // Информационное противодействие угрозам терроризма. Научно-практический журнал №14. 2010. С. 144-148.,

10. Брюхомицкий Ю.А. Распознавание клавиатурного почерка на основе использования статистических оценок плотности распределения // Информационное противодействие угрозам терроризма. Научно-практический журнал №14. 2010. С. 149-154.

11. Комиссаров А.Ю., Подлесный А.В. Идентификация пользователя ЭВМ и автора программного продукта: Метод. рекомендации. М.: ЭКЦ МВД России, 1996., С. 13.

12. МакФедрис П. Раскрытие тайн Microsoft office 2003 / Пол Мак Федрис - М.: НТ Пресс, 2007 С. 19.

13. Ковалюх Е.А., Шухнин М.Н. Классификация признаков электронных документов, подготовленных в текстовом редакторе Microsoft Word // Судебная экспертиза. - 2008. - С. 73-81.

14. Столяров А.М., Столярова Е.С. Уроки по Microsoft Word для менеджеров и не только... / Столяров А.М., Столярова Е.С. - М.: НТ Пресс, 2007. - 224 с.

15. Глушаков С.В. Microsoft Word 2007 / С.В. Глушаков, А.С. Сурядный, М.А. Струков. - изд. 3-е, доп. и перераб. - М.: АСТ: АСТ МОСКВА, 2009. - С. 63.

16. Джонсон С. Microsoft Word 2007 / Джонсон Стив; пер. с англ. Вернигорова В.А. - М. НТ Пресс, 2008. - С. 267.

IDENTIFICATION OF SIGNS OF CONTRACTOR TEXT ELECTRONIC DOCUMENT

I.M. KOMAROV The possibility of identification a text electronic performer. We M V TRETVniffllf21 give criteria for characterizing the workstation and featured perforM 1REIYAKO" mer of electronic text document.

Belgorod state national Key words: identification, text electronic document.

research university

1) e-mail: [email protected]

2) e-mail: [email protected]

i Надоели баннеры? Вы всегда можете отключить рекламу.