Научная статья на тему 'Модель автоматической коррекции ошибок при обработке данных в задачах улучшения качества информационного сервиса'

Модель автоматической коррекции ошибок при обработке данных в задачах улучшения качества информационного сервиса Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
347
93
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ИНФОРМАЦИОННЫЙ СЕРВИС / ПРОГРАММА АВТОМАТИЧЕСКОЙ КОРРЕКЦИИ ОШИБОК / МОДЕЛЬ ТАБЛИЧНОГО ДОКУМЕНТА / INFORMATION SERVICE / A PROGRAM FOR AUTOMATIC CORRECTION OF ERRORS / THE MODEL OF THE TABLE DOCUMENT

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Исаев Георгий Николаевич

Рассмотрены вопросы моделирования способов обеспечения достоверности и полноты данных в задачах улучшения качества информационного сервиса; предложена модель автоматического восстановления достоверности и полноты значений показателей в документах табличной структуры; в соответствии с этой моделью разработаны алгоритм и компьютерная программа, которая выполняет автоматическую идентификацию ошибок в данных, вычисляет достоверное значение и заменяет ошибочное значение на достоверное, а также выдает сообщения об ошибках оператору компьютер

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The article considers the problems of modeling of methods to ensure accuracy and completeness of data in the challenge of improving the quality of information service. The author presents a model of automatic restoration of accuracy and completeness of the values of parameters in the documents of table structure. According to this model, experts worked out algorithm and computer program that performs automated identification of errors at the data, calculates reliable value and replaces an erroneous value for reliable, and informs the operator computer with error messages

Текст научной работы на тему «Модель автоматической коррекции ошибок при обработке данных в задачах улучшения качества информационного сервиса»

УДК 002.6:004.4

Модель автоматической коррекции ошибок

при обработке данных в задачах улучшения качества

информационного сервиса

Георгий Николаевич Исаев, к.т.н., проф. каф. «Информационные и коммуникационные технологии», e-mail: georg.isaev@mail.ru

ФГОУ ВПО «Российский государственный университет туризма и сервиса», Москва

Рассмотрены вопросы моделирования способов обеспечения достоверности и полноты данных в задачах улучшения качества информационного сервиса; предложена модель автоматического восстановления достоверности и полноты значений показателей в документах табличной структуры; в соответствии с этой моделью разработаны алгоритм и компьютерная программа, которая выполняет автоматическую идентификацию ошибок в данных, вычисляет достоверное значение и заменяет ошибочное значение на достоверное, а также выдает сообщения об ошибках оператору компьютера.

The article considers the problems of modeling of methods to ensure accuracy and completeness of data in the challenge of improving the quality of information service. The author presents a model of automatic restoration of accuracy and completeness of the values of parameters in the documents of table structure. According to this model, experts worked out algorithm and computer program that performs automated identification of errors at the data, calculates reliable value and replaces an erroneous value for reliable, and informs the operator computer with error messages.

Ключевые слова: информационный сервис, программа автоматической коррекции ошибок, модель табличного документа.

Keywords: information service, a program for automatic correction of errors, the model of the table document.

Уровень качества функционирования информационного сервиса (КФИС) в значительной мере зависит от количества дефектов, которые возникают в процессе работы отдельных компонентов информационных систем (ИС), в частности, технологического процесса обработки данных (ТПОД) [1. С. 53]. Следует отметить, что наиболее значимыми дефектами являются искажения информации, идентифицируемые как дефекты достоверности информации, отсутствие значений показателей, обозначаемое как дефект полноты информации, нарушения в сроках представления информации, идентифицируемые как несвоевременность информации, и др. [2. С. 112]. Плохое качество информации формирует условия принятия неадекватных решений в широком классе задач [3. С. 316]. Одним из эффективных путей улучшения КФИС является разработка и реализация программных методов контроля достоверности и полноты информации.

Методы контроля можно подразделить по характеру ошибок человеческого и аппаратного факторов. Технологию программного обнаружения ошибок и последующего их ручного исправления можно отобразить схемой, изображенной на рис. 1.

Схема включает в себя контур 1 - этапы, выполняемые на компьютере, и контур 2 - этапы, выполняемые вручную. На первом этапе (блок 1)

происходит ввод данных в компьютер (ВДК). Затем (блок 2) проводится анализ входных документов посредством программ контроля правильности входных данных по условию - есть ошибки? (ЕО?). В случае отсутствия ошибки (блок 3) документ размещается на внешнем накопителе компьютера (РДВН). Если ошибка обнаружена (блок 4), то сведения о ней выводятся на терминальное устройство (ВТУМО), например, дисплей или принтер. На следующем этапе (блок 5) происходит идентификация ошибки (ИО). Затем (блок 6) выполняется обращение к массиву первичных документов и поиск соответствующего ошибочного

документа (ПОД). На следующем этапе (блок 7) происходит определение и (или) вычисление вручную достоверного значения показателя документа (ОВДЗД).

Ошибки в документах могут иметь самые различные модификации. Дефект может состоять в отсутствии (пропуске) значения показателя в до-кументо-строке (документо-графе), искажении значения показателя документа и др. Искажение значения показателя (данного в записи) может быть допущено за счет недостающего или лишнего числа символов в значении показателя, искажения какого-либо символа, внедрения в цифровое значение алфавитного символа или транспозиции («наползания») символов одного значения на другое и др. На следующем этапе (блок 8) происходит заполнение оператором корректировочного бланка (ЗКБ) достоверными значениями показателей с указанием режимов корректировки - «замена», «удаление», «вставка» и др. Далее данные «Корректировочного бланка» вводятся в компьютер и таким образом ошибки исправляются. На схеме видно, что процедуры контура 2 по сравнению с процедурами контура 1 составляют значительную долю трудозатрат и времени на этапах ТПОД.

В решении задачи улучшения КФИС необходимо исходить из принципа максимального перевода функций контроля достоверности и полноты данных на компьютер. Нужен такой метод контроля, который обеспечивал бы не только обнаружение ошибок, но и их автоматическое исправление. Средством реализации такого метода может быть алгоритм и разработанная на его основе программа. Эта программа могла бы в значительной мере минимизировать ресурсоемкость исправления дефектов (см. рис. 1, блоки 5 - 8), обеспечить модернизацию ТПОД в задачах улучшения КФИС и перспективность подобного подхода [4. С.12]. Программа должны обнаруживать ошибки, вычислять достоверное значение элементов документа, например реквизитов-оснований табличного документа, заменять ошибочное значение на вычисленное достоверное значение. Кроме того, программа в интерактивном режиме должна по ходу коррекции ошибок выдавать оператору сообщения об адресах и модификациях исправляемых ошибок на принтер или видеотерминал.

Эффективность реализации алгоритма и программы возможна на основе соответствующей модели. Эта модель должна, прежде всего, обеспечить описание и объяснение процесса автоматической коррекции ошибок. Описание и объяснение предполагает необходимость анализа структуры и

свойств табличных документов на основе модели, представленной на рис. 2.

Б = (!ь ! ., ■■■, ds,..., йк)

\В а\ Ъ\ Ъ2 ЪУ Ъп Ъп+1

а1 д11 д12 дц д1п д 1,п+1

а2 д21 д22 д2і д2п д2.п+1

а/ д,1 ді2 да діп ді,п+1

ат дт1 дт2 дті дтп дт,п+1

ат+1 дт+1.1 дт+1,2 дт+1,і дт+1,п дт+1,п+1

Рис. 2. Модель табличного документа

Эту модель можно отобразить следующим образом:

Є = <0к, А, В, Б), (1)

где 0к = \\ду\\ (і = 1, т ;у = 1, п) - матрица документа; ду - реквизиты-основания (числа), отражающие количественное состояние объектов; А - кортеж реквизитов-признаков (наименование строк таблицы), отражающий качественные стороны состояния объектов; В - кортеж реквизитов-признаков (наименования столбцов таблицы), отражающий качественные стороны состояния объектов; Б - кортеж реквизитов-признаков, отражающий качественные стороны состояния объектов общего уровня и относящиеся как к А, так и к В; д,п+\, дт+\,] - реквизиты-основания типа «итого», «всего» или контрольные суммы соответственно по строкам и столбцам, отражающие количественное состояние объектов.

Рассматриваемая модель табличного документа в определенном допущении может быть представлена в синтаксическом отношении как кодовый ансамбль. В этом ансамбле информационные группы отображаются совокупностью значений показателей по документо-строкам и (или) документо-графам, а также контрольными суммами и (или) значениями показателей типа «всего» и «итого». Например, в годовом многотабличном отчете вуза государственной статистики по форме 3-нк, в таблице, содержащей данные по распределению студентов по курсам и специальностям, имеется строка

01 с контрольными суммами значений показателей по графам (см. рис. 2, ат+1), а также графа «Итого» с контрольными суммами значений показателей по строкам таблицы (см. рис. 2, Ъп+1). В данном случае контрольные суммы обладают своеобразными свойствами синдромов, т. е. опознавателей ошибок. Указанные связи между значениями элементов матрицы табличного документа обеспечивают потенциальную возможность автоматического обнару-

жения ошибок и их исправление без непосредственного участия оператора компьютера. С учетом выявленных выше свойств взаимосвязи элементов матрицы документа представим модель алгоритма автоматического восстановления достоверности показателей документов табличного вида.

Исходя из анализа природы реквизитов-оснований, наблюдается взаимосвязь элементов типа арифметического баланса:

ч„

]=1

Чш+\,і Чі] ■

(2)

(3)

і=1

При условии внесения ошибки в какой-либо элемент Ч] на этапах обработки нарушаются условия соотношений типа (2), (3). С целью автоматического обнаружения ошибок и их исправления при вводе в ЭВМ указанные соотношения проверяются программно. Сначала проверяется равенство

т п

2 Чі,п+1 = 2 Чт+1,] . (4)

,=1 ]=1

Если равенство не соблюдается, то на принтер или дисплей, в рамках протокола ввода документов в компьютер, выдается сообщение об отсутствии равенства указанного типа и идентификатор документа. Если же равенство (4) соблюдается, то проверяется далее условие

2

]=\

Ч] = Чі,п+1.

(5)

Если в і-й строке не выполняется равенство

2

]=\

Ч- = Ч- ,

і ] і ,п+1

(6)

то производится замена строки г на строку с элементами

Ч-]■ =

Чт+1, ] 2 ЧУ ,

(7)

после чего на принтер выдается сообщение об ошибке и ее исправлении с указанием индекса документа, а также значение замененного ошибочного реквизита-основания и заменяющего достоверного реквизита-основания.

Если же условие (5) нарушается более чем в одной строке, то для столбцов матрицы проверяется условие

2 Ч і] = Чт+1, ].

(8)

і=\

Если же нарушение условия имеет место в одном столбце

2 Ч і] * Чт+1, ] ,

(9)

]=\

то столбец ] заменяется на столбец с элементами

Ч] = Чт+1] -2 Ч], (10)

] * ]

а на принтер выдается сообщение об ошибке и ее исправлении.

Если же нарушения происходят более чем в одном столбце, то на дисплей или принтер выдается сообщение об ошибках с обозначением модификации ошибок и их адресов. Следует заметить, что при условии какой-либо ошибки, например транспозиции (перестановки) ч у, Чі,]+\, нарушается условие (2). Это и идентифицируется как ошибка относительно чт+\,] и Чт+\,]+\. Обнаружение выполняется не только в случаях транспозиции, но и при других различных искажениях лексического, синтаксического, логического и арифметического свойства по набору Ч ] каждой отдельной строки и (или) столбца матрицы документа. Таким образом, алгоритм ориентирован на программное исправление однократных и обнаружение многократных (т.е. всех) ошибок относительно каждой строки и (или) столбца матрицы контролируемого документа.

На основе модели разработаны структура программы, машинный алгоритм и соответствующая программа на языке Ассемблер. Структура программы представлена на уровне блоков на рис. 3. В блоках 6 - 10 происходит обработка ошибок по их модификациям, описание которых приводится ниже.

Рис. 3. Структура программы «Автоматическое обнаружение ошибок и восстановление достоверности показателей документов табличного вида»

Блок сопряжения 1 с системой подготовки данных (СПД) информационной системы осуществляет интерфейс между программой и СПД (блок 0). В режиме открытия блок сопряжения сохраняет адрес модуля печати СПД, в дальнейшем печать диагностической информации осуществляется через СПД. В режиме закрытия выполняется завершение работы программы. В рабочем режиме выполняется анализ описания свойств данных (ОСД) входных документов и очистка рабочих полей.

Блок контроля документов (БКД) 2 служит для выработки пятиразрядного кода завершения, в дальнейшем код завершения используется как номер подпрограммы обслуживания, максимальное значение которого может быть 25, т. е. 32. БКД получает от СПД адрес документа и число строк в этом документе. Если имеется графа с номером строки, то она в контроле не участвует и используется при выдаче диагностических сообщений. Остальные графы образуют матрицу, в которой графа КС содержит контрольные суммы по каждой строке.

Одним из принципиальных вопросов является разработка алгоритмов программ обработки и контроля данных. В качестве примера приведем описание редуцированного алгоритма программы, модель которого описана выше. Контроль матрицы документа выполняется в соответствии с алгоритмом программы, представленным на рис. 4. В программе выделяется число рабочих ячеек, в которых происходит накопление суммы при чтении каждой строки в графах с 1-й по КС. Одновременно производится суммирование всей строки, полученное значение сравнивается с величиной, записанной в графе КС. При условии несовпадения (неравенства) взводится признак ошибки в строке ЕСЬ. Таким же образом контролируются остальные строки матрицы.

При вводе строки 01 производится сравнение накопленных сумм по графам и соответствующим значениям, записанным в строке 01, например, графы с 1-й по 15-ю. При несовпадении накопленной суммы взводится признак ошибки в графе ЕСО. При несовпадении накопленной суммы по графе КС взводится признак ошибки 8 КС. Если вычисленная сумма по строке 01 не равна заданной, то взводится признак 801. Если сумма не равна вычисленной сумме по графе КС, то взводится признак 801КС. При отсутствии признаков ошибок программа переходит к контролю следующего документа.

Если обнаружена одна ошибка, выдается сообщение: «В документе ХХХХХ УУ обнаружена

ошибка». При этом с помощью кода завершения выбирается соответствующая подпрограмма обслуживания. Если обнаружено более одной ошибки, выдается сообщение: «В документе ХХХХХ УУ обнаружено более одной ошибки».

Подпрограмма печати адресов ошибок получает управление каждый раз, когда в документе обнаружено более одной ошибки. При этом каждая строка с ошибкой сопровождается сообщением: «Строка ХХХХХХ содержит ошибку» и соответственно каждая графа с ошибкой сопровождается сообщением: «Графа ХХ содержит ошибку».

Рис. 4. Блок-схема алгоритма программы «Автоматическое обнаружение ошибок и восстановление достоверности значений показателей документов табличного вида»: 1 - СПД; 2 - Рабочий режим?; 3 - Режим открытия?; 4 - Режим закрытия?; 5 - АВБЕМЭ и 0001; 6 - Подготовка к работе; 7 - Завершение работы; 8 - Строка 01?; 9 - Есть ошибка в строке?; 10 - Первая ошибка?; 11 - ЕСЬ:=1; 12 - Печать обозначений ошибочных строк и граф; 13 - Последняя графа?; 14 - Есть ошибка в графе?; 15 - Первая ошибка?; 16 - ЕСО:=1; 17 - Сумма строки 01=графе КС?; 18 - Сумма по строке 01 = заданной?; 19 - Сумма по графе КС = заданной?; 20 - Б01КС:=1; 21 - Б01:=1; 22 - БКС:=1; 23 - Печать адресов ошибок

Подпрограмма СС06 (см. рис. 3, блок 7) получает управление, когда вычисленная контрольная сумма по строке 01 равна вычисленной контрольной сумме по графе КС и не равна заданной контрольной сумме, т. е. оператор допустил ошиб-

ку в подсчете контрольной суммы. Подпрограмма заменяет ошибочное число на вычисленное достоверное и выдает сообщение: «Строка 01, графа КС, значение ХХХХ скорректировано на УУУУ».

Подпрограмма СС11 (см. рис. 3, блок 8) получает управление при условии ошибок в контрольной сумме в графе ХХ. Ошибочная контрольная сумма заменяется на правильно вычисленную, и выдается сообщение: «Строка 01, графа ХХ, значение ХХХХ скорректировано на УУУУ».

Подпрограмма СС21 (см. рис. 3, блок 9) получает управление, если есть ошибка в контрольной сумме одной из строк. Производится замена ошибочного реквизита-основания на вычисленное достоверное с последующей выдачей сообщения: «Строка ХХХХХХ, графа КС, значение ХХХХ скорректировано на УУУУ».

Подпрограмма СС24 (см. рис. 3, блок 10) получает управление при наличии ошибки в одной из строк и в одной из граф. Ошибочное число, расположенное на пересечении ошибочной строки с ошибочной графой, заменяется на вычисленное достоверное. При этом выдается сообщение: «Строка ХХХХХХ, графа УУ, значение ХХХХ скорректировано на УУУУ».

Блок переходов (см. рис. 3, блок 3) осуществляет передачу управления на соответствующую подпрограмму обслуживания, используя код завершения. В случае если для какого-либо кода завершения нет подпрограммы обслуживания, управление передается на печать кода завершения (см. рис. 3, блок 5).

Подпрограмма печати кода завершения получает управление, если для кода завершения, выработанного блоком БКД, нет соответствующей подпрограммы обработки. При этом полученный код может быть распечатан средствами подпрограммы СС00 (см. рис. 3, блок 6) в виде «Некорректируемая ошибка с кодом ХХХХХ», где приняты следующие обозначения:

ІХХХХ-БСЬ - признак ошибки в строке;

ХІХХХ-БСО - признак ошибки в графе;

ХХІХХ-8КС - ошибочная контрольная сумма по графе КС;

ХХХІХ-801 - ошибочная контрольная сумма по строке 01;

ХХХХІ-801КС - сумма по графе КС не равна сумме по строке 01.

Объем программы составляет 586 операторов и занимает 4 Кбайта оперативной памяти. Программа не накладывает ограничений на способы ввода документов в компьютер. Документы в

ЭВМ могут быть введены через магнитные и оптические носители, каналы передачи данных и сканирующие устройства в зависимости от конкретных условий обработки данных и характера решаемых задач.

Проверка адекватности модели и работоспособности программы автоматической коррекции ошибок в документах табличной структуры проводилась путем экспериментальной обработки данных в рамках планирования эксперимента [2. С. 163].

Таким образом, оценка эффективности программы по результатам эксперимента показала следующее. Общее время работы программы, как с включением программы в СПД, так и без включения, одинаково и составило 2 мин на обработку 20 отчетов, взятых для эксперимента. Однако время работы процессора компьютера по реализации операций входного контроля отчетов не равнозначно относительно указанных вариантов контроля. Так, например, время работы процессора с включением программы в СПД составило 38,02 с. Процессорное время контроля без применения рассматриваемой программы (только средствами СПД) составило 44,98 с. Применение программы сократило время работы процессора на 6,96 с, т. е. на 15,5 %. Кроме того, взаимодействуя с СПД, программа минимизирует объем бумаги на распечатку диагностики ошибок. В любом случае посредством рассматриваемой программы на принтер выдаются более краткие и вместе с тем более информативные сообщения об адресе, модификации и исправлении ошибок. Так, например, распечатка диагностики ошибок по протоколу ввода и контроля 20 отчетов при условии включения рассматриваемой программы в СПД заняла 8 листов бумаги формата 207x210 мм. Распечатка диагностики указанных отчетов без включения программы, т. е. только средствами СПД, заняла 14 листов бумаги указанного формата. Таким образом, применение программы уменьшает расход бумаги ориентировочно до 40%.

ЛИТЕРАТУРА

1. Исаев Г. Н., Рождественский А. М. К вопросу повышения достоверности данных в автоматизированных информационных системах // Кибернетика и вуз. Томск: ТПИ. 1974. Вып. 8. С. 52 - 60.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

2. Исаев Г. Н. Управление качеством информационных систем. М.: МИРЭА. 2003.

3. Ritberger, M., Informationsgualität. Grundlagen der praktischen Information und Dokumentation. 5., völlig neu gefasste Ausgabe, band 1, K.G.Saur. München. 2004. s.315 - 320.

4. Патент RU № 52221 U1. Устройство для автоматического определения и коррекции ошибок в табличных документах / Исаев Г. Н. Бюллетень Федеральной службы по интеллектуальной собственности, патентам и товарным знакам № 7 от 10.03.2006.

Поступила 02.03.2011 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.