Научная статья на тему 'Информационное обеспечение процессов управления'

Информационное обеспечение процессов управления Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
4832
491
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Салмин Сергей Павлович

Информационные системы стали неотъемлемой частью современного цивилизованного общества. Постоянно совершенствуется информационная оболочка общества, которая сейчас немыслима без компьютеров, баз данных. Мы живем в эпоху стремительного развития компьютерного обеспечения нашей жизни, когда в связи с переводом информационных технологий управления на новые высокоуровневые платформы такие понятия, как «АИС», «ЭВМ», «большая ЭВМ», «мини-ЭВМ», «микро-ЭВМ», еще недавно воспринимавшиеся с почтением, постепенно исчезли из повседневного употребления. Статья посвящена современным взглядам на информационное обеспечение.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Информационное обеспечение процессов управления»

li95(11)2007

С.П. Салмин

Информационное обеспечение процессов управления

Информационные системы стали неотъемлемой частью современного цивилизованного общества. Постоянно совершенствуется информационная оболочка общества, которая сейчас немыслима без компьютеров, баз данных. Мы живем в эпоху стремительного развития компьютерного обеспечения нашей жизни, когда в связи с переводом информационных технологий управления на новые высокоуровневые платформы такие понятия, как «АИС», «ЭВМ», «большая ЭВМ», «мини-ЭВМ», «микро-ЭВМ», еще недавно воспринимавшиеся с почтением, постепенно исчезли из повседневного употребления. Статья посвящена современным взглядам на информационное обеспечение.

Развитие электронной обработки данных (ЭОД, EDP — electronic data processing) в направлении новых компьютерных (электронных)управленческих технологий (новых информационных технологий — НИТ, автоматизированных информационных технологий — АИТ) представляет собой магистральный путь модернизации, интенсификации и повышения уровня организации и управления промышленными, транспортными, сельскохозяйственными и другими предприятиями всех отраслей, как производственного, так и непроизводственного секторов и, что весьма существенно — финансовой и банковской сферы. При этом НИТ/АИТ являются ключевым элементом научно-технического прогресса во многих областях человеческой деятельности. Электронная обработка данных становится доминирующей отраслью использования средств вычислительной техники наряду с микропроцессорным управлением технологическими, робототехническими и гибкими автоматизированными комплексами. Численные расчеты на ЭВМ отходят на второй план по своему значению и удельному весу. Наступает (точнее — уже наступило) время безбумажной информатики, которая должна обеспечить техническую возможность существенной модернизации ме-

тодов управления в условиях возрастания роли рыночных компонент в народном хозяйстве и перехода от чисто административных (прямых) методов управления к экономическим (косвенным). Более того, экономическая деятельность все больше переходит в виртуальный мир, замена наличных расчетов безналичными перерастает в электронные счета и платежи. Мир третьего тысячелетия превращается во все более и более тесно связанный экономический организм, нервные волокна которого — электронные и компьютерные коммуникационные сети — играют постоянно возрастающую роль.

Мощные импульсы развития новых информационных технологий генерируются как экзогенными факторами общего комплексного развития производительных сил и научно-технического прогресса, так и эндогенным научно-техническим и технологическим прогрессом в самой отрасли обработки данных, важнейшими факторами которого являются:

• развитие элементной базы и конструктивное усовершенствование ЭВМ, разнообразие технических средств хранения, передачи и обработки данных (ОД), а также вспомогательных средств информационной

62

№>5(11)2007

техники, возрастание объемов памяти до триллионов байт, скоростей передачи — до миллионов байт в секунду, скоростей обработки — до сотен миллиардов операций в секунду, совершенствование компьютерных сетей;

• развитие технологии программирования в направлении превращения деятельности производителя программного обеспечения в разновидность индустриального высокопроизводительного и при этом высокоинтеллектуального труда и связанное с этим появление новейших суперкомплексов программного обеспечения, наиболее впечатляющим из которых является, возможно, шахматная программа, побеждающая чемпиона мира;

• развитие методов построения и динамического ведения структур данных и программных структур, которые в современных технологиях скрыты во внутреннем механизме индустриальных программных комплексов;

• совершенствование методов взаимодействия «человек—компьютер», внедрение новейших методов построения автоматизированных рабочих мест обработки данных (АРМ ОД), дружественных сопряжений1, технологии диалоговых окон и применение всех этих подходов в системах обработки экономической информации;

• использование методов электронной обработки данных, основанных на принципах аккумуляции человеческого знания, опыта и интуиции в форме таких новейших программно-аппаратных средств, как интеллектуальные пакеты различного назначения, базы знаний, экспертные системы, нейрокомпьютерные сети;

• комплексное использование всех результатов прогресса в указанных областях в форме промышленных НИТ/АИТ и автоматизированных информационных систем (АИС).

С позиций экономической науки нельзя Л

не отметить основные факторы прогресса, |

характерные для современного этапа раз- ^

вития автоматизированных информацион- ^ ных систем и технологий [1, 2].

1. В современном процессе мировой народнохозяйственной интеграции и глобализации экономических процессов их управляемость и предсказуемость тончайшим образом зависят от мировых информационных связей. Вполне правдоподобным выглядит предположение, что устойчивость мировой хозяйственной системы в значительной мере зависит от скорости реакции основных центров экономической мощи на происходящие изменения, а значит и от быстродействия глобальных компьютерных сетей и информационных систем.

2. Передача информации во все большей степени становится определяющим фактором научно-технического и, следовательно, экономического прогресса. Одна из трех технических революций второй половины ХХ века непосредственно связана с развитием информатики и информационных технологий (информационная революция), тогда как «зеленая революция» (прогресс в области распространения передовых сельскохозяйственных технологий в мире в 60-70-е годы) многим обязана именно информационной технике и технологии. Третья революция — революция энергосберегающих технологий — также базируется на мощном информационном фундаменте. Кроме того, менее кардинальные новшества, такие как формуляры (стандартизованные характеристики лекарственных средств) в области фармакопеи — также чисто информационное достижение.

3. Информационная отрасль во всех разновидностях своей деятельности: от

1 Обычно под дружественным сопряжением понимается оснащение диалогового терминала такой совокупностью диалоговых средств, которая в максимальной степени способствует эффективности усвоения технологии общения и самого общения «пользователь — информационная система».

63

Не5(11) 2007

1 I

К

со

0

U

1

0 &

1

is

Её

£ о <и

о g

о §

средств массовой информации и шоу-бизнеса до автоматизированных научных библиотек, информационных систем и вычислительных центров, обрабатывающих данные на вполне индустриальной основе, и до транснациональных корпораций, поставляющих аппаратное и программное обеспечение для информационных предприятий и для целей автоматизации управления предприятиями отраслей материального производства — превратилась в важнейшую область промышленной деятельности, опережающую по экономическим параметрам многие традиционные отрасли. Развитие информационной отрасли естественным образом приводит к развитию информационного менеджмента и информационного бизнеса как самостоятельных ветвей менеджмента и бизнеса.

4. Совершенствование менеджмента в производственной сфере, внедрение интегрированных технологий управления (например, SAP — System application packages — одна из современных технологий создания интегрированной системы управления, базирующаяся на использовании компьютерных сетей и крупномасштабных систем баз данных), реинжиниринг бизнес-процессов как модернизация информационной основы управленческой деятельности в новых, чрезвычайно напряженных условиях динамичной конкурентной среды существенно повышают уровень требований к организации производственных отношений и не последней в этом ряду становится необходимость овладения компьютерными технологиями организационного назначения. Так, внедрение средств orgware (современного программного обеспечения, интегрирующего разнообразные функции управления производством, например, такие пакеты, как «Галактика», «1C: Предприятие», Infosoft Integrator и др.) существенно повысило требования к пользователям автоматизированных средств обработки данных.

5. Информация как субстанция становится существенным ресурсом обществен-

ного производства, в связи с чем наряду с понятием «экономическая информация» все большее распространение получают такие понятия, как «экономика информации», «цена информации», «затраты и себестоимость обработки, хранения и передачи информации». Расширяется признание прав собственности на информационные объекты и необходимости учета и оценки соответствующих нематериальных активов.

Все вышесказанное вызывает у многих экономистов мысль, что к традиционно рассматриваемым рынкам товаров и услуг, капиталов и трудовых ресурсов следует добавить в качестве самостоятельного еще и информационный рынок. Таким образом, понятия «информационный рынок», «информационная система» и «обработка экономической информации» неотделимы от модернизации и повышения эффективности процессов управления в экономических системах на микро-, мезо- и макроэкономическом уровнях.

Информация как основа целенаправленной управленческой деятельности

Понятие «информация», лежащее в основе электронной обработки данных и информационного моделирования в любой предметной области, является фундаментальным для разнообразных процессов управления в природе, технике и обществе. Информация является первичным и основополагающим понятием для информатики, обработки данных и информационных технологий и информационного моделирования в любых прикладных отраслях, в совокупности своей образующих собственную межотраслевую предметную область. Информация — это не только фундаментальное понятие этой предметной области, но и, наряду с понятием «система», она играет значительную роль в большинстве научных дисциплин, представляя определенное соединительное звено между точными, естественными и гуманитарными дисциплина-

64

ми. Поэтому вполне обосновано мнение о том, что информацию следует рассматривать как первоначальное понятие, неопределяемое через другие. Известные определения в большинстве случаев поясняют смысл и содержание термина «информация», не являясь определениями в обычном понимании.

Так, согласно энциклопедическому словарю, «информация (лат. разъяснение, изложение), первоначально — сведения, передаваемые людьми устным, письменным или другим способом (с помощью условных сигналов, технических средств и т.д.); с середины двадцатого века — общенаучное понятие, включающее обмен сведениями между людьми, человеком и автоматом, автоматом и автоматом, обмен сигналами в животном и растительном мире, передачу признаков от клетки к клетке, от организма к организму; одно из основных понятий кибернетики».

Мы видим, что понятие «информация» включает обмен ощущениями или представлениями между людьми, возможно, с применением технических средств, а также отражение объективной реальности в объектах материального мира, не обязательно связанное с человеческим сознанием. Важно подчеркнуть, что информация — это одно из фундаментальных понятий, восходящих к философским основам гносеологии. Для понимания его сути продуктивным является следующее утверждение.

Под информацией принято понимать все, что меняет содержание знаний приемника информации относительно того предмета, о котором поступает информация.

Особенности информации как продукции, произведенной для удовлетворения тех или иных потребностей индивидуальных либо групповых субъектов, могут быть достаточно полно учтены в рабочем определении, представленном в работе [3]:

«Информацией (информационным продуктом, интеллектуальным продуктом, продуктом духовного или нематериального производства и т.п.) принято называть

№>5(11)2007

вещь или действие (продукт или услугу), ко- Л торые: Л

а) предназначены их производителем ^ для доставки определенного знания получателю (потребителю);

б) способны пополнить знания последнего без проведения им каких-то специальных, нетипичных для него познавательных действий.

Таким образом, информация — это те продукты и услуги, которые предназначены их производителем для передачи знаний в максимально доступной для потенциального потребителя форме.»

С концептуальной точки зрения, в информационном процессе всегда участвуют:

• источник информации;

• материальный канал передачи информации;

• материальный носитель информации;

• приемник информации;

• предмет (содержание) информационного сообщения;

• первоначальные знания приемника информации о предмете информационного сообщения;

• приращение знаний приемника информации в результате приема информационного сообщения;

• осознание приемником информации степени ее полезности.

Любой источник и любой приемник информации (в частности, любая пара «управляющая система — управляемый объект») содержат в себе определенный накопленный запас сведений (информационный фонд) о релевантных (существенных для процесса и целей деятельности системы) объектах, событиях или фактах и имеют свою предметную область (область знаний или деятельности данного источника либо приемника), а также свой тезаурус.

Тезаурус (греч. thesauros — сокровище) — это хранилище знаний. С информа-

^65

И95(11)2007

1 I

К

со

0 и

1

0 &

1 $

Её

£ о <и

о ^

0 §

1

ционной точки зрения тезаурус — это совокупность средств и способностей не только воспринимать информацию, но и перерабатывать ее для достижения определенных системных целей.

На основе тезауруса воспринимаются:

1) синтаксис или формат сообщения — совокупность правил, которым должна соответствовать структура информационных сообщений, передаваемых в виде последовательности знаков, для того чтобы приемник мог воспринять и обработать ее;

2) семантика сообщения, т. е. смысл или содержание сообщения, которое как раз и изменит знания приемника информации.

Сообщение может обладать семантикой для приемника информации, только если оно в определенной степени соответствует его тезаурусу. Например, сообщение на японском языке несет некоторое содержание лишь для лиц, владеющих этим языком. Человек, им не владеющий, сможет сделать некоторые выводы о содержании сообщения, если, допустим, располагает на своем компьютере качественной программой перевода с японского языка на другой, знакомый ему язык. В этом случае компьютер предоставляет своему владельцу дополнение к тезаурусу, необходимое для понимания сообщения.

Технически под тезаурусом понимают специально организованный большой словарь, относящийся к соответствующей предметной области.

Канал связи обычно реализуется с помощью физического носителя информации. Носитель — это физическая среда, с помощью которой информация отображается, передается или хранится. Информация передается в пространстве соответствующими техническими устройствами (телефон, телеграф, спутниковые каналы связи и др.). Информация передается также во времени. Под этим понимают ее запоминание на носителе для последующего использования. Поэтому любая информационная система

имеет системную память — совокупность носителей для размещения на них внутри-машинного информационного фонда.

Данные — знаковая основа передачи сообщений

В информационных системах принято различать понятия «информация» и «данные».

Данные — это знаковые совокупности на носителе, используемые для передачи или хранения информации. Данные обычно расположены в соответствии с некоторой заданной структурой. Структура данных — в общем то же, что и синтаксис. Данные могут нести или не нести информацию в зависимости от их соответствия тезаурусу приемника данных.

Основным типом носителя экономических данных для внутримашинного информационного фонда остаются на сегодняшний день магнитные носители. В частности, наибольшее распространение получили гибкие и жесткие съемные и постоянные магнитные диски. Основными техническими характеристиками магнитных носителей данных являются объем, надежность и быстродействие. Поддержание надежности магнитных носителей подразумевает использование соответствующих технологий защиты данных на носителях.

Вся совокупность автоматизированных управленческих процедур, образующих автоматизированную информационную технологию управления, базируется на иерархии информационных фондов, начиная от традиционных некомпьютерных и заканчивая самыми современными, с использованием наиболее производительных, надежных и емких носителей, аппаратных и программных средств. Данные во внутри-машинном информационном фонде (на машинном носителе) не могут существовать вне их формата, поскольку их обработка на компьютерах возможна лишь при условии наличия определенной структуры данных, используемой в программах обработки.

66

Формат (структура, синтаксис) любых данных основан на следующих понятиях.

1. Алфавит — конечная совокупность знаков (так, русский алфавит базируется на кириллице, в основу английского алфавита положен латинский). В машинной обработке данных используется машинный алфавит, включающий в себя, кроме букв, цифры, специальные знаки, а также знаки препинания. Современные средства обработки данных обычно содержат в себе возможность оперативного перехода от одного алфавита к другому, а также графические средства создания символов, отсутствующих в имеющихся алфавитах.

2. Правила размещения данных (собственно синтаксис или формат).

Принято различать:

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

• фиксированный, или жесткий формат данных. В фиксированном формате обязательно выделены единицы данных (обычно небольшое количество их разновидностей), причем для каждой из единиц данных устанавливается имя и область (множество) допустимых значений, т. е. данные в фиксированном формате представляют собой совокупность значений некоторого фиксированного набора переменных;

• свободный формат данных — это способ форматирования документов, при котором специфические единицы данных не выделяются, а структура сообщения строится аналогично сообщению на естественном языке (т. е. на том, на котором мы говорим и пишем — на русском, английском, итальянском и др.). Сообщение в свободном формате может содержать графическую, формульную информацию, рисунки и т.д.

Дальнейшие разделы данной статьи посвящены как анализу основ построения отдельных компонент современных систем обработки данных, так и синтезу подсистем и системы в целом на различных уровнях иерархии управления.

Нв5(11) 2007

Схема информационных потоков =§ в компьютеризованной системе | организационного управления ^

Качество управления субъектом хозяй- ^ ствования определяется качеством принимаемых решений и точностью их реализации. Субъект хозяйствования может быть рассмотрен как совокупность управляющей подсистемы (подсистемы принятия решений) и управляемой производственно-технологической подсистемы.

При выработке оптимальных хозяйственных решений лица, принимающие решения (ЛПР), оперируют в своей повседневной деятельности массивами данных, составляющих информационный фонд компьютеризованных информационных систем и подсистем, реализуя порученные им информационно-управленческие задачи.

ЛПР являются в рамках АИТ пользователями автоматизированных рабочих мест, терминалов систем обработки (экономических) данных и экономических информационных систем, а также автоматизированных систем управления. Таким образом, важнейшим элементом реализации управленческого процесса становится обработка экономических данных, выполняемая работниками, вооруженными средствами НИТ/ АИТ.

Применяемые в автоматизированной обработке данных технологические операции бывают в основном следующих типов.

1. Операции преобразования информационных сущностей, относящиеся к выработке управляющих воздействий, в которых целью переработки информации о состоянии и изменениях в управляемом объекте является получение предлагаемого варианта действий, оптимального или квазиоптимального решения либо прогноза дальнейшего состояния управляемого объекта (прямая связь: система управления ^ управляемый объект).

2. Операции над информационными

сущностями, относящиеся к получению ин-

^67

Н95(11)2007

формации об актуальном состоянии и изменениях в управляемом объекте, а также реакции объекта на управляющие воздействия в наглядном и обозримом, детальном или обобщенном виде (обратная связь: управляемый объект ^ система управления).

3. Операции преобразования информационных сущностей, относящиеся к поддержанию информационного фонда в работоспособном, устойчивом и стационарном состоянии, т. е. служебные операции поддержки (ведения) информационного фонда.

В современной практике управленческой деятельности наибольший удельный вес автоматизированных операций принадлежит второму типу (учет и контроль). Операции первого типа(планирование и оперативное управление) автоматизированы в меньшей степени, значительный объем принимаемых управленческих решений и выработки управленческих воздействий возлагается на человека-управленца.

Экономические информационные системы по своей природе являются человеко-машинными. Наиболее эффективным ре-

жимом работы подобных систем оказывается режим диалога «человек-ЭВМ», а учет человеческого фактора в вопросах как их эксплуатации, так и использования получаемых данных становится ключевым во всех постановках, связанных с данной проблематикой. Любого сотрудника, в чьи служебные обязанности входит работа с компьютеризированной информационной системой, а также практическое применение результатов подобного диалога, принято называть пользователем автоматизированной ЭИС или отдельного терминала ЭВМ. В качестве пользователя может также рассматриваться определенная организационная структура. Деятельность пользователей информационных систем остается важнейшим неформализуемым фактором их функционирования.

На рис. 1 схематически изображены потоки информации (данных) при управлении некоторым объектом (предприятием).

В некотором смысле данный рисунок представляет собой детализацию взаимодействия управляющей и управляемой подсистем. Прямоугольники здесь обобщенно изображают структурные подразделения

1 I

К

со

0 и

1

0 &

1 $

Её

£ о <и

о ^

0 §

1

Рис. 1. Схема движения сообщений в информационно-управляющей системе

68

управления предприятием, тогда как овальные фигуры — потоки информации (данных). Обратим внимание, что поток данных включает в себя как передачу, так и хранение данных. Блок 3 представляет собой управляемый экономический объект, скажем, цеха основного производства, отдельный цех или завод в целом. Этот блок единственный, который представляет собой управляемую производственно-технологическую систему, тогда как все остальные блоки раскрывают работу информационно-управляющей системы предприятия.

Важно представлять себе, что на схеме отображены только потоки данных, т. е. документы на бумажном или машинном носителе (а также, возможно, передаваемые по линиям связи в сети ЭВМ). Эта схема не имеет цели отобразить материальные потоки в производстве. Для блока 3 входной поток (стрелка из блока 2) представляет собой приказы, распоряжения дирекции, плановую, нормативную и технологическую информацию. Выходная стрелка к блоку 4 представляет собой данные о результатах основной производственной деятельности, т.е. сообщения о выпуске продукции, затратах материалов, данные по учету трудозатрат и результатов труда. Входные данные объединены в блоке 2 — управленческие воздействия, тогда как блок 4 включает в себя все указанные данные первичного учета. В результате мы имеем дело со следующими сообщениями:

• прямая связь — блок 2;

• обратная связь — блок 4.

На схеме видно, что управляющие воздействия формируются в блоке 1 — управляющем органе того уровня управления, для которого рассматривается данная схема. Это может быть руководство цеха, заводоуправление, дирекция акционерного общества или какого-либо его подразделения. Существенно, что управляющие воздействия вырабатываются на основе большого объема информации, содержащегося в со-

№>5(11)2007

общениях обратной связи, проходящих по Л достаточно сложным маршрутам. Данные | первичного учета, поступающие непосред- ^ ственно с производства, непригодны для их ^ анализа руководством из-за большого объема и обилия подробностей, несущественных для управленцев высшего уровня. Скажем, для руководства предприятия или фирмы несущественны показатели дневного выпуска по каждому виду продукции и цеху. Однако представляют интерес данные об отклонениях от графика и о том, где именно они имели место.

Поэтому любая структура управления предусматривает использование аналитических служб, обрабатывающих данные первичного учета и рассчитывающих определенные показатели, на основании которых руководство уже может принимать решения. Блок 5 в обобщенном виде представляет собой совокупность подобных служб: производственно-диспетчерские, планово-производственные отделы, отделы сбыта, финансовые службы, отделы труда и заработной платы и т.д. Основным аналитическим подразделением, которое обрабатывает данные первичного учета, является бухгалтерия. Там же готовится основной объем отчетности для вышестоящих и налоговых органов.

Таким образом, связь 3 ^4 ^5 представляет собой обычный способ передачи сообщений для дальнейшей обработки и анализа. Путь 3 ^4 соответствует случаю, когда сообщения (например, сообщения об экстренных ситуациях) поступают руководству без промежуточного анализа.

Информация, обрабатываемая в блоке 5, имеет две существенные разновидности: сообщения, поступающие в руководство на регулярной основе, и сообщения, для генерации которых необходим специальный запрос.

Рассмотрим сначала регулярные сообщения. Подобные сообщения могут проходить по одному из двух маршрутов. Маршрут 5 ^8 реализуется, если сообщение поступает руководству из аналитического

И95(11)2007

1 I

К

со

0 и

1

0 &

1 $

Её

£ о <и

о ^

0 §

1

подразделения и не передается в автоматизированный банк данных (блок 7). Маршрут 5 ^ 6 ^7 соответствует случаю, когда сообщение подлежит хранению во внутримашин-ном информационном фонде и дальнейшей компьютерной обработке. В данном контексте важно отметить роль блока 7 — автоматизированного банка данных (АБД). Этим блоком может считаться подразделение (отдел автоматизированных систем управления (АСУ) или вычислительный центр (ВЦ) предприятия), ответственное за ведение внутримашинного информационного фонда. В современных условиях, несмотря на наличие персональных компьютеров в любом функциональном подразделении, необходимость в централизованном информационном фонде не отпадает. При этом в условиях функционирования на предприятии локальной вычислительной сети связь с блоком 7 может быть электронной.

Данные, обработанные в блоке 7 в режиме регулярного информирования руководства, следуют по маршруту 7 ^ 8 ^1. Необходимо иметь в виду, что локальные контуры компьютеризованного управления могут существовать также и внутри подразделений.

Рассмотрим теперь маршруты данных, предоставляемых по запросам. В данной упрощенной схеме обслуживаются, главным образом, запросы руководства. Запросы адресуются либо непосредственно в аналитическое подразделение (1^ 9 ^5), либо в вычислительный центр (1^ 9 ^7). Ответ на запрос руководства может пройти обычным маршрутом 5 ^8 или через вычислительный центр 5 ^ 6 ^7 ^ 8 ^1. Ответ на запрос, поступивший на ВЦ по маршруту 1 ^ 9 ^7, поступит через 7 ^ 8 ^1. Аналитическое подразделение само может выдавать запросы на ВЦ (5 ^9 ^7) и получать ответы (7 ^ 8 ^5).

Наконец, сообщения из внешнего мира (конъюнктура, ценовая и маркетинговая информация, указания вышестоящих органов, финансовая, налоговая и банковская информация) поступают по маршруту (10 ^1). При этом обратный маршрут (1 ^10) описы-

вает движение отчетной, рекламной и маркетинговой информации, а также информации, которая может являться продукцией деятельности предприятия (ноу-хау, лицензии и пр.).

Рассмотренная схема, будучи предельно упрощенной, все же содержит ряд основных компонент, характерных для систем управления предприятиями:

• контуры прямой и обратной связи;

• аналитические подразделения;

• централизованную и распределенную обработку данных;

• наличие регулярной и выдаваемой по запросам информации;

• разделение схемы на информационно-управляющую часть и производственно-технологическую систему, к которой на рис. 1 относится только блок 3.

Для правильного понимания информационных процессов в рассмотренной схеме необходимо иметь в виду следующие ее особенности.

1. Схема описывает лишь один иерархический уровень управления. Контуры управления низших уровней могут быть скрыты внутри блоков; сама схема в качестве блока может войти в вышестоящую.

2. Использование децентрализованной обработки данных изменяет техническую реализацию системы, но не изменяет принципиального характера взаимодействия ее блоков.

3. Применение АИТ приводит к «переплетению» информационных потоков в информационно-управляющей и производственно-технологической подсистемах. Поэтому эти потоки следует классифицировать по их содержанию, а не по физическому размещению соответствующих носителей, так как значительное количество автоматизированных рабочих мест управленцев размещено непосредственно на складах, в цехах и других производственных подразделениях.

70

Экономическая информация и переход к автоматизированным информационным технологиям управления

Под экономической информацией (ЭИ) понимаются всевозможные экономические или управленческие сведения, необходимые или способствующие принятию тех или иных управленческих решений — все, что может быть отнесено к разряду информации об экономических процессах и финансово-экономическом состоянии определенных субъектов хозяйствования или хозяйственных комплексов.

Экономическая информация — информация об общественных процессах производства, обмена и потребления материальных благ, иными словами, — информация, служащая для отображения теми или иными подходящими средствами свойств, состояния и движения производительных сил и производственных отношений. К категории экономической информации относится большая часть потоков, рассмотренных выше на рис. 1, хотя в контурах управления производством циркулируют также другие разновидности информации (технологическая, административно-распорядительная, социальная и т.д.).

Такие виды сообщений и документов, как сводка биржевых курсов, бухгалтерский баланс, статистическая отчетность, накладная, ордер — суть компоненты потоков или массивов экономической информации, отраженные на определенном носителе. Документ, циркулирующий в системе документооборота предприятия, отрасли и любой системы организационного управления, как правило, является носителем ЭИ. Отметим, что всякий ручной (бумажный) документ в большинстве случаев имеет также юридическую силу, т. е. фиксирует ответственность издателя, оформителя или исполнителя соответствующего документа.

Совокупность упорядоченных, взаимосвязанных и взаимодействующих нормативных, оперативных и иных документальных актов, технических средств, устройств, ор-

№>5(11)2007

ганизационных структур и персонала, заня- Л тых обработкой экономической информации | для достижения определенных целей управ- ^ ления, а также массивов данных, необходи- ^ мых для выполнения этих действий, будем называть экономической информационной системой. Поскольку практически рассматриваются компьютеризированные системы, то иногда используется термин «автоматизированная информационная система» или же аббревиатура ЭИС/АИС.

Экономические данные — это любые последовательности символов на носителе, которые используются для переноса и хранения экономической информации. ЭИС/АИС представляют собой информационные модели производственных систем, вследствие чего в информационном моделировании экономических систем и процессов следует различать уровни моделирования и метамоделирования.

Информационное метамоделирование представляет собой моделирование специальными средствами информационных процессов в ЭИС/АИС — процедуру и инструмент анализа, в котором в качестве объекта моделирования и оптимизации выступают информационные модели (в том числе ЭИС/ АИС) хозяйствующих субъектов и комплексов. Информационное метамоделирование предоставляет определенный арсенал средств исследования НИТ/АИТ, проектирования и эксплуатации ЭИС/АИС.

Качество принимаемых руководством управленческих решений в большой степени зависит от качества информационного обеспечения, включающего в себя подсистемы нормативно-справочного хозяйства (информационно-справочная система), слежения (учет, пополнение и обновление информации), документооборота и т.п.

В старых, в том числе компьютеризированных системах управления, каждое управленческое или производственное подразделение создает свой информационный фонд, при этом подразделение информационно связывается с другими подразделениями предприятия.

Не5(11) 2007

1 I

К

со

0 и

1

0 &

1 $

Её

£ о <и

о ^

0 §

1

При переходе к автоматизированному управлению обычно происходит композиция как объектов данных, так и элементов управленческой парадигмы, по многим направлениям; в результате достигается та или иная степень интеграции управленческой системы. Внедрение интегрированной информационной системы ликвидирует автономные, во многом дублирующие друг друга системы сбора и подготовки данных и сокращает число информационных связей. Интегрированная система позволяет централизовать нормативно-справочное хозяйство, отделить рутинные процедуры ведения информационного фонда от функциональных задач управления, устранить случаи противоречивости в нормативных данных, упорядочить и упростить документооборот. Обеспечивается автоматизированное включение нормативных данных в первичные (вводимые) документы для справочных и расчетных целей, более технологичным и систематизированным становится процесс подготовки и ввода исходных данных, уменьшается возможность ошибок. В этом состоят преимущества интеграции информационного фонда.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Однако интегрированная информационная система — это очень жесткая система, в которую трудно вносить изменения. К надежности интегрированной информационной системы предъявляют повышенные требования. Очевидно, что техническая реализация интегрированного информационного фонда возможна только в современной (естественно, компьютеризированной) информационной системе.

В практике управления не наблюдаются в чистом виде ни полностью интегрированные информационные фонды, ни совокупности отдельных изолированных информационных подсистем. Обычно используется сочетание централизованных и локальных информационных фондов, обеспечивающее разумный компромисс «централизация-дублирование».

Переход к автоматизированным информационным технологиям управления характеризуется следующими особенностями,

определяющими качественные перемены в управленческих процедурах.

1. На экономико-организационном уровне происходит композиция тех отдельных функций управления, которые ранее (функциональная и иерархическая декомпозиция) приходилось разделять по техническим соображениям (невозможность обработки больших объемов информации за короткие промежутки времени). Композиция происходит как в вертикальном (уменьшение количества иерархических уровней управления), так и в горизонтальном (уменьшение количества функциональных подразделений на одном уровне за счет композиции функций) разрезе.

2. На кадровом уровне происходит скачок требований к квалификации работников. Требования к уровню компетентности исполнителей повышаются, возникают проблемы несовместимости новых требований со сложившимися психологическими и технологическими стереотипами. Новое качество работы отражено в концепции управленца как профессионального пользователя ЭИС/АИС.

3. На понятийном уровне вводятся в употребление новые обобщающие, так называемые базисные понятия, в терминах которых синтезируются частные классы объектов из отдельных предметных областей учета и менеджмента. К ним относятся, например, понятия «информационный фонд», «производственно-технологическая и информационно-управляющая подсистема», «генерация документов произвольной формы».

4. На техническом уровне, наряду с вопросами функционирования собственно электронной аппаратуры обработки данных и связи, важное значение приобретают технологии программирования и индустриализация производства программного продукта, вопросы эксплуатации программных комплексов и распределения ответственности между категориями пользователей АИС/ЭИС, работающих в различных предметных областях, а также вопросы легального доступа к интеллектуальной собственности.

72

Рассматривая взаимодействие управляющего субъекта (управляющей системы) с управляемым объектом (работу ЭИС/АИС), следует понимать, что ее основная задача в процессе управления — обеспечение полной, единой,достоверной и своевременной обратной связи, т.е. оперативного отображения переменной во времени картины состояния управляемого объекта. Иными словами, при этом перед нашим взором предстает действующая информационная модель функционирования предприятия, организации или определенной (иногда весьма значительной) экономической подсистемы. Эти операции традиционно относятся к управленческому учету.

Важным в этом смысле является наличие в отображающей системе определенных информационных сущностей, моделирующих соответствующие (релевантные) компоненты реально существующих субъектов хозяйствования и хозяйственных комплексов. Кроме компонент управляемого объекта, в системе отображены отношения между ними и процессы их взаимодействия. Следует различать информационные сущности, отображающие текущее состояние реального объекта, и информационные сущности, содержащие историю (последовательность состояний) некоторого объекта или отношения.

Основной класс подобных информационных сущностей реализован в ЭИС в виде файлов данных. Совокупность информационных сущностей, релевантная управляемому объекту как целому, образует информационный фонд системы управления (внутри- и внемашинный).

Управленческий информационный комплекс как модель

информационных процессов в ЭИС

Введем понятие «управленческого информационного комплекса» (УИК) как обобщенного абстрактного средства моделирования информационного отображения управленческой системы. УИК будет рассматриваться как обобщенная модель широкого

№>5(11)2007

класса информационных взаимодействий в Л

управленческих системах (метамодель в ука- |

занном выше смысле). Управленческий ин- ^

формационный комплекс формально пред- ^ ставляется следующим выражением:

©(¥) = (П, О, М, Р),

где ¥ — функциональный уровень УИК, и соответственно его компонент (реальные системы организационного управления являются, как правило, многоуровневыми);

П = П(¥) — парадигма информационно-управленческой деятельности, причем П = {лг}, где лг есть отображение вида ц8 ^цt, пара(ц8, цt) с М, а индексы г, в, г не превышают уровня УИК, равного ¥; О = О(¥) — управленческая организационная структура (в том числе обученный персонал);

М = М(¥) — операционная часть УИК (в частности, это может быть множество обобщенных баз данных М = {цв} вместе со средствами управления ими, т. е. АБД); Р = Р(¥) — сложившаяся практика реализации правил и принципов управления из П оргструктурой О с использованием обобщенных массивов данных цв из М.

Следует отметить, что обозначение ¥ опускается в тех случаях, когда из контекста не вытекает его необходимость.

Далее дадим менее формальное описание УИК:

= (ПАРАДИГМА, ОРГСТРУКТУРА, = ОПЕРАЦИОННАЯ ЧАСТЬ, ПРАКТИКА),

где ПАРАДИГМА — правовая основа деятельности УИК;

ОРГСТРУКТУРА в совокупности с ОПЕРАЦИОННОЙ ЧАСТЬЮ образует тот «автомат» (или «аппарат»), функционирование которого и обеспечивает управленческий процесс как таковой; ПРАКТИКА представляет собой воплощение ПАРАДИГМЫ, т.е. подмножество фактически исполняемых правил в совокупности со способом их исполнения.

Н95(11)2007

Правильная ПРАКТИКА есть экстенсио-

нал подмножества ПАРАДИГМЫ.

Однако в реально действующих УИК можно наблюдать и неправильную практику, когда воплощается один из следующих вариантов:

1) произвольно или даже в противоречии с ПАРАДИГМОЙ толкуются ее определенные положения, страдающие неполнотой, либо неопределенностью;

2) исполнитель вынужден практической деятельностью восполнять отсутствие в ПАРАДИГМЕ определенных регулировок;

3) предпринимаются определенные недобросовестные действия, имеющие корыстные мотивы и прямо противоречащие ПАРАДИГМЕ.

Содержательный смысл введенных компонент управленческого информационного комплекса будет выяснен позже, по мере их использования в построении формальной модели. Основные свойства УИК формулируются следующими четырьмя утверждениями.

Утверждение 1. Для любого ц8 е М, если существует л1 такое, что ц8 есть аргумент § или результат данного л 1, то из этого следу-| ет, что л1 е П (единство парадигмы). <§ Утверждение 2. Для любого лк е П справедливо, что если некоторый массив дан-| ных ц, является аргументом или результа-I том данного лк, то он принадлежит М: ц, е М

(полнота операционной части базы). ¡и Утверждение 3. Практика реализации | Р базируется на парадигме П, т. е. Рс П. Её

и

Из свойств первого и второго утвержде-

О ^

§ ний вытекает четвертое утверждение.

о

§ Утверждение 4. Парадигма П является мультиотображением М на себя.

О §

^ Под функционированием УИК будем понимать выполнение оргструктурой О опера-

74

ций над заданным обобщенным множеством аргументов М согласно существующей практике Рс П. При этом П включает в себя как прямые управляющие воздействия, так и реакцию на сигналы обратной связи. Для функционирования УИК существенно, что среди массивов данных ц, е М имеются как информационные сущности, созданные внутри УИК, так и сообщения из внешнего мира (сообщения внешней обратной связи). Мы видим, что сообщения обратной связи разделяются на две различных группы: сообщения внешней среды и сообщения о состоянии управляемого объекта или об изменениях в нем.

В подобной трактовке функционирование УИК можно понимать как вполне детерминированное. При этом не следует забывать, что внешние сообщения могут иметь и стохастическую природу. В качестве дальнейшего усложнения модели возможно рассмотрение стохастических элементов парадигмы П, однако пока мы не будем принимать эту возможность во внимание. Чтобы приблизить модель к реальным условиям функционирования управленческих систем, введем понятие «помех», наличие которых приводит к неполной детерминированности функционирования УИК. Рассмотрим связанные с теми или иными дефектами в структуре УИК разновидности помех:

• связанные с неединством парадигмы (в парадигме могут отсутствовать правила обработки некоторых единиц данных);

• связанные с неполнотой данных (в операционной базе М могут отсутствовать некоторые необходимые данные);

• связанные с несовершенством оргструктуры и практики исполнения Р (подмножество парадигмы выбрано оргструктурой некорректно, или же содержит правила, противоречащие парадигме П);

• связанные со случайными искажениями функционирования оргструктуры, информационной базы или же парадигмы.

Некоторые компоненты УИК иллюстрируются содержанием блоков и связей (рис. 1).

Основным объектом исследования в данной статье являются вопросы функционирования АБД, или же, в более широкой постановке, операционной части УИК, а также действия, связанные с изменением формы представления информационных сущностей в М.

Автоматизация управленческих работ

Необходимым технологическим этапом управленческого процесса является обработка данных в экономической (управленческой) информационной системе. Она проводится либо вручную (при отсутствии компьютерных средств, т. е. средствами и способами традиционной бухгалтерии или другого управленческого подразделения), либо в автоматизированной (с применением компьютерных средств) системе обработки экономических данных. Мы различаем, таким образом, системы ручной обработки данных и автоматизированные компьютерные системы обработки данных.

Системы ручной обработки данных (традиционные, неавтоматизированные системы), в которых все данные находятся на бумажном носителе, расчеты проводятся с помощью калькуляторов. Вручную осуществляются трудоемкие расчеты большого объема, с высокими пиковыми нагрузками (сосредоточенными на определенных периодах времени, соответствующих установленным срокам оформления отчетности: первый квартал, апрель, июнь, октябрь). Расчеты, как правило, содержат большое число ошибок и не могут выполняться в достаточном количестве вариантов. Оптимизация (перебор даже небольшого количества вариантов) недостижима. В традиционной некомпьютеризированной системе управления (соответствующей системе обработки данных) бумага — единственный носитель информации. Обработка данных в подобных системах выполняется вручную (возможно, с использованием простейших средств механизации учета). Классическим примером подобной системы является бухучет, некомпьютерная история которого насчитывает более 500 лет.

№>5(11)2007

Автоматизированные компьютерные сис- Щ темы обработки данных, где значительный | объем операций по заполнению документов ^ и все расчетные операции выполняются ^ с помощью компьютеризированной информационной системы.

Несмотря на очевидную устарелость и техническую неэффективность систем первого типа, они все еще достаточно широко распространены на практике. Осознание этого факта необходимо, во-первых, потому, что пока остается актуальной задача перехода от ручной обработки к автоматизированной и синтеза соответствующих проектных процедур; и, во-вторых, потому, что во многих случаях в процессе автоматизации обработки данных приемы, методики и оргструктура ручной системы механически переносятся на машинную, что снижает эффективность применения средств автоматизации. Применение автоматизированных информационных технологий позволяет избежать подобного отрицательного эффекта.

Автоматизацию управления ни в коем случае не следует рассматривать только как покупку новой, желательно высококачественной, высокопроизводительной и дорогой (насколько позволяют средства) вычислительной и оргтехники. В предыдущем пункте дан перечень основных проблем, которые необходимо решать в процессе перехода к автоматизированному управлению. Процесс автоматизации управления — это длительный, многоаспектный, многоступенчатый процесс, который обычно приходится проводить «на ходу», без прекращения повседневной производственной деятельности. Важнейшими компонентами подобного процесса являются, безусловно, решения технических, организационных, технологических, юридических и психологических вопросов. Важнейшей составляющей автоматизации управления или непрерывного повышения уровня автоматизации остается реинжиниринг бизнес-процессов.

С точки зрения управленческого информационного комплекса, мы наблюдаем в про-

^75

Не5(11) 2007

1 I

К

со

0

U

1

0 &

1

is

Её

£ о <и

о g

о §

цессе внедрения АИТ два дополняющих друг друга процесса: текущее функционирование УИК и реорганизацию (реинжиниринг) в соответствии как с новыми технологическими возможностями, так и с совершенствованием самой управленческой парадигмы П. Таким образом, в процессе внедрения информационной технологии происходит технологическое и принципиальное усовершенствование управленческих процессов.

Информационная технология, являясь платформой процесса автоматизации, включает в себя основные компоненты и предпосылки проведения автоматизации. Под автоматизированной информационной технологией принято понимать системно организованную для решения задач управления совокупность методов и средств реализации операций сбора, регистрации, передачи, накопления, поиска, обработки и защиты информации на базе применения развитого программного обеспечения, используемых средств вычислительной техники и связи, а также способов, с помощью которых информация предлагается пользователям.

Важнейшим техническим элементом обработки данных по автоматизированной технологии является, как сформулировано выше, носитель данных (информации). В автоматизированных системах следует проводить различие между машинным и внема-шинным носителями. Машинные документы в фиксированном формате обычно обрабатываются с помощью программ, созданных инструментальными средствами систем управления базами данных (СУБД). Однако возможна и визуальная работа оператора с подобными документами в диалоговом режиме (обычно посредством СУБД, или же специальных программ — редакторов баз данных, а также специализированных диалоговых средств). Обработка документов в свободном формате ведется, как правило, визуально с помощью текстовых редакторов.

В компьютеризированных системах вне-машинный информационный фонд рас-

сматривается в противоположность внутри-машинному информационному фонду на дисках, дискетах, магнитных лентах, магнитных картах различных разновидностей, носителях типа CD-ROM, ZIP и т.д.

Внутримашинный информационный фонд (обычно это совокупность баз данных: форматированных и в свободном формате) вместе с программным комплексом управления базами данных есть основная составляющая операционного фонда УИК. В АИС/ЭИС эту совокупность средств принято называть автоматизированным банком данных (рис. 1). Таким образом, АБД представляет собой систему информационных, языковых, организационных, программных и технических средств, предназначенных для централизованного накопления и коллективного использования данных, описывающих определенную предметную область.

В состав любого автоматизированного банка данных в качестве основных компонентов входят:

• автоматизированный информационный фонд (совокупность массивов данных на машинных носителях);

• прикладное программное обеспечение;

• другие обеспечивающие подсистемы, в частности обслуживающие программы.

Операции АБД, служащие для решения конкретных экономических задач (например, для расчета налоговых платежей предприятия на основе данных бухгалтерского учета или составления расписания обработки деталей на станках), относятся к категории функциональных.

Автоматизированный банк данных выполняет также обслуживание и поддержку информационного фонда (категория обеспечивающих операций или операций ведения АБД). Если функциональные операции можно отнести к моделированию соответствующих реальных производственных, учетных или управленческих процессов, то операции ведения АБД — это операции ме-тамоделирования.

76

Массовая эксплуатация компьютеризированных информационных систем невозможна без решения следующих проблем.

1. Приобретение или разработка необходимого программного обеспечения.

2. Адаптация этого программного обеспечения к особенностям управленческих и экономических процедур в данном учреждении.

3. Переобучение и повышение квалификации персонала для работы в условиях компьютеризации.

Таким образом, автоматизация управленческих работ включает в себя решение достаточно большого объема технологических проблем. В частности, применяемая в управленческих целях обработка данных в автоматизированных системах требует использования разнообразных специализированных технологических средств автоматизированного банка данных.

Основные функции

и структура управления данными и прикладными программами, реализующими работу АБД

В структуре компьютеризированной системы обработки данных принято выделять следующие уровни представления и обработки данных.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Уровень 1. На уровне обработки данных командами ЭВМ (на винчестере, а также в оперативной памяти) данные представлены в том виде, который определяется требованиями архитектуры компьютера (физическое представление данных, адресная система).

Уровень 2. Операционная система реализует процедуры обработки данных, как правило, на уровне файлов (файловая система: перенос, удаление, копирование файлов и т. д.). Операционная система имеет своего пользователя, свое диалоговое сопряжение. Она организует управление выполнением прикладных программ. Современ-

№>5(11)2007

ное понятие операционной среды (такой Л как Windows, массовый ввод версий кото- | рой в эксплуатацию продолжается с начала ^ 90-х годов прошлого века) является разви- tj тием концепции операционной системы на новом уровне. Команды операционной системы, выполняемые устройствами ЭВМ, составляют физический уровень сопряжения в автоматизированном банке данных.

Следует обратить внимание на одну из особенностей используемой здесь терминологии. Речь идет о понятии «сопряжение», используемом для обозначения средств взаимодействия и обмена данными между внутренними блоками системы или между внешними блоками и пользователем. Более принятым в отечественной терминологии является слово «интерфейс». Тем не менее, мы будем использовать термин «сопряжение» для программных модулей, оставив термин «интерфейс» для аппаратных модулей.

Уровень 3. Третий уровень — уровень системы обработки данных (СОД). На нем сосредоточены операции, связанные с обработкой на уровне форматированных записей. Программное обеспечение СОД, которое здесь используется, дает возможность доступа к отдельным записям и к элементам записей по их именам. Подобное программное обеспечение реализуется средствами СУБД, эти операции соответствуют хранимому уровню сопряжения в АБД.

Уровень 4. Уровень обработки прикладной программой. Содержащиеся в прикладной программе команды обращения к системе обработки данных (применяется также термин «команды языка манипулирования данными») относятся к уровню концептуального сопряжения (интерфейса) в АБД. Созданные с помощью прикладной программы диалоговые средства обеспечивают пользовательское сопряжение.

Каждый уровень системы обработки данных обладает своей собственной моделью данных, т.е. методом представления данных, используемым командами соответствующего уровня сопряжения.

^77

Не5(11) 2007

1

5

К «

о

U

!

0

6

1 s

Её £

о

о g

о §

Информационный фонд (как внемашин-ный, так и внутримашинный) как набор различных документов и недокументированных данных, а также информационные объекты, не входящие в собственно информационный фонд, образуют информационное обеспечение процесса управления в широком смысле. Обычно именно информационное обеспечение системы организационного управления содержит (и поддерживает) массивы исходных данных для математических, информационных и других моделей, применяемых в автоматизированном управлении, является информационным базисом для систем искусственного интеллекта.

Все управленческие модели, базирующиеся на информационном обеспечении, являются в свою очередь инструментами реализации разнообразных управленческих процедур на различных уровнях и с различной степенью автоматизации.

Основным орудием производства средств информационного обеспечения управленческих процессов являются СУБД — основной инструмент прикладного программиста, специализирующегося в предметной области управления экономическими процессами и системами. Прикладной программист создает как средства обслуживания баз данных, так и программы, реализующие управленческие процедуры.

Основные задачи, решаемые при конструировании СОД и создании конкретных автоматизированных управленческих процедур, и в более общем плане при разработке АИТ, сводятся к следующему:

• проектирование структуры данных;

• прикладное программирование управленческих процедур.

СУБД представляет собой инструментальное средство для создания прикладных программ, работающих, главным образом, с базами данных в фиксированном формате.

Идейным предшественником всех современных СУБД считается алгоритмический

язык Cobol (Common Business Oriented Language), разработанный в США в 1959-1960 годах, ныне мало используемый.

Современные СУБД представляют собой продукт длительной (более 30 лет) эволюции систем данного типа. СУБД — совокупность программ и языковых средств, предназначенных для управления данными в базе данных, ведения базы данных и обеспечения ее взаимодействия с прикладными программами (ГОСТ 20886-85). В современной практике СУБД чаще всего ориентированы на создание прикладных систем двух основных разновидностей:

1) прикладные системы, ориентированные на управление предприятиями среднего и малого масштаба, осуществляемого с помощью компьютера, объединенных в сравнительно небольшую по масштабам сеть, или даже автономных;

2) прикладные системы, ориентированные на крупномасштабные системы управления типа SAP (System Application Packages) на крупных предприятиях и в производственных комплексах, в сетях крупного масштаба, использующих, наряду с терминальными рабочими станциями (терминальными компьютерами), мощные ЭВМ типа Mainframe и элементы централизованной обработки данных.

Системы первого типа обычно ориентированы на такие СУБД, как SQL Server, Microsoft Access или Foxpro, Paradox с использованием платформ Windows. Многие системы второго типа в отечественной и мировой практике ориентированы на платформы UNIX и СУБД Oracle.

Создание прикладного программного обеспечения, реализующего конкретные управленческие функции, основано обычно на одном из следующих подходов:

• индивидуальная разработка конкретной управленческой АИС с помощью инструментальных программных средств, доставляемых соответствующей платформой, таких как входные языки систем Foxpro или

78

Paradox, либо языка Visual Basic для Microsoft Access;

• настройка достаточно универсального средства orgware на конкретное приложение (характерным примером такого подхода для систем малого и среднего масштаба служит использование бухгалтерского языка в системе «1С: Бухгалтерия»).

Пользователь компьютеризированной системы обработки данных — это специалист, профессиональная деятельность которого связана:

• либо с применением подобной системы как средства выполнения им своих функций(обычно операторских, аналитических или управленческих);

• либо с созданием и/или техническим обслуживанием этой системы.

Классификация пользователей систем обработки данных

Под пользователем системы обработки данных может пониматься отдельный специалист либо некоторая фирма или оргструктура. Что касается корпоративных пользователей (пользователей-фирм или организаций), то здесь имеются две основные разновидности:

• разрабатывающие фирмы: фирмы — производители программного обеспечения для массовой продажи или на заказ. Например, фирма 1С (Москва), производящая популярные в России и СНГ одноименные бухгалтерские пакеты.

• фирмы, эксплуатирующие компьютеры и программное обеспечение. Таковыми в настоящее время являются практически все предприятия, фирмы и организации.

Классификация пользователей-работников выглядит сложнее и позволяет выявить различия в их функциональной и профессиональной ориентации. Рассматриваются следующие разновидности пользователей-специалистов.

№>5(11)2007

Первая категория, основная, массовая Л

разновидность пользователя компьютер- |

ных систем — конечный пользователь — ^

с

пользователь-непрограммист, в системах ^ управления — сотрудник того или иного управленческого подразделения. Пользователи данного типа относятся к следующим подкатегориям:

а) пользователь-оператор — работник низшей или средней квалификации, выполняющий за терминалом стандартные действия (например, операционист в банке). Будучи пассивным пользователем, не имеет возможности каким-либо образом менять параметры системы, с которой работает. Рабочее место пользователя-оператора обязательно оснащено «дружественным» сопряжением, в рамках которого действия пользователя строго регламентированы;

б) профессиональный пользователь — профессионал в обслуживаемой предметной области (например, профессиональный бухгалтер), использующий автоматизированное рабочее место для выполнения своих должностных функций. Профессиональный пользователь в отличие от пользователя-оператора может быть активным пользователем, или настройщиком АРМ, т. е. может обращаться к макрокомандам с подстановкой параметров, как, скажем, специалист, применяющий на рабочем месте электронные таблицы собственного изготовления. Автономное автоматизированное рабочее место (АРМ) профессионального пользователя представляет собой человеко-машинную систему, оснащенную программно-техническим комплексом на базе персональной ЭВМ и укомплектованной необходимыми средствами подготовки, ввода, обработки, отображения и документирования данных. Специфика работы профессионального пользователя заключается в следующем:

• цель работы профессионального пользователя — не программирование или настройка orgware, а выполнение должност-

Не5(11) 2007

1

5

К

со

0

U

1

0

6

1 Её

£ о <и

0

1

о §

ных функций по своей профессиональной ориентации;

• АРМ может быть включено в локальную или глобальную компьютерную сеть;

• одно и то же оборудование может использоваться несколькими пользователями или несколькими системами обработки данных.

В системах любой сложности в качестве их элементарной основы используется отдельное АРМ профессионального пользователя.

Вторая категория — работники с компьютерной квалификацией (программисты и инженеры) в системе обработки экономических данных заняты либо обслуживанием, либо созданием информационных систем и автоматизированных рабочих мест. Пользователи этой категории обычно работают как настройщики или создатели АРМ. Эта категория разбивается в свою очередь на следующие подкатегории:

• прикладные программисты;

• системные инженеры;

• системные программисты.

Системные программисты заняты в специализированных фирмах — производителях программного продукта разработкой системного программного обеспечения. Однако наиболее массовая их деятельность — это поддержание действующих систем в фирмах-пользователях. Системные программисты, занятые в этой области, делятся на следующие основные категории:

• администраторы приложений;

• администраторы баз данных;

• администраторы сети.

Пользователи любого класса применяют программное обеспечение, снабженное диалоговым экранным сопряжением (интерфейсом) определенного уровня. Так, проектировщики, создающие структуры данных в системе обработки данных, пользуются

своим специфическим сопряжением, которое в значительной степени обеспечено средствами СУБД.

Технические характеристики АИТ: централизованная и распределенная ЭОД

Долголетний опыт показал, что наибольший выигрыш от компьютеризации обработки данных достигается при использовании ЭВМ в комплексе со средствами связи, когда пользователь имеет возможность доступа к значительному объему ресурсов, превышающему объем ресурсов его собственной ЭВМ.

С этой точки зрения можно рассматривать два метода обработки данных:

• централизованный;

• децентрализованный.

Подход к компьютерной обработке данных в 60-70-е годы прошлого века состоял в том, что имеется большая ЭВМ (Mainframe), установленная в ВЦ предприятия, либо в ВЦ как самостоятельной организации (вычислительный центр коллективного пользования — ВЦКП). Доступ к центральной ЭВМ обеспечивался с удаленных терминалов, расположенных в рабочих местах пользователей. Такова концепция централизованной обработки данных.

В 80-90-е годы получила распространение концепция распределенной обработки данных — выработка непосредственно на рабочих местах с помощью персональных компьютеров.

В первом случае необходимы большие ЭВМ с большим быстродействием, значительными ресурсами памяти, поддерживающие информационные фонды большого объема, охватывающие широкий круг предметных областей (многопрофильный АБД).

Во втором случае — это совокупность малых ЭВМ типа персональных компьютеров непосредственно на рабочих местах профессиональных пользователей, осна-

80

щенных локальными автоматизированными банками данных и прикладным программным обеспечением, с достаточно узкой предметной областью, обслуживающих потребности конкретного бухгалтера, экономиста, плановика или диспетчера — хозяина данного рабочего места.

Преимуществами первого метода (централизованного) являются:

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

• лучшая координация управленческих решений по отдельным подсистемам;

• отсутствие дублирования данных;

• лучшая информированность руководства и возможность принятия оптимальных решений на высшем уровне.

Его недостатки — громоздкость, необходимость высокоэффективной инженерной оснастки, сложность эксплуатации.

Преимущества при децентрализованной (распределенной) обработке:

• главное состоит в том, что автоматизация происходит непосредственно на рабочем месте профессионального пользователя (в отделе, на складе);

• повышается оперативность, достоверность и обоснованность принятия решений непосредственно на рабочих местах.

К недостаткам этого подхода можно отнести то, что затруднен единый контроль, снижается информированность руководства, данные в различных локальных АБД могутбыть рассогласованы. В зависимости от особенностей управляемого объекта может быть выбран тот или иной подход. Например, в транспортных системах используется первый метод, тогда как в банковских — комбинация первого и второго.

Выходом из этой противоречивой ситуации является соединение децентрализованных рабочих мест с помощью линий связи в единую систему, где достигается разумный баланс между первым и вторым методами. Синтез двух указанных концепций к концу 80-х — началу 90-х годов в виде вы-

№>5(11)2007

числительной сети, т.е. совокупности ком- Л пьютеров, соединенных линиями связи, по- | зволил объединить преимущества центра- ^ лизованной и распределенной обработки ^ данных. Однако использование сетевого подхода, повышая эффективность использования информационных и операционных ресурсов, приводит к еще большей сложности аппаратного и программного обеспечения.

Большинство систем связи между ЭВМ, используемых в настоящее время, относятся к одному из следующих типов:

• локальные вычислительные сети;

• связь между компьютерами по телекоммуникационным каналам общего пользования;

• глобальные информационные вычислительные сети, где компьютеры подключаются к системам общего пользования, за-действуется спутниковая и оптоволоконная связь, а радиус действия не ограничен.

Локальные вычислительные сети представляют собой совокупность технических средств и специального программного обеспечения, позволяющих получать доступ с одного компьютера к ресурсам другого. Обычно компьютеры, включенные в локальную вычислительную сеть, соединяются между собой специальным кабелем, который и обеспечивает доступ к памяти каждого из компьютеров через специальные сетевые платы. Для управления обменом данными между компьютерами устанавливается специальное сетевое программное обеспечение или сетевая операционная система. Она обслуживает потоки данных между компьютерами и работает наряду с локальными автономными системами, имеющимися на каждом компьютере сети. Автономная работа каждого компьютера осуществляется под управлением локальной операционной системы.

Среди компьютеров, включенных в сеть, выделяется один, который называется файл-сервером, или файловым сервером. От ос-

Н95(11)2007 ^

тальных компьютеров сети файл-сервер отличается следующим:

• имеет более привилегированные права доступа (право доступа определяется администратором сети);

• располагает наибольшими ресурсами и является как бы централизованным хранилищем файлов, находящихся в коллективном пользовании;

• в качестве файл-сервера используется машина с повышенной надежностью, информация файл-сервера обязательно дублируется.

Локальные сети, как правило, обеспечивают дальность связи не более 1-2 км. Они монтируются либо в пределах одного здания, либо в рядом стоящих зданиях.

Во втором подходе в качестве средства телекоммуникации для организации связи между компьютерами на достаточном удалении чаще всего используются телефонные линии. Для организации подобной связи требуется модем — устройство для преобразования электрических импульсов, которые циркулируют в контурах компьютера, в сигналы, характерные для телефонной сети и соответственно для обратного преобразования. Модем подключается через § обычный телефонный аппарат, имеющий | телефонный номер. При необходимости <§ связи с другим компьютером обычным образом осуществляется вызов абонента, по-| сле чего устанавливается связь между ком-| пьютерами К-1 и К-2 через модем М-1, телефонный канал ТК и модем М-2 (рис. 2). Телеки фонная линия может быть линией обычной | абонентской сети или выделенным теле-| фонным каналом.

Для совместной работы компьютера и § модема необходимо соответствующее про-

^ Рис. 2. Примерная схема модемной связи

между компьютерами через телефонный канал 82

граммное обеспечение, которое обычно поставляется вместе с модемом. Модемная связь позволяет осуществлять не только перекачку массивов данных, но и удаленное управление, т. е. использование одного компьютера в качестве терминала для другого компьютера. Дальность модемной связи практически не ограничена (это дальность, характерная для телефонной сети), но скоростные характеристики модемной связи обычно недостаточны для эффективной передачи достаточно больших объемов данных.

Глобальные информационные компьютерные сети (наиболее известной из которых является международная сеть Internet) используют такие высокоскоростные линии связи, как оптоволоконные, спутниковые и др. Локальное подключение абонентов к глобальным системам связи обычно производится через телефонные линии. Как в крупных локальных, так и в глобальных вычислительных сетях наряду с персональными ЭВМ, применяемыми в качестве терминалов и серверов сравнительно небольшой мощности, требуются серверы повышенной мощности — это крупные ЭВМ класса Mainframe, аналогичные тем, которые применяются в централизованной обработке.

Важнейшими техническими характеристиками носителей данных являются, как уже отмечалось выше, их быстродействие, объем памяти и надежность. Объем данных и соответствующая емкость (а также скорость передачи) для носителей (запоминающих устройств, устройств памяти, каналов передачи данных) измеряется в битах, байтах, килобайтах, мегабайтах, гигабайтах (соответственно бит/с, байт/с и т.д.). Один байт — это символ алфавита (код, занимающий 8 двоичных разрядов — битов; алфавит, в котором одному символу соответствует один байт, может содержать не более чем 28 = 256 символов). Байт в качестве единицы памяти был впервые применен в вычислительных системах класса IBM-360 в 60-х годах. Это техническое решение ока-

залось удачным и продолжает использоваться в современных технических устройствах. Следующими по величине единицами являются:

1 килобайт = 1024 байт;

1 мегабайт = 1024 килобайт;

1 гигабайт = 1024 мегабайт = 109 байт.

Наиболее быстродействующими устройствами из числа применяемых в обычной практике являются, как известно, устройства оперативной памяти, емкость которых в современных компьютерах достигает нескольких мегабайт, быстродействие — сотен миллионов операций чтения/записи в секунду. Современная номенклатура наиболее распространенных магнитных запоминающих устройств пока включает в себя:

1) дискеты диаметром 3,5" с емкостью 1,44 мегабайт;

2) запоминающие устройства типа ZIP (сменные жесткие диски) емкостью до сотен мегабайт;

3) CD-ROM (устройства односторонней памяти) емкостью до нескольких гигабайт;

4) съемные диски типа флэш-карта емкостью до нескольких гигабайт;

5) винчестеры (жесткие несменные магнитные диски, входящие в основной комплект компьютеров) емкостью до сотен гигабайт;

6) объемная память, способная, например, вместить в кубике из специального стекло-подобного вещества объемом менее одного квадратного дециметра (10х10х10 см) все содержимое Центральной российской библиотеки (известной среди российской интеллигенции как Ленинка).

Понятие «надежность носителя данных» включает в себя возможности защиты данных от:

• несанкционированного доступа;

• разрушения в результате сбоя технических средств.

№>5(11)2007

Для защиты данных от несанкциониро- Л ванного доступа разработано много раз- | личных методов, но известно, что компью- ^ тер, включенный в сеть связи, всегда в той tj или иной степени уязвим.

Таким образом, наряду со всевозможными разновидностями средств криптозащи-ты, парольной, программной защиты данных, следует рассматривать все виды обычной физической защиты: ограничение доступа в помещения, отключение устройств от сети, раздельное хранение элементов данных различной степени секретности и др. Обычно под криптозащитой понимают использование различного рода специальных шифров, делающих невозможным чтение зашифрованных сообщений лицами, не располагающими средствами декодирования.

Любые вопросы защиты данных должны рассматриваться с точки зрения соотношения затрат на защитные мероприятия и величины возможных потерь от несанкционированного доступа. Важнейшим аспектом защиты информационных систем является защита от вирусов — программ, осуществляющих несанкционированный доступ и разрушение программных и информационных ресурсов АИС/ЭИС.

Разрушение или потеря информации в результате сбоя технических средств приводят к катастрофическим последствиям, если не имеется резервных копий данных. Поэтому во всех случаях рекомендуется хранить и своевременно обновлять дубликат имеющихся данных на съемных запоминающих устройствах того или иного типа. При работе в компьютерных сетях следует хранить данные в нескольких экземплярах на разных компьютерах. Существуют специальные устройства (стримеры), которые позволяют дублировать данные с магнитного диска на магнитной ленте и хранить на ней резервную копию. В настоящее время для исполнения той же функции в домашних компьютерах обычно предназначаются устройства типа ZIP или CD-ROM.

83

Не5(11) 2007

1

5

К

со

0

U

1

0

6

1 Её

£ о <и

0

1

о §

Для предотвращения возможной потери данных и срыва процесса управления при перебоях в электроснабжении следует применять устройства, которые называются источниками бесперебойного питания. Подобные устройства обеспечивают поддержку работы компьютера в течение нескольких минут — времени, достаточного для фиксации данных на магнитном диске или другом носителе, где их сохранность не зависит от наличия напряжения в электросети.

С точки зрения возможностей хранения данных в информационных системах магнитные запоминающие устройства признаны в современной практике вполне удовлетворительными, как в смысле емкостных и скоростных характеристик, так и в смысле их надежности.

В данной статье не ставится целью более глубокое рассмотрение аппаратных вопросов обработки данных. Заинтересованный читатель может обратиться к специальным руководствам.

Информационный поиск и понятие релевантной информации

Автоматизированные информационные технологии состоят, как и любые технологии, из операций. Особую роль в АИТ играет операция информационного поиска — одна из важнейших операций обработки данных во внутримашинном информационном фонде.

Когда имеется необходимость использования хранимой информации, выполняется операция поиска, или выборки (retrieval), тех данных, которые нужны пользователю в данный момент — релевантных данных. Если производится поиск информации по запросу или решается некоторая задача на основе тех данных, которые содержатся в информационном фонде, то говорят, что информация может быть релевантна (или нерелевантна) данному запросу (задаче). Особенно наглядно подобная ситуация проявляется во время библиографического поиска или поиска в сети Internet.

Представим себе локальный информационный фонд (предприятия, организации, подразделения) — совокупность частично пересекающихся по содержанию сравнительно небольших баз данных, содержащих объем информации, практически полностью используемой при решении некоторого ограниченного круга задач(например, АРМ бухгалтера малого предприятия). В большинстве случаев решения задач необходима (релевантна) почти вся содержащаяся в подобном фонде информация, и поэтому нет необходимости в информационном поиске, равно как и в обращении к понятию релевантности.

Пусть, с другой стороны, имеется интегрированный информационный фонд достаточно большого объема для обслуживания крупного предприятия, фирмы или предназначенный для некоторого сообщества пользователей, содержащий информацию, релевантную большому количеству разнородных управленческих задач различных классов.

В экономических информационных системах обычно имеют дело с так называемыми большими массивами данных.

Определение 1. Большой массив данных— это такой массив данных, трудоемкость обработки которого в большей степени определяется размерами массива, нежели сложностью алгоритма его обработки.

При решении экономических задач часто сравнительно простые операции обработки повторяются многократно. Как правило, экономическую задачу имеет смысл ставить на машинное решение в том случае, когда именно размер информационного фонда определяет трудоемкость решения задачи, т. е. возникает необходимость обработки большого массива данных. В связи с этим в экономических расчетах очень существенны вопросы формата или организации больших массивов данных.

Кроме того, интегрированный информационный фонд, содержащий информацию, релевантную различным запросам или задачам, во многих случаях представляет собой большой массив данных.

84

№>5(11)2007

В этом случае мы можем считать, что наряду с информационным фондом F имеется множество Q = q2,..., qz} возможных запросов данных со стороны пользователей различных категорий (рис. 3), в результате выполнения любого из которых из информационного фонда выделяется некоторое подмножество данных меньшего объема S( q!) £ F.

В первом примере на рис. 3 весь круг, обведенный толстой линией окружности, представляет собой факультет. Круг делится толстыми линиями на группы. Пространство внутри них, разделенное более тонкими линиями, — это разбиение на студентов. Второй пример понятен: пересечение дисциплины учебного плана (строки) и данных о студенте (столбца) выводит на оценку студента по данной дисциплине.

Пусть подмножество S(qi) информационного фонда F есть релевантное подмножество запроса ql. Операция, выделяющая релевантное подмножество заданного информационного фонда по любому запросу из некоторого языка запросов (множества

запросов, которые могут быть построены Л в определенном синтаксисе), называется | операцией поиска. Формулировка запроса ^ в терминах языка запросов называется поис- ^ ковым предписанием. Использование языка запросов заключается в том, что формулируется запрос и находится релевантное подмножество.

Определение 2. Подмножество документов информационного фонда, релевантных поисковому предписанию, называется релевантным подмножеством.

Технология информационного поиска первоначально развивалась в системах библиотечных каталогов. В настоящее время наиболее развитый информационный поиск существует в трех основных предметных областях:

1) поиск библиографической информации, переведенный на компьютерную основу;

2) поиск в глобальных компьютерных сетях;

3) информатика в области экономики (поиск экономической информации, веде-

Структура запроса

Структура разбиения

Факультет

Группа

Студент

Дисциплина

Студент

Оценка

Студент

Оценки

Рис. 3. Примеры разбиения информационного фонда

85

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

И95(11)2007

ние больших информационных фондов экономического назначения).

В основе поиска информации лежит проблема установления релевантности. Информационный фонд состоит из единиц хранения, которые в свою очередь также могут иметь некоторую структуру. Если существует запрос, то необходимо иметь алгоритм, который для каждой единицы хранения устанавливает, релевантна ли данная единица хранения данному запросу или нет. Таким образом, в процессе поиска используется логическая переменная ю, которая для каждой из единиц хранения в F формулирует значение «истина» или «ложь», взависи-мости от того, релевантна данная единица хранения запросу или нет.

Пусть F = {ЯЬЯ2,...,Я(} есть информационный фонд, представленный как множество единиц хранения Я, (в данном случае мы отвлекаемся от структуры массивов: Я1, Я2,...,Я( суть записи). Тогда процесс определения релевантности каждой очередной единицы хранения представляет собой вычисление значения логической функции ю = 0(Я!, Я,), которая истинна на единицах хранения, релевантных запросу я,.

Для реализации подобного процесса необходимо иметь процедуры:

|

| • от одной единицы хранения к другой; <§ • установления релевантности запросу каждой единицы хранения, т.е. вычисления 1 ^ (Я,, Я).

I

Определение 3. Релевантное подмноже-¡и ство — это подмножество единиц хранения, | удовлетворяющее (т. е. принимает значение | «истина») поисковому условию, под которым следует понимать логическую функ-5 цию , Я,).

1с Эти задачи могут быть решены: (

1) полным перебором всех единиц хра-■Ц нения в информационном фонде (в доста-5а точно больших информационных фондах это нереально из-за большого объема работы);

86

2) реализацией определенной структуры разбиений информационного фонда, которая позволяет вместо полного перебора рассматривать лишь определенные компоненты разбиений, имеющихся в структуре.

Так, на рис. 3 разбиение информационного фонда записей о студентах на группы позволяет сократить процесс поиска релевантных данных о студентах, если известно, в какой группе студент учится. В общем случае для разбиения информационных фондов на меньшие по объему подмножества применяются различные системы классификации, согласно которым информационный фонд разбивается на подфонды существенно меньшего размера, в которых может оказаться возможным полный перебор (например, УДК — универсальная десятичная классификация, применяемая для индексации книжных изданий).

Проблема установления релевантности в базах данных свободного формата является достаточно сложной, особенно в больших хранилищах разнородных документов. В некоторых случаях неформатированную базу данных можно рассматривать как одну очень длинную строку символов. Если условие поиска П(я,, Я,) формулируется простейшим способом как поиск заданной подстроки, а вместо релевантной записи в базе данных (тексте) ищется позиция, в которой расположена искомая подстрока, то задача решается сравнительно просто. Однако в общем случае столь простого решения не существует, и предпочтительным в больших и сверхбольших информационных фондах является подход, при котором пользователь предпочитает просто знать необходимые ему адреса, по которым он и ищет релевантные данные. Ясно, однако, что подобный подход никак не гарантирует полноты поиска.

Индексация документов в свободном формате и качество поиска

В определенном смысле большинство известных алгоритмов поиска и методов поисковой организации основаны на разбие-

ниях информационного фонда по значениям определенных реквизитов. В наиболее общем смысле этот подход следует понимать так, что каждая единица хранения характеризуется своим набором значений, которые и определяют ее принадлежность к тому или иному релевантному подмножеству. На этом базируется наиболее известный сегодня метод — выделение основного смысла или информационного содержания единицы хранения с помощью набора ключевых слов или дескрипторов.

Этот метод называется индексацией текстов свободного формата. Следует отметить, что понятие «ключ» в информатике очень многозначно. Не следует смешивать термин «ключевое слово» в данном методе с другими случаями употребления термина «ключ».

Определение 4. Индексация — это выделение в тексте или информационном фонде ключевых слов (дескрипторов) — таких слов, которые характеризуют смысловое содержание текста. При этом производится замена многозначных или синонимических элементов точными значениями, имеющими однозначный смысл. Индексация может также заключаться в распределении единиц хранения по категориям.

Текст, расположенный на первых четырех страницах настоящей статьи, можно проиндексировать набором ключевых слов {ЭОД, информация, носитель, данные}. Отметим, что тезаурус в узком смысле часто рассматривают как словарь дескрипторов определенной предметной области.

Определение 5. Совокупность ключевых слов (дескрипторов), характеризующих некоторую единицу хранения, называют поисковым образом документа.

Запрос может быть сформулирован в неформальных терминах, т. е. словесно. Далее подобный запрос должен быть выражен формальными средствами принятого в системе языка запросов, т. е. должен также быть проиндексирован с помощью ключевых слов, используемых в данном информационном фонде. В этом случае говорят о поисковом образе запроса. Поисковый образ докумен-

^ Нв5(11) 2007

та и поисковый образ запроса могут пред- Л ставлять собой просто списки ключевых | слов. Тогда критерием релевантности и ус- ^ ловием поиска О(q¡, Rj) является либо пол- ^ ное совпадение списка ключевых слов, либо (заданная заранее) некоторая степень их совпадения, достаточная для признания документа формально релевантным запросу.

Помимо простого списка ключевых слов в поисковых образах как документа, так и запроса могут указываться определенные связи между ключевыми словами. Релевантность устанавливается при совпадении подобных связей, имеющихся как в документе, так и в запросе.

Операция индексации единицы хранения (а также и запроса) представляет собой неформальную операцию, которую обычно может выполнить только автор текста или очень опытный в предметной области специалист-индексатор.

Релевантность той или иной единицы хранения по отношению к тем или иным запросам может зависеть от того, как проиндексированы единица хранения и запрос. В автоматизированной информационной системе определяется формальная релевантность. Окончательно выяснить, полез-ноли полученное сообщение, может только сам пользователь, поэтому содержательная релевантность, определенная пользователем, не всегда совпадает с формальной, определенной системой. В связи с этим в информационных системах рассматриваются такие понятия, как «поисковый шум» и «поисковое молчание».

Определение 6. Поисковый шум — это нахождение в информационном фонде формально релевантных документов, которые при содержательном анализе оказываются нерелевантными.

Определение 7. Поисковое молчание — это наличие в информационном фонде фактически релевантных документов, которые не могут быть найдены из-за неудачной или неполной индексации.

Определение 8. Индексатор — это специалист в предметной области, который,

^87

li95(11)2007

используя определенные системы классификации и кодирования, может снабдить любой документ в этой области совокупностью однозначных признаков с целью избежать при поиске как поискового шума, так и поискового молчания.

Пример 1. Допустим, что в некоторой библиотеке информационный поиск осуществляется по двум направлениям:

1) компьютерщик ищет такие тексты, где речь идет о массивах данных;

2) геолог ищет информацию об определенных массивах горных пород.

Если оба для поиска используют слово «массив» и ведут поиск по одной и той же совокупности литературы, то есть шанс, что они получат одно и то же релевантное подмножество, в котором для компьютерщика поисковым шумом будет информация о горных массивах, а для геолога — информация о массивах данных.

Известны два способа решения этой проблемы.

1. Мы можем закодировать слова:

• «горный массив» — одной кодовой по-§ следовательностью;

| • «массив данных» — другой кодовой <§ последовательностью, создав однозначные дескрипторы.

«

0 и

1 2. Наш информационный фонд может быть разбит на локальные фонды:

I

р • для геолога — база геологических | данных;

• для компьютерщика — база данных по § информатике.

о

§ Проблема релевантности для документов в свободном формате является предме-■Ц том достаточно сложного смыслового анали-5а за как содержания документов и запросов, так и тех неформальных требований, кото-

88

рые предъявляются к результатам процесса поиска. При этом трудно гарантировать исчерпывающий поиск и отсутствие поискового шума. Таким образом, качество информационного поиска, определяемое снижением до допустимых пределов как поискового шума, так и поискового молчания, является предметом заботы и ответственности и конструктора системы, и индексаторов соответствующих предметных областей. Трудности, возникающие при направленном смысловом поиске информации, хорошо представляют себе те, кто осуществлял подобный поиск информации в системе Internet.

Существенно более простой в принципиальном плане (оставаясь при этом достаточно сложной технически) является операция поиска в информационных фондах фиксированного формата. Особенности подобного поиска мы рассмотрим более подробно ниже, при обсуждении вопросов, связанных с построением и использованием моделей данных.

В эпоху неавтоматизированной обработки экономических данных был накоплен значительный опыт форматизации документов, наиболее характерным примером которой являются глубоко проработанные модели бухгалтерского учета, в частности, установленные правила построения планов счетов, которые можно рассматривать как определенные соглашения относительно индексации расходных и приходных финансовых статей. Использование этого опыта оказывает существенное влияние на применение АИТ. В автоматизированной обработке в настоящее время разработан и широко используется развитой аппарат формализованного задания запросных языков, наиболее известными из которых являются языки классов SQL, Sequel и QBE.

Структура единиц хранения в базах данных с фиксированным форматом.

Реляционные базы данных

Данные, содержащиеся в экономических информационных системах, имеют в большинстве случаев фиксированный формат.

Свойства структуры данных в фиксированном формате.

1. Основная структура, в которой хранятся подобные данные, представляет собой таблицу с фиксированным количеством столбцов и переменным количеством строк. При этом строки обычно соответствуют отображаемым реальным событиям, фактам или объектам, а величины или слова, размещенные в позициях этой строки таблицы, называют свойства или характеристики соответствующего события, факта или объекта, либо идентифицируют его. Поэтому каждая строка характеризуется одним и тем же набором свойств, но различными их значениями.

2. На пересечении строки и столбца всегда находится единственное значение соответствующего свойства, характеризующее данное событие, факт или объект.

3. Порядок столбцов таблицы, как правило, фиксирован, но это несущественно. Каждый столбец таблицы имеет уникальное название или имя. При этом элемент данных может иметь несколько имен, ни одно из которых не может совпадать с именем какого-либо другого элемента.

4. Любые две строки таблицы различаются, по крайней мере, одним элементом.

5. Порядок строк таблицы не существенен и может меняться в процессе обработки данных.

Строки определенной подобным образом таблицы данных принято называть записями. Каждый элемент таблицы рассматривается при обработке данных как неразложимый на более мелкие элементы и называется элементом данных, реквизитом или атрибутом.

Определение 9. Для таблицы данных, обладающей перечисленными свойствами (1)-(5), приняты такие названия, как нормализованный файл, реляционный файл, Р-файл, реляционная база данных (в последнем случае речь чаще идет о совокупности связанных таблиц). При этом перечень имен реквизитов файла (с возможной дополнитель-

№>5(11)2007

ной информацией о реквизитах — тип, дли- Л на и т.д.) называется схемой файла, тогда | как совокупность значений реквизитов, на- ^ ходящихся в строках (записях) файла, на- ^ зывается экземпляром файла, или экземпляром схемы.

Таким образом, свойство 3 нормализованного файла можно понимать так: каждый реквизит повторяется в схеме файла не более одного раза.

Реляционный файл представляет собой машинный образ некоторого внемашинно-го документа с жестким форматом, или некоторой совокупности подобных документов. Каждая строка реляционного файла может соответствовать одному документу или одной строке некоторого документа. В таком характерном для бухгалтерских систем файле, как журнал операций, каждая запись соответствует одной бухгалтерской проводке. Проводка — это строка данных в жестком формате с реквизитами: дата, номер проводки, счет по дебету, счет по кредиту, сумма, описание. При использовании реляционной структуры устанавливается следующая иерархия единиц данных, имеющая, как правило, 4 ступени.

Ступень 1. Элементарной единицей данных в жестком формате считается реквизит. Он характеризуется уникальным именем, соответствующим имени определенного столбца в реляционном файле. Реквизит может иметь более одного имени. Каждый реквизит имеет область допустимых значений (тип); в каждом данном файле каждый реквизит может принимать некоторое подмножество значений из своей области значений. Реквизит в системах ручной обработки данных не определяется столь строго и по существу не отличается от традиционного понятия реквизита обычного документа.

При машинной обработке данных имя реквизита (представляющее собой аналог имени переменной в алгоритмических языках) есть тот идентификатор, под которым данный реквизит известен обрабатывающим программам. В каждый определенный момент

^89

Не5(11) 2007

1 I

К

со

0 и

1

0 &

1 $

Её

£ о <и

о ^

0 §

1

существования записи реквизит принимает некоторое значение (аналог значения переменной) из допустимого множества значений, определенного типом данного реквизита.

Реквизиты с числовой областью значений принято относить к категории оснований. Реквизитом-основанием является, например, любой реквизит, значения которого представлены в виде денежных сумм. Реквизиты символьного типа — разного рода коды и наименования — часто называют притачными, или реквизитами-признаками. Таким образом, реквизит рассматривается как наименьшая, неразложимая единица данных.

Ступень 2. Более крупные (составные) единицы данных обычно строятся путем композиции (конкатенации) реквизитов. Совокупность реквизитов, описывающая некоторый объект реального мира, называется составной единицей данных (СЕД). Составные единицы данных представляют собой, как правило, композиции реквизитов, имеющие некоторое экономическое содержание. СЕД, с законченным экономическим смыслом, обладает свойством документообразования.

Так, в автоматизированном бухгалтерском учете составными единицами данных могут считаться проводка, строка баланса, актив (или пассив) баланса, баланс в целом. Отметим, что файл обычно не относят к составным единицам данных; его считают объектом более высокого уровня, тогда как запись в жестком формате — разновидность составной единицы данных. Под длиной записи фиксированного формата понимают сумму длин значений реквизитов, входящих в запись.

Показатель — это составная единица данных, содержащая количественную характеристику некоторого экономического объекта или процесса (основание) и признаки, позволяющие идентифицировать этот процесс или объект.

Бумажный экономический документ во многих случаях состоит из показателей. Так, каждая строка бухгалтерского баланса представляет собой показатель, построенный по определенным правилам из итоговых показателей (остатков) счетов бухгал-

терского учета. Показатели могут быть исходными и производными, причем правила построения производного показателя должны быть строго фиксированы.

Область значений составной единицы данных представляет собой декартово произведение областей значений основных реквизитов.

Ступень 3. Множество записей представляет собой реляционный (нормализованный) файл. Под длиной реляционного файла понимается количество записей (строк) в этом файле.

Пример 2. Каждая запись в экзаменационной ведомости студенческой группы содержит такой цифровой реквизит, как номер зачетной книжки. Он представляет собой реквизит-признак. Отметим, что такой общий для всех строк ведомости реквизит, как номер группы, можно мысленно представить себе как присутствующий в каждой из строк и вынесенный в заголовок лишь из соображений технического удобства. Таким образом, экзаменационная ведомость не есть нормализованный файл. Можно представить себе нормализованный файл, построенный из экзаменационной ведомости путем внесения реквизитов заголовка в каждую из строк. Подобную операцию называют нормализацией. Практически существующие документы в жестком формате обычно не нормализованы, однако процедура нормализации при проектировании машинного файла достаточно проста, хотя и несколько громоздка. Процедура нормализации для одного частного случая приводится в работе [1].

Из свойства 4 нормализованного файла следует, что во всяком нормализованном файле существует такая СЕД (в частном случае реквизит), значения которой не могут совпадать ни в какой паре записей файла. Значения СЕД (реквизитов), обладающих подобным свойством, естественно использовать в качестве идентификаторов записей. Подобную СЕД (реквизит) принято называть реляционным ключом файла.

90

Следует иметь в виду, что термин «ключ» в информатике чрезвычайно полисемичен, не следует смешивать введенное только что понятие «реляционный ключ» с иными употреблениями этого термина, например, со введенным выше понятием «ключевое слово».

Определение 10. Полисемия — свойство термина обозначать различные понятия в одной или различных предметных областях, например, «вал» как деталь механического устройства и «вал» как валовая продукция или валовая выручка предприятия. Явление полисемии внешне сходно с омонимией, т. е. с графическим совпадением слов, несущих различный смысл, например, простой (прилагательное) и простой — вынужденный перерыв в работе.

Ступень 4. Совокупность реляционных файлов, обычно относящихся к одной и той же предметной области или к семантически близким предметным областям, образует реляционную базу данных (РБД).

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Базы данных в свободном и смешанном формате

Базы данных в свободном формате предназначены, главным образом, для визуальной диалоговой работы пользователя за терминалом (в частности, система «Кон-сультант+» и другие подобные системы). Запись для свободного формата представляет собой машинный образ абзаца или строки документа в свободном формате. Записи свободного формата обычно имеют переменную или неопределенную длину (количество символов).

Записи являются элементами файла, причем записи могут быть как жесткого, так и свободного форматов. Данные собираются, хранятся, копируются в виде файлов на магнитных носителях (дисках). В файле обычно содержится однородная экономическая или управленческая информация. Разделение файла на записи обусловлено структурой алгоритма обработки данных. В файлах свободного формата может содержаться, помимо текстовой, графическая, формульная и иная информация.

№>5(11)2007

Свободный формат данных в файлах Л в большей степени соответствует формату | обычного («традиционного») документа. Сле- ^ дует отметить ту особенность, что для файла ^ свободного формата порядок записей обычно существенен, тогда как записи жесткого формата могут располагаться в файле в любом порядке в зависимости от потребностей процедуры обработки. Поэтому файл записей жесткого формата можно рассматривать как множество записей, тогда как подобное утверждение для документов свободного формата обычно неверно.

База данных в свободном формате — совокупность тематически связанных файлов в свободном формате. Отметим, что обычно базы данных содержат файлы как в том, так и в другом формате. Таким образом, в конечном счете внутримашинный информационный фонд представляет собой совокупность разнородных по формату баз данных.

Следует различать понятия файла «для операционной системы компьютера» и «для системы обработки данных». С точки зрения операционной системы файл — это именованная область, занятая некоторой совокупностью данных, обрабатываемая операционной системой (или операционной средой) как одно целое, внутренняя структура которого операционной системе недоступна. Как внутренняя структура файла, так и объединение файлов в тематические базы определяются содержанием и назначением данных и принадлежат области ответственности системы обработки данных.

Обычно тип внутренней структуры файла и его назначение отображаются той частью имени файла, которую принято называть расширением. Оно служит в основном для информирования пользователя и обычно не влияет на работу операционной системы и приложений с этим файлом.

Положительным качеством баз данных в свободном формате является возможность оперативного визуального обновления данных, предназначенных для некомпьютеризированного использования. Подобного рода информация используется юриста-

^91

Не5(11) 2007

1 I

К

со

0

U

1

0 &

1

is

Её

£ о <и

о g

о §

ми, а также работниками налоговых служб, финансистами, бухгалтерами и др. В таких базах данных информация — это различные инструкции, законодательство, поправки к нему.

Реквизитный анализ представляет собой процесс выявления в ручном (бумажном) документе отдельных реквизитов и тех составных единиц данных, в которые эти реквизиты входят. Всякий внутримашинный образ документа для компьютерной обработки представляет собой результат реквизитного анализа, выполненного в процессе проектирования.

При реквизитном анализе выявляются как реквизиты, которые подлежат вводу в машинную память, так и элементы документа, которые не относятся ни к какому реквизиту и ни к какой СЕД, а также те данные, которые не подлежат хранению в информационном фонде.

Понятие «реквизитный анализ» для документов в свободном формате более специфично и во многих случаях возможные автоматические операции над ними сводятся к вводу документа в систему обработки данных полностью с помощью текстового редактора или сканера и к его выводу на подходящий внешний носитель. Все операции обработки подобных документов выполняются пользователем за терминалом системы в режиме диалогового взаимодействия «человек-ЭВМ».

Анализ структуры данного документа и возможностей его нормализованного представления в виде файла на машинном носителе нужно проводить с учетом характеристик его отдельных частей. В составе большинства внемашинных документов в фиксированном формате принято выделять:

1) общую часть документа (иногда называемую заголовочной), хотя по месту расположения реквизиты общей части могут располагаться и в так называемом подножии (обычно итоговые реквизиты);

2) предметные строки документа — множество однородных строк данных, в боль-

шинстве случаев содержащее неопределенное количество подобных строк;

3) оформительскую, или заверительную часть документа — подписи, печати и штампы, удостоверяющие юридическую силу документа и ответственность за его оформление и выполнение; оформительские реквизиты, как правило, не предназначены для хранения в виде нормализованного файла (отметим, что существуют современные технологии электронной подписи и другие методы электронной авторизации юридической силы документа, введенного в память ЭВМ, которые относятся к технологиям защиты информации в ЭВМ);

4) реквизиты, предназначенные для улучшения читабельности внемашинного документа и не подлежащие вводу в нормализованный файл, но, возможно, хранящиеся в форме машинной константы того или иного вида или же в позиции машинного файла специального вида, например, в поле типа MEMO [1];

5) текст в свободном формате, который может храниться в виде машинной константы, отдельного файла или же в поле типа MEMO.

Рассмотренные выше методы и подходы используются в различных информационных системах, функционирующих в российских вузах, например, в Нижегородском государственном университете имени Н.И. Лобачевского и в Нижегородском коммерческом институте Министерства экономического развития и торговли РФ.

Список литературы

1. Салмин С.П. Управленческие информационные комплексы и автоматизированные информационные технологии. Нижний Новгород: Изд-во Нижегородского государственного университета им. H. И. Лобачевского, 1999.

2. Салмин С.П, Торгашев А.Б. Информационный комплекс вуза: метамодель и основные процедуры// Прикладная информатика. 2006. № 2.

3. Петраков Н.Я., Ивантер В.В. Рынок интеллектуального продукта (вместо рецензии)//Вопросы экономики. 1990. № 1.

92

i Надоели баннеры? Вы всегда можете отключить рекламу.