Научная статья на тему 'К вопросу о современном состоянии и перспективах развития информационного обеспечения сельскохозяйственных предприятий'

К вопросу о современном состоянии и перспективах развития информационного обеспечения сельскохозяйственных предприятий Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
279
127
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ДОКУМЕНТООБОРОТ / АНАЛИЗ ДЕЯТЕЛЬНОСТИ СЕЛЬСКОХОЗЯЙСТВЕННОГО ПРЕДПРИЯТИЯ / ОПТИМИЗАЦИЯ ПРОЦЕССОВ / DOCUMENT CIRCULATION / ANALYSIS OF ACTIVITY OF AGRICULTURAL ENTERPRISE / OPTIMIZATION OF PROCESSES

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Кацко Игорь Александрович, Крепышев Дмитрий Александрович

Проведен анализ современного состояния и перспектив развития информационного

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

TO THE QUESTION OF THE MODERN CONDITION AND PROSPECTS OF DEVELOPMENT OF THE INFORMATIONAL SUPPLY OF AGRICULTURAL ENTERPRISES

The analysis of the modern condition and prospects of development of informational supply of agricultural enterprises is carried out

Текст научной работы на тему «К вопросу о современном состоянии и перспективах развития информационного обеспечения сельскохозяйственных предприятий»

УДК 303.732.4

UDC 303.732.4

К ВОПРОСУ О СОВРЕМЕННОМ СОСТОЯНИИ И ПЕРСПЕКТИВАХ РАЗВИТИЯ ИНФОРМАЦИОННОГО ОБЕСПЕЧЕНИЯ СЕЛЬСКОХОЗЯЙСТВЕННЫХ ПРЕДПРИЯТИЙ

Кацко Игорь Александрович д.э.н., профессор

Крепышев Дмитрий Александрович ст. преподаватель

Кубанский государственный аграрный университет, г.Краснодар

Проведен анализ современного состояния и перспектив развития информационного обеспечения сельскохозяйственных предприятий

Ключевые слова: ДОКУМЕНТООБОРОТ, АНАЛИЗ ДЕЯТЕЛЬНОСТИ СЕЛЬСКОХОЗЯЙСТВЕННОГО ПРЕДПРИЯТИЯ, ОПТИМИЗАЦИЯ ПРОЦЕССОВ

TO THE QUESTION OF THE MODERN CONDITION AND PROSPECTS OF DEVELOPMENT OF THE INFORMATIONAL SUPPLY OF AGRICULTURAL ENTERPRISES

Кацко Игорь Александрович Dr.Sci.(Econ.), professor

Krepyshev Dmitry Aleksandrovich senior lecturer

The Kuban state agrarian university, Krasnodar

The analysis of the modem condition and prospects of development of informational supply of agricultural enterprises is carried out

Keywords: DOCUMENT CIRCULATION, ANALYSIS OF ACTIVITY OF AGRICULTURAL ENTERPRISE, OPTIMIZATION OF PROCESSES

Сегодня, не смотря на экономический спад, а может быть и из-за него, обостряется конкуренция во всех сферах производственной деятельности, не исключение и сельское хозяйство. Самый эффективный во все времена способ победы в конкурентной борьбе владеть самым эффективным «оружием». В современном, компьютеризированном и информированном, мире информация и средства ее создания и обработки подчас не менее эффективное «оружие» конкуренции, чем новая техника на полях.

Уже достаточно распространенный способ улучшения работы с информацией и наведения порядка в документообороте использование на предприятии систем автоматического документооборота. Автоматический документооборот призван решить недостатки бумажного, такие как:

• поиск нужного документа;

• контроль исполнения документа;

• получение отчета о работе с документами;

• контроль движения документа на всех этапах его

жизненного цикла;

согласование документов, и множество других.

Спрос на системы автоматического документооборота привел к появлению множества программных продуктов различных зарубежных и отечественных компаний.

Для примера приведем некоторые из популярных и эффективных систем [1, 2].

Docs Fusion и Docs Open. В России Docs Open представлена достаточно давно и уже применяется во многих организациях. Дистрибьютором этого продукта в России является недавно созданная компания HBS. Docs может эффективно применяться и в крупных организациях с большим числом сотрудников (тысячи человек), и в небольших фирмах, где работает пять-шесть человек.

Documentum - это система управления документами, знаниями и бизнес-процессами для крупных предприятий и организаций. Она большей степени, чем готовый продукт, предназначенна для создания распределенных архивов, поддержки стандартов качества, управления проектами в распределенных проектных группах, организации корпоративного делопроизводства, динамического управления содержимым корпоративных интранет-порталов.

В продукте предусмотрено все, что нужно крупной организации, -это интегрированная система, позволяющая комплексно решать достаточно широкий спектр задач. Она включает необходимую функциональность для автоматизации деловых процессов: маршрутизацию, утверждение, распределение, уведомление и контроль исполнения. Безусловно, Documentum является одним из наиболее мощных продуктов, однако позволить себе такую систему могут только организации, которые очень серьезно относятся к задаче автоматизации документооборота и готовы выделить на нее достаточные финансовые и интеллектуальные ресурсы.

LanDocs - в первую очередь ориентирована на делопроизводство и архивное хранение документов. Она состоит из нескольких компонентов:

системы делопроизводства, сервера документов (архива), подсистемы сканирования и визуализации изображений, подсистемы организации удаленного доступа с использованием Internet-клиента, почтового сервера.

Компонент делопроизводства реализован в клиент-серверной архитектуре на базе промышленной СУБД: Oracle или Microsoft SQL Server. Программное обеспечение для централизованного управления хранением документов в электронном архиве реализовано в виде отдельного сервера. В качестве отдельной опции поставляется модуль полнотекстового поиска документов с учетом правил русского языка. Почтовая служба LanDocs сделана так, что сотрудники, у которых установлен специальный клиентский компонент LanDocs, могут получать сообщения-задания и отчитываться по ним, используя стандартный почтовый ящик Microsoft Exchange или Lotus Notes. Продукт открыт для разработчиков - имеется API для встраивания LanDocs в Windows-приложения сторонних разработчиков. Компонент сканирования и работы с изображениями имеет достаточно продвинутую функциональность: он позволяет фильтровать изображения, исправлять перекос, возникший после сканирования, распознавать текст.

Система LanDocs не ориентирована на поддержку коллективной работы и процесса создания документов.

Microsoft SharePoint Portal Server - электронный архив с развитыми средствами поддержки совместной работы. Это, пожалуй, первый продукт компании Microsoft, который может претендовать на роль корпоративного. Поддерживает: совместное создание документов, ведение версий документов, изъятие и возврат документов в архив (check-out, check-in). В нем нет Windows-клиента как такового. Для доступа к архиву используется Web-клиент (сторонние разработчики могут дописывать для него свои компоненты) и компонент, интегрированный в Windows Explorer, что позволяет обращаться к архиву как к набору файлов.

Система достаточно открыта, к ней можно добавлять различные компоненты. Опора на Web-технологии делает такое расширение технологичным.

Продукт наиболее эффективен в качестве базы информационной инфраструктуры для компаний, которые делают ставку не на иерархическое управление, а на матричную организацию взаимодействия людей и плоскую структуру управления. Для традиционных фирм она может стать звеном в интранет-инфраструктуре для «оживления» последней, так как концепции, заложенные в эту систему, позволяют сделать процесс публикации информации на портале частью каждодневной работы с документами, не требующей особо сложных процедур, ресурсов и организационных усилий.

Optima Workflow - кроме общего механизма организации потока работ, он позволяет хранить на время проведения работ все документы, относящиеся к процессу. Для этого в качестве хранилища используется механизм общих папок Microsoft Exchange. Полезной возможностью является отслеживание критических путей и представление комплекса взаимосвязанных работ в виде диаграмм Г анта. Впрочем, эту работу можно производить и в среде MS Project c использованием всех ее возможностей, так как Optima Workflow позволяет экспортировать данные о ходе работ в эту программу.

Система автоматизирует процессы регистрации документов по правилам делопроизводства, реализует механизмы аннотирования и сбора резолюций, доставки отчетов об исполнении поручений.

Тот факт, что Optima Workflov использует в качестве основного хранилища и транспорта Microsoft Exchange, определяет все ее возможности по надежности хранения, защите от сбоев, возможности применения медленных линий связи, синхронизации данных, ограничения доступа к данным. Для регистрации версий документов используется СУБД, к которой

осуществляется доступ через ODBC. Как уже указывалось выше при классификации систем, workflow-система удобна для формализации типовых процедур работы с документами в организациях, где такая работа является ежедневной практикой. Так как Optima Workflow в качестве сервера использует Exchange, его легко внедрить в тех компаниях, где он уже применяется по своему прямому предназначению - как почтовый сервер. Не нужно рассчитывать на то, что Optima Workflow позволит вам задействовать Exchange в качестве электронного архива - для этого есть другие продукты, к примеру, описанный выше Microsoft SharePoint Portal Server. Optima Workflow хранит документы только в процессе, пока работы, связанные с ним, не завершены.

«БОСС-Референт - разработана компанией АйТи. Она ориентирована в первую очередь на организации, руководство которых стремится к оптимизации деятельности своих сотрудников и повышению эффективности работы, в том числе и экономической эффективности. «БОСС-Референт» относится к категории систем, ориентированных на поддержку управления организацией, эффективной работы сотрудников и на накопление знаний, и при этом имеет развитые дополнительные сервисы (о них -чуть ниже).

Основное назначение системы «БОСС-Референт» - создание корпоративной системы, охватывающей деятельность всех сотрудников на своих рабочих местах и поддерживающей управленческие бизнес-процессы. Система поддерживает российские стандарты делопроизводства, организационное управление, контроль исполнительской дисциплины, отслеживание договоров с внешними организациями, согласование документов. Отличительная особенность ее в том, что, будучи полноценной системой документооборота, предназначенной для работы всех сотрудников организации, она уже обладает всей необходимой функциональностью для реализации делопроизводства. В ней с самого начала фигурируют понятия, роли

и функции, присущие организациям со сложной иерархической, в том числе территориально распределенной, структурой в России. Другая отличительная черта системы «БОСС-Референт»: в ней реализованы функции CRM-системы, контроля договоров, учета материальных ценностей, потокового сканирования и распознавания (в «БОСС-Референт» интегрирована система FineReader), электронной конференции и доски объявлений.

Дополнительные модули системы «БОСС-Референт» включают автоматизацию организации и планирования мероприятий, автоматизацию деятельности бюро пропусков на предприятии, генератор отчетов, факс-сервер.

Система реализована на платформе Lotus Notes. Благодаря этому вдобавок к функциям «БОСС-Референта» пользователи получают в свое распоряжение все богатство функциональности самой среды Lotus Notes, включая электронную почту, репликацию данных, возможность удаленной работы и т. д. «БОСС-Референт» является наиболее открытой во всех смыслах системой - она поставляется вместе с полными исходными текстами. К ней дополнительно прилагается инструментарий разработчика с полным описанием функций прикладного программного интерфейса.

Компания АйТи разработала несколько методик оценки экономического эффекта внедрения СЭД «БОСС-Референт». На основании таких оценок можно посчитать реальную экономию от перевода в электронный вид процессов согласования, создания, поиска и хранения документов, договоров, использования шаблонов документов, автоматизации процессов контроля исполнения поручений, работы с договорами и т.д. Такие методики, наряду с методиками TCO (total cost of ownership), применяются при оценке проектов внедрения системы на коммерческих предприятиях.

«Дело» - является типичным представителем систем автоматизации делопроизводства и именно в этом качестве приобрела популярность у нас в стране. Она последовательно поддерживает все правила делопроизводст-

ва, унаследованные от советского делопроизводства и принятые в России. Разработчик - компания «Электронные офисные системы» (ЭОС) - взял курс на пересмотр концепции продукта в сторону создания полноценной системы документооборота. Продукт поддерживает идеологию делопроизводства, суть которой в следующем: чтобы было совершено любое действие в организации, нужен документ, к которому «приделываются ноги», то есть обеспечивается его движение. Движение документов (при том, что физически они, естественно, не перемещаются) происходит за счет изменения учетных записей о документах в базе данных. Для хранения документов компания ЭОС недавно представила отдельный продукт, интегрированный с системой «Дело», обеспечивающий функции электронного архива. В системе реализован Web-интерфейс, что удобно для организации удаленного доступа и построения интранет-порталов. Система имеет API, позволяющий интегрировать ее с различными приложениями. «Дело» хранит учетные записи средствами промышленной СУБД - Oracle или Microsoft SQL Server; осуществляет полное протоколирование действий пользователей с документами. Последняя версия интегрирована с системой распознавания FineReader для занесения в нее данных с бумажных документов. Продукт в первую очередь интересен для организаций, которые сталкиваются с необходимостью внедрения формализованного делопроизводства для подразделений секретариатов, канцелярий, общих отделов.

«Евфрат» - простой электронный архив с базовыми возможностями контроля исполнения. Разработан компанией Cognitive Technologies. Компания предлагает спектр продуктов для организаций различного масштаба - от версии для малого офиса до варианта для крупных компаний. В нашем случае речь пойдет о втором варианте, называемом «Евфрат Клиент-сервер», в котором в качестве клиентской части используется «Евфрат-Офис», являющийся самостоятельным продуктом, который может работать независимо от серверного компонента системы.

«Евфрат» построен в парадигме «рабочего стола» с папками. Документы раскладываются по папкам, которые могут иметь любую степень вложенности. Собственного хранилища файлов «Евфрат» не имеет - система хранит только ссылки на файлы или на страницы в Internet. Для хранения реквизитов документов используется СУБД собственной разработки. В комплект продукта входят утилиты, позволяющие уплотнять и архивировать базу данных этой СУБД.

Отличительной особенностью является возможность открыть и просмотреть любой документ поддерживаемого системой формата с помощью встроенной программы просмотра, правда, без форматирования и иллюстраций, что, впрочем, не составляет проблемы, так как документ можно открыть во внешнем «родном» приложении. К сожалению, «Евфрат» не дает возможности отслеживать получение и возврат документов (check-out, check-in) и хранение версий, что может усложнить коллективную работу с документами. Система позволяет описать категории документов и приписать любой из категорий любые реквизиты.

Для ввода информации с бумажных носителей в комплект продукта входит система потокового ввода, основанная на другом продукте компании - системе распознавания текстов Cuneiform. По сути, «Евфрат» представляет собой средство сканирования, распознавания, регистрации документов, присвоения им реквизитов, индексации, полнотекстового поиска, назначения заданий, связанных с документом, и контроля их исполнения. Это недорогое решение, которое может оказаться полезным в малом офисе или на предприятиях, не предъявляющих высоких требований к масштабируемости информационной системы

Однако для сельскохозяйственного предприятия, площади которого могут быть достаточно большими, а техника и персонал перемещается по территориям не только самого предприятия, но и района, края, а то и всей страны важна не только актуальная работа с документацией. Важным яв-

ляется контроль за техникой и персоналом и с учетом больших расстояний большинство используемых средств контроля не эффективно, что приводит к убыткам и снижению конкурентоспособности предприятия.

Для решения данных проблем разработаны комплексы программ. Некоторые из них:

«1С:Предприятие8. Управление сельскохозяйственным предприятием »[4]. Фирма «1С» выпустила продукт «1С:Предприятие 8. Управление сельскохозяйственным предприятием» - созданный на базе решения «1С:Предприятие 8. Управление производственным предприятием».

Функционал решения «1С:Предприятие 8. Управление сельскохозяйственным предприятием» учитывает отраслевую специфику сельскохозяйственных предприятий разных направлений деятельности:

• Растениеводство

• Молочное животноводство (КРС)

• Свиноводство.

Решение может использоваться как на отдельных предприятиях, так и в сельскохозяйственных холдингах для комплексной автоматизации планирования, производственного и регламентированного учета, анализа сельскохозяйственной деятельности.

При разработке решения учтены специфика отрасли и опыт автоматизации более 30 предприятий, в том числе ООО «Агрофирма «Золотая нива», ООО «Индустриальная управляющая компания», ООО «Сельхоз-Инвест», ООО «Агро-Инвест», ООО «АРДИАЙ ЛЭНД МЕНЕДЖМЕНТ», ООО «Корпорация Сантимир», Группа компаний «Агро-Интел», ООО «Белгородский бекон», ЗАО «Русская свинина», и включает в себя тттиро-кий функционал по автоматизации различных аспектов управленческой и учетной деятельности сельскохозяйственных предприятий.

Продукт «1С:Предприятие 8. Управление сельскохозяйственным предприятием» предназначен для решения следующих задач:

• создание единой технологии управления информационными ресурсами предприятия на базе единой корпоративной платформы автоматизации;

• формирование данных для контроля за изменением активов предприятия, выполнением планов и заданий по производству и сбыту сельскохозяйственной продукции, выполнением планов по снабжению материально-техническими ресурсами;

• ведение учета и составление установленной отчетности о производственной деятельности;

• повышение качества управленческой информации, то есть ее достоверности и аналитичности;

• прозрачность информации, доступность ее руководству предприятия за любой период времени для принятия управленческих решений;

• расширение возможностей и повышение качества аналитической работы для менеджмента предприятия;

• комплексная автоматизация основных бизнес-процессов: планирование сельхоздеятельности, оперативный управленческий, бухгалтерский и налоговый учет, анализ деятельности, как в отдельности, так и в их взаимосвязи;

• систематизация и регламентация управленческого и бухгалтерского документооборота предприятия;

• исключение дублирования ввода и сокращение многократной обработки информации;

• повышение уровня квалификации и качества работы персонала;

• эффективная обработка больших объемов информации;

• исключение необходимости конвертации данных между информационными базами различных форматов;

• повышение исполнительской дисциплины персонала.

Система «АгроХолдинг»[3] создана и эффективна для:

• автоматизированного сбора оперативных данных,

• визуального мониторинга текущего состояния технических средств на карте,

• оперативного контроля за ресурсами,

• автоматизированной обработки агротехнологических данных ,

• автоматизированного планирования и учета деятельности сельхозпредприятия Разработанная специалистами компаний КБ «Панорама» г. Москва и «ЦентрПрограммСистем» г.Белгород.

При внедрении системы «АгроХолдинг» достигаются следующие результаты:

• Повышение качества земель и ускоренная рекультивация. Достигается за более точной дозировки внесения удобрений, рассчитанной на основе методов научной агрохимии, текущего фона действующего вещества, и, как следствие, снижение вредного влияния удобрений на качество земель.

• Повышение качества и оперативности принимаемых решений. Достигается за счет автоматизированного сбора данных и мониторинга текущего состояния технических средств, оперативного контроля за движением ресурсов (ГСМ, семена, удобрения, и др.).

• Снижение себестоимости сельхозпродукции. Зарубежный опыт показывает, что при применении технологии точного земледелия только расходы на минеральные удобрения могут сокращаться на 30% при одновременном повышении урожайности.

• Увеличение прибыли за счет оптимизации сельскохозяйственного производства, экономии хозяйственных и природных ресурсов.

• Повышается достоверность предоставляемой финансовой и управленческой отчетности. Создание единой базы данных позволяет объединить информационные потоки и исключить дублирование вводимой информации. Недостатком перечисленных выше информационных систем http://ej.kubagro.ru/2009/09/pdf/07.pdf

является ограниченные возможности по извлечению знаний из баз данных для оказания поддержки процессов принятия управленческих решений, что доступно современным системам класса KDD (knovledge discovery in databases), основанных на синтезе идеологии прикладной статистики и интеллектуального анализа данных. Одной из таких систем является аналитическая платформа Deductor, ориентированная на решение задач анализа самого широкого спектра: от создания систем корпоративной отчетности до решения задач Data Mining. Реализованные в Deductor технологии позволяют на базе единой платформы пройти все этапы построения аналитической системы: от создания хранилища данных до автоматического подбора моделей и визуализации полученных результатов» [6].

Knowledge Discovery in Databases

Источники данных

Г Выборка

Исходные данные

Т

Очистка

Очищенные данные

^Трансформация

Трансформированные данные

Знания

ТЕХНОЛОГИИ АНАЛИЗА ДАННЫХ

Рисунок 1 - Этапы открытия (добычи) знаний в базах данных1

1 Анализ бизнес информации - основные принципы, BaseGroup Labs [6] http://ej.kubagro.ru/2009/09/pdf/07.pdf

Таким образом, если большинство Data Mining систем большее внимание уделяет аналитическому аппарату (например, эволюционное программирование в PolyAnalyst) и проблеме очистки данных, то Deductor кроме аппарата и методов очистки данных, предлагает инструменты построения физического и виртуального хранилища данных, возможности построения сценариев обработки и экспорта данных. Компания BaseGroup Labs в развитие идеологии KDD Пятецкого-Шапиро (см. рисунок 1) предлагает концепцию «тиражирования знаний» когда отчеты, модели, правила, полученные экспертом, используются всеми сотрудниками организации без необходимости понимания способов и методов получения подобных результатов. Deductor (http://www.basegroup.ru) компании BaseGroup Labs, начиная с первых версий (2001г.), прошел следующий путь: совокупность самообучающихся алгоритмов - набор алгоритмов для решения основных задач Data Minig - Knowledge Discovery in Databases (система обнаружения знаний в базах данных с возможностями предобработки - очистки, фильтрации, преобразования данных, заполнения пропусков) - система тиражирования знаний - аналитическая платформа, позволяющая поставить анализ данных «на конвейер». Реализованные в Deductor технологии позволяют на базе единой архитектуры пройти все этапы построения аналитической системы - от создания хранилища данных до автоматического подбора моделей и визуализации полученных результатов, в частности, в виде OLAP-кубов, таблиц, диаграмм, гистограмм, карт, графов и т. д. Аналитическая платформа Deductor состоит из трех компонентов [5, 6]:

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1. Многомерного хранилища данных Deductor Warehouse.

2. Аналитического приложения Deductor Studio.

3. Средства тиражирования знаний Deductor Viewer.

Deductor Warehouse - многомерное хранилище данных, позволяющее аккумулировать из разных источников всю необходимую для анализа предметной области информацию. Использование единого хранилища позволяет

обеспечить непротиворечивость данных, их централизованное хранение и автоматически обеспечивает всю необходимую поддержку процесса анализа данных. Deductor Warehouse оптимизирован для решения именно аналитических задач, что положительно сказывается на скорости доступа к данным.

Deductor Studio - это программа, предназначенная для анализа информации из различных источников данных. Она реализует функции импорта, обработки, визуализации и экспорта данных. Deductor Studio может функционировать и без хранилища данных, получая информацию из любых других источников, но наиболее оптимальным является совместное использование с Deductor Warehouse. В Deductor Studio включен полный набор механизмов, позволяющий получить информацию из произвольного источника данных, в том числе и 1С бухгалтерии, провести весь цикл обработки (очистку, трансформацию данных, построение моделей), отобразить полученные результаты наиболее удобным образом (OLAP, диаграммы, деревья и т. д.) и экспортировать результаты на сторону.

Deductor Viewer - это облегченная версия Deductor Studio, предназначенная для отображения построенных в Deductor Studio отчетов. Она не включает в себя механизмов создания сценариев, но обладает полноценными возможностями по их выполнению и визуализации результатов. Deductor Viewer является средством тиражирования знаний для конечных пользователей, которым не требуется знать механику получения результатов или изменять способы их получения.

Хранилище данных Deductor Warehouse - это специально организованная база данных, ориентированная на решение задач анализа данных и поддержки принятия решений, обеспечивающая максимально быстрый и удобный доступ к информации.

Взаимодействие компонентов аналитической платформы Deductor проиллюстрировано на рисунке 4.5 [6].

Рисунок 2 - Компоненты платформы Deductor [6]

На практике в компаниях и госучреждениях часто бывает так, что информация вроде бы где-то есть, и ее даже много, но она не структурирована, не согласована, разрознена, не всегда достоверна, ее практически невозможно найти и получить в едином формате. Для устранения этого противоречия (когда при физическом наличии данных и даже их избытке фактически информация для анализа отсутствует) создается хранилище данных. Это позволяет превратить все многообразие накопленных в организации данных в ценную для принятия решений и управления информацию. Таким образом, хранилище представляет собой специальную базу данных, в которую по определенному регламенту (например, один раз в сутки, неделю или месяц) выгружаются данные из одной или сразу нескольких учетных систем или баз данных (1С - Бухгалтерия, собственные источники и т. п.).

Назначение хранилища данных - своевременно обеспечить аналитика всей информацией, необходимой для проведения анализа, построения моделей и принятия решений. Цель хранилища данных - не анализ данных, а подготовка данных для анализа и их консолидация.

Работа с данными из хранилища Deductor Warehouse осуществляется в терминах предметной области, например, центра занятости населения, что является очень удобным для пользователя. От пользователя не требуется знания структуры хранения данных и языка запросов. Он работает с привычными ему терминами центра занятости - образование, пол, возрас-

тная группа, дата заведения карточки безработного, дата закрытия карточки безработного, первая-четвертая профессии, последняя профессия, стаж и т. д.

В Deductor реализован механизм OLAP, который является на сегодня одним из популярных методов анализа данных. OLAP (англ.: OnLine Analytical Processing) - технология оперативной аналитической обработки данных, обеспечивающая возможность многомерного анализа данных [28, 139]. (Следует отметить некоторую разницу в подходах к OLAP, например, StatSoft ориентируется на OLAP как на общую идеологию разведочного анализа данных, в которую помимо практически всех методов прикладной статистики входит и механизм представления данных в виде кубов OLAP, о котором говорится здесь.)

Основное назначение OLAP - поддержка аналитической деятельности, произвольных (не регламентированных) запросов лиц, принимающих решения. На основе OLAP строятся системы поддержки принятия решений и системы подготовки отчетов.

OLAP-анализ может быть применен для построения отчетности, а также для первичной проверки возникающих гипотез.

В процессе принятия решений аналитик генерирует некоторые гипотезы. Для превращения этих гипотез в законченные решения они должны быть проверены. Проверка гипотез осуществляется на основании информации об анализируемой предметной области. Как правило, наиболее удобным способом представления такой информации для человека является зависимость между некоторыми параметрами. Например, зависимость безработицы от региона, образования, возрастной группы, пола и т. п. Другим примером может служить зависимость трудоустроенных лиц от сезона, категории незанятости и т. п.

В процессе анализа данных, поиска решений часто возникает необходимость в построении зависимостей между различными параметрами.

Кроме того, число таких параметров может варьироваться в широких пределах. Традиционные средства анализа, оперирующие данными, которые представлены в виде таблиц реляционной базы данных, не могут в полной мере удовлетворить таким требованиям. Чаще всего данные по различным параметрам анализируемого процесса хранятся в разрозненных таблицах и нужно затратить немало времени, чтобы свести их в единое целое. При этом увидеть зависимость между параметрами зачастую очень сложно.

В OLAP-системах разрозненная информация представляется в виде многомерного куба, которым можно легко манипулировать, извлекая срезами нужную информацию (рисунок 3).

=> |___________

Кросс таблица Кросс диаграмма

Плоские таблицы N -мерный куб Отображения среза

Рисунок 3 - Технология OLAP [5]

Обе российские системы (PolyAnalyst и Deductor) фактически являются рабочим местом аналитика, занимающегося анализом данных большого объёма.

Кроме PolyAnalyst и Deductor, на российском рынке свои решения в области Data Mining продвигают компании мирового уровня (однако далеко не все, например, IBM, Insightful Corp. и другие известные производители не представлены на российском рынке).

Отчасти это связано с тем, что Россия пока что имеет очень низкий спрос на решения в области Data Mining, который не превосходит даже спрос средней европейской страны) [5, 6].

Системы ИАД в настоящее время преимущественно используются в бизнесе. Между тем очевидна возможность использования этих систем при решении задач управления в сельскохозяйственном производстве.

Основные предпосылки этого заключаются в возможности использования современных информационных технологий - использования сценариев анализа, включающих создание хранилища данных, загрузку в него информации, извлечение и очистку данных (ETL), интеллектуальный анализ данных, создание отчетов для конечного пользователя (ЛПР).

Data Mining имеет свои ограничения и сферу применимости. Незнание ограничений и особенностей Data Mining ведет к тому, что разработчик и клиент зря теряют время и деньги на бесполезных экспериментах.

1. Data Mining должен анализировать табличные данные. Если информацию невозможно структурировать - Data Mining бессилен. Именно поэтому в настоящей работе предлагается на первом этапе исследования проводить когнитивный анализ изучаемой системы, а затем, выделяя подсистему, характеризующуюся структурированной информацией, применять методы прикладной статистики и ИАД.

2. Data Mining - эффективное средство поиска скрытых закономерностей, которое позволяет узнать, какие комбинации из 50-100 признаков объекта оказывают влияние на его поведение. Если признаков клиента мало, большой пользы от Data Mining нет, так как зависимости между двумя-тремя критериями можно достаточно просто узнать, используя только OLAP и методы прикладной статистики.

Если критериев меньше трех-пяти, скорее всего, Data Mining не откроет ничего нового. Например, если данные состоят только из названия

объектов и их реквизитов, для использования Data Mining нет особых причин [6].

Выводы

Любая классификация, сводится к поиску сходств и различий объектов (в нашем случае систем анализа данных), поэтому её нельзя назвать абсолютной.

У всех перечисленных выше систем имеются общие черты.

Во-первых, все системы ориентированы на извлечение информации из табличных данных (как числовых, так и текстовых) и превращения её в знания, необходимые для управления и принятия решений.

Во-вторых, практически все технологии анализа основываются на теориях 60-х годов ХХ века, которые относили к методам разведочного анализа данных (прикладной статистики), кибернетики, теории искусственного и машинного интеллекта и computer science.

В-третьих, в отличие от классических моделей статистики и эконометрики вид изучаемых связей и зависимостей не задаётся априори, а подбирается компьютером итеративно в целях наилучшего описания данных, таким образом, решается задача непараметрической идентификации объекта.

В-четвертых, в качестве критериев адекватности обычно используются (несмотря на частые утверждения об абсолютной независимости от теории вероятностей и математической статистики) формальные вероятностные методы.

В-пятых, основной целью использования перечисленных выше систем является получение информации для объективного анализа (содержательно-целевой подход). Если формальные методы основываются на идее достижения некоторого критерия проверки гипотез, например, F-Фишера (дисперсионный анализ), то содержательные методы предполагают дости-

жение целей моделирования (получение модели для прогноза, управления и т. д.).

Таким образом, все (или почти все) перечисленные выше классы систем анализа данных позволяют решать одни и те же задачи, но делают это с помощью разных подходов, основные идеи которых изложены выше. Системы ИАД реализуют содержательно-целевой подход и позволяют объективно анализировать сложные системы, характеризующиеся структурированной (слабоструктурированной) информацией. Использование методов ИАД обосновывается «новой парадигмой» в анализе данных, соответствующей принципам научного подхода к изучаемым объектам, основанного на знаниях, предположительно содержащихся в данных. Таким образом, исходные структурированные данные - это информационная модель объекта, описание которой может основываться на трех подходах: вероятностном, геометрическом и когнитивном (основанном на знаниях -экспертных либо содержащихся в данных). Решение проблем управления СЭС на основе использования ИАД позволяет избавиться от априорных предположений относительно природы данных, которые относят к недостаткам методов прикладной статистики.

Проведенный анализ наиболее известных средств ИАД в России позволил выявить преимущества системы Deductor, имеющей достаточно полный набор средств анализа, позволяющей пройти весь процесс от создания хранилищ данных до получения отчетов. В качестве альтернативных средств могут использоваться системы PolyAnalyst и Statistica. Преимуществом подобного рассмотрения является возможность построения моделей, опирающихся на различные априорные предположения о природе данных. Критерием выбора той или иной модели является согласование с практическими наблюдениями и мнением экспертов.

Эффективно работающие предприятия и организации заинтересованы в повышении эффективности своей деятельности, которая в своей ос-

нове должна основываться на улучшении качества информационного обеспечения. Без сбора, анализа оперативной и ретроспективной информации, например, о результатах деятельности сельхозорганизаций, продуктовых, материально-технических рынков в настоящее время невозможно повышение качества управления. Создание систем поддержки принятия управленческих решений на базе информационно-консультационных служб (в сельском хозяйстве), центров занятости населения и т. д. с использованием систем интеллектуального анализа данных для анализа и идентификации социальных и экономических систем позволит извлекать знания из данных о деятельности СЭС при принятии управленческих решений для перехода к «экономике знаний».

Литература

1. Конюшенко Е. К. Выбор системы электронного документооборота: взгляд заказчика [Электронный ресурс] Режим доступа: Ьйр:/М^ш.1<1егк.ги/Ьо^»?59543

2. Обзор систем документооборота [Электронный ресурс] Режим доступа: Ьйр://рголгеюїііиаі1іс1е59М=5&аісІ=82

3. ИАС "АгроХолдинг" [Электронный ресурс] Режим доступа:

Ийр:/М^ш. 1cps.ru/he1p15.htm1

4. 1С: Предприятие 8. Управление сельскохозяйственным предприятием [Электронный ресурс] Режим доступа: Ьйр:/М^ш. 1c.ru/news/mfo.isp?id=9060

5. Паклин Н.Б., Орешков В.И. Бизнес-аналитика: от данных к знаниям (+ СБ). — СПб.: Питер, 2009. — 624 с.

6. Практикум по анализу данных на компьютере: Учеб. пособие для вузов / Кацко И. А., Паклин Н.Б. - М.: Издательство "КолосС", 2009. - 278 с.

i Надоели баннеры? Вы всегда можете отключить рекламу.