Научная статья на тему 'Анализ эффективности способов представления информации оных структур в задачах управления технологическими процессами и системами'

Анализ эффективности способов представления информации оных структур в задачах управления технологическими процессами и системами Текст научной статьи по специальности «Математика»

CC BY
75
20
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПРЕДСТАВЛЕНИЕ ИНФОРМАЦИИ / ИНФОРМАЦИОННАЯ БАЗА / ЭНТРОПИЯ

Аннотация научной статьи по математике, автор научной работы — Худяков Михаил Павлович

Рассмотрены способы представления информации, используемые при проектировании и управлении технологическими процессами. На базе энтропийного подхода получены зависимости для их оценки по степени понижения объема информации.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Analysis of Presentation Technique Efficiency for Informational Structures in Technological Process and System Control

Information presentation modes used for designing and control over technological processes are analyzed. Dependences for their assessment according to the degree of information volume reduction are obtained based on the entropy approach.

Текст научной работы на тему «Анализ эффективности способов представления информации оных структур в задачах управления технологическими процессами и системами»

УДК 65.015.13: 674.01 М.П. Худяков

Худяков Михаил Павлович родился в 1965 г., окончил в 1987 г. Севмашвтуз, кандидат технических наук, доцент кафедры автоматизации технологических процессов и технических систем машиностроения Севмашвтуза. Имеет более 20 научных работ в области технологии автоматизированного производства.

АНАЛИЗ ЭФФЕКТИВНОСТИ СПОСОБОВ ПРЕДСТАВЛЕНИЯ ИНФОРМАЦИОННЫХ СТРУКТУР В ЗАДАЧАХ УПРАВЛЕНИЯ ТЕХНОЛОГИЧЕСКИМИ ПРОЦЕССАМИ И СИСТЕМАМИ

Рассмотрены способы представления информации, используемые при проектировании и управлении технологическими процессами. На базе энтропийного подхода получены зависимости для их оценки по степени понижения объема информации.

Ключевые слова: представление информации, информационная база, энтропия.

Проектирование и управление технологическими процессами современных производств осуществляется на основе их информационных моделей. Особенно это характерно для комплексных, распределенных, многопрофильных и многономенклатурных производств, к которым можно отнести лесоперерабатывающие и деревообрабатывающие предприятия. Общий объем информации, генерируемой при проектировании подобных технологических процессов и управлении ими, составляет по укрупненным оценкам от нескольких тысяч до сотен тысяч документов. Управление подобным объемом данных - это существенная проблема, которая на сегодняшний день полностью не решена. В этих условиях поиск способов повышения управляемости информационной базы проектирования и оценка их эффективности является актуальной задачей.

Анализ различных технологических процессов показал, что рост общего объема информации при ее изготовлении описывается кривой 1, интенсивность роста этого показателя - кривой 2, изменение количества актуальной ин- формации -кривой 3 (рис. 1).

Из приведенных на рис. 1 кривых видно, что при сильной неравномерности

Рис. 1

прироста общей технологической информации количество актуальной в текущий момент времени информации значительно меньше ее общего объема. Следовательно, с одной стороны, задача управляемости информационной базой технологического проектирования состоит в поддержании высокого уровня актуальности технологической информации, с другой - в снижении объема и неравномерности ее прироста. Первая задача решается обычно средствами ТВЫ/ЕБМ/РБЫ-систем и в данной статье не обсуждается. Рассмотрим методы решения второй задачи.

Любой метод повышения управляемости информационного фонда предусматривает количественный и структурный аспекты. Соответственно критериальные оценки эффективности метода должны предусматривать совместную оценку.

Обозначим за N некоторое общее количество информации, потенциально генерируемое при описании процесса изготовления изделия:

N = AS, (1)

где А - количество элементов описания реальных объектов (состояния изделия, средства технологического оснащения, операции, процессы и т.д.);

S - число потенциально возможных состояний элементов описания, отражаемых записями р фиксированного размера г (количество полей в записи).

С точки зрения информатики количество возможных состояний некоторого элемента описания (сообщения) определяют по формуле

Н = klog2m, (2)

где Н - шенноновская энтропия или мера неопределенности состояния объекта или некоторой ситуации с конечным числом исходов [2]; к - число знаков в сообщении; т - число знаков в алфавите.

Если сопоставить понятие знака в сообщении и понятие поля записи в описании состояния объекта, понятие числа знаков в алфавите и понятие числа значений поля [1], получим

N = А}р ^2г;, (3)

где j — количество однотипных элементов описания.

Из формулы (3) следует, что снижение общего объема N информации возможно за счет уменьшения количества элементов описания А, записей р, используемых для записей полей г.

Формула (3) напрямую применима к системам описания лингвистического характера, использующим для этой цели проблемно ориентированные языки. В этом случае в качестве pj выступает количество необходимых для полного описания j-го объекта записей, а в качестве Гj - количество выраженных лингвистической формулой характеристических признаков j-го объекта описания. Так же применяют формулу (3) и к системам кодирования информации.

Рассмотрим уменьшение количества объектов описания А за счет их типизации. Для этой цели чаще всего применяют различные методы классификации реальных объектов. При их группировке по тем или иным признакам объем описательной информации уменьшается в п раз (степень понижения информационного объема):

п = NN =N/2^^, + 1)/, (4)

где / - количество классификационных групп; р/ - количество записей в группе; г, - количество полей в записях группы.

Для технологий без использования классификаторов п = 1.

Для типовой технологии

п = 4р/^2Г/(р;^2Г; + 1) = А} - А/(р^2Г + 1). (5)

Для групповых технологий с различными концепциями классификации п соответственно составляет промежуточную величину по отношению к рассмотренным случаям. Чтобы избежать потерь информации в несовпадающих полях и записях для существенно различных объектов описания, объединенных в группы, при составлении группы требуется введение дополнительных полей и записей.

Тогда

П = ApJ\0g2Г/{(pm^\0g2ГmЛ~X + 1)/}, (6)

где ргшах - максимальное количество записей в группе;

гГ" - максимальное количество полей в записи группы.

В этом случае максимум п достигается не обязательно при минимуме количества классификационных групп. Таким образом, для заданной совокупности объектов описания существует оптимальный с информационной точки зрения способ классификации с максимальным значением п.

В общем случае процедуру классификации выполняют на нескольких уровнях, что соответствует построению иерархической системы классификации. На каждом уровне степень понижения информационного объема составляет п9, общая степень понижения информационного объема

п =

П

9=1

п

(7)

где / - количество уровней иерархии классификационной системы.

Представив произвольную /-уровневую систему классификации в виде графа (рис. 2), получим очевидное равенство

9

N = ^п^2п2х ... \Nini =

= М^Х ... х^п, (8)

из которого следует, что при одинаковой п больший эффект дают системы с наименьшим количеством уровней. Рис. 2

Так как количество уровней классификации зависит от степени понижения размерности информации на начальных уровнях, более информационно эффективны системы с максимальной п на начальных уровнях.

Классификационные системы не являются единственным механизмом сокращения количества элементов описания. Один из альтернативных механизмов - системы искусственного интеллекта, чаще всего реализуемые в форме экспертных систем (ЭС) как совокупность баз данных и знаний, дополненных интерпретатором. Для ЭС продукционного типа число решений для «дерева» произвольного вида

N = 2г{1 + Д(у, - ЬУ)/(К + sv)у]у=[1, ,]} = 2г{1 + Д(у, - Ьу)/2у]у = [1, г]}, (9)

где г - суммарное количество шагов вывода;

V - номер шага;

ку - количество логических связок v-го уровня типа «если х, то у»;

sv - количество логических связок v-го уровня типа «иначе»;

ку 1;

уу - количество связок v-го уровня типа «или»;

Ьу - количество связок v-го уровня типа «и».

Степень понижения информационного объема на у-м шаге вывода

Пу = 2 + (уу - Ьу)/пу_1, (10)

где пу_1 - степень понижения информационного объема на (у-1)-м шаге вывода.

Количество элементов массива данных, необходимых для вывода, для дерева решений произвольного вида определим по формуле

N = П0(1 + П 1(1 + П2(1 + ... + (п)...). (11)

Из формулы (11) видно, что с точки зрения размера информационного массива более выгодно задавать структуру дерева решений с максимальной степенью понижения в шагах с большими номерами.

Дерево решений в ЭС рассматриваемого типа может быть приведено к эквивалентному бинарному дереву решений путем добавления вершин и ребер. Для него количество элементов массива данных, необходимых для вывода, определим по формуле

N =N + у - Ь, (12)

где N - количество вершин исходного дерева;

у - общее на дерево количество связок типа «или»;

Ь - общее на дерево количество связок типа «и».

Следовательно, при прочих равных условиях ЭС с преобладанием дизъюнктивных операций более эффективна в смысле объема хранимой информации, чем ЭС с конъюнкцией или ЭС на бинарных деревьях.

Для ЭС фреймового типа соотношения (9) - (12) сохраняются, если вместо количества шагов подставить количество уровней вложенности исходного и всех ссылочных фреймов, а выражение (уу - Ь) заменить на (/V + - 2), где / - количество атрибутов исходного фрейма, - количество атрибутов всех ссылочных фреймов.

Для ЭС в виде простой семантической сети

N = ае, (13)

где а - общее число понятий сети;

е - общее число отношений между понятиями.

В семантической сети, вершины (понятия) которой представлены фреймами или продукциями, в формуле (13) следует вместо а подставить выражения, соответствующие зависимостям (9) - (12).

Необходимо отметить, что представленная на рис. 2 система классификации отражает хотя и наиболее распространенный, но частный случай, когда группы не включают общих записей и полей. При использовании общих записей и полей зависимость (6) преобразуют к виду

п = Ар.^2Г/{(ргтаХ^2ГгтаХ + 1 - ргСОт^2ГгСОт)/}, (14) где ргсот - количество общих записей в группе;

г/°от - количество общих полей в записи группы.

Очевидно, что при некотором усложнении структуры взаимосвязей между элементами описания общие поля и записи позволяют еще в большей степени понизить объем информации. Методы, основанные на разделении общих данных, широко применяют в объектных моделях.

Для объектно-реляционных моделей вполне применима зависимость (13), где для а выполняется (14). Аналогично для других комбинированных моделей в силу мультипликативности получены формулы для определения размерности их описания.

Таким образом, получены формулы для оценки различных методов повышения управляемости информационного фонда в технологических процессах и производственных системах, которые могут быть использованы при анализе, синтезе и управлении большими информационными массивами.

СПИСОК ЛИТЕРАТУРЫ

1. Дмитриев В. Прикладная теория информации / В. Дмитриев. - М.: Высш. шк., 1989.

2. Шеннон К. Математическая теория связи / К. Шеннон // Работы по теории информации и кибернетике. - М.: Иностр. лит-ра, 1963.

Севмашвтуз

Поступила 16.02.04

M.P. Khudyakov

Analysis of Presentation Technique Efficiency for Informational Structures in Technological Process and System Control

Information presentation modes used for designing and control over technological processes are analyzed. Dependences for their assessment according to the degree of information volume reduction are obtained based on the entropy approach.

i Надоели баннеры? Вы всегда можете отключить рекламу.