провести прогнозное моделирование и анализ альтернативных сценариев поведения распределительной системы;
проанализировать и дать оценку системной эффективности распределительной системы (кластера) РГРК.
Системный анализ в формате решения этого комплекса задач позволит, в частности, разработать методику оптимизации региональных газораспределительных сетей и структуры потребителей, обеспечивающую максимизацию прибыли РГРК. ,
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
1. Оттер С. Л. Системный анализ для решения деловых и промышленных проблем // Сов. радио. 1969.
2. Кутуков С.ЕВасильев В.И. Элементы искусственного интеллекта в системах сбора, подготовки и транспорта углеводородного сырья // Нефтегазовое дело/ 2003/ http://www.ogbus.ru.
3. Завальный П.К Оптимизация работы сложной газотранспортной системы // Газовая промышленность. 2002. №9. С. 56-59.
4. Овчаров А,Б. Расчеты стоимостной оптимизации проектных параметров магистрального газопровода // Газовая промышленность. 2004. №7. С. 42-46.
5. Эшби У. Введение в кибернетику. М.: Изд-во иностр. лит., 1959.
6. Бир Ст. Кибернетика и управление производством. М.: Наука, 1965,
7. Овчаров А. Б. Стоимостная оптимизация проектных параметров магистрального газопровода // Газовая промышленность. 2004, №2. С. 78-82.
8. Исаев Е.С., Бородавко А.Ю. Выбор оптимальных параметров проектируемых магистральных газопроводов // Газовая промышленность. 2004. №7. С. 47-48.
9. Акофф Р. Планирование будущего корпораций. М.: Прогресс, 1985.
10. Берталанфи Л. Общая теория систем - критический обзор // Исследования по обшей теории систем. М.: Прогресс, 1969. С. 23-82.
11. Лившиц В.И. Системный анализ экономических процессов на транспорте. М.: Транспорт, 1986.
12. Лившиц В.Н. Оптимизация при перспективном планировании и проектировании. М.: Экономика, 1983.
13. Болтянский В Г, Оптимальное управление дискретными системами. М.: Наука, 1973.
14. Моисеев Н.Н. Численные методы в теории оптимального управления. М.: Наука, 1971.
Статья поступила в редакцию 10 января 2006 г
УДК 004.382 И.А. Ми на ко в
КЛАСТЕРИЗАЦИЯ НЕСТРУКТУРИРОВАННОЙ ИНФОРМАЦИИ, ПРЕДСТАВЛЕННОЙ В ВИДЕ ТЕКСТОВ НА ЕСТЕСТВЕННОМ ЯЗЫКЕ
Рассматривается проблема кластеризации неструктурированной информации, представленной в виде текстов на естественном языке. Дан обзор существующих методов семантической кластеризации документов, выделены недостатки имеющихся методов и программных средств, предложен новый метод, основанный на мулыпиагентной кластеризации семантических дескрипторов документов, построенных на базе онтологии предметной области. Описывается логическая схема алгоритма, преимущества подхода, перспективы развития.
1. Введение в проблему
Развитие индустрии систем электронного документооборота, сопровождающееся ростом массивов обрабатываемых полнотекстовых документов, требует новых средств организации доступа к информации, многие из которых следует отнести к разряду систем искусственного интеллекта - систем обработки знаний (последнее время в данном контексте в литературе также популярен термин Text Mining).
Основной задачей, возникающей при работе с полнотекстовыми хранилищами данных, является задача поиска документов по их содержанию. Однако ставшие традиционными средства контекстного поиска по вхождению слов в документ, представленные, в частности, поисковыми машинами в Интернет, зачастую не обеспечивают адекватного выбора информации по запросу пользователя.
Наиболее известная проблема заключается в сложности точной формулировки запроса, понятной компьютеру. Эго может быть связано с рядом причин, как то: недостаточным знанием пользователем терминологии предметной области, наличием в языке многозначных и синонимичных слов, недостаточным пониманием семантики запроса и документа и даже орфографическими ошибками в написании искомых слов, которые могут встречаться как в текстах, так и в самом запросе.
Но другая, еще более фундаментальная причина заключается в том, что иногда пользователь не знает точно, какую именно информацию ему хотелось бы получить, имея лишь общее представление о границах своих интересов, или же он не обладает знанием, какая именно информация ему в принципе может быть доступна и скрывается в существующих документах. Поэтому ему необходимы механизмы, позволяющие исследовать содержащиеся в документах знания, например, классифицировав найденный материал по тематическим группам, отражающим, к примеру, основные события и разработки в исследуемой области.
Традиционно, задачи обработки и анализа документов включают в себя следующие области.
• Кластеризация документов
Целью кластеризации документов является автоматическое выявление групп семантически похожих документов среди заданного фиксированного множества документов [1, 2]. Отметим, что группы формируются только на основе попарной схожести описаний документов, и никакие характеристики этих групп не задаются заранее.
• Классификация документов
В отличии от задачи кластеризации, целью этой задачи является определение для каждого документа одной или нескольких из заранее заданных категорий, к которым этот документ относится. Особенностью задачи классификации является предположение, что множество классифицируемых документов не содержит «мусора»1, т.е. каждый из документов соответствует какой-нибудь из заданных категорий.
Частным случаем задачи классификации является задача тематической классификации. Здесь каждая категория - это некоторая тематика, а цель классификации — определить тематику документа [3, 4],
• Фильтрация документов
Как и в задаче классификации, целью задачи фильтрации является разбиение множества документов на категории. Однако этих категорий только две - те документы, которые удовлетворяют заданному критерию, и те, которые ему не удовлетворяют.
Одной из наиболее важных частных случаев является задача тематической фильтрации документов, т.е. автоматического определения документов, соответствующих заданной тематике, за счет отсева прочих документов [5, б].
В данной статье мы опишем способ решения проблемы кластеризации документов как наиболее сложной из перечисленных. Для решения задачи кластеризации документов (а в общем случае - семантических сетей, представляющих онтологические сцены) нами был разработан собственный метод кластеризации, построенный на принципах создания открытых муль-тиагентных систем [7-9]. В этом подходе свое воплощение находят идеи самоорганизации и эволюции данных, высказанные еще М. Мински [10] и И. Пригожиным [11] и противопоставляющие традиционным централизованным, жестким и последовательным алгоритмам решения задач динамичное и гибкое взаимодействие относительно простых программных агентов, представляющих «интересы» любых записей, образов, кластеров, сетей и т.д. Очевидно, что на основе подобных принципов может быть создан качественно новый инструмент интеллектуального анализа данных, открытый и гибко адаптируемый к решаемой задаче, глубоко интегрируемый с другими системами, легко распараллеливаемый и т.д.
Предлагаемый нами способ кластеризации достаточно универсален и подходит для анализа как структурированных данных (представленных, например, таблицами), так и семантических сетей. В следующих параграфах мы рассмотрим основные имеющиеся способы кластериза-ции\классификации документов, проанализируем их слабые стороны (которые и послужили причиной разработки собственного метода) и опишем алгоритм ику предлагаемого нами подхода.
2, Обзор существующих методов семантической кластеризации
Оформившись в середине 90-х годов XX века как направление анализа неструктурированных текстов, технология Text Mining сразу же взяла на вооружение методы классической добычи данных, такие как классификация или кластеризация. В Text Mining появились и дополнительные возможности: автоматическое реферирование текстов и выделение понятий, феноменов, фактов. Сегодня в соответствии с уже сложившейся методологией к основным элементам Text Mining относятся суммаризация (summarization), выделение феноменов, понятий (feature extraction), кластеризация (clustering), классификация (classification), ответ на запросы (question answering), тематическое индексирование (thematic indexing) и поиск по ключевым словам (keyword searching). Также в некоторых случаях набор дополняют средства поддержки и создания таксономии (taxonomies) и тезаурусов (thesauri).
На данный момент существует множество методов, осуществляющих кластеризацию или классификацию документов. Некоторые методы могут применять несколько альтернативных алгоритмов. В число наиболее часто используемых методов кластеризации входят:
- Support Vectors (метод опорных векторов) [12] - метод первоначальной классификации, который решает задачу построением гиперплоскостей в многомерном пространстве, разделяющих группы наблюдений с разными классовыми метками;
- байесовские сети (Bayesian networks) [13] и байесовские классификаторы (Bayesian classifiers) [14] - разработаны на основе теоремы Байеса и специально предназначены для работы со входными данными высокой размерности. Метод опирается на предположение о том, что независимые переменные статистически независимы;
- LSA/LSI - Latent Semantic Analysis/Indexing [15]. Путем факторного анализа множества документов выявляются латентные (скрытые) факторы, которые в дальнейшем являются основой для образования кластеров документов;
- STC - Suffix Tree Clustering [16]. Кластеры образуются в узлах специального вида дерева - суффиксного дерева, которое строится из слов и фраз входных документов;
- Single Link [17], Complete Link, Group Average (UPGMA) - эти методы разбивают множество документов на кластеры, расположенные в древовидной структуре - dendro-gramm, получаемой с помощью иерархической агломератнвной кластеризацией;
- Scatter/Gather [18]. Представляется как итеративный процесс, сначала разбивающий (scatter) множество документов на группы, а затем представляющий эти группы пользователю (gather) для дальнейшего анализа. Далее процесс повторяется снова над конкретными группами.
- K-means [19]. Относится к разделяющим алгоритмам. Кластеры представлены в виде центроидов, являющихся “центром массы” всех документов, входящих в кластер.
- Cl - Concept Indexing [20]. Разбивает множество документов методом рекурсивной бисекции, т.е. разделения множества документов на две части на каждом шаге рекурсии. Метод может использовать информацию, полученную на этапе обучения.
- Concept vector-based clustering [21] - для каждого набора документов нормализует его концепт-описатель - веетор уникальных слов путем подсчета весов векторов входящих в него документов, затем каждый новый документ приписывается к группе с наименьшим расстоянием между его вектором и вектором группы;
- SOM - Self-Organizing Maps [22]. Производит классификацию документов с использованием самонастраивающейся нейронной сети. Нуждается в предварительном обучении.
К программным разработкам, посвященным кластеризации документов, можно отнести следующие продукты: Vivisimo Clustering Engine [23], Inxight categorizer [24], Intelligent Miner for Text [25], TextAnalyst [26], SemioMap [27], Autonomy Portal-in-a-box [28] и ряд других.
Обзор возможностей подобных систем можно найти, например, в [29], а сравнение методов -в [30,31].
Подводя итог анализу методов, применяющихся в текущий момент для задач кластеризации, следует отметить, что они в массе своей обладают рядом принципиальных недостатков, не решенных в настоящее время на уровне промышленных продуктов.
Среди основных недостатков существующих методов можно выделить следующие.
- Отсутствие работы с семантическими сетями, позволяющими точнее представлять
смысл документа (подавляющее большинство алгоритмов ориентировано на работу с векторами, представляющими собой список ключевых (иногда уникальных) слов документа), и как следствие, невозможность использования знаний о предметной области (онтологии) в процессе кластеризации.
— Возможность создания только «исключающей» иерархии, когда каждый документ может входить лишь в одну группу (невозможно создать семантически более сложные структуры и сети, когда документ входит во многие группы, иногда сами по себе семантически не пересекающиеся \ противоречащие).
— Невозможность отслеживать ход работы, логику принимаемых решений и обоснованность результата. Зачастую непонятно, по каким признакам алгоритм определил документы как семантически близкие.
— Многие алгоритмы демонстрируют существенную зависимость качества результатов от изначальной предпосылки-догадки о «правильной структуре», т.е. количестве и начальном положении центров кластеров.
— Критичность для многих алгоритмов отсутствия мусора (т.е. документов, не относящихся к исследуемой предметной области) и достаточной обучающей выборки (зачастую предварительно почищенной и отобранной \ проверенной вручную).
Данные недостатки существенно ограничивают практическое применение методов, ухудшают качество результатов и возможности их дальнейшего анализа и применения, поэтому нами был разработан собственный модуль, ориентированный на решение этих задач.
3. Логическая схема процесса кластеризации
Предлагаемый подход для кластеризации данных базируется на принципах работы муль-тиагентных систем [9]. В нем каждому элементу системы - каждой записи и кластеру ставится в соответствие программный агент, представляющий их интересы. И процесс работы системы состоит в переговорах агентов, направленных на улучшение их состояния согласно критериям оценки качества. Вместо централизованной последовательной обработки осуществляется распределенная обработка, в которой каждая запись и каждый кластер самостоятельно и на основе некоторых заданных стратегий в достаточно узко ограниченном контексте принимают решения о вхождении в кластер или выходе из него, расширении или сужении кластера или его удалении, тем самым представляя текущий локальный баланс интересов конкретных записей и кластеров. В итоге процесс кластеризации осуществляется путем самоорганизации агентов, формирующих иерархическую кластерную структуру.
Подобный взгляд на проблему кластеризации позволяет абстрагироваться от реальной структуры данных и работать с понятиями более высокого уровня, что дает возможность предложить универсальный алгоритм, в равной мере ориентированный как на структурированные данные (таблицы, базы данных), так и неструктурированные (текст на естественном языке). Также к дополнительным плюсам данного подхода относится естественная параллельность, обеспечивающаяся принципами построения архитектуры мультиагентных систем, возможность гибко изменять стратегии и отслеживать логику принятия решений, а также работать в режиме реального времени, динамически перестраивая имеющиеся кластерные структуры с учетом вновь приходящих записей.
Общая логическая схема предлагаемого алгоритма приведена на рисунке.
Рассмотрим более подробно работу алгоритма кластеризации.
Предположим, что в системе уже существует сложившаяся на предыдущем шаге алгоритма структура кластеров и записей (далее, говоря кластер и запись, мы будем иметь в виду агента кластера и агента записи).
Теперь в системе появляется новая запись. В момент ее появления ей назначается некоторая начальная сумма денег, на основе которой она попытается вступить в различные кластеры. Сумма денег может назначаться одинаковой, пропорциональной времени прихода записи или пропорциональной ее «ценности», которая зависит от специфики предметной области (например, объем заказа или его стоимость), Эти деньги являются эквивалентом энергии элемента системы, где все действия стоят некоторую сумму денег, зависящую от их «серьезности». Подобный подход позволяет избежать бесконечных переговоров.
В системе существует критерий ценности, позволяющий определить, насколько значимым является тот или иной сформированный кластер.
Процесс вхождения новой записи в кластер
Запись анализирует все кластеры и записи, в которые она потенциально может вступить на основе имеющейся у нее суммы, оценивая ценность кластеров и расстояния до них, и строит сортированную таблицу кластеров по степени важности. Целью записи является вхождение в ряд кластеров таким образом, чтобы суммарная их значимость была максимально возможной, Эта величина - суммарная ценность записи.
После этого запись вычисляет потенциальную ценность нового кластера, который будет образован из нее и уже имеющегося кластера/записи, и сортирует список в порядке убывания ценности. Теперь она осуществляет первый раунд переговоров и интересуется у кластеров \ записей, согласны ли они объединиться / сформировать новый кластер.
Но поскольку каждый элемент системы имеет собственный интеллект, то кластер может ответить отказом в случае, если для него изменения влекут ухудшение его ценности. Как другие записи и кластеры решают, что предложенный вариант им выгоден? Они сравнивают новый вариант с текущими (т.е. с теми кластерами, в которых они на данный момент состоят). И если он лучше, чем один из текущих (т.е. если предполагаемая новая суммарная значимость будет больше), значит, надо согласиться.
Каждый из кластеров отвечает согласием или отказом, и запись пересортировывает свой список, оставляя в нем только согласившиеся кластеры. Далее из этих кластеров выбирается по критерию наибольшей суммарной записи несколько кластеров, и им посылается повторное предложение на объединение.
В результате переговоров запись вступила в ряд кластеров (или сформировала его), тем самым изменив их описания и ценность.
Итак, на данном этапе запись нашла свои кластеры, но изменила состояние системы, а именно изменился ряд кластеров (у этих кластеров изменилось количество входящих записей, возможно, изменились ценность и количество денег).
Теперь каждый из этих кластеров должен, в свою очередь, начать процесс поиска возможных новых вариантов (теперь записи и кластеры, которые раньше не хотели рассмотреть данный кластер, могут изменить свое мнение, так как ситуация тоже поменялась.)
Кластер начинает аналогичный процесс, предлагая новым записям войти в него с целью повышения собственной ценности. Кластер также стремится повысить свою ценность за счет вступления в другие кластеры более высокого уровня.
Записи, которым кластер предлагает войти в него, потенциально могут уже состоять в некоторых кластерах. Но если предлагаемый вариант будет лучше, запись может выйти из старого кластера и вступить в новый. В результате ценность старого кластера уменьшается, и потенциально уже другие записи могут покинуть его; в итоге кластер разрушится.
Все записи и кластеры, значение ценности которых изменилось, «встают в очередь» и начинают искать новые варианты согласно своим критериям.
Процесс заканчивается, когда либо все элементы системы нашли устраивающие их варианты, либо за круг переговоров никто из записей и кластеров не сумел договориться и изменить свое состояние.
Данный процесс мог бы быть потенциально бесконечно зацикленным, что существенно ухудшало бы его практическую ценность, но он ограничивается за счет уменьшения уровня энергии вовлеченных кластеров и записей. Поэтому процесс является затухающим, и структура после очередного воздействия «устаканивается», каждый раз суммарно улучшая свою ценность и тем самым представляя все более значимые зависимости для человека-эксперта.
Более подробно технические особенности и производственные характеристики алгоритма приведены в работах автора [32-34].
Данный алгоритм был успешно применен при решении ряда практических задач, в том числе в системе интеллектуальной обработай и классификации документов [8], мета-поисковой системе [35], системе поиска информации в области современных биотехнологий [36] и др.
4. Основные выводы и перспективы развития подхода
Предлагаемый подход к кластеризации информации, основанный на агентном взаимодействии, по сравнению с существующими методами позволяет добиться следующих основных преимуществ:
— возможность работы с онтологиями и семантическими сетями, что позволяет кластеризовать сложные информационные объекты (образы, тексты);
— алгоритм не требует предобработки данных экспертом предметной области, а также участия человека в процессе работы, но может использовать взаимодействие с экспертом для повышения качества результатов;
— алгоритм способен работать в неэвклидовом пространстве, где мера близости может существовать только для каждой пары объектов, а правило треугольника не соблюдается;
— создания значимых кластеров в любом подпространстве исследуемого пространства решений, алгоритм учитывает любые комбинации параметров, позволяя находить зависимости между любым поднабором атрибутов;
— прозрачность принимаемых решений и описание кластера в терминах онтологии, что дает возможность удобного анализа результатов;
— возможность создания сложной иерархической структуры кластеров, где каждая запись и кластер способны входить в множество других кластеров, тем самым учитывая и отображая все найденные семантические зависимости.
Предлагаемый подход может быть использован вместе с разрабатываемыми в настоящее время мультиагентными системами понимания текстов на естественном языке для нахождения взаимозависимостей и закономерностей в отборе документов, интеграции знаний и данных, позволяющей разработчикам в удаленных местах согласованно работать над одной онтологией, системой онлайн кластеризации поступающей информации, позволяющей пополнять онтологию предметной области и находить семантические зависимости и т.д.
1. DietrMerid. A Handbook of Natural Language Processing: Techniques and Applications for the Processing of Language as Text, chapter Text data mining. Marcel Dekker, New York, 1998.
2. Vasileios Hatzivassiloglou, Luis Gravano, and Ankineedu Maganti. An investigation of linguistic features and clustering algorithms for topical document clustering. In Proc. of the SIGIR’2000,2000.
3. Raymie Stala, Krishna Bharat, and Farzin Maghoul. The term vector database: fast access to indexing terms for web pages. In Proc. of the WWW-9, May 2000.
4. Ron Papka and James Allan. Document classification using multiword features. In Proc. of the CIKM’98, pages
124-131, New-York, November 1998. *
5. Callan J. Learning while filtering documents. In Proc. of SIGIR'98, Melbourne, Australia, 1998. P. 224*231.
6. Fredrik Kilander, Eva Fehraeus, and Jacob Palme. PEFNA: The private filtering news agent. Technical report, Department of Computer and Systems Sciences, Stockholm University, February 1997.
7. Андреев В., Bummux В., Батищев С., Ивкушкин К., Минское И., Ржевский Г., СафроновА., Скобелев П. Методы и средства создания открытых мультиагентных систем для поддержки процессов принятия решений // Изв. РАН. Теория и системы управления. 2003. Jfsl. С. 126-137.
8. Андреев В., Вольман С., Ивкушкин К„ КарягинД., Шмаков Я, Пименов А., Скобелев П., Томин М. Разработка мультиагентной системы интеллектуальной обработки и классификации документов Н Тр. 5-й Между нар. конф. по проблемам управления и моделирования сложных систем; Самара, 17-21 июня 2003. Самара: СНЦ РАН, 2003. С. 317-323,
9. Андреев В.В., ВояхонцевД.В., Ивкушкин К.В., КарягинД.В., Минаков И.А., Ржевский Г.А., Скобелев П.О. Мультиагентная система извлечения знаний // Тр. 3-й Междунар. конф. по проблемам управления и моделирования сложных систем; Самара, 4-9 сентября 2001. Самара: СНЦ РАН, 2001. С. 206-212.
10. Minsky М. The Society of Mind // New York, 1986. 339 p.
11. Иикояис Г., Пригожий И. Самоорганизация в неравновесных системах: от диссипативных структур к упорядоченности через флуктуации // М.: Мир, 1979. 512 с.
12. Cristianini N.and Shawe-Taylor J. AN INTRODUCTION TO SUPPORT VECTOR MACHINES (and other kernel-based learning methods) Cambridge University Press 2000.
13. Croft W.B, Callan J., and Brogtio J. Trec-2 routing and adhoc retrieval evaluation using the INQUERY system. Proceedings of the 2nd Text Retrieval Conference (TREC-2), 1994.
14. David D. Lewis. An evaluation of phrasal and clustered representations on a text categorization task. In SIGIR, 1992. P. 37-50.
15. Dumains Susan Т., Furnas George W., Landauer Thomas K. Indexing by Latent Semantic Analysis. Bell Communications Research 435 South St. Morristown, NJ 07960. Richard Rashman: University Of Western Ontario.
16. Zamir Oren Eli. A Phrase-Based Method for Grouping Search Engine Results. University of Washington, Department of Science & Engineering.
17. Sibson R. SLINK: An optimally efficient algorithm for the single-link cluster method. King’s College Research Center, King’s College, Cambridge, and Cambridge University Statistical Laboratory
18. Douglass R. Cutting, David R. Karger, Jan O. Pedersen, and John W. Tukey, Scatter/Gather: A Cluster-based Approach to Browsing Large Document Collections, SIGIR ’92.1992. P. 318-329,
19. PellegDan, Moore Andrew. X-means: Extending К-means with Efficient Estimation of the Number of Clusters. School of Computer Science, Carnegie Mellon University, Pittsburgh, PA 15213 USA.
20. Eui-Hong (Sam) Han and George Каруris. Concept Indexing. A Fast Dimensionality Reduction Algorithm with Application to Document Retrieval & Categorization. University of Minnesota, Department of Computer Science / Army HPC Research Center,4-I92 EECS Bldg., 200 Union St. SE, Minneapolis, MN 55455 USA.
21. Inderjit S. Dhillon and Dharmendra S. Modha, "Concept Decompositions for Large Sparse Text Data using Clustering,", Machine Learning, vol. 42:1, January, 2001. P. 143-175.
22. Hung Chihli, Wermter Stefan, Smith Peier. Hybrid Neural Document Clustering Using Guided Self-Organization and WordNet. IEEE Intelligent Systems, Vol. 19, No.2. P. 68-77
23. Vivisimo http://vivisimo. com/faq/Overview.html
24. Inxight categorizer http://w w w. inxi ght. com/product.s/categorizer/
25. Intelligent Miner for Text http://www-3.ibm.com/software/data/iminer/fortext/
26. TextAnalyst http://www.mejtaputer.com/
27. SemioMap http: itwww.entrieva.com/entrieva/index. htm
28. Autonomy Portal-in-a-box - www.autonomv.com
29. Lande D. ДОБЫЧА ЗНАНИЙ, CHIP Ukraine 10’2003.
30. Steinbach M„ G. Karypis, and V. Kumar A comparison of document clustering techniques In KDD Workshop on Text Mining, 2000.
31. Кириченко К. M, Герасимов М.Б. Обзор методов кластеризации текстовой информации http://www,dialog-21. ru/Archive/200 l/volume2/2 26.htm
32. Минаков И.А.Анализ эффективности и выработка рекомендаций для повышения качества алгоритмов кластеризации и понимания текста в онтологической модели приобретения знаний // Вестник СамГТУ. Сер. Технические науки. 2005. №39. С. 10-17.
33. Patent Application No. 0403145.6, UK, 2004. Data Mining / G Rzevski, IMinakov, P Skobelev.
34. Вольман С.И., КарягинД,В., Минаков И.А., Скобелев П.О. Разработка системы нахождения бизнес-правил с использованием кластеризации на примере данных логистической компании // Тр. 7-й Междунар. конф. по проблемам управления и моделирования сложных систем; Самара, 27 июня - I июля 2005. Самара: СНЦ РАН, 2005. С.409-413.
35. Водьман С.И, Минакое И.А., Томин М.С. Мультиагенгная система интеллектуального анализа содержимого Интсрнет-страниц // Тр. 7-й Между нар. конф. по проблемам управления и моделирования сложных систем, Самара, 27 июня - 1 июля 2005. Самара: СНЦ РАН, 2005. С. 403-408.
36. Андреев В., Гельфанд М.. Ивкушкин К„ Казаков А., Новичков П., Томин М., Вольман С., Минакое И., Скобелев IT. Разработка мультиагегггной системы интеллектуального поиска информации в области современных биотехнологий // Тр. 4-й Междунар. конф. по проблемам управления и моделирования сложных систем, Самара, 17-24 июня 2002. Самара: СНЦ РАН, 2002. С. 338-345.
УДК 621.315 В.Н. Митрошин
СТРУКТУРНОЕ МОДЕЛИРОВАНИЕ ПРОЦЕССА ОХЛАЖДЕНИЯ ИЗОЛИРОВАННОЙ КАБЕЛЬНОЙ ЖИЛЫ ПРИ ЕЕ ИЗГОТОВЛЕНИИ НА ЭКСТРУЗИОННОЙ ЛИНИИ*
Решена задача структурного моделирования температурных полей при охлаждении сопряженных физически неоднородных осесимметричных тел. Это позволило получить структурную схему процесса охлаждения кабельной изоляции, накладываемой на экструзионной линии, как объекта управления с распределенными параметрами, для последующего синтеза системы управления процессом охлаждения.
Важнейшей технологической операцией производства кабелей связи с пластмассовой изоляцией, на которой формируются основные параметры качества кабеля как канала связи, является операция изолирования. При изготовлении кабелей с полиэтиленовой изоляцией ее наложение осуществляется на экструзионных линиях, содержащих помимо червячных экструдеров охлаждающие ванны. При этом ванны охлаждения обычно рассматриваются как объекты управления с сосредоточенными параметрами (звенья с переменным транспортным запаздыванием), а не как объекты управления с распределенными параметрами, несмотря на то, что на технологической линии изолирования предусмотрено распределенное управление температурой воды в ваннах.
В данной работе предпринята попытка математического описания процесса охлаждения кабельной изоляции как объекта с распределенными параметрами.
Система уравнений, описывающая в безразмерной форме температурное поле в системе двух сопряженных цилиндров, движущихся в процессе охлаждения в водяной среде, имеет следующий вид [1].
Для металлического проводника (внутреннего цилиндра):
Статья поступила в редакцию 28 февраля 2006 г.
Для изоляции (внешнего цилиндра):
Э02(х,/,т). (2)
где
J±
R„
Здесь Т} - температура проводника,
Г? - температура изоляции,
Т - температура приведения (температура плавления изоляции),
9] и 92 - безразмерная температура проводника и изоляции соответственно,
* Работа выполнена при финансовой поддержке РФФИ (грант 06-08-00041-а)