Научная статья на тему 'Программный комплекс поддержки процесса формирования информационного обеспечения фонда физических эффектов'

Программный комплекс поддержки процесса формирования информационного обеспечения фонда физических эффектов Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
65
25
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Коробкин Дмитрий Михайлович, Фоменков Сергей Алексеевич

Рассмотрена перспективная технология расконсервации подшипников колесных пар железнодорожных вагонов. Приведена типовая схема установки для реализации технологии в условиях создаваемого производства. Приведены основные преимущества новой технологии

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Коробкин Дмитрий Михайлович, Фоменков Сергей Алексеевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The effectiveness of the systems operating structured physical information in the form of physical effects, depends not only on methods and algorithms for information retrieval, synthesis and analysis structures of a physical principle of technical system action. In not smaller degree, it depends on the quality and quantity of filling databases physical effects. As a result, the work purpose is creation of the program system of support the formation process of information support for databases physical effects

Текст научной работы на тему «Программный комплекс поддержки процесса формирования информационного обеспечения фонда физических эффектов»



Д.М. Коробкин, С.А. Фоменков

ПРОГРАММНЫЙ КОМПЛЕКС ПОДДЕРЖКИ ПРОЦЕССА ФОРМИРОВАНИЯ ИНФОРМАЦИОННОГО ОБЕСПЕЧЕНИЯ ФОНДА

ФИЗИЧЕСКИХ ЭФФЕКТОВ

На кафедре САПР и ПК ВолГТУ разработана обобщенная модель описания физического эффекта (ФЭ) [1] и создана база данных физических эффектов (БД ФЭ), содержащая более 1200 ФЭ из разных областей физики. Применение БД ФЭ повышает объем активно используемых физических знаний и может быть полезно предприятиям, НИИ, КБ, осуществляющим НИР и ОКР в областях конструирования принципиально новых технических систем, разработки новых технологий, научно-технического прогнозирования.

Эффективность работы с системами, оперирующими структурированной физической информацией в форме физических эффектов, зависит не только от методов и алгоритмов информационного поиска, синтеза и анализа структур физического принципа действия технической системы [1]. В не-

меньшей степени она зависит от качества и наполнения самого фонда ФЭ.

Таким образом, актуальной целью является разработка программного комплекса поддержки процесса формирования информационного обеспечения базы данных физических эффектов (ПК ППФИО БДФЭ) [2] (рис. 1), использование которого позволяет решить вопросы сокращения времени и трудозатрат на пополнение и улучшение качества существующего фонда ФЭ.

Разработанная автоматизированная система включает следующие основные процедуры:

1) расширение БД ФЭ (включение описаний новых ФЭ);

2) модернизация БД ФЭ (улучшение описаний ФЭ);

3) систематизация БД ФЭ на основе многомерных систематизационных схем.

БД концептов ПО

«ФЭ»

БД концептуальным отношений ПО «ФЭ»

3

я

Подсистема анализа С

первичных источников

4 - 3

Подсистема верификации БД ФЭ и

Подсистема систематизации БД ФЭ м

- № 9

3

БД тезаурусов фонда ФЭ

Ж

БД систематизацион- | ных осей

БД ФЭ

I"

1 — предварительная в ходим и выходная карта ФЭ

2 — ссыпки на источники; термины концептов и концептуальных отношений ПО «ФЭ», тезаурусы

БД с сыпок на источники

3 — предварительная входная карта ФЭ; входные и выходные карты

ф о нд а ФЭ; тез ауру сы ф онд а ФЭ;

4 — «новизна» ФЭ; рассогласованные карты ФЭ; карты тождественных ФЭ

5 — сис т е матизир о в аннь ш ф о нд ФЭ; созданные систематшщионные- оси

6 — входные карты фонда ФЭ; систематизационные оси; тезаурусы фонда ФЭ;

7 — новые систематизационные оси

8 — выделенные ссылки на источники

9 — предварительные входные и выходные картыФЭ; рассогласованные карты или карты тождественных ФЭ

10 - отредактированные входные и выходные кар ты новых и расширенных ФЭ

Рис. 1. Архитектура ПК ППФИО БДФЭ

Режимы работы и функциональная схема разработанной автоматизированной системы приведены на рис. 2.

Реализация процедур расширения и модернизации БД ФЭ основывается на анализе первичных источников, состоящем из поиска первичных источников, выделения описаний ФЭ и верификации, выявляющей «новизну» (отсутствие в БД ФЭ) выделенного ФЭ.

Подсистема анализа первичных источников, архитектура которой приведена на рис. 3, - основная в разработанном программном комплексе.

Реализация данной процедуры представлена в виде многоагентной системы с иерархической организацией взаимодействия агентов [3], что позволит равномерно распределить нагрузку на поисковые агенты и осуществлять координацию их действий.

Рис. 2. Режимы работы и функциональная схема

Стратегия поиска документов в сети Интернет, содержащих описания ФЭ, основывается на двух подходах:

1. Работа с начальным массивом ссылок на ресурсы с контентом в области физики (например, сайты журналов: «Успехи физических наук», «Журнал технической физики», «Физика твердого тела» и др.), заданных администратором системы.

2. Использование индексов существующих крупных поисковых систем.

Мета - агент работает с поисковым индексом, составленным на основе информации, передаваемой поисковым агентом. Мета-агент в режиме расширения фонда ФЭ передает поисковому агенту начальные ссылки, а в режиме модернизации - запросы, составленные на основе описания модифицируемого ФЭ. Мета - агент осуществляет

выделение описания ФЭ из текста первичного источника на основе разработанной авторами модели представления структурированной предметной информации [2], позволяющей выделять из текста информацию, которую можно представить в виде трех-компонентной структуры (A,B,C), где A -входное воздействие, C - выходное воздействие, B - объект.

Поисковый агент загружает документы, используя ссылки на ресурсы, переданные мета-агентом или сервисами Google Web API и Яндекс .XML в ответ на запрос. Он осуществляет парсинг html (txt, doc, rtf, pdf) документов, тематическую фильтрацию, фильтрацию по маске описания ФЭ, а также рекурсивный обход ссылок (Url), основанный на разработанной стратегии обхода де-

рева выделенных внутренних и внешних ссылок [2].

Разработанная авторами методика тематической фильтрации [2] основывается на объединении двух методов: метода семантического анализа документов (8ешЬР) и метода латентно-семантического анализа (Ь8Л), и базируется на предположении, что оценка тематической близости документа и тематики «Физика» определяется близостью термов, входящих в их описания. Если оценка близости документа тематике больше экс-

пертно выбранного порогового значения, то документ далее фильтруется посредством поиска в тексте маски описания ФЭ. Под маской описания ФЭ понимается поддерево в семантико-синтаксическом дереве предложения. Вершиной поддерева является один из терминов («Эффект», «Явление», «Закон», «Закономерность» и др.), и при этом данная вершина - родительская для термов предложения, которые содержатся в разработанном тематическом фильтре «Физика».

Рис. 3. Архитектура подсистемы анализа первичных источников

Полученные в результате работы много-агентной системы тексты документов, относящиеся к физической тематике и хранящиеся в базе данных мета-агента, в дальнейшем используются автоматизированной системой выделения описаний ФЭ и расширения описаний существующих.

В режиме расширения фонда ФЭ было найдено свыше 50 описаний новых ФЭ. Отметим, что большинство найденных ФЭ (например, гигантский магнитоэлектрический эффект, электроклинный эффект в хираль-ных смектических жидких кристаллах, явление вибрационной инжекции газа в жидкость и др.) представляют особый интерес, поскольку описаны в статьях журналов физического профиля за последние 5 лет.

В результате работы ПК ППФИО БДФЭ

в режиме модернизации фонда ФЭ были расширены описания свыше 40 ФЭ.

Поскольку в индексе разработанной поисковой системы сохраняется ссылка на ресурс, содержащий описание ФЭ, то был составлен фонд первичных источников на основе новейших публикаций в журналах физического профиля, который расширяет информацию выходной карты выделенных ФЭ.

Эффективность разработанной системы проверялась на специально созданном тестовом массиве документов, состоящем из 60 документов с нефизическим контентом, 17 документов с физическим контентом, но не содержащих описания ФЭ и 74 документов, содержащих описания ФЭ.

Таким образом, количество релевантных (с точки зрения фильтрации по тематике

«Физика», а затем - на наличие в тексте описаний ФЭ) документов в тестовом массиве -Drei = 74, нерелевантных документов -Dnrel = 77.

Использование разработанной автоматизированной системы в подрежиме фильтрации дало результаты, приведенные в таблице 1, где Drelretr и Dnrelretr - количество прошедших через фильтр соответственно релевантных и нерелевантных документов; Dretr - количество документов, найденных системой;

Точность фильтрации:

заключается не только в уменьшении временных и трудозатрат на поиск и анализ первичных источников, но и в возможности с его помощью находить источники описаний ФЭ, труднодоступные или вовсе не доступные администратору БД ФЭ при ручном поиске. Опыт работы ПК ППФИО БДФЭ показал, что необходимая физическая информация может располагаться не только на сайтах физических журналов или сборках материалов по физике. Например, для расширения описания одного из ФЭ была использована информация, найденная на сайте геологического факультета МГУ.

Precision = -

Полнота:

|Drel n D

D Ге1 retr

D,

Drei I т\ nrel , retr + D retr

Recall =

Dre1 П Dretr Dre1retr

D

rel

D

rel

Вероятность отбора нерелевантного ресурса:

Таблица 1

Результаты работы ПК на тестовом массиве документов

Фильтрация Выделение описаний ФЭ

Drelretr 73 49

Dnrelretr 3 78

Dretr 76 127

Precision 0,961 0,386

Recall 0,986 0,598

Fall-Out 0,039 -

|Dnrel n D,

Fall - out =

D

nrel

D

nrel

|D

nrel

В 74 документах содержится Drei = 82 описания ФЭ. При использовании автоматизированной системы в подрежиме выделения описаний ФЭ были получены результаты, приведенные в таблице 1, где Drelretr и Dnrelretr - количество соответственно релевантных и нерелевантных предварительных описаний ФЭ; Dretr - количество составленных описаний ФЭ; Precision - точность выделения описаний ФЭ; Recall - полнота выделения описаний ФЭ.

В таблице 1 для каждого из подрежимов приведены усредненные результаты тестовой работы программного комплекса (количество проверок равно 10).

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Преимущество использования разработанного программного комплекса перед ручной методикой формирования фонда ФЭ

В настоящее время программный комплекс используется на кафедре САПР и ПК ВолгГТУ - с его помощью проводится поиск описаний новых ФЭ и расширений описаний уже существующих. Разработанная программа позволила повысить качество фонда ФЭ также за счет выявления дублирующих ФЭ и ФЭ, имеющих рассогласованные описания входных и выходных карт. ПК ППФИО БДФЭ внедрен в учебный процесс Астраханского государственного технического университета, что отражено в соответствующем акте.

Благодаря используемой модели представления структурированной предметной информации [2], инвариантной относительно предметных областей данной, программный комплекс может быть ориентирован на другие предметные области, например, на химические знания в виде химических эффектов.

СПИСОК ЛИТЕРАТУРЫ

1. Фоменков С. А. и др. Моделирование и автоматизированное использование структурированных физических знаний. - Волгоград, 2004.

2. Коробкин Д.М. Выделение структурированной предметной информации из текстов пер-

вичных источников на примере физических знаний.: дис. ... канд. тех. наук: 05.13.12: защищена 26.12.06: утв. 13.04.07.

3. Тарасов В.Б. От многоагентных систем к интеллектуальным организациям. - М., 2002.

О.А. Даниленко, Ю.Р. Нурулин

РАЗРАБОТКА АЛГОРИТМА ОБРАБОТКИ ВОЗВРАТНЫХ КНИЖНЫХ ПОТОКОВ В ИНТЕГРИРОВАННЫХ КОМПЛЕКСАХ

Для всех субъектов книжного дела существует два материальных потока: входящий и исходящий. Для издательства входящим потоком являются книги, поступающие из типографии, а также возвращаемые от партнеров непроданные экземпляры. Исходящий поток книг направлен оптовым компаниям, торговым сетям, автономным магазинам, корпоративным покупателям, интернет-магазинам. Структура потоков приведена на рис.1. Для реализации всех указанных взаимодействий издательству в своем составе необходимо иметь оптовое подразделение по продажам с развитой логистической системой.

Для оптовых компаний к входящему потоку относятся книги:

- поступающие от издательств;

- поступающие от других оптовых поставщиков;

- приобретаемые непосредственно у авторов;

- возвращаемые от покупателей.

К исходящему потоку оптовых компаний относятся:

- поставки книг в торговые сети, автономным магазинам, интернет-магазинам;

- прямые поставки книг корпоративным покупателям (организации, предприятия, библиотеки, школы и т.д.);

- поставки книг другим оптовым поставщикам;

- возвраты книжной продукции изда-

тельствам, оптовым поставщикам и авторам. Структура потоков для оптовых предприятий показана на рис.2.

Существенным и главным отличием структуры материальных потоков издательства и оптовой компании является транзит-ность книжной продукции. Для издательства возврат литературы является конечной точкой в товаропроводящей цепочке. Для книги, потерявшей свой товарный вид, склад издательства является финишным в жизненном цикле продукции. При правильной организации оптовой компании все возвраты от покупателей транзитно передаются поставщику и далее по цепочке в издательство. Это главные риски издательства в их инвестиционной деятельности по выпуску книжной продукции.

Одной из главных тенденций, наблюдаемых в последние года не только в отечественной книготорговле, но и в зарубежных странах, является всевозрастающий объем возвратов книжной продукции на всехуров-нях интегрированных систем и в автономных магазинах. Этот объем в России еще не достиг тех размеров, который считается общепринятым для мировых лидеров издательской деятельности. Тем заметнее динамика роста. Если в начале90-х годов при тотальном дефиците книг эта составляющая материального потока между предприятиями была практически равной нулю, то в настоящее время объем возвратов достигает 5-

i Надоели баннеры? Вы всегда можете отключить рекламу.