Научная статья на тему 'Выбор средств для прототипирования системы построения рабочего словаря признаков'

Выбор средств для прототипирования системы построения рабочего словаря признаков Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
104
16
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СВОБОДНОЕ ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ / ПРОТОТИПИРОВАНИЕ / АНАЛИЗ ТРЕБОВАНИЙ К ПРОГРАММНОМУ ОБЕСПЕЧЕНИЮ / ПОСТРОЕНИЕ РАБОЧЕГО СЛОВАРЯ ПРИЗНАКОВ / ИНТЕЛЛЕКТУАЛЬНЫЙ АНАЛИЗ ДАННЫХ / FREE SOFTWARE / PROTOTYPING / SOFTWARE REQUIREMENTS ANALYSIS / CONSTRUCTION OF TRAINING DICTIONARY OF FEATURES FOR PATTERN RECOGNITION / DATA MINING

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Ведерникова Татьяна Ивановна, Дулатова Лия Асангалиевна

Статья описывает требования к программной системе построения рабочего словаря признаков, ее прототипу и содержит сравнение свободных программных средств для создания прототипа.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Ведерникова Татьяна Ивановна, Дулатова Лия Асангалиевна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

CHOOSING TOOLS FOR PROTOTYPING OF A TRAINING DICTIONARY CONSTRUCTION SYSTEM

The article describes requirements for a training dictionary construction system, for its prototype and includes comparison of free open source software for the prototype development.

Текст научной работы на тему «Выбор средств для прототипирования системы построения рабочего словаря признаков»

УДК 004.4 Ведерникова Татьяна Ивановна,

к. т. н., доцент кафедры информатики и кибернетики, Байкальский государственный университет экономики и права, e-mail:vedernikova-ti@isea.ru

Дулатова Лия Асангалиевна, магистр техники и технологии кафедры информатики и кибернетики, Байкальский государственный университет экономики и права, e-mail: dulatova_liya@mail.ru

ВЫБОР СРЕДСТВ ДЛЯ ПРОТОТИПИРОВАНИЯ СИСТЕМЫ ПОСТРОЕНИЯ РАБОЧЕГО СЛОВАРЯ ПРИЗНАКОВ

T.I. Vedernikova, L.A. Dulatova

CHOOSING TOOLS FOR PROTOTYPING OF A TRAINING DICTIONARY CONSTRUCTION SYSTEM

Аннотация. Статья описывает требования к программной системе построения рабочего словаря признаков, ее прототипу и содержит сравнение свободных программных средств для создания прототипа.

Ключевые слова: свободное программное обеспечение, прототипирование, анализ требований к программному обеспечению, построение рабочего словаря признаков, интеллектуальный анализ данных.

Abstract. The article describes requirements for a training dictionary construction system, for its prototype and includes comparison of free open source software for the prototype development.

Keywords: free software, prototyping, software requirements analysis, construction of training dictionary of features for pattern recognition, data mining.

Построение рабочего словаря признаков -вспомогательная задача распознавания образов, суть которой состоит в выборе или конструировании небольшой совокупности информативных признаков (так называемого «рабочего словаря признаков», РСП), наиболее полно описывающих объект распознавания с точки зрения заданного критерия [1]. РСП позволяет сократить объем обрабатываемых данных, ускорить процедуру распознавания и повысить качество результата. Система построения рабочего словаря признаков (СПРСП) может стать органичной частью существующих систем интеллектуального анализа и обработки данных и использоваться как для предварительной обработки информации, так и для решения задач идентификации объектов. Поскольку задача, решаемая СПРСП, носит вспомогательный характер, реализация системы в виде самостоятельного программного продукта представляется нецелесообразной.

Среди программных средств для интеллектуального анализа (ИАД) в последние годы все большую популярность завоевывают свободные

программы (СПО). Лучшие свободные программы для ИАД по качеству и набору функций не уступают коммерческим аналогам и полностью отвечают предъявляемым к современным программам этого типа требованиям: корректности расчетов, удобства (практичности), расширяемости, совместимости (в частности, импорт и экспорт данных разных форматов), мобильности (кроссплатфор-менности), наличие скриптового языка, средств работы с большими объемами данных, визуализации данных и визуального программирования [2, 3]. Такие программы имеют широкие сообщества пользователей и разработчиков, развивающих эти продукты и готовых оказать помощь в их установке, эксплуатации и настройке. Все это делает свободно распространяемые программные пакеты удобной площадкой для испытания и внедрения новых методов анализа данных. Таких, например, как МОС-метод построения рабочего словаря признаков, отсутствующий в универсальных пакетах для интеллектуального анализа данных. МОС-метод построения рабочего словаря признаков предназначен для решения задач идентификации стохастических объектов и основан на функциональном преобразовании многомерных случайных величин в одномерные, аккумулирующие в себе отличительные особенности исходных величин [1].

Для детализации требований к системе построения рабочего словаря признаков, демонстрации и исследования возможностей и недостатков МОС-метода предлагается разработать ее экспериментальный прототип. Экспериментальное прото-типирование [4-9] является эффективным средством анализа требований на начальных этапах разработки программных систем. Оно дает возможность получить лучшее понимание создаваемой системы и потенциальных проблем ее разработки. Для представления функций разрабатываемой системы или ее частей можно использовать существующие программы и компоненты. Для этих целей естественно использовать программы, сво-

Современные технологии. Транспорт. Энергетика. Строительство. _Экономика и управление_

ш

бодно распространяемые с исходными текстами, такой подход называется patchwork prototyping (буквально с англ. «лоскутное прототипирование»)

[9].

Прототип системы построения рабочего словаря признаков должен включать такие группы функций, как получение данных, предварительная обработка данных, статистический анализ данных, собственно построение рабочего словаря и оценка его качества, экспорт данных. Получение данных может осуществляться либо путем моделирования (генерирования) случайных величин, либо через импорт реальных или модельных данных из внешнего источника. Предварительная обработка включает восстановление пропущенных и (или) отбраковку имеющихся значений, нормирование и др. К анализу данных отнесены: проверка данных на независимость, случайность, однородность, оценивание параметров распределений, проверка гипотез о распределении выборки. Построение рабочего словаря признаков включает расчет интегральных характеристик, критериев качества и отбор признаков в рабочий словарь.

При прототипировании системы построения рабочего словаря признаков предлагается использовать средства визуального программирования, позволяющие представить исполняемую программу интеллектуального анализа данных как наглядную схему, включающую процедуры обработки данных в виде узлов. Причем для каждого узла доступны результаты выполнения всех других узлов, непосредственно с ним связанных. Кроме то-

го, каждый узел может рассматриваться как самостоятельная программа.

Среди свободно распространяемых программ концепцию визуального программирования поддерживают Orange, KNIME, Weka (посредством Knowledge Flow), RapidMiner и R (с учетом самостоятельных графических интерфейсов (GUI) RAnalyticFlow и Red-R). Для сравнения свободно распространяемых инструментов визуального программирования были отобраны следующие характеристики: богатство статистических функций, простота и удобство в использовании для построения схем, качество исполнения, подход к созданию расширений (способы описания узлов), языки реализации инструментов, поддержка графики, возможность просмотра результата работы схемы и ее узлов, поддержка сообществом пользователей и разработчиков, развивающих продукт.

В качестве ключевого критерия взята совместимость с R, т. к. среда R на сегодня обладает самым широким набором статистических функций. Результаты сравнения представлены в табл. 1.

Проведенный сравнительный анализ показал, что для реализации прототипа системы построения рабочего словаря признаков наиболее подходящим инструментом визуального программирования является программа RapidMiner, т. к. из средств, совместимых с R, она обладает наилучшими характеристиками. Для построения прототипа в соответствии с функциями создаваемой системы построения рабочего словаря признаков отобраны пакеты расширения R. Задачи, для кото-

Таблица 1

Сравнение свободно распространяемых инструментов визуального программирования

KNIME Weka Knowledge Flow Orange RapidMiner RAnalyticFlow Red-R

Поддержка языка и пакетов среды R есть нет нет есть GUI для R GUI для R

Богатство статистических функций за счет R ограничено средне много своих, плюс поддержка R за счет R за счет R

Простота и удобство удобен и прост в освоении удобен, но «заточен» под задачи обработки данных, а не разработки удобен и прост в освоении удобен, но для искушенного пользователя удобен, но требует навыков работы с R неудобен из-за ошибок и плохой доку-ментированности

Качество исполнения хорошее хорошее хорошее отличное хорошее плохое

Подход к созданию расширений узлы, связанные с классами Java классы Java виджеты и классы Python пакеты и функции R скрипты R виджеты с пакетами и функциями R, классы Python

Языки реализации Java Java Python, C Java Java Python, C

Поддержка графики есть

Возможность просмотреть результат из схемы есть неизвестно есть

Поддержка сообщества сильная слабая слабая

рых не найдены или не существуют пакеты, предполагается решать с помощью скриптов на языке R. К таким задачам относится расчет функциональных преобразований МОС-метода. Для прототипа построены фрагменты схемы, узлы которой инициируют функции RapidMiner, отобранные пакеты R и написанные скрипты, рассчитывающие функциональные преобразования.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Ведерникова Т. И. Способы построения рабочего словаря признаков для решения задач идентификации. [электронный ресурс] : электрон. науч. журн. // Известия ИГЭА. 2012. № 4. URL: http://webcache.googleusercontent.com/ search ?q=cache: ATWqRZq4ZI0J: eizvestia.isea. ru/ pdf.aspx?id%3D13863+&hl=ru&gl=ru. (Дата обращения 15.03.2013).

2. Blaz Zupan, Janez Demsar. Open-source Tools for Data Mining // Clinics in laboratory medicine 2008. 28 (1). Р. 37-54.

3. Open Source Data Mining Software Evaluation [электронный ресурс] URL: //http://www.phiresear-chlab.org/downloads/Open-

SourceDataMining.pdf. (Дата обращения 15.02.2013).

4. Соммервилл Иан. Инженерия программного обеспечения: пер. с англ. 6-е изд. М. : Изд. дом «Вильямс», 2002. 624 с.

5. Kenneth E. Lantz, The Prototyping Methodology, Prentice-Hall, Inc., Upper Saddle River, NJ. 1986.

6. Fabrice Kordon, Luqi. An Introduction to Rapid System Prototyping // IEEE Transactions on Software Engineering. 2002. Vol. 28, no. 9, Р. 817821.

7. Технологии разработки программного обеспечения : учеб. / С. Орлов. СПб. : Питер, 2002. 464 с.

8. Quality Technique: Prototyping / S. Stein et al. [Электронный ресурс]. URL: http: //salvin .jeancharle s. free.fr/documents/proj et -boulot/suede/quality management/Quality Tech-niques/ stein_dielewicz_petersen_ andersson.pdf. (Дата обращения 22.02.2013).

9. Jones, M. Cameron; Floyd, Ingbert R.; Twidale, Michael B. Patchwork Prototyping with Open-Source Software. // The Handbook of Research on Open Source Software, St. Amant, K. and Still, B. (Eds), Idea Group, Inc., PA, 2007.

УДК 621.331 Табанаков Павел Валерьевич,

ведущий инженер производственно-технического отдела, Восточно-Сибирская дирекция инфраструктуры,

тел. 89041404997

ПОВЫШЕНИЕ ЭНЕРГЕТИЧЕСКОЙ ЭФФЕКТИВНОСТИ РЕГУЛИРУЕМОЙ КОМПЕНСИРУЮЩЕЙ УСТАНОВКИ

P. V. Tabanakov

IMPROVING ENERGY EFFICIENCY OF ADJUSTABLE COMPENSATING INSTALLATION

Аннотация. В статье рассмотрены актуальные проблемы формирования законов регулирования технических средств для повышения энергетических показателей работы тяговых сетей магистральных железных дорог.

Ключевые слова: компенсация реактивной мощности, тяговая сеть, электроподвижной состав, потери электрической энергии.

Abstract. In the article actual problems of formation of laws of regulation of means for increase of power indicators of work of the main railways traction networks are considered.

Keywords: compensation of jet capacity, traction network, electrorolling stock, losses of electric energy.

В условиях непрерывно развивающейся экономики и расширения рыночных отношений тре-

буется оптимизация и повышение экономической эффективности работы железнодорожного транспорта. Для этого необходимо применение нового, отвечающего современным требованиям, энергоэффективного оборудования с одной стороны, и новые принципы управления им - с другой. За последние 9 лет уровень эксплуатационного грузооборота по ВСЖД увеличился, как это следует из рис. 1, на 30 %.

Ежегодно требования к росту пропускной способности железнодорожных линий неуклонно возрастают. В этой связи глобальное техническое переоснащение требует больших финансовых затрат. Модернизация уже существующего оборудования с применением новейших технологий позволит частично решить проблему, связанную с ограничением пропускной способности линий по устройствам тягового электроснабжения.

i Надоели баннеры? Вы всегда можете отключить рекламу.