Научная статья на тему 'Разработка модуля поиска как инструмента совершенствования узкопрофильного конфигуратора'

Разработка модуля поиска как инструмента совершенствования узкопрофильного конфигуратора Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
85
17
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
language theory / open information systems / search query / information retrieval algorithms / search module / semantic rules for information optimization
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

DEVELOPMENT OF THE MODULE OF SEARCH AS AN INSTRUMENT OF IMPROVEMENT OF THE NARROW-PURPOSE CONFIGURATOR

The article is devoted to identification of algorithms that define the optimum search query the process of developing the information search module. The module is necessary for maintenance in the current state in the database of a narrow professional configurator. The research has a cross-disciplinary character and is based on a method of problem-oriented search allowing use of data of one field of knowledge in the field of another. The presented research allows for the application of rules of semantics for the realization of system of configuration of mechanical engineering products, because both of them base on the universal principles of optimization of the taken and obtained information. The overall performance of search of a narrow-purpose configurator depends on the principle of work of the algorithm that based on the existing database of the configurator and using linguistic rules for performance of the tasks, which are almost impracticable for experts of this professional area. In the article an algorithm of creation of the qualifier and rules of data using for realization of the most optimal variants of search depending on user’s requirements are been given; groups of themes that would be of interest for the realization of the search algorithm and selection of information connected with pipeline fittings area have been revealed; groups of the inquiries fixed in the database have been defined. The article also describes the principles of search query optimizing, aimed at finding a new, specifying and supplementing information for configurator. It was concluded that such a process is freely realized primarily because the principles of constructing a configurator system do not contradict the natural processes taking place in the language. With this approach, information search acts as a tool for replenishing the database of the information system, that makes the system of the configurator open and, consequently, constantly relevant.

Текст научной работы на тему «Разработка модуля поиска как инструмента совершенствования узкопрофильного конфигуратора»

DOI: 10.24411/2470-1262-2018-10004

УДК (UDC) 81'33

Irina Nekipelova, Elvira Zarifullina, M.T. Kalashnikov Izhevsk State Technical University,

Izhevsk, Russia

For citation: Nekipelova I., Zarifullina E. (2018), Development of the Module of Search as an

instrument of improvement of the narrow-purpose configurator.

Cross-Cultural Studies: Education and Science.Vol.3, Issue I, pp. 30-42 (in USA)

Received: February 03, 2018 CC BY 4.0

РАЗРАБОТКА МОДУЛЯ ПОИСКА КАК ИНСТРУМЕНТА СОВЕРШЕНСТВОВАНИЯ УЗКОПРОФИЛЬНОГО КОНФИГУРАТОРА

DEVELOPMENT OF THE MODULE OF SEARCH AS AN INSTRUMENT OF IMPROVEMENT OF THE NARROW-PURPOSE CONFIGURATOR

Abstract

The article is devoted to identification of algorithms that define the optimum search query the process of developing the information search module. The module is necessary for maintenance in the current state in the database of a narrow professional configurator. The research has a cross-disciplinary character and is based on a method of problem-oriented search allowing use of data of one field of knowledge in the field of another. The presented research allows for the application of rules of semantics for the realization of system of configuration of mechanical engineering products, because both of them base on the universal principles of optimization of the taken and obtained information. The overall performance of search of a narrow-purpose configurator depends on the principle of work of the algorithm that based on the existing database of the configurator and using linguistic rules for performance of the tasks, which are almost impracticable for experts of this professional area. In the article an algorithm of creation of the qualifier and rules of data using for realization of the most optimal variants of search depending on user's requirements are been given; groups of themes that would be of interest for the realization of the search algorithm and selection of information connected with pipeline fittings area have been revealed; groups of the inquiries fixed in the database have been defined. The article also describes the principles of search query optimizing, aimed at finding a new, specifying and supplementing information for configurator. It was concluded that such a process is freely realized primarily because the principles of constructing a configurator system do not contradict

the natural processes taking place in the language. With this approach, information search acts as a tool for replenishing the database of the information system, that makes the system of the configurator open and, consequently, constantly relevant.

Keywords: language theory, open information systems, search query, information retrieval algorithms, search module, semantic rules for information optimization

Introduction

Статья является продолжением ряда работ, посвященных исследованию языка как информационной системы и описывающих информационные критерии и возможности языковой системы. В современной науке подобные исследования становятся всё более актуальными, поскольку позволяют выходить за пределы теоретического изучения языка и, используя фундаментальные наработки в области языкознания, решать сложные задачи прагматического характера. Это связано с тем, что, будучи феноменом человеческой деятельности и открытой сложной системой, язык, реализуя когнитивные возможности человека, позволяет точно и чётко решать прикладные задачи разных сфер человеческой деятельности. Мало того, в большинстве случаев он является единственно возможным средством конструктивного и адекватного решения этих задач.

Methods

Статья посвящена выявлению алгоритмов, определяющих оптимальный поисковой запрос при разработке модуля поиска информации, необходимого для поддержания в актуальном состоянии базы данных узкопрофессионального конфигуратора. Исследование имеет междисциплинарный характер и опирается на метод проблемно-ориентированного поиска, допускающего использование данных одной области знаний в поле другой области знаний, а также на метод проблемно-ориентированного проектирования (или предметно-ориентированного проектирования (англ. domain-driven design (DDD) - термин, введенный в оборот Эриком Эвансом [4])), направленного на создание оптимальных моделей систем и представляющего собой набор принципов и схем, которые представляют любую предметную область как систему, реализованную в виде сети. Этот метод предполагает создание программных абстракций - моделей предметных областей, устанавливающих связь между реальными условиями области применения явления действительности и кодом. DDD - это прежде всего набор правил и алгоритмов, которые позволяют принимать правильные проектные решения [5] и значительно ускорять процесс проектирования в той или иной предметной области. Предлагаемое исследование позволяет применить правила семантики в реализации системы конфигурирования изделий машиностроения, поскольку и та, и другая области опираются на универсальные принципы оптимизации извлекаемой и получаемой извне информации и могут использовать в своих исследованиях теорию графов. А знание о наиболее общих принципах человеческого мышления, в свою очередь, позволяет определить начальные базовые параметры разрабатываемого модуля поиска как инструмента усовершенствования узкопрофильного конфигуратора.

Discussion

Теория графов охватывает различные профессиональные сферы и в настоящее время продолжает активно развиваться [8; 11; 12]. Это связано с тем, что система графов позволяет представить и описать ту или иную систему не как номенклатуру имеющихся в ней компонентов или как перечень её взаимозависимых элементов, а прежде всего, как сеть [1, с. 145; 13; 15], коей является в том числе и естественный язык. Именно поэтому теория графов используется для решения большого количества самых разных задач [2; 3]. В процессе создания изделия машиностроения одной из таких задач является формализация сложных объектов с применением графов для корректировки и дополнения конфигуратора изделий машиностроения, создающегося в рамках задачи структурного синтеза - прежде всего формирования структуры конструкции изделия, его анализа и модификации [14; 16; 17]. Огромную роль в этом вопросе играют данные языка, выполняющего сугубо прикладную функцию - являются вспомогательным средством поиска профессиональной информации.

Большинство универсальных систем автоматизации инженерной деятельности позволяют проверить выбранную инженером конструкцию, произвести расчеты, оформить техническую документацию, однако предложить структуру изделия согласно заданным требованиям технического задания существующие системы они не могут. Во многом это связано с тем, что разработка новой или анализ существующей структуры изделия связаны с творческой природой конструирования, не подлежащего формализации. Но такие системы могут существенно облегчить деятельность конструктора, и прежде всего за счет реализации возможностей частичной автоматизации.

На сегодняшний день при лавинообразном росте информации любые информационные системы быстро теряют актуальность в случае, если они подвергаются стагнации, определяющим фактором которой является прекращение пополнения информационной базы актуальной информацией. При этом база нуждается в постоянном пополнении любой информацией из предметной области, постольку варианты невозможные или ненужные раньше, с течением времени могут стать не только приемлемыми, но и востребованными. Например, с разработкой новых прочных и легких материалов в машиностроении может быть пересмотрено производство многих деталей, что требует осуществления анализа старых и проведения новых расчетов.

Осуществление поиска новой информации и её привлечение является сложной, но выполнимой задачей. Естественно, как и любом поиске, результат поиска может не быть однозначно достоверным, однако при разработке оптимального алгоритма и внедрении его в практику возможна существенная автоматизация пополнения базы данных новыми данными, а также привлечение новых знаний и их быстрое внедрение, оптимизация задач системы и создание широкой платформы для формирования опытной базы, в минимальной степени зависящей от опыта специалиста в данной области. В связи с этим возрастает актуальность разработки и усовершенствования модуля инструмента усовершенствования узкопрофильного конфигуратора, в основу которого нами положена модель классификатора, выполняющей роль базы данных модуля информационного поиска в узкопрофессиональных экспертных поисковых системах. 32

Results

Классификатор как база данных модуля информационного поиска

В своей работе в качестве базы данных мы используем разработанный ранее классификатор редукторных систем [6]. Этот классификатор является информационной базой для синтеза изделий (редукторов) средней и высокой степени сложности. В его основе лежит графово-табличная модель представления сложных объектов машиностроения.

Классификатор изделий машиностроения строится по следующему алгоритму:

1. Разложение физического объекта на составляющие элементы (декомпозиция) в иерархическом порядке от сложного к простому. Наиболее удачной реализацией и представлением сложных систем и редуктора в частности является граф-дерево.

2. Характеристика каждого элемента графа с указанием описательной категории и значения. Объект, как правило, описывается многими параметрами, например, категорией масса и значением 27500 кг или категория вид соединения и значением пайка. Характеристики, так же как и физические объекты, могут образовывать иерархическую структуру.

3. Объединение нескольких декомпозиций в обобщенную модель, описывающую уже целый класс, объединенных общим функционалом, объектов. Такая модель также представлена граф-деревом, содержащим не только функциональные вершины, но и связи типа И-ИЛИ, признаки, объединяющие по смыслу несколько значений категорий из разных декомпозиций. Обобщенная модель представлена в виде граф-дерева, корневой вершиной которого является сложный объект. Кроме того, в обобщенной модели содержатся характеристики каждого элемента.

4. Формирование классификатора, представленного в табличном виде. В каждой строке таблицы представлена отдельная функциональная вершина графа, а по столбцам указаны значения признаков этой детали. Заполнение столбцов зависит от наличия того или иного значения в той или иной декомпозиции. Табличный вид выявляет пустоты в описаниях отдельных конструкций и позволяет в оптимальной форме хранить и дополнять модель класса объектов.

Таким образом, классификатор, обладая информацией обо всем классе объектов, является информационной базой, способной выполнять многие процессы, в частности осуществлять синтез, конфигурирование изделий, модификацию и т.п. Актуальное в информационном плане состояние классификатора и его пополнение становится обязательным условием качества проектируемых, исследуемых и обслуживаемых изделий машиностроения.

При таком условии классификатор является открытой системой, связанной с внешней средой необходимостью постоянного пополнения информацией. «Открытые системы могут обмениваться с окружающими телами энергией, веществом и, что также весьма существенно, информацией» [7, с. 444]. Возможны несколько вариантов извлечения информации из окружающей среды, среди которых основными являются, во-первых,

непосредственное использование знаний эксперта, а во-вторых, автоматизированное извлечение данных из информационных сред, и прежде всего из интернета, посредством специализированных инструментов.

Основной отличительной особенностью работы эксперта является её точность и компетентность. При добавлении информации экспертом требование достоверности выполняется a priori: как правило, эксперт добавляет четко регламентированную и эвристически проверенную информацию, но при этом информацию, ограниченную небольшими объемами. Автоматизированные же инструменты сбора информации, напротив, делают упор на обработку большого массива трудно охватываемой информации, однако при этом следует учитывать, что машина не способна адекватно оценивать значимость и адекватность данных, поэтому на этапе отбора информации она в любом случае нуждается в помощи эксперта.

При достижении определенного - достаточного в данный момент - показателя содержания данных классификатор можно считать приведенным к равновесному состоянию. При равновесном состоянии система способна решать задачи, поставленные перед ней, с заданной степенью точности. Особенностью извлечения данных из информационных сред является высокая степень неопределенности результатов их взаимодействия, связанная с большой энтропией внешней среды и «болезненной» упорядоченностью искусственной системы. Специфика искусственных систем заключается в том, что они имеют высокий уровень организации, следовательно, изначально имеют эквифинальное состояние, т.е. состояние, определяемое лишь внутренней структурой самой системы, вне зависимости от состояния среды. Такие системы развиваются в сторону увеличения порядка сложности.

Увеличение уровня сложности происходит за счет добавления и изменения в классификаторе данных. Если исходить из графовой модели представления данных, то следует предположить, что пополнению или исключению (например, информация о потере актуальности соединения деталей пайков) подлежат: 1) функциональные вершины, которые являются олицетворением физического объекта, 2) признаки и исходы (значения), описывающие объект, 3) изменение типов связей (например, обязательные ранее конструктивные элементы могут стать необязательными по результатам разработок новых изделий), 4) запрещенные варианты сочетания тех или иных элементов модели класса объектов, которые также можно извлечь из классификатора.

Все данные классификатора и конфигуратора, необходимые для работы с системой и с внешней средой, представлены на языке, и именно поэтому языковой параметр, обеспечивающий работу поисковых систем, является в этом процессе ключевым. Поставленная задача требует в своем решении использование метода проблемно-ориентированного поиска, дающего одной области знаний воспользоваться данными другой области в основном потому, что язык является классификацией высокой степени надежности [10] и все языковые операции основаны прежде всего на логических операциях: синтезе и анализе.

Алгоритм информационного поиска

Одним из основных источников знания является интернет, с одной стороны, предлагающий для анализа огромный массив информации, а с другой - дающий такой материал, который является наиболее сложным для анализа и обработки.

Сложность извлечения знаний определяют: во-первых, объем и неупорядоченность поступающей информации, во-вторых, неспособность технических систем обрабатывать иную, кроме конкретной и строго формализованной (технические справочники, спецификации), информацию, в-третьих, скорости появления новой информации, в-четвертых, необходимость разработки специальных алгоритмов для превращения информации в данные. Все эти проблемы и задачи напрямую связаны с особенностями превращения информации в данные языка, способами хранения этих данных и их использования [18, с. 80-82].

С целью извлечения из внешней среды актуальной информации в поисковых системах задаются запросы, которые по виду требуемого конечного результата, можно разделить на следующие типы: 1) поиск данных, дополняющих имеющуюся базу данных; 2) поиск данных, уточняющих уже имеющиеся данные; 3) поиск уточняющих данных, ведущих к пополнению существующей базы; 4) поиск уточняющих данных, ведущий к изменению имеющейся базы.

В данном исследовании предлагаемый алгоритм не предусматривает поиск заведомо новой, неизвестной ранее информации, слабо связанной с данными классификатора. Нас прежде всего интересует поиск, осуществляемый точечно, с определением области желаемых результатов, например, возможность использования определенной марки смазки или возможность использования аналогов червяка, вышедшего из строя.

Работа экспертов с конфигуратором редуктора позволила нам выявить, ко всему прочему, еще одну проблему, немаловажную для этой узкопрофильной области знаний: сами эксперты, использующие годами отлаженную схему работы, смогли лишь заявить о существующих в этой области проблемах, но они не смогли выявить приемлемые пути решения этих проблем, и прежде всего потому, что многие из возможных решений связаны с незнакомой для них экспертной областью - лингвистикой. Однако совместно проведенная работа экспертов разных профессиональных сфер позволила выявить и определить точки соприкосновения этих сфер.

При анализе специфики тематики трубопроводной арматуры нами были выявлены следующие большие группы тем, представляющие интерес при реализации алгоритма поиска и отбора информации:

1) знания о технических и качественных характеристиках существующих элементов трубопроводной арматуры, позволяющих произвести их сравнение и выбрать оптимальный вариант для расчетов;

2) знания о способах и особенностях использования технологий: ремонт и изменение конфигурации устройств, устранение неполадок и т.п.;

3) знания о новых устройствах: новые принципы работы, описание тестов, отчеты испытаний и т.п.

Все эти знания могут быть представлены в различном виде и представлять собой:

- утверждения, например: Для производства чугунного литья может быть использован чугун марок СЧ-15, СЧ-20 и антифрикционные чугуны;

- факты, например: Мотор-редукторы производства King Right Motor комплектуются планетарным, цилиндрическим или червячным редуктором;

- домыслы, например: Я думаю, что РЗАМ-С-50 может выдавать момент на выходном валу больше 750 Нм;

- совокупность всего вышеперечисленного, например: Приобрел Blueweld 185. Обнаружил, что подключить напрямую его к 40-ка литровому баллону аргона не получится, так как редуктор рассчитан на меньший диаметр резьбы.

Задача разрабатываемого алгоритма состоит в том, чтобы по интересующему пользователя запросу найти наиболее релевантную информацию, а также оценить ее содержание. Оценка содержания возможна с помощью формирования правил, а также формирования базы данных запроса, в которую входит и база классификатора как носитель точной информации, но для анализа текста требуются и специфические категории, такие как оценка, действия и т.д.

Иногда произвести оценку информации в автоматическом режиме бывает непросто. Проанализируем следующий текст: Цилиндро-конические мотор-редукторы серии K являются угловыми редукторами. Вал двигателя и выходной вал образуют прямой угол. Мотор-редуктор может устанавливаться произвольно в шести позициях на станине. Выходной вал может быть цилиндрический или полый. Первое и второе высказывания являются фактами: Цилиндро-конические мотор-редукторы серии K являются угловыми редукторами. Вал двигателя и выходной вал образуют прямой угол. Этому способствует употребление неакциональных глаголов являются и образуют, свидетельствующих о том, что перед нами фактическая информация. Третье высказывание наряду с глаголом действия устанавливаться содержит модальный глагол может, выражающий оттенок возможности: Мотор-редуктор может устанавливаться произвольно в шести позициях на станине. Содержание значения предполагает такую возможность, в которой эксперт может и не нуждаться - выбор здесь неочевиден. Четвертое высказывание также содержит модальный глагол может, но в этом высказывании выражена не возможность как таковая, а необходимость выбора: Выходной вал может быть цилиндрический или полый. Достигается это значение, безусловно, конструкцией с однородными членами, соединенными разделительным союзом или. Таким образом, то, что для машины может быть неочевидным, становится очевидным для эксперта, анализирующего полученную информацию и дополняющего / корректирующего имеющуюся базу данных в соответствии с анализом полученной из внешней среды информацией.

Таким образом, к основным группам фиксируемых в базе данных запросов знаний относятся: 1) данные из классификатора и 2) данные, необходимость которых обусловлена

требованием максимальной эффективности извлечения информации из неформализованной информационной среды.

К данным из классификатора относятся:

- названия элементов конструкции и описания их функционала;

- марки, серии, модели, модификации элементов и изделий трубопроводной арматуры;

- различные характеристики и описания элементов трубопроводной арматуры: число оборотов, скорость работы, расчетная грузоподъемность, удобство и др.

Данные, необходимость которых обусловлена требованием максимальной эффективности извлечения информации из неформализованной информационной среды, включают в себя:

- названия производителей: SHAYANGYEINDUSTRIAL, KingRightMotor, ОАО «Редуктор» и др.;

- название компаний, организаций потребителей: ОАО «Нижнетагильский металлургический комбинат», ОАО «Евразруда», ОАО «Тяжмаш», ФГУП НПО им. Лавочкина, ФГУП КНПЦ им. Хруничева и т.п.;

- оценочные качества элементов трубопроводной арматуры: современный, крутой, хорош, поломка, глючный, неприемлемый и т.п.;

- степень вероятности: возможно, вероятно, может быть, невозможно и т.п.;

- эмоционально-оценочные характеристики пользователей: нравится, пользуюсь, замучился, приладил, настроил и т.п.;

- отрасль использования: в производстве, в машиностроении, для домашнего пользования и т.д.;

- список действий: использовал, произведен, протестировать и т.п.;

- список общепринятых и индивидуальных сокращений: т/х, с/х и т.п.;

- возможные профессионально-обиходные варианты названий элементов: коробка вместо корпус.

Грамотно реализованные семантические правила поискового запроса выявляют и фиксируют интересующую пользователя информацию, организуя связи между представленными выше группами.

Пример обработки текста с использованием семантических правил:

1. Распознавание текста, выделение ключевых слов. Для высказывания: Для производства чугунного литья может быть использован чугун марок СЧ-15, СЧ-20 и антифрикционные чугуны, актуальными будут следующие ключевые параметры: отрасль использования, технологический процесс, оценка, действие, характеристика.

2. Анализ ключевого слова с помощью семантических правил. Утверждения: 1) Червячные, цилиндро-червячные и цилиндрические соосные мотор-редукторы INNOVARI мощностью 0,06-15 кВт отличаются надежностью, плавностью работы, повышенным КПД, а также низким уровнем шума и вибраций, 2) Одноступенчатые червячные мотор-редукторы SITI (СИТИ) серии MI, комплектуются асинхронными двигателями мощностью от 0,09 кВт до 18,5 кВт с крутящим моментом от 4 Нм до 2000 Нм и передаточным отношением от 5:1 до 100:1 и 3) Двухступенчатый червячный мотор-редуктор DRV отличаются модернизированным универсальным корпусом, позволяющим

осуществить монтаж редуктора в любом положении - могут быть проанализированы и разложены на составляющие следующим образом:

вид именование марка доп. характеристика действие качество

червячные, цилиндро-червячные и цилиндрические соосные мотор-редукторы INNOVARI мощностью 0,06-15 кВт отличаются надежностью, плавностью работы, повышенным КПД, а также низким уровнем шума и вибраций

одноступенчатые червячные мотор-редукторы SITI (СИТИ) серии М1 - комплектуются асинхронными двигателями мощностью от 0,09 кВт до 18,5 кВт с крутящим моментом от 4 Нм до 2000 Нм и передаточным отношением от 5:1 до 100:1

двухступенчатый червячный мотор-редуктор DRV - отличаются модернизированным универсальным корпусом, позволяющим осуществить монтаж редуктора в любом положении

Какие-то ключевые параметры могут быть опущены как временно неактуальные.

Как правило, ключевыми являются лексические единицы действия (отличаются, комплектуются), точные значения (М12), названия (редуктор), связки из признака и значения функциональной вершины графа обобщенной модели из классификатора (количество ступеней - 2). С учетом данной специфики можно простроить аналитические правила анализа информации.

Безусловно, анализировать высказывания, построенные по правилам разворачивания текста, используемого в нашем случае для машиностроения, проще не только эксперту, но и машине. Гораздо сложнее вычленять значимую информацию в текстах разговорного характера, спонтанного, обывательского, например: Практически все производители стали массово применять полимерные шестерни в редукторах, так как их нет нужды вырезать в токарных, фрезерных, зуборезных станках, шлифовать и закалять. Шестерня из полимерного материала выливается на считанные секунды на пресс автомате и ее себестоимость в десятки или сотни раз ниже качественно обработанной стальной или латунной шестерни. Применение пластиковых деталей приобрело такой размах, что встретить металлический редуктор в электроприводе можно с такой же вероятностью, как и встретить динозавра или мамонта на улице. И даже достаточно недешевые привода стоимостью на одну сотню евро (которые производители позиционируют как суперэлитные) часто - густо грешат установкой шестерен из полимерных материалов. Или: Единственным плюсом применения полимерных шестерен в редукторе может

являться их более тихая работа в сравнении с металлическими. Но и качественный стальной редуктор особо не напрягает звук лишними децибелами. Вас ведь не напрягает вой шестерен коробки передач автомобиля? Современные косозубые передачи не воют, как древний ГАЗон, в котором применялось прямозубое зацепление шестерен. Или: Перед дорогой машина подкинула сюрприз, отказал водительский стеклоподъёмник, сначала пытался перебрать... Помогало, но не надолго. За день до поездки плюнул и купил новый мотор-редуктор за 600 руб., поменял за 30 мин., всё работает. Или: Мы пошли навстречу клиенту и купили шестерню стоимостью 50 евро за свой счет. Заменили пластиковые втулки на подшипники, заправили редуктор смазкой до отвала - с тех пор мотор работает уже три года и никаких проблем. Не мешает ни «изношенная фурнитура», ни «превышение веса створки», ни «отсутствие зазора». В высказываниях подобного типа содержится меньше точной информации и больше информации оценочной, но эта информация тоже является актуальной, поскольку содержит недоступный для эксперта опыт. И во многом именно такой информацией изобилует интернет.

В языке в целом очень важными являются механизмы оптимизации [9, с. 243-302], и в этом отношении система конфигуратора не противоречит естественным языковым процессам. Поисковой текст оптимизируется следующими действиями:

1. Употребляется точечный запрос с привлечением узкого круга данных из классификатора для задачи пополнения самого классификатора; например, при запросе, соответствующем функциональной вершине с указанием родительской вершины + признак и имеющем вид: материал колеса редуктора, мы в первую очередь получим сведения о возможных значениях признака колеса: сталь, капрон и т.п.

2. Осуществляется использование ключевых групп категорий в зависимости от желаемого результата и задач: оценочные качества работы механизма (например, при запросе шестерня качественная можно получить варианты, раскрывающие качество шестерни), варианты действия (запрос: ходовая часть ремонтировал), степень вероятности (запрос: вероятно проработает) и т.п.

3. Допускается автоматическое предложения пользователю оптимальных вариантов построения запросов при выборе интересующей детали из классификатора или желаемого действия с ней: поиск альтернатив, поиск производителей, расчетов, дополнение функционала и т.п.

4. Используется отсев известных классификатору данных при желании найти что-то новое; например, при поиске альтернатив отсев таких альтернатив, которые помечены в классификаторе как альтернативные искомому объекту при обобщении нескольких декомпозиций.

5. Выборка информации согласно данным, известным классификатору, при желании пользователя подтвердить данные из базы классификатора.

Работы по созданию модуля информационного поиска разрабатывается как часть конфигуратора изделий машиностроения, первоначально - редуктора, на базе «Института механики» Ижевского государственного технического университета им. М.Т. Калашникова, который на протяжении многих лет является одной из ведущих

отечественных научных школ в области зубчатых передач признанным лидером в нашей стране и за рубежом в области изучения, разработки и внедрения в различные области техники спироидных передач и редукторов. За каждым изделием сегодня стоят глубокие исследования и серьезная наука, позволяющие создавать современные образцы редукторной техники. Каждый из разработанных и освоенных в производстве редукторов является наукоемким и конкурентоспособным. При этом процесс их совершенствования и создания новых прогрессивных образцов все время продолжается.

Implication

Эффективность работы поиска узкопрофильного конфигуратора зависит от принципа работы алгоритма, имеющего своей основой существующую базу данных конфигуратора и использующего лингвистические правила для выполнения задач, являющихся практически невыполнимыми для экспертов этой профессиональной области. В статье дан алгоритм построения классификатора и правила использования данных для реализации наиболее оптимальных вариантов поиска в зависимости от требований пользователя; выявлены группы тем, представляющие интерес при реализации алгоритма поиска и отбора информации, связанной с тематикой трубопроводной арматуры; определены группы фиксируемых в базе данных запросов. В статье также приведены принципы оптимизации поискового запроса, ориентированного на поиск новой, уточняющей и дополняющей конфигуратор информации. При этом сделан вывод, что подобный процесс оказывается свободно реализуемым прежде всего потому, что принципы построения системы конфигуратора не противоречит естественным процессам, протекающим в языке. При таком подходе информационный поиск выступает как инструмент пополнения базы данных информационной системы, что делает систему конфигуратора открытой, а следовательно, постоянно актуальной.

Эффективных алгоритмов поиска информации и попыток его анализа активно используется сейчас достаточно много, некоторые из таких алгоритмов лежат в основе всемирно известных и популярных поисковых систем, таких как системы Google, Yandex, Bing, Yahoo и т.п. Однако рассмотрение поискового модуля как части сложной профессиональной системы, в рамках которой этот модуль поддерживает актуальность существующей и постоянно пополняющейся базы данных, с течением времени делает исследования в этой области всё более перспективными и востребованными, а разработки в области совершенствования алгоритма информационного поиска всё более эффективными.

References:

1. Belyakov S.L., Bozhenyuk A.V., Ginis L.A., Gerasimenko E.M. (2013) Nechetkie metody upravleniya potokami v geoinformacionnyh sistemah [Indistinct methods of management of streams in geographic information systems]. Taganrog: YuFU, 176.

2. Cellier F.E. (2009) Object-oriented Modeling of Mechatronics Systems in Modelica Using Wrapped Bond Graphs // Proc. IEEE Intl. Conference on Mechatronics, Malaga, Spain 2009.

3. Deptula A., Partyka M.A. (2010) Application of game graphs in optimization of dynamic system structures // International Journal of Applied Mechanics and Engineering, vol.15, No.3, 647-656.

4. Evans E. (2004) Domain-Driven Design - Tackling Complexity in the Heart of Software. Addison-Wesley, 529.

5. Evans E. (2011) Predmetno-orientirovannoe proektirovanie (DDD): strukturizaciya slozhnyh programmnyh sistem = Domain-Driven Design: Tackling Complexity in the Heart of Software [Subject-oriented design (DDD): structurization of difficult program systems = Domain-Driven Design: Tackling Complexity in the Heart of Software]. Moscow: Williams. 448.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

6. Goldfarb V.I., Glavatskih D.V., Trubachev E.S. (2011) Spiroidnye reduktory truboprovodnoj armatury [Spiroid reducers of trubprovodny fittings]. M.: Veche, 234. 3

7. Klimontovich Yu.L. (1999) Open systems entropy and information // Progress of Physical Sciences, Vol.169, No. 4., 444.

8. Moskin N.D., Lebedev A.A., Varfolomeev A.G. (2017) Application of a method main a component for the analysis of poetic and folk texts [Primenenie metoda glavnyh komponent dlya analiza poehticheskih i folklornyh tekstov] // Cifrovaya gumanitaristika: resursy, metody, issledovaniya [Digital gumanitaristika: resources, methods, researches]. Perm: PSU. P. I.70-73.

9. Nekipelova I.M. (2014) Organizaciya, samoorganizaciya i dezorganizaciya yazykovoy sistemy: mekhanizmy optimizacii yazyka i rechi sinergeticheskiy aspect: Monografiya [Organization, self-organization and disorganization of language system: mechanisms of optimization of language and speech (synergetic aspect): Monograph]. M.-Izhevsk: Institut kompyuternyh issledovaniy. 376.

10. Nekipelova I.M., Zarifullina E.G. (2013) Yazykovaya sistema kak estestvennaya mnogourovnevaya klassifikaciya vysokoy stepeni nadezhnosti [Language system as natural multilevel classification of high degree of reliability] // Modern research of social problems [Sovremennye issledovaniya socialnyh problem]. No. 6 (26). doi: http://dx.doi.org/10.12731/2218-7405-2013-6-38 Nekipelova I.M. (2013)

11. Nitko Ya.M. (2017) Grafosemanticheskoe modelirovanie prostranstvenno-raspredelennyh ehrgonimov [Graf-semantic modeling of the spatial distributed ergonims] // Cifrovaya gumanitaristika: resursy, metody, issledovaniya [Digital gumanitaristiks: resources, methods, researches]. Perm: PSU. P. I. 74-76.

12. Polushkina T.M., Kovalenko E.G., Yakimova O.Yu. (2013) Sociologiya upravleniya [Sociology of management]. Moscow: Academy of Natural sciences. Available: https://www.monographies.ru/ru/book/view?id=219

13. Spivak S.I., Ismagilova A.S., Gibaeva R.A. (2014) Teoretiko-grafovyy metod analiza informativnosti kineticheskih ehksperimentov pri opredelenii parametrov [Teoretikal-graph a method of the analysis of informational content of kinetic experiments when determining parameters] // Vestnik Bashkirskogo universiteta [Bulletin of the Bashkir university]. Ussue 19. No. 4. 1126-1130.

14. Uematsu S. (1997) An application of graph theory to the kinematic analysis of planetary gear trains // Int. Journal of the Japan Soc. for Precis. Eng., No. 31, 141-146.

15. Vaynberg Allen A. (2008) Grafy dlya analiza strukturnyh sootnoshenij mezhdu peremennymi i ih prilozhenie k izucheniyu rossijskih regionov [Graphs for the analysis of structural ratios between variables and their application to a study of Russian regions] // Prikladnaya ehkonometrika [Applied econometrics]. No. 2(10). 44-63.

16. Wojnarowski J., Sikora K., Kopec J., Zawislak S. (2004) Graph-based models of planetary gears // Teoria Maszyn i Mechanizmow. Editors: J. Wojnarowski, T. Uhl., AGH, Krakow, 311-317.

17. Wojnarowski J., Zawislak S. (2002) Evolutionary algorithms for graph partitioning problem // Polioptymalizacja i komputerowe wspomaganie projektowania. Editors: W. Tarnowski, T. Kiczkowiak, WN-T, Warszawa, 277-286.

18. Zarifullina E.G. (2014) Yazyk i rech: baza dannyh i informaciya [Language and Speech: database and information] // Filologiya. Teoriya i praktika [Philology. Theory and Practice]. No. 11-1 (41). 80-82.

Information about authors:

Nekipelova Irina (Izhevsk, Russia) - PhD, Associate Professor of Philosophy department, the teacher of Russian as foreign of Institute of translators in the sphere of professional communication, M.T. Kalashnikov Izhevsk state technical university (426069 Izhevsk, Studencheskaya, 7). Her research fields are: Russian history, language philosophy, teaching Russian as foreign, language education - e-learning - language testing; author of over 110 publications and 3 monographs. E-mail: irina.m.nekipelova@mail.ru

Zarifullina Elvira (Izhevsk, Russia) - Head of E-learning department, M. T. Kalashnikov Izhevsk state technical university (426069 Izhevsk, Studencheskaya, 7). Her research fields are: IT-technologies, e-learning testing; author of over 20 publications. E-mail: zarifullina_elvira@mail.ru

Acknowledgement:

We express gratitude to Doctor of Engineering, professor of Design and Technology Preparation of Machine-Building Productions Department, the director of "Institute of Mechanics", the vice-president of Executive council of the International Federation for TMM (IFToMM), the member of committees on tooth gearings of the International Federation on TMM and the International Organization for Standardization (ISO) Veniamin Goldfarb for the problem statement and for the model of configurator reducer provided for a research.

Выражаем благодарность доктору технических наук, профессору кафедры конструкторско-технологической подготовки машиностроительных производств, директору "Института механики", вице-президенту Исполнительного совета Международной Федерации по ТММ (IFToMM), члену комитетов по зубчатым передачам Международной Федерации по ТММ и Международной организации по стандартизации (ISO) Вениамину Иосифовичу Гольдфарбу за постановку проблемы и за предоставленную для исследования модель конфигуратора редуктора.

i Надоели баннеры? Вы всегда можете отключить рекламу.