Научная статья на тему 'Выявление и использование ключевых параметров поискового запроса в процессе разработки модуля поиска как инструмента совершенствования конфигуратора изделий машиностроения'

Выявление и использование ключевых параметров поискового запроса в процессе разработки модуля поиска как инструмента совершенствования конфигуратора изделий машиностроения Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
162
8
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
информационные технологии / поисковой запрос / правила семантики / ключевые параметры поиска / модуль поиска / information technologies / search inquiry / semantic rules / key parameters of search / search module

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Некипелова Ирина Михайловна

Статья посвящена выявлению ключевых параметров, позволяющих строить максимально эффективный поисковой запрос, необходимый для поиска во внешней среде информации об изделиях машиностроения. Разработка алгоритмов поискового модуля, определяющих оптимальный поисковой запрос, необходима для формирования новых данных конфигуратора такого изделия машиностроения, как редуктор, и поддержания в актуальном состоянии его базы данных. Исследование имеет междисциплинарный характер и позволяет применить правила семантики, опирающиеся на универсальные принципы оптимизации извлекаемой и получаемой извне информации, в системе конфигурирования изделий машиностроения. В свою очередь знания о наиболее общих принципах человеческого мышления позволяют определить начальные базовые параметры разрабатываемого модуля поиска и сделать выводы относительно значимости экспертной оценки поступающей извне информации.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The article is devoted to identify the key parameters of the search module, which constructs the most effective search query. It is necessary to look for information about mechanical engineering products in the external environment. Development of algorithms of the search module, which define optimum search inquiry, allows to form new data of a configurator of such mechanical engineering product as a reducer and to support it databases in current state. The research has cross-disciplinary character and allows to apply semantic rules in the system of configuration of mechanical engineering products. The investigated rules rely on the universal principles of the information optimization which can be taken and received from the external environment. Also, the knowledge about most general principles of human thinking allows us to determine initial basic parameters of the developed search module. And also, it helps us to draw conclusions about the importance of expert assessing of information arriving from the outside.

Текст научной работы на тему «Выявление и использование ключевых параметров поискового запроса в процессе разработки модуля поиска как инструмента совершенствования конфигуратора изделий машиностроения»

Некипелова Ирина Михайловна, кандидат филол. наук, доцент кафедры философии, Ижевский государственный технический университет им. М. Т. Калашникова,

Ижевск, Россия

ВЫЯВЛЕНИЕ И ИСПОЛЬЗОВАНИЕ КЛЮЧЕВЫХ ПАРАМЕТРОВ ПОИСКОВОГО ЗАПРОСА В ПРОЦЕССЕ РАЗРАБОТКИ МОДУЛЯ ПОИСКА КАК ИНСТРУМЕНТА СОВЕРШЕНСТВОВАНИЯ КОНФИГУРАТОРА ИЗДЕЛИЙ МАШИНОСТРОЕНИЯ

Аннотация

Статья посвящена выявлению ключевых параметров, позволяющих строить максимально эффективный поисковой запрос, необходимый для поиска во внешней среде информации об изделиях машиностроения. Разработка алгоритмов поискового модуля, определяющих оптимальный поисковой запрос, необходима для формирования новых данных конфигуратора такого изделия машиностроения, как редуктор, и поддержания в актуальном состоянии его базы данных. Исследование имеет междисциплинарный характер и позволяет применить правила семантики, опирающиеся на универсальные принципы оптимизации извлекаемой и получаемой извне информации, в системе конфигурирования изделий машиностроения. В свою очередь знания о наиболее общих принципах человеческого мышления позволяют определить начальные базовые параметры разрабатываемого модуля поиска и сделать выводы относительно значимости экспертной оценки поступающей извне информации.

Ключевые слова: информационные технологии, поисковой запрос, правила семантики, ключевые параметры поиска, модуль поиска.

Abstract

The article is devoted to identify the key parameters of the search module, which constructs the most effective search query. It is necessary to look for information about mechanical engineering products in the external environment. Development of algorithms of the search module, which define optimum search inquiry, allows to form new data of a configurator of such mechanical engineering product as a reducer and to support it databases in current state. The research has cross-disciplinary character and allows to apply semantic rules in the system of configuration of mechanical engineering products. The investigated rules rely on the universal principles of the information optimization which can be taken and received from the external environment. Also, the knowledge about most general principles of human thinking allows us to

determine initial basic parameters of the developed search module. And also, it helps us to draw conclusions about the importance of expert assessing of information arriving from the outside.

Keywords: information technologies, search inquiry, semantic rules, key parameters of search, search module.

Язык, будучи феноменом человеческой деятельности и результатом человеческого мышления, выполняет ряд очень важных для адаптации человека и, следовательно, жизнеобеспечения социума прагматических функций. Понимание значимости этих функций приводит к усилению внимания учёных к аспектам, направленным на исследование в жизнедеятельности человека прикладного значения языковой системы.

Одной из важных прагматических функций, выполняемых языком, является осуществление поиска информации во внешней среде. Эту функцию выполняет модуль информационного поиска, разрабатывающийся как часть конфигуратора изделий машиностроения, первоначально - редуктора, на базе «Института механики» Ижевского государственного технического университета им. М.Т. Калашникова, который, являясь на протяжении многих лет одной из ведущих отечественных научных школ в области зубчатых передач, считается признанным мировым лидером в области изучения, разработки и внедрения в различные области техники спироидных передач и редукторов [1; 2]. Представленная статья является продолжением ряда работ, посвящённых разработке модуля поиска информации как метода совершенствования узкопрофильного конфигуратора [6; 9]. Необходимость подобного исследования связана с пониманием того, что, будучи феноменом человеческой деятельности и открытой сложной системой, язык, реализуя когнитивные возможности человека, позволяет точно и чётко решать прикладные задачи разных сфер человеческой деятельности. Мало того, в большинстве случаев он является единственно возможным средством конструктивного и адекватного решения этих задач [5].

В настоящее время в мире разработано несколько достаточно эффективных алгоритмов поиска информации, многие из которых лежат в основе всемирно известных поисковых систем, таких как Google, Yandex, Bing, Yahoo, Opera и т.п. Однако идея использования поискового модуля как части сложной узкопрофессиональной системы, в рамках которой этот модуль предназначен поддерживать актуальность существующей базы данных, возникла достаточно недавно и не имеет масштабной практической реализации. Целью данного исследования является выявление ключевых параметров для формирования оптимального поискового запроса, реализующего генеральные поисковые алгоритмы модуля поиска информации, необходимого для поддержания в актуальном состоянии базы данных конфигуратора изделий машиностроения. Исследование имеет междисциплинарный характер и опирается на метод проблемно-ориентированного поиска [4], допускающего использование данных одной области знаний в поле знаний другой области, а также на метод проблемно-ориентированного проектирования [8]. Предлагаемое исследование позволяет применить правила семантики, реализующие универсальные принципы оптимизации извлекаемой и получаемой извне информации [3], в конструировании системы конфигурирования изделий машиностроения. В свою очередь знания о наиболее общих принципах человеческого мышления позволяют нам определить 308

начальные базовые параметры разрабатываемого модуля поиска как инструмента усовершенствования узкопрофильного конфигуратора.

Создание изделий машиностроения требует формализации сложных объектов с целью возможности последующей корректировки созданных конфигураторов и их модификации. И в этом процессе особую роль играют формализованные данные языковой системы, являющейся вспомогательным средством поиска профессиональной информации.

Преимущество универсальных систем автоматизации инженерной деятельности заключается в том, что они позволяют быстро и в большом объёме произвести расчеты и верифицировать выбранную инженером конструкцию. Однако при этом они не могут выполнить весь процесс конфигурации с нуля до завершающей фазы, поскольку оказываются не в состоянии разработать и предложить новую структуру изделия согласно заданным требованиям технического задания, требующим творческого подхода к процессу конструирования и не подлежащим формализации. Таким образом, с точки зрения технического подхода можно говорить исключительно о возможностях частичной автоматизации этой деятельности, поскольку человек и машина выполняют разные функции в процессе конструирования, существенно дополняя друг друга. Однако создание конфигуратора, являясь финальной стадией технической разработки, не является окончательным вариантом, предназначенным для неизменного использования. Изменение стандартов и появление новых возможностей использования деталей машиностроения приводит к необходимости пересмотра производства многих деталей, осуществления новых расчётов и пр. Прекращение пополнения информационной базы актуальной информацией неизбежно приводит к стагнации и к потере актуальности конфигуратора. В связи с этим остро ставится вопрос о необходимости постоянного пополнения имеющейся базы данных конфигуратора искомой предметной области, поиск новых, ранее невозможных и невостребованных вариантов, из потенциальных становящихся актуальными. Однако при лавинообразном росте информации необходимо вырабатывать методы и подходы, дающие максимально успешные результаты.

Осуществление поиска новой информации и её привлечение является сложной, но выполнимой задачей. При разработке оптимального алгоритма и внедрении его в практику возможна существенная автоматизация пополнения базы данных новыми данными, а также привлечение новых знаний и их быстрое внедрение, оптимизация задач системы и создание широкой платформы для формирования опытной базы, в минимальной степени зависящей от опыта специалиста в данной области. В своей работе в качестве базы данных мы используем разработанный ранее классификатор редукторных систем. Этот классификатор является базой данных для синтеза редукторов средней и высокой степени сложности. Автоматизированные инструменты сбора информации позволяют сделать упор на обработку большого массива трудноохватываемой информации, однако при этом следует учитывать, что машина не способна адекватно оценивать значимость данных, поэтому на этапе отбора информации она в любом случае нуждается в помощи эксперта.

При достижении достаточного показателя содержания данных конфигуратор можно считать приведенным к равновесному состоянию. При равновесном состоянии система

309

способна решать задачи, поставленные перед ней, с заданной степенью точности. Особенностью извлечения данных из информационных сред является высокая степень неопределенности результатов их взаимодействия, связанная с большой энтропией внешней среды и нестабильной упорядоченностью системы. Специфика искусственных систем заключается в том, что они имеют высокий уровень организации и, следовательно, по определению характеризуются эквифинальным состоянием - состоянием самоорганизации, определяемой лишь внутренней структурой самой системы и не зависимой от состояния внешней среды. Такие системы способны развиваться в сторону увеличения порядка и уровня сложности, что происходит за счет добавления и изменения в классификаторе, обслуживающем конфигуратор, данных. Все данные классификатора и конфигуратора, необходимые для работы с системой и с внешней средой, представлены на языке, и именно поэтому языковой параметр, обеспечивающий работу поисковых систем, является в этом процессе ключевым.

Одним из основных современных источников знания является интернет, с одной стороны, предлагающий для анализа огромный массив информации, а с другой - дающий такой материал, который является крайне сложным для анализа и обработки. Сложность извлечения знаний определяется объёмом и неупорядоченностью поступающей информации, отсутствием её формализации, высокой и неконтролируемой скоростью её поступления, необходимостью перевода полученной и извлечённой из внешней среды информации в данные конфигуратора. Все эти проблемы напрямую связаны с особенностями превращения информации в данные языка, способами хранения этих данных и их использования.

С целью извлечения из внешней среды актуальной информации в поисковых системах осуществляются запросы, направленные на поиск корректирующей - дополняющей, уточняющей и изменяющей - базу данных информации. При этом работа экспертов-машиностроителей с конфигуратором показала, что эксперты в целом в состоянии выявить возникающие проблемы, но не в состоянии определить приемлемые пути решения этих проблем, поскольку процесс усовершенствования конфигуратора связан с незнакомой для них экспертной областью - семантикой.

Задача разрабатываемого алгоритма состоит в том, чтобы создать такие поисковые запросы, которые в максимальной степени позволят найти во внешней среде, извлечь из неё и оценить в соответствии со степенью достоверности и ценности релевантную информацию. Особую сложность в этом процессе составляют термины и понятия, относящиеся к разным сферам деятельности человека. Следовательно, эксперт должен заложить в модуль поиска такой алгоритм, который позволит отсеивать ненужные контексты, что сделать весьма сложно, поскольку с чисто формальной точки зрения омонимы, а речь идёт именно о них, имеют общий план выражения при различном плане содержания. Произвести оценку омонимичной информации в автоматическом режиме бывает непросто, а иногда и невозможно.

Рассмотрим пример. Слово накладка может иметь разные значения, которые

зафиксированы в словаре: 1) процесс наложения; 2) изделие из чужих волос, добавляемое к 310

причёске; 3) спец. деталь, накладывающаяся на что-либо, прикрывающая собой что-либо; 4) металлическая планка с прорезным отверстием, надеваемая на пробой для висячего замка; 5)разг.-сниж. промах, неудача, неполадка. Актуальным значением для исследуемой нами области будет третье значение. Однако накладка используется как деталь многих устройств и механизмов, относящихся не только к машиностроению, поэтому такой широкий запрос, как «накладка», даёт массовые, но тематически широкие и размытые, не имеющие ценности для эксперта результаты:

Накладка, путевая деталь рельсового скрепления, служащая для соединения концов рельсов при помощи болтов. Накладка перекрывает стык рельсов так, что...

Накладка для настольного тенниса - неотъемлемая часть вашей ракетки для настольно тенниса. Теннисная ракетка - это самый главный...

Приобретайте накладки для розеток и светорегуляторов с доставкой или в магазинах вашего города. Лучшие цены и отличный ассортимент.

Из полученных результатов видно, что заданный нами первоначальный запрос «накладка» не выдал искомой информации, связанной с деталью редуктора.

Дальнейшая конкретизация поиска за счёт запроса «накладка редуктор» дала, вопреки ожиданиям экспертов, частично желаемые результаты. Большая часть результатов не относилась к области машиностроения:

Запчасти аксессуары для водной техники. Цена 480 руб. Новый. В наличии. Верхняя накладка рулевого регулятора угол 90 и 20 градусов. Цена 480 руб.

Верхняя накладка угол 90 град белая. LM-B-1W. Комплект присоединения с углом наклона 90. Применяется в комплекте с рулевыми... и аналогичные.

Это связано с тем, что редукторы используются не только при конструировании автомобилей.

Ещё большая степень конкретизации «накладка редуктор автомобиль машиностроение» дала хорошие, но однотипные результаты, что как раз не входило в область интересов экспертов, поскольку их целью было отследить и выявить новую информацию:

RUредукторы и другие запчасти для радиоуправляемых автомобилей можно купить на выгодных... Накладка редуктора Traxxas TRS-4 - TRA8280...

Фото накладка порога наружная правая hover, h3, h5... цветовых сочетаний, а также стоимости автомобилей, запасных частей, дополнительного...

Газовые редукторы. В этом разделе вы можете купить редуктор газовый для систем распределенного впрыска газа (4 поколение ГБО) для автомобилей...

Эксплуатация автомобиля с неисправным редуктором (посторонние звуки, скрежет, критический нагрев, произвольная блокировка дифференциала) ... и пр.

Таким образом, мы приходим к промежуточному выводу, что наиболее широкий и наиболее узкий запросы являются наименее информативными для эксперта, ищущего во внешней среде разнообразную информацию, связанную с функционированием и

311

эксплуатацией редуктора.

В целом поиск осуществляется с использованием следующих ключевых параметров: 1) область использования: машиностроение; 2) устройство или механизм, частью которого является накладка: редуктор, двухступенчатый зубчатый редуктор и пр.; 3) модель автомобиля: ВАЗ, TOYOTA LEXUS HARRIER RX330 и пр.; 4) синонимический ряд деталей, из которых состоит редуктор: корпус, крышка, колесо и пр.; 5) вид или тип накладки: наружная права накладка и пр. 6) процесс, сопровождающийся неисправностью редуктора; посторонние звуки, произвольная блокировка дифференциала и пр.; 7) дополнительная информация: стоимость, цветовые сочетания, материал и пр.; 8) сопроводительные процессы: эвольвентные цилиндрические передачи и пр. Последовательное и тем более одновременное использование этих ключевых параметров при формулировании поискового запроса даёт максимальную конкретизацию запроса. Однако, как показала экспертная оценка, именно такая конкретизация позволяет получить наименее информативные данные при наибольшей точности тематического попадания. При этом полностью исключить ненужные тексты, появление которых связано с огромным разнообразием представленной в интернете информации, не представляется возможным. Следовательно, явление омонимии, имеющее место в любом естественном языке, является серьёзным препятствием на пути к созданию полностью автоматизированного, не требующего участия эксперта модуля поиска в составе конфигуратора. Это повышает значимость экспертной оценки в усовершенствовании конфигуратора изделий машиностроения, поскольку эксперт является обладателем «специфических знаний, относящихся к сфере производственных интересов человека» [7, 65]. До какой-то степени поисковые системы могут самостоятельно выполнять поставленные задачи, и поэтому ими необходимо пользоваться, особенно в выявлении стандартных и типовых случаев. Однако особые условия машина выполнить не может, и именно в этом случае необходима экспертная оценка специалиста. Таким образом, следует сделать вывод, что полностью перейти на использование автоматизированных систем обработки информации невозможно, поскольку машина не в состоянии заменить мышление человека - тонкий инструмент осмысления действительности и конструирования картины мира, не подчиняющийся абсолютной стандартизации. А автоматизация, которая требуется от машины, это прежде всего стандартизация процесса, то есть отказ от нестандартных способов развёртывания информации.

Однако в целом эффективность совершенствования конфигуратора изделий машиностроения зависит от принципа работы алгоритма, имеющего своей основой существующую базу данных конфигуратора и использующего лингвистические правила для выполнения задач, являющихся практически невыполнимыми для экспертов исходной профессиональной области. При этом подобный процесс оказывается свободно реализуемым прежде всего потому, что принципы построения системы конфигуратора не противоречат естественным процессам, протекающим в языке. При таком подходе информационный поиск выступает как инструмент пополнения базы данных информационной системы, что делает систему конфигуратора открытой, а следовательно, постоянно актуальной. 312

Volume 3, Issue III, September 2018 Список литературы

1. Гольдфарб В.И., Главатских Д.В., Трубачёв Е.С. и др. Спироидные редукторы трубопроводной арматуры. М.: Вече, 2011г. 234 с.

2. Гольдфарб В.И., Ткачёв А.А. Оптимизационный подход к автоматизированному проектированию цилиндрических передач. Труды 13 Всемирного конгресса по ТММ. Гуанадуато, Мексика, 2011.

3. Некипелова И. М. Организация, самоорганизация и дезорганизация языковой системы: механизмы оптимизации языка и речи (синергетический аспект): Монография. М.-Ижевск: Институт компьютерных исследований, 2014. 376 с.

4. Некипелова И. М. Языковая система как объект исследования постнеклассической науки // Филологические науки. Теория и практика. Тамбов: Грамота, 2013. № 1 (19). С. 116-121.

5. Некипелова И. М., Зарифуллина Э. Г. Языковая система как естественная многоуровневая классификация высокой степени надёжности // Современные исследования социальных проблем (электронный научный журнал). 2013. № 6 (26). doi: http://dx.doi.org/10.12731/2218-7405-2013-6-38

6. Некипелова И. М., Зарифуллина Э. Г. Разработка модуля поиска как инструмента совершенствования узкопрофильного конфигуратора // Cross-Cultural Studies: Education and Science (CCS&ES), 2018. № 1. P. 30-42.

7. Пилюшенко А.В. К вопросу о социально-философском содержании человеческого капитала личности // Вестник Томского государственного университета. 2018. № 430. С. 64-67.

8. Эванс Э. Предметно-ориентированное проектирование (DDD). Структуризация сложных программных систем. М.: Вильямс, 2011. 448 с.

9. Zarifullina E. G., Malina O. V. and Nekipelova I. M. Search module as tool for improvement of classifier // Graph-Based Modelling in Engineering Mechanisms and Machine Science, 2017. V. 42. P. 223-232.

i Надоели баннеры? Вы всегда можете отключить рекламу.