Научная статья на тему 'Первичная идентификация в технологии информационного поиска. Часть 1'

Первичная идентификация в технологии информационного поиска. Часть 1 Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
177
52
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ИНФОРМАЦИОННЫЙ ПОИСК / INFORMATIONAL SEARCH / ЭФФЕКТИВНОСТЬ ИНФОРМАЦИОННОГО ПОИСКА / EFFICIENCY OF INFORMATIONAL SEARCH / ТРИЕДИНАЯ СУЩНОСТЬ / TRIUNE ESSENCE / ПЕРВИЧНАЯ ИДЕНТИФИКАЦИЯ / INITIAL IDENTIFICATION / ЛОКАЦИЯ ПО СТРУКТУРЕ ЗНАНИЙ / A LOCATION IN STRUCTURE OF KNOWLEDGE / ИМЕНА ПОНЯТИЙ / СЛОВАРИ ПРОСТЫХ И СОСТАВНЫХ ИМЕН / DICTIONARIES OF SIMPLE AND COMPOUND NAMES / КОНСТРУКЦИЯ ВЫСКАЗЫВАНИЯ / ОСМЫСЛЕНИЕ (АССОЦИИРОВАНИЕ С СУЩНОСТЬЮ РЕАЛЬНОГО МИРА) / JUDGMENT (ASSOCIATION WITH ESSENCE OF THE REAL WORLD) / NAMES OF CONCEPTS / CONSTRUCTION OF STATEMENT

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Болотова Л.С., Данчул А.Н., Новиков А.П., Сурхаев М.А., Никишина А.А.

В статье рассмотрена одна из процедур механизма общения субъекта, которая названа первичной идентификацией. При полновесной реализации этой процедуры в программной системе, организующей информационный поиск, можно ожидать высоких показателей эффективности поиска. Однако полновесная реализация первичной идентификации возможна только с применением модели области реального мира, приближенной к модели, названной «гносеологической моделью».

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Болотова Л.С., Данчул А.Н., Новиков А.П., Сурхаев М.А., Никишина А.А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Initial identification in technology of informational search (part 1)

This article is devoted to a problem of creation of the program systems (PS) organizing the information search (IS), and providing high rates of efficiency for the mass user (not the expert in the field of informational technologies). Researches weren’t limited by the review of achievements in practice of creation PS_IS, and also in the corresponding scientific and engineering disciplines. The subject of researches is the process of achievement of mutual understanding in communication between two subjects. Such researches completely correspond to the character of researches in the scientific direction of artificial intellect. It points out the essence which allocates from the process of communication between subjects, and it is explained the concept corresponding to it and it is offered to call «initial identification». Consideration of process of initial identification allowed to reveal the main contradiction in a problem of creation PS_IS. In the process of communication (and respectively in IS) the subject operates with all known set of concepts and uses thus as gained recognition (simple or compound) names of concepts, and the names formed directly in the course of communication. However in a natural language only 83.000 concepts are called by simple unique names (in a word). Compound names called incomparably more concepts, they make only insignificant part of concepts with which the subject operates in communication. Thus, the dominating part of algorithms of II is connected with application of quickly named concepts.It is shown that process of an operational name is feasible only with use of the model of knowledge approached to gnoseological model. And it is also specified that after some time in computer systems emergence of such models of knowledge is possible.For the new technology of IS the organization of access of each concrete tag of a concrete concept to its names in base of names is offered. That makes a basis of the organization of base of simple and compound names. Also other characteristics of the organization of the dictionary at triune essence are provided.Such concept as»construction of sentence» is offered for a broad use in scientific practice inter pretation of which corresponds to interpretation of the concept «sense of the sentence» with explanations, which allow to draw sense from sequence of alphanumeric symbols.A great place in this work takes consideration of algorithms of formation and recognition of sentences (that is II). Many situations of II suspension are revealed and described. It is noted that completeness of such situations, and also algorithms of permission of the concrete situations and scenarios of interactive interaction providing finishing II up to the end make the essence of works on formation of the specification on design of PS realizing new technology of IS.In conclusion it is pointed out that the declared subject due to its scale can’t be opened in one article in details (scrupulously) to conform to requirements to the specification on creation of II. It is important that the complete picture of new technology of IS is given in article and feasibility of such technology is shown.

Текст научной работы на тему «Первичная идентификация в технологии информационного поиска. Часть 1»

Vol. 10. No. 4 (58). 2015

Л. С. Болотова, докт. техн. наук, профессор Московского государственного технического университета радиотехники, электроники и автоматики, г. Москва, lubolotova@mail.ru

А. Н. Данчул, докт. техн. наук, профессор, МГУУ Правительства Москвы, adan51@yandex.ru А. П. Новиков, канд. техн. наук, Департамент образования, г. Москва, aJpnovikov@yandex.ru М. А. Сурхаев, докт. пед. наук, профессор, Дагестанский государственный педагогический университет,

г. Махачкала, surhaev@mail.ru А. А. Никишина, ООО «Эльстер Метроника», г. Москва, anikishina@gmail.com

Первичная идентификация в технологии информационного поиска

Часть 1

В статье рассмотрена одна из процедур механизма общения субъекта, которая названа первичной идентификацией . При полновесной реализации этой процедуры в программной системе, организующей информационный поиск, можно ожидать высоких показателей эффективности поиска . Однако полновесная реализация первичной идентификации возможна только с применением модели области реального мира, приближенной к модели, названной «гносеологической моделью».

Ключевые слова: информационный поиск, эффективность информационного поиска, триединая сущность, первичная идентификация, локация по структуре знаний, имена понятий, словари простых и составных имен, конструкция высказывания, осмысление (ассоциирование с сущностью реального мира) .

введение

Общение между людьми не всегда может быть оценено как разговор по существу. В общении человека с программной системой (ПС), организующей информационный поиск, потери времени на разговор не по существу (беспредметный разговор) — это непозволительная роскошь. Поэтому рассмотрение проблем создания технологии эффективного1 для массового пользователя (неспециалиста в области информационных технологий) и удобного в применении информационного поиска является теоретически и практиче-

1 Эффективность информационного поиска документов, обеспечиваемая информационно поисковой системой, оценивается по информационной полноте Кп и информационному шуму Кш. Коэффициенты Кп и Кш принимают значения в интервале от 0 до 1.

ски значимым, актуальным и экономически оправданным.

тезисы, составляющие концепцию новой технологии информационного поиска

Понятие «информационный поиск» введено в обращение специалистами в области информационных технологий. «При упоминании области информационного поиска — Information Retrieval (IR) обычно имеют в виду комплексную деятельность по сбору, организации, поиску, извлечению и распространению информации при помощи компьютерных технологий» [1, с 40]. Среди задач в области информационного поиска, по решению которых ведутся активные работы, выделяют (см. об этом в [1, с. 40, 41]:

a) собственно информационный поиск документов по запросу пользователя. Под до-

128

Том 10. № 4 (58). 2015

кументом понимается минимальная структурная единица информации в аспекте хранения и извлечения из коллекции. Текстовый документ может быть представлен последовательностью более мелких единиц: абзацев, предложений, слов, которые в определенном контексте также являются документами. Коллекцию составляет множество документов, имеющих какие-либо общие свойства (например, коллекция документов по заданной тематике или коллекция документов, имеющих общий формат представления);

Ь) автоматическая рубрикация документов по заранее заданному рубрикатору;

^ автоматическая кластеризация документов — разбиение на кластеры близких по смыслу документов;

d) разработка вопросно-ответных систем — поиск точного ответа на вопрос пользователя, а не целого документа;

e) автоматическое составление аннотации документа и многие другие.

Опираясь на этот перечень из [1], можно сформулировать задачи информационного поиска, решению которых посвящено создание новой технологии информационного поиска. Задачи «Ь» и «c» в области информационного поиска — это комплексная деятельность по организации информации. На вербальном уровне эту деятельность можно охарактеризовать как некоторую систематизацию (целенаправленное или органичное объединение в систему) документов, знаний о документах и знаний, содержащихся в документах, для повышения эффективности собственно информационного поиска. Конкретизация задач из области информационного поиска, которые будут рассмотрены в настоящей статье, содержится в следующем тезисе концепции технологии информационного поиска.

■ Первый тезис концепции: Под информационным поиском будем понимать только собственно информационный поиск точного ответа на вопрос массового пользователя с применением специально разработанной вопросно-ответной ПС (результата конкретного решения задачи «d»).

В рамках статьи такую вопросно-ответную ПС будем именовать «ПС, организующая информационный поиск». Приведем также дефиниции понятий «массовый пользователь» и «эффективность информационного поиска».

о Массовым пользователем будем называть пользователя ПС, организующей информационный поиск, который, будучи специалистом в своей конкретной предметной области, не обязан быть специалистом в области информационных технологий.

о Под эффективностью информационного поиска будем понимать процент от полного множества обращений массового пользователя к системе, организующей информационный поиск, обращений, в которых была получена востребованная информация.

В настоящее время с применением соответствующих ПС информационный поиск уже в основном выполняется массовым пользователем. В том числе общепризнано, что поисковая система глобальной сети Интернет по определению должна быть ориентирована на массового пользователя.

Приступая к информационному поиску, массовый пользователь владеет полностью или не до конца сформулированным вопросом в конкретной предметной области.

■ Второй тезис концепции: Для устранения возможной незавершенности (на момент начала информационного поиска) формулировки вопроса массовым пользователем ПС должна иметь не пакетный (интерактивный) режим обработки запросов.

Тезис концепции поясняет: «Как обеспечить гарантированный и однозначный выход в конкретный узел структуры знаний, если массовым пользователем, приступившим к информационному поиску, не завершена формулировка вопроса?» При реализации второго тезиса концепции незавершенность формулировки вопроса будет постепенно устраняться в интерактивном взаимодействии человека с ПС по поиску информации. Другими словами, пользователь ПС на каждом шаге интерактивного взаимодействия (на каждом шаге локации

Vol. 10. No. 4 (58). 2015

по структуре знаний), фактически взаимодействуя с ПС на языке типа «меню», выбирает одну из предложенных альтернатив. Тем самым фиксируется часть запроса при условии, что такая альтернатива уже присутствует в запросе. Если альтернатива в запросе отсутствует, то запрос пополняется, и тем самым продолжается его формулировка.

Мотивированное достижение конкретного узла структуры знаний предлагается признать завершением некоторого этапа в процессе поиска информации массовым пользователем (человеком). Каждый этап процесса поиска информации содержит первичную идентификацию2 (ПИ), и возможно несколько шагов локации по структуре знаний. Этап процесса поиска информации подобен шагу итерации, когда каждый последующий шаг подобен предыдущим и при этом использует некоторый результат последнего из предыдущих шагов итерации.

С потребностью и реализацией поиска информации массовый пользователь столкнулся еще в те времена, когда этот поиск был неавтоматизированным. Поэтому компетентное толкование массовым пользователем сущности, соответствующей понятию, именованному «информационным поиском», у массового пользователя не обременено знанием трудностей реализации в ПС тех или иных функций информационного поиска. Собственно толкование массовым пользователем понятия «поиск информации» многообразно в формулировках, а также в применяемых при этом терминах и терминологии. Однако смысл «поиска информации» во всех формулировках неизменен. Это локация по некоторой структуре знаний, которая должна завершаться выходом на недвусмысленную, не требующую дальнейшей обработки, достаточно подробную и лаконичную консультацию, которую можно признать эффективной. Перечисленные характеристики консультации формиру-

2 Толкование понятия «первичная идентификация» приводится далее.

ют признание эффективности информационного поиска с применением конкретной ПС. Отметим также, что глубина подробности консультации по вопросу, незнание ответа на который инициировало информационный поиск, находится в зависимости от уровня готовности конкретного человека воспринимать и понимать консультацию в конкретной формулировке. То есть глубина подробности консультации практикой востребована быть не одновариантной.

о Под консультацией будем понимать множество простейших фактов на общенаучном языке или на языке, приближенном к языку научных интересов конкретного пользователя.

Ориентация текста консультации на общенаучный язык или же на язык, приближенный к языку научных интересов конкретного пользователя, улучшает осмысление пользователем текста и соответственно повышает эффективность информационного поиска в каждом конкретном сеансе интерактивного взаимодействия с ПС. Здесь отметим, что ассоциирование в реальном мире (осмысление) фактов, составляющих консультацию, мы назначаем не реализованным в ПС. Другими словами, консультация должна восприниматься ПС как алфавитно-цифровое данное. Для реализации сформулированных требований к технологии информационного поиска в области знаний, на которой он осуществляется, будем различать знания, которые обеспечивают информационный поиск, и знания, которые являются целью информационного поиска.

Под моделью области реального мира традиционно принято понимать множество фактов, относимых к конкретной области. При этом множество фактов толкуется подобным множеству фантиков от конфет, собранных в картонной коробке. Отчужденность конкретного факта от других фактов из модели области реального мира нарушается неявно установленными связями между одинаково именованными понятиями, принадлежащими, однако, разным фактам. О других подробностях в характеристиках

Том 10. № 4 (58). 2015

связей, объединяющих множество фактов в модель области реального мира, упоминать не принято. Здесь отметим, что для гносеологической модели характерна типизация связей в соответствии с установленными типами адекватностей3.

о Под гносеологической моделью субъекта будем понимать модель области реального мира, которая является результатом процесса познания, выполненного субъектом.

Если для обеспечения информационного поиска использовать гносеологическую модель (как некоторую структуру знаний), то при завершении конкретного этапа информационного поиска (выходе на конкретную метку конкретного понятия4 в структуре знаний) пользователь ПС, организующей информационный поиск, должен получить консультацию по интересующему его вопросу.

■ Третий тезис концепции: Консультация, которая является целью информационного поиска, должна быть вынесена в висячую вершину. Таким образом, к некоторым меткам некоторых понятий (в идеале к каждой метке каждого понятия) гносеологической модели подсоединены висячие вершины с консультациями.

При реализации этого тезиса концепции для области знаний, на которой осуществляется информационный поиск, характерна особенность структуры знаний, отображенная на диаграмме рис. 1.

Полный ответ на поставленный вопрос может быть собран в процессе пошаговой локации по структуре знаний. В этом случае устраняется необходимость выхода на висячую вершину, подсоединенную к какой-либо конкретной метке конкретного понятия. Таким ответом могут быть факты, связанные

3 Доводы в пользу этого утверждения, а также подробности описания гносеологической модели как модели области реального мира приводятся в [2-4]. Признаки различения пяти типов адекватностей повторяются в [5].

4 О множестве меток конкретного понятия в гносе-

ологической модели пояснено в [2-4].

модели, к которой подсоединена висячая вершина

Fig. 1. Tag of concept of gnoseological model, to which the trailing top is connected

с предметом поиска, отраженные на экране монитора, и до достижения конкретного момента не известные пользователю ПС, организующей информационный поиск. К примеру, если конкретный пользователь ПС озадачен вопросом «Присутствует ли конкретный технический узел в конкретном изделии?», а знания, обеспечивающие информационный поиск, составлены на спецификациях изделий, то ответ на вопрос будет получен до выхода на висячую вершину, которая предположительно могла бы содержать этот ответ. Технологии информационного поиска, в которых не применяется третий тезис концепции, в статье не рассматриваются.

В общении двух субъектов не применяется концепция «начинать всякий разговор с верхней пуговицы пиджака собеседника». В традиционных технологиях информационного поиска такая концепция имеет широкое распространение. В какой-то мере это объясняется тем, что движение к любой метке понятия (установка механизма логического вывода в конкретное место структуры знаний) имеет в реализованных ПС, организующих информационный поиск, небольшое число шагов локации по структуре знаний, так как базы знаний небольшие. В качестве примера может рассматриваться надстройка информационно-поисковой системы, где знания даже не отделены от программных блоков. Однако практика создания ПС, организующих информационный поиск, в которых реализуется технология систем, основанных на знаниях, сделала реальностью десятки и сотни шагов локации по структуре знаний (рис. 2).

-ч ПРИКЛАДНАЯ ИНФОРМАТИКА / JOURNAL OF APPLIED INFORMATICS

Vol. 10. No. 4 (58). 2015 '

14216^5^

Рис. 2. Многошаговая локация по структуре знаний для выхода в потребное место структуры Fig. 2. The multistep location of structure of knowledge for an exit in a required place of structure

Если вспомнить, что локация по структуре знаний реализуется применением взаимодействия с ПС на языке типа «меню», то наше утверждение может быть подтверждено следующей цитатой: «Меню может оказаться утомительным и продолжительным по времени, когда анализируются сложные ситуации, так как это может потребовать несколько меню для построения или использования системы, и пользователь должен перемещаться назад и вперед по меню» [6, с. 253]. Отметим также, что применение редактора знаний, доступного массовому пользователю5, приведет к тому, что размеры баз знаний ПС, организующих информационный поиск, значительно возрастут.

Применение в технологии информационного поиска концепции начинать всякое взаимодействие на языке типа меню с одной и той же конкретной точки структуры знаний выдвигает задачу сокращения времени и интеллектуальных резервов человека на многошаговую интерактивную локацию по структуре знаний. Работы по сокращению времени и повышению удобства для человека в интерактивной локации по структуре знаний, выполняемые в настоящее время и пока ожидающие своей реализации, носят характер создания методов улучшения организации труда и кардинально не решают вопрос.

Существенно быстрее и с меньшими затратами интеллектуальных резервов человека выход в конкретное место структуры знаний может быть выполнен с использованием словарей простых и составных имен, а также алгоритмов их применения. В этом случае процедуру выхода в конкретное ме-

сто структуры знаний будем именовать ПИ6. Интуитивно, ориентируясь на косвенные признаки работы механизма информационного поиска в общении с другими субъектами, массовый пользователь готов подтвердить, что информационный поиск — это не более чем чередование выхода в конкретное место структуры знаний (ПИ) и локации по структуре знаний. Ответ на вопрос «Какими методами можно уменьшить потери времени и потери интеллектуальных резервов человека для выхода в конкретное место структуры знаний?» отразим в следующем тезисе концепции:

■ Четвертый тезис концепции: Технология информационного поиска должна быть органичным чередованием процедур ПИ и локации по структуре знаний.

Незначительная часть понятий, находящихся в обороте при общении на естественном языке (около 83 000 понятий), именована уникальным именем, т. е. одним словом. Существенно больше понятий именовано составными именами. Понятия, именованные простыми и составными именами, образуют множество устоявшихся в общении понятий, применение которых позволяет достигать взаимопонимания в общении. Во множестве понятий, составляющих гносеологическую модель, именованных понятий лишь незначительная часть.

В рамках настоящей статьи механизм ассоциирования понятий с сущностями реального мира не рассматривается, однако авторы статьи предлагают признать, что каждое понятие гносеологической модели ассоциируется с сущностью реального мира. Такой сущностью может быть объект, отношение, процесс, явление, событие, факт, законо-

5 О редакторе знаний, доступном массовому пользователю, см. [4].

6 Толкование понятия, которое предлагается именовать «первичной идентификацией», приведено далее.

1QO

Том 10. № 4 (58). 2015

мерность и т. п. То есть все, что существует и выделено как целостная часть реального мира.

Присутствующие в гносеологической модели, неименованные понятия именуются непосредственно в процессе общения. При этом имена неименованных понятий формируются с применением имен именованных понятий и соответствующих связей, содержащихся в гносеологической модели. Информационный поиск, в котором используется все множество понятий гносеологической модели, существенно эффективнее информационного поиска, который базируется только на словарях простых и составных имен. Здесь отметим, что все множество понятий и фактов, составляющих гносеологическую модель (именованных или именуемых непосредственно в процессе общения), востребовано в практике субъекта, а потому может попасть и попадает в процесс общения и соответственно в информационный поиск.

Отметим также, что обстоятельный обзор достижений по созданию эффективной и удобной в применении для массового пользователя технологии информационного поиска, базирующейся только на словарях простых и составных имен, не сможет повлиять на такую оценку эффективности новой технологии информационного поиска. Несколькими словами поясним это утверждение. «С самого начала работ по созданию интеллектуальных систем возникло два вопроса: какова глобальная цель подобных исследований и какова их глобальная стратегия? Является ли их целью познание феномена естественного интеллекта и нужно ли копировать тот путь, по которому шла природа, создавая этот феномен?» [7, с. 6]. «Нам предоставлена возможность не копировать путь, по которому шла природа, создавая этот феномен, а исследовать и моделировать естественный интеллект, получая при этом высокие показатели эффективности в применении данной модели. Интеллектуальное поведение субъекта, модель которого можно получить как результат исследований в научном направлении "Искусствен-

ный интеллект'', содержит методы, приемы и алгоритмы, правильность и целесообразность которых выработана, зафиксирована и подтверждена длительной практикой субъекта, социальной группы людей и человечества в истории его развития. В том числе субъект обладает фрагментами алгоритма, необходимый уровень сложности которых установлен эволюцией субъекта» [8]. Такое обоснование мы предлагаем для очередного тезиса концепции новой технологии информационного поиска.

■ Пятый тезис концепции: ПИ должна базироваться не только на словарях простых и составных имен, но и на модели области реального мира, приближенной к гносеологической модели.

Этот тезис концепции содержит концентрированное выражение научной новизны предлагаемой технологии информационного поиска. В противоположность простоте формулировки тезиса концепции при его реализации ожидаются трудности. И все-таки. «Очевидно, что наука не может стоять на месте. Требование времени изучать живые системы, их неизвестные свойства больше не может откладываться до лучших времен» [12, с. 21].

Характеризуя мировоззрение субъекта (например, мировоззрение конкретного специалиста в области информационных технологий), можно отметить, что восприятие области реального мира субъектом отличается от восприятия той же области реального мира с помощью фотоаппарата или кинокамеры. Субъект анализирует результат восприятия области реального мира только вслед за отработкой некоторого механизма селекции поступающей от органов чувств информации. Об этом механизме селекции с уверенностью можно сказать, что в реальном мире каждый субъект видит задачи, которые умеет решать, и не замечает задач, участие в решении которых не приводит к значительному влиянию на результат решения. События, в которых решаются такие задачи, происходят без сознательного участия конкретного субъекта, а результаты реше-

Vol. 10. No. 4 (58). 2015

ния таких задач принимаются этим субъектом как обстоятельства. С этим обстоятельством мировоззренческого характера необходимо согласиться.

Однако развитие возможностей конкретного субъекта на решение все новых задач повышает четкость видения субъектом области реального мира. Логика суждений по теме настоящей статьи неминуемо приведет к переоценке достижений в вопросах создания технологии эффективного и удобного в применении для массового пользователя информационного поиска. В настоящее время на рынке программных продуктов отсутствуют модели области реального мира, приближенные к модели, названной «гносеологической моделью». Поэтому разработчики ПС не замечают низкий уровень эффективности и удобства в применении для массового пользователя существующих технологий информационного поиска. Это, в свою очередь, сдерживает работы по созданию новой технологии информационного поиска и в частности работы по созданию алгоритмов ПИ.

толкование понятия, которое предлагается именовать Пи

То или иное решение задачи ПИ присутствует в каждой ПС, организующей информационный поиск. ПИ было предложено называть процедуру выхода ПС в конкретное место структуры знаний (конкретное место гносеологической модели) с использованием словарей простых и составных имен, алгоритмов их применения и собственно гносеологической модели. В этом определении понятие, именованное ПИ,соотносится с искусственной сущностью (артефактом), которая к настоящему моменту не создана и потому не может быть избрана для исследования. Предлагается переопределить понятие, именованное ПИ, как понятие, соответствующее некоторой сущности, выявляемой при рассмотрении процесса общения двух субъектов. В этом случае ПИ может быть назван процесс, ведущий к достиже-

нию взаимопонимания сторонами общения при выборе или смене темы общения7.

Поясним это. В общении двух одноязычных субъектов взаимопонимание достигается с первых слов первого произносимого предложения. В момент достижения взаимопонимания будем констатировать завершение процесса ПИ (множественного в каждом акте общения). На основании прошедших событий и достигнутого ранее взаимопонимания ПИ (взаимопонимание в начале сеанса общения, как и взаимопонимание в текущий момент общения) может достигаться и без слов. Однако для создания новой технологии информационного поиска в область исследований поместим общение двух субъектов, специалистов в разных предметных областях (научных направлениях). Таким образом, общение двух субъектов начинается с некоторой процедуры и сопровождается интенсивным применением процедуры, которую будем именовать ПИ.

Отметим также, что завершение процедуры ПИ будем фиксировать в тот момент, когда с применением механизмов логического мышления оба субъекта конкретизировались на понятиях модели области реального мира (у каждого субъекта своя модель), которые ассоциируются субъектами с одной и той же сущностью реального мира. Для собеседника — инициатора темы процедура ПИ предшествует ассоциированию с сущностью реального мира, а завершается эта процедура в момент, когда возникает такое ассоциирование, поэтому идентификация в нашем толковании названа первичной. В новом определении понятие, именованное ПИ, ассоциируется с сущностью реального мира (с натурфактом), которая может быть исследована для выявления алгоритмов процесса ПИ.

Не существует значительных трудностей для исследования сущности, соответству-

7 После исследований ПИ можно будет реализовать ее алгоритмы в конкретной ПС. Механизм логического вывода этой ПС все так же будет обеспечивать выход в соответствующее конкретное место структуры знаний.

Том 10. № 4 (58). 2015

ющей понятию, которое мы именовали ПИ. Однако во множестве публикаций, посвященных вопросам технологии эффективного и удобного в применении для массового пользователя информационного поиска, нет упоминаний об этом понятии (под этим именем или под другими именами) и упоминаний о каких-либо исследованиях сущности, соответствующей этому понятию. Авторы настоящей статьи полагают, что отсутствие исследований сущности, соответствующей понятию ПИ, основано на отсутствии возможности применить механизм ПИ в ПС для информационного поиска из-за отсутствия в компьютерах моделей области реального мира, приближенных к гносеологической модели субъекта.

Создание и массовое тиражирование оболочки с редактором знаний, доступным массовому пользователю (см. об этом [4]), позволяет предположить, что по истечении некоторого времени на рынке ПС появится множество моделей областей реального мира, приближенных к гносеологической модели субъекта. В гносеологической модели8 каждое понятие представлено множеством меток, каждая из которых находится в конкретном месте структуры знаний. В этой связи отметим, что ПИ нацелена не на идентификацию понятия, как это толкуется традиционно. Она нацелена на идентификацию конкретного места структуры знаний, т. е. на идентификацию конкретной метки понятия. В новой технологии информационного поиска (в соответствии с четвертым тезисом концепции) за ПИ следует локация по структуре знаний. Поэтому завершением каждого процесса ПИ будем считать момент, когда с применением механизмов логического мышления оба субъекта конкретизировались на простейших фактах своих моделей области реального мира, которые ассоциируются субъектами с одним и тем же фактом реального мира. Формально это со-

8 Гносеологическая модель может быть охарактеризована как множество определений каждого из множества понятий.

ответствует тому, что оба субъекта в соответствии с темой общения конкретизировались на метках понятия, которые находятся в подобных (субъективно эквивалентных) определениях понятия, соответствующих конкретным местам двух гносеологических моделей (рис. 3). Краткое определение понятия, которое предложено именовать ПИ, может иметь следующую формулировку:

о ПИ — это идентификация в конкретной предметной области метки некоторого понятия, выбранного инициатором темы в качестве предмета суждений.

В дефиниции присутствуют понятия «инициатор темы» и «предмет суждений», применение которых нуждается в предварительном толковании и указаниях для ассоциирования с сущностями реального мира. Толкованию этих и не только этих понятий посвятим следующий параграф.

Модель общения двух субъектов и дефиниции понятий, используемых при описании такой модели

Традиционно общение между субъектами (рис. 4) определяется как обмен мнениями (обмен версиями знаний).

о Инициатор темы — это собеседник, который в конкретный момент времени сообщает другому собеседнику (далее именуемому просто собеседник) конкретный фрагмент знаний.

Конкретный фрагмент знаний, сообщаемый инициатором темы (ограниченный началом и концом), традиционно именуется высказыванием.

Формирование понятия, соответствующего такому фрагменту знаний (такой сущности), и именование этого понятия «высказыванием» связано с особым статусом такого фрагмента знаний. Конец передачи высказывания предусматривает (в неявной форме, а иногда в явной) получение подтверждения, что собеседник понимает инициатора темы. Высказывание своей законченностью и целостностью должно обеспе-

Vol. 10. No. 4 (58). 2015

40 >

> Объекты суждений <

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

> Предметы суждений

to

Q

Понятие, соответствующее

предмету суждений в гносеологической модели субъекта 1 как проявлению объекта суждений

to

Понятие, соответствующее

предмету суждений в гносеологической модели субъекта 2 как проявлению объекта суждений

Рис. 3. Завершение конкретного процесса ПИ — оба субъекта конкретизировались на конкретных

фактах двух гносеологических моделей Fig. 3. Completion of concrete process of II — both subjects were concretized on the concrete facts

of two gnoseological models

чивать идентифицируемость с конкретным фрагментом знаний в гносеологической модели собеседника. Иначе собеседник не подтвердит, что он понимает инициатора темы. Завершается идентификация ассоциированием (осмыслением) высказывания (фрагмента знаний) с конкретной реальностью.

о Высказывание — это передаваемый инициатором темы собеседнику фрагмент знаний, в конце передачи которого предусмотрено подтверждение (в неявной форме, а иногда в явной), что собеседник понимает инициатора темы.

Традиционно декомпозиция высказываний выполняется с выделением предложений, каждому из которых может быть поставлен в соответствие некоторый факт9.

о Предложение — это фрагмент знаний, содержащий завершенное выражение факта (в том числе, возможно, и простейшего факта). В конце передачи предложения ини-

9 В статье толкование понятий «высказывание» и «предложение» соответствует толкованию из грамматики русского языка и не содержит ограничений, принятых в других научных направлениях (в частности, в информатике).

циатором темы собеседнику возможна и выполняется идентификация, которая не требует обязательного подтверждения, что собеседник понимает инициатора темы.

Поясним соответствие каждого предложения некоторому факту. Рассмотрение множества понятий предложения, именованных словами, не позволяет установить смысл (семантику) предложения. Нерезультативным для установления смысла предложения будет и рассмотрение порядка слов в предложении. Более того, предложение может полностью сохранять свой смысл при перестановке слов в предложении. А также полностью изменить свой смысл при сохранении в предложении порядка слов. Чем, все-таки, определяется порядок слов в предложении?

o Сформированный порядок слов в предложении — это предлагаемый инициатором темы порядок идентификации понятий для идентификации факта, содержащегося в предложении.

Отметим, что подтверждение истинности это утверждение получит далее. Понятия (именованные словами/терминами) в предложении определены другими понятиями

136

ПРИКЛАДНАЯ ИНФОРМАТИКА / JOURNAL OF APPLIED INFORMATICS x-

' Том 10. № 4 (58). 2015

Субъект 1

Субъект

Рис. 4. Общение между субъектами Fig. 4. Communication between subjects

и определяют другие понятия. Сохранение смысла обеспечивается сохранением порядка определяемости. Порядка, в котором одно понятие (в предложении присутствующее своим именем, т. е. конкретным словом) определено другими понятиями (в предложении присутствующими своими именами, т. е. конкретными словами). Таким образом, смысл предложения содержится в конструкции, в которой одни понятия определены через другие.

о Под конструкцией будем понимать целостный фрагмент орграфа, возможно, сетевой структуры. Фрагмент орграфа может быть признан целостным, если между любыми двумя его узлами существует полупуть10.

Рассматривая каждую пару слов в однородной ориентации11 определимости одного понятия другим, выявляем существование таких связей (адекватность второго типа12) и отражаем в конструкции предложения. Перестановка слов в предложении без изменения порядка определимости понятий, составляющих предложение, не меняет конструкцию предложения (не меняет семантику предложения). В основе распознавания конструкции предложения находится выяснение того, какими понятиями предложения, именованными словами, определяется понятие в предложении, именованное словом. То есть установление связей по адекватности второго типа между понятиями предложения, именованными словами.

10 Полупуть в ориентированном графе GО — это последовательность вершин v0, V,, ..., Vп такая, что V, ^ V,+1 или V/ ^ V,+1 для любого /, если / + 1 существует (см. об этом [9, с. 233]).

11 Толкование понятия, именуемого однородной ориентацией, см. в [4].

12 Толкование понятия, именуемого адекватностью второго типа, см. в [4].

о Конструкция предложения — это орграф, в котором присутствуют все понятия, представленные в предложении своими простыми или составными именами. Каждое понятие в конструкции определено другим(и) понятием(ями) и/или определяет другое(ие) понятие(я).

В нескольких словах охарактеризуем процесс выявления факта, соответствующего предложению. Слова структурированы. При единстве корня слова могут иметь разные приставки, суффиксы и окончания. Тем самым слова содержат в себе различные смысловые оттенки. Отметим только, что смысловые оттенки, содержащиеся в словах предложений, накапливаются уже на стадии распознавания слов и фиксируются в оперативной базе сеанса общения, сохраняемой до конца беседы. Это позволяет использовать элементы этой базы (как протокола беседы) для выявления факта, соответствующего предложению. Другими словами, смысловые оттенки: род, число, время, части предложения (подлежащее, сказуемое, определение) — это подсказки для распознавания конструкции предложения. Именно эти подсказки помогают устанавливать порядок определимости одних понятий другими. Отметим также, что смысловые оттенки, накладываемые на слова, — это условность, которая принята априори и не может подвергаться пересмотру. Тем самым утверждается, что грамматика — это условность (артефакт), который обобщает практику общения и отражает ее динамику (историю развития).

о Факт, поставленный в соответствие конкретному предложению, — это некоторый фрагмент структуры знаний, в котором узлы соответствуют именованным понятиям.

Характеристику целостности предложения и соответствующего ему факта можно сформулировать в следующем виде: «Между

Vol. 10. No. 4 (58). 2015

любыми двумя узлами структуры знаний (понятиями, соответствующими факту) существует полупуть». Декомпозиция факта позволяет выделить простейшие факты, каждый из которых состоит из объекта и предмета, соединенных ориентированной связью. Простейший факт может быть определен как составная часть определения: «Центральное в определении понятие (объект суждений), а также связанное с одним из его проявлений (предмет суждений) вместе составляют простейший факт». Предмет суждений как проявление объекта суждений — это то, что в гносеологической модели находится на границах объекта суждений, где-то совсем рядом с объектом суждений. В противном случае в гносеологической модели нет сведений о предмете суждений, относящемся к объекту суждений.

Используя понятия, дефиниции которых мы привели, подробнее рассмотрим модель общения двух субъектов. Любой сеанс общения начинается с выбора темы общения одним из собеседников — инициатором темы. Выбор темы общения и соответственно процесс ПИ могут быть многократно инициированы за один сеанс общения как одной, так и другой стороной общения. Беседа в своем развитии может уйти далеко от первоначально избранной темы. К тому же всякий сеанс беседы содержит многократную смену темы. В ситуации, когда подряд следует несколько высказываний без смены темы общения, ПИ при поступлении очередного высказывания способствуют результаты ПИ, получаемые после поступления предыдущих высказываний.

■ Шестой тезис концепции: Процесс ПИ будем рассматривать при выборе или смене темы общения, когда ничего, кроме самого высказывания, не может способствовать осмыслению этого высказывания.

В конкретный момент беседы один из собеседников выступает в роли инициатора темы. Он выбирает тему, формулирует высказывание и при этом прогнозирует его целостность и законченность (т. е. положительный результат осмысления высказыва-

ния собеседником). Инициатор темы произносит высказывание и передает слово (инициативу в беседе) собеседнику (ведомому в беседе субъекту). Конечно же, высказывание может быть составлено из нескольких предложений, каждому из которых соответствует некоторая конструкция, узлами такой конструкции приняты именованные понятия. При именовании понятий составными именами каждое имя — это также некоторая конструкция, узлами которой приняты слова. Алгоритмы выделения группы слов из предложения для признания их составным именем того или иного конкретного понятия также нуждаются в исследовании. Применение инициатором темы высказывания, составленного из нескольких предложений, и применение предложений (фактов), каждое из которых составлено из нескольких простейших фактов, требует сложной (интегральной) процедуры ПИ. Отметим также, что в практике общения наблюдаются ситуации, когда понятия «объект суждений» или «предмет суждений» не содержатся в предложении в явном виде. Примеры: 1) Готовимся и отвечаем; 2) Пришел, увидел, победил; 3) Тургенев и его творчество; 4) Вечерело.

■ Седьмой тезис концепции: В рамках настоящей статьи алгоритмы ПИ будем исследовать только для ситуации, когда высказывание состоит из одного предложения и содержит только один простейший факт, который и определяет тему.

Таким образом, принятое к рассмотрению предложение соответствует одному простейшему факту и фактически содержит два имени. Каждое из них может быть как простым, так и составным. Ориентированная связь между этими именами присутствует неявно и выявляется с применением условностей грамматики. Важно подчеркнуть, что алгоритмы ПИ (как натурфакта) в полной мере могут быть выявлены только при рассмотрении высказывания, составленного из нескольких предложений, каждое из которых может соответствовать не простейшему факту. Однако исследования в этом направлении могут быть инициированы только

Том 10. № 4 (58). 2015

на базе опыта исследований, в которых высказывание принимается состоящим из одного предложения, которое, в свою очередь, соответствует простейшему факту.

Сформулируем еще один тезис концепции новой технологии информационного поиска. При выборе или смене темы общения (в том числе на момент начала всякого сеанса общения) один субъект (одна сторона общения) является инициатором темы (назначающим тему общения) ведущей стороной общения. Второй субъект (вторая сторона общения) является ведомой стороной, выполняющей ПИ (осмысляющей высказывание, полученное от инициатора темы, т. е. распознающей тему общения). В общении человека с ПС, организующей информационный поиск, для новой технологии информационного поиска предлагается принять неизменное распределение ролей.

■ Восьмой тезис концепции: В новой технологии информационного поиска ПС не принимает активную позицию в общении с человеком, т. е. не исполняет роль инициатора темы. ПС исполняет только роль собеседника — инициатора темы, т. е. всегда выполняет операцию ПИ.

динамичность предметной области в общении, а также словарей простых и составных имен

«По мере развития науки создается все больше и больше отдельных, четко выкристаллизовавшихся специфических языков науки. Это облегчает обмен информацией в пределах узких областей знаний, но затрудняет взаимное понимание в смежных разделах науки» [10, с. 146]. Рассмотрение общения субъектов, являющихся специалистами в разных предметных областях (научных направлениях), для поиска алгоритмов ПИ с последующим применением этих алгоритмов в новой технологии информационного поиска вполне обоснованно. Так как потребность в информационном поиске всегда ориентирована на область знаний малоисследованную, подвергающуюся непрерыв-

ной интенсивной актуализации (в том числе пополняемую новыми знаниями). Терминология этой области знаний подвергается непрерывной интенсивной актуализации.

Эффективность механизма ПИ во многом зависит от применяемых словарей простых и составных имен. Актуализация имен понятий в соответствии с существующими в обществе тенденциями их развития для практики общения выполняется каждым человеком. Единожды сформированные словари простых и составных имен со временем устаревают. При формировании составных имен непосредственно в процессе общения к окружению именуемого понятия применяются некоторые правила. Во избежание ограничений на правила формирования составных имен, в конечном счете, во избежание ограничений на многообразие составных имен модель знаний не должна иметь искусственных ограничений по структуре, как это имеет место в моделях знаний традиционных классов, в отличие от гносеологической модели.

Значительное повышение эффективности механизма ПИ может быть получено, если состав словарей, а также правила формирования составных имен будут активно подстраиваться к потребностям конкретной группы пользователей на этапе эксплуатации ПС. Необходима адаптируемость словарей простых и составных имен. Словари простых и составных имен должны пополняться и актуализироваться вместе с пополнением и актуализацией знаний в базе знаний предметной области, а также с привлечением новых пользователей к поисковой системе и развитием терминологии их общения, в том числе с развитием предметной области и развитием знаний пользователей о предметной области.

Алгоритмы процедур процесса общения (алгоритмы формирования предложений и алгоритмы процедуры ПИ), словари простых и составных имен, а также классификатор именованных понятий находятся в состоянии непрерывного стремления к устойчивости, т. е. непрерывно подвергаются типиза-

Vol. 10. No. 4 (58). 2015

ции13. Так, например, множество алгоритмов ПИ состоит из небольшого подмножества доминантных и субъективных алгоритмов, которые могут выбираться для исполнения в зависимости от ситуации, характеризующей общение в конкретный момент времени. Поэтому естественно стремление программистов создать язык взаимодействия с ПС, который будет отражать те достижения, которые типизация имеет на сегодняшний день. Тем самым программист вынуждает пользователя ПС изучить еще один специализированный язык взаимодействия с ПС.

Языки взаимодействия с ПС различают по уровню приближения к естественному языку, на котором два субъекта общаются между собой. Выполняемое человеком (программистом) непрерывное совершенствование языка интерактивного взаимодействия, а для массового пользователя изучение новых языков, по мнению авторов, является тупиковым решением. Потребность в общении между субъектами (обмене знаниями) возникает в областях, находящихся за гранью известного, а нередко и за гранью исследованного. Достижения типизации облегчают взаимопонимание в общении, но повышают востребованный уровень сложности алгоритмов формирования и алгоритмов распознавания предложений. Это сдерживает возможности выражения в общении того нового, что является объектом и предметом внимания инициатора темы.

Непрерывная актуализация словарей простых и составных имен как работа нетворческая, своей рутинностью подобная транзакции, должна быть передана компьютеру. В этом случае компьютер не должен навязывать человеку известные ему имена понятий, а также не должен участвовать в разрешении противоречий между пользователями по вопросам именования понятий. Компьютер не должен удалять устаревшие имена, а должен принимать все варианты имен каждого конкретного понятия.

13 Толкование понятия, именуемого термином «типизация», см. в [4].

В связи со сложностью проектирования программного блока ПИ и востребованностью такого программного блока в каждой ПС, организующей информационный поиск, возникает вопрос о необходимости проектирования одновариантного программного блока ПИ. Такой программный блок может входить составной частью в каждую ПС, организующую информационный поиск. После включения в состав ПС блок ПИ должен адаптировать словари к предметной области (как на этапе проектирования, так и на этапе эксплуатации ПС, организующей информационной поиск) и условиям эксплуатации информационной системы, а также адаптировать словари к динамике пользователей этой системы и динамике терминологии предметной области.

Продолжение в следующем номере. Список литературы

1. Соловьев В. Д., Добров Б. В., Иванов В. В., Лукашевич Н. В. Онтологии и тезаурусы. Учебное пособие. Казань; М., 2006.

2. Данчул А. Н., Новиков А. П. Представление знаний о предметной области на основе гносеологической модели // Информационные технологии. 2009. № 10. С. 44-50.

3. Данчул А. Н., Новиков А. П. Анализ проблемы представления знаний о предметной области // Автоматизация в промышленности. Материалы 3-й Научной конференции в Институте проблем управления РАН. Июнь 2009 года. Москва. С. 92-112.

4. Новиков А. П. Организация сетевых структур знаний, поддерживающая их редактирование: дисс.... на соиск. уч. ст. канд. техн. наук по специальности 05.13.11. Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей. М.: МГТУ МИРЭА, 2012.

5. Болотова Л. С, Данчул А. Н., Новиков А. П., Никишина А. А. Организация многонаправленно-сти иерархического подъема (спуска) и локация по структуре неоднородных знаний // Прикладная информатика. 2014. № 1 (49). С. 107-113. № 2 (50). С. 18-31.

ПРИКЛАДНАЯ ИНФОРМАТИКА / JOURNAL OF APPLIED INFORMATICS /-

' Том 10. № 4 (58). 2015

6. Абдикеев Н. М. Проектирование интеллектуальных систем в экономике. Учебник. М.: Экзамен, 2004.

7. Эндрю А. Искусственный интеллект / пер. с англ. В. Л. Стефанюка; под ред. Д. А. Поспелова. М.: МИР, 1985.

8. Болотова Л. С., Смольянинова В. А., Новиков А. П., Никишина А. А. Практическая значимость результатов исследований в научном направлении «Искусственный интеллект» // Прикладная информатика. 2013. № 4 (46). C. 114-128.

9. Харари Ф. Теория графов / под ред. Г. П. Гаври-лова. М.: МИР, 1973.

10. Налимов В. В. Вероятностная модель языка. М.: Наука, 1974.

11. Болотова Л. С., Новиков А. П., Никишина А. А. Интеграция результатов исследований научного направления «Искусственный интеллект» // Прикладная информатика. 2013. № 5 (47). С. 125-136.

12. Пивоваров О. Н., Пивоваров И. О., Кудрина Л. И. Природа живых систем. М.: НИА-При-рода, РЭФИА, 2002. — 144 с.

13. Мороз О. Заколдованный круг // Пути в незнаемое. Сборник XIII. М.: Советский писатель, 1977.

References

1. Solov'ev V. D., Dobrov B. V., Ivanov V. V., Luka-shevich N. V. Ontologii i tezaurusy: Uchebnoe po-sobie [Ontologies and thesauruses Manual: Tutorial]. Kazan', Moscow, 2006.

2. Danchul A. N., Novikov A. P. Predstavlenie znanii o predmetnoj oblasti na osnove gnoseologiches-kojmodeli [Representation of knowledge of subject domain on the basis of gnoseological model]. Infor-macionnye tehnologii — Information technologies, 2009, no. 10, рр. 44-50.

3. Danchul A. N., Novikov A. P. Analiz problemy pred-stavleniya znanii o predmetnoj oblast [The analysis of a problem of representation of knowledge of subject domain. Automation in the industry]. Ma-terialy 3-j Nauchnoj konferencii «Avtomatizatsiya v promyshlennosti» v Institute problem upravleniya RAN. [Materials of the 3rd Scientific conference «Automation in the industry» at Institute of problems of management of the Russian Academy of Sciences]. Moscow, 2009, рр. 92-112.

4. Novikov A. P. Organizaciya setevykh struktur znanii, podderzhivayushchaya ikh redaktirovanie. Diss. Cand. Techn. Nauk [Organization of network structures of knowledge supporting their editing Diss. cand. tekhn. sci]. Moscow, MGTU MIREA Publ., 2012, pp. 176.

5. Bolotova L. S., Danchul A. N., Novikov A. P., Ni-kishina A. A. Organizaciya mnogonapravlennos-ti ierarhicheskogo podema (spuska) i lokaciya po strukture neodnorodnykh znanii /Organization of a multiorientation of hierarchical rise (descent) and a location on structure of non-uniform knowledge]. Prikladnaya Informatika — Applied Informatics, 2014, no. 1 (49), pp. 107-113 and no. 2 (50), pp. 18-31.

6. Abdikeev N. M. Proektirovanie intellektual'nykh sistem v e'konomike: uchebnik. Rossiiskoi e'konomicheskoi akademii im. G. V. Plehanova [Design of Intellectual Systems in Economy: tutorial of the Russian economic academy of G. V. Ple-khanov]. Moscow, Ekzamen Publ., 2004.

7. Andrew A. Iskusstvennyi intellekt [Artificial intelligence]. Russ. ed.: E'ndryu A. Moscow, MIR Publ., 1985.

8. Bolotova L. S., Smol'yaninova V. A., Novikov A. P., Nikishina A. A. Prakticheskaya znachimost' rezul'tatov issledovanii v nauchnom napravlenii «Iskusstvennyi intellekt» [Prakticheskaya the importance of results of researches in the scientific direction «Artificial intelligence»]. Prikladnaya Informatika — Applied Informatics, 2013, no. 4 (46), pp. 114-128.

9. Harari F. Teoriya grafov [The theory of counts]. Russ. ed. G. P. Gavrilova. Moscow, MIR Publ., 1973.

10. Nalimov V. V. Veroyatnostnaya model' yazyka [Probabilistic model of language]. Moscow, Nau-ka Publ., 1974.

11. Bolotova L. S., Novikov A. P., Nikishina A. A. Inte-graciya rezul'tatov issledovanii nauchnogo naprav-leniya «Iskusstvennyiintellekt» [Integration of results of researches of the scientific direction «Artificial intelligence»]. Prikladnaya Informatika — Applied Informatics. Moscow, 2013, no. 5 (47), pp. 125-136.

12. Pivovarov O. N., Pivovarov I. O., Kudrina L. I. Priro-da zhivykh sistem. [Nature of livinge systems]. Moscow, NIA-Priroda, REFIA Publ., 2002, p. 144.

13. Moroz O. Zakoldovannyi krug. Puti v neznaemoe: Sbornik [Vicious circle. Ways to the neznayemy: collection]. Moscow, Sovetskiy Pisatel' Publ., 1977.

Vol. 10. No. 4 (58). 2015

L. Bolotova, Moscow State Technical University of Radioengineering, Electronics and Automation, Moscow, Russia, lubolotova@mail.ru,

A. Danchul, Moscow City university of management of the Moscow Government. Chair of informational technologies in management, Moscow, Russia, adan51@yandex.ru

A. Novikov, Department of Education of the city of Moscow, Russia, alpnovikov@yandex.ru M. Surkhaev, The Dagestan teacher training university, Makhachkala, Russia, surhaev@mail.ru A. Nikishina, Elster Metronica (Elster Group Company), Applicant, Department of Automated Control Systems, National University of Science and Technology «MISiS», the City of Moscow, Russia, anikishina@gmail.com

Initial identification in technology of informational search (part 1)

This article is devoted to a problem of creation of the program systems (PS) organizing the information search (IS), and providing high rates of efficiency for the mass user (not the expert in the field of informational technologies). Researches weren't limited by the review of achievements in practice of creation PS_IS, and also in the corresponding scientific and engineering disciplines. The subject of researches is the process of achievement of mutual understanding in communication between two subjects. Such researches completely correspond to the character of researches in the scientific direction of artificial intellect. It points out the essence which allocates from the process of communication between subjects, and it is explained the concept corresponding to it and it is offered to call «initial identification». Consideration of process of initial identification allowed to reveal the main contradiction in a problem of creation PS_IS. In the process of communication (and respectively in IS) the subject operates with all known set of concepts and uses thus as gained recognition (simple or compound) names of concepts, and the names formed directly in the course of communication. However in a natural language only 83.000 concepts are called by simple unique names (in a word). Compound names called incomparably more concepts, they make only insignificant part of concepts with which the subject operates in communication. Thus, the dominating part of algorithms of II is connected with application of quickly named concepts.

It is shown that process of an operational name is feasible only with use of the model of knowledge approached to gnoseological model. And it is also specified that after some time in computer systems emergence of such models of knowledge is possible.

For the new technology of IS the organization of access of each concrete tag of a concrete concept to its names in base of names is offered. That makes a basis of the organization of base of simple and compound names. Also other characteristics of the organization of the dictionary at triune essence are provided.

Such concept as»construction of sentence» is offered for a broad use in scientific practice interpretation of which corresponds to interpretation of the concept «sense of the sentence» with explanations, which allow to draw sense from sequence of alphanumeric symbols.

A great place in this work takes consideration of algorithms of formation and recognition of sentences (that is II). Many situations of II suspension are revealed and described. It is noted that completeness of such situations, and also algorithms of permission of the concrete situations and scenarios of interactive interaction providing finishing II up to the end make the essence of works on formation of the specification on design of PS realizing new technology of IS.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

In conclusion it is pointed out that the declared subject due to its scale can't be opened in one article in details (scrupulously) to conform to requirements to the specification on creation of II. It is important that the complete picture of new technology of IS is given in article and feasibility of such technology is shown.

Keywords: informational search, efficiency of informational search, triune essence, initial identification, a location in structure of knowledge, names of concepts, dictionaries of simple and compound names, construction of statement, judgment (association with essence of the real world).

About authors: L. Bolotova, Dr of Engineering, Professor; A. Danchul, Dr of Engineering, Professor; A. Novikov, PhD in Engineering; M. Surkhaev, Dr of Pedagogical Sciences, Professor; A. Nikishina, Senior Engineer

For citation: Bolotova L., Danchul A., Novikov A., Surkhaev M., Nikishina A. Initial identification in technology of informational search. Prikladnaya Informatika — Journal of Applied Informatics, 2015, vol. 10, no. 4 (58), pp. 128-142 (in Russian).

i Надоели баннеры? Вы всегда можете отключить рекламу.