Научная статья на тему 'Поиск объектов различных типов по нескольким признакам на основе сортировки'

Поиск объектов различных типов по нескольким признакам на основе сортировки Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
302
61
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СХЕМА / ПОИСК / SCHEME / SEARCH

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Белоконова Светлана Сергеевна

Описана схема детерминированного поиска на основе сортировки данных различных типов одновременно по нескольким маскам. Метод обладает параллелизмом в силу максимальной параллельности сортировки и параллелизма обработки отдельно взятых фрагментов. Поиск конструируется как идентификация с помощью сортировки экстремальных элементов числовой последовательности, сопоставленной просматриваемым фрагментам, файлам или группам объектов.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Белоконова Светлана Сергеевна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

SEARCH OF OBJECTS OF VARIOUS TYPES IN SEVERAL SIGNS ON THE BASIS OF SORTING

The scheme of the determined search on the basis of sorting the given various types simultaneously on several masks is described. The method possesses parallelism by virtue of the maximal parallelism of sorting and parallelism of processing of separately taken fragments. Search is designed as identification by means of sorting extreme elements of the numerical sequence compared looked through fragments, files or groups of objects.

Текст научной работы на тему «Поиск объектов различных типов по нескольким признакам на основе сортировки»

УДК 681.3.06: 681.323 (519.6)

С.С. Белоконова

ПОИСК ОБЪЕКТОВ РАЗЛИЧНЫХ ТИПОВ ПО НЕСКОЛЬКИМ ПРИЗНАКАМ НА ОСНОВЕ СОРТИРОВКИ

Описана схема детерминированного поиска на основе сортировки данных различных типов одновременно по нескольким маскам. Метод обладает параллелизмом в силу максимальной параллельности сортировки и параллелизма обработки отдельно взятых фрагментов. Поиск конструируется как идентификация с помощью сортировки экстремальных элементов числовой последовательности, сопоставленной просматриваемым фрагментам, файлам или груп.

Схема; поиск

S.S. Belokonova

SEARCH OF OBJECTS OF VARIOUS TYPES IN SEVERAL SIGNS ON THE

BASIS OF SORTING

The scheme of the determined search on the basis of sorting the given various types simultaneously on several masks is described. The method possesses parallelism by virtue of the maximal parallelism of sorting and parallelism of processing of separately taken fragments. Search is designed as identification by means of sorting extreme elements of the numerical sequence compared looked through fragments, files or groups of objects.

Scheme; Search.

Введение и постановка вопроса. Проблем а поиска, сбора и обработки информации принадлежит к числу основных задач информатики. Ее актуальность возрастает с ростом объема информации в электронном виде, с ростом ресурсов, доступных в сети Internet. Особую актуальность приобрели вопросы, связанные с поиском и распознаванием оцифрованной информации различного формата и типа данных, включая текстовую, графическую, аудио- и видеоинформацию. Существующие методы и подходы не вполне обеспечивают точ-, , мере поиск с распознаванием. В частности, это относится к поиску данных раз.

Оператор локализации экстремальных элементов последовательно. -

мой сортировки по ключу, сохраняющей на выходе входные индексы упорядо-, . из таких сортировок представляет собой разновидность сортировки подсчетом,

( ).

i -й строки и j -го столбца МС находится результат сравнения элементов c[i] и c[j] , отмечаемый знаком « + », если c[i] < c [ j ] , знаком «- », если c[i] > c [ j ] , знаком « 0 », если c[i] = c[j] . j - -

, , j -

. k j -

отсортированном массиве: cl[]:= c[j], с тем же индексом запоминается входной

номер переставленного элемента: e[k]:= j . Дополнительной составляющей схемы поиска является оператор локализации экстремальных элементов. Локально минимальный элемент массива (в дальнейшим - минимум) определяется как элемент меньший предшествующего и не больший последующего по отношению «<=». Оператор локализации минимумов последовательности из n эле ментов имеет вид

j:=1; while j<= n do begin

FOR L:=1 TO j-1 do if abs(e[j]-e[j-L])< = eps then goto 22; Writeln (' ',c[e[j]],' ',e[j]);

22: j:=j+1; end;

Присоединение к процедуре сортировки оператора локализации минимумов влечет программную идентификацию всех локально минимальных элементов входного массива в окрестности радиуса eps. При этом eps задается априори и произвольно фиксировано. Аналогично могут быть идентифицированы локальные максимумы [1,2], с изменением знака неравенства на противоположный - глобальные экстремумы [1]. На основании параллелизма сортировки экстремумы идентифицируются по максимально параллельной схеме.

Поиск объектов различных типов одновременно по нескольким признакам. Исходная (мультипликативная [1,2]) схема строится следующим образом. Исследуемой строке сопоставляется одномерный числовой массив, количество элементов которого совпадает с количеством слов заданной строки. Элементы сопоставленного числового массива, соответствующие различным , , , произведения взаимно однозначно соответствовали различным маскам, а

локальные минимумы в их последовательности единственным образом

. Sl

числового массива c = (c1,c2 cm ) выполняется по соотношениям:

j +1, если i -е слово совпадает

с j — й маской поиска ,1Ч

(1)

j +1 + n, если i — е слово не совпадает с j — й маской поиска При этом индексы элементов c[i] совпадают с индексами элементов S7[i]. К отсортированному массиву c применяется оператор локализации минимумов. Если локализация минимума выполняется в окрестности наперед заданного , , окажется искомое сочетание одновременно нескольких масок. Тем самым можно вести поиск не по разрозненному сочетанию нескольких масок, а по их взаимосвязанному положению в исследуемом массиве слов.

Мультипликативная схема [1,2] позволяет выполнить поиск объекта в том , -лежит одному типу данных. В частности, слово исследуемого текста может совпадать не более, чем с одной маской. С целью видоизменения поиска для объектов различных типов мультипликативная схема поиска модифицируется сле-.

Пусть дан массив S7 из m слов, в котором требуется выполнить поиск по заданной последовательности из n масок M = (,m2,...,mn), расположен-

ci = П aj,

j=1

ных в определенном и фиксированном порядке. На первом шаге массиву слов S7 сопоставляется двумерный числовой массив mass[n,m], где n - число масок

, m - . mass -

. m1 .

, i =1 , i -

m1 . i - S7

m1 , mass[1, i] 1, -

0. i 1 переход к следующему слову. Процесс продолжается, пока не будут

просмотрены все слова исследуемого массива. Второй проход повторяет , , m2 .

n S7

массив mass[n, m]:

[1, если i — е слово совпадав т с j — й маской по иска, (2)

mass [ j, i] = <

[0, если i — e слово не совпадает с j — й маской поиска .

В (2) и ниже i = 1,2,...,m, j = 1,2,...,n.

(2) -

ется промежуточный двумерный массив mass1:

Затем путем перемножения элементов столбцов (3) формируется одномерный массив с:

Изложенную схему можно следующим образом перевести в схему поиска по совпадению с множеством признаков или свойств. С помощью соотношений (3), (4) массив (2) переводится в одномерный числовой массив при условии, что при каждом i исследуемому объекту с номером i соответствует i -й стол-mass , . -

mass -

ветствия исследуемого объекта заданному признаку при фиксированном порядке обхода объектов [1].

Конструкция используется для идентификации объектов одновременно различных типов или, в более общем случае, объектов, характеризуемых свойствами различной природы. Схема имеет то ограничение, что каждый объект может удовлетворять не более чем одному признаку (ниже «признак» и «свойство» - ).

Схема видоизменяется для объектов, обладающих набором свойств.

Каждому объекту с заданным набором признаков следующим единственным образом сопоставляется числовое значение.

Пусть дано проиндексированное множество V из m однотипных объ-

,

n признаков M = (, m2,..., mn), расположенных в определенном

если mass [ j, i] = 1, если mass [ j,i] = 0.

(3)

n

ct = П mass1[ j, i].

(4)

фиксированном порядке. Как и прежде, формируются массивы mass, massl и c,

(2), (3) (5), (6):

1, если i —иооъект соответствует

где p - конечная последовательность из 2n упорядоченных простых чисел

знаков, присущих объекту V[/], и сопоставленным числом ф]: значение ф] по теореме о простых числах единственным образом разложимо на простые множители, по этому разложению данное число обратимо указывает на те признаки (5), которыми обладает объект соответственно простым сомножителям mas's1[j,/] из (6).

Каждому набору признаков, присущих объекту, соответствует единственное значение произведения элементов столбца, образующее элемент сопоставленной числовой последовательности (4).

Числовые идентификаторы наборов признаков могут быть априори рас,

. с (4)

, -

фицирует индексы искомых объектов по аналогии с тем, как идентифицируются индексы слов, совпадающих с масками поиска [1,2].

На основе совпадения индексов числового массива и массива исходных объектов выполняется переход от числовых экстремумов к искомым объектам в .

,

, .

может вестись по совпадению с такими числовыми значениями в

.

Поиск на этой основе может выполняться не только по полному набору , . -стности локализованных минимумов можно идентифицировать не только один , .

Пример 1. Среди изображений фрагментов кардиограмм на рис. 1

(

V = (/1,¥2,...,¥7)) указать те, которые удовлетворяют признакам:

1. Преобладание в рИЕ-комплексе Я-зубца над 8-зубцом.

2. ( между Я-зубцами более 10%).

3. Средняя частота сердечных сокращений в пределах нормы (60-90 ударов в

mass[ j, i] = -

j - ,

(5)

G, i -

j - ,

p[ Л mass[ j, i] = 1,

p [ j + n], если mass[j, i] = G,

(б)

(2, 3, 5,...). Имеет место взаимно однозначное соответствие между набором при-

).

V V V

4 у 5 у 7

Рис. 1. Фрагменты кардиограмм

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

По соотношению (5) на первом шаге массиву V сопоставляется двумерный массив mass. Первоначально каждый элемент этого массива равен нулю. Затем в каждом объекте V- (- = 1,2,...,7 ) проверяется наличие каждого признака. Если i -я кардиограмма отвечает j -му признаку, то элементу mass [ j, i] присваивается 1, иначе 0. Массив mass примет вид

Таблица 1

Вид модифицированного массива mass

Vi V2 V3 V4 V5 V6 V7

m1 1 1 0 1 1 0 1

m2 0 1 1 1 1 0 1

m3 l 1 1 0 1 0 0

Образование массива massl и одномерного числового массива С в соответствии с (4), (6) иллюстрирует табл. 2.

Таблица 2

Сопоставление модифицированных массивов massl и с массиву mass

V V2 3V V4 V5 V. V7

m1 2 2 7 2 2 7 2

m2 11 3 3 3 3 11 3

m3 5 5 5 13 5 13 13

массив С 110 30 105 78 30 1001 78

По построению схемы (4) - (6) глобально минимальный элемент соответствует объекту, обладающему всеми искомыми свойствами, глобально максимальный - объекту, не обладающему ни одним свойством. Иные числовые идентификаторы указывают объекты с частью признаков.

В массиве с идентифицируются экстремумы. Поскольку искомый объект удовлетворяет одновременно всем условиям поиска, то требуется найти гло-

бально минимальный элемент. Достаточно найти локально минимальный элемент, равный 30 (значение априори рассчитано и совпадает с глобальным минимумом). Локально минимальные элементы, равные 30, идентифицируются с индексами 2 и 5. Следовательно, искомые объекты на рис. 1 идентифицируются по номерам 2 и 5. Все остальные промежуточные значения соответствуют объ-

, .

(4) - (6) , -

торых различны между собой. В качестве примера можно взять поиск каталога, содержащего файлы различных типов. Каталог рассматривается как объект, искомый в нем файл - как признак поиска. Каталог с такими признаками иденти-(4) - (6),

к файлам различного типа, если типы совместимы или могут быть приведены к одному типу в операционной системе, например, *.1x1, *^рг, *.раБ, *.х1б, *^ос. Для реализации поиска объектов, которые не приводятся к одному и тому же типу, например, *^а1, *.Ъшр, *.jpg, предлагается описываемая в дальнейшем . , -мер, текстовый файл *.1x1, непосредственно содержащий текст исследуемого файла, графические файлы *.Ьшр, содержащие внедренные в исследуемый файл рисунки, типизированный файл *^а1, который содержит все числовые значения, присутствующие в данном файле и т.д. Поиск в исходном файле сводится к поиску в файлах сопоставленной группы. Каждая группа рассматривается как объект со многими признаками поиска, а наличие или отсутствие в объекте файла, соответствующего маске поиска, как признак объекта для его идентификации.

, . -

(4) - (6),

позволяет свести поиск к идентификации локальных экстремумов числовой последовательности и в этом сравнительно общем случае.

Поиск в файлах *^а1 заданного числового значения с точностью до eps1 можно выполнить на основе схемы поиска элемента в числовом массиве с заданной границей погрешности. Информация из типизированного числового файла считывается в числовой массив с сохранением порядка следования элементов. Далее без изменений применяется схема, описанная в [1]. Схема обобщается на поиск самих типизированных числовых файлов по признаку наличия в нем заданного числового значения с допустимой границей погрешности. С целью поиска файлов типа *.Ьшр каждому файлу (предполагается, что файл содержит только один рисунок) сопоставляется вектор распознавания. Этот вектор можно сформировать на основе какой-либо известной схемы. Если вектор сформирован, то для текущего рисунка находится норма разности между вектором исследуемого рисунка и эталонным вектором. Рисунок считается найденным, если норма разности соответственной пары векторов не превосходит заданной границы по.

В [1] доказаны следующие утверждения.

Предложение 1. Массив с единственным образом идентифицирует изо.

1. .

С некоторыми ограничениями схема распространяется на поиск числовых, , . изложенный подход обобщается на поиск объектов одновременно нескольких произвольных типов, если эти типы реализованы в языке программирования [1].

Таким образом, изложена схема поиска по нескольким маскам объектов различных типов, при этом схема совмещает поиск с распознаванием.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Белоконова С.С. Разработка и исследование схем детерминированного поиска на основе сортировки с приложением к идентификации оцифрованных объектов различных типов / Автореферат диссертации на соискание ученой степени кандидата технических наук. - Таганрог: Изд-во ТТИ ЮФУ. - 2007. - 20 с.

2. Ромм Я.Е., Белоконова С.С. Схема поиска данных различных типов по не-

// . -регион. Техн. науки. Специальный выпуск «Математическое моделирование и компьютерные технологии». 2006. - С. 3 - 8.

Белоконова Светлана Сергеевна

Таганрогский государственный педагогический институт E-mail: belokonova@mail.ru

347936, г. Таганрог, ул. Инициативная, д. 48. Тел: 88634 60-18-99

Belokonova Svetlana Sergeevna

Taganrog State Pedagogical Institute E-mail: belokonova@mail.ru

48, Initsiativnaia, Taganrog, 347936. Phone: 88634 60-18-99

УДК 539:620.179.16

E. С. Огурцов

ИССЛЕДОВАНИЕ КОМБИНИРОВАННЫХ ЭЛЕКТРОДИНАМИЧЕСКИХ ВЕТРОГЕНЕРАТОРОВ С ВЕРТИКАЛЬНОЙ ИЛИ ГОРИЗОНТАЛЬНОЙ ОСЬЮ

В статье представлены результаты последних разработок по созданию оптимальных комбинированных электродинамических ветрогенераторов с вертикальным или горизонтальным валом. Даны результаты численного и экспериментального моделирования. Показана фотография устройства, вырабатывающего электрическую энергию от невозобновляемого источника

Оптимальные комбинированные электродинамические ветрогенерато-ры, устройство-мжовик; статор; ротор; генератор электрической энергии; постоянные магниты; невозобновляемые источники энергии.

E.S. Ogurtsov

RESEARCH COMBINED ELECTRODYNAMIC WINDGENERATORS WITH VERTICAL AND HORIZONTAL AXIS

In article results of last workings out on creation optimum combined electrodynamic windgenerators with vertical and horizontal shaft are presented. Results of numerical and experimental modelling are yielded. The photo of the device developing electric energy from not renewed source is shown.

i Надоели баннеры? Вы всегда можете отключить рекламу.