Научная статья на тему 'Решение задачи идентификации говорящего с использованием нечеткого классификатора'

Решение задачи идентификации говорящего с использованием нечеткого классификатора Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
47
12
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Сергиенко Р.Б.

Рассматривается задача распознавания говорящего. В качестве исходных данных взята задача «Японские гласные» из UCI репозитория. Эта задача была решена с использованием нечеткого классификатора как метода классификации, способного извлекать причинно-следственные закономерности из исходных данных. Были проведены численные исследования метода формирования нечеткого классификатора для различного числа говорящих и различного числа используемых нечетких правил. Метод показал приемлемую эффективность на тестовой выборке: от 0,985 для двух говорящих до 0,786 для девяти.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Сергиенко Р.Б.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Speaker identification problem solving using fuzzy classifier

The problem of speaker identification is considered. Classification problem of “Japanese vowels” from UCI repository is used as source data. This problem was solved with a fuzzy classifier as a classification method that is able to extract cause-and-effect relations from source data. Computational investigation of fuzzy classifier design with coevolutionary algorithms for different numbers of speakers and for different number of the used fuzzy rules was performed. The proposed method allows getting acceptable classification efficiency for a test sample: from 0.985 for two speakers to 0.786 for nine speakers.

Текст научной работы на тему «Решение задачи идентификации говорящего с использованием нечеткого классификатора»

Решетневскце чтения

енте миграции распараллеливание не ухудшает работу алгоритмов. Однако стоит точнее выяснить необходимый коэффициент миграции для более надежной работы алгоритмов.

На тестовой задаче при фиксированном количестве ресурсов была рассмотрена эффективность ГА и ACO на четырех ядрах для различных настроек и различной длины интервала обмена одним лучшим индивидом. Результаты показывают, что при увеличении интервала между миграциями, надежность алгоритма увеличивается до определенного предела, после чего начинает убывать. Это можно объяснить тем, что при малом коэффициенте миграции популяции развиваются изолированно друг от друга, а при большом коэффициенте нет существенной разницы с одной большой популяцией. Это подтверждает известный в генетике принцип, что благоприятные признаки

распространяются быстрее, когда общины маленькие, чем когда они большие.

В дальнейшем предполагается разработать более эффективные методы распараллеливания алгоритмов, позволяющие ускорить его работу за счет эффектив -ного взаимодействия разнородных популяций, развивающихся на разных ядрах и различных топологиях обмена индивидами.

Библиографические ссылки

1. Holland J. H. Adaptation in Natural and Artificial Systems // The University of Michigan Press. 1975.

2. Dorigo М., Gambardella L. M. Ant Colony System: A Cooperative Learning Approach to the Traveling Salesman Problem // IEEE Transactions on Evolutionary Computation. 1997. P. 53-66.

3. Cantu-Paz E. A Survey of Parallel Genetic Algorithms // IlliGAL Report. 1997.

O. E. Semenkina

Siberian State Aerospace University named after academician M. F. Reshetnev, Russia, Krasnoyarsk

PARALLEL GENETIC AND ANT ALGORITHMS FOR TRAVELING SALESMAN PROBLEM SOLVING

The parallelization of genetic and ant colony algorithms for solving the traveling salesman problem is considered, the dependence of algorithms' efficiency on the number ofpopulations and the rate of migration is shown.

© Семенкнна О. E, 2012

УДК 519.234

Р. Б. Сергиенко

Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева, Россия, Красноярск

РЕШЕНИЕ ЗАДАЧИ ИДЕНТИФИКАЦИИ ГОВОРЯЩЕГО С ИСПОЛЬЗОВАНИЕМ НЕЧЕТКОГО КЛАССИФИКАТОРА

Рассматривается задача распознавания говорящего. В качестве исходных данных взята задача «Японские гласные» из UC1 репозитория. Эта задача была решена с использованием нечеткого классификатора как метода классификации, способного извлекать причинно-следственные закономерности из исходных данных. Были проведены численные исследования метода формирования нечеткого классификатора для различного числа говорящих и различного числа используемых нечетких правил. Метод показал приемлемую эффективность на тестовой выборке: от 0,985 для двух говорящих до 0,786 для девяти.

Задача распознавания говорящего одна из актуальных прикладных задач классификации. В качестве инструмента классификации предлагается использовать нечеткий классификатор [1], способный помимо решения собственно задачи классификации также извлекать причинно-следственные закономерности в виде нечетких правил. При этом предлагается применять новый многошаговый метод формирования нечеткого классификатора с использованием самонастраивающихся коэволюционных алгоритмов. Многошаговый метод формирования нечеткого классификатора основан на многократном повторении ранее разработанного метода формирования нечеткого классификатора [2].

В качестве исходных данных для решения задачи распознавания говорящего взята задача Japanese Vowels (Японские гласные) из UCI репозитория [3]. Задача состоит в том, что девять мужчин-носителей японского языка многократно произносят гласные звуки /ae/. Далее речь преобразуется во временной ряд, характеризирующийся двенадцатью спектральными коэффициентами в каждый дискретный период времени. Длительность временного ряда составляет от 7 до 29 дискретных периодов времени. Объем обучающей выборки составляет 270 элементов (по 30 экземпляров для каждого из девяти говорящих). Объем тестовой выборки - 370 элементов. Для снижения размерности решаемой задачи классифика-

Математические методы моделирования, управления и анализа данных

ции использовались средние значения двенадцати спектральных коэффициентов в течение всего времени произношения гласных звуков.

При проведении численных исследований количество говорящих для распознавания последовательно изменялось от 2 до 9. Также варьировалось число используемых нечетких правил от 60 до 600. Для каждой пары числа говорящих и числа используемых нечетких правил проводилось 20 запусков алгоритма формирования нечеткого классификатора для усреднения результатов.

Результаты численных исследований, а также результаты для различного числа говорящих и различного числа используемых нечетких правил приведены в таблице. Критерий эффективности работы алгоритма формирования нечеткого классификатора - доля правильно распознанных элементов тестовой выборки. Показаны средние и максимальные значения критерия эффективности для каждой комбинации настроек.

Метод показал приемлемую эффективность на тестовой выборке: от 0,985 для двух говорящих до 0,786 для девяти. Видно, что при увеличении числа используемых нечетких правил, эффективность работы алгоритма растет. Однако после определенного

числа используемых нечетких правил их дальнейшее увеличение теряет практический смысл. В некоторых случаях увеличение числа говорящих приводит к увеличению точности распознавания. Это связано с ау-диометрическим свойствами говорящих - если есть два говорящих с близкими параметрами голоса, то добавление говорящего с существенно отличным голосом логично приводит к росту точности распознавания.

Библиографические ссылки

1. Ishibuchi H., Nakashima T., Murata T. Performance evaluation of fuzzy classifier systems for multidimensional pattern classification problems // IEEE Trans. on Systems, Man, and Cybernetics. 1999. Vol. 29. P. 601-618.

2.Сергиенко Р. Б. Исследование сходимости многошагового метода формирования нечеткого классификатора // Теория и практика системного анализа : тр. II Всерос. науч. конф. молодых ученых с между-нар. участием. 2012. Т. 1. С. 25-36.

3.UCI Machine Learning Repository [Electronic resource]. URL: http://kdd.ics.uci.edu/.

Результаты численных исследований

Число говорящих 60 правил 100 правил 200 правил 300 правил 400 правил 500 правил 600 правил

2 (сред.) 0,842 0,877 0,930 0,942 0,943 0,948 0,952

2 (макс.) 0,924 0,924 0,969 0,985 0,985 0,985 0,985

3 (сред.) 0,570 0,660 0,768 0,822 0,845 0,868 0,872

3 (макс.) 0,649 0,720 0,837 0,876 0,896 0,916 0,916

4 (сред.) 0,625 0,664 0,762 0,806 0,821 0,842 0,856

4 (макс.) 0,736 0,745 0,827 0,872 0,891 0,909 0,900

5 (сред.) 0,555 0,622 0,730 0,782 0,813 0,827 0,827

5 (макс.) 0,640 0,705 0,827 0,827 0,885 0,885 0,878

6 (сред.) 0,591 0,689 0,777 0,828 0,844 0,839 0,865

6 (макс.) 0,662 0,791 0,846 0,902 0,895 0,902 0,908

7 (сред.) 0,501 0,605 0,733 0,791 0,809 0,830 0,845

7 (макс.) 0,620 0,655 0,803 0,857 0,867 0,882 0,887

8 (сред.) 0,467 0,558 0,689 0,746 0,761 0,776 0,790

8 (макс.) 0,517 0,620 0,735 0,779 0,814 0,810 0,830

9 (сред.) 0,399 0,515 0,649 0,685 0,724 0,742 0,755

9 (макс.) 0,481 0,559 0,700 0,732 0,786 0,786 0,786

R. B. Sergienko

Siberian State Aerospace University named after academician M. F. Reshetnev, Russia, Krasnoyarsk SPEAKER IDENTIFICATION PROBLEM SOLVING USING FUZZY CLASSIFIER

The problem of speaker identification is considered. Classification problem of "Japanese vowels" from UCI repository is used as source data. This problem was solved with a fuzzy classifier as a classification method that is able to extract cause-and-effect relations from source data. Computational investigation of fuzzy classifier design with coevolutionary algorithms for different numbers of speakers and for different number of the used fuzzy rules was performed. The proposed method allows getting acceptable classification efficiency for a test sample: from 0.985 for two speakers to 0.786for nine speakers.

© Серraенко Р. E., 2012

i Надоели баннеры? Вы всегда можете отключить рекламу.