Составим следующую систему уравнений: dx(t)
dt
= y(t)
дУ^) / Ч / Ч / Ч
а2--+ а1 у(£) + а0х(?) = пу).
Ж (7)
Пусть z1 = x(t), тогда z2 = y(t), и систему (7) представим в следующем виде:
dz2 dt
dz х dt
Запишем, собственно, сам алгоритм, который использует данный метод:
z п+1= z n+dk1+(1-d)k2, (10)
* = 1
где: 2 , а к1 и k2 - вектора искомых значений, ко-
торые находятся из следующих равенств:
Dk1= М( zn ), (11)
Dk2=k1.
= Z,
При этом:
-Z +
u(t)
D = E - d-At -
Примем
d^n dt
= f (z„)
z„ =
f(z„)=
,причем
z
(z ^ zi
V Z 2 J
(8)
,тогда
f ( Zn ) dz„
(12)
где: E - единичная матрица, а матрица Якоби равна:
2
a1 a0 u(t) Z2 Z1 +
a
2
D =
a
2
a
2 J
(9)
Г1 0Л 0 1
0 d -At
- aLd-At - ^d-At
df ( z„)
dz.
Отсюда:
> ( 1
df(Zi) df(Zi)
dz
dz
df (Z2) df (Z2)
V dzi
dz
0 1
Оо_ a
a2 a2
2 J
. (13)
-d-At Л
ald-At 1 + ^d-At
V a2 a2
(14)
После проведенных преобразований нетрудно отыскать векторы к1 и к2, подставив которые в (10) становится возможным получение серии решений уравнения (6) в точке t = Ю.
Далее процедура, проведенная выше, повторяется, но при этом
t = Й = М+Ю. (15) Таким образом, находится серия решений в точке t = И и так далее, пока не закончится время, ограниченное объемом выборки и интервалом дискретизации.
Как видно из рисунков, хотя процедура получения истинных процессов высоких порядков в системе с применением численного метода дискретных разностей стала невозможной, мы можем наблюдать тот факт, что с увеличением порядка дифференциального уравнения, которым описывается реальный процесс в системе, существенно растут: как объемы выборок, так и время регулирования
процесса, что приводит к не менее существенному росту машинного времени Tc, затрачиваемого на реализацию математических расчетов.
Список литературы
1. Иконников О.А., Первушин В.Ф. Исследование не-
параметрических моделей динамических систем: Вестник Сибирского государственного аэрокосмического университета им. ак. М.Ф. Решетнева. Вып. 1(47). Красноярск, 2013. С. 36-40.
2. Иконников О.А. О непараметрическом моделировании линейных динамических процессов высоких порядков: Вестник Сибирского государственного аэрокосмического университета им. ак. М.Ф. Решетнева. Вып. 2(54). Красноярск, 2014. С. 30-32.
a
a
0
z
2
a
a
a
2
2
2
J
a
a
2
2
ПРИМЕНЕНИЕ ДЕСЯТИ АЛГОРИТМОВ ДЛЯ ОПТИМИЗАЦИИ ПАРАМЕТРОВ МЕТОДА ОПОРНЫХ ВЕКТОРОВ И ОПТИМИЗАЦИИ ПРОЦЕССА ОТБОРА ИНФОРМАТИВНЫХ ПРИЗНАКОВ В ЗАДАЧЕ РАСПОЗНАВАНИЯ ПОЛА
И ВОЗРАСТА ЧЕЛОВЕКА
Лосева Елена Давидовна
Магистрант Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева, г. Красноярск
На сегодняшний день речевые технологии предлагают пользователям широкий спектр автоматизированных услуг. Информационные системы становятся дружественными и понятными даже для обычного пользователя. Современные технические средства позволяют реализовы-вать диалог компьютера с пользователем на естественном
языке. Так называемые, речевые диалоговые системы отличаются следующими функциональными возможностями: распознавание и понимание речи, управление диалогом, формирование речевого потока, «разговор» с пользователем на доступном ему естественном языке. Со-
гласно исследователям речевые технологии обладают следующими функциональными возможностями: способствуют дифференцированию рынка, улучшают качество существующих услуг, доступность в использовании, снижают затраты на обслуживание. Эффективность диалоговых систем ключевой вопрос на сегодняшний день. Современные технологии способны улавливать и распознавать не только речь человека, но и его психоэмоциональное состояние, а также идентификации спикера по речевому сигналу. Исследования с целью повышению качества диалоговых систем и точности распознавания информации по речевому сигналу продолжаются. Распознавание по речевому сигналу предполагает наличие выборочных данных, на основе которых и производится процедура распознавания. На сегодняшний день существуют разные программные системы, с помощью которых организуется анализ звуковых характеристик речевого сигнала. Но количество акустических характеристик достаточно велико, и использование всего набора данных в процессе распознавания представляет затруднение: атрибуты могут иметь низкий уровень вариации, коррелировать друг с другом, что снижает точность распознавания [1, с. 273-324]. Поэтому, важной задачей в процессе распознавания информации является не только эффективность используемого метода классификации, но извлечение информативных признаков из общего числа имеющихся данных. То есть задача распознавания средствами речевого сигнала представляет собой задачу классификации (обучение с учителем) [2, с. 81]. В этой статье рассмотрено применение десяти оптимизационных алгоритмов для повышения точности распознавания пола и возраста человека. Распознавание проводилось методом опорных векторов SVM, параметры которого оптимизированы тремя алгоритмами [3, с. 1-3]. Так же было протестировано семь алгоритмов для оптимизации процесса отбора информативных признаков.
Для осуществления процесса классификации имеются наблюдения для обучения О это набор, состоящий из п объектов, имеющих р параметров:
О = {(*,-,и,.)\х, е Я?,и, е{-1,1}} (1)
1 — 1 п и ■ л л
при , где . принимает значения -1 или 1, определяя
х<
к какому классу, принадлежит каждая точка 1.
Оптимальная гиперплоскость для линейной классификации - это гиперплоскость, разделяющая наблюде-
и, — 1 г и, — -1 ния 1 от объектов 1 с максимальным расстоянием, вычисляемая по формуле
и — й ■ X - Ь
где: й - это вектор нормали к гиперплоскости; х -
(2)
— Ё У,а,к(х >х) - Ь
(3)
и,-
где: 1 это выходные значения для 1 - ой обучающей выборки; У'' - эталонные выходные значения для 1 -ой обучающей выборки, такие что для У 1 соответствуют по-
У —-1
1 - отрицательным;
функция ядра.
При Ь — 0, вычисление коэффициента а проводится по формуле, где С - параметр, влияющий на переобучение:
а, — 0 > 1
0 < а, < С у1и1 — 1
а, — С Уи1 ^1 , (4)
Таким образом, сумма ядер может быть использована для измерения относительной близости каждой кон-
ложительным значениям и к(х,Х)
трольной точки х до других ' из данных, принадлежащих первому или второму классу. Используемые функции ядер:
• Нейронная функция ядра:
tanh(ax * у + Ь) (5)
где: это а - альфа и Ь это регулируемый параметр;
• Полином: полином ядра определяется:
(6)
где: О - это степень полинома;
• Гауссовская комбинация: настраиваются регулируемые параметры и °"3;
• Мультиквадрик (multiquadric): определяется как корень квадратный из формулы
х,-
(х * у +1)1
II II2 „2
х - у + С
(7)
где: С - это параметр, влияющий на переобучение классификатора;
• Ядро Епачникова: Ядро Епачникова представляет со-
3
-(1- и 2)
бой функцию 4 для и между «-1» и «1», значение «0» для и, если значения находятся за пределами границ.
• Точка:
х * У
это вектор входных значений [4, с. 341-345].
Но так как часто случается, что наблюдения для дискриминации не являются линейно разделимыми, чтобы сохранить вычислительную нагрузку разумной, вводится понятие нелинейной классификации с заменой скалярного произведения на нелинейную функцию ядра
к (x,у) [5, с. 81-84]. Так как гиперплоскость в двухмерном пространстве определяется как набор точек (вектор), то векторы, определяющие гиперплоскости, могут быть выбраны как линейные комбинации с парамет-а
рами 1 изображения функции векторов. При таком выборе гиперплоскости определяются соотношением, которое исходит из формулы Лагранжа:
anova: функция
где:
: Г -
гамма
ехр(-Г(х - у)), функция и О - это степень полинома;
(8) (9)
(10)
• Радиальная функция ядра:
ехр(-Г|| х - у\\2)
где: Г - это гамма функция;
Соответственно, оптимизируемые параметры: С ,
а1, а2, аз, О, а,Ь .
Так как задача распознавания акустических сигналов предполагается наличие выборочных данных, то для создания соответствующих баз данных необходимое количество звукозаписей 150. Созданная база для классификации возраста человека состоит из голосов людей от
и
1=1
11 лет до 18 и от 20 до 55 лет. Для классификации пола человека использовались голоса мужского и женского пола [6, с. 607]. Обработка звуковых волн производилось с использованием программ Notepad++ [7, с. 1-6], Praat («script») [8. с. 1459-1462], Excel 97-2003. Алгоритм создания баз данных RSDB - A, RSDB - G:
1. На первом этапе проводится предобработка звукозаписей в программе Praat с дополнительным модулем «script». Извлекаются следующие характеристики звуковых волн: time, pitch, intensity, formant 1, formant 2, formant 3 [9, с. 26-485]. Для загрузки звукозаписей выбирается «Read from File», «Open Praat script», далее выбирается «Create Table». Через опцию «Run» запускается модуль «script». Указать место хранения звукозаписей: «input» (например, «C:\Users\DNS\...») и место, куда будут
сохранены обработанные данные: «output» (например, «C:\Program Files (x86)\...»). Эта процедура проводится для каждой звукозаписи. Для оформления извлеченных звуковых характеристик в базу данных в программе Notepad++ открыть все созданные файлы «N.xls» с акустическими характеристиками и провести замену формата числа с точки на запятую. Полученные данные переносятся в программу Microsoft Office Excel. Удаляется первый столбец с наименованием «time», вычисляется среднее значение по остальным пяти столбцам. Полученные усреднённые значения расположить построчно с указанием номера класса («0» или «1»). Пример приведен в таблице 1 и 2.
Оформление базы данных RSDB - G
Таблица 1
womanl 100 63,15 604,23 1907,05 3041,63 0
womanN 86,12 160,52 1110,12 2052,48 3350,78 0
manl 40,56 57,62 829,73 2035,27 3282,73 1
manN 94,25 108,56 1100,89 1959,98 4093,55 1
Таблица 2
Оформление базы данных RSDB - A___
adult1 100 63,15 604,23 1907,05 3041,63 0
adultN 86,15 160,52 1110,12 2052,48 3350,78 0
young1 40,56 57,623 829,73 2035,27 3282,75 1
youngN 94,25 108,56 1100,89 1959,98 4093,55 1
3. Так как в этой статье реализация поставленной задачи проводилась в программе Rapid Miner v.5.3 [10, с. 25-29], то созданные базы данных необходимо прикрепить к общей структурной схеме с использованием блока «Read Excel». Загрузка каждой базы данных производится с помощью опции «Import configuration Wizard». В открывшемся окне на шаге 1 - 3 все параметры остаются без изменения, а на 4 шаге указываются следующие харак-
теристики: в первой колонке «ID» указывается binominal, id и в последней колонка «Class» указывается binominal, label. Полученный блок «Read Excel» прикрепить к общей схеме.
Созданные базы данных имеют следующие характеристики, представленные в таблице 3.
Характеристики баз данных
Таблица 3
БД Язык Объем БД Количество классов Объем БД, мин. Средняя продолж. речевого сигнала, сек.
RSDB - A Русский 600 Совершеннолетний, несовершеннолетний 29,7 1284
RSDB - G Русский 800 Мужской, женский пол 38,9 1929
Алгоритмы, выбранные для оптимизации параметров метода опорных векторов:
• Optimize Parameters (Quadratic) [11, с. 1-15]: оптимизация параметров с использованием квадратичной итерационной модели.
• Optimize Parameters (Evolutionary) [12, с. 19-23]: оптимизация параметров генетическим алгоритмом. В этом алгоритме для процесса отбора лучших решений создается начальная популяция индивидуумов, далее применяются стандартные операторы селекции, рекомбинации, мутации. Каждое решение оценивается с помощью функции пригодности. В качестве функции пригодности взята пригодность всего решения в целом.
• Optimize Parameters (Grid): нахождение оптимальных значений параметров в заданном диапазоне.
Для каждого выбранного параметра указываются минимальные и максимальные значения для нижней и верхней границы диапазона соответственно. Проводится перебор всех возможных комбинации параметров. Возвращается оптимальный набор параметров.
Алгоритмы, выбранные для оптимизации процесса отбора информативных признаков:
• Optimize Selection (Evolutionary): отбор признаков с использованием генетического алгоритма.
• Optimize Weights (Evolutionary): оптимизация весовых коэффициентов с использованием генетического алгоритма.
• Optimize Weights (Forward): оптимизация весовых коэффициентов.
• Optimize Weights (Backward): оптимизация весовых коэффициентов.
• Optimize Weights (PSO): оптимизация весовых коэффициентов с определением каждому решению меры качества.
• Forward Selection: выбор оптимальных признаков (производительность оценивается с помощью внутренних операторов (перекрестной проверкой).
• Backward Elimination: выбор оптимальных признаков (производительность оценивается с использованием внутреннего оператора исключения). Вычисление надежности работы по двум подходам, - стандартного и оптимизированного метода SVM проводилось по формуле:
Nad = 1 --
П,
(11) П - общее
где - это количество успешных запусков; количество запусков.
Для проведения исследования было проведено 50 запусков. Успешными запусками считаются результаты с точностью классификации выше 75% для обоих подходов.
В таблице 4 приведены результаты применения трех алгоритмов для оптимизации параметров метода опорных вектора. В таблице 5 приведены результаты применения семи алгоритмов для оптимизации процесса отбора информативных признаков. В таблице 6 приведены усредненные результаты надежности работы стандартного метода опорных векторов.
Таблица 4
Надежность, %
Метод Начальные установки Оптимизируемые параметры RSDB - G RSDB - A
Optimize Parameters (Quadratic) exceeded region = clip exceeded range = clip Сигма а1, 92,62 91,25
Параметр с 93,75 92,58
Степень о 93,75 92
Параметры а и Ь 95 93,66
Optimize Parameters (Evolutionary) Количество особей: 200, Количество поколений: 400, селекция: рулетка Сигма а1, 94,62 94
Параметр с 92,5 96,16
Степень о 95,45 94,28
Параметры а и Ь 91,25 94,33
Optimize Parameters (Grid) Определением каждому решению меры качества (метод решетки) Сигма а1, а2,°"з 90,54 94,05
Параметр с 93,75 92
Степень о 90,62 96
Параметры а и Ь 95,12 93,57
Среднее значение надежности, % 93,24 93,66
П
Таблица 5
Показатели надежности работы метода SVM, с применением алгоритмов для процесса оптимизации отбора
информативных признаков_
Надежность, %
Метод Начальные установки RSDB - G RSDB - A
Optimize Selection (Evolutionary) Количество особей: 200, поколений: 400, селекция: турнир 91,41 93,6
Optimize Weights (Evolutionary) Количество особей: 200, поколений: 400, селекция: турнир 92,31 92,11
Optimize Weights (Forward) Оптимизация весов атрибутов линейным поиском 91,41 92,79
Optimize Weights (Backward) Оптимизация весов атрибутов линейным поиском 95 92,8
Optimize Weights (PSO) Количество индивидуумов = 150, Количество поколений = 250, селекция: рулетка. Min weight = 0, Max weight = 1 93,75 92
Forward Selection Speculative round =15, Max round of attributes=15 91,79 93
Backward Elimination Speculative round =15, Max round of elimination=15 94,9 95
Среднее значение надежности, % 92,94 93,04
Таблица 6
Показатели надежности работы стандартного метода SVM на полном наборе признаков_
Надежность работы классификаторов, %
Метод RSDB - G RSDB - A
Стандартный классификатор SVM 86,12 87,73
Анализ полученных результатов показал, что применение оптимизационных методов повышает качество распознавания информации по речевому сигналу (пола и возраста человека). В сравнении с надежностью стандартного классификатора показатели работы предложенных подходов имеют значительные преимущества и составляют в среднем для распознавания пола: 7,54%, для распознавания возраста: 5,51 % на полном наборе признаком. Показатели надежности работы классификатора SVM после оптимизации отбора информативных признаков имеют так же преимущества, - для распознавания пола составляет: 6,69%, а для распознавания возраста: 5,21%. Можно сделать вывод, что выбранные оптимизационные алгоритмы показывают высокую эффективность работы.
В заключении можно отметить, что диалоговые системы будут только тогда эффективны, если они будут привычными для пользователя, адаптированы к нему. Тщательный структурированный подход в разработке разговорных диалоговых систем может также привести к появлению новых усовершенствованных технологий для успешного будущего человека (пример, автомобильная навигационная система, "умная" локальная система сотовой радиосвязи, многомодальные системы). Успех в их реализации будет зависеть напрямую от уровня качества, который разработчики смогут предложить пользователям, поэтому исследования в этой научно - технической области продолжаются.
Список литературы
1. Kohavi R., John G. H. Wrappers for feature subset selection // Artificial Intelligence, 97. 1997. P. 273324.
2. Christopher Winship, David J. Harding. The overall strategy for the identification of age, period. Cohort
model: mechanisms approaches: Harvard University, 2004, P. 81.
3. Метод опорных векторов [Электронный ресурс]. URL: http://yury.name/ (дата обращения: 10.01.2015), С. 1-3.
4. Boersma P. Praat, a system for doing phonetics by computer. Glot international, 5(9/10), 2002, P. 341345.
5. Местецкий Л. М. Математические методы распознавания образов: курс лекций. Москва: МГУ, 2002-2004. С. 81-84.
6. Прикладная статистика: Классификации и снижение размерности: справ. изд./ С. А. Айвазян [и др.]; под ред. С. А. Айвазяна. М.: Финансы и статистика, 1989, С. 607.
7. Sound - Detailed Help [Электронный ресурс] URL: http://www.physicsclassroom.com/mop/ (дата обращения: 25.12.2014). C. 1-6.
8. Eyben F., Wöllmer M., Schuller B. Opensmile: the munich versatile and fast opensource audio feature extractor // Proceedings of the Intern. Conf. on Multimedia, 2010. ACM. P. 1459-1462.
9. Fareed Akthar, Caroline Hahne. Rapid Miner 5: Operator reference// Dortmund, 2012. P. 26-485.
10. Черезов Д. С., Тюкачев Н. А. Обзор основных методов классификации и кластеризации данных. Воронеж: ВГУ, 2009. С. 25-29.
11. Hall, M. [et al.]. The WEKA Data Mining Software: An Update, SIGKDD Explorations. 2009. Vol. 11, iss. 1. P. 1-15.
12. Daridi F., Kharma N., Salik, J. Parameterless genetic algorithms: review and innovation // IEEE Canadian Review. 2004. (47). P. 19-23.
СРАВНИТЕЛЬНЫЙ АНАЛИЗ ЭФФЕКТИВНОСТИ РАБОТЫ ТОНКОПЛЕНОЧНЫХ СОЛНЕЧНЫХ МОДУЛЕЙ НА ШИРОТЕ ХАРТУМА И САНКТ-ПЕТЕРБУРГА
Бадрелдин-Миргхани М. М., Афанасьев В. П.
Санкт-Петербургский государственный электротехнический университет «ЛЭТИ», г. Санкт-Петербург
A COMPARATIVE ANALYSIS OF THE EFFICIENCY OF THIN FILM SOLAR MODULES AT THE LATITUDE OF KHARTOUM & ST.PETERSBURG M. M. Badreldin-Mirghani, V. P. Afanasjev
ABSTRACT
In this paper, we present evaluation of work efficiency of thin film solar modules TFSM based on amorphous and nanocrystalline silicon at the latitude of Khartoum (15.6°) and St. Petersburg (59.9°) using the program PVGIS. To improve the accuracy of the program PVGIS method was proposed influence of the temperature of the solar module at various times of the year on its efficiency. Analysis of this study showed that monthly correction angle of the solar module to the horizon will increase the efficiency of its work to by 6% in St. Petersburg and by 7% in Khartoum.
Photovoltaic Geographical Information System (PVGIS), radiation intensity, the thin film solar module (TFSM) based on amorphous and nanocrystalline silicon (a-Si:H/nc-Si), the angle of inclination of the solar module
В данной работе приведена оценка эффективности работы тонкопленочных солнечных модулей (ТПСМ) на основе аморфного и нанокристаллического кремния на широте Хартума (15,6°) и Санкт-Петербурга (59,9°) с ис-
пользованием программы PVGIS. Для повышения точности программы PVGIS было предложено учитывать влияние изменения температуры солнечного модуля в разное время года на его эффективность. Проведенный анализ показал, что введение ежемесячной коррекции угла