APRIL 27-28, 2023
НУТЦ СИГНАЛИГА ИШЛОВ БЕРИШ ВА ТАНИБ ОЛИШ БОСЦИЧЛАРИ Шукуров Камолиддин1, Каххаров Аълохон1, Хасанов Умиджон2, Шукурова Нигора3
^ухдммад ал-Хоразмий номидаги ТАТУ, доцент 2Мух,аммад ал-Хоразмий номидаги ТАТУ, ассистент 3Тошкент кимё-технология институти, Шахрисабз филиали https://doi.org/10.5281/zenodo.7859815
Abstract. In this article, shortcomings of speech signal processing and recognition algorithms are studied, and a new algorithm is proposed and explained.
Keywords: Speech signal, speech recognition, symbol, convolution, software-hardware engine, Capstral analysis, SVD, Hanning, STFT, segment, HMM, Markov model, command, frame.
Нуткни таниш дегани бу маълумот инсон овози ёрдамида компютерга киритилишини англатади ва компютер инсон нуткини тинглайди ва танийди. Нут; сигналларини таниш бутун дунёда хдли х,ам фаол урганилмокда, чунки куйилган масала анча мураккаб. Шунинг учун тижорат максадидаги нуткни таниш тизимлари купайиб бормокда. Бундай тизимларнинг самаралиси ва турли вазифаларани тулик бажара оладигани кам учрайди.
Нуткни таниб олиш муаммоси - бу сигналларни кайта ишлаш сохдсида доимо мух,им мавзу булиб келган тимсолларни таниб олишдир. Тимсолларни таниб олишдан максад объектни сонли синфларга ажратишдир. Х,ар бир синф ёки намуна маълум бир сузни ифодалайди. Киритиш белгили хусусияти вектори укитилаётган маълумотлар базасидаги векторларга киритиш векторларини мослаштириш оркали синфланади.
Барча нуткни танишда кулланиладиган амаллар ва алгоритмлар маълум бир мураккаб сонли усуллар ва шунга мос ишлов бериш алгоритмларини талаб этади: Фурьенинг турли базисларида спектрал тах,лили, вейвлет узгартириши, фильтрлаш, свёртка, кэпстрал тах,лил ва х,.к. Ушбу алгоритм ва методларни махсуслаштирилган дастурий-аппарат воситалар ёки урнатилган тизимларда амалга ошириш анча мушкул. Бунинг учун махсус ёндашув ва оптимал алгоритмларни амалга оширишни талаб этади.
Таклиф этилаётган реал вакт режимида сухандонга боглик ёки боглик булмаган х,олда нутк буйрукларини тиниб олиш алгоритмлари кетма-кетилги 1-расмда келитирилган.
APRIL 27-28, 2023
Узгартириш ва дастлабки ишлов бериш
Кирувчи ракамли нутк сигнали
Адаптив фильтрлаш
Жимлик
сохаларини
ажратиш
Белгиларни ажратиш Фреймларга ажратиш
MFCC
кийматларини олиш
Ойнадан утказиш. Hanning
Улчамларни
кискартириш.
SVD
^иска вактли Фурье
алмаштириш. STFT
Формант
частоталарини
аниклаш
Ягона белгилар вектори
Feature matching
HMM асосида
■ Белгиларни намуна буйича Натижа
щ хотирада кидириш,
саклаш таккослаш ва
1
1-расм. Таклиф килинаётган нутк сигналларидан белгили хусусиятларни ажратиб олиш ва таниш алгоритмлари боскичлари.
Ушбу усул оркали нутк буйрукларини таниб олиш куйидаги алгоритмик боскичларда амалга оширилади.
1. Кирувчи нутц куринишидаги аналог сигнал, 16 кГц частотали ракамли сигнал куринишига угирилади.
2. Нутц буйруцлари ташци шовцин ва уалацитлардан тозалаш. Реал вакт шароитида ва турли мухитларда шовкин ва халакитларнинг хам частота ва хусусиятлари турлича булади. Шуларни хисобга олиб нутк буйрукларини танишда адаптив фильтрлардан фойдаланиш максадга мувофик.
3. Нутц сигналларидан жимлик сощлари ажратиб олиш. Жимлик сохдларини ажаритиб олишдан аввал нутк сигнали кийматлари М=128га тенг булак сегментларга ажаратилиб, Qi сегментга узлаштирилади. Ушбу сегментлардаги жимлик холатини
APRIL 27-28, 2023
aHHK^am ynyH x,ap öup cerneHTHHHr энергнaсн xHCoG^aHagu. HyTKHHHr энергннсн -
a»paTH.nraH cox,aHHHr ro3acuHu xucoGnaMgu.
N
(l)
i = 0
Ey epga E - HyTKHHHr энеpгнaсн, Qi - cerneHTHHHr KHHMaT.napH.
^yMugaru pacMga Hyr; curaa.n.napHgaH »hm^hk cox,a.napHHH a»paTuö oaum anropHTMH Ke^Tupu^raH.
4. @реüмnарга awapmnrn. Hyr; curaa^ugaH »HM^HK ^o^aT^apu MyKOTHnraHgaH cyHr Hyr; curHa^HHH ;aHTa cerneffraam HaTH»acuga $peHM.napra a»paTum 3apyp. OpeÖM^am GocKHH^apuga gacxnaG curaa.n.napra um^OB öepum MaKcaguga Mat^yM öup TeHr öy^aK^apra a»pamnaflu(3-pacM).
A
III L 1 1 1 ^LLIj Wffflfffjfpr —! ! i i i i i i i i i i i i i i i i 1 i i —!—1—!—!—1—!—!—i—!—!— t
, * | * , '<*"■ | > , * 11 ' | | M «an^ M ; | ; -uaaa j—i j 1 12000
Li Lz Lb 1_4 LS Le L?...............................Lk
APRIL 27-28, 2023
3-pacM. HyTK curaannapuHH ^peÜMnam. OnuG GopunraH TagKHKOT HaTH^anapura Kypa, cerneHTnam ynnaMH L=256 TaHnaHgH. ^HcKpemam nacTOTacH 16 kFU, ga e3HnraH HyTK cHrHanHHHHr cerneHTnam ynnaMH L=256 GynraHga, KoTenHHKOB TeopeMacH mapraapura moc KenagH Ba ymGy KHÜMaraapga Kyragponu npo^ccopnapga cerneHTnam ynnaMH M=256 GynraH ^peÜMnapra am^OB Gepum MaKcHMan
Te3Kop^HKHH TatMUHnaMgu
5. Henning(XeHHum) oüuacuöau ym^a3urn. CPHEga KynnaG oMHanap KynnaHHnagu BapTneir, B^KMaH, HeGwmeB, XeHHHHr, KaM3ep Ba Xэммннгnap mynap ^yMancHgaHgHp[1,2]. fflynapgaH HyTK cHrHannapura HmnoB Gepumga Хэммннг Ba XeHHHHr oÜHanapu KeHr KynnaHHnagu BH3HHHr aMHaH XeHHHHr oÜHacuHH TaHnamHMH3gaH MaKcag gh3 ^oMganaHaguraH KHcKa BaKTnH Oypbe y3rapTHpHmHga(STFT-short time Furier transform), OHHagaH yTKa3Hmga curaanHHHr GomH Ba oxupu TynHK Honb KHÜMaTura TeHr Gynumu KepaK.
, . t 2nn \
a(n) = 0.5 (1 - cos(^-j))
(2)
ByHga, N - oMHanap KeHrnuru. XeHHHHr oÜHacuHH ymGy ^opMyna epgaMHga H^onanamHHHr aMnnmyganu Ba HacroranH KypuHumu 2.4-pacMga KenrapunraH.
2.4-pacM. XeHHHHr oÜHacuHHHr aMnnmyga Ba HacTOTanH u^ogacu. ByHgaH KypuHuG TypuGguKH, curaan TaKcHMnaHHm gapa^acu -31.5 gBHH TamKHn этagн [2, 3].
6. ^uc^a eaymnu Oypbe anMammupum. y KyMugaru ^opMyna opKanu aHHKnaHagu STFTX = STFT[x[n]} = X[k,n] = ^ x[m]w[m - n]e-jkm (3)
7. YnnaMnapHU ^u^apmupurn. Curaan ynnaMnapuHH KHcKapHTHpumga cuHrynap eMum ycynugaH ^oMganaHungu. CuHrynap eMum (HHr. Singular Value Decomposition, SVD) - Gy xaKHKHÜ MaTp^aHH KaHOHHK maKnra Kenrapum MaKcaguga geK0Mn03^Hflgup. SVD MaTp^anap GunaH amnamga ^yga xaM KynaM ycyngup, GyHgaH TamKapu MaTp^anap ycraga aMannap пpoцeccop caMapagopnuruHH x,aM omupagu. y MaTp^aHH reoMeTpHK cTpyKTypacHHH KypcaTagH Ba MaB^yg MabnyMOTnapHH ^KKon TaKgHM KHnum hmkohhhh GepagH. SVD TypnH
m=-m
APRIL 27-28, 2023
хил масалаларни х,ал килишда - энг кичик квадратлар усулида якинлашиш ва тенгламалар системасини ечишдан тортиб сигналларни сикиш ва фильтрлашгача кулланилади.
8. Формант частоталарини аницлаш. Сухандонга боглик булган нут; буйрукларини танишда формант частоталарини кушимча параметр сифатида олиш яхши ахамият касб этади. Бу эса уз навбатида таниб олиш аниклик фойизини ошишига олиб келади.
9. MFCC цийматларини олиш. MFCC энг кенг таркалган коэффициентлардан булиб, инсон эшитиш тизимининг чизикли булмаган таъсирини аппроксимациялайди. Инсон идроки билан олиб борилган тажрибалар шуни курсатдики, соф тонлар каби стимуллар учун базиляр мембрана буйлаб максимал кучишнинг полати тон частотасининг логарифмига пропорсионалдир[3,4]. Бу эса уз навбатида ушбу коэффициентлар инсон эшитиш тизимига жуда х,ам якинлигини билдиради.
10. Белгиларнинг мувофицлигини текшириш ва таниб олиш. Ягона белгилар векторида ажратиб олинган нутк буйруклари дастлаб мувофиклиги текширилади ва мослиги аникланса у таниб олинади. Ушбу боскичида нутк буйрукларини турли синфлаш ва кластерлаш масалаларини ечиш оркали амалга оширилади. Бизнинг х,олатда Яширин Марков моделига асосланган модельдан фойдаланилди.
Барча мавжуд нуткни таниб олиш ва овозли бошкарув тизимлари ухшаш тузилишга эга булиб, дастлабки ишлов бериш, акустик модуль ва лингвистик модуллардан ташкил топади. Акустик модулда асосан, Гаусснинг аралашмаларига асосланган Марковнинг яширин моделларидан ёки сунъий нейрон тармоклари фойдаланилади.
Сунъий нейрон тармокларига асосланган алгоритмларини амалга ошириш х,исоблаш тизимидан юкори самардорликни талаб килишини х,исобга олиб, нутк буйрукларини реал вакт режимида таниб олиш тизимини ишлаб чикиш учун яширин Марков занжирига асосланган алгоритм аппарат-дастурий платформага мосланди. Ушбу алгоритм алох,ида нутк буйрукларини таниб олишда 95% аниклик курсатди.
REFERENCES
1. Д. В.П., MATLAB 6.5 SP1/7 +Simulink 5/6. Обработка, Москва: М.: СОЛОН-пресс, 2005, p. 576 с.
2. С. А.Б., Цифровая обработка сигналов: учеб. для вузов, Санкт Петербург: Питер, 2003, p. 604 с.
3. "https://ru.wikipedia.org/wiki/Оконное_преобразование_Фурье#Окно_Ханна_(Хеннинг а)" [Online].
4. S. B. D. a. P. Mermelstein, "Comparison of parametric representations for," IEEE Trans. on Acoustics, Speech and Signal Processing, no. vol. 28, pp. pp. 357-366, 1980.