Научная статья на тему 'НУТҚ СИГНАЛИГА ИШЛОВ БЕРИШ ВА ТАНИБ ОЛИШ БОСҚИЧЛАРИ'

НУТҚ СИГНАЛИГА ИШЛОВ БЕРИШ ВА ТАНИБ ОЛИШ БОСҚИЧЛАРИ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
32
15
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
Speech signal / speech recognition / symbol / convolution / software-hardware engine / Capstral analysis / SVD / Hanning / STFT / segment / HMM / Markov model / command / frame.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Шукуров Камолиддин, Каххаров Аълохон, Хасанов Умиджон, Шукурова Нигора

In this article, shortcomings of speech signal processing and recognition algorithms are studied, and a new algorithm is proposed and explained.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «НУТҚ СИГНАЛИГА ИШЛОВ БЕРИШ ВА ТАНИБ ОЛИШ БОСҚИЧЛАРИ»

APRIL 27-28, 2023

НУТЦ СИГНАЛИГА ИШЛОВ БЕРИШ ВА ТАНИБ ОЛИШ БОСЦИЧЛАРИ Шукуров Камолиддин1, Каххаров Аълохон1, Хасанов Умиджон2, Шукурова Нигора3

^ухдммад ал-Хоразмий номидаги ТАТУ, доцент 2Мух,аммад ал-Хоразмий номидаги ТАТУ, ассистент 3Тошкент кимё-технология институти, Шахрисабз филиали https://doi.org/10.5281/zenodo.7859815

Abstract. In this article, shortcomings of speech signal processing and recognition algorithms are studied, and a new algorithm is proposed and explained.

Keywords: Speech signal, speech recognition, symbol, convolution, software-hardware engine, Capstral analysis, SVD, Hanning, STFT, segment, HMM, Markov model, command, frame.

Нуткни таниш дегани бу маълумот инсон овози ёрдамида компютерга киритилишини англатади ва компютер инсон нуткини тинглайди ва танийди. Нут; сигналларини таниш бутун дунёда хдли х,ам фаол урганилмокда, чунки куйилган масала анча мураккаб. Шунинг учун тижорат максадидаги нуткни таниш тизимлари купайиб бормокда. Бундай тизимларнинг самаралиси ва турли вазифаларани тулик бажара оладигани кам учрайди.

Нуткни таниб олиш муаммоси - бу сигналларни кайта ишлаш сохдсида доимо мух,им мавзу булиб келган тимсолларни таниб олишдир. Тимсолларни таниб олишдан максад объектни сонли синфларга ажратишдир. Х,ар бир синф ёки намуна маълум бир сузни ифодалайди. Киритиш белгили хусусияти вектори укитилаётган маълумотлар базасидаги векторларга киритиш векторларини мослаштириш оркали синфланади.

Барча нуткни танишда кулланиладиган амаллар ва алгоритмлар маълум бир мураккаб сонли усуллар ва шунга мос ишлов бериш алгоритмларини талаб этади: Фурьенинг турли базисларида спектрал тах,лили, вейвлет узгартириши, фильтрлаш, свёртка, кэпстрал тах,лил ва х,.к. Ушбу алгоритм ва методларни махсуслаштирилган дастурий-аппарат воситалар ёки урнатилган тизимларда амалга ошириш анча мушкул. Бунинг учун махсус ёндашув ва оптимал алгоритмларни амалга оширишни талаб этади.

Таклиф этилаётган реал вакт режимида сухандонга боглик ёки боглик булмаган х,олда нутк буйрукларини тиниб олиш алгоритмлари кетма-кетилги 1-расмда келитирилган.

APRIL 27-28, 2023

Узгартириш ва дастлабки ишлов бериш

Кирувчи ракамли нутк сигнали

Адаптив фильтрлаш

Жимлик

сохаларини

ажратиш

Белгиларни ажратиш Фреймларга ажратиш

MFCC

кийматларини олиш

Ойнадан утказиш. Hanning

Улчамларни

кискартириш.

SVD

^иска вактли Фурье

алмаштириш. STFT

Формант

частоталарини

аниклаш

Ягона белгилар вектори

Feature matching

HMM асосида

■ Белгиларни намуна буйича Натижа

щ хотирада кидириш,

саклаш таккослаш ва

1

1-расм. Таклиф килинаётган нутк сигналларидан белгили хусусиятларни ажратиб олиш ва таниш алгоритмлари боскичлари.

Ушбу усул оркали нутк буйрукларини таниб олиш куйидаги алгоритмик боскичларда амалга оширилади.

1. Кирувчи нутц куринишидаги аналог сигнал, 16 кГц частотали ракамли сигнал куринишига угирилади.

2. Нутц буйруцлари ташци шовцин ва уалацитлардан тозалаш. Реал вакт шароитида ва турли мухитларда шовкин ва халакитларнинг хам частота ва хусусиятлари турлича булади. Шуларни хисобга олиб нутк буйрукларини танишда адаптив фильтрлардан фойдаланиш максадга мувофик.

3. Нутц сигналларидан жимлик сощлари ажратиб олиш. Жимлик сохдларини ажаритиб олишдан аввал нутк сигнали кийматлари М=128га тенг булак сегментларга ажаратилиб, Qi сегментга узлаштирилади. Ушбу сегментлардаги жимлик холатини

APRIL 27-28, 2023

aHHK^am ynyH x,ap öup cerneHTHHHr энергнaсн xHCoG^aHagu. HyTKHHHr энергннсн -

a»paTH.nraH cox,aHHHr ro3acuHu xucoGnaMgu.

N

(l)

i = 0

Ey epga E - HyTKHHHr энеpгнaсн, Qi - cerneHTHHHr KHHMaT.napH.

^yMugaru pacMga Hyr; curaa.n.napHgaH »hm^hk cox,a.napHHH a»paTuö oaum anropHTMH Ke^Tupu^raH.

4. @реüмnарга awapmnrn. Hyr; curaa^ugaH »HM^HK ^o^aT^apu MyKOTHnraHgaH cyHr Hyr; curHa^HHH ;aHTa cerneffraam HaTH»acuga $peHM.napra a»paTum 3apyp. OpeÖM^am GocKHH^apuga gacxnaG curaa.n.napra um^OB öepum MaKcaguga Mat^yM öup TeHr öy^aK^apra a»pamnaflu(3-pacM).

A

III L 1 1 1 ^LLIj Wffflfffjfpr —! ! i i i i i i i i i i i i i i i i 1 i i —!—1—!—!—1—!—!—i—!—!— t

, * | * , '<*"■ | > , * 11 ' | | M «an^ M ; | ; -uaaa j—i j 1 12000

Li Lz Lb 1_4 LS Le L?...............................Lk

APRIL 27-28, 2023

3-pacM. HyTK curaannapuHH ^peÜMnam. OnuG GopunraH TagKHKOT HaTH^anapura Kypa, cerneHTnam ynnaMH L=256 TaHnaHgH. ^HcKpemam nacTOTacH 16 kFU, ga e3HnraH HyTK cHrHanHHHHr cerneHTnam ynnaMH L=256 GynraHga, KoTenHHKOB TeopeMacH mapraapura moc KenagH Ba ymGy KHÜMaraapga Kyragponu npo^ccopnapga cerneHTnam ynnaMH M=256 GynraH ^peÜMnapra am^OB Gepum MaKcHMan

Te3Kop^HKHH TatMUHnaMgu

5. Henning(XeHHum) oüuacuöau ym^a3urn. CPHEga KynnaG oMHanap KynnaHHnagu BapTneir, B^KMaH, HeGwmeB, XeHHHHr, KaM3ep Ba Xэммннгnap mynap ^yMancHgaHgHp[1,2]. fflynapgaH HyTK cHrHannapura HmnoB Gepumga Хэммннг Ba XeHHHHr oÜHanapu KeHr KynnaHHnagu BH3HHHr aMHaH XeHHHHr oÜHacuHH TaHnamHMH3gaH MaKcag gh3 ^oMganaHaguraH KHcKa BaKTnH Oypbe y3rapTHpHmHga(STFT-short time Furier transform), OHHagaH yTKa3Hmga curaanHHHr GomH Ba oxupu TynHK Honb KHÜMaTura TeHr Gynumu KepaK.

, . t 2nn \

a(n) = 0.5 (1 - cos(^-j))

(2)

ByHga, N - oMHanap KeHrnuru. XeHHHHr oÜHacuHH ymGy ^opMyna epgaMHga H^onanamHHHr aMnnmyganu Ba HacroranH KypuHumu 2.4-pacMga KenrapunraH.

2.4-pacM. XeHHHHr oÜHacuHHHr aMnnmyga Ba HacTOTanH u^ogacu. ByHgaH KypuHuG TypuGguKH, curaan TaKcHMnaHHm gapa^acu -31.5 gBHH TamKHn этagн [2, 3].

6. ^uc^a eaymnu Oypbe anMammupum. y KyMugaru ^opMyna opKanu aHHKnaHagu STFTX = STFT[x[n]} = X[k,n] = ^ x[m]w[m - n]e-jkm (3)

7. YnnaMnapHU ^u^apmupurn. Curaan ynnaMnapuHH KHcKapHTHpumga cuHrynap eMum ycynugaH ^oMganaHungu. CuHrynap eMum (HHr. Singular Value Decomposition, SVD) - Gy xaKHKHÜ MaTp^aHH KaHOHHK maKnra Kenrapum MaKcaguga geK0Mn03^Hflgup. SVD MaTp^anap GunaH amnamga ^yga xaM KynaM ycyngup, GyHgaH TamKapu MaTp^anap ycraga aMannap пpoцeccop caMapagopnuruHH x,aM omupagu. y MaTp^aHH reoMeTpHK cTpyKTypacHHH KypcaTagH Ba MaB^yg MabnyMOTnapHH ^KKon TaKgHM KHnum hmkohhhh GepagH. SVD TypnH

m=-m

APRIL 27-28, 2023

хил масалаларни х,ал килишда - энг кичик квадратлар усулида якинлашиш ва тенгламалар системасини ечишдан тортиб сигналларни сикиш ва фильтрлашгача кулланилади.

8. Формант частоталарини аницлаш. Сухандонга боглик булган нут; буйрукларини танишда формант частоталарини кушимча параметр сифатида олиш яхши ахамият касб этади. Бу эса уз навбатида таниб олиш аниклик фойизини ошишига олиб келади.

9. MFCC цийматларини олиш. MFCC энг кенг таркалган коэффициентлардан булиб, инсон эшитиш тизимининг чизикли булмаган таъсирини аппроксимациялайди. Инсон идроки билан олиб борилган тажрибалар шуни курсатдики, соф тонлар каби стимуллар учун базиляр мембрана буйлаб максимал кучишнинг полати тон частотасининг логарифмига пропорсионалдир[3,4]. Бу эса уз навбатида ушбу коэффициентлар инсон эшитиш тизимига жуда х,ам якинлигини билдиради.

10. Белгиларнинг мувофицлигини текшириш ва таниб олиш. Ягона белгилар векторида ажратиб олинган нутк буйруклари дастлаб мувофиклиги текширилади ва мослиги аникланса у таниб олинади. Ушбу боскичида нутк буйрукларини турли синфлаш ва кластерлаш масалаларини ечиш оркали амалга оширилади. Бизнинг х,олатда Яширин Марков моделига асосланган модельдан фойдаланилди.

Барча мавжуд нуткни таниб олиш ва овозли бошкарув тизимлари ухшаш тузилишга эга булиб, дастлабки ишлов бериш, акустик модуль ва лингвистик модуллардан ташкил топади. Акустик модулда асосан, Гаусснинг аралашмаларига асосланган Марковнинг яширин моделларидан ёки сунъий нейрон тармоклари фойдаланилади.

Сунъий нейрон тармокларига асосланган алгоритмларини амалга ошириш х,исоблаш тизимидан юкори самардорликни талаб килишини х,исобга олиб, нутк буйрукларини реал вакт режимида таниб олиш тизимини ишлаб чикиш учун яширин Марков занжирига асосланган алгоритм аппарат-дастурий платформага мосланди. Ушбу алгоритм алох,ида нутк буйрукларини таниб олишда 95% аниклик курсатди.

REFERENCES

1. Д. В.П., MATLAB 6.5 SP1/7 +Simulink 5/6. Обработка, Москва: М.: СОЛОН-пресс, 2005, p. 576 с.

2. С. А.Б., Цифровая обработка сигналов: учеб. для вузов, Санкт Петербург: Питер, 2003, p. 604 с.

3. "https://ru.wikipedia.org/wiki/Оконное_преобразование_Фурье#Окно_Ханна_(Хеннинг а)" [Online].

4. S. B. D. a. P. Mermelstein, "Comparison of parametric representations for," IEEE Trans. on Acoustics, Speech and Signal Processing, no. vol. 28, pp. pp. 357-366, 1980.

i Надоели баннеры? Вы всегда можете отключить рекламу.