Научная статья на тему 'Сучасныя тэхналогіі ў пераўтварэнні тэкставай інфармацыі ў маўленне: сінтэзатары маўлення па тэксце'

Сучасныя тэхналогіі ў пераўтварэнні тэкставай інфармацыі ў маўленне: сінтэзатары маўлення па тэксце Текст научной статьи по специальности «Строительство и архитектура»

CC BY
91
12
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СИСТЕМЫ СНТЕЗА РЕЧИ / КОМПЬЮТЕРНЫЕ ТЕХНОЛОГИИ / ОЦЕНКА КАЧЕСТВА / СИНТЕЗ / ТЕКСТОВАЯ ИНФОРМАЦИЯ

Аннотация научной статьи по строительству и архитектуре, автор научной работы — Зяноўка Яўгенія Сяргееўна

У дадзеным артыкуле разглядаюцца сістэмы сінтэзу маўлення (ССМТ) як праграмны прадукт для агучвання тэкставай інфармацыі. Праведзена падрабязная характарыстыка выкарыстання з апісаннем структуры, відаў і сферы прымянення ў сучасным свеце. Апісаны магчымыя метады ацэнкі якасці сінтэзаванага маўлення і прыведзены прыклады найбольш вядомых сістэм сінтэзу маўлення для розных моў. Сістэма сінтэзу маўлення гэта тэхналогія, якая дазваляе пераўтвараць уваходную тэкставую інфармацыю ў агучанае маўленне. Галоўная задача дадзеных сістэм канвертацыя тэксту ў маўленне, якое не павінна адрознівацца ад натуральнага. Гісторыя распрацоўкі сістэм сінтэзу маўлення пачалася яшчэ ў XVIII ст., але большая частка даследаванняў датычыцца ХХ ст. у сувязі са стварэннем і развіццём вылічальнай тэхнікі. Механізм ССМТ складаецца з двух этапаў: гэта канвертацыя “графема фанема” і генерацыя гукавога файла. Навукоўцы выдзяляюць тры падыходы да стварэння ССМТ у залежнасці ад апрацоўкі гукавога сігналу: гэта фармантны, артыкуляцыйны і канкатэнатыўны. Асноўнымі крытэрыямі ацэнкі натуральнасці сінтэзаванага маўлення лічацца разборлівасць і натуральнасць маўлення, ацэнка працы асобных модуляў сістэмы і ацэнка пазнавальнасці, разумення сэнсу, выразнасці і эмацыйнасці. На сённяшні дзень ССМТ разглядаецца як асобны напрамак даследаванняў і таксама мае шырокі патэнцыял прымянення ў такіх галінах, як лінгвадыдактыка, вакальны маніторынг, тэлекамунікацыйныя паслугі, мультымедыя і г. д.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Сучасныя тэхналогіі ў пераўтварэнні тэкставай інфармацыі ў маўленне: сінтэзатары маўлення па тэксце»

Труды БГТУ, 2018, серия 4, № 1, с. 77-83

77

УДК 004.934.5

Я. С. Зяноука

Аб'яднаны шстытут праблем шфарматыю Нацыянальнай акадэми навук Беларусi

СУЧАСНЫЯ ТЭХНАЛОГ11 У ПЕРАУТВАРЭНН1 ТЭКСТАВАЙ 1НФАРМАЦЫ1 У МАУЛЕННЕ: С1НТЭЗАТАРЫ МАУЛЕННЯ ПА ТЭКСЦЕ

У дадзеным артыкуле разглядаюцца сютэмы сштэзу маулення (ССМТ) як праграмны прадукт для агучвання тэкставай шфармацыг Праведзена падрабязная характарыстыка выкарыстання з ашсаннем структуры, ввдау i сферы прымянення у сучасным свеце. Ашсаны магчымыя метады ацэнкi якасцi сiнтэзаванага маулення i прыведзены прыклады найбольш вядомых сiстэм сiнтэзу маулення для розных моу.

Сiстэма сiнтэзу маулення - гэта тэхналопя, якая дазваляе пераутвараць уваходную тэкставую шфармацыю у агучанае мауленне. Галоуная задача дадзеных астэм - канвертацыя тэксту у мауленне, якое не павшна адрознiвацца ад натуральнага. Псторыя распрацоуш сiстэм сштэзу маулення пачалася яшчэ у XVIII ст., але большая частка даследаванняу датычыцца ХХ ст. у сувязi са стварэннем i развiццём вьшчальнай тэхнiкi.

Механiзм ССМТ складаецца з двух этапау: гэта канвертацыя "графема - фанема" i генерацыя гукавога файла. Навукоуцы выдзяляюць тры падыходы да стварэння ССМТ у залежнасщ ад апрацоум гукавога сiгналу: гэта фармантны, артыкуляцыйны i канкатэнатыуны. Асноуным крыгэрыямi ацэнк1 натуральнасцi сiнтэзаванага маулення лчацца разборл1васць i натуральнасць маулення, ацэнка працы асобных модуляу сютэмы i ацэнка пазнавальнасцi, разумення сэнсу, выразнасщ i эмацыйнасщ. На сённяшт дзень ССМТ разглядаецца як асобны напрамак даследаванняу i таксама мае шырою патэнцыял прымянення у таких галiнах, як лшгвадыдактыка, вакальны манггорынг, тэлекамуткацыйныя паслугi, мультымедыя i г. д.

Ключавыя словы: сiстэмы сштэзу маулення па тэксце, камп'ютарныя тэхналогп, ацэнка якасцi, сiнтэз, тэкставая i электронная шфармацыя, канвертацыя.

Ya. S. Zianouka

The United Institute of Informatics Problems of National Academy of Sciences of Belarus

COMPUTER TECHNOLOGIES IN CONVERTING TEXT DATA INTO SPEECH: TEXT-TO-SPEECH SYNTHESIZERS

The article describes text-to-speech systems (TTS) as a software which converts language text into speech with its structure, types and quality evaluation. It also depicts its sphere of application and the most popular examples.

The main task of text-to-speech systemsis to convert text information into speech, which should not be different from the natural one. The history of the development began in the XVIII century. But most of the research concerns the twentieth century in connection with the creation and development of computer technology.

TTS mechanism consists of two stages: the conversion of "grapheme-to-phoneme" and generation of a sound file. Scientists distinguish three approaches to creating TTS depending on the audio processing. These are formant, articulation and concatenation synthesis.The main criteria for evaluation of the naturalness of the synthesized speech are intelligibility and naturalness of speech, the assessment of individual system's modules and evaluation of awareness, understanding of the meaning, clarity and emotion. TTS is treated as a separate field of research and therefore has broad potential as a part of another areas such as linguodidactics, vocal monitoring, telecommunications, multimedia, etc.

Key words: text-to-speech systems, computer technologies, quality evaluation, synthesis, text and electronic information, conversion.

Уводзшы. У апошшя гады спецыялюты самых розных абласцей праяуляюць усё большую защкауленасць да вывучэння тэхналогш у розных сферах дзейнасщ, уключаючы фанетыку су-часнай беларускай мовы. Варта падкрэслщь, што назiраецца штэнаунае развщцё у галше тэа-рэтычнага i прыкладнога даследавання маулення, якое ахоплiвае таюя напрамю, як мадэляван-

не артыкуляцыйных i перцэпцыйна-слыхавых працэсау, аУдыёвiзуалiзацыi маулення, фарм> раванне баз мауленчых даных i мауленчых фондау, гаворка у шумах i перашкодах, маулен-чыя камп'ютарныя дыялогавыя сютэмы, фане-тычныя аспекты дыялога з камп'ютарам, аута-матызаваныя i пауаутаматызаваныя сютэмы 1дэт,ыф1кацш i верыфшацыи, яюя агучваюць

78

Сучасныя тэхналогп у пераутварэнш тэкставай iнфapмauыi у мауленне

шфармацыю, мауленчыя экспертныя сютэмы, мауленчыя навучальныя сютэмы, аналiз i сiнтэз маулення на базе новых тэхналогш.

Асноуная частка. Сёння камп'ютарныя тэхна-логii займаюць вядучую ролю у шфармацыйным асяроддзг Адным з важных накрункау ix прымя-нення з'яуляецца распрацоука сютэм сiнтэзу маулення, яюя аутаматычна апрацоуваюць элект-ронныя тэксты у мауленне. Сютэмы антэзу i распазнавання маулення (ССМТ) - гэта сiстэмы, здольныя агучваць апрацаваны тэкст, пераутва-раць мауленне у тэкст, выконваць пераклад з адной мовы на iншую, ажыццяуляць камуткацыю пам1ж чалавекам i камп'ютарам з дапамогай толью голасу i г. д. [1]. Сярод гэтых сютэм асобае месца займае сiнтэзатар маулення па тэксце (СМТ). Гэта камп'ютарная сютэма, якая пераутварае адвольны тэкст, незалежна ад таго, яюм чынам ён уведзены, у гукавы файл праз выкарыстанне спецыяльных праграмных сродкау [9]. Высакаякасныя ССМТ маюць шырою патэнцыял прымянення [9]. Сёння сiнтэзатар маулення знаходзщь самае шырокае прымяненне у разнастайных сферах народнай гас-падарю, навую, культуры, медыцыны, адукацш i шш. Узгадаем найбольш вядомыя.

• Тэлекамушкацыйныя паслугi. ССМТ даз-валяюць перадаваць тэкставую iнфармацыю праз тэлефонную лшю. Больш за 70% тэлефон-ных размоу патрабуюць нiзкi узровень камуш-кацыi, што дазваляе выкарыстоуваць сштэзата-ры маулення як сродак агучю неабходных паве-дамленняу. Гэта датычыцца агучкi электроннай чаргi, разнастайных анонсау, iнфакiёскау i г. д.

• Лшгвадыдактыка. Высакаякасны сiнтэз можа спалучацца з сiстэмамi камп'ютарнага на-вучання i служыць карысным iнструментам для вывучэння мовы. Аудыявiзуалiзацыя пашырае магчымасщ успрымання новага матэрыялу як на слых, так i вiзуальна.

• Дапамога людзям з абмежаванымi здоль-насцямi. Машыны могуць быць неацэнным срод-кам перадачы маулення з дапамогай спецыяльна распрацаванай клавiятуры i хуткай праграмы зборкi сказау. Сiстэмы сштэзу маулення у спалучэннi з аптычнымi сiстэмамi распазнання прадастауляюць доступ да тсьмовай шфармацш. Рынак праграм для сляпых карыстальнiкау у xуткiм часе папоунщца сiнтэзатарамi маулення у камплекце з гукавымi картамi. На сённяшш дзень ужо вядомыя гукавыя карты DECtalk апошняй версii SoundBlaster (NTM), хоць яшчэ не у фармаце, карысным для сляпых людзей.

• Аудыякшп i гаворачыя цацю. Сёння усё большая колькасць людзей аддае перавагу агучаным кнiгам замест друкаваных цi электронных крынiц. Таму з'явшася неабходнасць запюу матэрыялау. Прыцягненне новых дыктарау, на жаль, цалкам не вырашае пытанне па агучцы вялшх аб'ёмау

тэксту, таму што гэта даволi доуп i складаны працэс. Ад усix дыктарау патрабуецца высок узровень прафесiйнасцi i прад'яуляюцца такя крытэрыi, як добра пастаулены голас, падтрыман-не адзiнага тэмпу i xуткасцi агучвання, магчы-масць зашсу вялiкix аб'ёмау тэксту i г. д. Таксама неабходна улiчваць умовы, у яюх адбываецца запiс. Усе ператчаныя пытант здымае сштэзава-нае мауленне, якое дазваляе эканомiць час, скара-чаць затраты на дыктарау i абсталяванне.

• Вакальны машторынг. У некаторых вы-падках вусная шфармацыя з'яуляецца больш эфектыунай, чым пiсьмовыя паведамленнi. Гэта дазваляе засяродзщь увагу як на вiзуальныx, так i на гукавых сродках шфармацьп. Адсюль iдэя уключэння сiнтэзатарау у вымяральныя або кiраунiчыя сiстэмы.

• Мультымедыя, дыялог пам1ж чалавекам i машынай. Распрацоука высакаякасных СМТ з'яу-ляецца неабходным крокам (як i удасканаленне сiстэм распазнавання маулення) у напрамку больш канчатковых сродкау камушкацып пам1ж чалавекам i камп'ютарам. Мультымедыя - гэта першы, але шматабяцальны крок у гэтым юрунку.

• Фундаментальныя i прыкладныя даследа-ваннi. Сiнтэзатары маулення з'яуляюцца выдат-нымi лабараторнымi iнструментамi для лшгвю-тау. Яны дазваляюць вывучаць i даследаваць розныя аспекты тэарытычнага i практычнага працэсу маулення, уключаючы эфектыунасць iнтанацыйныx i рытмiчныx мадэляу. Напрык-лад, фармантны тып сютэм шырока ужываецца фанетыстамi для вывучэння маулення у рамках акустычных правшау.

Калi ж звярнуцца да псторыи пытання, то трэ-ба у першую чаргу прыгадаць, што у канцы XVIII ст. дацю вучоны Хрысцiян Карцэнштайн стварыу мадэль мауленчага тракту чалавека, якая магла прамауляць некалькi галосных гукау. Далей з канца XVIII - пачатку XIX ст. шэраг прац В. Кампелена, Ч. Уiтстана i А. Бэла дазволш атрымаць сiнтэзаванне галосных i амаль усix зычных гукау, а Д. Фабер рэашзавау спробу сiнтэзавання спевау. Развiццё у XX ст. электрош-кi i вылiчальнай тэxнiкi дазволiла атрымаць якасныя прыклады сiнтэзаванага маулення [4]. У 1930-х гг. супрацоунЫ лабараторый Бэла (BellLabs) распрацавалi вакодэр - электронны сштэзатар маулення для тэлефоннай сети. У 1960-х гг. Г. Фант распрацавау фармантны сштэзатар, з дапамогай якога у будучым былi упершыню атрыманы прыклады сiнтэзу рускага маулення высокай якасцi Б. М. Лабанавым i iнш. [2]. На працягу 70-90-х гадоу ХХ ст. усталявалiся асноуныя метады сiнтэзу маулення: фармантны, м^ахвалевы i камтляцыйны. У 1990-х гг. былi пабудаваны першыя мадэлi даступных для карыс-тальнiкау камерцыйных сштэзатарау па тэксце,

нaпpыклaд DIGALO (www.digalo.com). У i999 г. y 1нстытуце тэxнiчнaй кiбepнeтыкi (зapaз All II HAH Бeлapyci) 6ыу pэaлiзaвaны шмaтгaлacaвы ciнтэз pycкaгa мayлeння na тэк^е, a тaкcaмa crn-тэз бeлapycкaгa, пoльcкaгa i yкpaiнcкaгa маулен-ня, a нa пpaцягy 2000-2007 гг. Удакладнялюя на-вyкoвыя aлгapытмы pacnpa^yra ciнтэзaтapay мayлeння na тэкcцe для cлaвянcкix мoУ [б].

Пачатак cyчacнaй гicтopыi мayлeнчыx да^е-даванняу y СССР дaтyeццa cяpэдзiнaй 60-x гг. ХХ ст., кош yпepшыню пачала пpaцaвaць Уceca-юзная шкoлa-ceмiнap па аутаматычным paOTaBm-вaннi cлыxaвыx выяу (AРСВ), якая збipaлa y леп-шыя гады да 300 удзельшкау. Да гэтага ж 4acy адгоицца i пaчaткoвы этап paзвiцця мауленчьк дacлeдaвaнняy y Бeлapyci. У 1965 г. y нaвyкoвaй лaбapaтopыi кафель paдыёпpыёмныx пpылaд Miнcкaгa paцыётэxнiчнaгa шстытута пад rapay-шцгвам Б. М. Лабанава была apгaнiзaвaнa гpyna па дааледаванш мayлeнчыx ciгнaлay. У той 4ac y яе Увaxoдзiлi M. П. ДзeгцяpoУ, Б. В. Панчанка, М. К. Фацееу i iнш., якiя яшчэ дoyгi 4ac, а некато-pыя з ix i зapaз пpaцyюць y гэтым на^унку.

У нашай кpaiнe пpaктычнaя pэaлiзaцыя cici3-мы ciнтэзy маулення звязана з pacпpaцoУкaй пpыcтacaвaння "Фaнeмaфoн-i" y i97i г. З кoжнaй давай вepciяй якacць ciнтэзaвaнaгa тэкcтy паляп-шaлacя. Так, y i 975 г. з'явiycя "Фaнeмaфoн-2", а yжo "Фaнeмaфoн-3" быу пpaдcтayлeны на выста-ве 'Telecom" y Жэневе. Ён aтpымay вeльмi выто-кiя вoдгyкi з 6oRy iншыx кpaiн-yдзeльнiц: rep-мани, Фpaнцыi, 1талй, ЗШA i шш. [6]. Ha Сycвeт-ным кaнгpэce фaнeтычныx навук y i987 г. cвeт пабачыу "Фaнeмaфoн-4", пpaцa ятога зacнaвaнa на фaнeмнa-aлaфoнным метадзе. Тагеама у iм пpaдyглeджвaлacя ciнтэзaвaннe не толью муж-чынcкiм, але i жадачым гoлacaм.

Бeлapycкiмi pacпpaцoyшчыкaмi ciнтэзaвaнa-га маулення у мeжax выканання пpaeктa "Сш-тэз выpaзнaгa маулення на базе глыбoкaгa crn-такшчнага aнaлiзy чытаемага тэкcтy" (гpaнт БРФФД - РФФД на 2009-20ii гг.) yпepшыню cтвopaнa двyxмoУнaя cicтэмa ciff^y выpaзнaгa маулення на бeлapycкaй i pycкaй мoвax, якая дэмaнcтpaвaлacя на шэpaгy нaвyкoвa-тэxнiчныx выcтay. У гэтыя ж гады пpaвeдзeны вялiкi аб'ём дacлeдaвaнняy, нaкipaвaныx на pacпpaцoyкy бе-лapycкaмoyнaй мaдэлi ciнтэзy маулення. Acroy-ную poлю у cтвapэннi ciнтэзaтapa бeлapycкaгa маулення aдыгpaлi дacлeдaвaннi i parapa^yri Ю. С. Гeцэвiчa, як зapaз з'яуляецца загадчыкам лaбapaтopыi pacпaзнaвaння i ciнтэзy маулення Aini HAH Бeлapyci [6]. Пачынаючы з 20ii г. i па cённяшнi дзень, лaбapaтopыя pacпaзнaвaння i ciнтэзy маулення пpaвoдзiць тэapытычныя i пpaктычныя дacлeдaвaннi у дадзенай вoблac-цi [7]. Ужo pacпpaцaвaныя бeлapycкaмoУны crn-тэзaтap для cтaцыянapныx плaтфopм "Мульты-фoн", ciнтэзaтap маулення для мaбiльныx плат-фopм i iнтэpнэт-вepciя ciнтэзaтapa [8].

Пpaцэдypa кaнвepтaцыi тэкcтy у мауленне cклaдaeццa з двyx acнoУныx этапау. Пepшы уяу-ляе caбoй aнaлiз yвaxoднaй iнфapмaцыi, дзе тэкcт тpaнcкpыбipyeццa у фанетычнае пpaдcтay-ленне, а дpyгi - гeнepaцыя мayлeнчыx агналау, дзе адбываецца вывад aпpaцaвaнaй iнфapмaцыi у выглядзе гyкaвoгa файла (гл. cxeмy нiжэй) [ii]. Пepшaпaчaткoвa пacлядoyнacць ciмвaлay аналь зуецца i aпpaцoyвaeццa у ix фанетычнае ^ад-стауленне, якoe звычайна aдлюcтpaвaнa у выглядзе пacлядoyнacцi фанем з до^т^вай iнфap-мацыяй для вызначэння ^ав^ьной iнтaнaцыi. Дадзены фeнoмeн называецца пepayтвapэннямi "тэкcт - фанема" i "графема - фанема".

Aгyльнaя cтpyктypa астэм антэзу маулення [i2]

80

Cyчacныя тэxнaлoгü у пepayтвapэннi тэкcтaвaй môapMaubii у мayлeннe

Дpyгi этaп cклaдaеццa з re^pa^ii фaнетыч-нaгa пpaдcтayлення тэкcтy y лiчбaвы ciгнaл з выкapыcтaннем aлгapытмay ciнтэзy. Кожнaя фaнемa пеpayтвapaеццa y acобнyю aдзiнкy гуавой бaзы дaныx. Taкiм чытам, нa гэтым кpокy блок кaнкaтэнaцыi cчытвaе фaнемы aднy зa aд-ной з paдкa вывaдy фaнем. Для кожнaй тaкой фaнемы nparpaMa выбipaе aдпaведнyю гyкaвyю aдзiнкy y гутавой бaзе дaныx, потым yœ anpa-цaвaныя фaнемы злyчaюццa aднa з aдной i aд-бывaеццa вывaд мayленчaгa ciгнaлy.

HaвyкоУцы выдзяляюць тpы acноУныя пады-xоды дa aпpaцоyкi мayленчaгa ciгнaлy CMT [3]:

1) apтыкyляцыйны ciнтэз, якi зacнaвaны нa фiзiчнaй мaдэлi aпicaння фiзiялогii мовa- i гу-кayтвapэння y мayленчым aпapaце з yлiкaм звеогак aб apтыкyляцыi, што выкapыcтоУвaюц-вд для колькacнaй aцэнкi фоpмы мayленчaгa aпapaтy, яго pэзaнaнcныx yлacцiвacцей i xapa^ тapыcтык гyкaвыx кpынiц. А^о^ьы пapaмет-pы - гэтa пaзiцыя i кiнемaтыкa apтыкyлятapa. Вымayлены гук вылiчвaеццa згоднa фiзiчнaмy ypayненню. Дaдзены ciнтэзaтap выкapыcтоyвa-еццa дaволi pэдкa y cyвязi з вялiкiмi выдaткaмi, тaмy што кaмп'ютapныя, тэapытычныя i ^ax-тычныя зaдaчы яшчэ цaлкaм не выpaшaны;

2) фapмaнтны шнтэз, якi yяyляе caбой am-caльны, aкycтычнa-фaнетычны пaдыxод дa crn-тэзaвaнaгa мayлення. Пpы фapмaнтным ciнтэзе мaдэлююццa aкycтычныя xapaктapыcтыкi May-ленчaй xвaлi зaмеcт фiзiялaгiчныx пpaцэcay мо-вayтвapэння. У дaдзеным выпaдкy мaдэлююццa гaлоУныя aкycтычныя acaблiвacцi мayленчaгa ciгнaлy. Пaд фapмaнтaй paзyмеюццa чacтотныя pэзaнaнcы мayленчaй aкycтычнaй cicтэмы. na-paметpы фapмaнтay (чacтaтa, шыpыня, yзpо-вень) вызнaчaюццa aкycтычнымi yлacцiвacцямi cicтэмы. Haйбольш вaжны пapaметp - чacтaтa фapмaнты, ятая цеcнa звязaнa з геaметpычнaй кaнфiгypaцыяй мayленчaгa aпapaтy. Пaколькi y ^auare гaвоpкi кaнфiгypaцыя мayленчaгa arn-paтy змяняеццa, то aдпaведнa змяняюццa фap-мaнтныя чacтоты [3];

3) кaнкaтэнaтыyны ciнтэз мaдэлюеццa пa мayленчым шгшле, якi aпpaцaвaны мayленчaй бaзaй дaныx. Сегментaвaнaя бaзa дaныx cтвоpa-та для aдлюcтpaвaння гaлоУныx фaнaлaгiчныx xapaктapыcтык мовы. У кaнкaтэнaтыyным crn-тэзе выкapыcтоyвaюццa элементapныя aдpэзкi нaтypaльнaй мayленчaй xвaлi. У дaдзеным вы-пaдкy aдcyтнiчaе неaбxоднacць мaдэлявaння cклaдaныx a^craramix пpaцэcay мовaУтвapэн-ня. Скaмпiлявaны ciгнaл, cклaдзены з cегментay нaтypaльнaгa мayлення, дaдaтковa aпpaцоyвa-еццa, кaб зглaдзiць пеpaxоды пaмiж aб'яднaны-mí aдpэзкaмi i змянiць пpacaдычныя xapaxra-pыcтыкi y aдпaведнacцi ca знaчэннямi, яюя a^ pымaлicя нa этaпе пpacaдычнaй aпpaцоyкi.

Сiнтэз мayлення можa paзглядaццa як ^гг-paмны пpaдyкт, дa якогa пpaд'яyляюццa пэуныя пaтpaбaвaннi y пэyныx yмовax i для пэутай зa-дaчы. Зaдaчa aцэнкi я^од ciнтэзaвaнaгa May-лення цеcнa пеpaплятaеццa з тэcцipaвaннем crn-тэзу мayлення як кaмп'ютapнaй пpaгpaмы [5]. Сяpод зaдaч, для выpaшэння якix можa ^ымя-няццa cicтэмa aцэнкi я^од ciнтэзaвaнaгa May-лення, вылyчaюццa нacтyпныя[4].

• Tэcцipaвaнне cicтэмы ciнтэзy y пpaцэcе яе pacпpaцоyкi.

Гaлоyнaя зaдaчa тaкогa тэcцipaвaння - rnc-тупше пaляпшэнне пapaметpay cicтэмы. Сютэ-Ma пaвiннa быць ayтaмaтычнaй, гэтa зшчыць фyнкцыянaвaць без удзелу чaлaвекa; мець дac-тaтковa выcокyю xyткaдзейнacць; мець мaгчы-мacць aцэньвaць ciнтэзaвaнaе мayленне як aдпa-веднacць голacy кaнкpэтнaгa дыктapa, тaк i aд-шведю^ь aгyльныx пapaметpay мayленчaгa ciгнaлy. Для aцэнaчнaгa aнaлiзy дacтyпныя вы-нш ycix этaпay ciнтэзy, i пpaвеpкa можa a^i^ цяyляццa з выкapыcтaннем пpaмежкaвaй iнфap-мaцыi, згенеpaвaнaй cicтэмaй y вiдaвочным выглядзе.

• Ацэнта yлacнaй cicтэмы ciнтэзy мayлення y пapayнaннi з кaнкypэнтaмi.

Пpы aцэнцы yлacнaй cicтэмы aдбывaеццa пapayнaнне pозныx cicтэм ciнтэзy нa pозныя га-лacы. Для гэтaгa можa пpымяняццa як ayraMa-тычнaя дыктapaнезaлежнaя aдзнaкa, тaк i aua^ кa экcпеpтay. У дaдзеным тэcцipaвaннi можa быць ycклaднены доcтyп дa вынiкay шнтэзу: для кaмеpцыйныx пparpaм звычaйнa дacтyпныя толькi iнтэpaктыyныя дэмa-веpcii, пpы дaпaмо-зе якix можнa aтpымaць yзоpы ciнтэзaвaнaгa мayлення дaволi нiзкaй яга^, з фонaвaй музы-кaй aбо iншымi aбмежaвaннямi y мэтax aбapо-ны aд кaмеpцыйнaгa выкapыcтaння, щ дacтyп-ныя толькi зaгaдзя пaдpыxтaвaныя пpыклaды гyчaння. Для кapэктнaгa пapayнaння вынiкay пpaцы ciнтэзaтapay неaбxоднa выкapыcтоyвaць ix поУнaфyнкцыянaльныя веpcii.

• Удзел y rarnypcax, якiя пpaводзяццa незa-лежнымi кaмпaнiямi.

У тaкix yмовax cicтэмa aцэнкi можa быць не a^raMa^m^^ aле ayтaмaтызaвaнaй. ^ы-цягвaюццa вялiкiя чaлaвечыя pэcypcы (та-пpыклaд, зaцiкayленыя кapыcтaльнiкi irngp-нэту). ^ы гэтым yнyтpaнaя cтpyктypa cicтэм ciнтэзy i зacтaнеццa зaкpытaй, aле мaеццa мaгчымacць aтpымaння пpaмежкaвыx вынiкay ^a^i cicтэмы вa yнiфiкaвaным выглядзе, ^ы зaцiкayленacцi y гэтым caMix удзельштау конкypcy. CCMT могуць тэcцipaвaццa та aд-ной i той жa мayленчaй бaзе, з выкapыcтaннем якой будуецвд ciнтэзaвaны голac. Mожa пpымяняццa тaкcaмa этaлоннaя aдзнaкa пpы пapayнaннi з дыктapaм-донapaм.

Асноунымi aгульнaпpынятымi MepaMi правер-Ki якaсцi шнтэзаванага маулення з'яуляюцца [4]:

1) paзбоpлiвaсць маулення;

2) натуральнасць маулення;

3) ацэнка працы асобных модуляу сютэмы;

4) ацэнка пaзнaвaльнaсцi, разумення сэнсу, выразнасщ, эмaцыйнaсцi.

Якасць маулення - вeлiчыня, якая характа-рызуе суб'ектыуную ацэнку гучання маулення падчас тэсщравання. Рaзбоpлiвaсць маулення -гэта адносная колькасць (у працэнтах) правшь-на прынятых элементау (складоу, слоу, фраз) артыкуляцыйных тaблiц. На aснaвaннi гэтага можна лiчыць, што пад «якасцю» сiнтэзaвaнaгa маулення разумеецца яе натуральнасць, гэта значыць вeлiчыня, якая характарызуе суб'ек-тыуную ацэнку гучання маулення у пapaунaннi з гучаннем натуральнай гаворю.

Акрамя вышэйпepaлiчaных магчымасцей ацэню якaсцi сiнтэзaвaнaгa маулення неабходна таксама улiчвaць мноства фактарау, якiя уплы-ваюць на яго успрыманне. Гэта:

1) умовы, у якiх адбываецца праслухоуван-не сiнтэзaвaнaгa маулення;

2) сютэмныя хapaктapыстыкi камп'ютарна-га абсталявання;

3) вопыт i тpэнipоУкa слухача;

4) лшгвютычная структура паведамлення, складанасць тэксту;

5) якасць затсу мауленчага сiгнaлу i умовы успрымання (гучнасць, шум, iншыя перашкоды i г. д.).

Як бачна, ацэнка якасщ сiнтэзaтapaу маулення - гэта складаны працэс, якi мае суб'ек-тыуны характар, таму што цалкам залежыць ад тэсцipоУшчыкa i умоу правядзення эксперы-менту па праслухоуванш згенераванага гукаво-га файла. На сённяшш дзень aдсутнiчaюць адз> ныя пpaвiлы па тэсцipaвaннi дадзеных сiстэм, таму кожны навуковец вь^рае свой асобны па-дыход для вырашэння дадзенай задачы.

Заключэнне. Таюм чынам, аутаматычны сiнтэз маулення - гэта тэхналопя, якая дазваляе пераутвараць уваходную тэкставую шфарма-цыю у агучанае мауленне. Дадзеныя тэхнaлогii

з'яуляюцца дaволi пaпуляpнымi, таму што сфера iх прымянення дaволi шырокая. Асобны пpывiлeй падобных сiстэм - гэта прастата вы-карыстання: дастаткова увесщ тэкст у дыялога-вае акно, i машына агучыць згенераваны файл. Такога роду узаемадзеянне не патрабуе спецыя-льнай падрыхтоую i значна пaвялiчвae колькасць кapыстaльнiкaу таюх сiстэм. Таксама гэта магчымасць пaвялiчыць хуткасць падчас выка-рыстання камп'ютарау, пазбауляючы ад неаб-ходнaсцi карыстацца клaвiятуpaй пры уводзе тэксту. Сштэз маулення можа ужывацца у сю-тэмах пaдтpымкi беспапяровых тэхнaлогiй (тэкставых файлау), у мауленчых iнтэpфeйсaх для швалщау па слыху i зроку, у сютэмах кам-п'ютарнай тэлефанп (даведачныя службы, моу-ная электронная пошта), у сiстэмaх мауленчага юравання (нaвiгaцыйныя сiстэмы, дыспетчарс-кiя службы), у сютэмах абароны доступу да баз даных (галасавы ключ), у сютэмах для крымша-лiстычнaй экспертызы на аснове голасу i мовы, у нaвучaннi замежным мовам i г. д. [3].

На сённяшш дзень натчваецца вялiкaя колькасць сштэзатарау, якiя апрацоуваюць роз-ныя мовы. Сярод iх варта адзначыць тaкiя сю-тэмы, як AT&T, Nuance, NeoSpeach, Microsoft, IVONASoftware, CereProc, Cepstral, Acapela-Group. Таюя сютэмы сштэзу маулення па тэксце, як Acapela, Vokalizer, RHVoice, ESpeak, Festival, з'яуляюцца якaснымi сpодкaмi апра-цоую рускай мовы. Для беларускай мовы кам-пaнiя Sakrament распрацавала СМТ беларускага маулення для камерцыйных мэт на аснове рускага СМТ. Лабараторыя распазнавання i сiнтэзу маулення А1П1 НАН Бeлapусi на праця-гу апошшх 55 гадоу займаецца paспpaцоукaмi сштэзу маулення па тэксце [7], яюя уключа-юць сiнтэзaтap для стацыянарных платформ "Мультыфон-4", сiнтэзaтap маулення для маб> льных платформ i анлайн сштэзатар [9]. Галоу-ная aсaблiвaсць дадзеных распрацовак, у пры-вaтнaсцi iнтэpнэт-сiнтэзaтapa, - адкрыты доступ, гэта значыць кожны бясплатна можа вы-карыстаць яго, прайшоушы па спасылцы http://corpus.by/TextToSpeechSynthesizer/.

Л^аратура

1. Гeцэвiч Ю. С. Алгарытмы лiнгвiстычнaй aпpaцоУкi тэкстау для сiнтэзу маулення на беларускай i рускай мовах: дыс. ... канд. тэхн. навук. Мшск, 2012. 198 с.

2. Лобанов Б. М. Синтезатор персонализированной речи по тексту «ЛобаноФон-2000» // Тр. Междунар. конф., посвящ. 10-летию рос. эксперим. фонетики, 1-4 февр. 2001 г. / С.-Петерб. ун-т. СПб., 2001. С. 147-153.

3. Лобанов Б. М. Компьютерный синтез и клонирование речи. Минск: Белорус. наука, 2008. 357 с.

4. Соломенник А. И. Оценка качества селективного синтеза речи: методы и результаты: дис. ... канд. фил. наук. М., 2016. 127 с.

5. Русанова О. А. Современные технологии синтеза устной речи [Электронный ресурс]. URL: http://docplayer.ru/38896137-Sovremennye-tehnologii-sinteza-ustnoy-rechi.html (дата обращения: 29.07.2017).

82

Сучасныя тэхналогп у пераутварэнш тэкставай iнфapмauыi у мауленне

6. Лабанау Б. М. Развiццё мауленчых тэхналогш у Беларусi // Лабараторыя распазнавання i сiнтэзу маулення [Электронны рэсурс]. 2016. URL: https://ssrlab.by/b-m-labanau-razviccio-mauliencych-technalogij-u-bielarusi (дата звароту: 02.01.2017).

7. Лабараторыя распазнавання i антэзу маулення [Электронны рэсурс]. 2017. URL: http://ssrlab.by/ (дата звароту: 11.07.2017).

8. Сштэзатар маулення па тэксце [Электронны рэсурс]. 2017. URL: http://corpus.by/ TextToSpeechSynthesizer/ (дата доступу: 01.07.2017).

9. Dutoit T. An Introduction to text-to-speech synthesis. Norwell, MA, USA: Kluwer Academic Publishers, 1997.420 p.

10. Ramteke Surendra P. Development of TTS for Marathi Speech Signal Based on Prosody and Concatenation Approach // International Journal of Engineering Research & Technology (IJERT). 2012. Vol. 1, issue 10. P. 82-89.

11. Flanagan J. L., Rabiner L. R. Speech synthesis. Stroudsburg, Dowden, Hutchinson & Ross, 1973. 173 p.

12. Cole R. Survey of the State of the Art in Human Language Technology. Cambridge: University Press and Giardini, 1997. 166 p.

13. Lambert T., Breen A. A Database design for a TTS synthesis system using lexical diphones // Speech Communication and Technology: proceedings of the 9-th European conference InterSpeech'2004, Jeju Island, Korea, October 4-8, 2004. Jeju Island, 2004. P. 1381-1384.

14. d'Alessandro C., Lienard J.-S. Synthetic speech generation // Survey of the State of the Art in Human Language Technology. Cambrige: University Press, 1996. Chapter 5. P. 155-185.

15. Захарьев В. А. Мультиголосовой синтез речи по тексту для построения естественноязыковых интерфейсов интеллектуальных систем // Открытые семантические технологии проектирования интеллектуальных систем = Open Semantic Technologies for Intelligent Systems: материалы Междунар. науч.-техн. конф. Минск, 16-18 февр. 2017 г.: в 2 ч. / Белорус. гос. ун-т информатики и радиоэлектрики. Минск, 2017. Ч. 1. С. 167-170.

16. Taylor P. Analysis and synthesis of intonation using the tilt model // J. Acoust. Soc. America. 2000. Vol. 107, no. 3. P. 1967-1714.

References

1. Hetsevich Yu. S. Algarytmy lingvistychnay apratsouki tekstau dlya sintezu maulennya na belaruskay i ruskay movakh: dys. kand. tekhn. navuk [Algorithms of linguistic processing for speech synthesis in Bela-rusian and Russian languages. Cand. Diss.]. Minsk, 2012. 198 p.

2. Lobanov B. M. Synthesizer of personalized text-to-speech "LobanoFon 2000". Trudy Mezdunarodnoy konferentsii, posvyashchennoy 100-letiyu rossiyskoy eksperimental'noy fonetiki [Proceedings of the International Conference dedicated to the 100th anniversary of the Russian experimental phonetics], St. Petersburg, 2001, pp. 147-153 (In Russian).

3. Lobanov B. M. Komp 'yuternyy sintez i klonirovanie rechi [Computer synthesis and speech cloning]. Minsk, Belorusskaya nauka Publ., 2008. 357 p.

4. Solomennik A. I. Otsenka kachestva selektivnogo sinteza rechi: metody i rezul'taty: dis. kand. filol. nauk [Evaluation of the selective speech synthesis quality: methods and results. Cand. Diss.]. Moskow, 2016. 127 p.

5. Rusanova O. A. Sovremennye tekhnologii sinteza ustnoy rechi [Modern technologies of oral speech synthesis]. Available at: http://docplayer.ru/38896137-Sovremennye-tehnologii-sinteza-ustnoy-rechi.html (accessed 29.07.2017).

6. Labanau B. M. Razvitstsyo maulenchykh tekhnalogiy u Belarusi [The development of speech technologies in Belarus]. Available at: https://ssrlab.by/b-m-labanau-razviccio-mauliencych-technalogij-u-bielarusi (accesed 02.01.2017).

7. Labaratoryya raspaznavannya i sintezu maulennya [Speech synthesis and recognition laboratory]. Available at: http://ssrlab.by (accessed 11.07.2017).

8. Sintezatar maulennya pa tekstse [Text-to-speech synthesizer]. Available at: http://corpus.by/ TextToSpeechSynthesizer/ (accessed 01.07.2017).

9. Dutoit T. An Introduction to text-to-speech synthesis. Norwell, MA, USA: Kluwer Academic Publishers, 1997.420 p.

10. Ramteke Surendra P. Development of TTS for Marathi Speech Signal Based on Prosody and Concatenation Approach. International Journal of Engineering Research & Technology (IJERT), 2012, vol. 1, issue 10, pp. 82-89.

11. Flanagan J. L., Rabiner L. R. Speech synthesis. Stroudsburg, Dowden, Hutchinson & Ross, 1973.173 p.

fl. C. 3aHoyKa

83

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

12. Cole R. Survey of the State of the Art in Human Language Technology. Cambrige, Cambridge University Press and Giardini, 1997. 166 p.

13. Lambert T., Breen A. A Database design for a TTS synthesis system using lexical diphones. Proceedings of the 9-th European conference InterSpeech '2004 "Speech Communication and Technology". Jeju Island, 2004, pp.1381-1384.

14. d'Alessandro C., Lienard J. -S. Synthetic speech generation. Survey of the State of the Art in Human Language Technology. Cambrige, Cambrige University Press, 1996, chapter 5, pp. 155-185.

15. Zakhar'ev V. A. Multi-voice text-to-speech synthesis for the construction of natural language interfaces of intelligent systems. Materialy Mezhdunarodnoy nauchno-tekhnicheskoy konferentsii "Otkrytye semanticheskie tekhnologii proektirovaniya intellektual'nykh sistem" [Proceedings of the International Scientific and Technical Conference "Open Semantic Technologies for Intelligent Systems"]. Minsk, 2017, part 1, pp. 167-170 (In Russian).

16. Taylor P. Analysisand synthesis of intonation using the tiltmodel. J. Acoust. Soc. America, 2000, vol. 107, no. 3, pp. 1697-1714.

iH^apMa^ra npa ayTapa

3flHoyKa flyremH CapreeyHa - acnipaHT agg3ena cynacHan 6enapycKaM mobm Upmpa gacnegaBaH-Hay 6enapycKaM KynbTypbi, mobm i niTaparypbi, Manogmbi HaByKOBbi cynpa^ymK na6apaTopbii pacna3-HaBaHHa i cim33y MayneHHa. A6'agHaHbi mcrbiTyT npa6neM m^apMarbiKi Ha^iaHanbHaM aKa^Mii Ha-ByK Eenapyci. Ha^iaHanbHaa aKa^Mia HaByK Eenapyci (220072, r. MiHCK, Byn. CypraHaBa, g. 1, Kopn. 2, Рэcпy6пiкa Eenapycb). E-mail: evgeniakacan@gmail.com

Information about the author

Zianouka Yauhenia Siarheeuna - PhD student, the Department of Modern Belarusian Language, Junior Researcher of Speech Synthesis and Recognition Laboratory. The United Institute of Informatics Problems of National Academy of Sciences of Belarus (1, housing 2, Surganova str., 220072, Minsk, Republic of Belarus). E-mail: evgeniakacan@gmail.com

nacmyniy 10.01.2018

i Надоели баннеры? Вы всегда можете отключить рекламу.