Kõnesüntesaatori naishääl. Tekst kõneks (TTS) kõnesüntesaatorid

Ilja Morozovi välja töötatud Balabolka on mõeldud teksti taasesitamiseks heli kujul. Programm on meeldiva ja mugava mitmekeelse liidesega keskkond teksti kõneks teisendamiseks. Inimkõne taasesitamise eest vastutavad otseselt kõnesüntesaatorid, mis laaditakse eraldi alla ja installitakse arvutisse. Sellel saidi https://saidi lehel saate Balabolka legaalselt tasuta alla laadida koos vene häälega, ilma registreerimise ja SMS-ideta. Sel juhul ei pea te häkkima ei rakendust ega kõnemootorit, otsima klahvigene ja pragusid ning seejärel ei pea te viirustega võitlema. Kõik siin on viirusevaba, tasuta, seaduslik ja seaduslik.

Miks Balabolka, selle eelised, konkurendid ja vajalikud komponendid

Tänapäeval on tarkvara arvutile operatsioonisüsteemiga Microsoft Windows XP, 2000, Vista, 7, 8, 8.1, 10, tahvelarvutisse või nutitelefoni installitud Androidi rakendused ning võrguteenused inimkõne sünteesimise funktsiooniga erinevate lähtekoodide ja häälmootoritest piisab mitmeleheküljelise ülevaate jaoks, millel on lühike ja selge järeldus. Venekeelsete tekstide valjuhäälseks lugemiseks arvutihäälega on vaja kolme komponenti: Speech API, heli kõnesüntesaatorit vene keele toega ja väikest programmi teksti valju lugemise funktsiooniga. Sellel lehel on lingid kõigele, mida vajate täieõiguslikuks tööks, sealhulgas võimalusele alla laadida Balabolka uusim versioon Windows 10, 8 jaoks tasuta.

Enam-vähem kaasaegses arvutis on kolme võimalusega korraga Speech API juba süsteemi installitud ja kasutajal tuleb lihtsalt sobival vahekaardil valida kõnemootor, näiteks Balabolka või sarnase rakenduse jaoks. : SAPI4, SAPI5 või Microsoft Speech Platform. Kui teil on vaja Windowsi jaoks värskendada MS Speech API teeki, peaksite teadma, et SAPI 5.1 installimine arvutisse, kus töötas SAPI 5.3 või 5.4, toob kaasa kvaliteedi languse.

Inglis- ja venekeelse taasesituse funktsioonid erinevate helisüntesaatorite abil, näiteks: Aleksander ja Jelena on välja töötanud Olga Yakovleva ettevõttest AREYCHVoice (RHVoice), Boris, Nikolay ja Svetlana, tootjad Lernout & Housepy TruVoice TTS, Nikolay ja Alena ettevõttest Akapel, Tatyana ja Maxim Ivonilt, Olgast Lokendo TTS-ist, Katerinast ScanSoft RealSpeakist, Igorist UkrVoxist ja teistest räägitakse üksikasjalikult allpool.

Eelinstallitud kõnemootorid loovad automaatselt ühenduse vastavate arvutisse installitud rakendustega. Kõnesünteesiks sobivad lugejad ja tekstiredaktorid, mis suudavad sünteesitud häälega valjult reprodutseerida erinevaid dokumente, nagu Balabolka, Govorilka, Govorun+, ABoo, Demagogue, Cool Reader, ICE Book Reader ja mitmed võrguteenused, näiteks: Translator Google ja sarnased, kuid vähem arenenud võrguteenused Ivona, Acapela, Linguatec, imTranslator. Programmid ei vaja töötamise ajal Internetti ja kõik võrguteenused on saadaval stabiilse arvutiühendusega Internetiga.

Optimaalne valik personaalarvutis kasutamiseks oleks programm Balabolka, mis töötab koos SAPI4, SAPI5 ja Microsoft Speech Platformiga, toetades tööd dokumentides sisalduvate tekstidega populaarsetes vormingutes FB2, DjVu, PDF, TXT, DOC, HTML ja muud dokumendid, samuti lõikepuhvrisse kopeeritud tekst.

Balabolka töö tulemusena on võimalik luua MP3-, MP4-, OGG-, WAV-, WMA- ja muude helivormingute fail, kasutades ka oma koodekeid, millel on võimalus kuvada MP3-failides teksti ID3-na pleieri subtiitritena. kuvada samaaegselt nagu karaokes. Soovitame RHVoice'i tarkvara osana alla laadida tasuta vene Balabolka ning vene hääl Aleksander ja Elena, ilma registreerimise ja SMS-ideta saidilt lahkumata.

Balabolka liides ja funktsionaalsus

Vene keele toega mitmekeelne liides võimaldab teil ilma Balabolka võimaluste uurimisele aega raiskamata alustada sisu kuulamist otse, sisestades lihtsalt tekstifragmendi, olgu selleks siis rida, lause, lõik, lehekülg, peatükk, osa, köide või kogu raamat, isegi mitmeköiteline esseekogu.

Balabolka liidese elemendid, menüüd ja seaded pakuvad kasutajale järgmisi valikuid:

  • määrake liidese keel, nahk, konfigureerige kiirnuppe,
  • treeningu juhtimine, kasutades esitus-, pausi-, peatamisnuppe,
  • valige kõnemootori SAPI 4, SAPI 5 või Microsoft Speech Platform tüüp,
  • määrake süntesaatori kõne kiirus, tämber, helitugevus,
  • õige hääldus mitmel viisil,
  • leida homograafid (sõnad, mis on õigekirjas samad, kuid erinevad kuulmisel),
  • juhtida lugemisprotsessi lühikeste klaviatuuri otseteede abil,
  • teksti taasesitamine, kui kasutaja klaviatuuril tippib,
  • suvaliselt muuta arvutiekraanil fondi värvi, fondi stiili,
  • keeleliste kõhkluste vältimiseks eemaldage õigesti reavahetused,
  • teisendada dokument heliks, et seda kuulata MP3-mängijates, mobiiltelefonides, nutitelefonides ja tahvelarvutites jne.

Saate juhtida teksti lugemist menüüst, kiirklahvide otseteede või salve (teavitusala) kaudu. Vajadusel on võimalik võrrelda kahte faili, eraldada failidest teksti, jagada dokument osadeks, tõlkida, kontrollida õigekirja, salvestada teksti helifailidesse, luua sisukorda või järjehoidjaid, navigeerida nimelise järjehoidja juurde.

Balabolka kaasaskantav versioon

Teie arvutis või sülearvutis võib olla mitu Balabolka Portable kaasaskantavat versiooni teatud eelseadistustega: hääl, sõnastikud, tämber, lugemiskiirus ja muud seaded. Selline lahendus võib olla nõutud näiteks juhul, kui mõnda tüüpi materjalid on kõrvaga paremini tajutavad, kui neid loevad Nicolai Lernout & Hauspie TruVoice TTS SAPI4 teegist ja teisi tekste loeb paremini Aleksandr RHVoice SAPI5-s või Elena Microsoft Speech Platformi komplektist. SAPI4 ja SAPI5 teegid ei ühildu ja saate korraga töötada ainult ühe teegiga. Kui paralleelne kasutamine on vajalik, on kaks sobivate seadistustega kaasaskantavat Balabolka seadet tõhusaks lahenduseks. Sellistes olukordades soovitame tasuta alla laadida vene keeles Balabolka Portable, mis ei vaja installimist, ei loo teie arvutis või sülearvutis konfiguratsioonifaile ja mida saab käivitada USB-mälupulgalt.

Heli ja kõne API

Balabolka heli hääldus tehakse sõltumatute häältega, mis ilmuvad Balabolka häälte loendis. Venekeelse teksti kuulamiseks peate leidma ja installima süsteemi täiendavaid venekeelseid hääli. Häälduse ja rõhuasetuse kvaliteet ja õigsus ei sõltu programmi võimalustest tekstifaile või tekstifragmente sisaldavaid dokumente valjusti lugeda; need parameetrid määrab seadetes valitud helimootor. Vabalt levitatakse mitte ainult vene, vaid ka inglise, saksa, mitmeid teisi Euroopa ja Jaapani hääli.

Kahjuks pole veel loodud ideaalseid tarkvaratooteid 100% korrektse venekeelse kõne hääldusega, kuid isegi professionaalsed diktorid paljudes provintsi telekanalites pole kaugeltki täiuslikud. Kõik, kes on Balabolka juba vene häälega tasuta alla laadinud ja Balabolkat tegevuses proovinud, on seda isiklikust kogemusest näinud. Hääled toimivad eranditult SAPI 4 või 5 teatud modifikatsiooniga, aga ka Microsoft Speech Platformiga ning pärast süsteemi installimist peate need valima Balabolka vastaval SAPI või Microsoft Speech Platformi vahekaardil.

Balabolka häälemootorid

Kui Speech API on reeglina süsteemi juba installitud, tuleb leida kvaliteetne vabalt levitatav Text-to-Spech Engine (TTS), millel on vene keele reprodutseerimine, kvaliteetne hääldus, suur sõnaraamat ja meeldiv meessoost ja naiste toonid pole nii lihtne. Selle probleemi lahendamiseks võite kulutada palju aega, kuid on teada, millised Balabolka vene hääled tasub alla laadida. Üks parimaid variante on RHVoice'i Elena ja Aleksandri hääled. Alustuseks tuleks kohe tasuta alla laadida RHVoice'i häälemootor ning valida sobivate tämbriseadete ja häälduskiiruse seadistustega vene Aleksander.

Kui on vaja ühilduda SAPI4-ga, siis tasub hinnata Lernout & Hauspie TruVoice Text-to-Spech Engine'i vabalt saadaolevate kõnesüntesaatorite Boris, Nicolai, Svetlana sobivust. SAPI5 puhul väärivad tähelepanu järgmised süntesaatorid: kuulus Acapela Elan TTS venelane Digalo Nikolai, aga ka Alyona Acapela Groupist, Alena Nuancest, Tatyana ja Maxim Ivonast, Olga Loquendo TTS-ist, Katerina ScanSoft RealSpeakist, Igor firmast UkrVox, venelane Alena ja Ivan , mitte eriti arusaadav maskuliinne ja pseudounisex eSpeakist ja mitmetest teistest vähemtuntud kõnemootoritest. Vene Elena ja TELE seisavad mõnevõrra eraldi, komplektis Microsoft Speech Platform - Runtime Languages, platvormiga, mis ei ühildu ei SAPI4 ega SAPI5-ga.

Balabolka laadige alla tasuta ja vene hääled selle jaoks

sait, kus kõigil on võimalus Microsoft Windowsiga arvutisse legaalselt alla laadida tasuta programme ilma captcha, viiruste ja SMS-ita. Seda lehte uuendati 21.04.2019 Täname, et külastasite jaotist.
Värskendus: 21.04.2019
Uusim versioon: 2.15.0.698
Sünonüümid: byalabolka, balabolka, belabolka, byalabolka
Operatsioonisüsteem:

Erinevalt eelmisest esindajast on Cantor 2 vokaalpartiide sünteesimiseks "täiustatud" süsteem, kuid see on hinna eest. Sellel on ka versioon eraldi programmina. Kuigi vst-instrument on sekvenseris oleva klaverirulli analoog: vaadake liidest (joon. 4).

Kuna see pistikprogramm on väga instrumenteeritud, saab see manipuleerida paljude hääleparameetritega. Kuid ikkagi peate alustama fraasi silbi haaval konstrueerimisest. Nagu võite arvata, tehakse seda klaverirulli abil. Samuti on olemas tööriistariba tavaliste “pliiatsite”, “kustutuskummidega” jne. Tegelikult proovime sünteesida ülalmainitud fraasi "hei, yo, tule!" Joonistame sündmused ristkülikukujuliste alade kujul ja märgistage need kõik, nagu joonisel 5.

Nagu näete, pole kõik sõnad sündmuste kohal kirjutatud. Näiteks sõna "tule" on jagatud kaheks silbiks - "com" ja "on". Tähelepanelikud kasutajad märkavad, et allpool kirjutatakse automaatselt foneemid - see on üsna mugav funktsioon. Kui lähete üksikasjadesse ja nüanssidesse, peate omama väga head ettekujutust sellest, millised on kõne kõla foneemid ja muud peened nüansid, mis on kättesaadavad ainult kitsastele spetsialistidele. Jätame selle nii nagu on ja vaatame, kuidas see üldiselt töötab. Kuid see pole veel kõik. Nüüd tuleb Cantor 2 raja midi osas registreerida ka osa, mille järgi meie sõnad (silbid) kõlavad. Teeme nii nagu joonisel 6.

Nüüd saame sekvenseris taasesituse sisse lülitada ja veenduda, et väljundis on heli.

Järgmiseks kohandame mõningaid helinüansse. Lubage mul kohe teha reservatsioon, et Cantor 2 seadistamise kõigi nüansside uurimiseks peate kirjutama terve raamatu. Käesolevas artiklis vaatleme üldisi parameetreid. Nii et esiteks saate valida valmis hääle. Saadaval on neid kümmekond. Saate need avada programmi ülaosas valikus Laadi hääl (joonis 7).

Vaikimisi oli "Nikki", kuid muutsin selle "Lutheriks". Proovida saab erinevaid hääli, nii nais- kui ka meeshääli.

Teiseks on efektide sektsioon (tegelikult efektide sektsioon, joonis 8).

Saadaval on 4 efekti – Distortion, Echodelay, Chorus ja Reverb. Kuigi neid samu efekte saab eraldi lisada.

Foneemi ja hääle osadest pole mõtet rääkida, sest... Neid on üsna raske õppida ja ainult üsna spetsialiseerunud spetsialist saab nende seadistustest aru. Kuigi keegi ei viitsi nendel lõikudel nuppe keerata ja seeläbi heli muuta. Või uurige kõnesünteesi teooriat ja ka Cantori kasutusjuhendit, et mõista, kuidas see kõik toimima peaks. Üldiselt on parameetreid päris palju, tekkiv heli on üsna keeruline ja üsna primitiivne.

Küll aga saab ka algaja, kui ta proovib, saada minuga sarnase heli.

Fruity Loops Studio

Võib-olla on paljud teist, olles näinud Fruity Loopsi, üllatunud, kuidas see sellesse artiklisse sattus, sest see on tõenäolisem kui mitte kõnesüntesaator. Asi on selles, et selle arsenalis on väga hea kõnesüntesaator. Seda nimetatakse kõnesüntesaatoriks. Ja kuigi see pole eraldi pluginana saadaval, saate FL-i enda vst-pluginana oma tööjaama sisestada ja seal kasutada selle kõnesüntesaatorit. Kuid ma eelistan siiski luua kõneosa FL-is endas, seejärel eksportida see helifaili ja kasutada seda mis tahes tööjaamas.

Niisiis, proovime luua eelmise näite põhjal partii otse FL Studios. Sisestame selle pistikprogrammi oma projekti (joonis 9).

Niipea, kui lisame selle projekti, ilmub automaatselt aken, mis palub meil teksti sisestada. Te ei pea pikalt mõtlema ja sisestama kohe meie fraasi ülaltoodud näidetest (joonis 10).

Lisaks saate kohe määrata muid kõneparameetreid, nagu hääl (saadaval on umbes 20 häält), hääldusstiil, režiim (sosistatav, aspireeritud või tavaline) ning tempo ja helikõrguse seaded. Soovitan koheselt tempo paika panna (mul on see näiteks 140, vastavalt projekti tempole). Nupp Kuula võimaldab kuulata osa käigu pealt, enne selle loomist. Pärast seda, kui oleme valinud vajalikud parameetrid, klõpsake märkeruutu, programm palub meil salvestada loodud kõneosaga fail ja projektis luuakse uus vokaaliga osa (joonis 11).

Meil pole vaja jännata - Speech Synthesizer lõi meile raja, milleks on Fruity Slicer, millesse on loodud osa, mis on jagatud nootideks, kus igale sõnale vastab eraldi noot (paremal pildil 11 näete et meil on 4 tükist osa ). Lisaks on klaverirull loonud rajad signeeritud sõnadega nootidele, mis on väga mugav (joon. 12).

Kõik on üsna selge ja lihtne. Fraasi korrektseks kõlamiseks pole vaja foneeme üles kirjutada ega silpe valida. Piisab lihtsalt fraasi sisestamisest - see kõlab juba üsna talutavalt ja loetavalt. Seejärel saate sama lihtsalt sõnu ümber korraldada ja eksportida osa soovitud helivormingusse. Saate selles ise näidet kuulates veenduda.

Milline kõnesüntesaatoritest on parem?

Minu isiklik arvamus: elav kõne, elav vokaal on parem. Kui valida eelpool mainitud programmide hulgast, siis loomulikult võidab Cantor 2 nii seadistuste kui ka parameetrite arvult. Kui valite mugavuse, lihtsuse ja helikvaliteeti, eelistan ma Fruity loopsi kõnesüntesaatorit.

Täiendus toimetajatelt

Kõnesünteesiks on ka tasuta programm -. Saate seadistada erinevaid parameetreid ja pärast eelkuulamist genereerida tulemuse helifailiks.

Kõnesüntesaatori rakendused on mugavad ja usaldusväärsed abilised Androidi kasutajatele. Nende abiga saate "häälestada" rakendusi maailma populaarseimatesse keeltesse, reguleerida oma hääle tämbrit ja muid olulisi parameetreid ning kuulata ka erinevate sõnade kõla. Enamik Androidi TTS-i rakendusi on saadaval tasuta, kuid mõnede häälte ja funktsioonide installimise eest peate maksma lisatasu. Oleme valinud teile kõige mugavamad kõnesüntesaatorid, mille saate alla laadida meie veebisaidilt.

Google'i kõne süntees


Žanr Tööriistad
Hinnang 4,1
Seaded 1 000 000 000–5 000 000 000
Arendaja Google LLC
vene keel Seal on
Hinnangud 1 107 289
Versioon 3.14.9
apk suurus 14,7 MB


Kõige populaarsem ja juurdepääsetavam TTS-i utiliit, mis ühildub paljude Android-seadmetega. Programmi kasutades saate lugeda ekraanil olevat teksti ja täita mitmeid olulisi funktsioone:

  • Raamatute häälkõne rakendusest Google Play raamatud.
  • Tõlgi ja häälda sõnu keelest.
  • Lülitage TalkBacki teenuse abil sisse hääljuhised.

Saate aktiveerida Google'i kõnesünteesi rakenduse otse oma seadmes. Selleks avage menüükäsk "Seaded", kus minge alajaotisesse "Keel ja sisestusmeetodid" ja seal - "Kõnesüntees". Valige Google'i kõnesünteesi süsteem, mille järel rakendus aktiveeritakse automaatselt.

Programm toetab enam kui 40 keelt, sealhulgas inglise, vene, prantsuse, saksa, jaapani, hispaania, taani, hindi ja paljusid teisi. Utiliidi uusim versioon on lisanud 3 uut keelt - rumeenia, eesti ja slovaki ning parandanud ka hääle kvaliteeti üldiselt.

Acapela TTS hääled


Žanr Ühendus
Hinnang 3,5
Seaded 100 000–500 000
Arendaja Acapela Group S.A.
vene keel Ei
Hinnangud 3 883
Versioon 6.0.0.2
apk suurus 9,3 MB


Veel üks kvaliteetne kõnesüntesaator Androidile, mis on saadaval meie portaalis. Programm on jagamisvara ja enne rakenduse ostmist saate veebis kuulata mees- ja naishäälte demoversioone. Utiliit võimaldab teil osta ja installida kõrgekvaliteedilise häälega programme, nagu Google TalkBack, tõlkijad ja uudiste häälkõned.

Hääle valimiseks ja rakenduses installimiseks sisenege menüüsse, seejärel vajutage ja hoidke häält mõni sekund all. Valitud hääle kõrvale ilmub kollase tähe ikoon ja see määratakse vaikehääleks. Nüüd saate seda programmi kasutada oma lemmikraamatulugejaga.

Rakenduse Acapela TTS Voices saab aktiveerida järgmiste sammude abil.

  • Laadige teenus alla meie veebisaidilt või Google Play portaalist.
  • Pärast rakenduse installimist klõpsake programmi ikooni. Veenduge, et teil oleks Interneti-ühendus.
  • Vaadake serverist alla laaditud häälte loendit.
  • Klõpsake iga hääle kõrval oleval menüül, kus saate kuulata oma teksti või minna otse ostma.
  • Pärast ostmist ja maksmist laaditakse hääl alla ja saate seda igal ajal kasutada.

Acapela TTS Voices ühildub Android OS 2.2 ja uuemate versioonidega.

Vocaliser TTS Voice


Žanr Töö
Hinnang 3,3
Seaded 500 000–1 000 000
Arendaja Kooditehas
vene keel Seal on
Hinnangud 3 405
Versioon 2.0.8
apk suurus 5,4 MB


Kõnesüntesaator koos ingliskeelse menüüga. Programmil on integreeritud TTS-mootor, mis toetab enam kui 50 keelt. Teenindus paistab silma meeldiva ja selge heliga, mille tämbrit on võimalik oma maitse järgi reguleerida.

Vocalizer võimaldab teil edastada häält populaarsetele Androidi rakendustele, nagu raamatud ja taastusravi tarkvara.

Vocalizer TTS Voice'i muud olulised funktsioonid on järgmised:

  • Toetage 50 keelt ja 100 tüüpi häält.
  • Emotikonide tugi (kas teadsite, et see on olemas?).
  • Sõnade hääldamine sõnaraamatutes.
  • Lugemiskiiruse sätted.
  • Kirjavahemärkide heliseaded.

Kui programm on teie seadmesse installitud, saate selle aktiveerida seadete menüüs jaotises Keel ja sisestusmeetodid – Tekst kõneks muutmine ja määrata Vocalizer TTS vaikesüsteemiks.

Rakendus ühildub Androidi süsteemi versiooniga 4.0 ja uuemaga.

Kui teile see rakendus meeldis ja otsite sarnaseid rakendusi, vaadake arvustust. Ja kui viibite võõras riigis ja teil pole aega teksti häält anda, peate selle teksti tõlkima – saate sellest pildistada ja tõlkida.

Tänapäeval on olemas tehnoloogia, mis suudab teisendada tekstiteabe tavaliseks kõneks. "Nutikate masinate" arenedes muutub see tehnoloogia üha aktuaalsemaks ja nõuab iga päevaga üha enam täiuslikkust. Tegelikult on praegu välja töötatud mitmeid kõnesünteesi meetodeid, millest me räägime.

Kõnesüntesaatoreid saab kasutada täiesti erinevates valdkondades ja neid kasutatakse paljude probleemide lahendamiseks alates raamatute "lugemisest", "rääkivate" laste mänguasjade valmistamisest, ühistranspordis või teenindussüsteemides peatustest teatamisest ja lõpetades meditsiiniga (siin on see väärt). Stephen Hawkingi meenutamine, kõnesüntesaatori kasutamine maailmaga suhtlemiseks).

Niisiis, vaatame lähemalt kõnesünteesi tehnoloogiat ja meetodeid. Nagu juba mainitud, on kõnesünteesi meetodeid mitu. Seega saab eristada mitmeid peamisi lähenemisviise:

  • parameetriline süntees;
  • konkatenatiivne (kompilatsioon) süntees;
  • süntees reeglite järgi (trükiteksti alusel);

Parameetriline süntees võimaldab salvestada kõnet mis tahes keele jaoks, kuid seda ei saa kasutada tekstide puhul, mida pole eelnevalt määratud. Parameetrilist kõnesünteesi kasutatakse siis, kui sõnumite hulk on piiratud. Selle sünteesimeetodi kvaliteet võib olla väga kõrge.

Põhimõtteliselt on parameetriline kõnesüntees vokooderi tööpõhimõtte rakendamine. Parameetrilise sünteesi puhul esindab helisignaal teatud arvu pidevalt muutuvate parameetritega. Vokaalhelide tekitamiseks kasutatakse toonigeneraatorit ja kaashäälikute jaoks mürageneraatorit. Kuid seda meetodit kasutatakse tavaliselt häälte salvestamiseks muusikalistes kompositsioonides ja sagedamini ei räägi me isegi puhtast hääle sünteesist, vaid pigem modulatsioonist.

Kompilatsiooni sünteesimeetod põhineb tekstide koostamisel eelsalvestatud elementide “sõnastikust”. Süsteemielemendi suurus peab olema vähemalt sõna. Tavaliselt on elementide varu piiratud mitmesaja sõnaga ja sünteesitud tekstide sisu sõnastiku mahuga. Seda kõnesünteesi meetodit kasutatakse laialdaselt igapäevaelus - reeglina erinevates abiteenustes ja seadmetes, mis nõuavad kõnereageerimissüsteemidega seadmeid.

Täielik kõnesüntees vastavalt reeglitele suudab reprodutseerida kõnet varem tundmatust tekstist. See meetod ei kasuta inimkõne elemente, vaid põhineb programmeeritud keelelistel ja akustilistel algoritmidel.

Siin on ka jaotus – sellele sünteesimeetodile saab eristada kahte lähenemist. Esimene on formantne kõnesüntees vastavalt reeglitele ja teine ​​on artikuleeriv süntees. Formantide süntees põhineb formantidel – kõneakustilise süsteemi sagedusresonantsidel. Formantide sünteesi algoritm modelleerib inimese hääletrakti talitlust, mis töötab resonaatorite kogumina. Kahjuks on tänapäeval enamikku ainult formantide sünteesil töötavaid süntesaatoreid ilma ettevalmistuseta raske mõista, kuid kahtlemata on see universaalne ja paljutõotav tehnoloogia. Artikulatsioonimeetod püüab parandada formantmeetodi puudusi, lisades mudelile üksikute häälikute häälduse foneetilisi tunnuseid.

Samuti on olemas reeglite järgi kõnesünteesi tehnoloogia, mis kasutab loomuliku kõne salvestatud segmente. Kuna kompileerimismeetodeid kasutatakse endiselt kõige sagedamini, ütleme nende kohta paar sõna üksikasjalikumalt.

Sõltuvalt sellest, kui suured on sünteesiks kasutatavad kõne “katked”, eristatakse järgmisi sünteesitüüpe:

  • mikrosegment (mikrolaineahi);
  • allofooniline;
  • difooniline;
  • poolsilbiline;
  • silbiline;
  • süntees suvalise suurusega ühikutest.

Kõige sagedamini kasutatakse allofoonilisi ja difoonilisi meetodeid. Kõnesünteesi difoonilise meetodi puhul on põhielementideks kõikvõimalikud foneemide binoomkombinatsioonid ning allofoonimeetodi puhul - vasak- ja parempoolsete kontekstide kombinatsioonid (allofon on foneemi variant, mille määrab selle spetsiifiline foneetiline keskkond ). Sel juhul kombineeritakse erinevat tüüpi kontekstid klassidesse vastavalt akustilise läheduse astmele.

Selliste süsteemide eeliseks on see, et nad võimaldavad sünteesida teksti tekstist, mis pole eelnevalt määratletud, kuid puuduseks on see, et sünteesitud kõne kvaliteet ei ole võrreldav loomuliku kõne kvaliteediga (piiridel võivad tekkida moonutused õmbluselementidest). Samuti on väga raske kontrollida kõne intonatsiooniomadusi, kuna üksikute sõnade omadused võivad sõltuvalt kontekstist või fraasi tüübist muutuda.

See kõik on aga teoorias. Praktikas kogevad kõnesünteesitehnoloogia arendajad praeguses arenguetapis hoolimata selles valdkonnas tehtud aktiivsetest edusammudest endiselt mõningaid raskusi, mis on peamiselt seotud sünteesitud kõne kunstlikkuse, emotsionaalse värvingu puudumise ja madala mürakindlusega.

Fakt on see, et mis tahes sünteesitud kõnet on inimesel reeglina raske tajuda. Selle põhjuseks on asjaolu, et sünteesitud tekstis olevad lüngad täidab inimaju, kes kasutab selleks lisaressursse ning sünteesitud kõnet suudab inimene normaalselt tajuda vaid umbes 20 minutit.

Kõne tajumist mõjutab ka selle emotsionaalne värvus. Sünteesitud kõne puhul see puudub. Kuigi väärib märkimist, et mõned algoritmid võimaldavad siiski kõne emotsionaalset värvingut mingil määral imiteerida, muutes foneemide, pauside ja tämbrimodulatsiooni kestust, kuid siiani pole nende töö ideaalist kaugel.

Mis puudutab kolmandat nimetatud probleemi – madalat mürakindlust, siis katsed näitavad, et sünteesitud teksti tajumist segab igasugune, isegi kõige väiksem kõrvaline müra. See on jällegi tingitud asjaolust, et sünteesitud kõne töötlemiseks kasutab inimaju lisakeskusi, mida loomuliku kõne tajumisel ei kasutata.

Selle artikli lõpus tahaksin tuua mõned näited olemasolevatest kõnesüntesaatoritest.

Kõik teavad nn lugejaid - programme monitorilt teksti mugavamaks lugemiseks. Paljud meist kasutavad teksti häälestamiseks kõnesünteesiprogramme, näiteks Balabolka ja Govorilka.

Selleks, et sellised programmid saaksid tekste lugeda, tuleb installida ka SAPI teek (Speech API) ja kõnemootorid. Kõige tavalisemad on Speech API kaks versiooni: SAPI4 ja SAPI5 Mõlemad teegid võivad töötada samas arvutis. Operatsioonisüsteemides Windows XP, Windows Vista ja Windows 7 on SAPI5 teegid juba installitud.

Lisaks e-lugeritele on levinud ekraanile juurdepääsu programmid. Selliste programmide näited on:

NEITSI 4. Programm loodi Windowsiga pimedate ja vaegnägijate mugavaks töötamiseks. See võimaldab teil valida häälega räägitava teabe ja punktkirjaekraanil kuvatava teabe. Nägemispuudega kasutajatele pakutakse Galileo ekraani suurendussüsteemi.

Cobra 9.1 muudab töö Windowsiga lihtsamaks ka pimedate ja vaegnägijate jaoks. See programm suudab kuvada teavet arvutimonitorilt kõne abil, punktkirjakuvarit ja sellel on ekraani suurendusfunktsioon.

Absinthium

Kategooriad:

Sildid:

Kas märkasite viga? Valige see hiirega ja vajutage Ctrl+Enter!

Kommentaarid

Tehnilisest küljest on artikkel õige. Aga kus autor ise lisab, algavad probleemid. Selge see, et inimesel, kes on sellest vaid kuulnud ega kasuta seda pidevalt, on raske hinnangut anda. Nii et ärge võtke seda kaebusena, ma tahan lihtsalt midagi selgitada.

Tegelikult on kõnesüntesaatorite tase üsna vastuvõetav. Kuigi loomulikult on need, mis töötati välja 10-15 aastat tagasi, endiselt edasi ja just nemad satuvad võrgustikku teemaga pealiskaudselt tutvudes. Aga on ka teisi, mõistlikumaid. 20 minutiga ei tüdine inimene süntesaatorist – mina töötan süntesaatoritega 15 tundi päevas. Ja minusuguseid on palju. aga ka need inimesed, kes pole nagu mina ja mu kolleegid, vaid nagu enamus, naudivad näiteks kõnesüntesaatorite abil tekstifailidest salvestatud audioraamatute kuulamist. Tihtipeale väsitavad audioraamatut lugevad näitlejad inimest isegi kiiremini kui 20 minutit, mistõttu võidavad suurema tõenäosusega süntesaatorid oma masinliku otsekohesuse ja kompromissimatusega, eriti kui te pole esteet, vaid lihtsalt saate teavet. Ja lõpus loetletud programmid, eriti virgo ja kobra, pole meie laiuskraadidel ikka veel nii tuntud, isegi nende seas, kelle jaoks need välja töötati. Ekraanilugejaprogrammidest tuntuim on akende lõuad. See programm on teiste lahenduste seas liider. Nvda ekraanilugeja programm on ka meil populaarne ja väärib kahtlemata tähelepanu. See võimaldab pimedatel lahendada enamikke igapäevaprobleeme ja seda levitatakse vabalt.