Kvinnestemme for talesynthesizer. Tekst til tale (TTS) talesynthesizere

Balabolka, utviklet av Ilya Morozov, er ment å gjengi tekst i lydform. Programmet er et miljø for konvertering av tekst til tale med et behagelig og praktisk flerspråklig grensesnitt. Talesynthesizere, som lastes ned separat og installeres på en datamaskin, er direkte ansvarlige for gjengivelsen av menneskelig tale. På denne siden av nettstedet https://site kan du lovlig laste ned Balabolka gratis med en russisk stemme inkludert, uten registrering og SMS. I dette tilfellet trenger du ikke å hacke verken applikasjonen eller talemotoren, se etter nøkkelgener og sprekker, og deretter trenger du ikke å bekjempe virus. Alt her er virusfritt, gratis, lovlig og lovlig.

Hvorfor Balabolka, dens fordeler, konkurrenter og nødvendige komponenter

I dag, programvare for en datamaskin med operativsystemet Microsoft Windows XP, 2000, Vista, 7, 8, 8.1, 10, Android-applikasjoner installert på nettbrett eller smarttelefon, og nettjenester med funksjonen å syntetisere menneskelig tale ved hjelp av ulike kildekoder og stemmemotorer er ganske nok for en flersidet anmeldelse med en kort og klar konklusjon. For å lese tekster høyt på russisk ved hjelp av en datamaskins stemme, trenger du tre komponenter: Speech API, en lydtalesyntese med støtte for russisk språk, og et lite program med funksjonen å lese tekst høyt. Denne siden inneholder lenker til alt du trenger for fullverdig arbeid, inkludert muligheten til å laste ned den nyeste versjonen av Balabolka gratis for Windows 10, 8.

På en mer eller mindre moderne datamaskin er Speech API, med tre alternativer samtidig, allerede installert i systemet, og brukeren trenger bare å velge en talemotor, for eksempel for Balabolka eller en lignende applikasjon, i den aktuelle fanen : SAPI4, SAPI5 eller Microsoft Speech Platform. Hvis du trenger å oppdatere MS Speech API-biblioteket for Windows, bør du være klar over at installering av SAPI 5.1 på en datamaskin som kjørte SAPI 5.3 eller 5.4 vil føre til redusert kvalitet.

Funksjoner for avspilling på engelsk og russisk ved bruk av forskjellige lydsynthesizere, for eksempel: Alexander og Elena utviklet av Olga Yakovleva fra AREYCHVoice (RHVoice), Boris, Nikolay og Svetlana produsert av Lernout & Housepy TruVoice TTS, Nikolay og Alena fra Akapel, Tatyana og Maxim fra Ivon , Olga fra Lokendo TTS, Katerina fra ScanSoft RealSpeak, Igor fra UkrVox og andre vil bli diskutert i detalj nedenfor.

Forhåndsinstallerte talemotorer kobles automatisk til de tilsvarende applikasjonene som er installert på datamaskinen. For talesyntese, egnede lesere og tekstredigerere som kan reprodusere ulike dokumenter høyt med en syntetisert stemme, som Balabolka, Govorilka, Govorun+, ABoo, Demagogue, Cool Reader, ICE Book Reader og flere nettjenester, for eksempel: Oversetter Google og lignende, men mindre avanserte nettjenester Ivona, Acapela, Linguatec, imTranslator. Programmene krever ikke Internett under drift, og noen av nettjenestene er tilgjengelige med en stabil datamaskinforbindelse til Internett.

Det optimale valget for bruk på en personlig datamaskin ville være Balabolka-programmet, som fungerer med SAPI4, SAPI5 og Microsoft Speech Platform, og støtter arbeid med tekster i dokumenter i de populære formatene FB2, DjVu, PDF, TXT, DOC, HTML og andre dokumenter, samt tekst kopiert til utklippstavlen.

Som et resultat av Balabolkas arbeid er det mulig å lage en MP3-, MP4-, OGG-, WAV-, WMA- og andre lydformatfil, også ved hjelp av egne kodeker, med muligheten til å vise tekst som ID3 i MP3-filer som undertekster på spilleren vises samtidig, som i karaoke. Vi anbefaler å laste ned gratis russisk Balabolka og den russiske stemmen Alexander og Elena som en del av RHVoice-programvaren, uten å forlate nettstedet uten registrering og SMS.

Grensesnitt og funksjonalitet til Balabolka

Et flerspråklig grensesnitt med støtte for det russiske språket lar deg, uten å kaste bort tid på å utforske mulighetene til Balabolka, direkte begynne å lytte til innholdet ved ganske enkelt å sette inn et tekstfragment, det være seg en linje, en setning, et avsnitt, en side, en kapittel, en del, et bind eller hele boken, til og med en samling med flere bind.

Grensesnittelementer, menyer og innstillinger for Balabolka gir brukeren følgende alternativer:

  • angi grensesnittspråk, hud, konfigurer hurtigknapper,
  • utøve kontroll ved å bruke avspillings-, pause-, stoppknappene,
  • velg typen talemotor SAPI 4, SAPI 5 eller Microsoft Speech Platform,
  • angi hastigheten, klangfargen, talevolumet til synthesizeren,
  • korrekt uttale ved hjelp av flere virkemidler,
  • finne homografer (ord som er like i stavemåte, men forskjellige i hørsel),
  • kontrollere leseprosessen med korte hurtigtaster,
  • reprodusere tekst mens brukeren skriver på tastaturet,
  • endre vilkårlig skriftfarge på dataskjermen, skriftstil,
  • fjern linjeskift på riktig måte for å unngå språklige nøler,
  • konverter et dokument til lyd for lytting på MP3-spillere, mobiltelefoner, smarttelefoner og nettbrett, etc.

Du kan kontrollere tekstlesing fra menyen, ved å bruke hurtigtaster eller fra skuffen (varslingsområdet). Om nødvendig er det mulig å sammenligne to filer, trekke ut tekst fra filer, dele et dokument i deler, oversette, stavekontrollere, lagre tekst i lydfiler, lage en innholdsfortegnelse eller bokmerker, navigere til et navngitt bokmerke.

Balabolka bærbar versjon

På datamaskinen eller bærbar PC kan du ha flere bærbare versjoner av Balabolka Portable med visse forhåndsinnstillinger: stemme, ordbøker, klangfarge, lesehastighet og andre innstillinger. En slik løsning kan være etterspurt, for eksempel når noen typer materialer oppfattes bedre på øret når de leses av Nicolai Lernout & Hauspie TruVoice TTS fra SAPI4-biblioteket, og andre tekster leses bedre av Aleksandr RHVoice i SAPI5 eller Elena fra Microsoft Speech Platform-settet. SAPI4- og SAPI5-bibliotekene er inkompatible, og du kan bare jobbe med ett av bibliotekene om gangen. Hvis parallell bruk er nødvendig, vil to Balabolka Portables med passende innstillinger være en effektiv løsning. I slike situasjoner anbefaler vi å laste ned Balabolka Portable gratis på russisk, som ikke krever installasjon, ikke oppretter konfigurasjonsfiler på datamaskinen eller bærbar PC, og kan startes fra en USB-flash-stasjon.

Lyd og tale API

Lyduttale i Balabolka gjøres av uavhengige stemmer som vises i Balabolka-stemmelisten. For å lytte til russisk tekst, må du finne og installere flere russiske stemmer i systemet. Kvaliteten og korrektheten til uttale og stressplassering avhenger ikke av programmets evner til å lese tekstfiler eller dokumenter med tekstfragmenter høyt; disse parametrene bestemmes av lydmotoren som er valgt i innstillingene. Ikke bare russisk, men også engelske, tyske, flere andre europeiske og japanske stemmer distribueres fritt.

Dessverre er det ennå ikke laget ideelle programvareprodukter med 100 % korrekt uttale av russisk tale, men selv profesjonelle kunngjørere på mange provinsielle TV-kanaler er langt fra perfekte. Alle som allerede har lastet ned Balabolka gratis med russisk stemme og prøvd Balabolka i aksjon har sett dette av personlig erfaring. Stemmer fungerer utelukkende med en viss modifikasjon av SAPI 4 eller 5, så vel som med Microsoft Speech Platform, og etter installasjon i systemet må du velge dem i den tilsvarende SAPI- eller Microsoft Speech Platform-fanen i Balabolka.

Stemmemotorer for Balabolka

Hvis Speech API, som regel, allerede er installert på systemet, kan du finne en høykvalitets fritt distribuert tekst-til-tale-motor (TTS) med russisk språkreproduksjon, høykvalitets uttale, en stor ordbok og hyggelig mannlig og kvinnelige toner er ikke så lett. Du kan bruke mye tid på å løse dette problemet, men det er kjent hvilke russiske stemmer for Balabolka som er verdt å laste ned. Et av de beste alternativene er stemmene til Elena og Aleksandr fra RHVoice. Til å begynne med bør du umiddelbart laste ned RHVoice-stemmemotoren gratis og velge den russiske Alexander med passende klanginnstillinger og uttalehastighetsinnstillinger.

Hvis du trenger å være kompatibel med SAPI4, er det verdt å vurdere egnetheten til de fritt tilgjengelige talesynthesizerne Boris, Nicolai, Svetlana fra Lernout & Hauspie TruVoice Text-to-Spech Engine. For SAPI5 er følgende synthesizere verdt oppmerksomhet: den berømte Acapela Elan TTS russiske Digalo Nikolai, samt Alyona fra Acapela Group, Alena fra Nuance, Tatyana og Maxim fra Ivona, Olga fra Loquendo TTS, Katerina fra ScanSoft RealSpeak, Igor fra UkrVox, russiske Alena og Ivan , lite forståelige maskulin og pseudo unisex fra eSpeak og en rekke andre mindre kjente talemotorer. Den russiske Elena og TELE står litt adskilt, sammen med Microsoft Speech Platform - Runtime Languages, en plattform som ikke er kompatibel med verken SAPI4 eller SAPI5.

Last ned Balabolka gratis og russiske stemmer for det

nettsted, hvor alle har muligheten til å lovlig laste ned gratis programmer for en datamaskin med Microsoft Windows uten captcha, uten virus og uten SMS. Denne siden ble oppdatert 21.04.2019. Takk for at du besøker seksjonen.
Oppdatering fra: 21.04.2019
Siste versjon: 2.15.0.698
Synonymer: byalabolka, balabolka, belabolka, byalabolka
Operativsystem:

I motsetning til den forrige representanten, er Cantor 2 et mer "avansert" system for å syntetisere vokaldeler, men for en pris. Den har også en versjon som et eget program. Selv om vst-instrumentet er en analog av piano-rollen i sequenceren: ta en titt på grensesnittet (fig. 4).

Siden denne plugin er svært instrumentert, kan den manipulere et stort antall stemmeparametere. Men du må fortsatt begynne med å konstruere en frase stavelse for stavelse. Som du kanskje gjetter, gjøres dette ved hjelp av en pianorull. Det er også en verktøylinje med de vanlige "blyanter", "viskere", etc. Faktisk, la oss prøve å syntetisere uttrykket "hei, yo, kom igjen" nevnt ovenfor! La oss tegne hendelsene i form av rektangulære områder, og også merke hver av dem, som i figur 5.

Som du kan se, er ikke alle ordene skrevet over hendelsene. For eksempel er ordet "kom igjen" delt i to stavelser - "com" og "på". Oppmerksomme brukere vil legge merke til at fonemer automatisk skrives nedenfor - dette er en ganske praktisk funksjon. Hvis du går inn på detaljer og nyanser, må du ha en veldig god ide om hva fonemer og andre subtile nyanser av talelyden er, bare tilgjengelig for smale spesialister. Vi lar det være som det er og ser hvordan det fungerer generelt. Men det er ikke alt. Nå, i midi-delen av Cantor 2-sporet, må vi også registrere en del som ordene våre (stavelsene) vil høres etter. La oss gjøre det som i figur 6.

Nå kan vi slå på avspilling i sequenceren og sørge for at vi har litt lyd ved utgangen.

La oss deretter justere noen lydnyanser. La meg ta en reservasjon med en gang at for å studere alle nyansene ved å sette opp Cantor 2, må du skrive en hel bok. I denne artikkelen vil vi se på de generelle parameterne. Så for det første kan du velge en ferdig stemme. Det er omtrent et dusin av dem tilgjengelig. Du kan åpne dem øverst i programmet, i alternativet Last stemme (fig. 7).

Standarden var "Nikki", men jeg endret den til "Luther". Du kan prøve forskjellige stemmer, både kvinnelige og mannlige.

For det andre er det en effektseksjon (faktisk Effektseksjonen, fig. 8).

Det er 4 effekter tilgjengelig - Distortion, Echodelay, Chorus og Reverb. Selv om de samme effektene kan legges til separat.

Det er ingen vits i å snakke om Phoneme- og Voice-delene, fordi... De er ganske vanskelige å lære, og bare en ganske spesialisert spesialist kan forstå innstillingene deres. Selv om ingen hindrer deg i å vri på knottene i disse seksjonene og dermed endre lyden. Eller se nærmere på teorien om talesyntese, samt Cantors brukermanual, for å forstå hvordan det hele skal fungere. Generelt er det ganske mange parametere, den resulterende lyden er ganske kompleks og ganske primitiv.

Men selv en nybegynner, hvis han prøver, kan få en lyd som ligner på det jeg fikk.

Fruity Loops Studio

Kanskje mange av dere, etter å ha sett Fruity Loops, vil bli overrasket over hvordan det kom inn i denne artikkelen, fordi det er mer sannsynlig enn ikke talesynthesizer. Saken er at den har en veldig god talesynthesizer i arsenalet. Den heter Speech Synthesizer. Og selv om den ikke er tilgjengelig som en separat plugin, kan du sette inn selve FL som en vst-plugin i arbeidsstasjonen og bruke talesynthesizeren der. Men jeg foretrekker fortsatt å lage en taledel i selve FL, for så å eksportere den til en lydfil, og deretter bruke den på en hvilken som helst arbeidsstasjon.

Så la oss prøve å lage batchen fra forrige eksempel direkte i FL Studio. La oss sette inn denne plugin-en i prosjektet vårt (fig. 9).

Så snart vi legger den til i prosjektet, vises et vindu automatisk som ber oss om å skrive inn teksten vår. Du trenger ikke tenke lenge og umiddelbart legge inn uttrykket vårt fra eksemplene ovenfor (fig. 10).

I tillegg kan du umiddelbart stille inn andre taleparametere, for eksempel stemme (ca. 20 stemmer tilgjengelig), uttalestil, modus (hvisket, aspirert eller normal) og innstillinger for tempo og tonehøyde. Jeg anbefaler deg å sette tempoet umiddelbart (jeg har det, si, 140, i henhold til tempoet til prosjektet). Lytt-knappen lar deg lytte til en del på farten, før du oppretter den. Etter at vi har valgt de nødvendige parameterne, klikker du på avkrysningsboksen, programmet vil be oss om å lagre filen vår med den opprettede taledelen og en ny del med vokal vil bli opprettet i prosjektet (fig. 11).

Vi trenger ikke bry oss - Speech Synthesizer laget et spor for oss, som er en Fruity Slicer med en del laget i, delt inn i noter, hvor hvert ord tilsvarer en egen note (i figur 11 til høyre kan du se at vi har en del med 4 stk ). I tillegg har piano roll laget spor for noter med signerte ord, noe som er veldig praktisk (fig. 12).

Alt er ganske klart og enkelt. Det er ikke nødvendig å skrive ned fonemer eller velge stavelser for å få frasen til å høres riktig ut. Det er nok å bare skrive inn en setning - det vil allerede høres ganske tålelig og leselig ut. Da kan du like gjerne omorganisere ordene og eksportere delen til ønsket lydformat. Du kan se selv ved å lytte til et eksempel.

Hva er den beste av talesynthesizerne som er anmeldt?

Min personlige mening: live tale, live vokal er bedre. Hvis du velger fra de ovennevnte programmene, vinner selvfølgelig Cantor 2 når det gjelder antall innstillinger og parametere. Dessuten hevder den ikke bare å være en talesynthesizer, men til og med en vokalsynthesizer. Hvis du velger for bekvemmelighet, enkelhet og lydkvalitet, foretrekker jeg Speech Synthesizer fra Fruity loops.

Tillegg fra redaksjonen

Det er også et gratis program for talesyntese -. Du kan konfigurere ulike parametere og, etter forhåndslytting, generere resultatet til en lydfil.

Talesynthesizer-applikasjoner er praktiske og pålitelige assistenter for Android-brukere. Med deres hjelp kan du "stemme" applikasjoner til de mest populære språkene i verden, justere klangen til stemmen din og andre viktige parametere, og også lytte til lyden av forskjellige ord. De fleste TTS-apper for Android er tilgjengelige gratis, men du må kanskje betale ekstra for å installere visse stemmer og funksjoner. Vi har valgt ut de mest praktiske talesynthesizerne for deg, som du kan laste ned på nettsiden vår.

Google talesyntese


Sjanger Verktøy
Vurdering 4,1
Innstillinger 1 000 000 000–5 000 000 000
Utvikler Google LLC
russisk språk Det er
Estimater 1 107 289
Versjon 3.14.9
apk størrelse 14,7 MB


Det mest populære og tilgjengelige TTS-verktøyet, kompatibelt med mange Android-enheter. Ved å bruke programmet kan du lese tekst på skjermen, samt utføre en rekke viktige funksjoner:

  • Voice over bøker fra Google Play Bøker-appen.
  • Oversett og stemme ord fra.
  • Slå på talemeldinger ved hjelp av TalkBack-tjenesten.

Du kan aktivere talesyntese-appen fra Google direkte på enheten din. For å gjøre dette, åpne menyelementet "Innstillinger", der går du til underseksjonen "Språk og inndatametoder", og der - "Talesyntese". Velg Googles talesyntesesystem, hvoretter applikasjonen aktiveres automatisk.

Programmet støtter mer enn 40 språk, inkludert engelsk, russisk, fransk, tysk, japansk, spansk, dansk, hindi og mange andre. Den siste versjonen av verktøyet har lagt til 3 nye språk - rumensk, estisk og slovakisk, og også forbedret kvaliteten på stemmen generelt.

Acapela TTS-stemmer


Sjanger Forbindelse
Vurdering 3,5
Innstillinger 100 000–500 000
Utvikler Acapela Group S.A.
russisk språk Nei
Estimater 3 883
Versjon 6.0.0.2
apk størrelse 9,3 MB


En annen høykvalitets talesynthesizer for Android, som er tilgjengelig på portalen vår. Programmet er shareware, og før du kjøper applikasjonen kan du lytte til demoversjoner av mannsstemmer og kvinnestemmer på nett. Verktøyet lar deg kjøpe og installere programmer med stemme av høy kvalitet, for eksempel Google TalkBack, oversettere og nyhetsvoice-overs.

For å velge og installere en stemme i applikasjonen, gå inn i menyen og trykk og hold nede stemmen i noen sekunder. Et gult stjerneikon vil vises ved siden av den valgte stemmen, og det vil bli satt som standard. Nå kan du bruke dette programmet med din favorittbokleser.

Acapela TTS Voices-applikasjonen kan aktiveres ved å bruke følgende trinn.

  • Last ned tjenesten på vår nettside eller Google Play-portal.
  • Etter at du har installert programmet, klikker du på programikonet. Sørg for at du har en Internett-tilkobling.
  • Sjekk ut listen over stemmer som er lastet ned fra serveren.
  • Klikk på menyen ved siden av hver stemme, hvor du kan lytte til din egen tekst eller gå rett til kjøp.
  • Etter kjøp og betaling vil stemmen lastes ned og du kan bruke den når som helst.

Acapela TTS Voices er kompatibel med Android OS 2.2 og nyere.

Vocalizer TTS Voice


Sjanger Jobb
Vurdering 3,3
Innstillinger 500 000–1 000 000
Utvikler Kodefabrikk
russisk språk Det er
Estimater 3 405
Versjon 2.0.8
apk størrelse 5,4 MB


Talesynthesizer med meny på engelsk. Programmet har en integrert TTS-motor som støtter mer enn 50 språk. Tjenesten skiller seg ut på grunn av sin behagelige og klare lyd, hvis klangfarge kan justeres til din smak.

Vocalizer lar deg stemme over populære Android-applikasjoner som bøker og rehabiliteringsprogramvare.

Andre viktige funksjoner i Vocalizer TTS Voice inkluderer:

  • Støtte 50 språk og 100 typer stemme.
  • Emoji-støtte (visste du at det er en?).
  • Uttrykke ord i ordbøker.
  • Innstillinger for lesehastighet.
  • Lydinnstillinger for tegnsetting.

Når programmet er installert på enheten din, kan du aktivere det gjennom innstillingsmenyen under Språk og inndatametoder - Tekst-til-tale og angi Vocalizer TTS som standardsystem.

Applikasjonen er kompatibel med Android-systemversjon 4.0 og nyere.

Hvis du likte denne appen og ser etter lignende apper, sjekk ut anmeldelsen. Og hvis du er i et ukjent land, og du ikke har tid til å stemme teksten, må du oversette denne teksten - du kan ta et bilde av den og oversette den.

I dag finnes det en teknologi som kan konvertere tekstinformasjon til vanlig tale. Med utviklingen av "smarte maskiner" blir denne teknologien mer og mer relevant, og hver dag krever den mer og mer perfeksjon. For øyeblikket er det faktisk utviklet en rekke talesyntesemetoder, som vi vil snakke om.

Talesynthesizere kan brukes på helt andre områder, og brukes til å løse mange problemer, alt fra å «lese» bøker, produsere «snakkede» barneleker, annonsere stopp i offentlig transport eller i servicesystemer, og slutte med medisin (her er det verdt husker Stephen Hawking, ved å bruke en talesynthesizer for å kommunisere med verden).

Så la oss se nærmere på teknologien og metodene for talesyntese. Som allerede nevnt er det flere talesyntesemetoder. Dermed kan flere hovedtilnærminger skilles:

  • parametrisk syntese;
  • konkatenativ (kompilasjons) syntese;
  • syntese i henhold til regler (basert på trykt tekst);

Parametrisk syntese lar deg ta opp tale for alle språk, men den kan ikke brukes for tekster som ikke er spesifisert på forhånd. Parametrisk talesyntese brukes når settet med meldinger er begrenset. Kvaliteten på denne syntesemetoden kan være svært høy.

I hovedsak er parametrisk talesyntese en implementering av driftsprinsippet til en vokoder. Ved parametrisk syntese er lydsignalet representert av et visst antall kontinuerlig skiftende parametere. En tonegenerator brukes til å generere vokallyder, og en støygenerator brukes for konsonanter. Men denne metoden brukes vanligvis til å spille inn stemmer i musikalske komposisjoner, og oftere snakker vi ikke engang om ren stemmesyntese, men heller om modulasjon.

Samlingssyntesemetoden er basert på å kompilere tekster fra en forhåndsinnspilt "ordbok" av elementer. Størrelsen på et systemelement må være minst et ord. Vanligvis er bestanden av elementer begrenset til flere hundre ord, og innholdet i syntetiserte tekster er begrenset til volumet av ordboken. Denne metoden for talesyntese er mye brukt i hverdagen - som regel i ulike hjelpetjenester og utstyr som krever utstyr med taleresponssystemer.

Full talesyntese etter reglene kan gjengi tale fra en tidligere ukjent tekst. Denne metoden bruker ikke elementer av menneskelig tale, men er basert på programmerte språklige og akustiske algoritmer.

Det er også en oppdeling her - to tilnærminger til denne syntesemetoden kan skilles. Den første er formant talesyntese i henhold til reglene, og den andre er artikulatorisk syntese. Formantsyntese er basert på formanter - frekvensresonanser til det taleakustiske systemet. Formantsyntesealgoritmen modellerer funksjonen til den menneskelige stemmekanalen, som fungerer som et sett med resonatorer. I dag er dessverre de fleste synthesizere som utelukkende jobber med formantsyntese vanskelig å forstå uten forberedelse, men utvilsomt er dette en universell og lovende teknologi. Den artikulatoriske metoden prøver å forbedre manglene ved formantmetoden ved å legge til fonetiske trekk ved uttalen av individuelle lyder til modellen.

Det er også en teknologi for talesyntese i henhold til regler, som bruker innspilte segmenter av naturlig tale. Siden kompileringsmetoder fortsatt brukes oftest, la oss si noen ord om dem mer detaljert.

Avhengig av hvor store "utdragene" av tale som brukes til syntese er, skilles følgende typer syntese:

  • mikrosegment (mikrobølgeovn);
  • allofonisk;
  • difonisk;
  • halvstavelse;
  • stavelse;
  • syntese fra enheter av vilkårlig størrelse.

De mest brukte er allofoniske og difoniske metoder. For den difoniske metoden for talesyntese er grunnelementene alle slags binomiale kombinasjoner av fonemer, og for allofonmetoden - kombinasjoner av venstre og høyre kontekster (en allofon er en variant av et fonem, som bestemmes av dets spesifikke fonetiske miljø ). I dette tilfellet kombineres ulike typer kontekster til klasser i henhold til graden av akustisk nærhet.

Fordelen med slike systemer er at de gjør det mulig å syntetisere tekst fra en tekst som ikke er spesifisert på forhånd, men ulempen er at kvaliteten på syntetisert tale ikke er sammenlignbar med kvaliteten på naturlig tale (forvrengninger kan forekomme ved grensene). av sømelementer). Det er også svært vanskelig å kontrollere intonasjonsegenskapene til tale, siden egenskapene til individuelle ord kan endre seg avhengig av konteksten eller typen frase.

Dette er imidlertid alt i teorien. I praksis, på det nåværende utviklingsstadiet, til tross for aktiv fremgang på dette området, opplever utviklere av talesynteseteknologi fortsatt noen vanskeligheter, hovedsakelig assosiert med kunstigheten til den syntetiserte talen, mangelen på emosjonell farging i den og lav støyimmunitet.

Faktum er at enhver syntetisert tale som regel er vanskelig for en person å oppfatte. Dette skyldes det faktum at hullene i den syntetiserte teksten fylles av den menneskelige hjernen, som bruker ekstra ressurser til dette, og en person kan normalt oppfatte syntetisert tale i bare omtrent 20 minutter.

Oppfatningen av tale påvirkes også av den emosjonelle fargen. Når det gjelder syntetisert tale, er den fraværende. Selv om det er verdt å merke seg at noen algoritmer fortsatt gjør det mulig å imitere den emosjonelle fargen av tale til en viss grad ved å endre varigheten av fonemer, pauser og klangmodulering, men så langt er arbeidet deres langt fra ideelt.

Når det gjelder det tredje navngitte problemet - lav støyimmunitet, viser eksperimenter at oppfatningen av syntetisert tekst blir forstyrret av enhver, selv den minste, fremmede støy. Dette er igjen på grunn av det faktum at for å behandle syntetisert tale, bruker den menneskelige hjernen ekstra sentre som ikke brukes når den oppfatter naturlig tale.

På slutten av denne artikkelen vil jeg gi noen eksempler på eksisterende talesyntese.

Alle kjenner de såkalte "leserne" - programmer for mer praktisk lesing av tekst fra skjermen. Mange av oss bruker talesynteseprogrammer for å stemme tekst, for eksempel Balabolka og Govorilka.

For at slike programmer skal lese tekster, må du også installere SAPI-biblioteket (Speech API) og talemotorer. De vanligste er to versjoner av Speech API: SAPI4 og SAPI5. Begge bibliotekene kan kjøres på samme datamaskin. Operativsystemene Windows XP, Windows Vista og Windows 7 har allerede SAPI5-biblioteker installert.

I tillegg til e-lesere er skjermtilgangsprogrammer vanlig. Eksempler på slike programmer er:

Jomfruen 4. Programmet ble laget for komfortabelt arbeid for blinde og svaksynte brukere med Windows. Den lar deg velge informasjonen som skal snakkes opp med stemmen og informasjonen som skal vises på leselisten. For synshemmede brukere leveres Galileo-skjermforstørrelsessystemet.

Cobra 9.1 gjør også arbeid med Windows enklere for blinde og svaksynte brukere. Dette programmet kan vise informasjon fra en dataskjerm ved hjelp av tale, en leselist, og har en skjermforstørrelsesfunksjon.

Absintium

Kategorier:

Tagger:

Har du lagt merke til en feil? Velg det med musen og trykk Ctrl+Enter!

Kommentarer

Fra et teknisk synspunkt er artikkelen korrekt. Men der forfatteren legger til på egen hånd, begynner problemene. Det er klart at det er vanskelig for en person som bare har hørt om det og ikke bruker det hele tiden til å dømme. Så ikke ta dette som en klage, jeg vil bare oppklare noe.

Faktisk er nivået på talesynthesizere ganske akseptabelt. Selv om selvfølgelig de som ble utviklet for 10 - 15 år siden fortsatt eksisterer, og det er de som kommer over nettverket med en overfladisk kjennskap til temaet. Men det er andre, mer fornuftige. På 20 minutter blir en person ikke lei av en synthesizer - jeg jobber med synthesizere 15 timer om dagen. Og det er mange som meg. men selv de menneskene som ikke er som meg og mine kolleger, men som flertallet, liker å lytte for eksempel til lydbøker som er tatt opp fra tekstfiler ved hjelp av talesyntese. Ofte sliter skuespillere som leser en lydbok en person enda raskere enn 20 minutter, så synthesizere, med deres maskinelle direktehet og kompromissløshet, er mer sannsynlig å vinne, spesielt hvis du ikke er en estet, men bare mottar informasjon. Og programmene som er oppført på slutten, spesielt jomfru og kobra, er fortsatt ikke så godt kjent på våre breddegrader, selv blant dem de ble utviklet for. Det mest kjente av skjermleserprogrammene er jaws for windows. Dette programmet er ledende blant andre løsninger. Skjermleserprogrammet nvda er også populært hos oss og fortjener utvilsomt oppmerksomhet. Den lar blinde løse de fleste hverdagslige problemer og distribueres fritt.