Mis määrab digiteeritud heli kvaliteedi? Formaadid: mis on digitaalne heli Mis määrab helisalvestuse kvaliteedi?

Bitid, hertsid, vormitud dithering...

Mis on nende mõistete taga peidus? CD Audio standardi väljatöötamisel võeti kasutusele järgmised väärtused: 44 kHz, 16 natuke ja 2 kanal (st stereo). Miks täpselt nii palju? Mis on selle valiku põhjus ja miks neid väärtusi üritatakse tõsta näiteks 96 kHz ja 24 või isegi 32 bitini...

Vaatame esmalt diskreetimiseraldusvõimet – see tähendab biti sügavust. Juhtub nii, et tuleb valida numbrite 16, 24 ja 32 vahel. Vaheväärtused oleksid muidugi heli mõttes mugavamad, kuid digitehnoloogias kasutamiseks liiga ebameeldivad (väga vastuoluline väide, arvestades, et paljudel ADC-del on 11- või 12-bitine digitaalne väljund – u.

Mida see parameeter teeb? Lühidalt – dünaamilise ulatuse jaoks. Samaaegselt taasesitatud helitugevuste vahemik on maksimaalsest amplituudist (0 detsibelli) kuni väikseima, mida eraldusvõime võimaldab, näiteks 16-bitise heli puhul umbes miinus 93 detsibelli. Kummalisel kombel on see tugevalt seotud fonogrammi müratasemega. Põhimõtteliselt on 16-bitise heli puhul täiesti võimalik edastada signaale võimsusega -120 dB, kuid neid signaale on praktikas keeruline kasutada sellise põhikontseptsiooni tõttu nagu proovivõtumüra. Fakt on see, et digitaalsete väärtuste võtmisel teeme kogu aeg vigu, ümardades tegeliku analoogväärtuse lähima võimaliku digitaalse väärtuseni. Väikseim võimalik viga on null, kuid maksimaalne viga, mille me teeme, on pool viimasest bitist (bitt, edaspidi lühendatakse termini vähima tähtsusega bitt MB-ks). See viga annab meile nn diskreetimismüra – juhusliku lahknevuse digiteeritud signaali ja originaali vahel. See müra on konstantne ja selle maksimaalne amplituud on võrdne poolega vähima tähtsusega numbrist. Seda võib pidada juhuslikeks väärtusteks, mis on segatud digitaalseks signaaliks. Seda nimetatakse mõnikord ümardamismüraks või kvantimismüraks (mis on täpsem nimi, kuna amplituudikodeeringut nimetatakse kvantiseerimiseks ja diskreetimine on pideva signaali teisendamine diskreetseks (impulss) jadaks – umbes).

Vaatleme üksikasjalikumalt, mida mõeldakse signaali võimsuse all, mõõdetuna bittides. Digitaalse helitöötluse tugevaimaks signaaliks võetakse tavaliselt 0 dB, see vastab kõigile bittidele, mille väärtus on 1. Kui kõige olulisem bitt (edaspidi SB) nullida, on saadud digitaalne väärtus poole suurem, mis vastab taseme kaotus 6 detsibelli (10 * log(2) = 6). Seega, lähtestades kõige olulisemad numbrid kõige vähemtähtsatele numbritele, vähendame signaali taset kuue detsibelli võrra. On selge, et signaali minimaalne tase (üks vähima tähendusega numbris ja kõik ülejäänud numbrid on nullid) on (N-1) * 6 detsibelli, kus N on valimi (proovi) bitisügavus. 16 biti jaoks saame nõrgima signaali taseme - 90 detsibelli.

Kui me ütleme "pool kõige vähemtähtsamat bitti", ei pea me silmas -90/2, vaid pool sammu järgmise bitini – see tähendab veel 3 detsibelli madalamal, miinus 93 detsibelli.

Tuleme tagasi digiteerimise eraldusvõime valiku juurde. Nagu juba mainitud, tekitab digiteerimine müra poole vähima tähtsusega biti tasemel, mis tähendab, et kirje digiteeritakse 16 bitti. pidevalt müra tegema miinus 93 detsibelliga. See suudab signaale vaiksemalt edastada, kuid müra jääb siiski -93 dB juurde. Digitaalse heli dünaamiline ulatus määratakse selle kriteeriumi järgi – seal, kus signaali/müra suhe muutub müraks/signaaliks (müra on rohkem kui kasulikku signaali), asub selle vahemiku alumine piir. Seega peamine digiteerimise kriteerium - kui palju müra kas me saame endale lubada rekonstrueeritud signaali? Vastus sellele küsimusele sõltub osaliselt sellest, kui palju müra algses heliribas oli. Oluline järeldus on see, et kui me digiteerime midagi, mille müratase on miinus 80 detsibelli, siis pole absoluutselt mingit põhjust digiteerida seda rohkem kui 16 bitti, kuna ühest küljest lisab -93 dB müra plaadile väga vähe. juba tohutu (võrreldes) müra -80 dB ja seevastu vaiksem kui -80 dB algab müra/signaal juba fonogrammis endas ja sellist signaali pole lihtsalt vaja digitaliseerida ja edastada.

Teoreetiliselt on see ainus kriteerium digiteerimisresolutsiooni valikul. Rohkem meid me ei panusta absoluutselt ei mingeid moonutusi ega ebatäpsusi. Kummalisel kombel kordab praktika peaaegu täielikult teooriat. See juhtis neid inimesi, kes valisid heli-CD-de jaoks 16-bitise eraldusvõime. Müra miinus 93 detsibelli on päris hea seis, mis vastab peaaegu täpselt meie tajutingimustele: valuläve (140 detsibelli) ja linnas tavapärase taustamüra (30-50 detsibelli) vahe on täpselt saja ringis. detsibelle ja kui arvestada, et sisse Valu tekitaval helitugevusel nad muusikat ei kuula – mis veelgi ahendab vahemikku –, siis selgub, et tegelik ruumi või isegi seadmete müra on palju tugevam kui kvantimismüra. . Kui me kuuleme digisalvestisel miinus 90 detsibelli, kuuleme ja tajume kvantimismüra, vastasel juhul ei tee me lihtsalt kunagi kindlaks, kas heli on digiteeritud või reaalajas. Muud erinevust dünaamilise ulatuse osas lihtsalt ei ole. Kuid põhimõtteliselt kuuleb inimene tähendusrikkalt 120 detsibelli vahemikus ja tore oleks kogu see vahemik säilitada, midagi, millega 16 bitti ei paista hakkama saada.

Kuid see on ainult esmapilgul: spetsiaalse tehnika abil nn kujuline dithering, saate muuta diskreetimismüra sagedusspektrit, liigutades selle peaaegu täielikult piirkonda, mis on üle 7–15 kHz. Näib, et muudame sageduse eraldusvõimet (keeldume vaikset kõrget sagedust taasesitamast), et saada ülejäänud sagedusvahemikus täiendavat dünaamilist vahemikku. Koos meie kuulmise iseärasustega - meie tundlikkus väljutatud kõrgsageduspiirkonna suhtes on kümneid dB madalam kui põhipiirkonnas (2-4 kHz) - võimaldab see kasulike signaalide suhteliselt vaikset edastamist veel 10- 20 dB vaiksem kui -93 dB – seega on 16-bitise heli dünaamiline ulatus inimese jaoks umbes 110 detsibelli. Ja üldiselt samal ajal inimene lihtsalt ei kuule helisid, mis on 110 detsibelli vaiksemad kui valju heli, mida ta just kuulis. Kõrv, nagu ka silm, kohandub ümbritseva reaalsuse helitugevusega, seega on meie kuulmise samaaegne ulatus suhteliselt väike – umbes 80 detsibelli. Räägime ditrimisest üksikasjalikumalt pärast sagedusaspektide arutamist.

CD-de diskreetimissagedus on 44100 Hz. On olemas arvamus (põhineb Kotelnikovi-Nyquisti teoreemi ebaõigel mõistmisel), et reprodutseeritakse kõik sagedused kuni 22,05 kHz, kuid see pole täiesti tõsi. Võime vaid kindlalt väita, et digiteeritud signaalis pole sagedusi üle 22,05 kHz. Tegelik pilt digiteeritud heli taasesitusest sõltub alati sellest spetsiifiline tehnoloogia ja pole alati nii ideaalne, kui me tahaksime, ja nagu see vastab teooriale. Kõik sõltub konkreetsest DAC-st (digitaal-analoogmuundur, mis vastutab helisignaali saamise eest digitaalsest järjestusest).

Mõelgem kõigepealt välja, mida me saada tahaksime. Keskealine (pigem noor) inimene tunneb helisid vahemikus 10 Hz kuni 20 kHz ja tähendusrikkalt kuuleb 30 Hz kuni 16 kHz. Kõrgemaid ja madalamaid helisid tajutakse, kuid need ei kujuta endast akustilisi aistinguid. Üle 16 kHz helid on tunda tüütu ebameeldiva faktorina - surve pähe, valu, eriti valjud helid toovad nii terava ebamugavuse, et tahaks ruumist lahkuda. Ebameeldivad aistingud on nii tugevad, et turvaseadmete töö põhineb sellel - paar minutit väga valju kõrgsagedusheli ajab iga inimese hulluks ning sellises keskkonnas muutub täiesti võimatuks midagi varastada. Piisava amplituudiga helisid alla 30–40 Hz tajutakse objektidest (kõlaritest) lähtuva vibratsioonina. Õigem oleks öelda nii – lihtsalt vibratsioon. Inimene akustiliselt peaaegu ei määra nii madalate helide ruumilist asendit, seega kasutatakse juba teisi meeli - kombatavad, me tunneme selliseid helisid oma kehaga.

Kõrgete sagedustega on kõik veidi halvem, vähemalt kindlasti keerulisem. Peaaegu kogu DAC-de ja ADC-de parenduste ja komplikatsioonide olemus on suunatud täpselt kõrgete sageduste usaldusväärsemale edastamisele. “Kõrge” all mõeldakse diskreetimissagedusega võrreldavaid sagedusi – see tähendab, et 44,1 kHz puhul on see 7-10 kHz ja kõrgem.

Kujutage ette 14 kHz siinuslainet, mis on digiteeritud diskreetimissagedusega 44,1 kHz. Sisendsinusoidi perioodi kohta on umbes kolm punkti (proovi) ja algse sageduse taastamiseks sinusoidi kujul on vaja näidata kujutlusvõimet. Proovidest signaali kuju taastamise protsess toimub ka DAC-is, seda teeb rekonstrueerimisfilter. Ja kui suhteliselt madalad sagedused on peaaegu valmis sinusoidid, siis on kõrgete sageduste taastamise kuju ja kvaliteet täielikult DAC-i taastamissüsteemi südametunnistusel. Seega, mida lähemal on signaali sagedus poolele diskreetimissagedus, seda keerulisem on signaali kuju taastada.

See on peamine probleem kõrgete sageduste taasesitamisel. Probleem pole aga nii hull, kui võib tunduda. Kõik kaasaegsed DAC-id kasutavad mitme kiirusega tehnoloogiat, mis seisneb mitu korda suurema diskreetimissageduse digitaalses taastamises ja sellele järgnevas muundamises kõrgendatud sagedusega analoogsignaaliks. Seega on kõrgete sageduste taastamise probleem nihutatud digitaalsete filtrite õlgadele, mis võivad olla väga kvaliteetsed. Nii kvaliteetne, et kallite seadmete puhul tekib probleem täielikult eemaldatud - on tagatud sageduste kuni 19-20 kHz moonutusteta taasesitamine. Resampling on kasutusel ka mitte väga kallites seadmetes, nii et põhimõtteliselt võib selle probleemi lugeda lahendatuks. Seadmed vahemikus $ 30 - $ 60 (helikaardid) või muusikakeskused kuni $ 600, mis on tavaliselt DAC-is sarnased nende helikaartidega, taasesitavad suurepäraselt sagedusi kuni 10 kHz, rahuldavalt - kuni 14-15 ja kuidagi ülejäänu. See päris piisav enamiku päriselu muusikaliste rakenduste jaoks ja kui kellelgi on vaja rohkem kvaliteeti, siis leiab seda profiklassi seadmetes, mis polegi nii palju kallimad – need on lihtsalt targalt tehtud.

Tuleme tagasi ditheringi juurde – vaatame, kuidas saaksime dünaamilist ulatust kasulikult 16 bitist kaugemale tõsta.

Ditheringu mõte on lisada müra. Nii kummaliselt kui see ka ei kõla, müra ja ebameeldivate kvantimisefektide vähendamiseks me lisama teie müra. Vaatame näidet – kasutame ära CoolEditi võimekust töötada 32 bitis. 32 bitti on 65 tuhat korda täpsem kui 16 bitti, nii et meie puhul võib 32-bitist heli lugeda analoogoriginaaliks ja selle konverteerimist 16-bitiseks digiteerimiseks. Olgu algse 32-bitise heli kõrgeim helitase vastav miinus 110 detsibellile. See on palju vaiksem kui 16-bitise heli dünaamiline ulatus, mille puhul nõrgim kuuldav heli vastab tasemele miinus 90 detsibelli. Seega, kui me lihtsalt ümardame andmed 16 bitti, saame täieliku digitaalse vaikuse.

Lisame signaalile “valge” müra (st lairiba ja ühtlane kogu sagedusriba ulatuses), mille tase on miinus 90 detsibelli, mis vastab ligikaudu kvantimismüra tasemele. Nüüd, kui teisendame selle signaali ja "valge" müra segu 16 bitiks (võimalikud on ainult täisarvud - 0, 1, -1, ...), selgub, et mingi osa signaalist jääb alles. Seal, kus algne signaal oli kõrgema tasemega, on neid rohkem, seal, kus oli madalam tase, on nullid.

Ülaltoodud meetodi katsetamiseks võite kasutada heliredaktorit Cool Edit (või mõnda muud, mis toetab 32-bitist vormingut). Et kuulda, mida saate, peate signaali võimendama 14 biti (78 dB) võrra.

Tulemuseks on mürarikas 16-bitine algsignaali sisaldav heli, mille tase oli miinus 110 detsibelli. Põhimõtteliselt on see standardne viis dünaamilise ulatuse laiendamiseks, mis juhtub sageli peaaegu iseenesest - müra on kõikjal piisavalt. See on aga iseenesest üsna mõttetu - diskreetimismüra tase jääb samale tasemele ning mürast nõrgema signaali edastamine ei ole loogika seisukohalt eriti selge... (Väga ekslik arvamus, kuna edastades a. signaal, mille tase on väiksem kui müra, on üks põhilisi andmete kodeerimise meetodeid.)

Keerulisem viis - kujuline dithering, on see, et kuna me ei kuule ikka veel väga vaiksete helide puhul kõrgeid sagedusi, siis see tähendab, et nendele sagedustele tuleks suunata põhiline mürajõud ja müra saab isegi kasutada kõrgemal tasemel – kasutan taset 4 madala järgu numbrid (kaks bitti 16-bitises signaalis). Teisendame saadud 32-bitise signaali ja müra segu 16-bitiseks signaaliks, filtreerime välja kõrged sagedused (mis tegelikult pole inimesele kõrvaga tajutavad) ja tõstame signaali taset, et saaksime tulemust hinnata.

See on juba üsna hea (ülimadala helitugevuse jaoks) müra võimsuselt on ligikaudu võrdne heli endaga, mille algtase on miinus 110 detsibelli! Oluline märkus: meie edutatud tegelik diskreetimismüra poolest kõige vähem olulisest numbrist (-93 dB) kuni nelja vähima tähtsusega numbrini (-84 dB), langetamine kuuldav diskreetimismüra vahemikus -93 dB kuni ligikaudu -110 dB. Signaali ja müra suhe halvenenud, kuid müra läks kõrgsageduspiirkonda ja lakkas olemast kuuldav, mis andis märkimisväärne paranemine tegelikkuses(inimese tajutav) signaali-müra suhe.

(Teisisõnu, kuna müra võimsus on justkui "laiali" üle sagedusvahemiku, ilma ülemisi sagedusi läbimata, siis võtame sellelt osa võimsusest ära, mille tulemusena signaal-to. -müra suhe paraneb signaalide ajalises esituses - ca.)

Praktikas on see juba 20-bitise heli sämplimise müratase. Selle tehnoloogia ainus tingimus on müra sageduste olemasolu. 44,1 kHz heli võimaldab paigutada müra madalal helitugevusel 10-20 kHz kuuldamatutele sagedustele. Kui aga digiteerida sagedusel 96 kHz, on müra sageduspiirkond (inimesele kuuldamatu) nii suur, et vormitud ditheringi kasutamisel on 16 bitti. tõesti muutuda kõigiks 24-ks.

[Märkus: PC Speaker on ühebitine seade, kuid üsna kõrge maksimaalse diskreetimissagedusega (selle ühe biti sisse/välja lülitamine). Kasutades sisuliselt ditheringule sarnast protsessi, mida nimetatakse pigem impulsilaiusmodulatsiooniks, mängiti sellel üsna kvaliteetset digitaalset heli - ühest bitist eraldati 5-8 madala sagedusega bitti ja kõrge diskreetimissagedus ning kõrgsageduslik. mürafilter oli seadmete suutmatus nii kõrgeid sagedusi taasesitada, aga ka meie võimetus neid kuulda. Kerge kõrgsageduslik vile – selle müra kuuldav osa – oli siiski kuulda.]

Seega võimaldab vormitud dithering oluliselt vähendada 16-bitise heli niigi madalat diskreetimismüra, laiendades seega vaikselt kasulikku (vaikset) dünaamilist ulatust. kõik inimese kuulmispiirkond. Kuna nüüd kasutatakse 32-bitiselt töövormingult CD lõplikuks 16-bitiseks teisendamiseks alati vormitud ditheringut, on meie 16 bitist helipildi täielikuks edasiandmiseks täiesti piisav.

Tuleb märkida, et see tehnoloogia töötab ainult materjali paljundamiseks ettevalmistamise etapis. Kvaliteetse heli töötlemisel lihtsalt vajalik jääma 32-bitiseks, et mitte rakendada pärast iga toimingut ditheringut, kodeerides tulemused paremini tagasi 16-bitiseks. Kuid kui fonogrammi müratase on üle miinus 60 detsibelli, saate kogu töötluse läbi viia 16 bitti ilma vähimagi südametunnistuse piinata. Vahepealne dithering tagab ümardamismoonutuste ja sellega kaasneva müra puudumise sadu kordi nõrgem kui juba olemasolev ja seetõttu täiesti ükskõikne.

K:
Miks nad ütlevad, et 32-bitine heli on parem kui 16-bitine heli?
A1: Nad on valed.
A2: [Nad tähendavad midagi veidi erinevat: heli töötlemisel või salvestamisel vaja kasutage kõrgemat eraldusvõimet. Nad kasutavad seda ära Alati. Kuid helis, nagu ka valmistootes, ei nõuta rohkem kui 16-bitist eraldusvõimet.]
K: Kas diskreetimissagedust on mõtet tõsta (näiteks 48 kHz-ni või 96-ni)?
A1: Ei oma seda. Mis tahes pädeva lähenemisviisiga DAC-i kujundamisel edastatakse 44 kHz kõik vajalik sagedusvahemik.
A2: [Need tähendavad midagi veidi erinevat: see on mõistlik, kuid ainult heli töötlemisel või salvestamisel.]
K: Miks ikka veel käib kõrgemate sageduste ja bitikiiruste juurutamine?
A1: Edusammude edasiliikumiseks on oluline. Kus ja miks pole enam nii oluline...
A2: Paljud protsessid toimuvad sel juhul kergemini. Kui seade hakkab näiteks heli töötlema, on tal seda lihtsam teha sagedusel 96 kHz / 32 bitti. Peaaegu kõik DSP-d kasutavad heli töötlemiseks 32 bitti ja konversioonide unustamine muudab arenduse lihtsamaks ja siiski väikese kvaliteeditõusu. Ja üldiselt - heli edasiseks töötlemiseks Sellel on Mõistlik on salvestada see suurema eraldusvõimega kui 16 bitti. Kõrgetasemeliste seadmete jaoks, mis taasesitavad ainult heli, on see absoluutseltükskõikne.
K: Kas 32x või 24x või isegi 18-bitised DAC-id on paremad kui 16-bitised?
V: Üldiselt - Ei. Teisenduse kvaliteet ei sõltu üldse biti sügavusest. AC"97 koodek (kaasaegne helikaart alla 50 dollari) kasutab 18-bitist kodekit ja 500-dollarilised kaardid, mille heli pole selle jamaga võrreldagi, kasutavad 16-bitist kodekit. Sellel pole 16-bitise heli taasesituse puhul mingit vahet.
Samuti tasub meeles pidada, et enamik DAC-sid toodab tavaliselt vähem bitte, kui sisse võtab. Näiteks tüüpilise odava kodeki tegelik müratase on -90 dB, mis on 15 bitti ja isegi kui see ise on 24-bitine - te ei saa "lisa" 9 biti pealt mingit tulu - nende tulemus. töö, isegi kui see oli, uputatakse nende samasse müra. Enamik odavaid seadmeid on lihtsalt ignoreeritud täiendavad bitid - need lihtsalt ei lähe tegelikult oma helisünteesi protsessis arvutamisse, kuigi nad lähevad DAC-i digitaalsisendisse.
K: Aga salvestamiseks?
V: Salvestamiseks on parem omada suurema võimsusega ADC-d. Jällegi rohkem päris biti sügavus. DAC-i bitisügavus peab vastama algse heliriba müratasemele või olema lihtsalt piisav soovitud madala taseme saavutamiseks müra.
Samuti on mugav kasutada bitisügavust koos varuga, et kasutada suurendatud dünaamilist ulatust salvestustaseme vähem täpseks reguleerimiseks. Kuid pidage meeles - peate alati lööma päris kodeki vahemik. Tegelikkuses on näiteks 32-bitine ADC peaaegu täielikult olemas mõttetu, kuna madalaimad kümme bitti teevad lihtsalt pidevalt müra - nii madal müratase (alla -200 dB) lihtsalt ei saa olla analoogmuusika allikas.

Pole mõtet nõuda helilt CD-ga võrreldes suuremat bitisügavust või sämplimissagedust või paremat kvaliteeti. 16 bit / 44 kHz, vormitud ditheringiga piirini viidud, on üsna võimekas täielikult edastama meile huvipakkuvat teavet, kui see ei puuduta helitöötlusprotsessi. Te ei tohiks raisata ruumi valmis materjali lisaandmetele, nagu ka DVD-Audio 96 kHz / 24-bitise helikvaliteedi paranemist. Õige lähenemisviisiga standardses CD-vormingus heli loomisel saavutame kvaliteedi, mis lihtsalt ei vaja seda edasises täiustamises ning vastutuse lõppandmete õige helisalvestuse eest on pikka aega võtnud väljatöötatud algoritmid ja inimesed, kes oskavad neid õigesti kasutada. Viimastel aastatel ei leia te uut plaati ilma vormitud ditheringita ja muude tehnikateta, mis helikvaliteeti viivad piirini. Jah, laiskadel või lihtsalt kõveratel on mugavam pakkuda valmis materjali 32 bitti ja 96 kHz, kuid teoreetiliselt - kas see on väärt kordades rohkem heliandmeid?..

Heli-CD-d on järk-järgult muutumas ajalooks. Ei, muidugi müüakse neid ikka poodides, aga järjest vähem kuulatakse ja ostetakse. Paljud lihtsalt ei näe sellel mõtet, sest isegi kui kaalume helifailide hankimise seaduslikku viisi, maksab üks MP3-vormingus laul veebipoes palju vähem kui üks heliplaadile salvestatud lugu. Tekib mõistlik küsimus: miks maksta rohkem?

Muidugi on heli-CD helikvaliteet palju kõrgem kui mis tahes helifailil, kus andmed on tihendatud, kuid üllatava enamiku inimeste jaoks pole see erinevus kriitiline. Mis seal on! Tänapäeval mõtlevad isegi suurimad audiofiilid oma audio-CD-kogu helifailideks konverteerimisele, sest võib-olla saabub aeg, mil nõudlus plaatide järele on nii madal, et CD-mängijaid enam lihtsalt ei toodeta.

Käesolevas artiklis vaatleme mõnda programmi audio-CD-delt andmete võtmiseks ja nende MP3-ks ja muudeks vorminguteks teisendamiseks. Aga kõigepealt väike teooria.

Heli tihendamine ja populaarsed helivormingud

Andmete tihendamine hõlmab salvestatud teabe analüüsi ja lihtsustamist, mille tulemusena saab laserkandjale salvestada rohkem heliandmeid, kui on võimalik heli-CD salvestamisel.

Et oleks selgem, mis on andmete tihendamine, kujutage ette, et peate oma sõbrale telefoni teel tuhat korda ümber jutustama paberitüki sisu, millele on kirjutatud A-täht. Võite lihtsalt tuhat korda valjusti öelda "A" ja teie vestluskaaslane on teadlik, mis lehel on kirjutatud. Teisest küljest võid kõigepealt kokku lugeda, mitu korda seda tähte kirjutatakse, ja siis öelda sõbrale, et paberile on tuhat korda kirjutatud täht “A”. Tulemus on sama – teie sõber teab paberitüki sisu, kuid teisel juhul kulub teil teabe edastamiseks palju vähem aega. Teisisõnu tegite andmete tihendamise, analüüsides, mitu korda tähte korratakse.

Digitaalne heli tihendamine järgib ligikaudu sama stsenaariumi. Heliandmete tihendamisel on aga mitmeid funktsioone. Nii et näiteks tuttava meloodia äratundmiseks piisab selle mängimisest kehvema kvaliteediga. Tuleb meeles pidada, et paljud inimesed mõtlevad “kvaliteetse heli” mõistes täiesti erinevaid asju. Nii et kui muusikasalvestis teeb näiteks muusiku kõrvadele haiget, sest keel ei olnud rangelt määratletud võtmes tüütud, siis võib tavainimene leppida palju tõsisemate puudujääkidega.

See inimese heli tajumise funktsioon on inspireerinud uute helivormingute loomist, mis kasutavad kadudega heli tihendamise mudelit. Heli halvenemine ei ole enamiku melomaanide jaoks kriitiline ja mõnel juhul pole kvaliteet üldse oluline, näiteks vaikuse pausi korral, kui heliandmetel pole väärtust või sagedustel, mida inimkõrv ei taju .

Digitaalseid helisalvestusvorminguid on tohutult palju. Nende erinevus seisneb selles, et nad kasutavad erinevaid tihendusalgoritme. Tänapäeval on kõige populaarsemad vormingud:

  • WMA (Windows Media Audio) on Microsoft Corporationi välja töötatud formaat. See formaat loodi minevikus populaarse VQF-vormingu alusel, mis on tänapäeval peaaegu unustatud.
  • OGG Vorbis on tasuta ja avatud lähtekoodiga formaat. Viimasel ajal on see muutunud nii populaarseks, et seda toetavad mõnede kaasaskantavate pleierite tootjad.
  • MP3 (MPEG Layer III) on kõige populaarsem formaat, mis hoiab liidripositsiooni aastaid.

MP3-vormingu omadused

Üldnimetus MP3 on MPEG Layer III lühend. MPEG omakorda tähistab Moving Picture Coding Experts Groupi. MP3-vormingu töötas välja Saksamaa Fraunhoferi Instituut eelmise sajandi 90ndate alguses. Formaat sai tõeliselt populaarseks pärast seda, kui Thomson hakkas selle vastu huvi tundma.

Tänu MP3-vormingut kasutavale tihendusalgoritmile saab heliandmeid tihendada kümme kuni kaksteist korda ilma märgatava kvaliteedi kadumiseta. Kõrge tihendusaste saavutatakse tänu sellele, et MP3 kasutab inimkuulmise omadusi. Inimkõrv tajub heli vahemikus 20 Hz kuni 20 kHz, seega kõik helid, mis sellesse vahemikku ei kuulu, lükatakse lihtsalt tagasi. See vähendab oluliselt andmemahtu.

Teine MP3 funktsioon, mis võimaldab hankida väiksemat helifaili, on seotud stereoheliga ja jällegi inimese kuulmise omadustega. Stereorežiimis salvestatud muusikat kuulates kuuleme peamist erinevust kesksagedustes. Tänu sellele funktsioonile saab helikodeerimisel rakendada tihendusalgoritmi, mis kodeeriks iga kanali jaoks eraldi ainult selle sagedusspektri, milles kanalite erinevus on kõige kuuldavam. Ja heli nendel stereokanalite sagedustel, kus erinevus on vähem märgatav, kombineeritakse ja kodeeritakse monorežiimis. Seda kombineeritud stereosignaali kodeerimisrežiimi nimetatakse Joint Stereo.

Digitaalse heli spetsifikatsioonid

Heliandmete tihendamisel on vaja kontrollida digiteeritud heli kvaliteeti. Näiteks kui teil on vaja audioraamatut digiteerida, pole sel juhul kõrge kvaliteet vajalik. Peaasi, et saate sõnadest aru. Kui muusikapala digiteeritakse, on kvaliteet väga oluline.
Olenemata sellest, millist heli tihendusalgoritmi kasutatakse, on helikvaliteeti iseloomustavad parameetrid samad.

Digitaalse heli üks peamisi omadusi on bitikiirus. Bitikiirus on digitaalse helivoo kodeerimise/dekodeerimise kiirus. Mida kõrgem on selle väärtus, seda parem on helikvaliteet ja seda suurem on faili suurus. Peab ütlema, et bitikiirus on suhteline väärtus. Erinevate tihendusalgoritmidega loodud failid, millel on sama bitikiirus, erinevad kvaliteedi poolest.

Kodeerimist saab teha konstantse või muutuva bitikiirusega. Muutuva bitikiirusega kodeerimismeetod võimaldab muuta helisignaali kvaliteeti lennu ajal, st taasesituse ajal. Kui programm teeb kindlaks, et tegemist on keerulise helivooga (näiteks sümfooniaorkestri helid), tõuseb kvaliteet, aga kui heli on lihtne (näiteks kui lugude vahel on paus), siis kvaliteet halveneb automaatselt. See vähendab faili suurust.

Heli kodeerimine toimub teatud diskreetimissagedus. Töötlemisprotsessi käigus jagatakse helisignaal suureks hulgaks osadeks (proovideks), millest igaüks töödeldakse tihendusalgoritmi abil. Signaali töötlemise täpsuse määrab diskreetimissagedus, mida mõõdetakse kilohertsides. Sõltuvalt näidiste arvust ajaühikus eristatakse helikarakteristikut nagu bitisügavus. Pole raske arvata, et mida rohkem sämpleid töödeldakse, seda kõrgem on helikvaliteet.

Kahekordne diskreetimine rakendatakse analoog-digitaalmuundurisse (helikaarti) sisenevale helisignaalile - amplituudis ja ajas.
Signaali kuju matemaatiliseks kirjeldamiseks kasutatakse Kotelnikovi teoreemi, mille kohaselt saab iga piiratud spektriga pidevat protsessi esitada selle hetkeväärtuste diskreetse jadaga. Sellise jada sagedus peab olema vähemalt kaks korda suurem protsessi kõrgeima harmoonilise sagedusest. Sagedust, millega signaali hetkväärtusi (proove) võetakse, nimetatakse diskreetimissageduseks.

Igasugune kõrvalekalle helikaardi sisendisse saabuva signaali kujus õigest sinusoidi kujust viib selleni, et spekter läheb signaali omasagedusest kaugemale. Seetõttu on helisignaali õigeaegsel diskreetismisel sissetuleva impulsi sagedused piiratud alla poole diskreetimissagedusest või võetakse üleliigse sagedusega spekter. Tänu sellele, et inimkõrv suudab eristada helivibratsioone sagedusega kuni 20 kHz, tuleb välja, et mis tahes helisignaali diskreetimissagedus peab olema vähemalt 40 kHz. Seetõttu võib praktikas leida heliseadmeid, mille diskreetimissagedused on 44,1 kHz, 48 kHz ja 96 kHz.

Heli amplituudi diskreetimiseks, näiteks laserplaadil, kasutatakse kvantimistaset 2 kuni kuueteistkümnenda astmeni (65536). Numbrite esitamine vahemikus 0 kuni 2^16 nõuab 16 bitti teavet, seega on mugavam kasutada terminit 16-bit signaali laius. Heli sügavus sõltub sisendsignaali dünaamilisest vahemikust ja aktsepteeritavast kvantimismürast.

Amplituudi ja aja kvantiseerimine põhjustab heli moonutusi kogu sagedusriba ulatuses, millele lisandub helikaardi heliteelt tulenev müra ja häired.

Teine oluline digitaalheli omadus on stereoheli. Seega, kui heli salvestatakse stereo, mitte mono kujul, kahekordistub heliandmete hulk ja vastavalt suureneb ka väljundfaili suurus.

Muusika rippimine heli-CD-delt Windows Media abilMängija

Heliandmete kopeerimise võimalus on WindowsXP-sse juba sisse ehitatud. Heliandmete kopeerimiseks Windows Media Playeri abil sisestage heliplaat oma kettaseadmesse, käivitage pleier ja klõpsake programmi akna ülaosas nuppu "Kopeeri plaadilt". Mängijaaknas kuvatakse teie helimeediumi sisu üksikute lugudena. Iga nende kõrval on märkeruut. See tähendab, et kõik laulud kopeeritakse. Kui te ei soovi konkreetset laulu kopeerida, tühjendage selle nime kõrval olev ruut.

Vaikimisi ei ole programmi seadistustel heliandmete tihendamise kvaliteet väga kõrge, nii et kui olete kvaliteetse heli fänn, peate muutma loodud faili bitikiirust. Selleks käivita käsk "Tööriistad>Valikud" ja avanevas aknas minge vahekaardile "Muusika kopeerimine CD-lt". Bitikiiruse väärtus määratakse liuguriga "Heli kvaliteet" ja kõige parempoolsem asend vastab maksimaalsele väljundfaili suurusele ja vastavalt ka parimale helile.

Üks standardpleieri omadusi on võime kaitsta helifaile teises arvutis esitamise eest. Kui soovite, et programmiga loodud WMA-faile esitataks ainult selles arvutis, veenduge, et valik "Kopeerimiskaitsega muusika" on märgitud.

Kopeerimise alustamiseks klõpsake programmi akna ülaosas nuppu "Kopeeri muusika CD-lt". Ekraanile ilmub aken, kus saate sisukaitse lubada või keelata, märkides vastava kasti. Enne kopeerimise alustamist saate vajadusel muuta ka kopeerimisseadeid.

Tihendusprotsessi saab jälgida veerus "CD kopeerimise olek". Niipea, kui pala kõvakettale ülekandmine on lõpule viidud, kuvatakse kopeeritud kompositsiooni vastas teade "Teeki kopeeritud".

Vaatamata heliandmete kopeerimise kaalutud meetodi näilisele mugavusele on paljudel juhtudel selle kasutamine ebamugav. Esiteks ei toeta kõik kaasaskantavad MP3-seadmed WMA-vormingut ja teiseks võtab sellesse vormingusse kodeerimine teiste vormingutega võrreldes kauem aega. Lõpuks, Windows Media Playeri kasutamisel puudub tihendussätete üle paindlik kontroll.

Ühesõnaga, kui olete ostnud MP3-mängija ja plaanite regulaarselt täiendada oma digitaalset muusikakogu, kopeerides andmeid heliplaatidelt, peate veenduma, et teil on käepärast kvaliteetne ja multifunktsionaalne helikooder. Vaatleme mõnda neist programmidest artikli teises osas.

Millised parameetrid määravad digitaalse heli kvaliteedi?

  • Heli teave. Heli on laine, mis levib õhus, vees või muus keskkonnas pidevalt muutuva intensiivsuse ja sagedusega.

    Inimene tajub helilaineid (õhuvõnkumisi) kuulmise abil erineva helitugevuse ja tooniga helina. Mida suurem on helilaine intensiivsus, seda valjem on laine sagedus, seda kõrgem on heli toon (joonis 1.1).

    Riis. 1.1. Heli helitugevuse ja kõrguse sõltuvus helilaine intensiivsusest ja sagedusest

    Inimkõrv tajub heli sagedustel, mis jäävad vahemikku 20 vibratsiooni sekundis (madal heli) kuni 20 000 vibratsiooni sekundis (kõrge heli).

    Inimene suudab heli tajuda suures intensiivsuse vahemikus, mille maksimaalne intensiivsus on 1014 korda suurem kui miinimum (sada tuhat miljardit korda). Helitugevuse mõõtmiseks kasutatakse spetsiaalset ühikut “detsibell” (dbl) (tabel 5.1). Helitugevuse vähenemine või suurendamine 10 dbl võrra vastab helitugevuse vähenemisele või suurenemisele 10 korda.

    Tabel 5.1. Helitugevus
    Heli tugevus detsibellides
    Inimese kõrva tundlikkuse alumine piir on 0
    lehtede sahin 10
    Vestlus 60
    Auto signaal 90
    Reaktiivmootor 120
    Valulävi 140
    Heli aja proovivõtt. Selleks, et arvuti saaks heli töödelda, tuleb pidev helisignaal ajasamplit kasutades teisendada digitaalseks diskreetseks vormiks. Pidev helilaine jagatakse eraldi väikesteks ajutisteks sektsioonideks ja iga sellise lõigu jaoks määratakse kindel helitugevuse väärtus.

    Seega on helitugevuse pidev sõltuvus ajast A(t) asendatud diskreetse helitugevuse tasemete jadaga. Graafikul näeb see välja nagu sujuva kõvera asendamine "sammude" jadaga (joonis 1.2).

    Riis. 1.2. Heli ajaproovide võtmine

    Proovivõtu sagedus. Analoogheli salvestamiseks ja digitaalseks teisendamiseks kasutatakse helikaardiga ühendatud mikrofoni. Saadud digitaalheli kvaliteet sõltub helitugevuse taseme mõõtmiste arvust ajaühikus, st diskreetimissagedusest. Mida rohkem mõõtmisi sekundis tehakse (mida kõrgem on diskreetimissagedus), seda täpsemalt järgib digitaalse helisignaali “redel” dialoogisignaali kõverat.

    Heli diskreetimissagedus on ühe sekundi jooksul tehtud helitugevuse mõõtmiste arv.

    Heli diskreetimissagedus võib olla vahemikus 8000 kuni 48 000 helitugevuse mõõtmist sekundis.

    Heli kodeerimise sügavus. Igale "astmele" on määratud konkreetne helitugevuse tase. Helitugevuse tasemeid võib käsitleda kui võimalike olekute N kogumit, mille kodeerimiseks on vaja teatud kogust informatsiooni I, mida nimetatakse heli kodeerimise sügavuseks.

    Heli kodeerimise sügavus on teabe hulk, mis on vajalik digitaalse heli diskreetse helitugevuse kodeerimiseks.

    Kui kodeerimissügavus on teada, saab digitaalse helitugevuse tasemete arvu arvutada valemiga N = 2I. Olgu heli kodeeringu sügavus 16 bitti, siis helitugevuse tasemete arv on võrdne:

    N = 2I = 216 = 65 536.

    Kodeerimisprotsessi ajal määratakse igale helitugevuse tasemele oma 16-bitine kahendkood, mille madalaim helitase vastab koodile 000000000000000 ja kõrgeim - 1111111111111111.

    Digitaliseeritud helikvaliteet. Mida kõrgem on heli sagedus ja sämplimissügavus, seda kõrgem on digiteeritud heli kvaliteet. Madalaim digiteeritud heli kvaliteet, mis vastab telefoniside kvaliteedile, saadakse diskreetimissagedusega 8000 korda sekundis, diskreetimissügavusega 8 bitti ja ühe heliraja salvestamisega (monorežiim). Kõrgeim digiteeritud helikvaliteet, mis vastab audio-CD kvaliteedile, saavutatakse diskreetimissagedusega 48 000 korda sekundis, diskreetimissügavusega 16 bitti ja kahe heliriba salvestamisega (stereorežiim).

    Tuleb meeles pidada, et mida kõrgem on digitaalse heli kvaliteet, seda suurem on helifaili teabe maht. Saate hinnata keskmise helikvaliteediga (16 bitti, 24 000 mõõtmist sekundis) 1-sekundilise heli kestusega digitaalse stereohelifaili teabemahtu. Selleks tuleb kodeerimissügavus korrutada mõõtmiste arvuga 1 sekundi jooksul ja korrutada 2-ga (stereoheli):

    16 bitti 24 000 2 = 768 000 bitti = 96 000 baiti = 93,75 KB.

    Helitoimetajad. Heliredaktorid võimaldavad teil mitte ainult heli salvestada ja taasesitada, vaid ka seda redigeerida. Digiteeritud heli esitatakse heliredaktorites visuaalsel kujul, nii et heliriba osade kopeerimise, teisaldamise ja kustutamise toiminguid saab hõlpsasti teha hiirega. Lisaks saate heliribasid üksteise peale asetada (helid miksida) ja rakendada erinevaid akustilisi efekte (kaja, tagurpidi taasesitus jne).

Mis määrab digiteeritud heli kvaliteedi?

    Digitaalse heli kvaliteedi jaoks on olulised kaks asja: originaalheliraja kvaliteet ja analoog-digitaalmuunduri kvaliteet.

    Mis puudutab algse heliriba kvaliteeti, siis kõik on ligikaudu selge. Kui see on kõver (moonutustega) või mürarikas, siis ükski digiteerimine seda ei paranda. Noh, see tähendab, et erinevate töötluste, sealhulgas digitaalsete, abil on võimalik eraldada kasulik signaal, mida kasutatakse kõne eraldamisel välise müra taustal või tavalise signaali isoleerimisel juhusliku müra taustal (kõigil on vaatasin filme spinnidest, eks?), aga kui me räägime muusikalisest fonogrammist ehk siis laia spektriga fonogrammist, siis igasugused nipid ei aita.

    Seega eeldame, et fonogramm on kvaliteetne.

    Siis jääb alles ainult ADC.

    Peamine indikaator on siin kodeeringu biti sügavus. On selge, et mida suurem see on, seda parem, kuid teisest küljest, seda keerulisem ja kallim on selline muundur. Digitehnoloogia koidikul (mis ei olnud nii ammu...) tunnistati hinna/kvaliteedi suhte osas optimaalseks 16-bitine lõpprekord. Väiksema bitisügavuse korral kannatab fonogrammi digitaalse koopia dünaamiline ulatus - madala taseme helid (pianissimo) moodustavad vaid väikese osa kõigist bittidest, mis tähendab, et signaali muutumise astmelisus muutub märgatavaks. Ja madalpääsfiltrimisest pole siin suurt abi (Kotelnikovi teoreemi mainimised on teretulnud, kuid me ei tohi unustada, et see eeldab vaikimisi täiuslik analoog-digitaal muundamine, st lõpmata suure bitisügavusega). Kuna igasugune töötlemine, isegi digitaalsel kujul, võib ainult vähendada efektiivset bitisügavust, siis stuudiotes digitaliseerimine toimus ja toimub tänaseni suurema bittide arvuga.

    Tänapäeval ei ole enam haruldane, et digitaalsed fonogrammid valmistatakse ette 24-bitise bitisügavusega (super-Audio CD, Audio-DVD). Sellise natukese sügavusega on võimalik täielikult edasi anda iga muusikateose dünaamilist ulatust, isegi Raveli Bolerot, mis algab vaevukuuldava trummide osaga ja lõpeb kogu orkestriga fortissimo’ga.

    Palun. Lisaks bitisügavusele on olulised ka teised ADC parameetrid, eelkõige mittelineaarsus ja müra. Eriti mürad. Kuna need piiravad muunduri efektiivset bitivõimsust. Mis mõte on neil 24 bitil, kui viimased 8 on mürarikkad ja seetõttu ei kanna mingit kasulikku infot... Tänapäevaste 24-bitiste ADC-de müratase võib üle 100 kHz diskreetimissagedusel ulatuda -115 dB-ni, see on juba üsna korralik ja diferentsiaalset mittelineaarsust mõõdetakse kümne tuhande protsendi ulatuses. See tähendab, et sellised lahendused ületavad kergesti inimkõrva võimeid.

  • See sõltub kolmest põhiparameetrist:

    1. Proovivõtu sagedus. See piirab edastatavate sageduste ribalaiust: edastatava signaali maksimaalne sagedus on alla poole diskreetimissagedusest. Telefonis kasutatakse kõige sagedamini diskreetimissagedust 8 kHz, mis annab teoreetiliseks ribaks veidi kitsama kui 4 kHz (praktikas kasutatakse sagedust 300-3000 Hz). Ja CD-standard kasutab sagedust 44,1 kHz, mis võimaldab täielikult edastada spektrit 20 Hz - 20 kHz. Diskreetimissageduse suurendamine üle nende väärtuste ei ole edastatavate sageduste vahemiku seisukohalt mõttekas, kuid see vähendab intermodulatsiooni moonutuste taset. DVD Audio standardis on maksimaalne diskreetimissagedus 192 kHz, ka mõned head arvutite helikaardid toetavad seda diskreetimissagedust (esituse ja salvestussageduste ribalaius on mudeliti erinev). Muud standardväärtused on 96, 48, 32, 22,05, 11,025 kHz.
    2. Kodeerimise biti sügavus. Sellest sõltub dünaamiline ulatus - lineaarse kodeeringu korral on täishoo ja minimaalse sammu vahe 8 biti puhul 256 korda ja 16 biti puhul 65536 korda, mis on vastavalt 48 ja 96 dB. 48 dB on ausalt öeldes madal, see on kompaktse kasseti dünaamilise ulatuse tase ja lisaks kitsale dünaamilisele ulatusele tekivad ebameeldivad moonutused, mis on eriti selgelt kuuldavad vaiksetes kohtades - sujuva signaali muundamise tagajärg. astmeliseks. Bitisügavusega 16 bitti on helikvaliteet juba päris hea (seda bitisügavust kasutab CD), kuid mitte ideaalne paljudel reaalsetel juhtudel - paljud klassikalised teosed ja ka raske muusika nõuavad suuremat DD-d. Kvaliteetsed süsteemid kasutavad 24-bitist kodeeringut, kuigi tegelik oluliste bittide arv ei ületa 18-20. Biti sügavust pole mõtet veelgi suurendada.
    3. Kodeerimismeetod. Sellel on kaks poolt. Esimene on valimi skaala ise. Tavaliselt on see lineaarne, kuid võib olla ka logaritmiline. See suurendab dünaamilist ulatust sama bitisügavusega, kuid moonutuste tase on kõrgem kui sama dünaamilise vahemiku puhul lineaarse skaala ja suurema bitisügavusega. Teine on erinevate kadudega tihendusalgoritmide kasutamine. Viimasega seoses ilmneb bitikiiruse mõiste. Viimane on bittide arv, mis on vajalik ühe sekundi heli kodeerimiseks. Loomulikult sõltub bitikiirus diskreetimissagedusest ja biti sügavusest, aga ka tihendusastmest. Kompressioon võib olla kadudeta või kadudeta. Kadudeta pakkimine on sisuliselt tavaline arhiveerimine ja see ei mõjuta heli. Ja kaotustega on need seetõttu kaotused. Kodeerija analüüsib heliteavet ja loobub andmetest, juhindudes psühhoakustilistest kaalutlustest: kõige vähem kuuldava kaotus. See tähendab, et nõrk heli tugeva taustal, nõrgad kõrgsageduslikud helid tugevate kesksageduslike helide taustal jne. Keskmiste ja kõrgete sageduste korral võidakse faasiteave ära jätta. Selle tulemusel, kui salvestust tihendatakse CD kvaliteediga 4,5 korda (bitikiirus 320 kbps, mp3/Lame), on salvestuse kuuldav halvenemine nii tühine, et ilma hea varustuseta on erinevust väga raske märgata. Ja bitikiirusega 128 on helikvaliteedi halvenemine juba ilmne ja paljud salvestised kõlavad lihtsalt ebameeldivalt. Kuid plastkõlaritega või sülearvutisse sisseehitatud kõlaritega te seda erinevust ei kuule.

Väga sageli kuuleme selliseid määratlusi nagu "digitaalne" või "diskreetne" signaal, mille poolest see erineb "analoogsignaalist"?

Erinevuse olemus seisneb selles, et analoogsignaal on ajas pidev (sinine joon), samas kui digitaalsignaal koosneb piiratud koordinaatide komplektist (punased punktid). Kui taandada kõik koordinaatideks, siis koosneb iga analoogsignaali segment lõpmatust arvust koordinaatidest.

Digitaalse signaali puhul paiknevad koordinaadid piki horisontaaltelge kindlate ajavahemike järel, vastavalt diskreetimissagedusele. Levinud audio-CD-vormingus on see 44100 punkti sekundis. Koordinaatide kõrguse vertikaalne täpsus vastab digitaalsignaali bitisügavusele 8 biti puhul 256, 16 biti puhul = 65536 ja 24 biti puhul = 16777216 taset. Mida suurem on biti sügavus (tasemete arv), seda lähemal on vertikaalsed koordinaadid alglainele.

Analoogallikad on: vinüül- ja helikassetid. Digitaalsed allikad on: CD-Audio, DVD-Audio, SA-CD (DSD) ja failid WAVE- ja DSD-vormingus (sh APE, Flac, Mp3, Ogg jne tuletised).

Analoogsignaali eelised ja puudused

Analoogsignaali eeliseks on see, et just analoogkujul tajume heli oma kõrvaga. Ja kuigi meie kuulmissüsteem teisendab tajutava helivoo digitaalsesse vormi ja edastab selle sellisel kujul ajju, pole teadus ja tehnoloogia veel jõudnud selleni, et mängijad ja muud heliallikad sellisel kujul otse ühendaksid. Sarnaseid uuringuid tehakse praegu aktiivselt puuetega inimeste kohta ja me naudime eranditult analoogheli.

Analoogsignaali puuduseks on võime signaali salvestada, edastada ja paljundada. Magnetlindile või vinüülile salvestamisel sõltub signaali kvaliteet lindi või vinüüli omadustest. Aja jooksul lint demagnetiseerub ja salvestatud signaali kvaliteet halveneb. Iga lugemine hävitab järk-järgult kandjat ja ümberkirjutamine toob kaasa täiendavaid moonutusi, kus täiendavaid kõrvalekaldeid lisavad järgmised kandjad (lint või vinüül), lugemis-, kirjutamis- ja signaaliedastusseadmed.

Analoogsignaali koopia tegemine on sama, mis foto kopeerimine, tehes sellest uuesti foto.

Digisignaali eelised ja puudused

Digisignaali eeliste hulka kuulub täpsus helivoo kopeerimisel ja edastamisel, kus originaal ei erine koopiast.

Peamine puudus on see, et digitaalne signaal on vaheaste ja lõpliku analoogsignaali täpsus sõltub sellest, kui üksikasjalikult ja täpselt helilainet koordinaatidega kirjeldatakse. On üsna loogiline, et mida rohkem punkte on ja mida täpsemad on koordinaadid, seda täpsem on laine. Kuid siiani pole üksmeelt selles, kui palju koordinaate ja andmete täpsus on piisav, et väita, et signaali digitaalsest esitusest piisab analoogsignaali täpseks taastamiseks, mida meie kõrvad ei erista originaalist.

Andmemahtude poolest on tavalise analoogheli kasseti maht vaid umbes 700-1,1 MB, tavalisele CD-le aga 700 MB. See annab aimu suure mahutavusega kandjate vajadusest. Ja sellest sünnib omaette kompromissisõda erinevate nõuetega kirjeldavate punktide arvule ja koordinaatide täpsusele.

Tänapäeval peetakse täiesti piisavaks helilaine esitamist, mille diskreetimissagedus on 44,1 kHz ja bitisügavus 16 bitti. Diskreetimissagedusel 44,1 kHz on võimalik rekonstrueerida signaali kuni 22 kHz. Nagu psühhoakustilised uuringud näitavad, ei ole diskreetimissageduse edasine tõus märgatav, kuid bitisügavuse suurenemine annab subjektiivse paranemise.

Kuidas DAC-id lainet loovad

DAC on digitaal-analoogmuundur, element, mis muudab digitaalse heli analoogiks. Vaatleme põhiprintsiipe pealiskaudselt. Kui kommentaaridest ilmneb huvi mitme punkti põhjalikuma läbivaatamise vastu, avaldatakse eraldi materjal.

Mitmebitised DAC-id

Väga sageli on lainet kujutatud sammudena, mis on tingitud esimese põlvkonna mitmebitiste R-2R DAC-ide arhitektuurist, mis töötavad sarnaselt releelülitiga.

DAC-sisend võtab vastu järgmise vertikaalkoordinaadi väärtuse ja lülitab igal kellatsüklil voolu (pinge) taseme vastavale tasemele kuni järgmise muudatuseni.

Kuigi arvatakse, et inimkõrv ei kuule kõrgemat sagedust kui 20 kHz ja Nyquisti teooria järgi on võimalik signaali taastada kuni 22 kHz, jääb küsimus selle signaali kvaliteedi kohta pärast taastamist. Kõrgsagedusalas on saadud "astmeline" lainekuju tavaliselt algsest kaugel. Lihtsaim väljapääs olukorrast on salvestamise ajal diskreetimissageduse suurendamine, kuid see toob kaasa faili suuruse olulise ja soovimatu suurenemise.

Alternatiiviks on DAC taasesituse diskreetimissageduse kunstlik suurendamine vaheväärtuste lisamisega. Need. kujutame ette pidevat laineteekonda (hall punktiirjoon), mis ühendab sujuvalt algsed koordinaadid (punased täpid) ja lisame sellele joonele vahepunktid (tumelilla).

Diskreetimissageduse suurendamisel on tavaliselt vaja bitisügavust suurendada, et koordinaadid oleksid ligikaudsele lainele lähemal.

Tänu vahekoordinaatidele on võimalik “samme” vähendada ja laine originaalile lähemale ehitada.

Kui näete pleieris või välises DAC-is võimendusfunktsiooni vahemikus 44,1 kuni 192 kHz, on see vahekoordinaatide lisamise funktsioon, mitte heli taastamine ega tekitamine sagedusalas üle 20 kHz.

Algselt olid need eraldi SRC kiibid enne DAC-i, mis seejärel migreerusid otse DAC-kiipidele. Tänapäeval võib leida lahendusi, kus selline kiip lisatakse kaasaegsetele DAC-idele, seda tehakse selleks, et pakkuda alternatiivi DAC-i sisseehitatud algoritmidele ja saada mõnikord veelgi paremat heli (nagu seda tehakse näiteks Hidizsis AP100).

Peamine keeldumine tööstuses mitmebitistest DAC-idest tulenes kvaliteedinäitajate edasise tehnoloogilise arendamise võimatuse tõttu praeguste tootmistehnoloogiatega ja kõrgemate kuludega võrreldes võrreldavate omadustega impulss-DAC-dega. Hi-End toodete puhul eelistatakse aga sageli pigem vanu mitmebitiseid DAC-e kui uusi tehniliselt paremate omadustega lahendusi.

DAC-ide vahetamine

70ndate lõpus levis laialt impulss-arhitektuuril põhinev DAC-ide alternatiivne versioon "delta-sigma". Impulss-DAC tehnoloogia võimaldas tekkida ülikiired lülitid ja võimaldas kasutada kõrgeid kandesagedusi.

Signaali amplituud on impulsi amplituudide keskmine väärtus (võrdse amplituudiga impulsid on näidatud roheliselt ja saadud helilaine on näidatud valgega).

Näiteks kaheksast tsüklist koosnev viie impulsi jada annab keskmise amplituudi (1+1+1+0+0+1+1+0)/8=0,625. Mida kõrgem on kandesagedus, seda rohkem impulsse silutakse ja saadakse täpsem amplituudi väärtus. See võimaldas esitada helivoogu ühebitisel kujul laia dünaamilise ulatusega.

Keskmistamist saab teha tavalise analoogfiltriga ja kui selline impulsside komplekt otse kõlarile suunata, siis väljundis saame heli ja kiirgaja suure inertsi tõttu ülikõrgeid sagedusi ei reprodutseerita. Sellel põhimõttel töötavad PWM-võimendid klassis D, kus impulsside energiatihedust loob mitte nende arv, vaid iga impulsi kestus (mida on lihtsam realiseerida, kuid seda ei saa kirjeldada lihtsa binaarkoodiga).

Mitmebitist DAC-i võib pidada printeriks, mis on võimeline Pantone'i tintide abil värve kandma. Delta-Sigma on piiratud värvivalikuga tindiprinter, kuid tänu võimalusele rakendada väga väikseid täppe (võrreldes sarveprinteriga), toodab see rohkem toone, kuna punktide tihedus on pinnaühiku kohta erinev.

Pildil ei näe me tavaliselt silma madala eraldusvõime tõttu üksikuid punkte, vaid ainult keskmist tooni. Samuti ei kuule kõrv impulsse üksikult.

Lõppkokkuvõttes on impulss-DAC-de praeguste tehnoloogiate abil võimalik saada laine, mis on lähedane sellele, mis teoreetiliselt tuleks vahepealsete koordinaatide lähendamisel saada.

Tuleb märkida, et pärast delta-sigma DAC tulekut kadus sammude kaupa "digitaallaine" joonistamise asjakohasus, kuna Nii ei ehita moodsad DAC-id lainet astmeliselt. Õige on konstrueerida diskreetne signaal, mille punktid on ühendatud sujuva joonega.

Kas DAC-ide vahetamine on ideaalne?

Kuid praktikas pole kõik roosiline ning sellel on mitmeid probleeme ja piiranguid.

Sest Kuna valdav arv kirjeid on salvestatud mitmebitises signaalis, nõuab bit-biti põhimõttel impulsssignaaliks teisendamine tarbetult kõrget kandesagedust, mida tänapäevased DAC-id ei toeta.

Kaasaegsete impulss-DAC-de põhifunktsiooniks on mitmebitise signaali teisendamine suhteliselt madala kandesagedusega ühebitiseks signaaliks koos andmete detsimeerimisega. Põhimõtteliselt määravad need algoritmid impulss-DAC-de lõpliku helikvaliteedi.

Kõrge kandesageduse probleemi vähendamiseks jagatakse helivoog mitmeks ühebitiseks vooguks, kus iga voog vastutab oma bitirühma eest, mis võrdub voogude arvu kandesageduse kordsega. Selliseid DAC-sid nimetatakse mitmebitiseks delta-sigmaks.

Tänaseks on impulss-DAC-d saanud teise tuule kiirete üldotstarbeliste kiipide osas NAD-i ja Chordi toodetes tänu võimalusele paindlikult programmeerida teisendusalgoritme.

DSD formaadis

Pärast delta-sigma DAC-ide laialdast kasutamist oli üsna loogiline, et tekkis vorming kahendkoodi salvestamiseks otse delta-sigma kodeeringusse. Seda vormingut nimetatakse DSD-ks (Direct Stream Digital).

Seda vormingut ei kasutatud laialdaselt mitmel põhjusel. Failide redigeerimine selles vormingus osutus asjatult piiratuks: te ei saa vooge segada, helitugevust reguleerida ega võrdsustada. See tähendab, et ilma kvaliteeti kaotamata saate arhiveerida ainult analoogsalvestisi ja toota live-esinemiste kahe mikrofoniga salvestust ilma täiendava töötlemiseta. Ühesõnaga, te ei saa tegelikult raha teenida.

Piraatlusevastases võitluses ei toetanud (ja ei toeta) arvutid SA-CD-vormingus plaate, mis muudab nende koopiate tegemise võimatuks. Ei mingeid koopiaid – pole laia publikut. DSD helisisu oli võimalik esitada ainult eraldi SA-CD-mängijast patenteeritud plaadilt. Kui PCM-vormingu jaoks on olemas SPDIF-standard digitaalseks andmeedastuseks allikast eraldi DAC-i, siis DSD-vormingu jaoks standardit pole ja SA-CD-plaatide esimesed piraatkoopiad digiteeriti SA- analoogväljunditest. CD-mängijad (kuigi olukord tundub tobe, aga tegelikkuses anti osad salvestised välja ainult SA-CD-l või tehti sama salvestus Audio-CD-le teadlikult halva kvaliteediga SA-CD propageerimiseks).

Pöördepunkt toimus SONY mängukonsoolide väljalaskmisega, kus SA-CD plaat kopeeriti enne taasesitamist automaatselt konsooli kõvakettale. DSD-vormingu fännid kasutasid seda ära. Piraatsalvestiste ilmumine stimuleeris turgu DSD-voogude esitamiseks eraldi DAC-sid välja laskma. Enamik DSD-toega väliseid DAC-e toetab tänapäeval USB-andmeedastust, kasutades SPDIF-i kaudu digitaalsignaali eraldi kodeeringuna DoP-vormingut.

DSD kandja sagedused on suhteliselt väikesed, 2,8 ja 5,6 MHz, kuid see helivoog ei vaja andmete vähendamise teisendamist ja on üsna konkurentsivõimeline kõrge eraldusvõimega vormingutega, nagu DVD-Audio.

Puudub selge vastus küsimusele, kumb on parem, DSP või PCM. Kõik sõltub konkreetse DAC-i rakendamise kvaliteedist ja helitehniku ​​andekusest lõpliku faili salvestamisel.

Üldine järeldus

Analoogheli on see, mida me oma silmadega ümbritseva maailmana kuuleme ja tajume. Digitaalne heli on koordinaatide kogum, mis kirjeldab helilainet ja mida me ei kuule otse ilma analoogsignaaliks teisendamata.

Otse helikassetile või vinüülile salvestatud analoogsignaali ei saa uuesti salvestada ilma kvaliteeti kaotamata, samas kui digitaalses esituses saab lainet bitti bitti kopeerida.

Digitaalsed salvestusvormingud on pidev kompromiss koordinaatide täpsuse ja faili suuruse vahel ning mis tahes digitaalne signaal on vaid esialgse analoogsignaali ligikaudne väärtus. Digisignaali salvestamise ja taasesitamise ning analoogsignaali andmekandjale salvestamise tehnoloogia erinevad tasemed annavad aga signaali digitaalsele esitusele rohkem eeliseid, sarnaselt digikaamerale võrreldes filmikaameraga.