Nieuwe audioformaten. Audiobestandsindelingen

We zullen de verschillende audiobestandsformaten bekijken:

GOLF (.wav) is het meest gebruikte audioformaat. Gebruikt in Windows OC om geluidsbestanden op te slaan. Het is gebaseerd op het RIFF-formaat (Resource Interchange File Format), waarmee u willekeurige gegevens in een gestructureerde vorm kunt opslaan. Er worden verschillende compressiemethoden gebruikt om audio op te nemen, omdat audiobestanden groot zijn. De eenvoudigste compressiemethode is Pulse Code Modulation (PCM), maar deze biedt niet voldoende compressie.

AU (.au, .snd)- het audiobestandsformaat dat wordt gebruikt door Sun-werkstations (.au) en het NeXT-besturingssysteem (.snd). Het werd wijdverbreid op internet, in een vroeg ontwikkelingsstadium waarvan het de rol speelde van een standaardformaat voor audio-informatie.

MPEG-3 (.mp3)- het formaat van geluidsbestanden, een van de meest populaire tegenwoordig. Het is ontworpen om andere geluiden dan menselijke spraak op te slaan. Wordt gebruikt om muziekopnamen te digitaliseren. Eerdere versies van het formaat: MP1 en MP2. Bij het coderen wordt psychoakoestische compressie gebruikt, waarbij geluiden die slecht worden waargenomen door het menselijk oor uit de melodie worden verwijderd. Eerdere versies bieden slechtere compressie, maar zijn tijdens het afspelen minder belastend voor computerbronnen. De kenmerken van de processor zijn direct van invloed op de geluidskwaliteit - hoe zwakker de processor, hoe groter de geluidsvervorming.

MIDI (.mid)- Muziekinstrument digitale interface. Deze standaard is begin jaren tachtig ontwikkeld voor elektronische muziekinstrumenten en computers. MIDI definieert de uitwisseling van gegevens tussen muziek- en geluidssynthesizers van verschillende fabrikanten. MIDI is een protocol voor het verzenden van muzieknoten en melodieën. Maar MIDI-gegevens zijn geen digitaal geluid - het is een verkorte vorm van het opnemen van muziek in numerieke vorm. Een MIDI-bestand is een reeks opdrachten die acties opnemen, zoals het indrukken van een toets op de piano of het draaien van een knop. Deze commando's die naar het MIDI-afspeelapparaat worden gestuurd, regelen het geluid. Een klein MIDI-bericht kan ervoor zorgen dat een geluid of een reeks geluiden wordt gespeeld op een muziekinstrument of synthesizer, dus MIDI-bestanden zijn kleiner (geluidseenheden per seconde) dan gelijkwaardige gedigitaliseerde bestanden. geluid.

MOD (.mod)- een muziekformaat, het slaat samples op van het gedigitaliseerde geluid, die vervolgens kunnen worden gebruikt als sjablonen voor individuele noten. Bestanden in dit formaat beginnen met een set geluidsvoorbeelden, gevolgd door notities en informatie over de duur. Elke noot wordt gespeeld met een van de geluidspatronen die aan het begin worden getoond. Dit bestand is relatief klein en heeft een op notities gebaseerde structuur. Dit maakt het gemakkelijker om te bewerken met programma's die traditionele muziekopname simuleren. Het definieert, in tegenstelling tot een MIDI-bestand, het geluid volledig, waardoor het op elk computerplatform kan worden afgespeeld.

IFF (.iff)- Interchange File Format - een formaat dat oorspronkelijk is ontwikkeld voor het Amiga computerplatform. Nu ook gebruikt op cd's in CD-I-vorm. De structuur lijkt erg op die van het RIFF-formaat.

AIFF (.aiff) - Audio Interchange File Format - een formaat voor het uitwisselen van audiogegevens, gebruikt op Silicon Graphics en Mac-computerplatforms. Net als het Wave-formaat, maar anders dan het, maakt het het gebruik van gedigitaliseerd geluid en sjablonen mogelijk. Veel programma's kunnen bestanden in dit formaat openen.

RealAudio (.ra, .ram) is een indeling die is ontworpen voor realtime audioweergave op internet. Ontwikkeld door Real Networks (www.real.com). De resulterende kwaliteit komt op zijn best overeen met een matige audiocassette; voor het opnemen van muziekwerken van hoge kwaliteit verdient het gebruik van het mp3-formaat meer de voorkeur.

Laten we meteen een voorbehoud maken dat het artikel ALLEEN over algemene kenmerken spreekt en geen details bevat. In de toekomst zal Lifehacker haar eigen onpartijdige onderzoek doen. En vandaag zullen we proberen de reeds bekende ervaring op de een of andere manier te generaliseren.

Er is een analoog en een figuur.

Analoog is goed, maar van korte duur en onhandig. Daarom zullen analoge media, ondanks de hoge vinylverkoop, geen comeback maken.

Audio digitaal kan van drie hoofdtypen zijn:

  • in een formaat dat geen compressie gebruikt;
  • in een formaat dat lossless compressie gebruikt;
  • in een indeling die compressie met verlies gebruikt.

Op de grafieken - goede AudioCD, OGG gecomprimeerd met 350 kbps variabele bitrate en MP3 met Lame. Hoe lager de grafiek, hoe dichter het geluid bij het origineel ligt. Het blijkt een zeer interessante foto te zijn. Ondanks dat MP3 de hoge frequenties duidelijk heeft afgesneden, in tegenstelling tot de OGG, waar je de blokkering onder de 2 kHz ziet.

De frequentie-tijdverdeling van geluid spreekt van niet minder interessante dingen. Met een constante bitrate van 320 kbps is de MP3 bijna identiek aan de originele opname. Alles lijkt nu op zijn plek te vallen. Maar ... In feite is alles nog verwarrender.

Waarom überhaupt lossy gebruiken als er lossless beschikbaar is?

Gezond verstand.

Feit is dat de meeste analoge opnamen niet de hoeveelheid informatie bevatten die zou moeten worden opgeslagen in hoogwaardige formaten. Vergeet niet dat de oorspronkelijke bemonsteringsfrequentie voor cd 44,1 kHz is, en dat de kwantisering slechts 16 bits is.

De vorige grafieken demonstreren goed de hoge betrouwbaarheid van MP3-transmissie. Maar voor een audiocassette, magneetband (tenzij dit natuurlijk een masterband is), zijn de eigenschappen van een audio-cd onbereikbaar. En voor massastudio-apparatuur is relatief recent de mogelijkheid verschenen om analoog geluid op te nemen dat overeenkomt met AudioCD. Het heeft geen zin om in FLAC (en nog meer in WAV) een concertopname of een schijf uit het pre-digitale tijdperk te digitaliseren, vooral niet die gemaakt van magnetische media. Ze bevatten niet die spectra en de hoeveelheid informatie die zonder compressie door containers kan worden opgeslagen.

Wat is er vandaag veranderd?

Een zeldzame geluidstechnicus maakt een digitale masteropname (die vervolgens wordt gereproduceerd op fysieke media), waarbij maximaal gebruik wordt gemaakt van moderne technologieën. Daarom is de kans dat een 24-bits track eigenlijk maar 16-bits is, extreem groot.

Analoge opnames van hoge kwaliteit op hoogwaardige apparatuur zijn tegenwoordig nog moeilijker te vinden - al was het maar voor fans van dit geluid. Dat is bijvoorbeeld Jack White, de ex-leider van de White Stripes. Tegelijkertijd verwijzen sommige van zijn opnames naar variaties van lo-fi, en op zoek naar de buitensporige geluidskenmerken van het nummer wordt er een soort plezier voor fijnproevers.

Als u zich een ideale bron voorstelt, kunt u alleen met een getraind oor of luisteren op hoogwaardige audioapparatuur een gecomprimeerd bestand vinden. En al op basis hiervan (en), is het de moeite waard om de volgende conclusie te trekken:

AAC is noodzakelijk en voldoende voor middengeprijsde apparatuur, bij gebrek waarvan (en bij afwezigheid van bronnen die kunnen worden gecodeerd in AAC) - MP3 met een constante bitsnelheid van 320 kbps, gemaakt met de Lame 3.93-codec (aanbevolen sleutels voor decodering: -cbr -b320 -q0 -k -ms).

De uitzonderingen zijn opnamen die oorspronkelijk zijn opgenomen in hoge kwaliteit, bijvoorbeeld opgenomen op DVD-Audio, SACD, of opnamen die oorspronkelijk zijn verzameld in DSD (of vergelijkbaar formaat) met een hoge bitsnelheid.

Hoewel lossless enkele functies heeft. En daar vertellen we de volgende keer over.

Tegenwoordig zijn er ongeveer drie dozijn veelgebruikte digitale audioformaten. Waarom moest je zoveel soorten geluidsbestanden maken om één type inhoud op te slaan en hoe je dit allemaal kunt beheren, je zult van dit materiaal leren.

Invoering

Zeker, veel gebruikers gebruiken hun thuiscomputer liever niet alleen als werkpaard, maar ook als multimediacentrum waar u films of familiefoto's kunt bekijken en naar uw favoriete muziek kunt luisteren. Hoewel compacte digitale spelers of mobiele telefoons zeker meer geschikt zijn om naar muziekcomposities te luisteren, kan een computer in tegenstelling tot hen niet alleen muziek afspelen.

Hoe groot het ingebouwde geheugen van uw muziekspeler ook is, het zal hoogstwaarschijnlijk nauwelijks mogelijk zijn om de hele muziekbibliotheek erin op te slaan. Bovendien kunt u met een pc muziek maken, bewerken, ordenen en zoeken. Vergeet ook niet dat er tegenwoordig ongeveer drie dozijn veelgebruikte digitale audioformaten zijn, en de meeste spelers zijn verre van alleseters en kunnen er slechts enkele spelen.

Dus waarom moest je zoveel muziekformaten maken om één type inhoud op te slaan? Het punt is dat in de overgrote meerderheid van de gevallen het geluid in een "gecomprimeerde" vorm wordt opgeslagen, aangezien een minuut ongecomprimeerde compositie ongeveer 10 MB op de harde schijf in beslag neemt. Aan de ene kant lijkt dit niet veel, maar aan de andere kant, als je een muziekliefhebber bent en je verzameling bestaat uit enkele honderden of zelfs duizenden nummers, dan wordt het duidelijk dat het geluid gecomprimeerd moet worden om de ruimte die het inneemt op elektronische media te verminderen.

Om muziekbestanden te comprimeren, worden verschillende speciale algoritmen gebruikt, die vervolgens de structuur en kenmerken van de presentatie van geluidsgegevens bepalen, of de zogenaamde digitale audioformaten bestanden. Alle audioformaten kunnen in drie groepen worden verdeeld: ongecomprimeerde audioformaten, lossless compressie en lossy compressie.

Zonder compressie

Een van de meest wijdverbreide formaten met betrekking tot dit type is de bekende WAV. Het geluid in bestanden met deze extensie wordt opgeslagen zonder enige compressie of wijzigingen. Het is waar dat er veel meer ruimte nodig is voor het opslaan van niet-gecomprimeerde bestanden, en daarom wordt WAV het meest gebruikt alleen in professionele audio- en videotoepassingen, waar het geluid vóór de verwerking geen kwaliteitsverlies mag hebben. Het is een ongerechtvaardigde verspilling om gewone muziekcomposities in deze vorm te houden.

Om WAV-bestanden af ​​te spelen, hebt u geen speciale software nodig, aangezien dit formaat door alle mediaspelers wordt begrepen, inclusief de standaard Windows Media-audiospeler die in het Windows-systeem is ingebouwd.

Een ander formaat dat wordt gebruikt voor het opslaan van ongecomprimeerde audio die het vermelden waard is, is de ontwikkeling van Apple genaamd AIFF (Audio Interchange File Format). Zoals je misschien al geraden hebt, wordt het het meest gebruikt op Macintosh-computers met Mac OS X.

Compressie zonder verlies (verliesvrij)

Lossless compressie-algoritmen voor audiobestanden werken volgens het principe van conventionele archiveringsprogramma's. Ze bieden niet het hoogste compressieniveau (van 40 tot 60%), terwijl ze praktisch geen invloed hebben op de geluidskwaliteit. Het is ook vermeldenswaard dat in dit geval de gecodeerde gegevens volledig in hun oorspronkelijke vorm kunnen worden hersteld. Daarom wordt het gebruik van verliesvrije compressie het vaakst gebruikt in gevallen waarin het belangrijk is om de identiteit van de gecomprimeerde gegevens in het origineel te bewaren.

De meest populaire audioformaten in deze groep zijn FLAC (Free Lossless Audio Codec), APE (Monkey's Audio), WMA (Windows Media Lossless) en ALAC (Apple Lossless Audio Codec). Elk van hen heeft zijn voor- en nadelen. De APE-codec biedt bijvoorbeeld iets betere compressiewinsten, terwijl FLAC vaker voorkomt. Over het algemeen slaan alle echte muziekliefhebbers hun muziekcollecties op in verliesvrije formaten, omdat ze geen gegevens uit de audiostream verwijderen en bestanden die met deze codecs zijn gemaakt, zelfs op hoogwaardige geluidsapparatuur kunnen worden beluisterd.

Om lossless gecomprimeerde formaten af ​​te spelen, worden in de regel externe spelers (behalve WMA) gebruikt, zoals MPlayer, foobar, AIMP, Winamp, VLC en andere, omdat alle benodigde codecs er al in zijn ingebouwd. Een andere optie is om apart een pakket extra codecs te installeren (bijvoorbeeld K-Lite), waarna je bestanden in lossless formaat kunt beluisteren vanaf vrijwel elke audiospeler.

Compressie met verlies

Dit is de meest populaire groep algoritmen die de maximale (tot 10 keer of meer) audiocompressieverhouding bieden. Het is waar dat, in tegenstelling tot eerdere formaten, het audiobestand hier aan kwaliteit verliest, en hoeveel het direct afhangt van de mate van compressie.

Om de kwaliteit van het gedigitaliseerde geluid te bepalen, is de meest gebruikte indicator: bitrate- de snelheid van de audiostream verkregen na compressie en gemeten in kilobits per seconde (kbps). Zoals we al zeiden, kost een minuut ongecomprimeerde audio gemiddeld ongeveer 10 MB, wat overeenkomt met een audiostream van ongeveer 1400 kbps. Na codering met verlies kan de bitsnelheid dalen tot 56 kbps. Tegelijkertijd moet er rekening mee worden gehouden dat om de natuurlijke klank te behouden, het debiet minimaal 192 of 256 kbps moet zijn. Als de bitrate van de stream 320 kbps of meer is, dan is het verschil in geluid voor de meeste mensen tussen gecomprimeerde en ongecomprimeerde audio praktisch verdwenen.

Het meest populaire formaat hier is zonder twijfel de beroemde en geliefde MP3, ontwikkeld door specialisten van de beroemde MPEG (Moving Picture Experts Group). Het wordt het meest gebruikt om audiobestanden te coderen die op internet en verschillende bestandshostingservices zijn geplaatst vanwege de mogelijkheid om de verzonden gegevens aanzienlijk te verkleinen, wat belangrijk is bij een lage netwerkverbindingssnelheid.

Andere opvallende formaten in deze serie zijn AAC (Advanced Audio Coding) en OGG Vorbis. Tegelijkertijd zijn hun compressiealgoritmen, die minder populair zijn, perfecter dan die van hun belangrijkste concurrent. Dus met dezelfde bestandsgrootte bieden ze een betere geluidskwaliteit in vergelijking met MP3. Een ander serieus voordeel van deze formaten is de mogelijkheid om tot 48 audiokanalen te coderen voor AAC en 255 voor OGG, tegenover slechts twee voor MP3.

Het is vermeldenswaard dat het WMA-formaat ook eigendom is van Microsoft; het is oorspronkelijk gemaakt voor het opslaan en uitzenden van gecomprimeerde audio-informatie met verlies, en er is niet zo lang geleden verliesvrije codering aan toegevoegd, te beginnen met Windows Media Audio 9.1. Nominaal biedt dit formaat een betere compressieverhouding dan MP3, waardoor ontwikkelaars zich ertegen kunnen verzetten als alternatief voor concurrerende algoritmen AAC en OGG. Het wijdverbreide gebruik van WMA wordt weliswaar belemmerd door het gesloten karakter en het beperkte gebruik op veel platforms (besturingssystemen). En ingebouwde ondersteuning voor digitaal auteursrechtbeheer (DRM) draagt ​​niet bij aan de populariteit van het geesteskind van Microsoft.

Ondanks het feit dat MP3 verliest van zijn concurrenten, zowel wat betreft compressie-efficiëntie als geluidskwaliteit, blijft het nog steeds het meest populaire audioformaat. Het geheim van zo'n succes kan waarschijnlijk de banale traagheid van het denken worden genoemd, aangezien de meeste gebruikers, hardwarefabrikanten en softwareontwikkelaars er in de loop der jaren aan gewend zijn geraakt. Dat is de reden waarom MP3-bestanden in het algemeen kunnen worden beluisterd op alles dat digitaal geluid kan afspelen - of het nu een mobiele telefoon is, een pc met een populair besturingssysteem, een draagbare audiospeler, een modern muziekcentrum of een dvd-speler.

En hoewel andere formaten nog niet kunnen opscheppen over dergelijke ondersteuning, zijn ze ook niet zo slecht. Zo vond AAC brede steun van Apple, dat zijn algoritmen gebruikt om audioboeken, podcasts, iTunes-nummers en beltonen op te slaan. Dus voor fans van Macintosh-computers, iPads, iPhones en iPods kan dit formaat als "native" worden beschouwd.

WMA-bestanden kunnen eenvoudig worden afgespeeld op elke pc met het Windows-besturingssysteem, dat wereldwijd het meest wordt gebruikt. Veel fabrikanten van draagbare audiospelers en stationaire optische-schijfspelers ondersteunen dit formaat echter ook. Maar om bestanden in OGG Vorbis- of AAC-indeling op Windows-systemen te beluisteren, moet u speciale codecs installeren. Dit is echter geen probleem. Door het bovengenoemde gratis K-Lite Codek Pack te installeren, kunt u bijna elk geluidsbestand op uw computer afspelen met uw favoriete speler.

Conclusie

Laten we tot slot eens kijken welke software u nodig heeft om van uw thuiscomputer een veelzijdig hulpmiddel te maken voor het werken met audiobestanden. Voor het gemak verdelen we alle applicaties in verschillende hoofdgroepen.

spelers - worden gebruikt voor het rechtstreeks afspelen van geluidsbestanden en worden vaak gebruikt voor het catalogiseren en organiseren van muziekcollecties. Hun aantal is zo enorm dat het niet te tellen is. Maar toch, om uw keuze wat gemakkelijker te maken, presenteren we, naar onze mening, de twaalf meest populaire: Windows Media Player (ingebouwd in het systeem), Winamp, KMPlayer, iTunes, GOM Player, jetAudio, VLC Media Player (VideoLAN ), AIMP, BSPlayer, Real Player, WinDVD en Foobar2000.

Converters - toepassingen die in staat zijn om van het ene formaat naar het andere te transcoderen. Voor dit doel kunt u de meeste populaire spelers gebruiken zonder toevlucht te nemen tot het gebruik van speciale programma's. Hoewel dit in sommige gevallen onontbeerlijk is.

Rippers (grijpers) - hiermee kunt u digitale audio-informatie extraheren van optische media (Audio-CD, DVD) en deze in verschillende formaten opslaan. Ondanks het grote aantal grabbers van alle soorten, heeft de EAC-toepassing (Exact Audio Copy) op dit gebied de grootste populariteit gewonnen, waarmee u de meest nauwkeurige kopieën van schijven kunt maken. Andere populaire rippers zijn Audiograbber, Reaper, Easy CD-DA Extractor en andere.

Editors - programma's die zijn ontworpen om geluidsgegevens te creëren, op te nemen en te bewerken. In deze groep zijn er zowel vrij eenvoudige programma's waarmee je elementaire bewerkingen kunt uitvoeren met een audiobestand (knippen, trimmen, samenvoegen, normaliseren, enz.), En echte monsters voor professioneel werk met geluid. Onder de kleine editors kan de Nero WaveEditor-applicatie worden onderscheiden vanwege zijn bescheiden omvang en tegelijkertijd vrij hoge functionaliteit. De meest populaire professionele audio-oplossingen zijn: Adobe Audition, Sound Forge, Cubase, Sony Vegas Pro en anderen.

Puur theoretisch kan natuurlijk maar één programma al deze noodzakelijke functies combineren, maar in de praktijk is het niet altijd handig om één applicatie voor alle taken te gebruiken. En het is bijna onmogelijk om alle taken van hoge kwaliteit uit één programma te halen.

In ieder geval is het veel handiger om meerdere gespecialiseerde applicaties bij de hand te hebben, die minder ruimte innemen en individueel beter met hun taken omgaan.

In de muziekwereld is er een enorm aantal muziekformaten, hun aanpassingen en versies, gecreëerd door de reuzen van de muziekindustrie en kleine bedrijven die publieke erkenning hebben gekregen in de elektronische wereld.

Voor deze doeleinden zijn verschillende fysieke methoden ontwikkeld om audiogegevens op te slaan, bijvoorbeeld: vinylplaten, magneetband, cd's, DAT, MD (minidisc), dvd of muziekbladmuziekconversie (MIDI), op dezelfde manier veel verschillende computermethoden zijn ontstaan ​​opslag van audiogegevens - digitaal: OGG, Mp3, Flac, Wav-formaten.

Het is onmogelijk om alle audioformaten, codecs, hun voor- en nadelen te bespreken en te bespreken, dus in mijn artikel zal ik proberen te praten over de meest populaire extensies voor audiobestanden die je tegenkomt.

Waarom kunnen we geen universeel coderingsformaat voor audiobestanden gebruiken? Want voor de implementatie van verschillende functies is een ander formaat nodig. Bijvoorbeeld: voor het afspelen van cd's in een cd-rom-station, voor het opnemen van muziek of geluidseffecten in videogames, voor het opnemen van een filmtrack of videoclip, voor het afspelen op mobiele telefoons of het overbrengen van bestanden via internet, daarnaast zijn er een aantal besturingssystemen dat het meest wordt gebruikt in de wereld ... Deze omvatten: Amiga, Macintosh, NEXT en Windows personal computers.

Daarnaast is het werk van een dj, geluidstechnicus, cj, videotechnicus of een simpele muziekliefhebber heel anders van aard. Dit kan vereisen dat uw audiogegevens op zijn eigen manier worden opgeslagen. Audio voor een cd moet bijvoorbeeld worden opgeslagen met 16 bits en een bemonsteringsfrequentie van 44,1 kHz. Om geluid via internet te downloaden, kunnen we echter beter een andere bitdiepte en bemonsteringssnelheid gebruiken, aangezien elke minuut 16-bits, 44-kilohertz-audio ongeveer 10 MB in beslag neemt, d.w.z. een gemiddelde track van 5 minuten is 50 meter - te veel data voor de gemiddelde gebruiker. Dit artikel geeft een overzicht van de meest populaire muziekformaten.

AA(Hoorbaar audioboekbestand) - het formaat is eigen, ontwikkeld door Audible. Het wordt gebruikt om audioboeken op te nemen die worden verkocht via Audible- en iTunes-services. Het is mogelijk om de snelheid van het luisteren naar bestanden te vertragen of te versnellen - digitale toonhoogte, de mogelijkheid om bladwijzers achter te laten bij het luisteren naar audioboeken, bestandsbeveiliging, bij het leveren van geluidsopnamen via internet.

AAC(Geavanceerde audiocodering) - audiobestandsformaat met minder kwaliteitsverlies bij het coderen dan mp3 met dezelfde grootte. Lossless muziekcodering van originele kwaliteit met behulp van ALAC-profiel. AAC is een familie van MPEG4-audiocoderingsalgoritmen. In tegenstelling tot de hybride mp3-filterbank, gebruikt AAC MDST-technologie (Modified Cosine Transform), wat betekent dat de luisteraar een betere geluidskwaliteit krijgt dan MP3-codering met dezelfde of lagere bitrate. Mogelijke AAC-bestandsextensies: [.m4a], [.m4b], [.m4p].

AAC is ook een dat twee basiscoderingsprincipes gebruikt om de hoeveelheid gegevens die nodig is om digitale audio van hoge kwaliteit te verzenden aanzienlijk te verminderen. Dit formaat is van de hoogste kwaliteit en maakt gebruik van compressie met verlies, ondersteund door de meeste moderne apparatuur, inclusief draagbare.

Vanaf 2009 is het veel minder wijdverbreid dan MP3 en andere alternatieve oplossingen. AAC (Advanced Audio Coding) is oorspronkelijk gemaakt als opvolger van MP3 met verbeterde coderingskwaliteit. Het AAC-formaat, officieel bekend als ISO/IEC 13818-7, werd in 1997 uitgebracht als het zevende nieuwe deel van de MPEG-2-familie. Er is ook het AAC-formaat dat bekend staat als MPEG-4 Part 3.

Voordelen van AAC boven MP3:

- tot 48 audiokanalen;

- hoge coderingsefficiëntie met zowel constante als variabele bitrate;

- bemonsteringsfrequenties van 8 Hz tot 96 kHz (MP3: 8 Hz - 48 kHz);

- flexibelere Joint stereo-modus.

ADXIs een op ADICM gebaseerd eigen compressie- en opslagformaat met verlies, speciaal ontwikkeld door CRI Middleware voor gebruik in videogames. Het meest karakteristieke kenmerk is de mogelijkheid om de geluidsopname te herhalen, wat het gebruik van het formaat handig maakt voor gebruik als achtergrondmuziek in verschillende games die deze mediacontainer ondersteunen. Het wordt ondersteund door veel SEGA Dreamcast-games, sommige PlayStation 2- en GameCube-games.

In tegenstelling tot MP3 maakt het geen gebruik van het psycho-akoestische model om het volume aan geluidsgegevens te verminderen (waardoor de complexiteit ervan wordt verminderd). In plaats daarvan gebruikt het ADPCM-model een relatieve foutgegevensrecord met een voorspellingsfunctie om de monsters op te slaan, wat een betere bewaring van het oorspronkelijke signaal na codering betekent; in wezen biedt ADPCM-compressie, in plaats van volledige oversized audiosamples te gebruiken, signaalafwijkingssamples die veel kleiner zijn, meestal 4 bits. Voor het menselijk oor zit deze afwijking op het geluidsniveau, waardoor het kwaliteitsverlies nauwelijks merkbaar is.

AIFFIs een standaard bestandsindeling voor het opslaan van audiogegevens op het Macintosh-platform. Als u ooit audiobestanden moet overzetten tussen een pc en een Macintosh-computer, gebruik dan deze indeling. Het ondersteunt 8- en 16-bits mono- en stereo-audiogegevens. Bestanden in dit formaat kunnen al dan niet een Mac-Binary-header bevatten. Als een bestand van dit type geen Mac-Binary-header bevat, heeft het hoogstwaarschijnlijk de extensie aif. Als een bestand van dit type een Mac-Binary-header bevat, zal Sound Forge het openen, maar het identificeren als een Macintosh-bronbestand (zie volgende sectie). In dit geval heeft het bestand hoogstwaarschijnlijk de snd-extensie. Opmerking Wanneer bestanden worden opgeslagen op Macintosh-computers, wordt een zogenaamde Mac-Binary-header aan de bestanden toegevoegd. Het is een klein stukje informatie dat aan het begin van een bestand is geschreven en dat het bestandstype voor Mac OS en andere toepassingen identificeert. Op deze manier communiceren Macintosh-computers of het bestand bijvoorbeeld tekst, afbeeldingen of audiogegevens bevat.

AMR(Adaptieve meervoudige snelheid) [ . amr] - adaptieve codering met variabele snelheid. Een coderingsstandaard voor audiobestanden die speciaal is ontworpen om een ​​signaal in het spraakfrequentiebereik te comprimeren. Gestandaardiseerd door ETSI (European Telecommunications Standards Institute). Het gebruik van AMR maakt het mogelijk om een ​​hoge netwerkcapaciteit te bieden met een gelijktijdige hoge kwaliteit van spraakoverdracht. AMR heeft een breed scala aan spraakcoderings- / decoderingssnelheden en stelt u in staat flexibel te schakelen tussen verschillende modi, afhankelijk van de omgeving of netwerkbelasting, waardoor in elke omgeving kristalheldere spraakoverdracht wordt gegarandeerd.

AAP- (Aap's Audio) [ . aap] - ontwikkeld door Matthew T. Ashland - verliesvrij digitaal audioformaat ( verliesvrij ). Monkey's Audio-codec wordt alleen vrijgegeven voor het Microsoft Windows-platform, hoewel er een aantal niet-officiële codecs zijn voor MacOS, Linux en BeOS. Monkey's Audio-bestanden gebruiken de volgende extensies: .ape voor het opslaan van audio en .apl voor het opslaan van metadata. Dit formaat is niet gratis, omdat de licentie ervan beperkt de distributie ernstig.

appelverliesloos[. m4 een] is een audiocodec ontwikkeld door Apple Inc om digitale muziek te comprimeren zonder gegevensverlies. Apple Lossless-gegevens worden opgeslagen in een MP4-container met de .m4a-extensie. Hoewel Apple Lossless dezelfde bestandsextensie heeft als AAC, is het geen AAC, de codec is vergelijkbaar met andere Lossless-codecs zoals FLAC e.a. Een iPod met een dockconnector (geen shuffle) en de nieuwste firmware kan Apple Lossless-bestanden afspelen. Het maakt geen gebruik van digitaal rechtenbeheer (DRM), maar gezien de aard van de container wordt aangenomen dat DRM kan worden toegepast op ALAC.

Tests hebben aangetoond dat bestanden die zijn gecomprimeerd in ALAC ongeveer 40% tot 60% van de grootte van de originelen blijken te zijn, afhankelijk van het type muziek, vergelijkbaar met andere Lossless-formaten. Bovendien maakt de snelheid waarmee het kan worden gedecodeerd het nuttig voor apparaten met beperkte prestaties, zoals de iPod.

Apple Lossless Encoder werd op 28 april 2004 geïntroduceerd als onderdeel van QuickTime 6.5.1 en als onderdeel van iTunes 4.5. De codec wordt ook gebruikt in AirPort Express's AirTunes-implementatie.

De decoder voor het Apple Lossless-formaat bevindt zich nu in de open source libavcodec-bibliotheek. Dit betekent dat elke mediaspeler die op deze bibliotheek is gebaseerd, inclusief VLC-media en MPlayer, mogelijk Apple Lossless-bestanden kan afspelen.

CDDA(Compact Disc digitale audio) - Audio-cd, een internationale standaard voor het opslaan van gedigitaliseerde audio op compact discs, gepresenteerd door Philips en Sony. Audio-informatie wordt gepresenteerd in pulscodemodulatie met een bemonsteringsfrequentie van 44,1 kHz en een bitsnelheid van 1411,2 kbps, 16-bits stereo.

METaudiospecificatie in de Red Book-standaard:

- de maximale tijd voor alle opnames is 79,8 minuten;

- minimale tracktijd - 4 seconden (inclusief een pauze van 2 seconden);

- het maximale aantal nummers is 99;

- het maximum aantal referentiepunten (baanvakken) - 99 zonder tijdslimiet;

- moet aanwezig zijn Internationale standaard opnamecode (ISRC).

DTS- (Digital Theatre-systeem) is in wezen Dolby Digital , of liever zijn concurrent. Formaat DTS gebruikt een minimaal compressieniveau dan Dolby , dus in feite klinkt het beter, wat in de praktijk bewezen is DVD discs waarop tracks zijn opgenomen in DTS- of DD-formaat.

DTS het is een digitaal theatersysteem - een familie van digitale meerkanaals geluidsopnamesystemen gecreëerd door Digital Tieter System voor de demonstratie van digitale fonogrammen in bioscopen, synchroon met huurfilms. Naast de begeleidende filmafdrukken zijn beide systemen ( DTS en Dolby Digital ) worden in vereenvoudigde vorm gebruikt op optische videoschijven voor thuisweergave. DTS gebruikt minder compressie dan Dolby , maar geen van de systemen heeft absolute superioriteit. Geschillen over voordelen DTS of Dolby Digital stop niet tot op de dag van vandaag. Formaat DTS-stereo bijna identiek Dolby Surround. DTS Ondersteunt zowel 5.1-kanaals als 7.1-kanaals audio-opties. DTS in thuisbioscopen staat volledige bitrate (1509,75 kbps) toe.

FLAC(gratis codec van het Ogg-project)[.flac] - (Engelse Free Lossless Audio Codec - gratis lossless audiocodec) - een populaire gratis codec voor audiocompressie. In tegenstelling tot Ogg Vorbis-, MP3- en AAC-lossy codecs, verwijdert FLAC geen informatie uit de audiostream en is het zowel geschikt voor het luisteren naar muziek op hoogwaardige geluidsweergaveapparatuur als voor het archiveren van een audiocollectie. Tegenwoordig wordt het FLAC-formaat door veel audiotoepassingen ondersteund. Om basistypen metadata op te slaan, gebruikt de basisdecoder tags ID 3 v 1 en ID 3 v 2, zodat u ze vrij kunt toevoegen en bewerken.

MIDI(Digitale interface voor muziekinstrumenten) - digitale interface van muziekinstrumenten. Het is een digitale geluidsopnamestandaard voor het gegevensuitwisselingsformaat tussen elektronische muziekinstrumenten.

Met de interface kunt u gegevens zoals toetsaanslagen uniform in digitale vorm coderen, het volume en andere akoestische parameters aanpassen, een timbre, tempo, toonsoort enz. kiezen, met nauwkeurige timing. Er zijn veel gratis opdrachten in het coderingssysteem die fabrikanten, programmeurs en gebruikers naar eigen goeddunken kunnen gebruiken. Daarom maakt de MIDI-interface het mogelijk om, naast het afspelen van muziek, de besturing van andere apparatuur te synchroniseren, bijvoorbeeld verlichting, pyrotechniek, enz.

Een reeks MIDI-commando's kan worden opgenomen op elk digitaal medium in de vorm van een bestand, verzonden via elk communicatiekanaal. Het afspeelapparaat of programma wordt een MIDI-synthesizer (sequencer) genoemd en is eigenlijk een automatisch muziekinstrument.

MP2 (MPEG -1 Audio Layer II of Musicam) [ . mp2 ] Is een van de drie audiocompressie-indelingen met verlies (laag 2) die zijn gedefinieerd in de MPEG-1-standaard. Gebruikt in digitale DAB-uitzendingen en de oude video-cd-standaard, die in de jaren 90 werd gebruikt om films op optische cd's te distribueren en die bestond vóór de wijdverbreide invoering van dvd.

De MPEG-1 Audio Layer 2-encoder is voortgekomen uit de MUSICAM (Masking pattern-adapted Universal Subband Integrated Coding And Multiplexing) audiocodec, ontwikkeld door CCETT, Philips en IRT in 1989 als onderdeel van EUREKA's onderzoek 147 Europese intergouvernementele ontwikkelingen voor digitale omroepsystemen voor stationaire, draagbare en mobiele ontvangstapparaten. De basisparameters van MPEG-1 Audio zijn overgenomen van MUSICAM, inclusief filterbank, tijddomeinverwerking, audioframegrootte, enz. Na verdere verfijning werd het MUSICAM-algoritme echter niet gebruikt in de definitieve versie van de MPEG-1 Layer II-standaard.

MP3 (MPEG-laag 3) [ . mp3 ] Het derde audiocoderingsformaat MPEG is een gelicentieerd bestandsformaat voor het opslaan van audio-informatie Op dit moment is MP3 het meest bekende en populaire van de wijdverbreide verliesgevende digitale audiocoderingsformaten. Het wordt veel gebruikt op netwerken voor het delen van bestanden voor de evaluatieve overdracht van muziekwerken. Het formaat kan worden afgespeeld in bijna elk populair besturingssysteem, op bijna elke draagbare audiospeler en wordt ook ondersteund door alle moderne modellen stereo's en dvd-spelers.

MP3 gebruikt een lossy compressie-algoritme dat is ontworpen om de gegevens die nodig zijn om een ​​opname te reproduceren drastisch te verminderen en ervoor te zorgen dat de afspeelkwaliteit zeer dicht bij het origineel ligt (volgens de meeste luisteraars), hoewel audiofielen een tastbaar verschil melden. Wanneer u een MP3 maakt met een gemiddelde bitsnelheid van 128 kbps, is het resultaat een bestand dat ongeveer 1/10 van de grootte van het originele audio-cd-bestand is. MP3-bestanden kunnen worden gemaakt met een hoge of lage bitsnelheid, wat de kwaliteit van het resulterende bestand beïnvloedt. Het principe van compressie is om de nauwkeurigheid van sommige delen van de geluidsstroom te verminderen, wat voor de meeste mensen bijna niet te onderscheiden is. Deze methode wordt perceptuele codering genoemd. Tegelijkertijd wordt in de eerste fase een geluidsdiagram gebouwd in de vorm van een opeenvolging van korte tijdsperioden, waarna informatie die niet door het menselijk oor kan worden onderscheiden erop wordt verwijderd en de resterende informatie wordt opgeslagen in een compacte vorm. Deze benadering is vergelijkbaar met de compressiemethode die wordt gebruikt bij het comprimeren van afbeeldingen naar het JPEG-formaat. Veel muziek fijnproevers geven er de voorkeur aan om muziek te comprimeren met de maximale kwaliteit - 320 kbps , of bijvoorbeeld overschakelen naar andere formaten FLAC , waarbij de gemiddelde bitrate ~ 1000 . is kbps.

MusePack[. mpc] bestandsformaat zonder licentie voor het opslaan van audio-informatie die wordt gedistribueerd door GNU General Public License.

Musepack maakt gebruik van frequency banding, het behoort dus tot de zogenaamde subband-codecs. Het belangrijkste kenmerk is de fijnafstemming van psycho-akoestiek, waardoor u kunt werken met pure VBR-codering (variabele bitrate-codering). Het belangrijkste doel van Musepack is de transparantie van het geluid van de gecodeerde muziek.

In moderne formaten zoals: MP3, Vorbis, AAC, AC3, WMA, wordt een tweede dct-conversie uitgevoerd, waardoor ze een betere kwaliteit kunnen bereiken bij gemiddelde en lage bitrates, maar het is niet mogelijk om hoge resultaten te behalen bij hogere. MusePack voert geen tweede dct-conversie uit, waardoor u een ongeëvenaarde kwaliteit kunt bereiken bij bitrates boven de 180.

Net als AAC en sommige andere moderne formaten, voert Musepack kanaalkoppeling uit op frequentiebanden, wat een klein effect heeft op de kwaliteit, maar je kunt veel besparen op grootte. In MP3 wordt kanaalkoppeling niet over frequentiebanden uitgevoerd, maar voor de hele band als geheel, waarbij het signaal wordt opgesplitst in frequentiesubbanden, het signaal vervolgens wordt ontleed in een reeks cosinus (MDCT is een speciaal geval van de Fourier-transformatie) en schrijft de afgeronde (gekwantiseerde) waarden van de coëfficiënten verkregen na de transformatie (kwantisering vindt plaats in overeenstemming met de lopende psycho-akoestische analyse). De MPC, na het opsplitsen van het signaal in frequentiesubbanden, kwantiseert eenvoudig (op basis van psychoakoestiek) het amplitudesignaal in elke subband en schrijft de resulterende afgeronde (gekwantiseerde) waarden naar de uitgangsstroom. Dit feit verklaart ook de hoge compressie- en decompressiesnelheid van de MPC.

MOD- het formaat is ontworpen voor het Amiga-platform. Elk MOD-bestand bevat gedigitaliseerde opnames van echte geluiden van instrumenten, de zogenaamde samples, enigszins vergelijkbaar met de structuur van MIDI. Cj of een componist die in MOD-formaat schrijft, gebruikt een programma genaamd tracker, waarin hij aangeeft welk instrument, op welk tijdstip, welke noot en octaaf moet klinken - deze reeks noten wordt in een lijst geschreven - een track en verschillende tracks parallel klinkend in een blok dat een patroon wordt genoemd. De verzameling patronen vormt een module - een bestand in het MOD-formaat, met de extensie .mod. Eén trackerbalk komt overeen met één echt kanaal waarin cj genummerde noten kan spelen of bewerken. Aan de noten kunnen verschillende "patronen" worden toegewezen - bijvoorbeeld: tremolo, glissando, enz.

OGG [.ogv], [.oga], [.ogx], [.ogg] Is een open standaard voor een multimediacontainerformaat, het belangrijkste bestands- en streamingformaat voor multimediacodecs van de Xiph.Org-stichting, evenals de naam van het project dat dit formaat en de codecs ervoor ontwikkelt. Zoals alle technologieën die zijn ontwikkeld onder de paraplu van Xiph.Org, is het Ogg-formaat een open en gratis standaard zonder patent- of licentiebeperkingen.

Ogg is gewoon een container. Muziek of video wordt gecomprimeerd door codecs en het verwerkingsresultaat wordt in dergelijke containers opgeslagen. Ogg-containers kunnen streams opslaan die zijn gecodeerd met meerdere codecs. Een video- en audiobestand kan bijvoorbeeld gegevens bevatten die zijn gecodeerd met audio- en videocodecs.

De Ogg-container kan audio en video in verschillende formaten opslaan (zoals MPEG-4, Dirac, MP3 en andere).

RealAudio[. ra],[. RAM] Een gepatenteerde standaard voor streaming en een mediabestandsformaat dat eigendom is van " RealNetworks-producten en -diensten". RealAudio voor het eerst geïntroduceerd als onderdeel van een pakket RealAudio 10, verliesvrije audiocompressiecodec.

Een van de voordelen van deze codec is ondersteuning voor streaming, zeer snelle decodering. De nadelen zijn de gesloten code en het ontbreken van multichannel. Beschikbaar voor Microsoft Windows, Macintosh en GNU/Linux.

RKAU[.rka] Van alle audiocodecs neemt RKAU een heel speciale plaats in. Ten eerste is het de kleinste (slechts 25kB!) En snelste encoder. Ten tweede biedt het, naast het feit dat het een verliesvrij audiocompressieprogramma is, compressiemodi met verlies die een compressieverhouding bieden die groter is dan alle bekende verliesvrije algoritmen. Vanwege de eigenaardigheden van het algoritme dat ten grondslag ligt aan rkau, liggen de vervormingen die door de codec worden geïntroduceerd echter niet in de spectrale (zoals in het geval van psycho-akoestische modellen van MP3, MP +, AAC en andere encoders), maar in het echte gebied. Dat wil zeggen, ze hebben ruwweg een niet-lineair karakter, zoals de vervormingen van de meeste paden. Tegelijkertijd is er geen verlies van kleine details en microvlakken van het fonogram. Als u het in dit opzicht echter "overdrijft", kan het geluid volledig onverteerbaar worden: er verschijnen harde ruisachtige artefacten in het geluid en het geluid zelf krijgt een uitgesproken kleuring.

In de hiërarchie van audiocodecs staat rkau alleen. Het is zo origineel dat het geen analogen heeft met andere algoritmen voor het comprimeren van audiogegevens. De kleine omvang van het encoderprogramma (25 kB) en de hoge werkingssnelheid met compressiesnelheden die vergelijkbaar zijn met andere verliesvrije algoritmen, maken rkau tot de onbetwiste leider. En hoewel de meest effectieve lossless coder kan worden beschouwd als OptimFROG, besproken in het vorige deel van het artikel, loopt rkau slechts een beetje achter op het gebied van efficiëntie. Echter, wanneer de "lossy" compressiemodus is geactiveerd, laat rkau, zelfs in de hoogste kwaliteitsmodus, alle verliesvrije algoritmen ver achter zich en benadert in efficiëntie programma's op basis van het psycho-akoestische model (MP3, MP +, AAC, VQF en andere) . Tegelijkertijd treedt het verlies van microvlakken en nuances van het originele audiomateriaal, dat typisch is voor MPEG-achtige algoritmen, niet op, en artefacten die zich in dit geval onvermijdelijk voordoen, kunnen alleen worden opgemerkt op apparatuur van zeer hoge kwaliteit met herhaalde vergelijkende vergelijkingen. luisteren.

Verkorten[.shn] - is een indeling die wordt gebruikt om audiogegevens te comprimeren. Dit is een vorm van bestandscompressie die wordt gebruikt voor compressie van cd-kwaliteit, tp gjnthm audiobestanden (44,1 kHz, 16 bit, stereo PCM ). Dit formaat wordt tegenwoordig nog steeds door sommige mensen gebruikt omdat live-opnames legaal worden verkocht en die zijn gecodeerd als Bestanden inkorten.

Speex [. spx] Is een codec voor gratis spraakcompressie die kan worden gebruikt in Voice-over-Internet-toepassingen ( VoIP ). Het heeft hoogstwaarschijnlijk geen patentbeperkingen en is gelicentieerd onder de nieuwste versie van de licentie. BSD (zonder het derde artikel). Gecomprimeerd door codec Speex gegevens kunnen worden opgeslagen in het opslagformaat voor audiogegevens Ogg , of direct verzenden via pakketten UDP/RTP.

Ontwikkelaars verzetten zich tegen hun ontwikkeling tegen andere open codecs, bijvoorbeeld codec Vorbis , bewerend dat precies de codec Speex het meest geschikt voor voice-over-netwerken met onbetrouwbare pakketbezorging. Tegelijkertijd benadrukken de auteurs van de ontwikkeling specifiek dat de codec geschikt is voor gebruik in netwerken met onbetrouwbare pakketoverdracht, dat wil zeggen of het pakket is aangekomen of niet.

Speex behoort tot de klasse van de zogenaamde Code opgewonden lineaire voorspelling (CELP ) -codecs, dat wil zeggen codecs die zijn gebouwd op basis van de zogenaamde Linear Predictive LPK-codering. De LPK gebruikt een digitaal filter met alleen feedback (zogenaamd "autoregressief filter") om een ​​segment van een spraaksignaal te benaderen. De coëfficiënten van dit filter worden "gepast" op het signaalsegment met behulp van de Levinson-procedure (in de westerse literatuur - Levinson-Durbin). CELP -modificatie van het bosbouwcomplex zorgt voor de aanwezigheid van de zogenaamde. "Codeboek", dat vooraf gedefinieerde sets van enkele impulsen bevat die het LPK-filter aansturen.

Spraaksignaal in codec Speex is verdeeld in niet-overlappende segmenten met een duur van 20 ms (160 samples bij 8 KHz). In dit geval, om de spannende set te beoordelen, is het bovenstaande segment verdeeld in vier subsecties van respectievelijk 5 ms. Op elk van de subsegmenten wordt gezocht naar de opwindende sets pulsen van zowel het huidige subsegment (uit het codeboek) als de twee voorgaande subsegmenten. In tegenstelling tot andere codecs, om octrooibeperkingen te vermijden, Speex gebruikt geen algebraïsche codering, alleen vector. De excitaties van de twee voorgaande subsegmenten worden toegevoegd met variabele gewichten, in tegenstelling tot een aantal andere codecs, waar variabele posities in de tijd worden gebruikt.

Volgens de ontwikkelaars Speex geoptimaliseerd voor spraak van hoge kwaliteit bij lage snelheden. codec Speex maakt ook variabele signaalcompressie mogelijk en ondersteunt signalen met verschillende bandbreedtes: ultrabreedband (bemonsteringsfrequentie 32 kHz), breedband (16 kHz) en smalband (8 kHz).

TAK(Tom's lossless Audio Kompressor) [ . tak] Audiocodec en verliesvrij digitaal audiocompressieformaat. Het beschikt over een hoge compressieverhouding en snelheid van coderen en decoderen.Het wordt gratis verspreid samen met een set software voor het coderen en afspelen, evenals plug-ins voor populaire spelers: Winamp, foobar2000, enz. Ontwikkeld door Thomas Becker , Duitsland Een relatief nieuwe codec. De eerste definitieve versie 1.0 werd gepubliceerd op 26 januari 2007.

Het formaat blijft evolueren (de nieuwste versie is 1.1.1) en is momenteel een van de drie meest populaire verliesvrije audiocompressieformaten (na FLAC en WavPack), volgens een onderzoek op het hydrogenaudio.org-forum.

TTA(Echte audio) Is een gratis audiocodec die realtime verliesvrije compressie van muziekbestanden mogelijk maakt. De codec is gebaseerd op adaptieve voorspellende filters en heeft alle verbeterde eigenschappen zoals de meeste moderne encoders. De gecomprimeerde bestandsgrootte zal 30% - 70% kleiner zijn dan het originele muziekbestand. Het TTA-formaat ondersteunt ID3v1- en ID3v2-tags. Met behulp van de True Audio-codec kunt u maximaal 20 audio-cd's op één dvd-r-schijf plaatsen.

TwinVQ(Transform - domeingewogen interleave vectorkwantisatie) - vectorkwantisatie met transformatiedomeinen en gewogen interleaving), ontwikkeld in Japan in het laboratorium NTT-laboratoria voor menselijke interfaces.

VQF-bestanden zijn ongeveer 30-35% kleiner dan MP3-bestanden met dezelfde geluidskwaliteit. De stream van 128 Kbps voor MP3-bestanden komt overeen met de stream van 80 Kbps voor VQF-bestanden. Deze voordelen hebben ook een keerzijde. Bij het decoderen is de CPU-belasting ook 30% hoger dan bij het decoderen van MP3. Dit bepaalt de hogere eisen voor de computer waarop u dergelijke bestanden wilt afspelen.

Tests tonen aan dat VQF superieur is in alle parameters bij lage frequenties en veel minder golfvormvervorming met een groot dynamisch bereik (echte muziek). Wat betreft de blokkering van de hoge frequenties van het geluidsspectrum, is VQF 2-3 dB inferieur aan MP3 bij frequenties boven 15 kHz. Dit wordt echter gemakkelijk gecompenseerd door de equalizer van de speler aan te passen, waardoor VQF objectief een stap hoger in geluidskwaliteit wordt geplaatst in vergelijking met MP3.

VQF(Interleave Vector Quanization)- ontwikkeld in Japan en gebaseerd op TwinVQ-technologie. Als we VQF en MP3 vergelijken, dan zal het eerste formaat 30-50% "compacter" zijn, met dezelfde geluidskwaliteit. Dit geeft VQF een aanzienlijk voordeel ten opzichte van het MP3-formaat. Maar het proces van codering, decodering (decoder) VQF, kost ongeveer 30% meer pc-processorbronnen dan mp3-audio.

Tests tonen de superioriteit van TwinVQ in alle opzichten aan bij lage frequenties en veel minder golfvormvervorming met een groot dynamisch bereik (echte muziek). In termen van blokkering van de hoge frequenties van het geluidsspectrum is TwinVQ echter 2-3 dB inferieur aan MP3 bij frequenties boven 15 kHz. Dit wordt echter gemakkelijk gecompenseerd door de equalizer van de speler aan te passen, waardoor TwinVQ objectief een stap hoger in geluidskwaliteit staat in vergelijking met MP3.

Vorbis [. ogg] Is een gratis, lossy audiocompressieformaat dat officieel werd uitgebracht in de zomer van 2002. Qua functionaliteit en kwaliteit is het vergelijkbaar met codecs als AAC, AC3 en VQF, superieur aan MP3. Het psycho-akoestische model dat in Vorbis wordt gebruikt, is in principe vergelijkbaar met MP3 en dergelijke, maar de wiskundige verwerking en praktische implementatie van dit model verschillen aanzienlijk, waardoor de auteurs hun formaat volledig onafhankelijk van alle voorgangers konden verklaren.

Ogg Vorbis gebruikt standaard een variabele bitrate, terwijl de laatste niet beperkt is tot harde waarden en zelfs met 1 kbps kan variëren. Opgemerkt moet worden dat de maximale bitsnelheid niet strikt wordt beperkt door het formaat, en met de maximale coderingsinstellingen kan deze variëren van 500 tot 1000 kbps. De bemonsteringsfrequentie heeft dezelfde flexibiliteit - gebruikers hebben de keuze tussen 2 kHz en 192 kHz.

Vorbis is ontwikkeld door de Xiphophorus-gemeenschap om alle betaalde eigen audioformaten te vervangen. Ondanks het feit dat dit het jongste formaat is van alle MP3-concurrenten, biedt Ogg Vorbis volledige ondersteuning op alle populaire platforms (Microsoft Windows, Linux, Apple Mac OS, PocketPC, Palm, Symbian, DOS, FreeBSD, BeOS, enz.), en ook een groot aantal hardware-implementaties. Ondanks al zijn voordelen ten opzichte van concurrenten, is de populariteit van dit formaat echter nog steeds laag.

Wav(Golfvorm audioformaat) [ . wav], [. Golf] - ontwikkeld in samenwerking met IBM ... Niet-gecomprimeerd audio-opnameformaat (stereo of mono). Dus slechts één minuut stereogeluidsopname gemaakt met cd-kwaliteit (sample rate 44,1 KHz) bevat 60 s x 44100 Hz x 2 kanalen = 5.292.000 samples. Elke sample kan 8 of 16 bits hebben. In de variant met 8 bits per sample neemt één minuut geluid dus 42.336.000 bits in het geheugen in beslag = 5.292.000 bytes (ongeveer 5 MB).

WavPack[.wv], [.wvс] - Gratis open source audiocodec voor verliesloze audiocompressie. Ontworpen door David Bryant.

Met het WavPack-formaat kunt u 8-, 16-, 24- en 32-bits audiobestanden comprimeren (en herstellen) in het .WAV-formaat. Het ondersteunt ook het streamen van audio en hoge bemonsteringsfrequenties. Net als bij andere verliesvrije compressiemethoden, hangt de compressie-efficiëntie af van de brongegevens, maar ligt deze gewoonlijk tussen 30% en 70% voor gewone populaire muziek, iets hoger voor klassieke muziek en andere bronnen met een groter dynamisch bereik.

WavPack bevat ook een unieke "hybride" modus die alle voordelen van verliesloze compressie biedt met als extra bonus een relatief klein, hoog (meer precies gecodeerd) bestand met kwaliteitsverlies (.WV) in plaats van een enkel bestand te maken, dat kan op zichzelf worden afgespeeld, evenals een "correctie" -bestand (.WVC), waarmee u (in combinatie met het vorige .WV) het origineel volledig kunt herstellen. Voor sommige gebruikers betekent dit dat ze nooit hoeven te kiezen tussen lossless en lossy compressie.

WMA(Windows Media-audio) [ . wma] Een gelicentieerd bestandsformaat ontwikkeld door Microsoft voor het opslaan en uitzenden van audio-informatie.WMA werd oorspronkelijk op de markt gebracht als een alternatief voor MP3, maar wordt nu tegengewerkt door Microsoft's AAC-formaat (gebruikt door de populaire online muziekwinkel iTunes).

Nominaal wordt het WMA-formaat gekenmerkt door een goed compressievermogen, waardoor het het MP3-formaat kan "omzeilen" en in parameters kan concurreren met de Ogg Vorbis- en AAC-formaten. Maar zoals is aangetoond door onafhankelijke tests, evenals door subjectieve beoordeling, is de kwaliteit van de formaten nog steeds niet ondubbelzinnig gelijkwaardig, en het voordeel zelfs ten opzichte van MP3 is ondubbelzinnig, zoals Microsoft stelt. Het is vooral vermeldenswaard dat vroege versies van het formaat (of zijn implementaties) problemen hadden bij lage bitsnelheden. Ook hebben veel muziekliefhebbers en eigenaren van digitale spelers een hekel aan het WMA-formaat vanwege de lage foutbestendigheid. Als tijdens het coderen / overbrengen van een WMA-bestand een deel ervan is beschadigd, wordt het afspelen van het bestand onmogelijk, zowel na de plaats van de beschadiging als enkele tientallen seconden ervoor. (Ter vergelijking: als een MP3-bestand beschadigd is, kun je het nog steeds van het begin tot de plaats van de beschadiging afspelen, dan een paar seconden overslaan en het tot het einde afspelen; soms zijn fouten van enkele bytes in een MP3-bestand amper merkbaar of helemaal niet. ) Dit formaat evolueert echter voortdurend, dus kan worden aangenomen dat de kwaliteit zal worden geoptimaliseerd.

De meeste draagbare audiospelers ondersteunen het WMA-formaat samen met MP3. Dit formaat wordt zeer slecht ondersteund op alternatieve platforms (vanwege het gesloten karakter).

Microsoft heeft ondersteuning voor digitaal auteursrechtbeheer (DRM) (bescherming) in WMA opgenomen. Het belangrijkste gevolg is dat je niet naar beveiligde nummers kunt luisteren op andere computers dan die waarop het nummer is gedownload van een muziekwinkel.

In de nieuwste versies van het formaat, te beginnen met Windows Media Audio 9.1, wordt gecodeerd zonder verlies van Engelse kwaliteit. verliesvrije, meerkanaals surround sound-codering en spraakcodering.

Laten we meteen een voorbehoud maken dat het artikel ALLEEN over algemene kenmerken spreekt en geen details bevat. In de toekomst zal Lifehacker haar eigen onpartijdige onderzoek doen. En vandaag zullen we proberen de reeds bekende ervaring op de een of andere manier te generaliseren.

Er is een analoog en een figuur.

Analoog is goed, maar van korte duur en onhandig. Daarom zullen analoge media, ondanks de hoge vinylverkoop, geen comeback maken.

Audio digitaal kan van drie hoofdtypen zijn:

  • in een formaat dat geen compressie gebruikt;
  • in een formaat dat lossless compressie gebruikt;
  • in een indeling die compressie met verlies gebruikt.

Op de grafieken - goede AudioCD, OGG gecomprimeerd met 350 kbps variabele bitrate en MP3 met Lame. Hoe lager de grafiek, hoe dichter het geluid bij het origineel ligt. Het blijkt een zeer interessante foto te zijn. Ondanks dat MP3 de hoge frequenties duidelijk heeft afgesneden, in tegenstelling tot de OGG, waar je de blokkering onder de 2 kHz ziet.

De frequentie-tijdverdeling van geluid spreekt van niet minder interessante dingen. Met een constante bitrate van 320 kbps is de MP3 bijna identiek aan de originele opname. Alles lijkt nu op zijn plek te vallen. Maar ... In feite is alles nog verwarrender.

Waarom überhaupt lossy gebruiken als er lossless beschikbaar is?

Gezond verstand.

Feit is dat de meeste analoge opnamen niet de hoeveelheid informatie bevatten die zou moeten worden opgeslagen in hoogwaardige formaten. Vergeet niet dat de oorspronkelijke bemonsteringsfrequentie voor cd 44,1 kHz is, en dat de kwantisering slechts 16 bits is.

De vorige grafieken demonstreren goed de hoge betrouwbaarheid van MP3-transmissie. Maar voor een audiocassette, magneetband (tenzij dit natuurlijk een masterband is), zijn de eigenschappen van een audio-cd onbereikbaar. En voor massastudio-apparatuur is relatief recent de mogelijkheid verschenen om analoog geluid op te nemen dat overeenkomt met AudioCD. Het heeft geen zin om in FLAC (en nog meer in WAV) een concertopname of een schijf uit het pre-digitale tijdperk te digitaliseren, vooral niet die gemaakt van magnetische media. Ze bevatten niet die spectra en de hoeveelheid informatie die zonder compressie door containers kan worden opgeslagen.

Wat is er vandaag veranderd?

Een zeldzame geluidstechnicus maakt een digitale masteropname (die vervolgens wordt gereproduceerd op fysieke media), waarbij maximaal gebruik wordt gemaakt van moderne technologieën. Daarom is de kans dat een 24-bits track eigenlijk maar 16-bits is, extreem groot.

Analoge opnames van hoge kwaliteit op hoogwaardige apparatuur zijn tegenwoordig nog moeilijker te vinden - al was het maar voor fans van dit geluid. Dat is bijvoorbeeld Jack White, de ex-leider van de White Stripes. Tegelijkertijd verwijzen sommige van zijn opnames naar variaties van lo-fi, en op zoek naar de buitensporige geluidskenmerken van het nummer wordt er een soort plezier voor fijnproevers.

Als u zich een ideale bron voorstelt, kunt u alleen met een getraind oor of luisteren op hoogwaardige audioapparatuur een gecomprimeerd bestand vinden. En al op basis hiervan (en), is het de moeite waard om de volgende conclusie te trekken:

AAC is noodzakelijk en voldoende voor middengeprijsde apparatuur, bij gebrek waarvan (en bij afwezigheid van bronnen die kunnen worden gecodeerd in AAC) - MP3 met een constante bitsnelheid van 320 kbps, gemaakt met de Lame 3.93-codec (aanbevolen sleutels voor decodering: -cbr -b320 -q0 -k -ms).

De uitzonderingen zijn opnamen die oorspronkelijk zijn opgenomen in hoge kwaliteit, bijvoorbeeld opgenomen op DVD-Audio, SACD, of opnamen die oorspronkelijk zijn verzameld in DSD (of vergelijkbaar formaat) met een hoge bitsnelheid.

Hoewel lossless enkele functies heeft. En daar vertellen we de volgende keer over.