Какво ще определи качеството на цифровизирания звук? Формати: какво е цифров звук? Какво определя качеството на звукозаписа

Битове, херци, оформен дитъринг...

Какво се крие зад тези понятия? При разработването на стандарта CD Audio са приети следните стойности: 44 kHz, 16 малко и 2 канал (т.е. стерео). Защо точно толкова? Каква е причината за този избор, а също и защо се правят опити тези стойности да се увеличат до, да речем, 96 kHz и 24 или дори 32 бита...

Нека първо да разгледаме разделителната способност на семплиране - тоест битовата дълбочина. Просто така се случва, че трябва да избирате между числата 16, 24 и 32. Междинните стойности, разбира се, биха били по-удобни по отношение на звука, но са твърде неприятни за използване в цифровите технологии (много противоречиво твърдение, като се има предвид, че много ADC имат 11 или 12 битов цифров изход - прибл.

Какво прави този параметър? С две думи - за динамичен обхват. Диапазонът на едновременно възпроизвежданите обеми е от максималната амплитуда (0 децибела) до най-малката, която разделителната способност позволява, например около минус 93 децибела за 16-битово аудио. Колкото и да е странно, това е силно свързано с нивото на шума на фонограмата. По принцип за 16-битово аудио е напълно възможно да се предават сигнали с мощност от -120 dB, но тези сигнали ще бъдат трудни за използване на практика поради такава фундаментална концепция като шум при вземане на проби. Факт е, че когато вземаме цифрови стойности, правим грешки през цялото време, закръгляйки реалната аналогова стойност до най-близката възможна цифрова стойност. Най-малката възможна грешка е нула, но максималната грешка, която правим, е половината от последния бит (бит, оттук нататък терминът най-малко значим бит ще бъде съкратен до MB). Тази грешка ни дава така наречения семплиращ шум - случайно несъответствие между дигитализирания сигнал и оригинала. Този шум е постоянен и има максимална амплитуда, равна на половината от най-малката цифра. Това може да се разглежда като произволни стойности, смесени в цифров сигнал. Това понякога се нарича шум от закръгляване или шум от квантуване (което е по-точно име, тъй като амплитудното кодиране се нарича квантуване, а семплирането е процес на преобразуване на непрекъснат сигнал в дискретна (импулсна) последователност - прибл.).

Нека се спрем по-подробно на това какво означава мощност на сигнала, измерена в битове. Най-силният сигнал в цифровата аудио обработка обикновено се приема като 0 dB, това съответства на всички битове, зададени на 1. Ако най-значимият бит (наричан по-долу SB) се нулира, получената цифрова стойност ще бъде наполовина по-голяма, което съответства на загуба на ниво от 6 децибела (10 * log(2) = 6). По този начин, чрез нулиране на тези от най-значимите към най-малко значимите цифри, ще намалим нивото на сигнала с шест децибела. Ясно е, че минималното ниво на сигнала (едно в най-малката цифра, а всички останали цифри са нули) е (N-1) * 6 децибела, където N е битовата дълбочина на семпла (проба). За 16 бита получаваме нивото на най-слабия сигнал - 90 децибела.

Когато казваме „половината от най-малкия бит“, нямаме предвид -90/2, а половината стъпка до следващия бит – тоест още 3 децибела по-ниско, минус 93 децибела.

Да се ​​върнем към избора на резолюция за цифровизация. Както вече споменахме, цифровизацията въвежда шум на нивото на половината от най-младшия бит, което означава, че записът е цифровизиран до 16 бита постоянно вдига шумпри минус 93 децибела. Може да предава сигнали по-тихо, но шумът все още остава на -93 dB. Динамичният диапазон на цифровото аудио се определя от този критерий - там, където съотношението сигнал/шум се превръща в шум/сигнал (има повече шум, отколкото полезен сигнал), се намира долната граница на този диапазон. По този начин, основенкритерий за цифровизация - колко шумможем ли да си позволим реконструиран сигнал? Отговорът на този въпрос зависи отчасти от това колко шум е имало в оригиналния саундтрак. Важното заключение е, че ако цифровизираме нещо с ниво на шум от минус 80 децибела, няма абсолютно никаква причина да го цифровизираме на повече от 16 бита, тъй като, от една страна, шум от -93 dB добавя много малко към вече огромен (сравнително) шум от -80 dB, а от друга страна, по-тих от -80 dB, шумът/сигналът вече започва в самата фонограма и просто няма нужда да се цифровизира и предава такъв сигнал.

Теоретично това е единственият критерий за избор на разделителна способност за цифровизация. Повече нас ние не допринасямеабсолютно никакви изкривявания или неточности. Практиката, колкото и да е странно, почти напълно повтаря теорията. Това беше ръководството на хората, които избраха 16-битова резолюция за аудио компактдискове. Шум минус 93 децибела е доста добро състояние, което почти точно съответства на условията на нашето възприятие: разликата между прага на болка (140 децибела) и обичайния фонов шум в града (30-50 децибела) е точно около сто децибели и ако вземете предвид, че при ниво на звука, което причинява болка, те не слушат музика - което допълнително стеснява обхвата - се оказва, че реалният шум на стаята или дори на оборудването е много по-силен от шума на квантуването . Ако можем да чуем ниво от минус 90 децибела в цифров запис, ние ще чуем и възприемем шум от квантуване, в противен случай просто никога няма да определим дали аудиото е цифровизирано или на живо. Друга разлика по отношение на динамичния обхват просто няма. Но по принцип човек може да чува смислено в диапазона от 120 децибела и би било хубаво да се запази целият този диапазон, нещо, с което 16 бита изглежда не могат да се справят.

Но това е само на пръв поглед: с помощта на специална техника, т.нар оформен дитъринг, можете да промените честотния спектър на семплиращия шум, като почти напълно го преместите в областта над 7-15 kHz. Изглежда, че променяме честотната разделителна способност (отказваме да възпроизвеждаме тихи високи честоти) за допълнителен динамичен диапазон в оставащия честотен диапазон. В комбинация с особеностите на нашия слух - нашата чувствителност към изхвърлената високочестотна област е с десетки dB по-ниска, отколкото в основната област (2-4 kHz) - това дава възможност за относително тихо предаване на полезни сигнали с допълнителни 10- 20 dB по-тих от -93 dB - по този начин динамичният обхват на 16-битов звук за човек е около 110 децибела. И като цяло, в същото време човек просто не може да чуе звуци със 110 децибела по-тихи от силния звук, който току-що е чул. Ухото, подобно на окото, се приспособява към силата на звука на заобикалящата реалност, така че едновременният обхват на слуха ни е сравнително малък - около 80 децибела. Нека поговорим за dithring по-подробно, след като обсъдихме честотните аспекти.

За компактдискове честотата на семплиране е 44100 Hz. Има мнение (въз основа на неправилно разбиране на теоремата на Котелников-Найкуист), че се възпроизвеждат всички честоти до 22,05 kHz, но това не е съвсем вярно. Можем само да кажем със сигурност, че в цифровизирания сигнал няма честоти над 22,05 kHz. Реалната картина на цифровизираното възпроизвеждане на звук винаги зависи от специфична технологияи винаги не е толкова идеален, колкото бихме искали, и както съответства на теорията. Всичко зависи от конкретния DAC (цифрово-аналогов преобразувател, отговорен за получаване на аудио сигнал от цифрова последователност).

Нека първо да разберем какво бихме искали да получим. Човек на средна възраст (по-скоро млад) може да усети звуци от 10 Hz до 20 kHz и смислено да чуе от 30 Hz до 16 kHz. Възприемат се по-високи и по-ниски звуци, но не представляват акустични усещания. Звуците над 16 kHz се усещат като досаден неприятен фактор - натиск върху главата, болка, особено силните звуци носят толкова остър дискомфорт, че искате да напуснете стаята. Неприятните усещания са толкова силни, че работата на устройствата за сигурност се основава на това - няколко минути много силен високочестотен звук ще подлуди всеки и става абсолютно невъзможно да се открадне нещо в такава среда. Звуци под 30 - 40 Hz с достатъчна амплитуда се възприемат като вибрации, излъчвани от предмети (високоговорители). Би било по-точно да се каже така - просто вибрация. Човек акустично почти не определя пространственото положение на такива ниски звуци, така че вече се използват други сетива - тактилни, ние усещаме такива звуци с тялото си.

С високите честоти всичко е малко по-лошо, поне със сигурност по-трудно. Почти цялата същност на подобренията и усложненията на DAC и ADC е насочена именно към по-надеждно предаване на високи честоти. Под „високи“ имаме предвид честоти, сравними с честотата на дискретизация - тоест в случай на 44,1 kHz тя е 7-10 kHz и по-висока.

Представете си синусоида от 14 kHz, цифровизирана при честота на дискретизация от 44,1 kHz. Има около три точки (проби) на период от входната синусоида и за да възстановите първоначалната честота под формата на синусоида, трябва да покажете малко въображение. Процесът на възстановяване на формата на сигнала от проби също се случва в DAC; това се извършва от филтъра за реконструкция. И ако относително ниските честоти са почти готови синусоиди, тогава формата и съответно качеството на възстановяване на високите честоти лежи изцяло на съвестта на системата за възстановяване на ЦАП. По този начин, колкото по-близо е честотата на сигнала до половината от честота на дискретизация, толкова по-трудно е да се възстанови формата на сигнала.

Това е основният проблем при възпроизвеждане на високи честоти. Проблемът обаче не е толкова лош, колкото може да изглежда. Всички съвременни DAC използват многоскоростна технология, която се състои от цифрово възстановяване до няколко пъти по-високи честоти на дискретизация и последващо преобразуване в аналогов сигнал с повишена честота. По този начин проблемът с възстановяването на високите честоти се прехвърля върху раменете на цифровите филтри, които могат да бъдат с много високо качество. Толкова високо качество, че в случай на скъпи устройства има проблем напълноотстранен - ​​осигурено е неизкривено възпроизвеждане на честоти до 19-20 kHz. Повторното вземане на проби се използва и в не много скъпи устройства, така че по принцип този проблем може да се счита за решен. Устройства в района на $30 - $60 (звукови карти) или музикални центрове до $600, обикновено подобни на DAC на тези звукови карти, перфектно възпроизвеждат честоти до 10 kHz, сносно - до 14 - 15 и по някакъв начин останалото. Това достадостатъчно за повечето музикални приложения в реалния живот, а ако някой има нужда от повече качество, ще го намери в устройства от професионален клас, които не са чак толкова по-скъпи - просто са направени разумно.

Нека се върнем към дитъринга - нека видим как можем полезно да увеличим динамичния диапазон над 16 бита.

Идеята на dithering е да добавите шум. Колкото и странно да звучи, за да намалим шума и неприятните ефекти на квантуване, ние добаветевашият шум. Нека разгледаме един пример – нека се възползваме от възможността на CoolEdit да работи в 32 бита. 32 бита е 65 хиляди пъти по-точен от 16 бита, така че в нашия случай 32-битовото аудио може да се счита за аналогов оригинал, а преобразуването му в 16 бита може да се счита за цифровизация. Нека най-високото ниво на звука в оригиналния 32-битов звук съответства на минус 110 децибела. Това е много по-тихо от динамичния обхват на 16-битовото аудио, за което най-слабият звуков звук съответства на ниво от минус 90 децибела. Следователно, ако просто закръглим данните до 16 бита, ще получим пълна цифрова тишина.

Нека добавим "бял" шум към сигнала (т.е. широколентов и равномерен по цялата честотна лента) с ниво от минус 90 децибела, приблизително съответстващо по ниво на шума от квантуване. Сега, ако преобразуваме тази смес от сигнал и "бял" шум в 16 бита (възможни са само цели числа - 0, 1, -1, ...), се оказва, че част от сигнала остава. Там, където първоначалният сигнал е с по-високо ниво, има повече единици, където е имало по-ниско ниво, има нули.

За да тествате експериментално горния метод, можете да използвате звуковия редактор Cool Edit (или всеки друг, който поддържа 32-битов формат). За да чуете какво получавате, трябва да усилите сигнала с 14 бита (78 dB).

Резултатът е шумно 16-битово аудио, съдържащо оригиналния сигнал, който имаше ниво от минус 110 децибела. По принцип това е стандартният начин за разширяване на динамичния диапазон, което често се случва почти от само себе си - навсякъде има достатъчно шум. Това обаче само по себе си е доста безсмислено - нивото на семплиращия шум остава на същото ниво и предаването на сигнал, по-слаб от шума, не е много ясно от логическа гледна точка... (Много погрешно мнение, тъй като предаването на сигнал с ниво, което е по-ниско от нивото на шума, е един от основните методи за кодиране на данни Прибл.)

По-сложен начин - оформен дитъринг, е, че тъй като все още не чуваме високи честоти в много тихи звуци, това означава, че основната мощност на шума трябва да бъде насочена към тези честоти и дори можете да използвате шум на по-високо ниво - ще използвам ниво от 4 цифри от нисък ред (два бита в 16-битов сигнал). Преобразуваме получената смес от 32-битов сигнал и шум в 16-битов сигнал, филтрираме високите честоти (които всъщност не се възприемат от хората със слух) и повишаваме нивото на сигнала, за да можем да оценим резултата.

Това вече е доста добро (за изключително ниска сила на звука) предаване на звука; шумът е приблизително равен по сила на самия звук с първоначално ниво от минус 110 децибела! Важна забележка: ние повишенреален семплиращ шум от половината най-малка значима цифра (-93 dB) до четири най-малко значими цифри (-84 dB), понижаванезвуков шум от -93 dB до приблизително -110 dB. Съотношение сигнал/шум влошено, но шумът премина във високочестотната област и престана да се чува, което даде значително подобрение в реално(възприемано от човека) съотношение сигнал/шум.

(С други думи, тъй като мощността на шума е, така да се каже, „разпръсната“ в честотния диапазон, без да преминава през горните честоти, ние отнемаме част от мощността от нея, в резултат на което сигналът към -съотношението на шума се подобрява във времето на представянето на сигналите - Прибл.)

На практика това вече е нивото на шума при семплиране на 20-битово аудио. Единственото условие за тази технология е наличието на честоти за шум. Звукът от 44,1 kHz прави възможно поставянето на шум на честоти, които не се чуват при ниски обеми от 10-20 kHz. Но ако цифровизирате при 96 kHz, честотната област за шум (нечуваем от хората) ще бъде толкова голяма, че при използване на оформен дитъринг 16 бита наистина липревърнете във всички 24.

[Забележка: PC Speaker е еднобитово устройство, но с доста висока максимална честота на семплиране (включване/изключване на този единичен бит). Използвайки процес, подобен по същество на dithering, наречен по-скоро широчинно-импулсна модулация, на него се възпроизвеждаше доста висококачествен цифров звук - 5-8 нискочестотни бита бяха извлечени от един бит и висока честота на семплиране, и високата честота шумовият филтър беше неспособността на оборудването да възпроизвежда толкова високи честоти, както и неспособността ни да ги чуем. Леко високочестотно свирене обаче - чуваемата част от този шум - се чуваше.]

По този начин оформеното дитъринг ви позволява значително да намалите и без това ниския шум на семплиране на 16-битово аудио, като по този начин тихо разширявате полезния (безшумен) динамичен диапазон с всичкозоната на човешкия слух. Тъй като вече оформеният dithering се използва винаги при конвертиране от работен формат от 32 бита към крайните 16 бита за CD, нашите 16 бита са напълно достатъчни, за да предадат напълно звуковата картина.

Трябва да се отбележи, че тази технология работи само на етапа на подготовка на материала за възпроизвеждане. Когато обработвате висококачествено аудио, просто необходимоостават в 32 бита, за да не се прилага дитъринг след всяка операция, по-добре кодирайки резултатите обратно до 16 бита. Но ако нивото на шума на фонограмата е повече от минус 60 децибела, можете да извършите цялата обработка в 16 бита без най-малкото угризение на съвестта. Междинното дитъринг ще гарантира липсата на заоблящи изкривявания и шума, който добавя стотици пътипо-слаб от това, което вече съществува и следователно напълно безразличен.

Q:
Защо казват, че 32-битовият звук е по-добър от 16-битовия?
A1: Те грешат.
A2: [Те означават нещо малко по-различно: когато обработвате или записвате звук трябва даизползвайте по-висока резолюция. Те се възползват от това Винаги. Но в аудиото, както и в готовия продукт, не се изисква разделителна способност от повече от 16 бита.]
Q: Има ли смисъл да увеличавам честотата на семплиране (например до 48 kHz или до 96)?
A1: Няма го. При всеки компетентен подход към проектирането на DAC се предава 44 kHz всичконеобходимия честотен диапазон.
A2: [Те означават нещо малко по-различно: има смисъл, но само когато се обработва или записва звук.]
Q: Защо въвеждането на по-високи честоти и побитови скорости все още е в ход?
A1: Важно е прогресът да върви напред. Къде и защо вече не е толкова важно...
A2: Много процеси протичат по-лесно в този случай. Ако, например, устройството ще обработва звук, ще му бъде по-лесно да направи това в 96 kHz / 32 бита. Почти всички DSP използват 32 бита за аудио обработка и възможността да забравите за преобразуването прави разработката по-лесна и все пак леко увеличение на качеството. И като цяло - звук за допълнителна обработка То имаИма смисъл да се съхранява в по-висока разделителна способност от 16 бита. За hi-end устройства, които възпроизвеждат само звук, това абсолютнобезразличен.
Q: 32x или 24x или дори 18-битовите ЦАП по-добри ли са от 16-битовите?
A: Общо взето - Не. Качеството на преобразуването изобщо не зависи от битовата дълбочина. Кодекът AC"97 (модерна звукова карта под $50) използва 18-битов кодек, а картите за $500, чийто звук дори не може да се сравни с тази глупост, използват 16-битов кодек. Това не прави абсолютно никаква разлика при възпроизвеждане на 16-битово аудио.
Също така си струва да имате предвид, че повечето ЦАП обикновено произвеждат по-малко битове, отколкото приемат. Например, реалното ниво на шум на типичен евтин кодек е -90 dB, което е 15 бита, и дори самият той да е 24-битов - няма да получите никаква възвръщаемост от "допълнителните" 9 бита - резултатът от техните работата, дори и да е имало, ще се удави в същия собствен шум. Повечето евтини устройства са просто игнорирандопълнителни битове - те просто не влизат в изчисленията в техния процес на звуков синтез, въпреки че отиват на цифровия вход на DAC.
Q: Ами за запис?
A: За запис е по-добре да имате ADC с по-голям капацитет. Отново, повече истинскибитова дълбочина. Битовата дълбочина на DAC трябва да съответства на нивото на шума на оригиналния саундтрак или просто да е достатъчна за постигане на желаното ниско ниво шум.
Също така е удобно да имате малко битова дълбочина с марж, за да използвате увеличения динамичен диапазон за по-малко прецизна настройка на нивото на запис. Но помнете - винаги трябва да удряте истинскиобхват на кодеци. В действителност, 32-битов ADC, например, е почти напълно безсмислен, тъй като най-ниските десет бита просто ще издават непрекъснат шум - таканисък шум (под -200 dB) просто не може да бъдев аналогов музикален източник.

Няма смисъл да се изисква по-висока битова дълбочина или честота на семплиране от звука в сравнение с CD или по-добро качество. 16 бита / 44 kHz, изтласкани до границата с оформен дитъринг, са доста способни напълнопредава информация, която ни интересува, ако не става дума за процеса на обработка на звука. Не трябва да губите място за допълнителни данни в готовия материал, точно както не трябва да очаквате повишено качество на звука от DVD-Audio с неговите 96 kHz / 24-bit. С правилния подход при създаване на звук в стандартен CD формат ще имаме качество, което просто няма нужда от негов по-нататъшно усъвършенстване, а отговорността за правилния звукозапис на крайните данни отдавна е поета от разработените алгоритми и хора, които знаят как да ги използват правилно. През последните няколко години няма да намерите нов диск без оформен дитъринг и други техники за достигане на качеството на звука до краен предел. Да, ще бъде по-удобно за мързеливите или просто кривите да предоставят готов материал в 32 бита и 96 kHz, но на теория - струва ли си няколко пъти повече аудио данни?..

Аудио дисковете постепенно се превръщат в нещо от историята. Не, разбира се, те все още се продават в магазините, но все по-малко хора ги слушат и купуват. Мнозина просто не виждат смисъл в това, защото дори ако вземем предвид законния начин за получаване на аудио файлове, една песен в MP3 формат в онлайн музикален магазин струва много по-малко от една песен, записана на аудио диск. Възниква разумен въпрос: защо да плащате повече?

Разбира се, качеството на звука на аудио CD е много по-високо от това на всеки аудио файл, където данните са компресирани, но за изненадващо мнозинство от хора тази разлика не е критична. Какво има там! В наши дни дори най-големите аудиофили мислят за преобразуването на колекцията си от аудио CD в аудио файлове, защото може да дойде време, когато търсенето на дискове ще бъде толкова ниско, че аудио CD плейъри просто няма да се произвеждат повече.

В тази статия ще разгледаме някои програми за вземане на данни от аудио компактдискове и конвертирането им в MP3 и други формати. Но първо, малко теория.

Аудио компресия и популярни аудио формати

Компресирането на данни включва анализ и опростяване на записаната информация, в резултат на което на лазерен носител могат да бъдат записани повече аудио данни, отколкото е възможно при запис на аудио CD.

За да стане по-ясно какво е компресиране на данни, представете си, че трябва да преразкажете съдържанието на лист хартия, на който е написана буквата А хиляда пъти на ваш приятел по телефона. Можете просто да кажете „А“ на глас хиляди пъти и вашият събеседник ще разбере какво е написано на листа. От друга страна, можете първо да преброите колко пъти е написана тази буква и след това да кажете на приятеля си, че буквата „А“ е написана хиляди пъти на листа хартия. Резултатът ще бъде същият – вашият приятел ще знае съдържанието на листчето, но във втория случай ще ви отнеме много по-малко време, за да прехвърлите информацията. С други думи, извършихте компресиране на данни, като анализирате колко пъти се повтаря една буква.

Цифровото аудио компресиране следва приблизително същия сценарий. Компресирането на аудио данни обаче има редица характеристики. Така например, за да разпознаете позната мелодия, е достатъчно да я пуснете с по-лошо качество. Трябва да се има предвид, че много хора имат предвид напълно различни неща в понятието „висококачествен звук“. Така например, ако един музикален запис боли ушите на музиканта, защото струната не е била набрана в строго определена тоналност, тогава обикновеният човек може да се примири с много по-сериозни недостатъци.

Тази характеристика на човешкото звуково възприятие е вдъхновила създаването на нови аудио формати, които използват модел на аудио компресия със загуби. Влошаването на звука за повечето любители на музиката не е критично, а в някои случаи качеството изобщо не е важно, например в паузи на мълчание, когато аудио данните нямат стойност или в тези честоти, които човешкото ухо не може да възприеме .

Има огромен брой формати за цифрови аудиозаписи. Разликата им е, че използват различни алгоритми за компресия. Най-популярните днес формати са:

  • WMA (Windows Media Audio) е формат, разработен от Microsoft Corporation. Този формат е създаден на базата на популярния в миналото VQF формат, който днес е почти забравен.
  • OGG Vorbis е безплатен формат с отворен код. Напоследък стана толкова популярен, че се поддържа от производителите на някои преносими плейъри.
  • MP3 (MPEG Layer III) е най-популярният формат, заемащ водеща позиция в продължение на много години.

Характеристики на MP3 формат

Общото наименование MP3 е съкращение от MPEG Layer III. MPEG, от своя страна, означава Moving Picture Coding Experts Group. MP3 форматът е разработен от германския институт Fraunhofer в началото на 90-те години на миналия век. Форматът става наистина популярен, след като Thomson се интересува от него.

Благодарение на алгоритъма за компресиране, който използва MP3 формат, аудио данните могат да бъдат компресирани десет до дванадесет пъти без забележима загуба на качество. Високото съотношение на компресия се постига благодарение на факта, че MP3 използва характеристиките на човешкия слух. Човешкото ухо възприема звук в диапазона от 20 Hz до 20 kHz, така че всички звуци, които не попадат в този диапазон, просто се отхвърлят. Това значително намалява обема на данните.

Друга характеристика на MP3, която ви позволява да получите по-малък аудио файл, е свързана със стерео звука и отново с характеристиките на човешкия слух. Когато слушаме музика, записана в стерео, ние чуваме основната разлика в средните честоти. Благодарение на тази функция може да се приложи алгоритъм за компресия към аудио кодиране, който ще кодира отделно за всеки канал само честотния спектър, в който разликата между каналите е най-чуваема. И звукът на тези честоти на стерео каналите, при които разликата е по-малко забележима, се комбинира и кодира в моно режим. Този комбиниран режим на кодиране на стерео сигнал се нарича Joint Stereo.

Цифрови аудио спецификации

Когато компресирате аудио данни, става необходимо да се контролира качеството на цифровизирания звук. Така например, ако трябва да цифровизирате аудиокнига, тогава високото качество не е необходимо в този случай. Основното е, че можете да различите думите. Ако едно музикално произведение се дигитализира, качеството е от голямо значение.
Независимо кой алгоритъм за аудио компресия се използва, параметрите, характеризиращи качеството на звука, са еднакви.

Една от основните характеристики на цифровия звук е битрейт. Побитовата скорост е скоростта на кодиране/декодиране на цифров аудио поток. Колкото по-висока е стойността му, толкова по-добро е качеството на звука и по-голям е размерът на файла. Трябва да се каже, че битрейтът е относителна стойност. Файловете, създадени с помощта на различни алгоритми за компресиране и с еднакъв битрейт, ще се различават по качество.

Кодирането може да се извърши с постоянен или променлив битрейт. Методът на кодиране с променлив битрейт позволява да се променя качеството на аудио сигнала в движение, тоест по време на възпроизвеждане. Ако програмата определи, че се занимава със сложен звуков поток (например звуците на симфоничен оркестър), качеството се увеличава, но ако звукът е прост (например, когато има пауза между песните), качеството автоматично се влошава. Това намалява размера на файла.

Звуковото кодиране става с определена честота на дискретизация. По време на процеса на обработка аудиосигналът се разделя на голям брой части (проби), всяка от които се обработва от алгоритъм за компресия. Точността на обработката на сигнала се определя от честотата на дискретизация, която се измерва в килохерци. В зависимост от броя на пробите за единица време се разграничава звукова характеристика като битова дълбочина. Не е трудно да се досетите, че колкото повече проби се обработват, толкова по-високо е качеството на звука.

На постъпващия в аналого-цифровия преобразувател (звукова карта) звуков сигнал се прилага двойно семплиране - по амплитуда и по време.
За математическо описание на формата на сигнала се използва теоремата на Котелников, според която всеки непрекъснат процес с ограничен спектър може да бъде представен чрез дискретна последователност от неговите моментни стойности. Честотата на такава последователност трябва да бъде поне два пъти по-висока от честотата на най-високия хармоник на процеса. Честотата, при която моментните стойности (проби) на сигнала се вземат на проби, се нарича честота на дискретизация.

Всяко отклонение във формата на сигнала, постъпващ на входа на звуковата карта от правилната форма на синусоида, води до излизане на спектъра извън естествената честота на сигнала. Следователно, когато семплира аудио сигнал във времето, честотите на входящия импулс са ограничени до под половината от честотата на семплиране или се взема спектър с повишена честота. Поради факта, че човешкото ухо може да различи звукови вибрации с честота до 20 kHz, се оказва, че честотата на дискретизация на всеки аудио сигнал трябва да бъде най-малко 40 kHz. Следователно на практика можете да намерите аудио устройства със семплиращи честоти от 44,1 kHz, 48 kHz и 96 kHz.

За амплитудно вземане на проби от аудио, например на лазерен диск, се използва ниво на квантуване 2 на шестнадесета степен (65536). Представянето на числа от 0 до 2^16 изисква 16 бита информация, така че е по-удобно да се използва терминът 16-битова ширина на сигнала. Дълбочината на звука зависи от динамичния обхват на входния сигнал и приемливия шум на квантуване.

Квантуването на амплитудата и времето причинява изкривявания на звука в цялата честотна лента, към които се добавят шум и смущения от звуковия път на аудиокартата.

Друга важна характеристика на цифровия звук е стерео звукът. Следователно, ако звукът е записан в стерео, а не в моно, количеството аудио данни се удвоява и съответно размерът на изходния файл се увеличава.

Извличане на музика от аудио дискове с помощта на Windows MediaИграч

Възможността за копиране на аудио данни вече е вградена в WindowsXP. За да копирате аудио данни с помощта на Windows Media Player, поставете аудио диск във вашето дисково устройство, стартирайте плейъра и щракнете върху бутона „Копиране от диск“ в горната част на прозореца на програмата. Прозорецът на плейъра ще покаже съдържанието на вашата аудио медия като отделни песни. До всеки от тях има отметка. Това означава, че всички песни ще бъдат копирани. Ако не искате да копирате конкретна песен, премахнете отметката от квадратчето до нейното име.

По подразбиране настройките на програмата не задават качеството на компресиране на аудио данни на много високо ниво, така че ако сте фен на висококачествен звук, трябва да промените битрейта на създадения файл. За да направите това, изпълнете командата "Инструменти>Опции" и в прозореца, който се отваря, отидете в раздела "Копиране на музика от CD". Стойността на битрейта се задава с плъзгача "Качество на звука", а най-дясната позиция съответства на максималния размер на изходния файл и съответно най-добрия звук.

Една от характеристиките на стандартния плейър е възможността за защита на аудио файлове от възпроизвеждане на друг компютър. Ако искате WMA файловете, създадени от програмата, да се възпроизвеждат само на този компютър, уверете се, че опцията „Музика, защитена от копиране“ е отметната.

За да започнете да копирате, щракнете върху бутона „Копиране на музика от компактдиск“ в горната част на прозореца на програмата. На екрана ще се появи прозорец, в който можете да активирате или деактивирате защитата на съдържанието, като поставите отметка в съответното квадратче. Преди да започнете да копирате, можете също да промените настройките за копиране, ако е необходимо.

Процесът на компресиране може да се следи в колоната "Статус на копиране на CD". Веднага след като операцията по прехвърляне на песента на твърдия диск приключи, съобщението „Копирано в библиотеката“ ще се появи срещу копираната песен.

Въпреки очевидното удобство на разглеждания метод за копиране на аудио данни, в много случаи е неудобно да се използва. Първо, форматът WMA не се поддържа от всички преносими MP3 устройства, и второ, кодирането в този формат отнема повече време в сравнение с други формати. И накрая, когато използвате Windows Media Player, няма гъвкав контрол върху настройките за компресия.

С една дума, ако сте закупили MP3 плейър и планирате редовно да попълвате вашата цифрова музикална библиотека чрез копиране на данни от аудио дискове, трябва да сте сигурни, че имате под ръка висококачествен и многофункционален аудио енкодер. Ще разгледаме някои от тези програми във втората част на статията.

Какви параметри определят качеството на цифровия звук?

  • Звукова информация. Звукът е вълна, разпространяваща се във въздух, вода или друга среда с непрекъснато променящ се интензитет и честота.

    Човек възприема звуковите вълни (въздушни вибрации) с помощта на слуха под формата на звук с различна сила и тон. Колкото по-голям е интензитетът на звуковата вълна, толкова по-силен е звукът; колкото по-висока е честотата на вълната, толкова по-висок е тонът на звука (фиг. 1.1).

    Ориз. 1.1. Зависимост на силата и височината на звука от интензитета и честотата на звуковата вълна

    Човешкото ухо възприема звука с честоти, вариращи от 20 вибрации в секунда (слаб звук) до 20 000 вибрации в секунда (висок звук).

    Човек може да възприема звук в огромен диапазон от интензитети, в който максималният интензитет е 1014 пъти по-голям от минималния (сто хиляди милиарда пъти). За измерване на силата на звука се използва специална единица "децибел" (dbl) (Таблица 5.1). Намаляването или увеличаването на силата на звука с 10 dbl съответства на намаляване или увеличаване на интензитета на звука с 10 пъти.

    Таблица 5.1. Сила на звука
    Сила на звука в децибели
    Долната граница на чувствителност на човешкото ухо е 0
    шумолене на листа 10
    Разговор 60
    Автомобилен клаксон 90
    Реактивен двигател 120
    Праг на болка 140
    Времево семплиране на звук. За да може компютърът да обработва звук, непрекъснатият аудио сигнал трябва да бъде преобразуван в цифрова дискретна форма с помощта на времево семплиране. Продължителната звукова вълна се разделя на отделни малки временни секции, като за всяка такава се задава определена стойност на интензитета на звука.

    По този начин непрекъснатата зависимост на силата на звука от времето A(t) се заменя с дискретна последователност от нива на силата на звука. На графиката това изглежда като замяна на гладка крива с последователност от „стъпки“ (фиг. 1.2).

    Ориз. 1.2. Времева семплиране на аудио

    Честота на вземане на проби. Микрофон, свързан към звуковата карта, се използва за запис на аналогов звук и преобразуването му в цифрова форма. Качеството на получения цифров звук зависи от броя на измерванията на нивото на силата на звука за единица време, т.е. честотата на семплиране. Колкото повече измервания се извършват в секунда (колкото по-висока е честотата на дискретизация), толкова по-точно „стълбата“ на цифровия аудио сигнал следва кривата на диалоговия сигнал.

    Честотата на аудио дискретизация е броят на измерванията на силата на звука, направени за една секунда.

    Скоростите на аудио дискретизация могат да варират от 8 000 до 48 000 измервания на силата на звука в секунда.

    Дълбочина на аудиокодиране. На всяка „стъпка“ се присвоява определено ниво на звука. Нивата на силата на звука могат да се разглеждат като набор от възможни състояния N, чието кодиране изисква определено количество информация I, което се нарича дълбочина на кодиране на звука.

    Дълбочината на аудиокодиране е количеството информация, необходимо за кодиране на дискретни нива на звука на цифрово аудио.

    Ако дълбочината на кодиране е известна, тогава броят на нивата на звука на цифровия звук може да се изчисли по формулата N = 2I. Нека дълбочината на аудио кодиране е 16 бита, тогава броят на нивата на звука на звука е равен на:

    N = 2I = 216 = 65 536.

    По време на процеса на кодиране на всяко ниво на звука се присвоява собствен 16-битов двоичен код; най-ниското ниво на звука ще съответства на кода 000000000000000, а най-високото - 111111111111111.

    Дигитализирано качество на звука. Колкото по-високи са честотата и дълбочината на семплиране на звука, толкова по-високо е качеството на цифровизирания звук. Най-ниското качество на цифровизирания звук, съответстващо на качеството на телефонната комуникация, се получава при честота на семплиране 8000 пъти в секунда, дълбочина на семплиране 8 бита и запис на един аудио запис (моно режим). Най-високото цифровизирано качество на звука, съответстващо на качеството на аудио CD, се постига с честота на семплиране от 48 000 пъти в секунда, дълбочина на семплиране от 16 бита и запис на две аудио записи (стерео режим).

    Трябва да се помни, че колкото по-високо е качеството на цифровия звук, толкова по-голям е обемът на информацията на звуковия файл. Можете да оцените обема на информацията на цифров стерео аудио файл с продължителност на звука 1 секунда със средно качество на звука (16 бита, 24 000 измервания в секунда). За да направите това, дълбочината на кодиране трябва да се умножи по броя на измерванията за 1 секунда и да се умножи по 2 (стерео звук):

    16 бита 24 000 2 = 768 000 бита = 96 000 байта = 93,75 KB.

    Звукови редактори. Звуковите редактори ви позволяват не само да записвате и възпроизвеждате звук, но и да го редактирате. Цифровият звук се представя в звукови редактори във визуална форма, така че операциите по копиране, преместване и изтриване на части от аудиозаписа могат лесно да се извършват с помощта на мишката. Освен това можете да наслагвате аудиозаписи един върху друг (смесвате звуци) и да прилагате различни акустични ефекти (ехо, възпроизвеждане в обратна посока и т.н.).

Какво ще определи качеството на цифровизирания звук?

    За качеството на цифровия звук две неща са от съществено значение: качеството на оригиналния саундтрак и качеството на аналогово-цифровия преобразувател.

    Що се отнася до качеството на оригиналния саундтрак, всичко е приблизително ясно. Ако е извит (с изкривявания) или шумен, тогава никакво количество цифровизация няма да го подобри. Е, това е възможно чрез различни обработки, включително цифрови, да се изолира полезен сигнал, който се използва при изолиране на реч на фона на външен шум или при изолиране на нормален сигнал на фона на случаен шум (всеки има гледах филми за завъртания, нали?), но ако говорим за музикална фонограма, тоест за фонограма с широк спектър, тогава всякакви трикове няма да помогнат.

    Така че ще приемем, че фонограмата е с високо качество.

    Тогава всичко, което остава, е ADC.

    Основният индикатор тук е битовата дълбочина на кодиране. Ясно е, че колкото по-голям е, толкова по-добре, но от друга страна, толкова по-сложен и скъп е един такъв конвертор. В зората на цифровите технологии (което не беше толкова отдавна ...), 16-битов краен запис беше признат за оптимален по отношение на съотношението цена / качество. При по-ниска битова дълбочина страда динамичният обхват на цифрово копие на фонограма - звуците с ниско ниво (пианисимо) представляват само малка част от всички битове, което означава, че стъпаловидата на промяната на сигнала става забележима. И нискочестотното филтриране няма да помогне много тук (споменаването на теоремата на Котелников е добре дошло, но не трябва да забравяме, че тя мълчаливо предполага перфектенаналогово-цифрово преобразуване, тоест с безкрайно голяма битова дълбочина). Тъй като всяка обработка, дори и в цифров вид, може само да намали ефективната битова дълбочина, дигитализацията в студията се извършваше и продължава да се извършва и до днес с по-голям брой битове.

    В днешно време вече не е необичайно цифровите фонограми да се подготвят с 24-битова битова дълбочина (супер-аудио CD, аудио-DVD). С такава битова дълбочина ще бъде възможно напълно да се предаде динамичният диапазон на всяко музикално произведение, дори Болеро на Равел, което започва с едва доловима част от малки барабани и завършва фортисимо с целия оркестър.

    Ето. В допълнение към битовата дълбочина, други параметри на ADC също са важни, предимно нелинейност и шум. Особено шумове. Тъй като ограничават ефективния битов капацитет на преобразувателя. Какъв е смисълът от тези 24 бита, ако последните 8 от тях са шумни и следователно не носят полезна информация... Нивото на шума на съвременните 24-битови ADC може да достигне -115 dB при честота на дискретизация над 100 kHz, това вече е доста приличен, а диференциалната нелинейност се измерва с десет хилядни от процента. Тоест подобни решения лесно надхвърлят възможностите на човешкото ухо.

  • Това ще зависи от три основни параметъра:

    1. Честота на вземане на проби. Той ограничава честотната лента на предаваните честоти: максималната честота на предавания сигнал е под половината от честотата на семплиране. В телефонията най-често се използва честота на дискретизация от 8 kHz, което дава теоретична лента малко по-тясна от 4 kHz (на практика се използва лента от 300-3000 Hz). А стандартът CD използва честота от 44,1 kHz, което прави възможно пълното предаване на спектъра от 20 Hz - 20 kHz. Увеличаването на честотата на дискретизация над тези стойности няма смисъл от гледна точка на обхвата на предаваните честоти, но намалява нивото на интермодулационно изкривяване. В стандарта DVD Audio максималната честота на семплиране е 192 kHz; някои добри аудио карти за компютри също поддържат тази честота на семплиране (ширината на честотната лента на възпроизвеждане и честотите на запис се различават при различните модели). Други стандартни стойности са 96, 48, 32, 22.05, 11.025 kHz.
    2. Кодираща битова дълбочина. Динамичният диапазон зависи от него - при линейно кодиране разликата между пълното размахване и минималната стъпка е 256 пъти за 8 бита, и 65536 пъти за 16 бита, което е съответно 48 и 96 dB. 48 dB е откровено ниско, това е нивото на динамичния диапазон на компактна касета и освен това, в допълнение към тесния динамичен диапазон, възникват неприятни изкривявания, особено ясно чуваеми на тихи места - следствие от трансформацията на плавен сигнал в стъпаловиден. С битова дълбочина от 16 бита, качеството на звука вече е доста добро (тази битова дълбочина се използва от CD), но не е идеално в много реални случаи - много класически произведения, както и тежка музика, изискват по-голям DD. Висококачествените системи използват 24-битово кодиране, въпреки че действителният брой значими битове не надвишава 18-20. Няма смисъл от допълнително увеличаване на битовата дълбочина.
    3. Метод на кодиране. Това има две страни. Първият е самата скала за вземане на проби. Обикновено е линеен, но може да бъде и логаритмичен. Това дава увеличение на динамичния диапазон със същата битова дълбочина, но нивото на изкривяване е по-високо, отколкото при същия динамичен диапазон с линейна скала и по-висока битова дълбочина. Второто е използването на различни алгоритми за компресия със загуби. Във връзка с последното се появява понятието битрейт. Последният е броят битове, необходими за кодиране на една секунда аудио. Естествено битрейтът зависи от честотата на семплиране и дълбочината на битовете, но също и от съотношението на компресия. Компресията може да бъде със загуба или без загуба. Компресията без загуба е по същество обикновено архивиране и не засяга звука. А със загубите, затова са загуби. Кодерът анализира аудио информацията и изхвърля данните, ръководени от психоакустични съображения: загуба на това, което ще бъде най-малко чуваемо. Тоест слаб звук на фона на силен, слаби високочестотни звуци на фона на силни средночестотни звуци и т.н. При средни и високи честоти информацията за фазата може да бъде отхвърлена. В резултат на това, когато записът е компресиран с CD качество 4,5 пъти (битрейт 320 kbps, mp3/Lame), звуковото влошаване на записа е толкова незначително, че без добро оборудване е много трудно да се види разликата. И с битрейт 128, влошаването на качеството на звука вече е очевидно и много записи звучат просто неприятно. Но с пластмасови високоговорители или високоговорители, вградени в лаптопа, няма да чуете тази разлика.

Много често чуваме определения като „цифров“ или „дискретен“ сигнал; каква е разликата му с „аналогов“?

Същността на разликата е, че аналоговият сигнал е непрекъснат във времето (синя линия), докато цифровият сигнал се състои от ограничен набор от координати (червени точки). Ако сведем всичко до координати, тогава всеки сегмент от аналогов сигнал се състои от безкраен брой координати.

За цифров сигнал координатите по хоризонталната ос са разположени на равни интервали, в съответствие с честотата на дискретизация. В общия аудио-CD формат това е 44100 точки в секунда. Вертикалната точност на координатната височина съответства на битовата дълбочина на цифровия сигнал; за 8 бита е 256 нива, за 16 бита = 65536 и за 24 бита = 16777216 нива. Колкото по-голяма е битовата дълбочина (брой нива), толкова по-близо са вертикалните координати до оригиналната вълна.

Аналогови източници са: винил и аудио касети. Цифровите източници са: CD-Audio, DVD-Audio, SA-CD (DSD) и файлове във формати WAVE и DSD (включително производни на APE, Flac, Mp3, Ogg и др.).

Предимства и недостатъци на аналоговия сигнал

Предимството на аналоговия сигнал е, че ние възприемаме звука с ушите си в аналогова форма. И въпреки че нашата слухова система преобразува възприемания звуков поток в цифрова форма и го предава в тази форма на мозъка, науката и технологиите все още не са достигнали точката на свързване на играчи и други звукови източници директно в тази форма. Подобни изследвания вече се провеждат активно за хора с увреждания и ние се радваме изключително на аналогов звук.

Недостатъкът на аналоговия сигнал е възможността за съхраняване, предаване и възпроизвеждане на сигнала. Когато записвате на магнитна лента или винил, качеството на сигнала ще зависи от свойствата на лентата или винила. С течение на времето лентата се демагнетизира и качеството на записания сигнал се влошава. Всяко четене постепенно унищожава носителя, а пренаписването внася допълнително изкривяване, при което се добавят допълнителни отклонения от следващия носител (лента или винил), устройства за четене, запис и предаване на сигнал.

Правенето на копие на аналогов сигнал е същото като копирането на снимка, като я снимате отново.

Предимства и недостатъци на цифровия сигнал

Предимствата на цифровия сигнал включват точност при копиране и предаване на аудио поток, където оригиналът не се различава от копието.

Основният недостатък е, че цифровият сигнал е междинен етап и точността на крайния аналогов сигнал ще зависи от това колко подробно и точно звуковата вълна е описана с координати. Съвсем логично е, че колкото повече точки има и колкото по-точни са координатите, толкова по-точна ще бъде вълната. Но все още няма консенсус относно това какъв брой координати и точността на данните са достатъчни, за да се каже, че цифровото представяне на сигнала е достатъчно, за да възстанови точно аналоговия сигнал, неразличим от оригинала от нашите уши.

По отношение на обема на данните, капацитетът на обикновената аналогова аудио касета е само около 700-1,1 MB, докато обикновеният CD съдържа 700 MB. Това дава представа за необходимостта от носители с голям капацитет. И това поражда отделна война на компромиси с различни изисквания към броя на описващите точки и точността на координатите.

Днес се счита за напълно достатъчно да се представи звукова вълна с честота на дискретизация 44,1 kHz и битова дълбочина 16 бита. При честота на дискретизация от 44,1 kHz е възможно да се реконструира сигнал до 22 kHz. Както показват психоакустичните изследвания, по-нататъшно увеличаване на честотата на семплиране не се забелязва, но увеличаването на битовата дълбочина дава субективно подобрение.

Как DAC изграждат вълна

DAC е цифрово-аналогов преобразувател, елемент, който преобразува цифров звук в аналогов. Ще разгледаме повърхностно основните принципи. Ако коментарите показват интерес към разглеждане на редица точки по-подробно, ще бъде пуснат отделен материал.

Многобитови ЦАП

Много често вълната се представя като стъпки, което се дължи на архитектурата на първото поколение многобитови R-2R DAC, които работят подобно на релеен превключвател.

Входът DAC получава стойността на следващата вертикална координата и при всеки тактов цикъл превключва нивото на тока (напрежението) на подходящото ниво до следващата промяна.

Въпреки че се смята, че човешкото ухо може да чуе не по-високи от 20 kHz и според теорията на Найкуист е възможно да се възстанови сигналът до 22 kHz, качеството на този сигнал след възстановяването остава под въпрос. Във високочестотната област получената "стъпаловидна" форма на вълната обикновено е далеч от оригиналната. Най-лесният изход от ситуацията е да се увеличи честотата на дискретизация при запис, но това води до значително и нежелано увеличение на размера на файла.

Алтернатива е изкуственото увеличаване на честотата на семплиране при възпроизвеждане на DAC чрез добавяне на междинни стойности. Тези. представяме си непрекъснат вълнов път (сива пунктирана линия), плавно свързващ оригиналните координати (червени точки) и добавяме междинни точки на тази линия (тъмно лилаво).

Когато се увеличава честотата на дискретизация, обикновено е необходимо да се увеличи битовата дълбочина, така че координатите да са по-близо до апроксимираната вълна.

Благодарение на междинните координати е възможно да се намалят „стъпките“ и да се изгради вълна, по-близо до оригинала.

Когато видите функция за усилване от 44,1 до 192 kHz в плейър или външен DAC, това е функция за добавяне на междинни координати, а не за възстановяване или създаване на звук в областта над 20 kHz.

Първоначално това бяха отделни SRC чипове преди DAC, които след това мигрираха директно към самите DAC чипове. Днес можете да намерите решения, при които такъв чип се добавя към съвременните DAC, това се прави, за да се осигури алтернатива на вградените алгоритми в DAC и понякога да се получи дори по-добър звук (както например това се прави в Hidizs AP100).

Основният отказ в индустрията от многобитови ЦАП се дължи на невъзможността за по-нататъшно технологично развитие на показателите за качество с настоящите производствени технологии и по-високата цена в сравнение с „импулсните“ ЦАП със сравними характеристики. Въпреки това, в Hi-End продуктите често се дава предпочитание на стари многобитови ЦАП, а не на нови решения с технически по-добри характеристики.

Превключване на ЦАП

В края на 70-те години широко разпространение получи алтернативна версия на ЦАП, базирана на "импулсна" архитектура - "делта-сигма". Технологията Pulse DAC даде възможност за появата на ултра-бързи превключватели и позволи използването на високи носещи честоти.

Амплитудата на сигнала е средната стойност на амплитудите на импулса (импулси с еднаква амплитуда са показани в зелено, а получената звукова вълна е показана в бяло).

Например, последователност от осем цикъла от пет импулса ще даде средна амплитуда (1+1+1+0+0+1+1+0)/8=0,625. Колкото по-висока е носещата честота, толкова повече импулси се изглаждат и се получава по-точна стойност на амплитудата. Това направи възможно представянето на аудио потока в еднобитова форма с широк динамичен диапазон.

Осредняването може да се извърши с обикновен аналогов филтър и ако такъв набор от импулси се приложи директно към високоговорителя, тогава на изхода ще получим звук и ултра високите честоти няма да бъдат възпроизведени поради високата инерция на излъчвателя. На този принцип работят ШИМ усилвателите в клас D, където енергийната плътност на импулсите се създава не от техния брой, а от продължителността на всеки импулс (което е по-лесно за изпълнение, но не може да се опише с прост двоичен код).

Многобитовият DAC може да се разглежда като принтер, способен да прилага цвят с помощта на мастила Pantone. Delta-Sigma е мастиленоструен принтер с ограничена гама от цветове, но поради възможността за нанасяне на много малки точки (в сравнение с принтера за еленови рога), той произвежда повече нюанси поради различната плътност на точките на единица повърхност.

В едно изображение обикновено не виждаме отделни точки поради ниската разделителна способност на окото, а само средния тон. По същия начин ухото не чува импулси поотделно.

В крайна сметка, с настоящите технологии в импулсни DAC, е възможно да се получи вълна, близка до това, което теоретично трябва да се получи при приближаване на междинни координати.

Трябва да се отбележи, че след появата на делта-сигма DAC, уместността на рисуването на „цифрова вълна“ на стъпки изчезна, т.к. Ето как съвременните ЦАП не изграждат вълна на стъпки. Правилно е да се изгради дискретен сигнал с точки, свързани с гладка линия.

Идеални ли са смяната на ЦАП?

Но на практика не всичко е розово и има редица проблеми и ограничения.

защото Тъй като огромният брой записи се съхраняват в многобитов сигнал, преобразуването в импулсен сигнал с помощта на принципа "бит към бит" изисква ненужно висока носеща честота, която съвременните ЦАП не поддържат.

Основната функция на съвременните импулсни DAC е да преобразуват многобитов сигнал в еднобитов сигнал с относително ниска носеща честота с децимация на данните. По принцип именно тези алгоритми определят крайното качество на звука на импулсните DAC.

За да се намали проблемът с високата носеща честота, аудиопотокът се разделя на няколко еднобитови потока, където всеки поток отговаря за своя собствена битова група, която е еквивалентна на кратно на носещата честота на броя на потоците. Такива ЦАП се наричат ​​многобитови делта-сигма.

Днес импулсните ЦАП получиха втори вятър във високоскоростните чипове с общо предназначение в продуктите на NAD и Chord поради възможността за гъвкаво програмиране на алгоритми за преобразуване.

DSD формат

След широкото разпространение на делта-сигма ЦАП, съвсем логично беше появата на формат за запис на двоичен код директно в делта-сигма кодиране. Този формат се нарича DSD (Direct Stream Digital).

Форматът не беше широко използван поради няколко причини. Редактирането на файлове в този формат се оказа ненужно ограничено: не можете да смесвате потоци, да регулирате силата на звука или да прилагате еквалайзер. Това означава, че без загуба на качество можете да архивирате само аналогови записи и да създавате записи с два микрофона на изпълнения на живо без допълнителна обработка. С една дума, не можете наистина да печелите пари.

В борбата срещу пиратството дисковете във формат SA-CD не се поддържаха (и все още не се поддържат) от компютри, което прави невъзможно да се правят копия от тях. Няма копия – няма широка публика. Беше възможно да се възпроизвежда DSD аудио съдържание само от отделен SA-CD плейър от патентован диск. Ако за формата PCM има стандарт SPDIF за пренос на цифрови данни от източник към отделен ЦАП, то за формата DSD няма стандарт и първите пиратски копия на SA-CD дискове са дигитализирани от аналоговите изходи на SA- CD плейъри (въпреки че ситуацията изглежда глупава, но в действителност някои записи са издадени само на SA-CD или същият запис на Audio-CD е умишлено направен с лошо качество, за да се рекламира SA-CD).

Повратната точка настъпи с пускането на игровите конзоли SONY, където SA-CD дискът беше автоматично копиран на твърдия диск на конзолата преди възпроизвеждане. Феновете на DSD формата се възползваха от това. Появата на пиратски записи стимулира пазара да пусне отделни ЦАП за възпроизвеждане на DSD потоци. Повечето външни ЦАП с поддръжка на DSD днес поддържат USB трансфер на данни, използвайки DoP формата като отделно кодиране на цифровия сигнал през SPDIF.

Носещите честоти за DSD са сравнително малки, 2,8 и 5,6 MHz, но този аудио поток не изисква преобразуване на редукция на данни и е доста конкурентен на формати с висока разделителна способност като DVD-Audio.

Няма ясен отговор на въпроса кое е по-добро, DSP или PCM. Всичко зависи от качеството на изпълнение на конкретен DAC и таланта на звуковия инженер при запис на крайния файл.

Общо заключение

Аналоговият звук е това, което чуваме и възприемаме като света около нас с очите си. Цифровият звук е набор от координати, които описват звукова вълна и които не можем да чуем директно без преобразуване в аналогов сигнал.

Аналогов сигнал, записан директно върху аудиокасета или винил, не може да бъде презаписан без загуба на качество, докато вълна в цифрово представяне може да бъде копирана бит по бит.

Цифровите формати на запис са постоянен компромис между степента на точност на координатите спрямо размера на файла и всеки цифров сигнал е само приближение на оригиналния аналогов сигнал. Въпреки това, различните нива на технология за записване и възпроизвеждане на цифров сигнал и съхраняване на носител за аналогов сигнал дават повече предимства на цифровото представяне на сигнала, подобно на цифров фотоапарат спрямо филмов фотоапарат.