Digitalizace zvuku II. - Odvrácená strana zvukové karty

Digitalizace zvuku II. - téma měsíce
Digitalizace zvuku II. - téma měsíce

Druhý díl navazuje na první část z listopadového čísla Muzikusu. Tam jsme popsali základní principy AD/DA převodníků. Pro jejich objasnění jsme využili analogie s filmem, kdy je pohyblivý děj snímán statickými obrázky. Promítáním pak, díky nedokonalosti zraku, navodíme vjem pohybu. Digitalizace zvuku pracuje stejně. V rychlém sledu ukládáme vzorky zvuku. Náš sluch je při poslechu vnímá jako souvislý zvuk - jako hudbu či jako plynulou řeč. Dále jsme ukázali základní typy převodníků a podívali se na zoubek pojmům jako maskování či převzorkování.

V tomto díle se budeme podrobně věnovat otázce, co se děje s již digitalizovaným zvukem. Tedy jak to vypadá uvnitř procesoru respektive DSP (digital signal processor). Podíváme se na parametry některých digitálních zařízení a popíšeme si další oblasti zpracování zvuku, ke kterým dochází za zády naší zvukovky.

Přejeme vám hezké čtení :-)

 

Historie

Oproti západním státům máme jednu „výhodu“. Nástup digitální techniky lze u nás s trochou nadsázky datovat na rok přesně: 1989. V osmdesátých letech tvořily základní kameny mašinky jako Sinclair, Atari, Sharp, Commodore či perly IQ 151 a PMD. Íkvéčko bylo legendární množstvím použité oceli, váze a značnému přehřívání. Kdo si ještě vzpomeneme na jeho neuvěřitelnou klávesnici či programovací jazyk Karel? Sinclair byl možná nejrozšířenější, ale pro muzikanta nepříliš ideální volbou. Jeho zvukový generátor byl jednohlasý a vyluzovaný tón nebezpečně připomínal monoskop. Atari nebo Commodore, to byla jiná káva. Vícehlasý generátor a šikovná sada instrukcí už dovolovaly různá kouzla. Navíc se dal sehnat rozumný hudební software. Po pádu železné opony se k nám dostaly standardní PC AT a XT. Ale i tak trvalo nějakou dobu, než je mohl průměrně movitý hudebník využívat pro komponování. Takže největší dík za umožnění práce s muzikou musíme objektivně přisoudit sympatickému Atari.

 

Západní kolegové to tak hezky datované nemají. Za otce počítačů je označován Američan John von Neumann, ale můžeme se setkat i s dalšími jmény, jako Alan Turing a další. Vše se datuje někam do čtyřicátých let dvacátého století. Jak zpívá Laura a její tygři: „Dvacátý století, století robotů“.

Areál IBM v roce 1960
Areál IBM v roce 1960

První počítače (computers), přesněji počítačky-kalkulačky, byly samozřejmě mechanické. Využívaly děrné štítky a byly určené výhradně k výpočtům (computing). Pár příhod o takových počítačkách značky Marchant se můžeme dočíst v knize Richarda Feynmenna To snad nemyslíte vážně. První elektronické computery byly elektronkové (srdce kytaristovo zplesá) a jejich rozměry byly obludné, nehledě na příšernou poruchovost. Prvním plně elektronickým počítačem byl ENIAC a mezi průkopníky-stavitele počítačů patří od začátku americká IBM.

 

Velkými milníky na cestě miniaturizace byl objev tranzistoru (1953) a následně operačního zesilovače. Let na měsíc v šedesátých letech byl silně podpořen výpočetní technikou. Sice odlišnou od té současné, nicméně plnící stejnou roli. Nemyslet, ale rychle a přesně dělat monotónní výpočty. No, uvidíme, jak to bude vypadat za pár let...

 

Základy využití počítačů pro muzikanty musíme hledat trochu jinde. Druhá světová válka nakopnula technický vývoj, akustika, radary a vše ostatní se posunulo o velký kus dopředu. Špičkou v oboru byla a dosud je dánská společnost Brüel & Kjchar4r (všimněte si, že Dánové mají i TC Electronic. Kdo ví, kde se to v nich bere...). Ta v roce 1977 uvedla na trh úplně první plně digitální frekvenční analyzér, Typ 2131. Proč ho zde zmiňujeme? Protože přístroj převáděl zvuk na čísla - už tenkrát! Čili obsahoval převodníky, vzorkování atd. Vlastní analýza běžela nad digitalizovaným zvukem.

 

Na začátku osmdesátých let následovaly další digitální systémy pro měření hluku a vibrací. Dobře si vzpomínám na některá cvičení z Akustiky, která jsme prováděli se stařičkým analyzérem Brüel & Kjær z osmdesátých let. Rozměry měl jako 2U rack a byla to plně digitální mašinka s přibližně třísekundovou pamětí. Díky tomu s ním bylo možné provádět některá kouzla, jako třeba nekonečné opakování zvukové smyčky, tak jak je nyní známe ze světa samplerů a počítačů. V roce 1995 to pro nás bylo naprosté sci-fi.

 

K obyčejným muzikantům-smrtelníkům si počítač našel nejprve využití díky MIDI. Malá náročnost datového toku umožnila zaznamenávat a přehrávat hudbu na více MIDI stopách. Klávesáci proto patřili po dlouhou dobu mezi šlechtu, která jediná věděla, k čemu to celé je. A občas i o co jde. Jistě pamatujete na články Daniela Forró. Ten udělal zásadní kus práce na poli vzdělávání nevděčného národa muzikantského. Nechť je mu v Japonsku dobře! Někdy běžely v Muzikusu i dvě Danielovy rubriky věnující se MIDI současně! I když, upřímně, tenkrát jim moc lidí nerozumělo a jejich význam byl rozpoznán až po „několika staletích“ (Jedna ruka netleská :-). Jednou z mála zmínek o MIDI a kytaře bylo možné najít v Muzikusu 1991/1, kde Michal Pavlíček popisoval práci na scénické hudbě, případně v jeho dřívějších zmínkách o natáčení alba Stromboli a Černého světla. Tam bylo semínko kytaristova poznání, že celé to začíná někde u snímače Roland GK-2 a dále pokračuje k syntezátoru GR-50 a zvukovým modulům.

 

V polovině devadesátých let měla ve zvukovkách dominantní postavení firma Creative Labs. Sound Blaster a jeho klony byly téměř všude. Přesto se i u nás sem tam dařilo prosazovat alternativním značkám, které byly k muzikantům daleko vstřícnější. Určitě si vzpomenete na plážovou želvu Turttle Beach a jejich typy Tropez Plus, Maui, Monterey... Hodně rád vzpomínám na TBS 2000, protože právě tu mi koupil tatínek :-).

Inzerce na přelomový software, nahrávání až čtyř stop najednou
Inzerce na přelomový software, nahrávání až čtyř stop najednou

V roce 1995 vyšel první speciál časopisu Chip s CD přílohou u nás. To byla do té doby věc nevídaná. Vždyť prázdné kolečko stálo pět set korun! Číslo bylo věnované právě hudbě na PC a objevil se v něm i jeden z prvních inzerátů na relativně dostupný SW umožňující nahrávat čtyři audiostopy současně. To si pište, že abyste jej mohli provozovat, Sound Blaster moc k užitku nebyl. Cubase postupně přecházel z Atari na platformu PC. Následoval vývoj dalších DAW aplikací, Cakewalk, Pro Tools atd. Objevují se další a další výrobci zvukových karet a hotových řešení.

 

V posledních letech přibývá velké množství virtuálních nástrojů, muziku jde dělat s přehledem i s tou nejlevnější externí kartou. Její technické parametry stačí bez problémů na domácí demáče i pracovní záznam. Dominance Apple v produkčních studiích už není tak zřejmá, klasické PC, nadopované různými DSP, se zase o kousek přiblížilo jeho parametrům.

 

Budoucnost tedy leží asi někde v notebooku s virtuálními nástroji a nejnovější verzí oblíbeného DAW. I přes všechny výhrady k pochybnému hudebnímu vzdělání a talentu různých „composerů“ a DJ’s, kteří by bez PC nevyloudili ani Pec nám spadla, je to ještě pořád kreativní činnost. A bude asi až do té doby, než při návštěvě Tróje uvidíme šimpanze s novou verzí Traktoru od Native Instrument. V tu chvíli asi bude ten pravý čas zastavit evoluci a vrátit se ke kořenům.

Zvukový modul ovládaný klaviaturou
Zvukový modul ovládaný klaviaturou

Zpracování digitalizovaného zvuku

V prvním díle tohoto Tématu měsíce jsme se zabývali převodem zvuku do digitální formy. Ukázali jsme praktickou realizaci převodníků AD/DA. Zabývali jsme se odstupem signál-šum, vznikem kvantizační chyby, převzorkováním atd. Tedy věcmi, které se dějí proto, abychom dostali digitalizovaný signál.

 

Nyní je konečně čas se podívat trochu detailněji, co se děje se zvukem, když je převeden na nuly a jedničky.

 

Když to zjednodušíme, můžeme předpokládat, že zpracování zvuku lze provádět:

a)prostředky počítače, tedy na standardním PC

b)využitím DSP, speciálním procesorem, optimalizovaným pro zpracování zvuku

 

Architektura počítače je univerzální, ale to v některých případech může muzikanta limitovat. Poznáme to ve chvílích, kdy chceme mít spuštěno například velké množství virtuálních efektů či VST instrumentů v reálném čase. Počítač už zkrátka nestačí plnit naše požadavky. Omezením bývá výpočetní výkon procesoru, propustnost sběrnic mezi procesorem a pamětmi atd.

Na rozdíl od něj je DSP konstruován tak, aby uměl velmi rychle provádět výpočty obvyklé při zpracování zvuku a aby také zvládl rychle přistupovat k datům. Umí toho tedy méně než PC a není tak všestranný. Ale to málo co dělá, zvládá lépe.

 

Basic Stones

Než se pustíme do podrobnějšího popisu, podíváme se na základní kameny každého „počítacího stroje“. Jsou to:

·paměť, kde se uchovávají data

·paměť, kde se uchovává program

·periférie

·sběrnice

·procesor

 

Jako jednoduchý příklad můžeme vzít třeba zvukový modul, viz obrázek 1. Budeme předpokládat, že je jednohlasý a že v jeho paměti dat jsou uloženy zvukové vzorky piana. Ve druhé paměti je uložen program, který říká, co má modul dělat, je-li stisknuta klávesa. Perifériemi jsou v našem případě klávesnice (připojená přes MIDI), displej modulu a výstup do zesilovače. Procesor je srdcem celého modulu a vykonává uložený program. Sběrnice pak slouží pro jejich vzájemné propojení.

 

Řekněme, že je stisknuta klávesa C. Procesor si přečte část programu odpovídající této události a zjistí, že má vzít příslušný vzorek (třeba číslo 67). Dále jej má poslat na výstup do zesilovače. Pohoda.

 

Jiné to bude, pokud je stisknuto více kláves najednou. Procesor si v našem programu přečte, že má nechat znít pouze první stisknutou klávesu, tedy vzorek 67. Ale program také může být napsán tak, že se má modul umlčet a neznít vůbec.

Digitalizace zvuku II. - téma měsíce
Digitalizace zvuku II. - téma měsíce

Z výše uvedeného je patrné, že by bylo fajn, kdyby datová paměť byla přepisovatelná. Díky tomu bychom mohli v budoucnu nahrát místo vzorků piana třeba hammondky nebo saxofon. Čili klasický sampler. Ale i paměť na program by mohla být přepisovatelná, abych mohl v budoucnu „apgrejdovat“ na novou verzi. Jako to známe třeba od výrobců Line 6 nebo Nord.

 

Taktování

Nejen „krovkáři“ si musí hlídat takty a čas, kdy nastoupit. Stejně tak „počítací stroje“ musí všechno dělat synchronizovaně. Z praxe víme, že při záznamu zvuku či obrazu do více přístrojů je nutné vyřešit jejich vzájemnou synchronizaci. K tomu slouží standardy jako SMPTE apod. Jedině tak lze při výsledném mixu spojit jejich výstupy dohromady. Problém špatně synchronizovaného playbacku známe třeba ze „socreal“ estrád typu Ein Kessel Buntes.

 

Elektronické mašinky musí pracovat stejně, protože je nutné synchronizovat velké množství nezávislých komponent. V přístroji tikají vnitřní hodiny. Jejich impulz se přivádí na zařízení, která mají být „taktovány“. To se týká zejména pamětí a procesoru. Uvnitř pak všechno funguje jako v motoru. Co takt, to jeden úkon. Jakmile přijde signál z hodin, paměť uloží číslo. Procesor provede výpočet nebo „nasaje“ čekající data. Po skončení těchto operací se v počítači vše zastaví a čeká se na další impulz z hodin.

 

Když se nad tím člověk zamyslí, vypadá to jako zrychlený záběr ze světelné křižovatky někde v New Yorku, z kultovního filmu Baraka. Obrovské množství chodců a aut se na okamžik dá do pohybu, přičemž po chvíli ustrnou, aby přenechali pohyb druhé půlce křižovatky. Velmi sugestivní představa :-)

 

Přesně tohle říkají gigahertzy ve specifikaci procesorů, pamětí, grafických karet, sběrnic atd. Každá z těchto součástek má vlastní rychlost, přičemž výměna dat je synchronizována sběrnicí. A vše se podřizuje procesoru.

 

Nicméně jako na horách, i zde často platí, že výsledná rychlost systému je dána rychlostí toho nejpomalejšího účastníka. Proto počítač s rychlým procesorem ještě nemusí nutně znamenat výhru, pokud je osazen pomalou pamětí.

 

Architektura

Podstatný rozdíl mezi DPS a „obyčejným“ mikroprocesorem je v jejich architektuře. DSP mají oddělené paměti jak pro data, tak pro instrukce (program). To se označuje jako Harvardská architektura. Obecné procesory bývají postaveny na vonneumannovské architektuře, tedy mají společný prostor pro data i instrukce.

 

O co vlastně jde? Pokud jsou paměti oddělené, umožní to nezávisle číst a zapisovat do každé z nich. Pracuje se s nimi paralelně a tím lze za

kratší čas zvládnout větší objem práce. Nárůst výkonu se projeví zejména u složitějších operací, jako je násobení či dělení.Pokud je paměť společná (vonneumannovský typ), je možnost paralelní práce omezená. Jednoduché operace, jako je sčítání či odčítání, běží rychle, ale složitější už jsou znatelně pomalejší.

 

Možná se to na první pohled nezdá, ale dosažený rozdíl ve výkonu je hodně znát. A všimněte si, že neříkáme, že procesory harvardského typu nutně pracují rychleji. Paradoxně totiž může i systém s pomaleji taktovaným procesorem zpracovat více úkolů než vonneumannovský procesor s vyšší rychlostí.

Blokové schema DSP
Blokové schema DSP

Pod pokličkou DSP

Jako vzor DSP pro popis vnitřního uspořádání jsme vzali kousek od Texas Instrument, řady TMS320xxx. Na obrázku 2 je jeho zjednodušené blokové schéma.

 

Vysoké rychlosti je dosaženo oddělením pamětí pro data a instrukce a také díky osmi nezávislým sběrnicím. Dvě z nich slouží pro přístup do paměti programu, šest pro čtení a zápis do datové paměti. Procesor tak dosahuje vysokého stupně paralelismu. V jednom taktu lze provést současně více operací, například dvě čtení a dva zápisy.

 

Aritmeticko logická jednotka (ALU) je srdcem celého DSP a má 40 bitů. Provádí veškeré operace, jak, aritmetické tak logické. Násobička/sčítačka umí přesně a jenom to, co říká její název a odlehčuje ALU, pokud je toho na něj moc. Posuvný registr se stará o přísun a odsun čísel z/do ALU i násobičky.

 

Jak takový DSP pracuje? Představme si, že chceme přidat do nahrávky echo. Řekněme, že zpoždění bude 1 sekunda a mix 50 %. Není nic jednoduššího! Stačí k výstupu přičítat zeslabený signál, zpožděný o jednu vteřinu. Protože zvuk máme zakódovaný v číslech, bude to celé jenom o sčítání a dělení.

 

Jdeme na to. Na vstupu DSP je zvuk vzorkován AD převodníkem (je převeden na čísla). Vzorky jsou směřovány zpět na výstup, tedy DA převodník a audio out. Zároveň je ale ukládáme do paměti. Proces trvá jednu vteřinu. Jakmile tato doba uplyne, vyndám z paměti nejstarší vzorek (přečtu číslo), zeslabím jej na polovinu (vydělím dvěma) a pošlu na vstup (přičtu k výstupnímu signálu). Protože se v paměti uvolnila jedna pozice, vzorky se posunou o jedno místo dopředu. Vzniká tak místo pro příchozí data. A tak pořád dokola.

 

Celý proces si nyní rozebereme s využitím obrázku blokového schématu DSP. Do datové paměti jsou přes sběrnici ukládány vzorky zvuku přicházející z AD. Z ní je v každém taktu čten posuvným registrem vzorek starý právě jednu vteřinu a je poslán na vstup ALU. Zde dojde k jeho zeslabení, tedy vydělením dvěma. V dalším kroku posuvný registr vyzvedne zeslabený vzorek na výstupu ALU a znovu jej předá na vstup. Spolu s ním jde do ALU vzorek aktuálního vstupního signálu. Obě čísla jsou sečtena. Výsledný vzorek je posuvným registrem poslán do DA převodníku a dílo jest dokonáno. Základním principem, na kterém je vybudován svět počítačů, je poslání jednoho nebo více čísel do ALU a provedení žádané operace. Vše, co počítače umí, je založeno na rozpadu jednotlivých úkonů na milióny těchto triviálních operací. To je podstata činnosti procesoru.

 

V našem případě umí ALU na vstupu přijmout dvě šestnástibitová čísla. Jeho vnitřní struktura je 40 bitů. Na výstupu z ALU opět dostaneme dvě šestnáctibitová čísla. Musíme si uvědomit, že 40 bitů zde není přepych, ale nutnost - čísla se mezi sebou totiž nejen sčítají, ale i násobí. Pak rázem vychází mnohem vyšší čísla, než jsou původní.

 

Přetečení

Tím se dostáváme k závěru kapitoly o DSP. Jedním z hlavních problémů, se kterým se procesory potýkají, je totiž to, že výsledek operace může být větší, než je kapacita výstupu ALU. Vezměme vzorek „1111111111111111“. Nebudeme vás napínat, je to šestnáct jedniček, dekadicky 65536. Přičteme k němu to nejmenší možné (přirozené) číslo - „1“ (třeba přidáváme slabé echo). Nyní u šestnáctibitové zvukové karty tvrdě narážíme na její technické meze. Co s tím? Co má být na výstupu? Taková situace se nazývá přetečením - došlo k překročení povoleného rozsahu čísla, k přetečení ALU.

 

Asi se to nezdá, ale k přetečení dochází poměrně často. Proto je každý procesor vybaven propracovaným systémem hlídání, které tyto stavy ošetřuje. To je zajištěno zvlášť určenými bity, které mají za cíl tyto situace vyřešit a korigovat výstupní čísla tak, aby jejich význam dával smysl. Jsou tu různé příznaky přetečení, SXM (sign extension mode), OVM (overflow mode), ochranné bity ALU atd. Ty slouží ke korekci takto vzniklých chyb a jejich princip může být někdy řádně komplikovaný. Rozuměj zamotaný :-)

 

Co s tím vším?

Ted se vrátíme z vnitřku DPS zpátky na zem a podíváme se, co se vlastně dá s digitalizovaným zvukem dělat. Základní seznam bude znít:

·analýza

·efektování

·ukládání

·komprese

·přehrávání

 

Analýza zvuku

Analýzou se snažíme získat takové parametry, které nám pomohou co nejlépe provést žádanou operaci. Nic moc srozumitelného? Tato obecně formulovaná věta prostě znamená, že pokud chci třeba převést písničku do mp3, musím nejprve zkoumat její parametry.

 

Proč je nutné zvuk analyzovat? Analogová zařízení pracující v reálném čase mají většinou pevně nastavený algoritmus. Ten aplikují na průchozí signál bez ohledu na jeho parametry. Pokud mám klasickou krabičku na zem chorus CH-1, tak se přidává echo bez ohledu na to, zda do něj přivádím kytaru či zpěv. Naopak u drahých multiefektů se přímo nabízí nejprve vstupní signál analyzovat a teprve pak zvolit nejvhodnější algoritmus. Vše samozřejmě v reálném čase.

 

Analýza tedy slouží jako řídicí člen pro zpracování signálu. Získané parametry mění - obrazně řečeno - nastavení efektů, aby byl jejich výsledný účinek co nejúčinnější. Kroutí pomyslnými knoflíky virtuálních FX, aby to hrálo co nejlépe.

 

Jasnou dominanci má Fourierova transformace (FT, viz sloupek). Ta se obecně nazývá analýzou v kmitočtově-časové oblasti, kam patří třeba i waveletová transformace (někdy též vlnková). Výstupem FT jsou parametry vypovídající o frekvenčních složkách zvuku, tedy spektru. Nejjednodušší zařízení, které jí využívá, je asi ladička. Ale stejně tak je FT zásadní téměř všude, od pitch shifteru po whammy pedál. Vlnková transformace se využívá například pro oddělení užitečného signálu od šumu. Jako další příklady analýzy zvuku zmíníme například konvoluci a dekonvoluci signálů, Wiegnerovi distribuci, či komplexní charakteristiky spektra. Jejich využití je opět velmi rozmanité, od porovnávání signálů po návrhy a analýzu filtrů.

 

Velmi složitou oblastí je počítačové rozpoznávání řeči. Ta patří mezi nejnáročnější úlohy vůbec. Každý mluvíme s jinou kadencí, s rozdílnou úrovní hlasitosti, máme jinak položený hlas, odlišujeme se výslovností, do projevu silně zasahují emoce atd. Při jejím zpracování se kromě FT využívá i kepstrální analýza, fonetická analýza či vektorová kvantizace. Ale i přes tak důkladné pitvání zvuku to ještě není ono. Holt náš sluch, respektive oblast mozku zpracovávající lidskou řeč, má pořád obrovský náskok před technikou. Tahounem zpracování řeči v ČR je Katedra kybernetiky na Fakultě aplikovaných věd Západočeské university.

 

Důkladná analýza zvuku předchází téměř všemu, co s jedničkami a nulami děláme - kompresi do mp3, detekci výšky tónu v syntezátoru, vokodéru a veškerému složitějšímu efektování. Samostatnou kapitolou praktického využití analýzy zvuku je pro nás simulace. Zjednodušeně to funguje tak, že výrobce změří všechny možné parametry vzorového nástroje (třeba Marshall JCM900). Data jsou převedena do matematických rovnic a uložena do tabulek. Zde je podstatné si uvědomit, že nevytvářím něco statického, ale připravím „živý organismus“, který se, v závislosti na vstupu, chová pokaždé jinak. Reaguje na dynamiku, na úroveň vstupního signálu, na šíři jeho spektra atd. V tom je zásadní rozdíl nové generace simulací započatých společností Line 6 oproti dřívějším snahám o napodobení zvuku význačných nástrojů a aparátů. Nově vzniklý nástroj aplikuje na zvuk to, co změřil u originálu.

 

Není vždy nutné provést co nejvíce analýz, ale spíše vybrat ty správné, které dovedou podchytit vše podstatné. Čili jednoznačně kvalita před kvantitou. Ale nejde jen o muziku. Telekomunikace, lékařství, aktivní potlačení hluku, radary, meteorologie, seizmologie či tajné služby - tady všude se analyzují signály.

 

Nicméně, hudba především, přátelé!

 

Efektování

Další činností, prováděnou s digitalizovaným zvukem, je jeho efektování virtuálními efekty. Většinou je možné je provozovat jako samostatné aplikace (stand alone), nebo jako instumenty VTS, RTAS, DXi2, ReWire atd. Asi nejvýznamnější je filtrace signálu. Tedy dolní, horní a pásmová propust. Patří mezí základní a asi nejdůležitější efekty vůbec. Mimochodem, hodně efektů je založeno právě na filtru a sčítacím článku, případně v kombinaci s delayem.

 

Konstrukce virtuálního filtru, stejně jako reálného, je poměrně složitá. Při jeho návrhu je nutné počítat rezidua funkce a další ošemetnosti. Ale k dispozici máme velmi rozsáhlé knihovny různých filtračních algoritmů, jak v Matlabu, tak v „Céčku“. Takže si stačí jenom vybrat.

 

Číslicové filtry lze dělit podle impulzní odezvy. Filtry s nekonečnou impulzní odezvou se značí IIR (infinite impulse response) s konečnou odezvou pak FIR (finite impulse response). IIR známe z reálného světa a jejich návrh na počítači je obdobný jako při konstrukci skutečných filtrů. Základní typy využívají Butterwothovu, eliptickou, Čebyševovu a inverzní Čebyševovu aproximaci. Digitální realizace funguje jako simulace reálného filtru.

 

Oproti tomu FIR v reálu neexistují a jsou výsadou virtuálního světa. Jejich velkou výhodou je dosažení stejného skupinového zpoždění, tedy lineární fáze v celém kmitočtovém pásmu. Znamená to, že všechny frekvence se na výstup dostanou se stejným zpožděním. Věc, která je s reálnými součástkami nedosažitelná. Další velkou výhodou FIR je snadná implementace a také stabilita filtru.

 

Ukládání

Skladování virtuálních čísel je velmi elegantní a jednoduchá záležitost. Zejména v porovnání s analogem (pásky, cédéčka, desky atd.). Rychlost průměrného harddisku zvládne bez potíží obsloužit několik stop záznamu v reálném čase. V tabulce vidíme datové toky jak záznamových médií, tak formátů záznamu. Snadno si spočítáme, že v ideálním případě by mělo být možné ukládat na disk SATA v reálném čase až dva tisíce stop najednou (300 MB děleno 150 kB). Ve skutečnosti tomu tak není, protože operační systém a ostatní SW vyžaduje poměrně velkou část datového toku. A dále jsme omezeni fyzickým počtem AD/DA převodníků. Přesto je zřejmé, že kapacita záznamu je úžasná. Konec konců třeba Cubase 4 už v technické specifikaci uvádí neomezený počet audio stop pro simultánní nahrávání a přehrávání. Kde jsou ty časy, kdy Turtle Beach anoncoval revoluční software Quad Studio s kapacitou čtyř simultánních stereo stop (no, psal se rok 1995, takže tak dávno to zase není...).

Deset číselných vzorků zabírá deset bajtů
Deset číselných vzorků zabírá deset bajtů

Komprese

Význam a způsob užití komprese je jasný: Umístit na co nejmenší plochu co nejvíce dat. Když jedu na túru, můžu si vybrat, zda věci do baťohu naházím nebo poskládám. Složená bunda zabere méně místa, protože lépe využívá prostor.

 

Komprese dat většinou využívá více způsobů najednou. Tím primárním bývá šikovný matematický algoritmus. Principiálně dělá to samé co šifrování. Základní data, tedy soubor čísel, postupně přepočítává komprimačním algoritmem. Výsledkem je balík, který zabírá menší objem. Pro jeho převedení na původní data je opět nutné jeho přepočítání, protože bez zpětného převodu je nečitelný. Jak se to dělá? Řekněme, že chceme uložit deset čísel 1, 3, 3, 12, 31, 20, 23,122, 202 a 212 do paměti, ve které má každá paměťová buňka rozsah 0-255, tedy jeden bajt (byte). Při klasickém způsobu uložení tato data obsadí deset bajtů. Všimněme si ale, že prvních sedm čísel je velmi malých. Co jich dát do jednoho bajtu více najednou? Na obrázku 3 a 4 je takový postupukázán. Prostě jenom skládáme kalhoty :-)

 

Dalším krokem, nevyhnutelným pro kvalitní kompresi, je analýza dat. Jako příklad vezměme mp3. Základním kamenem její úspěšnosti je využití maskování (viz první díl). Díky znalostem chování lidského sluchu dovedeme určit, která složka záznamu už nebude vnímána. Ta je ze záznamu bez milosti vyjmuta a jede se dál. Ale analýza se provádí i při klasické kompresi typu ARJ apod. Soubor dat je zkoumán z pohledu, jaký algoritmus bude nejefektivnější. Přitom zde k žádnému vypuštění dat při kompresí nedochází.

 

Je tedy zřejmé, že komprimujeme bud ztrátově, nebo bezeztrátově. Ztrátové jsou třeba jpg, mpeg4, mp3, ogg, acc, avi, mpg. Bezeztrátové zip, arj, rar, lha, uc2 atd.

 

Výhodou je, pokud lze kompresi provádět v reálném čase. A to všechny multimediální komprimační algoritmu samozřejmě dovedou. Je asi zbytečné uvádět, že takový postup lze uplatnit pouze na datech, která ještě nejsou optimalizována. Třeba dokument ve Wordu či excelovskou tabulku. Zkuste ale komprimovat obrázek jpg. Nezískáte téměř nic, protože to už za vás udělal foťák!

Blokové schema mp3 přehrávače s využitím DSP řady TSP, zdroj: Texas Instruments
Blokové schema mp3 přehrávače s využitím DSP řady TSP, zdroj: Texas Instruments

Přehrávání

Přehrávání, respektive čtení, záznamu je oproti analogu opět bezkonkurenční. Při opakovaném přehrávání nedochází k žádné degradaci původního signálu. Vzpomeňme třeba na vyprávění Bryana Maye o natáčení Bohemian Rapsody, kdy pásky byly vydřené téměř na kost. Technické omezení analogu je hodně limitující. Ale na druhou stranu to znamenalo, že muzikanti museli přijít do studia podstatně lépe připraveni. Nebo prošoupali pásek a muselo se začít znova ;-) Díky počítači můžeme spoléhat na nekonečné množství střihů, slepování, oprav a tak dále. Nahrávání se pak může změnit spíše na skládání nahraných fragmentů (Lego). Nejdůležitější feeling se tak do písničky nedostává z kytaristovy duše, ale ze zvukařovy myši. Jiní muzikanti vidí v digitální technice významného pomocníka pro vlastní kreativitu. Jejím vedlejším efektem je podle nich umožnění vytváření hudby i lidem bez hudebního vzdělání. Oba tábory mají jistě pravdu. Ale konečně, od toho jsou tu minirozhovory, aby poskytly pohled na věc i z jiného úhlu!

 

Závěr

I když víme, jak to pracuje a co to dělá, pořád ještě neznáme odpověď na základní otázky: Proč někomu zní digitální zvuk chladně? Je analogový lepší než digitální? Schválně jsme se těmto otázkám vyhnuli, protože jsou těžko uchopitelné, velmi individuální a vydaly by na samostatné téma (minimálně...).

 

Rádi bychom ale zmínili tři fenomény digitální techniky. Tím prvním je vizualizace zvuku. Bereme to jako samozřejmou věc a už nad tím nepřemýšlíme, ale zkuste se vrátit zpátky do analogových dob. Když se nahrávalo, svítilo pár budíků a kontrolka z režie. Dnes jsou naše oči upřené na krásně zpracovanou obrazovku programu, kde se to všechno tak hezky vlní a problikává. Chtě nechtě je sluch rázem na druhé koleji, protože prioritou číslo jedna našeho vnímání je zrak. Tato zásadní věc není z mojí hlavy, ale upozornil mě na ní Andrej Šeban. V minulém minirozhovoru se toho dotknul i David Kollar. Zkuste si někdy při nahrávání zakrýt monitor, a uvidíte ten rozdíl. Uslyšíte to jinak. Možná to bude plastičtější, detailnější, možná plné chyb :-)

 

Dalším fenoménem je „virtuálnost“. Nahrávka kapely už není hmatatelná věc, ale pouhý adresář s mp3 soubory. Ztráta LP desek možná není to poslední, o co přijdeme. Jsou na řadě i CD? Nebo přijde něco jiného?

 

A do třetice bychom se chtěli dotknout proměny „kultury poslechu“. To samozřejmě není dáno jenom digitalizací, ale i tempem doby. Přesněji nás samotných, jak moc jsme uspěchaní. Muziku posloucháme v autě nebo v MHD se sluchátky na uších. V obchodě či z rádia to do nás pumpují, ale skutečný poslech to rozhodně není. Představa, že si doma v klidu sednu a pustím HUDBU, zní jako z jiného světa. Takže zaplať pánbůh za živé hraní. To naštěstí zůstalo. Doufejme, že jeho neopakovatelnost a atmosféra bude pořád něco zásadního. Něco, proč bude stát za to se muzice věnovat.

 

Převod muziky na nuly a jedničky je s námi spoustu let. Pokusili jsme se popsat principy digitální techniky, jejíž chladné spínače mačkáme ve studiu. Asi je jedno, jestli hudebník či hudebnice vědí, jak to funguje. Na jejich umělecký výkon to nemá vliv. Na druhou stranu se domníváme, že určitá představa může vést k jakémusi uvolnění a získání nadhledu při používání digitálních hračiček vůbec. Někdy to totiž bereme moc vážně. Anebo spoléháme, že je to všelék. A právě určitý nadhled nám rozváže ruce a pomůže popustit uzdu fantazii, minimálně v intimních podmínkách natáčení.

 

Takže, máte už vaší muziku v nulách a jedničkách? Víte už, co se se zvukem děje, když prochází DSP? Víte, k čemu je ALU a jakou propustnost má eSATA? Ano? Tak to je dobře... Ted už jen vyhrnout rukávy a uchopit nástroj. Takto teoreticky vybavení se v digitálním světě nemůžeme ztratit.

 

Použitá literatura

Při psaní jsme se opírali o texty z vydavatelství ČVUT Praha, Ph.D.. Thesis ČVUT, MFF UK Praha a VUT Brno. Některé informace jsme čerpali z wikipedia.org, případně české wikipedie, která je ale značně neúplná. Pro seznámení s tématem určitě doporučíme skripta Zpracování signálu, F. Kadlec, Úvod do číslicového zpracování signálů, J. Uhlíř, P. Sovka, R. Čmejla nebo Implementace algoritmů číslicového zpracování signálů, V. Davídek. A samozřejmě Muzikus :-)

Psáno pro časopis Muzikus