Vývoj záznamových zařízení XX - Digitální technologie: nástup jedničky a nuly

Vývoj záznamových zařízení XX - Digitální technologie: nástup jedničky a nuly
Vývoj záznamových zařízení XX - Digitální technologie: nástup jedničky a nuly

Pokud se dnes bavíme o zvukovém záznamu, v naprosté většině případů se jedná o signál navzorkovaný s frekvencí 44,1 kHz a 16bitovou kvantizační hloubkou a posléze komprimovaný některým ze ztrátových algoritmů. Hudba ve formě jedniček a nul uložená na digitálních médiích a pamětích počítačů, přehrávačů a telefonů. V jednom z posledních dílů série o zařízeních, na která po staletí ukládáme zvuk, si popíšeme principy digitalizace - tedy jak rozezvučit jedničky a nuly.

Způsobů vlastního ukládání dat je obrovské množství, ovšem ty nejrozšířenější v dnešní době představují magnetická úložiště, optická média a čistě elektrické polovodičové paměti (flash). Zvuková data bývají uložena v souborech různých typů a vlastností. Základními datovými formáty jsou nekomprimované soubory typu wav, aiff, au či raw založené na principu pulzně-kódové modulace (PCM viz dále).

 

Vzhledem k tomu, že tyto soubory zabírají skutečně hodně paměťového prostoru (například dvoukanálový stereo zvuk s parametry 44,1 kHz a 16 bitů představuje 1 411 200 bitů za sekundu), s rostoucím výkonem počítačů a „embedded“ zařízení se rozšířily komprimované formáty. Bezztrátovou komprimaci poskytují formáty FLAC, APE, WMA lossless či WavPack. Nedokonalostí lidského sluchu a přehrávacích aparatur naopak využívají ztrátové algoritmy, které ovšem také nabízejí mnohem větší datovou úsporu. S různou ztrátou kvality tak lze dnes použít soubory typu wma lossy, AAC, vorbis a zejména spotřebitelsky nejrozšířenější mp3.

Dobový terminál SIGSALY (1943)
Dobový terminál SIGSALY (1943)

Za širokou nabídkou formátů stojí zběsilý vývoj posledních zhruba patnácti let. Počátky digitalizace však spadají hluboko do minulého století, přesněji řečeno do roku 1937, kdy Alec Reeves objevil princip dodnes využívané pulzně-kódové modulace - PCM. První aplikací tohoto systému byl telefonní šifrovací systém Sigsaly z let 1943-1946. Prvního komerčního nasazení se PCM dočkala po vzniku integrovaných obvodů v podobě digitálního telefonního přenosu z roku 1962, kdy šířka přenášeného pásma 4000 Hz byla navzorkována dvojnásobnou frekvencí 8 kHz (o vzorkovacím teorému později).

 

A co se konkrétně pod zkratkou PCM skrývá? Jedná se o převod spojitého signálu na digitální (čili nespojitý - diskrétní) pomocí vzorkování a kvantování. Dle vzorkovací frekvence se jednou za krátký okamžik odečte amplituda signálu a uloží se její číselná hodnota. U CD kvality se toto provede 44 100krát za sekundu, tedy délka jednoho vzorku je cca 23 mikrosekund. S jakou přesností bude signál navzorkován záleží také na jemnosti rozlišení jednotlivých hodnot (kvant) - při 4bitovém kvantování se zaokrouhluje na 24, tedy 16 hodnot, zatímco při 16bitovém na 65 536 a při 24bitovém na 16 777 216.

 

První elektronické digitální médium bylo vytvořeno v roce 1939 Johnem Atanasoffem. Jednalo se o první počítač s bubnovým úložným prostorem (namísto děrných štítků), využívajícím kondenzátory na povrchu bubnu k dočasnému ukládání dat během zpracování. Jeden takový buben měl kapacitu třiceti 50bitových čísel, tedy 1500 bitů. V roce 1942 byl popsán magnetický buben. Tato technologie se poté rozvinula v digitální magnetický záznam na disky či pásky a sehrála tak klíčovou roli v historii digitálního audia.

Vzorkování a kvantování signálu 4bitovou pulzně-kódovou modulací
Vzorkování a kvantování signálu 4bitovou pulzně-kódovou modulací

Další zásadní milník připravil William Shockley vynálezem germaniového tranzistoru v roce 1947. Hromadná výroba se naplno rozjela až v průběhu padesátých let, kdy se o něco později objevil i první tranzistor z křemíku. Tím byla odstartována další éra elektrifikace domácností v podobě tranzistorových rádií a také rozvoj výpočetní techniky, jejíž řídicí čipy jsou dodnes složeny z milionů a miliard mikroskopických tranzistorů.

 

První digitální nahrávky jsou datovány rokem 1962, kdy Tom Stockham z amerického MIT (Massachusetts Institute of Technology) začal s použitím sálového počítače TX-0 a A/D-D/A převodníku na magnetickou pásku nahrávat digitální zvuková data. Ten samý vynálezce v roce 1975 postavil s použitím vysokorychlostního magnetofonu 16bitový rekordér pro svou firmu Soundstream, Inc. v Salt Lake City.

 

Digitalizace neminula ani oblast hudebních nástrojů. V roce 1963 byl představen první elektronický sampler Mellotron. Zvuky jednotlivých nástrojů pro každou notu (klávesu) byly nahrány na smyčkách magnetické pásky. Mellotron využili ve svých nahrávkách Beatles, Pink Floyd, Led Zeppelin či The Moody Blues. V roce 1968 vzniká první nahrávka s použitím tranzistorového syntezátoru. Wendy Carlos na něj nahrál album Switched-On Bach.

Bubnový disk
Bubnový disk

V roce 1969 vzniká - původně pro lékařské účely - první digitální delay, tedy signálová jednotka poskytující 100milisekundové zpoždění signálu. Firma American Data Sciences, později Lexicon, začala vyrábět digitální efektové procesory a prodávat je nahrávacím studiím.

 

Přelomový ročník 1971 datuje zrod prvního floppy disku, tedy magnetické diskety IBM o kapacitě 100 kB. Rovněž Intel začal vyrábět nejenom mikroprocesor řady 4004, ale také velké integrované obvody LSIC, používané v prvních komerčních zařízeních pro digitální audio. O pouhý rok později Phillips demonstroval systém optického videodisku s laserovou hlavou a 30cm skleněnou deskou jako datovým médiem.

 

Koneckonců celá sedmdesátá léta patřila digitálním novinkám. Stejně jako začaly jedničky a nuly pomalu ovlivňovat segment mixážních pultů a sound processingu, tak se zvyšoval jejich význam v oblasti záznamu zvuku. Vznikají první rotační pevné disky, jak je dnes známe (s kapacitou v desítkách MB), digitální syntezátory (Synclavier), herní konzole (Nintendo), osobní počítače (IBM, Apple) a první digitální nahrávky.

Replika prvního Shockleyho tranzistoru
Replika prvního Shockleyho tranzistoru

První spotřebitelské digitální audio přišlo překvapivě spolu s videorekordérem Sony Betamax (viz minulý díl) a jeho rozšířením o digitální hi-fi audio. Tato technologie byla představena v polovině roku 1978 a rozšíření zaznamenala zejména v průběhu 80. let. To už ale přichází na trh CD.

 

Compact disc standard firem Phillips/Sony byl finalizován v roce 1980 po více než desetiletém vývoji. Dvanácticentimetrový plastový disk, točící se rychlostí 200-500 otáček za minutu, využíval 16bitového kvantizačního kódování a vzorkovací frekvence 44 100 Hz. Maximální kapacita 74 minut stačila pro záznam Beethovenovy 9. symfonie. Masová výroba „cédéčka“ začala okolo roku 1984 a od té doby jsou jeho parametry standardem pro konzumní audio.

 

Základní vlastnosti digitálního zvuku byly popsány již v úvodu. Kvantizační rozsah, často také nazývaný bitová hloubka (doslovným překladem z angličtiny), determinuje „jemnost“ rozlišení velikosti amplitudy signálu. Má tedy přímý vliv na dynamický rozsah nahrávky a detailnost zaznamenaného zvuku.

Otevřený Mellotron M4000
Otevřený Mellotron M4000

Oproti tomu vzorkovací frekvence ovlivňuje zejména rozsah frekvenční - podle tzv. Nyquist-Shannonova teorému je nutné použít vzorkovací frekvenci alespoň dvojnásobnou, než je nejvyšší harmonická složka vzorkovaného signálu. Jinými slovy, při vzorkování 10 kHz je možno teoreticky zachytit maximálně 5kHz signál. Prakticky je ale takto navzorkovaný signál silně zkreslený, neboť namísto původního harmonického 5kHz signálu získáme obdélníkovou funkci o stejné frekvenci a obdélníkový signál jak známo obsahuje množství vyšších harmonických, které je posléze nutné na výstupu filtrovat dolnopropustním filtrem.

 

Takto nevhodným vzorkováním ztrácíme informaci o průběhu signálu a navíc se vystavujeme riziku aliasingu čili „překládání“ frekvencí. Příklad aliasingu můžete vidět na příslušné ilustraci: Červený vstupní signál byl navzorkován frekvencí menší než dvojnásobnou. Označené vzorkovací body tak „přeložily“ původní frekvenci do propustného pásma a výsledkem je zcela jiná, mnohem nižší frekvence než na vstupu.

Aliasing způsobený nevhodně zvolenou vzorkovací frekvencí
Aliasing způsobený nevhodně zvolenou vzorkovací frekvencí

Propustné pásmo při digitalizaci signálu je tedy v intervalu <0, Fs/2>, kde Fs je vzorkovací frekvence. Formálně správně je šířka pásma rozšířena o ekvivalentní záporné frekvence. Ty však lze vyjádřit jako frekvence kladné s opačnou fází, proto je výše uvedená definice postačující. Vzhledem k udávanému rozsahu lidského sluchu 20 Hz-20 kHz by byla teoreticky dostačující vzorkovací frekvence 40 kHz, nicméně praktický rozsah CD přehrávačů se pohybuje v rozmezí 2 Hz-21 kHz.

Psáno pro časopis Muzikus