Nebojte se funkcí v DAW - Co vše jde se zvukem ve světě nul a jedniček…
Převod z audio na MIDI 2/2
V minulém díle jsme se pustili do tématu převodu z formátu audio na MIDI. Nejpesimističnější odpovědí bylo, že tento převod možný není. Dnes se podíváme na optimističtější odpovědi na tuto otázku.
Odpověď druhá
Druhou odpověď jsem v podstatě již naznačil v té první. Pokud nám jde pouze o jednohlasý signál, určité možnosti tu jsou, i když nevedou ke storpocentnímu výsledku. Pokud se ale jedná o získání MIDI dat z polyfonního nástroje, je situace mnohem dramatičtější. Do hry vstupuje řada dalších matematických faktorů, které je pro analýzu zvuku třba vzít v potaz, a tak je takový převod z audia do MIDI ještě složitější (a to výrazně).
Jednou z variant, o kterých lze uvažovat, je již zmíněný Celemony Melodyne. Druhou variantou a poměrně novým hráčem na tomto poli, je Zynaptiq Pitchmap. Oba softwary se v ideálním případě snaží přesně o to, co by si ve výsledku uživatel, který se na úvodní otázku dotazoval, přál. Snaží se tedy skutečně z kompletní nahrávky vytvořit MIDI záznam, ideálně s jednotlivými oddělenými party, tedy de facto s rozpoznáním jednotlivých nástrojů, které pak vedou svoji linku.
Na jednu stranu je třeba realisticky přiznat, že výsledky se požadovanému výstupu přibližují jen velmi vzdáleně. Na druhou stranu je ale potřeba uznat, že výsledky jsou neuvěřitelně dobré na to, jak náročný daný úkol je. Lidský mozek si (pokud je trénovaný!) umí odfiltrovat ostatní nástroje a zaměřit se pouze na jediný, který pak poslouchá a analyzuje. Dělá to takto na základě zkušeností, procesu učení se a znalostí. Lidský mozek je schopen se naučit, jak přibližně zní kytara. Umí ji rozpoznat v hlubších i vysokých polohách. To samé je schopen udělat s ostatními nástroji, a to dokonce i s moderními zvuky, které žádný po staletí známý zvuk nepřipomínají. Software ale takové inteligence schopný není. Každý zvuk má v různých polohách různou barvu, a tak se nedá spolehat na obyčejnou analýzu vyšších harmonických frekvencí a jejich snadné přepočítávání. A to nemluvím o tzv. maskování zvuku, kdy se jedna frekvence nižší intenzity (hlasitosti) schovává za danou frekvenci intenzity vyšší (hlasitější), které algoritmy plete ještě více. Tento jev je ještě více patrný, pokud pro analýzu použijeme soubor ve formátu mp3 namísto nekomprimovaného souboru typu wav. Soubor mp3 využívá právě této nedokonalosti lidského mozku a právě maskované frekvence ze signálu eliminuje. Algoritmus pak prostě nemá šanci, jak frekvenci najít, jednoduše v signálu už není.
Pokud jsou navíc v nahrávce bicí, je třeba počítat s ještě nižší úspěšností. Tyto de facto ruchy (nedá se určit jejich přesná frekvence, nelze je tedy považovat za tóny) celou analýzu ještě zesložiťují, zamotávají a pletou. Právě kvůli tomu, že se nejedná o tóny, u nichž by bylo možné zjistit konkrétní frekvenci.
Z praktické zkušenosti vyplývá, že výše uvedené softwary lze použít v případě, kdy chceme analyzovat jeden polyfonní nástroj, tedy například hru na kytaru nebo klavír apod. Zde se úspěšnost analýzy zásadně zvyšuje právě díky tomu, že algoritmus není pleten dalšími nástroji a zvuky.
Odpověď třetí
Nu a na závěr se po strojích vracíme k člověku. Jak již bylo dříve naznačeno, nejspolehlivější a nejpřesnější analýzu zatím dokáže stále udělat člověk, a to zejména pokud je školený a umí potřebným stylem poslouchat. Jednak jsou tito lidé naučeni odfiltrovat určité zvuky a zaměřit se pouze na jeden zvuk, který pak v hlavě analzují (ideální je, když mají absolutní sluch, pak jim jde práce rychleji a jsou okamžitě schopni identifikovat jednotlivé tóny), ale obvykle také vycházejí i z naposlouchaných zkušeností. To znamená, že výsledek se nemusí vždy naprosto přesně shodovat s tím, co se v nahrávce skutečně hraje. Třeba doprovody na kytary jsou někdy jen „hodně podobné". Samozřejmě je výhodou, pokud člověk zná aranžerský styl autora hudby, protože je schopen předvídat jeho záměry a postupy. Ale ani lidský mozek s mnoha zkušenostmi prostě nemůže zaslechnout vše, proto se výsledek od originálu může lišit.
Nicméně v každém případě existují specialisté na tuto problematiku, kteří se živí (lepším nebo horším) převodem zvukových nahrávek do MIDI dat. Existují také obrovské knihovny těchto MIDI nahrávek, a to jak českých, tak zahraničních interpretů. V současnosti je výsledný MIDI soubor vytvořený šikovným jedincem - muzikantem - originálu mnohem blíž, než jak to dokáže jakýkoliv software.
Pak ale nastává jiný problém: „... ono to zní jako MIDI...“ Jak již víme, MIDI nezní! MIDI vysílá pouze informace o tom, která klávesa byla kdy stisknuta. Ale to už je zase úplně jiná kapitola.