Radion lähetyssignaalin prosessointi

Vain harvat äänitysammattilaiset tietävät, miten radioasemat käsittelevät lähetyssignaalia ennen kuin se lähtee FM-aalloille. Tämän artikkelin tarkoituksenna on perehtyä aiheeeseen ja avata silmiä.

Jokainen radioasema käyttää lähettimen edellä lähetysaudioprosessoria. Prosessorin tärkein toiminto on pitää lähettimen deviaatio asemalle määritellyissä rajoissa. Kuitenkin vain harvat asemat käyttävät tähän tarkoitukseen pelkkää yksinkertaista peak limitteriä. Sen sijaan käytetään monimutkaisempia audioketjuja, joilla hillitään tehokkaasti piikkimodulaatiota, mutta myös pienennetään merkittävästi musiikin piikkiteho/keskimääräinen teho -suhdetta. Näin asema saadaan kuulostamaan äänekkäämmältä sallittua deviaatiota ylittämättä.

Roskaa sisään — Roskaa ulos

Valmistajat ovat virittäneet lähetysprosessorit puhtaalle, dynaamiselle ohjelmamateriaalille, jota äänitysteollisuus on julkaissut koko historiansa aikana. (Ainoa merkittävä poikkeus on 45 1/min singlet, jotka on usein ylisäröytettyjä.) Koska prosessoreiden on käsiteltävä puhetta, mainoksia ja ikivihreitä nykypäivän materiaalin lisäksi, niin niitä ei voida säätää yksinomaan ”ylikompressoitujen”, särölle masteroitujen CD:iden prosessoimiseen.

20 vuoden ajan lähetyprosessorien suunnittelijat ovat tienneet, että kovaäänisimmän ja eniten ’punchia’ sisältävän lopputuloksen voi saada aikaan vain äärimmäisen puhtaasta lähdemateriaalista. Orban on julkaissut 20 vuotta ohjeita radioasemille signaalipolkujen puhdistamiseksi: pienikin signaalin yliajaminen ennen prosessoria aiheuttaa pientä äänenlaadun heikkenemistä, jota prosessori usein korostaa voimakkaasti. Ohjeet suosittavat riittävää amplitudivaraa ja matalasäröistä vahvistusta signaalin leikkautumisen estämiseksi, vaikka käyttäjä ajaisi mittarit punaiselle.

90-luvulla radioasemille tulevat CD:t oli esisäröytetty jo masterointivaiheessa äänenvoimakkuuden lisäämiseksi. Ensimmäistä kertaa alettiin huomata säännöllisesti tapahtuvaa suurta leikkautumista tuotantoprosessissa. Lähetysprosessorit reagoivat esisäröytettyihin CD:ihin täsmälleen samalla tavalla kuin ne ovat reagoineet jo yli 20 vuoden ajan vahingossa leikkautuneeseen materiaaliin – ne korostavat säröytymistä voimakkaasti. Vaihekierron takia lähdesignaalin leikkautuminen ei koskaan lisää ”on air” -voimakkuutta – se vain lisää grungea. Tämän artikkelin kirjoittajat ymmärtävät syyn olevan takana oleva äänitteiden äänenvoimakkuussodan. Aivan kuten (paikallis)radioasemat haluavat lähettää voimakkainta signaalia, niin samalla tavalla bändit, tuottajat ja jopa jotkut levy-yhtiöt haluavat tuotteen, joka ei jää äänenvoimakkuudessa toiseksi CD-jukeboksissa tai musiikkikaupan kuuntelupisteessä.

Radiolähetysissä sota on kestänyt jo yli 25 vuotta. Tuolloin radioasemat käyttivät yksinkertasista leikkausta äänenvoimakkuuden kasvattamiseksi, ja nyt tämä neljännesvuosisadan vanha tekniikka on löytänyt tiensä musiikkiteollisuuteenkin. Seuraavassa kuvassa on nykyaikaisen CD:n pahasti leikkautunutta ääniaaltoa. Merkitty alue on leikkautunut. Tämä on yksi myöhemmin selostettavan ongelman juurista, muunlainen ylenmääräinen digitaalinen limitointi ei välttämättä aiheuta tämänkaltaista ”tasakattoista” leikkautumista, mutta poistaa soundista silti transientteja ja voimaa.

Kuva 1

 

Nykyään ongelma on se, että radioasemien lähetysketjussa on tehokkaita audioprosessointilaitteita, jotka eivät osaa käsitellä hyvin jo pahasti leikkautunutta signaalia. Pahaksi onneksi yllä oleva kuva on tyypillinen esimerkki nykyisen pop-musiikin masteroinnista. Lähetyskompressoreiden attack- ja release-ajat oli optimoitu ennen 1990-lukua julkaistuille vinyyleille. Tällaisessa lähdemateriaalissa on lyhytaikaisia piikkejä. Ylenpalttisella digitaalisella limitoinnilla lähdemateriaalin lyhyen aikavälin ”peak to average”-suhdetta pienennetään radikaalisti, jolloin lähetysprosessori saa käsiteltäväkseen synteettistä lähdemateriaalia, jota se ei osaa käsitellä yhtä kunniallisesti ja luonnollisesti kuin vanhaa materiaalia. Sen sijaan että lopputulos olisi iskevä (punchy), niin ylikompressoitu lähdemateriaali kuuluu radiossa pieneltä ja dynamiikkaköyhältä siskonmakkaralta (kiitos termistä entisen YleQ:n Terolle), jossa ei ole musiikin sisältämää luonnollista äänenvoikakkuuden vaihtelua ja iskevyyttä. Soundi muistuttaa musiikkitaustapaperia ja saa kuuntelijan kääntämään äänenvoimakkuutta taustamusiikkitasolle.

On olemassa uskomus, jonka mukaan lähetysprosessori käsittelee ylikompressoitua lähdemateriaalia hellemmällä kädellä kuin luonnollista materiaalia. Se on totta vain osittain — jos lähdemateriaalissa ei ole pitkän aikavälin dynaamista vaihtelua, niin silloin lähetysprosessorin AGC ei vähennä sitä. Lähetysprosessori kompressoi kuitenkin ylikompressoituja lyhyen aikavälin aaltokäyriä ja pienentää ”peak-to-average”-suhdetta vielä entisestään, jolloin äänenlaatu heikkenee heikkenemistään.

Ylikompressoitu materiaali ei kuulosta ilmassa äänekkäämmältä. Se kuulostaa säröytyneemmältä ja saa radion kuulostamaan äärimmäisissä tapauksissa rikkinäiseltä. Se kuulostaa pieneltä, kireältä ja tasaiselta. Se ei kuulosta hyvältä äänenvoimakkuutta lisättäessä, joten kuuntelija kokee sen taustamusiikiksi. Ylikompressointi yhdistettynä radioiden lähetyssignaalin prosessointiin tappaa musiikista draaman ja elämän. Pahemmissa tapauksissa soundi kuulostaa aivan liian säröytyneeltä ja saa aikuiset, erityisesti naiset, kääntämään kanavaa.

Tyypillinen prosessointiketju — mitä todella tapahtuu kun äänitteesi
kuuluu radiossa:

Tyypillinen ketju koostuu seuraavista osista alla mainitussa järjestyksessä:

Vaiheensiirtäjä

Vaiheensiirtäjä on sarja allpass-suotimia (tyypillisesti neljä kappaletta, kaikki 200 Hz kohdalla), joiden ryhmäviive vaihtelee taajuuden suhteen. Monet ihmisäänen aaltomuodot (erityisesti miesten äänet) ovat jopa 6 dB epäsymmetrisiä. Vaiheensiirtäjällä saadaan äänen aaltomuoto symmetrisemmäksi ja menetelmällä voidaan joskus vähentää puheen peak-to-average-suhdetta 3-4 dB. Koska prosessointi on lineaarista (se ei lisää signaaliin uusia taajuuksia), niin se on lähin vastine ”ilmaiselle lounaalle” lähetysprosessointimaailmassa.

Entäs menetelmän haitat? Vanhoina hyvinä aikoina, kun lähdemateriaalia ei vielä limitoitu liikaa, oli suurin haitta hyvin pieni musiikin läpinäkyyvyyden ja erottelevuuden kärsiminen. Tämä oli laajalti hyväksytty hinta merkittävästä puheen säröytymisen vähentämisestä, koska vaiheenpyörityksen vaikutusta musiikkimateriaaliin ei juuri pysty kuulemaan tavallisilla kotistereoilla, autoradiolla ja kannettavilla radioilla.

Asiat muuttuivat digitaalisten formaattien yleistyttyä. Vaiheensiirtäjä muuttaa radikaalisti lähdeaaltokäyrän muotoa muuttamatta taajuusvastetta: jos mittaat vaiheensiirtäjän taajuusvastetta, niin tulos on ”flat”, ellet myös mittaa vaihevastetta, jolloin voit todeta, että se on täysin epälineaarinen taajuuden suhteen. Käytännössä epälineaarisen vaiheensiirron jälkeen tasaiseksi limitoitu transienttipiikki voi sijaita nyt missä kohtaa aaltomuotoa hyvänsä. On tavallista, että ne päätyvät keskelle nollatasoa, jolloin ne näyttävät lyhyiltä aaltomuodon pätkiltä, josta puuttuuvat kaikki yksityiskohdat – vähän kuin vakavan palovamman arpi. Tämä on hyvin kuvaava metafora asialle, koska nyt lähdemateriaalin rankka limitointi ei enää auta vähentämään peak-to-average-suhdetta, vaan se lisää signaaliin ainoastaan tarpeetonta säröä.

Äänitysmaailmassa on olemassa uskomus, että lähetysprosessori käsittelee leikkautuneita, ylikompressoituja CD:itä vähemmän kuin puhtaita, dynaamisia CD:itä. Vaiheensiirron takia uskomus on yksinkertaisesti virheellinen. Sen sijaan kaikki lähdemateriaalin aaltomuodon leikkautumiset aiheuttavat radioaalloilla soivaan lopputuotteeseen pelkästään säröä ilman pienintäkään äänenvoimakkuuden lisääntymistä.

AGC

Seuraava vaihe on tavallisesti keskimääräistä äänenvoimakkuutta seuraava AGC:n (Automatic Gain Control) pitää toimia hyvin laajalla dynamiikka-alueella, joka on tyypillisesti 25 dB. Sen tarkoituksena on kompensoida käyttäjän virheet (livetuontantoympäristössä) ja vaihtelevat keskimääräiset tasot (automatisoidussa ympäristössä). Keskimääräiset tasot voivat vaihdella suuresti, koska pelkästään CD:iden peak-to-average-suhde on vaihdellut tallennusmedian käyttöönoton jälkeen. Siten kovalevylle siirretyn materiaalin normalisoinnilla (kaiken amplitudivaran käyttämiseksi) ei ole toivottua vaikutusta keskimääräisen tason säätämisessä. Suorassa siirrossa (yleistä) RMS-tason vaihtelu voi olla jopa 15 dB.

AGC yksinkertaisesti poistaa musiikista pitkän aikavälin dynamiikan. Käytännössä kaikki radioasemien päälliköt haluavat asemansa kuulostavan ilmassa koko ajan äänekkäältä, jotta ei olisi sitä riskiä, että joku kanavasurffaaja hyppäisi aseman yli juuri sille hetkelle sattuuneen hiljaisen kohdan takia.

AGC voi olla joko yksi- tai monialueinen. Monialueisena se on harvoin yli kaksialueinen, koska AGC:t toimivat hitaasti, jolloin taajuusalueiden välinen modulaatio (kuten keskialuetta pumppaava basso) ei ole niin suuri ongelma kuin myöhemmissä, nopeammin toimivissa kompressointivaiheissa.

AGC sisältää aina gaten, joka menee päälle, jos lähdesignaali putoaa alle määritellyn tason. Tällä estetään kohinan esillenouseminen suuresta äänenvoimakkuuden pienenemisestä huolimatta.

Stereokuvan laajennus

Kaikissa laitteissa ei ole stereokuvan laajennusta ja niissä joissa se on, saattavat tehdä asian myös muualla kuin heti AGC:n jälkeen. (Itse asiassa erillistä stereokuvan laajennusyksikköä käytetäänusein ketjun ensimmäisenä yksikkönä.)

Stereokuvan laajennuksella asema saadaan kuulostamaan isommalta ja dramaattisemmalta, jolloin se erottuu muita enemmän radioasemien viidakossa, varsinkin autostereoissa. Ylikäytettynä stereokuvan laajentaminen muuttaa miksauksen tasapainoa. Jos esim. suurin osa stereokaiun energiasta on stereokentän sivuilla, niin stereokentän laajennus muuttaa kaiun suhdetta keskellä olevaan lauluun verrattuna. Opetus? Miksattaessa musiikkia radiolähetykseen sopivaksi kannattaa kaikua käyttää konservatiivisesti, koska joidenkin asemien prosessorit tuovat kaikua pintaan.

Koska jokainen valmistaja käyttää toisistaan poikkeavaa sterokentän laajennustekniikkaa, niin sitä on mahdotonta yleistää. Ainoa yleismaailmallinen totuus on ehdoton mono-yhteensopivuusvaatimus (koska stereo-FM-radiokin vastaanottaa signaalia säännöllisesti monona, koska lähetyssignaalinlaatua valvova piiri pudottaa lähetyksen monolle, jos laatu heikkenee liikaa) ja että stereokenttää (L-R) ei laajenneta liikaa. Liiallinen laajennus synnyttää aina monitiesäröä (multipath distortion) (koska L-R-informaation siirtävä osa FM-signaalista on alttiimpi monitiesärölle). Lisäksi lähetyksen äänenvoimakkuus pienenee (FM-stereokomposiittiaaltomuodon ominaisuuden takia, jota ei nyt käsitellä enempää).

Limitoinnit aiheuttavat sen, että äänitysstudiotyylinen stereokuvan laajennus on yleensä epäyhteensopiva FM-lähetykseen erityisesti jos se lisää merkittävästi keskimääräisiä L-R-tasoja. Vinyyliaikakaudella oli olemassa samanlainen limitointi leikkauspään hyppäämisen estämiseksi, mutta CD:illä tätä rajoitusta ei enää ole. Siitä huolimatta radiosoittoon tarkoitettu miksaus kuulostaa aina puhtaimmalta ja äänekkäimmältä, jos sen L-R/L+R-suhde on alhainen. On ironista, että mono kuulostaa äänekkäimmältä ja puhtaimmalta!

EQ

EQ voi olla yksinkertaisimmillaan kiinteä basson korostus tai monimutkaisimmillaan monivaiheinen parametrinen taajuuskorjaus. Lähetysprosessorissa olevalla EQ:lla on kaksi käyttötarkoitusta. Ensinnäkin sillä luodaan radioaseman oma soundi. Toiseksi sillä kompensoidaan monialuekompressoinnin ja korkeiden taajuuksien limitoimisen aiheuttamaa taajuusvasteen muuttumista. Ne voivat aiheuttaa koko taajuusvasteen värittymistä ja se voidaan korjata tai sitä voidaan pienentää monialuekompressorin eteen asennetulla, huolellisesti valitulla kiinteällä EQ:lla.

Monialuekompressointi ja limitointi

Valmistajasta riippuen monialuekompressointi ja limitointi voidaan tehdä yhdessä tai kahdessa vaiheessa. Jos se tapahtuu kahdessa vaiheessa, niin silloin monialuekompressorilla ja limitoinnilla voi olla erilaiset crossoverit ja jopa eri määrä kaistoja. Jos se tapahtuu yhdessä vaiheessa niin silloin kompressori ja limitteri voivat ”keskustella” keskenään yhteistoiminaansa optimoidakseen. Kummankin menetelmän lähestymistavalla voidaan saada hyvältä kuulostava lopputulos ja kummallakin on omat huonot puolensa.

Tavallisesti monialuekompressori pienentää dynamiikkaa 4-6 alueella ja lisää audion tiiviyttä kokonaisäänenvoimakkuuden lisäämiseksi. On tavallista, että jokaisella alueella on oma kohinaportti kohinan estämiseksi alhaisilla tasoilla, ja valmistajilla on usein omat algoritminsa kohinaportituksessa kuultavien sivuvaikutusten minimoimiseksi.

Kehittyneessä prosessorissa voi olla kymmeniä parametreja pelkästään monialuekompressorin/limitterin säätämiseksi. Kompressorin toteutuksesta riippuen voidaan säätää seuraavia parametreja: drive, output gain, attack, release time, treshold, joskus myös crossover-taajuudet. Jokaisella parametrilla on oma vaikutuksensa soundiin, joten laitteen säätäjällä on oltava laaja kokemus osataakseen säätää monialuekompressorin siten, että se kuulostaa hyvältä suuresti vaihtelevalla ohjelmamateriaalilla ilman jatkuvaa säätöjen vaihtelutarvetta. Toisin kuin ääniteteollisuuden masteroinnissa, radioasemalla ei ole masteroijaa optimoimassa asetuksia erikseen jokaiselle ohjelmalähteelle sopivaksi!

Esikorostus ja korkeiden taajuuksien limitointi

Maasta riippuen FM-radio on esikorostettu 50 tai 75 mikrosekuntia. Esikorostus on 6 dB/oktaavi korkeiden taajuuksien vahvistus, joka on +3 dB joko 2,1 kHz (75µs) tai 3,2 kHz (50µs) kohdalla. 75µs esikorostuksella 15kHz on korostettu +17dB!

Prosessorin valmistajasta riippuen esikorostus voidaan tehdä monialuekompressoria ennen tai sen jälkeen. Miksaajien ja masteroijien on tärkeä ymmärtää, että yli 5 kHz taajuusalueen suuri korostaminen aiheuttaa huomattavia ongelmia lähetyskompressorissa, koska esikorostuksella vahvistetaan aluetta muutenkin todella paljon. Korkeiden taajuuksien limitointi voi tehdä soundista joko tunkkaisen, säröytyneen tai sekä että. Yksi tärkeimmistä eroista lähetysprosessoreiden välillä on se, miten hyvin ne suoriutuvat korkeiden taajuuksien limitoinnista mahdollisimman vähäisillä kuultavilla sivuvaikutuksilla. Huippuluokan prosessoreissa korkeiden taajuuksien limitointi on toteutettu tavallisesti osittain korkeuden taajuuksien äänenvoimakkuuden pienentämisellä ja osittain ’distortion cancelled clipping’:llä.

Leikkaus

Useimmissa prosessoreissa leikkausvaihe tarkoittaa lähinnä piikkien limitointia. Se on kriittistä lähetysprosessorin toiminnan kannalta. FM-esikorostuksen takia yksinkertainen leikkaus ei toimi lainkaan hyvin. Se tuottaa erotustaajuuskeskinäismodulaatiosäröä, jota radiovastaanottimmen jälkivaimennus (esikorjauksen kompensointi alkuperäisen taajuusvasteen saavuttamiseksi) suurentaa. (Jälkivaimennus on tasainen 2-3 kHz alueella, mutta pienee sen jälkeen 6 dB/oktaavi ylikorostaen 2-3 kHz alapuolella olevaa energiaa.) Lopputulos on erityisen räikeä symbaalien ja sibilanssien kohdalla (”ässät” muuttuvat ”äffiksi”).

70-luvun loppupuolella yksi tämän artikkelin alkuperäisistä kirjoittajista (R.O.) keksi distortion-cancelled-clipping:in, jossa muutetaan leikkauksen tuottaman särön spektriä. FM:ssä se poistaa tyypillisesti leikkauksen tuottaman särön 2 kHz alapuolella (vastaanottimen suoran taajuusvasteen osa). Menetelmä lisää limitteriltä tulevaan signaaliin n. 1 dB piikkitason, mutta vastapainoksi limitteriä voidaan ajaa paljon kovemmin kuin muuten olisi mahdollista.

Sillä ehdolla että distortion-cancelled-clipping ei tuota kuultavaa säröä, on se erittäin tehokas piikkien limitointikeino, koska se vaikuttaa vain piikkeihin, jotka todella ylittävät leikkausrajan jättäen ympäröivän materiaalin koskemattomaksi. Vastaavasti leikkaus ei aiheuta äänenvoimakkuuden pienentämisessä mahdollisesti syntyvää pumppaamista, varsinkaan esikorostetulla materiaalilla. Lisäksi leikkaus syö korkeimpia taajuuksia vain minimaalisen vähän korkeiden taajuuksien limitointiin verrattuna. Näiden syiden takia useimmat FM-lähetysprosessorit limitoivat signaalia mahdollisimman paljon niin, että kuultava särö on hyväksyttävän alhaisella tasolla.

Limitointijärjestelmät voivat olla hyvin monimutkaisia, koska limitoidun signaalin taajuuskaista pitää limitoida yläpäästä 19 kHz:in limitoinnissa syntyvien harmonioiden syntymisestä huolimatta. (Taajuuskaistan limitointi estää stereopääkanavan ja alikanavan välisen valetoiston (aliasing between the stereo main and subchannel), suojaa FM-stereokomposiittikantataajuuskaistassa 55 kHz taajuuden yläpuolella olevia apukantoaaltoja ja suojaa 19 kHz pilottiääntä). Limitoidun signaalin lineaarin suodatus 15 kHz yläpuolisten taajuuksien poistamiseksi aiheuttaa suuria korostuksia (pahimmassa tapauksessa jopa 6 dB) spektrin typistämisestä ja suotimen aikadispersiosta johtuen. Jopa vaihelineaarinen alipäästösuodin (mahdollinen vain DSP-toteutuksissa) aiheuttaa enimmillään 2 dB korostuksen. Siksi huippuluokan lähetysprosessoreissa käytetään monimutkaista korostuksenkompensointimekanismeja piikkien vähentämiseksi lisäämättä merkittävästi taajuuskaistan ulkopuolista spektriä.

Joissakin prosessoreissa käytetään stereokooderin lähdön yhdistelmäleikkausta tai -limitointia. Stereokooderi on piiri, joka koodaa vasemman ja oikean kanavan yhdeksi vastaanottimelle lähettäväksi lomitetuksi signaaliksi. Viestintävirasto valvoo juuri lomitetun signaalin deviaatiota. Lomitetun signaalin leikkaus tai limitointi on ollut pitkään kiistelty tekniikka, mutta uusimman sukupolven tekniikalla limitoinnissa vanhemaa tekniikkaa vaivanneita interferenssiongelmia on voitu vähentää merkittävästi.

Yhteenveto

Radiolähetyksen prosessointi on monimutkaista, ja se on kehitetty äänitteille, joita äänitysteollisuus on tuottanut lähes koko historiansa ajan. Historiallisessa viitekehuksessä ylikompressointi on lyhytaikainen häiriö, joka ei sovellu kaupallisten popmusiikkia soittavien radioiden ”kilpailevaan” prosessointiin. On suositeltavaa, että levy-yhtiöt tekevät äänitteistä erilliset radiomiksaukset. Niissä voidaan käyttää entiseen tapaan taajuuskorjausta, hidasta kompressointia ja muita tuottajien ja masteroijien taiteelliselta kannalta tarpeellisia efektejä halutun ”soundin” luomiseksi. Radiomiksauksia ei kuitenkaan pidä limitoida ja leikata nopeilla päästöajoilla. Lyhyen aikavälin aaltokäyrät on jätettävä koskemattomiksi. Niiden käsittely on jätettävä lähetysprosessorille.

Lopputulos on radiovastaanottimessa yhtä äänekäs kuin ylikompressoitu materiaalikin, mutta se on paljon iskevämmän, selkeämmän ja elävämmän kuuloinen. Toinen suositus äänitysteollisuudelle on käyttää studio- tai masterointiprosessointia, jolla saadaan aikaan haluttu efekti ilman ei-toivottua leikkauksessa syntyvää suurta säröytymistä. Vaihtoehto raa’alle piikkien leikkaukselle on digitaalinen look-ahead-limitointi, joka tuottaa vähemmän modulaatiosäröä kuin leikkaus ja estää lisäksi räikeiden tasakattoisten aaltomuotojen syntymisen. Leikkaukseen verrattuna menetelmä on siten merkittävästi yhteensopivampi lähetysprosessointiin. Siitä huolimatta jopa digitaalinen limitointi voi heikentää peruuttamattomasti äänenlaatua, koska se pienentää peak-to-average-suhdetta niin paljon, että lähetysprosessori käsittelee sitä epäluonnollisella tavalla. Siksi sitä pitää käyttää säästeliäästi. On lopulta vain yksi keino saada selville, miten jokin äänitys muuttuu lähetysprosessorissa — ajaa masteroitu äänite lähetysprosessorin läpi ja kuunnella lopputulosta tavallisella radiolla.

 

Päivitetty: 02.06.2019

Alkuperäinen teksti (c) Frank Foti, Omnia Audio & Robert Orban, CRL/Orban. Suomentanut: Panu Pentikäinen / Pulu Studio