Bozar konstruktor: Inżynieria brzmienia na przykładzie pluginu Stereo Tool

Inżynieria brzmienia na przykładzie pluginu Stereo Tool

Opublikowano 21 gru 2012

Dzisiejszy wpis będzie nietypowy, ponieważ tym razem będziemy budować coś niematerialnego - brzmienie. Ten artykuł ma za zadanie nieco przybliżyć techniki przetwarzania muzyki tak, aby brzmiała ona atrakcyjniej dla ucha.

Ludzki słuch ma zmienną czułość w swoim zakresie częstotliwości.

Najgłośniej słyszymy dźwięki z przedziału 1000-4000Hz, natomiast potrzeba dużo większej głośności, aby równie dobrze odbierać niskie basy lub subtelne soprany. Dlatego najatrakcyjniejszym ustawieniem equalizera dla większości wydaje się łódeczka, czyli podbicie skrajnych zakresów częstotliwości, z pozostawieniem środka bez zmian. Jednak sam equalizer nie jest lekiem na całe zło. Podbijając np. basy, w pewnym momencie w tym albo innym utworze może się pojawić się ich głośniejsza seria i dojdzie wtedy do przesterowania, czyli obcięcia czubków amplitudy na płasko, co słychać jako "trzeszczenie" lub "pierdzenie", zależnie od obciętej częstotliwości.

Rozwiązaniem jest dużo bardziej zaawansowany tor audio, jaki oferuje darmowy plugin do wielu odtwarzaczy o nazwie Stereo Tool. Został on stworzony do remasteringu dźwięku w domowym zaciszu, tak, aby dopasować go najlepiej do naszego słuchu i sprzętu grającego. Przy odpowiednich ustawieniach, ze znanych utworów wyciągniemy dużo, dużo więcej, niż moglibyśmy przypuszczać i usłyszymy nowe rzeczy.

Ale najpierw kilka słów na temat samego odtwarzania formatów cyfrowych. Mamy tu ważne 2 parametry.

Próbkowanie to "rozdzielczość w poziomie", czyli jak wiele razy na sekundę zapisana jest informacja o wartości amplitudy. Przy typowej częstotliwości 44.1Khz twierdzenie Nyquista pozwala nam zapisać dźwięki do częstotliwości ok. 22kHz, co powinno być wystarczające dla ucha ludzkiego. Niższe wartości dają wyraźne przytłumienie wysokich tonów. Dla lepszych efektów warto ustawić, aby nasz odtwarzacz resamplował dźwięk przynajmniej do 48kHz, albo 96kHz, bo pozwoli to pluginowi na dużo większą precyzję w przetwarzaniu dźwięku.
Rozdzielczość, to dokładniej "rozdzielczość w pionie", czyli ilość poziomów głośności, jakie może przyjąć amplituda. Jeśli jest niska, dźwięk jest metaliczny, jak z pocztówki grającej lub starej konsoli. Typowa rozdzielczość 16-bitowa to 65536 kombinacji, czyli sporo. Jednak jest to ilość skończona. Użycie rozdzielczości 32-bitowej typu float daje zakres praktycznie nieskończony z uwagi na charakter notacji zmiennoprzeciwnkowej.

Co więc powinien dostać plugin na wejściu? Najlepiej, aby był to dźwięk niepotraktowany żadnym equalizerem, o próbkowaniu 48kHz i rozdzielczości 32bit float. W tym momencie zaczyna się całe przetwarzanie.

Jak działa plugin? Omówię najbardziej podstawowy tor, jaki można ustawić:
Wzmocnienie ► Kompresja ► Ogranicznik.

Przede wszystkim przypomnijmy sobie o co nam chodziło - o uwydatnienie tych dźwięków, które ludzie ucho słabo słyszy, lub toną gdzieś przytłumione przez te dużo głośniejsze. Zaczynamy więc od silnego, niekiedy nawet 10-krotnego wzmocnienia całego sygnału.

Oczywiście bez dalszych zabiegów taki dźwięk okropnie by charczał, ale plugin musi mieć "zapas głośności", który będzie mógł wykorzystać w razie potrzeby.

Teraz należy zadbać o głośność. Element, który się tym zajmuje to wielopasmowy kompresor. Działa on jak equalizer sprzężony z analizatorem spektrum. W typowym equalizerze wzmocnienie poszczególnych częstotliwości ustawione jest na sztywno przez użytkownika. W tym przypadku jest uzależnione od aktualnego poziomu tych częstotliwości. Przykład: lubimy delikatne muśnięcia hit-hata perkusji (pst, pst). Normalnie podbilibyśmy soprany w granicach 8-12kHz, ale przez to kompletnie tonęłyby one w głośnych, trzeszczących uderzeniach talerzy, czyniąc całą muzykę jazgotliwą i nieprzyjemną. Wielopasmowy kompresor analizuje poziom głośności naszych hit-hatów i jeśli brzmią one cicho w tle, podgłaśnia ten zakres częstotliwości, a kiedy nagle wkrada się głośne uderzenie dźwięku, ścisza go, aby nie dopuścić do nagłej eksplozji głośności w tym paśmie.

Tak dzieje się dla każdej z 10 częstotliwości. Możemy panować nad głębokim i średnim basem, wokalami, typowymi instrumentami oraz dodać jasności talerzom. Efekt jest taki, że wszystkie częstotliwości (czyli instrumenty, efekty, głosy) słyszymy w miarę równie głośno. Każde pasmo ma swoją wartość docelowej głośności, do której dąży i możemy ją dowolnie modyfikować, ustalając w ten sposób ogólną barwę dźwięku.

Ważnym parametrem jest także czas w którym głośność pasma dobije lub odbije od tej granicy (czyli "refleks" wielopasmowego kompresora). Wpływa to na dynamikę dźwięku i źle ustawione może doprowadzić do nieprzyjemnego "pompowania", kiedy po głośnym dźwięku (często basie) następuje chwilowe przyciszenie, co jest dość męczące w odsłuchu.

Okno wielopasmowego kompresora może za początku przerażać, ale już omawiam wszystkie elementy.

Pierwsza kolumna to częstotliwości na których skupia się kompresja. Są one domyślnie tak dobrane, aby pokryć całe słyszalne pasmo. Warto w pierwszej kolejności skorygować dwie pierwsze, odpowiedzialne za bardzo niskie basy, ponieważ one są najbardziej podatne na obcięcie przez "fizyczną" część toru audio, czyli kartę dźwiękową, wzmacniacz i głośniki, lub przetworniki słuchawek.
Druga kolumna to equalizer, działający na zdefiniowanych przez nas częstotliwościach. Możemy go włączyć w ustawieniach, ale używajmy go na samym końcu, dopiero po jak najlepszym dopasowaniu dźwięku przez kompresor. Equalizer może działać przed, lub po kompresji. Drugie rozwiązanie daje o wiele bardziej odczuwalny efekt, ale może doprowadzić do przesterowania podbitych częstotliwości
Trzecia kolumna jest najważniejsza. To tutaj ustawiamy docelowy poziom głośności każdego z pasm, nadając brzmieniu pożądany charakter. Najlepiej na początku skręcić wszystkie pasma na jakieś 10% mocy i po kolei podciągać je do miłego dla ucha poziomu.
Czwarta i piąta kolumna odpowiadają za dynamikę dźwięku, czyli czas reakcji kompresora na zmiany głośności poszczególnych pasm. Suwaki reprezentują szybkość reakcji, co przekłada się na średnią głośność, kiedy są sprzężone ze sobą. Bardzo ważnym elementem tutaj jest spektrogram, widoczny po zmaksymalizowaniu okna. Możemy na nim zaobserwować tempo adaptacji wewnętrznego equalizera do aktualnej sytuacji dźwiękowej.

Przy ustawieniu dużej prędkości wzrostu (upseed), kompresor będzie sprawniej redukował dane pasmo w przypadku jego zbyt wysokiego natężenia. Natomiast duża prędkość spadku da efekt szybkiego przywrócenia głośności tego pasma już po redukcji. Jeśli zależy nam na w miarę jednolitym i głośnym dźwięku, ustawiamy upspeed co najmniej na 50%, a downspeed na 10-20%, co utrzyma wszystkie częstotliwości na podobnym poziomie. Natomiast, gdy chcemy wyciągnąć więcej subtelności, podkręcamy downspeed na 50%, co da szybszą odpowiedź na zmienną sytuację dźwiękową.
W ostatniej kolumnie możemy ustawić parametry ostrego limitera, ale od tego jest osobny, lepszy moduł.

Mamy dwa scenariusze kompresji: pierwszy z nich to zwykła kompresja, kiedy głośność wszystkich pasm dąży do zadanych poziomów. Pozwala to wydobyć z dźwięku najwięcej ukrytej zawartości, ponieważ wszystkie tony otrzymują odpowiednią ekspozycję. Drugi scenariusz to limitowanie. W tym przypadku wszystkie częstotliwości chcą być jak najgłośniejsze. Daje to żywszy i nieco głośniejszy dźwięk, ale często giną w nim drobne niuanse. Do wyboru służy suwak.

Bardzo silna kompresja połączona z limitowaniem jest często używana w reklamach telewizyjnych, aby uczynić głos lektora odczuwalnie wyraźniejszym i krzykliwszym, bez przekraczania dozwolonej amplitudy.

Nie zawsze kompresor da radę skompresować wszystkie częstotliwości tak, aby nie wykraczały one poza zakres, który potrafi odtworzyć karta dźwiękowa. Czasem, szczególnie w przypadku nagłych dźwięków pozostają różne szpilki i górki, które brzmiałyby jako trzeszczenie. Dodatkowo silny lub ciągły bas potrafi bardzo rozchwiać cały tor, więc jeśli nie chcemy go redukować, potrzebujemy ostatniego ogniwa.

Jest to końcowy ogranicznik. Dba on o to, aby sygnał, który go opuszcza był w zakresie 0-100%, bez przyciętych czubków amplitudy. Mamy aż dwa jego rodzaje - prosty i zaawansowany. Ten pierwszy zwykle bywa wystarczający.

Osiąga swój cel poprzez bardzo zręczne manipulowanie głośnością, co nie dopuszcza do powstawania obciętych końcówek sinusoidy.

Zaawansowany ogranicznik nie bez powodu zasłużył na swoją nazwę. Robi to co pierwszy, ale pracuje w zakresie kilku pasm. Nie przeszkadza mu pulsujący głośny bas - ma nawet specjalny moduł do jego kontroli.

W tym czasie kształtuje amplitudy korzystając z parametru pozornej głośności (loudness) tak, aby mniej lub bardziej wypełniała ona cały zakres dynamiczny.

Teoretycznie moglibyśmy wyłączyć wielopasmowy kompresor i przepuścić wzmocniony sygnał przez zaawansowany ogranicznik końcowy, otrzymując poprawny technicznie dźwięk. Efektem byłaby duża odczuwalna głośność bez słyszalnego przesterowania (bez obciętej amplitudy) - coś co tak drażni w reklamach i coraz większej ilości muzyki z tego wieku. No ale może niektórym to się podoba. Głównym zadaniem ogranicznika jest jednak oczyszczenie przetworzonego sygnału z drobnych błędów i dopiero potem ewentualne go formowanie, czyli nadawanie dodatkowej głośności.

Do toru warto czasem włączyć dwa dodatkowe ogniwa: odpowiadające za efekt stereo oraz za podbicie basu.

Ten pierwszy jeszcze do niedawna był dość prymitywny. Wzmocnienie stereo polegało na wzmocnieniu różnicy fazowej pomiędzy kanałami. Problem w tym, że brzmi to tylko w dobrze nagranej muzyce z wysokim bitrate. Przy garażowym 128k w sopranach działa się prawdziwa tragedia.

Najlepiej używać go do innych celów - np. ograniczenia zbyt dużego sztucznie wprowadzonego stereo (maximum angle), albo naprawy źle nagranej kasety, gdzie jeden kanał został odwrócony, przez co całość brzmi jak ze środka naszej głowy. Wtedy ustawiamy opcję "phase shift" na 180 stopni.

Od niedawna jest do dyspozycji drugi moduł "stereo boost". Daje on dużo bardziej przyjemny efekt, nie wprowadzając artefaktów. Najlepiej brzmi na rozstawionych przynajmniej na metr głośnikach, wyraźnie "rozprężając" ściśnięty dźwięk.

Określamy dwa parametry: wzmocnienie stereo i maksymalny jego poziom. Jeśli mamy mocno odseparowaną partię, nie ma potrzeby wzmacniać jej dodatkowo. Natomiast fragment, gdzie separacja jest słaba, zostanie rozciągnięty w przestrzeni bardziej konkretnie

Moduł wzmocnienia basu to nie jest zwykły equalizer, ponieważ formuje on dźwięk, a nie jedynie podgłaśnia zakres częstotliwości. Po jego włączeniu podkreślane są bardzo niskie "tąpnięcia", jednak nie powoduje to ogólnego wzrostu poziomu sygnału, tak więc nie ryzykujemy przesterowaniem.

Zasada działania jest podobna jak w przypadku efektu stereo - określamy wzmocnienie i maksymalną wartość. Tam, gdzie bas jest już wystarczająco silny, nie zostaje niepotrzebnie przesterowany Ale regulacji najlepiej dokonać przy włączonej opcji "difference", gdzie będziemy słyszeć wyłącznie bas. Najpierw ustawiamy najniższą częstotliwość bo to ona będzie najwyraźniej słyszalna jako "tąpnięcia". Potem określamy próg odcięcia i jeśli chcemy, to również harmoniczne. Tutaj sprawa jest bardzo indywidualna w zależności od naszego sprzętu audio. Po wyłączeniu opcji "difference" powinno być słychać porządnego kopa. Jeśli jest za silny, wystarczy zmniejszyć parametr "strength".

Na zabawie z parametrami Stereo Tool można spędzić całe godziny, tylko ładując nowe albumy. Nie raz będziecie zaskoczeni jaką jakość da się wyciągnąć z garażowych, lub bardzo starych nagrań! Jedyna rzecz, na którą trzeba mieć cały czas uwagę to poziom sygnału wyjściowego. Nie możemy doprowadzić do jego przesterowania. Sygnalizowane jest ono ciągłym paleniem się prawego miernika na czerwono i wyraźnie płaską górą amplitudy na prawym oscyloskopie. 3 najszybsze rozwiązania to:

zmniejszyć wstępne wzmocnienie (pogorszy się dynamika)
obniżyć wszystkie progi wielopasmowego kompresora (możemy zatracić nasze długo dopasowywane brzmienie)
zwiększyć moc końcowego ogranicznika (może dojść do pompowania)

3 komentarze:

Anonimowy 5 wrz 2013, 03:32:00

Należałoby wspomnieć, że głównym celem programu Stereo Tool jest przygotowanie materiału tak, aby nadawał się on do EMISJI analogowej (zwłaszcza FM) lub cyfrowej (podcast).

Jak każdy procesor dynamiki, Stereo Tool wprowadza dodatkowe zniekształcenia i artefakty. Sam używam tego programu - natomiast, czy nam się taki dźwięk podoba, czy też nie, jest kwestią gustu... Trzeba też wiedzieć, co chcemy osiągnąć oraz jak tego dokonać - trzeba dobrze znać program i zasadę działania jego elementów składowych.

Teorię procesorów dynamiki i ich przystosowanie do własnych potrzeb doskonale opisuje Cornelius Gould (pracujący obecnie w Telos, Omnia Audio) w serii "audio processing from the ground up" dostępnej w formie .pdf online.

slawekb0@gmail.com
NoGodsNoMasters 28 maj 2021, 15:35:00

ale jak tak przeprocesorowany dźwięk nagrać lub zapisać aby tak brzmiał jak ustawię w Stereo Tool?
TS PCB 22 maj 2023, 02:21:00

Rzeczywiście to coś innego niż zwykle ale jak się okazuje taka budowa jest tak samo ważna i tak samo pracochłonna. Prawidłowe ustawienie parametrów w programie może sprawiać nieco trudności ale jak widać jest wykonalne.

Bozar konstruktor

Inżynieria brzmienia na przykładzie pluginu Stereo Tool

3 komentarze:

Prześlij komentarz

Archiwum bloga

Kategorie

W planach