Celem tego opracowania jest przybliżenie czytelnikowi zagadnień związanych z kontrolowaniem wydolności dźwiękowej Dźwiękowych Systemów Ostrzegawczych, przy wykorzystywaniu elektronicznych metod pomiaru „współczynnika zrozumiałości mowy” i wskazanie błędów popełnianych przy pomiarach, które mogą znacznie zafałszować wyniki lub też całkowicie zdyskwalifikować wykonaną pracę.
Na pozór wydaje się, że można sprawdzić czy system nagłośnieniowy emituje dźwięk zarozumiały czy też nie. Ale, tak naprawdę, „zrozumiałość mowy” jest funkcją kontynuowaną i może się stale polepszać lub pogarszać.
Istnieją określone stopnie zrozumiałości mowy, podobnie jak kilka sposobów na dokonanie pomiaru tego skomplikowanego parametru akustycznego.
Znane są dwie metody pomiaru zrozumiałości mowy: bezpośrednia („ludzka”) czyli testy wyrazowe z udziałem grupy ludzi oraz pośrednia, wykorzystująca elektroniczne urządzenia pomiarowe, dlatego nazywana jest również przyrządową.
W testach bezpośrednich grupa słuchaczy wysłuchuje specjalnie utworzone ciągi wyrazów odtwarzane przez system dźwiękowy, notując usłyszane słowa na specjalnie przygotowanych kartach testowych. Testy bezpośrednie wydają się być bardziej użyteczne, ponieważ wykorzystują rzeczywistych słuchaczy w rzeczywistych sytuacjach. Jednakże przeprowadzanie „testów wyrazowych z udziałem wielu słuchaczy nie jest ani praktyczne, a tym bardziej ekonomiczne. Koniecznym stało się więc zbudowanie prostego testu opartego na pomiarach akustyki z udziałem elektronicznych przyrządów pomiarowych.
W metodzie pośredniej (przyrządowej) głośnikowy system dźwiękowy może odtwarzać zarówno mowę jak i specjalny sygnał testowy, które są następnie odbierane przez mikrofon i poddane analizie. W wyniku tej analizy uzyskuje się składniki sygnału oryginalnego i produkty zniekształcenia tegoż sygnału przez tor wzmacniający i akustykę otoczenia. Następnie obliczana jest proporcja pomiędzy sygnałem użytecznym, (czyli oryginalnym) a szkodliwym (tym zdegradowanym przez akustykę otoczenia). Ściśle mówiąc, specyfika takiego pomiaru jest dalece bardziej złożona niż zbadanie prostego stosunku sygnału użytecznego do sygnału zniekształconego przez akustykę otoczenia... no ale to już inna historia.
Jak zbudować system dla pomiaru zrozumiałości mowy wykorzystujący wszystkie aspekty transmisji i odbioru dźwięku? Czy istnieje sposób matematycznego obliczenia rzeczywistej zrozumiałości mowy w pomieszczeniu?
Zanim odpowiemy na te pytania, warto zwrócić uwagę szanownym Czytelnikom na fakt, że zrozumiałość mowy jest pochodną słyszalności1, wyrazistości2 oraz klarowności3 dźwięku i zależy od wielu czynników.
CZYNNIKI mające wpływ na ZROZUMIAŁOŚĆ MOWY | |
---|---|
PODSTAWOWE | DRUGORZĘDNE |
* Pasmo przenoszenia systemu PA | * Zniekształcenia wnoszone przez system PA |
* Charakterystyka częstotliwościowa | * Dokonane korekcje ch-ki w systemie PA |
* Głośność (poziom ciśnienia dźwięku SPL) | * Niejednorodność pokrycia dźwiękiem |
* Stosunek poziomu Zapowiedzi do poziomu Hałasu otoczenia | * Obecność wczesnych odbić |
* Wymowa i tempo mówienia | * Ogniskowanie dźwięku lub obecność silnych późnych odbić |
* Predyspozycje słuchowe słuchacza | * Kierunek, z którego dźwięk dociera do słuchacza |
* Stosunek dźwięku Bezpośredniego do Pogłosowego (np.parametr C50) | * Barwa głosu mówcy |
* Słownictwo i kontekst mowy | |
* Techniki mikrofonowe i sposób obsługi mikrofonu |
W 1971 w Holandii, niejaki Puetz opublikował swoje odkrycia w dziedzinie zrozumiałości mowy. Określił on proporcje zależności zrozumiałości mowy do czasu pogłosu w pomieszczeniu, wielkości tego pomieszczenia i odległości, w jakiej znajduje się mówca od słuchacza. Zauważył też, że znaczą redukcję zrozumiałości powoduje utrata słyszenia spółgłosek, a nie samogłosek. Ustanowiono zatem definicję procentowej utraty słyszenia spółgłosek %ALcons i nazwano ją architektoniczną w odróżnieniu od późniejszych modyfikacji z 1986 roku, gdzie metoda wyznaczenia %ALcons oparta jest na wyznaczeniu stosunku poziomu dźwięku bezpośredniego do poziomu dźwięku rozproszonego w przestrzeni LR (dźwięku pogłosowego). Pomiar %ALcons nasuwa pewne wątpliwości, jednakże praktyka wykazała, że technika ta uwzględnia najbardziej znaczące zniekształcenia obrazu dźwiękowego i dlatego została zaakceptowana dla potrzeb kontrolowania zrozumiałości mowy w systemach Alarmu Głosowego®*, szczególnie w Stanach Zjednoczonych gdzie nagminnie stosuje się w torze wzmacniania głosu różnej maści limitery i kompresory dynamiki.
Mniej więcej w tym samym czasie, gdy Puetz prowadził swoje doświadczenia, grupa naukowców w laboratoriach TNO w Holandii również badała zrozumiałość mowy w celu udoskonalenia innych metod pomiarowych, pod nazwą Speech Transmission Index.
Ich metoda oparta jest na pomiarze funkcji przenoszenia modulacji (MTF) systemu wzmacniającego dźwięk, w każdej z siedmiu zakresów oktaw pokrywających obszar od 125 Hz do 8 kHz. Zamiast żywej mowy stosowany jest tu specjalnie modulowany sygnał testowy. Ponieważ pomiar współczynnika STI wykorzystuje częstotliwości w zakresie mowy ludzkiej, do obliczeń włączane będą zarówno nierównomierności charakterystyki częstotliwościowej toru elektroakustycznego jak też efekty akustyczne zależne od częstotliwości, takie jak pogłos, flange oraz echo. Z tego powodu przy pomiarach „zrozumiałości mowy” tą metodą, należy bezwzględnie odłączyć z toru wzmacniającego urządzenia efektowne i kompresory dynamiki sygnału. Pomiar zrozumiałości mowy wg metody STI stał się standardem pomiarowym opisanym w normie IEC 268-16, do którego odnosi się norma EN60849.
Dla dokonania pełnego pomiaru i obliczenia STI wymagana jest znaczna moc obliczeniowa. W latach 70-tych przenośne urządzenia obliczeniowe nie były tak łatwo osiągalne. Problem ten rozwiązało pojawienie się metody RASTI. Jest to znacznie uproszczona wersja pomiaru STI, gdzie pomiar dokonuje się tylko dla dwóch częstotliwości: 500 Hz i 2 kHz, z dziewięcioma częstotliwościami modulacyjnymi. Ta metoda aż o 91% zmniejszyła wymagania obliczeniowe przyrządów. Pierwszy miernik RASTI wyprodukowała w 1985 firma Bruel & Kjaer. Metoda RASTI początkowo przeznaczona była do badania transmisji „żywej” mowy w naturalnej akustyce ale okazała się także odpowiednia dla pomiarów efektywności dźwiękowych systemów rozgłoszeniowych (Public Address). Została również adoptowana przez kilka europejskich standardów dla systemów Alarmu Głosowego w latach 80 i 90-tych takich jak BS5839-8 czy BS7443.
Prezentowanie standardów pomiarowych nie miało większego znaczenia aż do początku lat 90-tych, gdzie włączenie wymogów dotyczących zrozumiałości mowy do specyfikacji systemów Alarmu Głosowego, dało wystarczający powód do ich zastosowania.
I tu pierwszym szokiem było zdanie sobie sprawy, że uzyskanie dobrej zrozumiałości mowy nie zawsze jest możliwe, albowiem AKUSTYKA otoczenia jest tu ostatecznym arbitrem… bez względu na to jak bardzo złożony jest system pomiarowy.
Po drugie, wyszło na jaw, że w pewnych warunkach pomiar RASTI okazał się dawać zbyt wysokie lub zbyt niskie wyniki. Problem ten wynika głównie z pomiaru dokonywanego tylko w dwóch zakresach pasma audio. Podczas gdy pomiary, dokonywane dla systemów nagłośnieniowych wysokiej jakości z głośnikami o dobrze kontrolowanej kierunkowości dawały dobre wyniki, to w pomiarach mniej kosztownych systemów dźwiękowych, zauważono wyraźny wzrost nieprawidłowości.
Z tych powodów w Anglii stworzono Złożoną Skalę Zrozumiałości (Combined Inteligibility Scale) i natychmiast adoptowano ją do zastosowania w Unii Europejskiej (patrz norma EN60849). Wykres CIS pozwala określać zrozumiałość mowy stosując różne metody pomiarowe, nie tylko wspomnianą RASTI.
CIS pozwoliła na porównywanie różnych skal zrozumiałości i była przyjęta w końcu lat 90-tych. Jednak pozycja wygodnej metody RASTI była już zbyt silna wśród standardów i - pomimo jej zasadniczych wad - inżynierowie a także instytucje licencjonujące systemy dźwiękowe nadal kontynuowały posługiwanie się tą metodą.
Możliwość dysponowania przez komputery przenośne potężną mocą obliczeniową, pozwoliło analizować funkcję przenoszenia modulacji (MTF) (jak we wspomnianej metodzie STI), która wyciągana jest z pomiaru odpowiedzi impulsowej badanego pomieszczenia. Metoda ta pozwoliła również na implementację innych systemów pomiarowych takich jak TEF i MLSSA, które umożliwiały pełny pomiar współczynników zrozumiałości mowy STI oraz RASTI. Metoda impulsowa, oprócz STI, RASTI czy ALcons pozwala wyznaczyć wiele parametrów akustyki wnętrza takich jak czas pogłosu (RT60), wczesne odbicia (EDT) czy też Klarowność dźwięku (parametr C50, C35) i dlatego stosowana jest głownie przez specjalistów od akustyki. Wyznaczając tak duża ilość skomplikowanych parametrów akustycznych jest przy tym bardzo pracochłonna, jednakże wyniki obliczeń współczynnika zrozumiałości mowy są tu bardzo dokładne. Poza tym, co jest szczególnie istotne, metoda impulsowa pozwala wykonywać pomiar STI w pomieszczeniach przy obecności naturalnego hałasu ich normalnego użytkowania!
Szybki wzrost ilości instalowanych systemów Alarmu Głosowego i wymagania inwestorów w zakresie stosowanie standardu EN60849, sprawiły, że inspektorzy budowlani i pożarowi potrzebowali prostego w obsłudze przyrządu do szybkiego kontrolowania zrozumiałości mowy w instalacjach rozgłoszeniowych. Biorąc pod uwagę ogromną moc procesora potrzebną do tego rodzaju obliczeń, dostarczenie takiego instrumentu stało się nie lada wyzwaniem. Niepewność wyniku stanowiła tu ogromną barierę komercyjną.
Pod koniec roku 2001 GoldLine włączył opcjonalne oprogramowanie OPT STICIS do pomiaru STI dla swojego przenośnego RTA analizera DSP30 (przy ścisłej współpracy z Bose i TNO). Tak doposażony przyrząd wskazywał odczyty CIS i STI (również RASTI - jako opcja). Mierzył dźwięk w każdej z siedmiu oktaw od 125 Hz do 8 kHz. Sygnałem testowym był specjalny pseudolosowy szum modulowany, odtwarzany przez system PA z płyty CD. W wynikach pomiarów zauważalne są pewne różnice, dlatego w skrajnych miejscach obszaru pomiarowego trzeba wykonać kilka pomiarów i uśredniać je, niemniej łatwość, z jaką używa się tego przyrządu sprawia, że stał się popularnym narzędziem w rękach inspektorów dokonujących odbioru rozgłoszeniowych systemów Alarmu Głosowego (DSO).
Tak więc współpraca Gold Line, Bose i TNO zaowocowała stworzeniem nowego i praktycznego systemu pomiaru zrozumiałości mowy, nazwanego w Europie STIPA (STI dla systemów PA), a w Anglii PASTI, co bardziej kojarzy się z popularnym „RASTI"… poprzednim arbitrem dla systemu nagłośnieniowego.
Bezkrytyczne stosowanie uproszczonej metody STIPA, do wyznaczania współczynnika zrozumiałości mowy w każdych warunkach akustycznych pomieszczeń z głośnikami alarmowymi, może prowadzić do całkowicie błędnych odczytów.
Nie przypadkowo, w normie PN-EN 60849 dla DSO, wskazano różne metody wyznaczania współczynnika zrozumiałości mowy. Rzecz w tym, że dobór metody pomiarowej należy dostosować do rodzaju przestrzeni akustycznej oraz sposobu rozmieszczenia i rodzaju zastosowanych głośników w systemie rozgłaszania komunikatów alarmowych.
Przykładowo, wspomniana norma w Załączniku A, w punkcie A.1 sugeruje wręcz stosowanie Alcons do przestrzeni o słabej zrozumiałości (np. z echem lub pogłosem). Byłem świadkiem sytuacji, gdzie w pogłosowej przestrzeni betonowego parkingu galerii handlowej dokonywano pomiarów współczynnika zrozumiałości mowy metodą STIPA. Wynik był niekorzystny (poniżej 0,48 STI) ale osoby, będące świadkami tego procesu stwierdzały, że komunikaty słowne są bardzo dobrze przez nich zrozumiałe – nawet przez zamknięte drzwi. Zachodzi więc pytanie „dla kogo potrzebna jest zrozumiała mowa - dla przyrządów czy dla ludzi ?”
Jeśli ludzie dobrze rozumieją treści komunikatów nadawanych przez głośniki a przyrząd pokazuje, że jest zupełnie inaczej, to komu potrzebny jest taki przyrząd ? Zaproponowałem wykonanie badania zrozumiałości mowy metodą %ALcons, która dla warunków pogłosowych jest bardziej miarodajna i okazało się, że przy zmierzonej 10% utracie zrozumiałości spółgłosek końcowy wynik wyniósł 0,72 CIS.
Taki wynik odpowiada wrażeniom słuchowym zgromadzonych osób - a to najlepszy dowód, że dla takich warunków metoda %ALcons wybrana została prawidłowo. Mało kto zwraca uwagę na jeszcze bardziej istotne ograniczenie w badaniu STI przy pomocy przyrządów STIPA. Pomiary tym przyrządem należy wykonywać tylko w otoczeniu wolnym od dźwięków rozmów ludzi, w przeciwnym razie wynik może być całkowicie zafałszowany. Z resztą, instrukcja użytkowania przyrządu o tym mówi dosyć wyraźnie. Nie wierzyłem, że producent „wypuszcza na rynek” urządzenie tak niedoskonałe, ale sam przedstawiciel producenta na stoisku targowym pokazał mi dowód. W otoczeniu hałasu ludzkich rozmów ustawił mikrofon pomiarowy zaledwie 1m od głośnika z sygnałem pomiarowym i dokonał pomiaru. Wynik okazał się większy niż 1 STI !!
Dzieje się tak, ponieważ „sygnał testowy”, który imituje ludzką mowę miesza się z prawdziwą mową ludzi i w ten sposób znakomicie „fałszuje” próbkę pomiarową.
Traktując zatem poważnie zalecenia dokonywania pomiaru współczynnika zrozumiałości mowy w instalacjach DSO tzn. „w otoczeniu akustycznym zbliżonym do warunków rzeczywistego użytkowania pomieszczeń w budynku” - czyli z ludźmi, którzy raczej nie milczą jak w kościele – wyniki badania „zrozumiałości mowy” przyrządami STIPA mogą być bardzo łatwo podważone.
Wygoda i łatwość z jaka dokonuje się pomiarów (natychmiastowy odczyt) powoduje, że jest to aktualnie najpopularniejszy sposób badania „zrozumiałości mowy” przez instalatorów Alarmu Głosowego (DSO), z resztą przyrządy STIPA zostały wymyślone właśnie dla nich.
Jednakże, szanujący się inspektor akustyki nie będzie opierał się na wynikach badania przyrządami STIPA i z pewnością wybierze metodę IMPULSOWĄ.
Wspomnianych problemów przy prawidłowym wyznaczaniu współczynnika zrozumiałości mowy, unikniemy stosując metodę IMPULSOWĄ. Metoda ta bardzo precyzyjnie bada wszystkie parametry akustyki pomieszczenia i dokładnie wyznacza współczynnik zrozumiałości mowy wg. metody % ALcons, STI oraz RaSTI. Wprawdzie wynik nie jest natychmiastowy bowiem wymaga to przetworzenia ogromnej ilości danych ale za to pomiarów można dokonywać w każdych warunkach, pomiędzy rozmawiającymi ludźmi a nawet w dużym hałasie (np. w hali fabrycznej). Ograniczenia dotyczą wyłącznie samej instalacji oprzyrządowania bowiem aparatura „wypuszczająca” do systemu rozgłoszeniowego szumowy sygnał pomiarowy musi być jednocześnie połączona z mikrofonem pomiarowym znajdującym się w innym miejscu (tj. w pomieszczeniu badanym), które przecież może znajdować się daleko i na odległych kondygnacjach budynku. Stosując jednakże nowoczesne bezprzewodowe nadajniki do mikrofonów pomiarowych ograniczenie to nie wydaje się być już żadnym problemem.
* nazwa Alarm Głosowy jest zastrzeżona jako znak towarowy przez firmę BEL AQUSTIC
1 słyszalność: odnosi się do głośności nadawanych komunikatów i określana jest jako SPL (w dB)
2 czytelność: zwana wyrazistością, odnosi się do sposobu artykułowania wyrazów i jakości zapisu komend automatycznych.
3 klarowność: związana jest z przetwarzaniem głośników w pomieszczeniu i stosunku dźwięków bezpośrednich do odbitych.
BEL ACOUSTICS 2015-2023