Strony: « 1 |
2 |
3 |
4 |
Realizacja wokodera w środowisku Reaktora cd.
Sobota, 21 grudnia
4. PODSUMOWANIE
Uzyskane w postaci próbek dźwiękowych wyniki pokazały, że środowisko Reaktora pozwala osiągnąć zadowalające efekty w dziedzinie konstrukcji wokoderów pasmowych. Zarówno w pierwszej, jak i drugiej realizacji, wyjściowy sygnał mowy jest zrozumiały. Podczas pracy z wokoderem muzycznym zauważono silne obciążenie procesora (program testowano na komputerze z procesorem Intel Celeron 1,7GHz i 128MB pamięci RAM), bo ok. 70% przy próbkowaniu 44,1kHz i tylko dwugłosowej polifonii.
Środowisko Reaktora nie umożliwia przeprowadzenia operacji typu splot, a zatem i również korelacji, czy autokorelacji, w związku z czym niektóre bloki konstruowane były z wykorzystaniem prostowania i filtracji. Wynikiem zastosowania takiej metody jest niezbyt dokładny pomiar częstotliwości tonu krtaniowego. Układ detekcji dźwięczności głosek pracuje najskuteczniej przy wyraźnie artykułowanych głoskach bezdźwięcznych, czego nie wykonywały osoby czytające testowane w badaniach wiersze. Problem ten mógłby być rozwiązany przez dobudowanie kompresora, który wprowadziłby jednak dodatkowe obciążenie procesora.
Przedstawione w punkcie 3.3 zastosowane rozwiązania ukazują, że dobór parametrów odpowiedzialnych za czytelną pracę wokodera nie jest łatwy i należy zwrócić na niego dużą uwagę. Z jednej strony ideałem byłoby, gdyby układ detekcji dźwięczności głosek reagował natychmiast, a z drugiej, aby wykrycie to było jednoznaczne. W rzeczywistości tak jednak nie jest i należy się zdecydować na kompromis (rysunek 4b). Podobna sytuacja ma miejsce w przypadku układu detekcji amplitud sygnałów wyjściowych z filtrów pasmowych. Zbyt mocne wygładzenie przebiegu powoduje utratę zrozumiałości, natomiast zbyt słabe implikuje pojawianie się nieprzyjemnego chropowatego przydźwięku.
Autor: Tomasz STACHURA
LITERATURA
[1] ALEXANDROV IVANOV P., Speech analysis and synthesis by linear predictive coding, Praca dyp-lomowa, Sheffield Hallam University, 1995, 1, 12–13.
[2] BASZTURA CZ., Źródła, sygnały i obrazy akustyczne, Warszawa, Wydawnictwa Komunikacji i Łączności, 1988, 59–76, 231–239.
[3] SAPOŻKOW M.A., Sygnał mowy w telekomunikacji i cybernetyce, Warszawa, Wydawnictwa Na-ukowo–Techniczne, 1966, 246–267. Czytaj dalej
Artykuły z tej samej kategorii