Konferencja Naukowa Studentów » 2004 » Elektronika
Strony: « 1 | 2 | 3 | 4 |

Realizacja wokodera w środowisku Reaktora cd.

Sobota, 21 grudnia

4. PODSUMOWANIE

Uzyskane w postaci próbek dźwiękowych wyniki pokazały, że środowisko Reaktora pozwala osiągnąć zadowalające efekty w dziedzinie konstrukcji wokoderów pasmowych. Zarówno w pierwszej, jak i drugiej realizacji, wyjściowy sygnał mowy jest zrozumiały. Podczas pracy z wokoderem muzycznym zauważono silne obciążenie procesora (program testowano na komputerze z procesorem Intel Celeron 1,7GHz i 128MB pamięci RAM), bo ok. 70% przy próbkowaniu 44,1kHz i tylko dwugłosowej polifonii.

Środowisko Reaktora nie umożliwia przeprowadzenia operacji typu splot, a zatem i również korelacji, czy autokorelacji, w związku z czym niektóre bloki konstruowane były z wykorzystaniem prostowania i filtracji. Wynikiem zastosowania takiej metody jest niezbyt dokładny pomiar częstotliwości tonu krtaniowego. Układ detekcji dźwięczności głosek pracuje najskuteczniej przy wyraźnie artykułowanych głoskach bezdźwięcznych, czego nie wykonywały osoby czytające testowane w badaniach wiersze. Problem ten mógłby być rozwiązany przez dobudowanie kompresora, który wprowadziłby jednak dodatkowe obciążenie procesora.

Przedstawione w punkcie 3.3 zastosowane rozwiązania ukazują, że dobór parametrów odpowiedzialnych za czytelną pracę wokodera nie jest łatwy i należy zwrócić na niego dużą uwagę. Z jednej strony ideałem byłoby, gdyby układ detekcji dźwięczności głosek reagował natychmiast, a z drugiej, aby wykrycie to było jednoznaczne. W rzeczywistości tak jednak nie jest i należy się zdecydować na kompromis (rysunek 4b). Podobna sytuacja ma miejsce w przypadku układu detekcji amplitud sygnałów wyjściowych z filtrów pasmowych. Zbyt mocne wygładzenie przebiegu powoduje utratę zrozumiałości, natomiast zbyt słabe implikuje pojawianie się nieprzyjemnego chropowatego przydźwięku.

Autor: Tomasz STACHURA

LITERATURA

[1] ALEXANDROV IVANOV P., Speech analysis and synthesis by linear predictive coding, Praca dyp-lomowa, Sheffield Hallam University, 1995, 1, 12–13.
[2] BASZTURA CZ., Źródła, sygnały i obrazy akustyczne, Warszawa, Wydawnictwa Komunikacji i Łączności, 1988, 59–76, 231–239.
[3] SAPOŻKOW M.A., Sygnał mowy w telekomunikacji i cybernetyce, Warszawa, Wydawnictwa Na-ukowo–Techniczne, 1966, 246–267.
Czytaj dalej

Artykuły z tej samej kategorii
1. Stałoprądowy model Shichman’a-Hodges’a tranzystora MOS w programie SPICE
2. Wyznaczanie charakterystyk statycznych diod schottky’ego w programie spice
3. Pomiary zrozumiałości mowy w dźwiękowych systemach ostrzegawczych

powrót »

Kategorie


projekt i wykonanie: smetek.biz