Project 152:

Psycho-akoestische aspecten bij digitalisering van audiosignalen


Datum bijeenkomst 152
woensdag 5 februari 2003

Titel
Psycho-akoestische aspecten bij digitalisering van audiosignalen

Locatie
Dr. Neher Laboratorium
St. Paulusstraat 4
2264 XZ Leidschendam

Sprekers
John Beerends (TNO)
Steven van de Par (Philips)

Tijd: 20:00 uur (19:30 is er koffie)

Openbaar vervoer
Vanaf Den Haag CS tram 6 of 2 tot Leidsenhage. Loop langs het winkelcentrum (Burg. Banninglaan), steek bij de stoplichten over en neem de 2e zijstraat rechts.

Per auto
Vanaf de A12 en A13 afslag Den Haag/Voorburg, rechtsaf richting Leidschendam. Rijd door tot u links het winkelcentrum Leidsenhage ziet. Voorbij het winkelcentrum bij de verkeerslichten rechtsaf (richting Stompwijk) en dan 2e straat rechts.

Contactpersoon
Peter Swarte, zie bestuur.

Aanmelden
Stuur de antwoordstrook per post of fax naar de secretaris of meld hier aan via de website.

Samenvatting

Voor deze avond hebben wij twee illustere heren uitgenodigd die ons een aantal psycho-akoestische effecten onder de aandacht brengen die een rol kunnen en zullen spelen bij de kwaliteit van bepaalde vormen van audiocodering.

De eerste spreker is John Beerends (TNO):

Audio heeft een geschiedenis achter zich van het steeds nauwkeuriger vastleggen van het akoestische signaal. Er zijn tegenwoordig zelfs systemen met sample frequenties van rond de 100 kHz en resoluties van 24 bits, resulterend in bitrates van ongeveer 5 Mbit/s. Uiteindelijk nemen we van al die informatie maar heel weinig waar, wat blijkt uit het feit dat een 0.2 Mbit/s MP3 file fantastisch kan klinken. Voor spraaksignalen kunnen we nog veel lagere bitrates gebruiken. In deze presentatie wordt ingegaan op de basisprincipes van het zuinig coderen en op de problemen die ontstaan op het moment dat we de kwaliteit van zulke signalen willen meten. Aandacht zal worden gegeven aan de meetstandaards die de ITU (International Telecommunication Union) heeft ontwikkeld voor het meten van spraak- en muziekkwaliteit. Speciaal de laatste ontwikkelingen, waarbij ook de kwaliteit van de transductie kan worden gemeten, zullen worden toegelicht.

De tweede spreker is Steven van de Par (Philips Research):

In deze presentatie worden enkele eigenschappen van geluidsmaskering besproken waarmee in het algemeen niet volledig rekening wordt gehouden in verliesbrengende audiocoderingsmethoden. In deze audiocoderingsalgoritmes wordt aangenomen dat de ruis die geïntroduceerd wordt, gemaskeerd wordt door het nuttige deel van het geluid. Het wordt zelfs aangenomen dat in elke afzonderlijke frequentieband het vervormde signaal onder de maskeringscurve ligt waardoor de totale vervorming onhoorbaar wordt. Echter, dit blijkt in verschillende studies niet het geval te zijn. De hoorbaarheid van het vervormde signaal integreert sterker over de gehele frequentieband dan verwacht mag worden uit de hoorbaarheid van de vervormde signalen in de verschillende kritieke frequentiebandjes. In de bestaande algoritmes wordt dit probleem opgelost door de reductie van het niveau van het complete vervormde signaal. Dit is echter, zoals aangetoond zal worden, niet de optimale oplossing. Het is beter om de vervorming te laten toenemen in spectraal verdeelde banden die erg duur zijn om te coderen en juist de bits die daardoor uitgespaard worden te gebruiken voor een sterkere reductie van de distorsie in die banden die eenvoudiger te coderen zijn. Dit alles leidt tot een toename van de kwaliteit zoals aangetoond zal worden in luistertesten.