Elektronik I Norden » De avslöjar röstens hemligheter

De avslöjar röstens hemligheter

Posted on maj 6th, 2013 by Göte Fagerfjäll

I ett omfattande europeiskt forskningsprojekt som leds av KTH ska en komplett modell av människorösten tas fram. Arbetet är redan igång, och forskningen inbegriper så väl fysiska modeller, simuleringar som visualiseringar av vår röst. Den ökade förståelsen ska utgöra en grund för att andra att jobba vidare med, och kan exempelvis leda till bättre talproteser, röstvård, talande robotar och undervisningsmöjligheter i sammanhang där människors röst spelar stor roll.

Sten Ternström, professor i musikakustik, är en av de KTH-forskare som ingår i Eunison som koordineras av KTH. Med tre forskningsgrupper från KTH som samarbetar med fyra andra röstexpertgrupperingar på universitet och forskningsinstitut i Frankrike, Tyskland och Spanien är projektet omfattande. Det gäller även budgeten, som ligger på 25 miljoner kronor och motsvarar många tusentals forskningstimmar, enligt Sten Ternström. – Människorösten är en mycket central del av våra liv, och därtill komplicerad. Därför behöver vi bättre förståelse för hur rösten fungerar, och hur den fallerar. Syftet med forskningen är att resultatet i förlängningen skall leda till bättre talproteser, röstvård, pratande maskiner och undervisningsmöjligheter. I projektet samarbetar en mängd röst- och beräkningsexperter på universitet över halva Europa, med kraftfulla datorer till sin hjälp. – Forskningsberäkningarna skulle förvisso kunna göras på en vanlig persondator, men det skulle resultera i biblisk tidsåtgång. Vi använder istället KTH:s superdator Lindgren, den vassaste vi har när det gäller kolossala beräkningsresurser. Det handlar visserligen i grunden om rätt enkla fysikaliska samband och de fyra räknesätten, men samtidigt är det snabba rörelser hos tiotusentals punkter i tre dimensioner vi talar om, så det blir väldigt mycket plus, minus och gånger, vilket gör forskningen beräkningstung. I den kompletta modellen över människorösten ingår alltså simuleringar och visualisering, där superdatorer spelar stor roll. Men även mekaniska modeller i silikon och plast av stämband, ansatsrör och tunga kommer att konstrueras samt studeras i experiment för att kontrollera att simuleringarna räknar rätt. – Rösten är en väldigt komplex företeelse, som kräver mycket arbete för att efterlikna och förstå. Vi är därför också intresserade av att se hur mycket modellen kan förenklas, utan att röstljuden påverkas av detta. Han tillägger att forskarna redan blivit klara med en förstudie, och har kommit igång med forskningsarbetet. En stor skillnad mot tidigare gjord forskning på området är att Eunison kommer att kombinera rön från flera discipliner, och gå från ax till limpa där tidigare insatser varit av mer fragmentarisk karaktär. Det finns sedan tidigare åtskilliga modeller av olika delar av rösten, som till exempel stämbanden eller ansatsröret, men de är oftast förenklade just för att man ska slippa de tunga fysikberäkningarna. – Vår färdiga modell över människorösten kommer att likna en marionettdocka. Forskaren rycker i en eller flera trådar och kan sedan se vad som händer. Han fortsätter med att berätta att röstmodellen ska vara styrbar över Internet. Det betyder att forskare var som helst ska kunna mata in data och få tillbaka en visualisering via nätet. Förutom Sten Ternström ingår även KTH-forskarna Olov Engwall, Johan Hoffman, Johan Jansson och Örjan Ekeberg i Eunison.

Filed under: SvenskTeknik

« Återvinning av sällsynta jordartsmetaller i forskningsprojekt IPv6 som standard i IP VPN-lösningar »

Fordonselektronik

Mätteknik

Embedded

Radio

De avslöjar röstens hemligheter

Kommentaren

Gästkommentaren

I periferin