Ny arkitektur ökar tillförlitligheten i hårdvara

För tre år sedan startade projektet DeSyRe (on-Demand System Reliability) med målsättningen att skapa extremt tillförlitliga medicintekniska produkter. Nu kommer resultat som visar att med en ny arkitektur skulle datorkomponenter för extremt kritiska applikationer kunna använda 28 procent mindre energi, uppta 48 procent mindre utrymme och samtidigt ge nio gånger lägre felfrekvens för hårdvaran, enligt Chalmers.

Desyre-konsortiet lovade vid projektstarten att ta fram nya designtekniker för att motverka en förväntad stigande andel fel i datorkomponenter och samtidigt minimera prestandaförlusten samt den energiförbrukning som detta medför.

För att nå dessa ambitiösa mål introducerade Desyre ett annorlunda sätt att tackla tillförlitligheten hos datorkomponenter genom att separera ett datorsystem i två olika delsystem. Ett första delsystem består av vanliga, utbytbara processorkärnor som är naturligt felbenägna. Ett andra delsystem är extremt resistent mot fel och övervakar tillståndet hos kärnorna i det första delsystemet. För att försäkra att varje kärna i det andra delsystemet kan det första delsystemet hantera en tilldelad deluppgift korrekt och effektivt. I händelse av ett diagnostiserat fel överförs uppgifter från en kärna till andra, vilande kärnor i samma delsystem.
– Vi har i Desyre projektet utvecklat ett nytt koncept som effektivt kan hantera olika typer av fel med givna resurser, säger Ioannis Sourdis, docent i datorteknik på Chalmers tekniska högskola, och projektledare för Desyre.

– Vi jämförde Desyre-arkitekturen med befintliga tillförlitlighetsmetoder, och Desyre var bättre på alla områden. Resultaten var bättre än vi förutsett i början av projektet, och överträffar alla våra förväntningar.

Jämfört med ett standard Triple-Modular-Redundans-system (TMR, ett system som jämför utdata från tre identiska moduler och sedan litar på "majoriteten"), kräver Desyre-systemet 46 procent mindre chiputrymme och 28 procent mindre energi för att uppnå samma tolerans mot transienta fel och samma prestanda som ett typiskt TMR-system.

Alternativt och jämfört med ett tidsredundant system (programmet körs två gånger och resultatet jämförs), exekverar Desyre koden 14-32 procent snabbare. Sist men inte minst, när man tittar på permanenta fel och jämför Desyre med ett system som dubblerar resurserna på samma utrymme (ett system där allt genomförs med en back-up-reservdel som tar över vid funktionsfel), reducerar Desyre antalet systemfel (FIT) med nästan en storleksordning, faktor 10, enligt Chalmers.

– Vi räknade med att Desyre skulle minska FIT med cirka 40 procent som mest, och var mycket nöjda med att nå en minskning av antalet fel med en storleksordning, säger Riccardo Mariani, CTO på Yogitech, och internationellt erkänd specialist på bilsäkerhet.

– De nya teknikerna skapades för extremt tillförlitliga medicinska datorsystem, men användningen är inte begränsad till den marknaden. Jag förväntar mig Desyre-liknande system i våra framtida bilar, till exempel självkörande bilar, eftersom vi designar datorsystem för fordon med mycket utmanande krav på tillförlitlighet för att uppfylla stränga funktionella säkerhetsstandarder.

Om EU FP7-projektet Desyre

Desyre-konsortiet samlar ledande europeiska experter på området för feltolerant och självreparerande design, från både akademi och industri. Universitets partners är: Chalmers (Sverige) – projektledare, University of Bristol (Storbritannien), EPFL (Schweiz), Forth (Grekland) och Imperial College London (Storbritannien). Industripartners är Neurasmus och Recore Systems (Nederländerna) och Yogitech (Italien).

Projektets startdatum var 1 oktober 2011 och slutdatumet är nu, i mars 2015.

Comments are closed.