Moore byts mot Kurzweil

Moores lag har dödförklarats många gånger och vi kan nog lugnt säga att vi nu arbetar i eran efter Moore. Men ingen är redo att sakta ner än. Ivo Bolsens, senior VP och CTO, Xilinx betraktar i den här artikeln Gordon Moores observation om transistorförtätning som bara en aspekt av en mer långsiktig underliggande teknisk trend – lagen om accelererande avkastning som utformats av Kurzweil.


Ivo Bolsens, senior VP och CTO, Xilinx


Visst kan det vara så att företagen blev något passiva under Moore-eran och nöjde sig med de vinster som varje ny processnod medförde. Även om vi kan förvänta oss att skalningen fortsätter, om än i långsammare takt, innebär slutet på Moores lag ett starkare incitament att driva fram andra trender hårdare.

Nu är några spännande nya tekniker på väg, till exempel 3D-integrering med flera chip: vi maxar varje kvadratmillimeter, så låt oss tänka i kubik. Vi kommer också att uppnå snabba vinster genom nya tekniker som minne med lagringskapacitet och kiselfotonik. När vi når den fysiska hastighetsgränsen för konventionella I/O-kretsar, vilken vi vet är omkring 100 Gbit/s per meter, kommer strävan att öka hastigheten för anslutning med flera chip och lägre I/O-effekt att lyfta kiselfotonikteknik till framtida generationer av avancerade IC-kretsar som FPGA:er.

En guldålder för datorarkitektur
Det här är verkligen en otroligt spännande tid. John Hennessy och David Patterson, 2017 års mottagare av Turing-priset och professorer på Stanford respektive Berkeley, har kallat det en guldålder för datorarkitektur, med strävan efter domänspecifika optimeringar som en av de viktigaste drivkrafterna. Jag kan peka på ett exempel i Xilinx AI-motor, en av de viktigaste och mest kraftfulla funktionerna i Versal ACAP(Adaptive Compute Acceleration Platform), som vi presenterade i oktober 2018. Jag tror att det är osannolikt att vi skulle ha gjort något liknande för bara några år sedan, när det var lättare att uppnå vinst på annat håll.

I dag handlar framsteg inte bara om bearbetningsprestanda. Jag nämnde tidigare utvecklingen av kiselfotonik som en teknik för att öka I/O-hastigheter. AI-explosionen är faktiskt en av de starkaste drivkrafterna och gör att vi fokuserar mer på att hitta snabbare sätt att flytta data till, inom och ut från acceleratorer som Versal-chip. Versals programmerbara NoC-sammankoppling (Network on Chip) med hög bandbredd och andra designfunktioner, till exempel nära och korta anslutningar mellan distribuerade minnen på chip och bearbetningselement, är ytterligare exempel på hur chiptillverkare ser bortom skalning för att uppnå prestandavinster av nästa generation.


Figur 1. Optimerad intern enhetsanslutning för ökad bearbetningshastighet och -effektivitet

Just nu är AI förmodligen det som influerar nuvarande och framtida processorarkitekturer allra mest.

Man kan konstatera att kraven för datacenterapplikationer driver mycket av vad Xilinx gör idag, och det handlar om att bredda arbetsbelastningen.

Tidigare har datacenter i hyperskala fungerat som stora databaser för våra dataarkiv och har lagrat video, bilder och ljud och tillhandahållit innehåll på begäran. Vi som individer och företag kräver allt mer när vi ansluter självkörande fordon och en massa IoT-dataströmmar från smarta fabriker, smarta städer och smarta infrastrukturer. Vi måste ha hjälp att hitta de djupa insikter som så desperat behövs för att fortsätta att öka företagens produktivitet, energieffektiviteten, den allmänna tryggheten och säkerheten samt levnadsstandarden.

Anpassningsbara och konfigurerbara datacenter
Med tanke på denna bredd av arbetsbelastningar behöver datacentren olika resurser för att hantera belastningarna effektivt. Datacenterarkitekturerna rör sig bort från stela CPU-centrerade strukturer och prioriterar istället anpassningsbarhet och konfigurerbarhet för att optimera resurser som minne och acceleratorer som är tilldelade till enskilda arbetsbelastningar. Det finns inte längre ett enda mätetal. Det handlar inte bara om TOPS. Andra mätvärden som överföringar per sekund och latens hamnar i förgrunden när efterfrågan blir mer realtidsbetonad, vilket självkörande fordon är ett självklart och viktigt exempel på.


Figur 2. Breddningen av molnarbetsbelastningar kräver större flexibilitet.

Det här är helt klart ett område där Xilinx kunskaper om programmerbara enheter är direkt tillämpbara, och vi tar fram lösningar som Versal ACAP för att uppfylla dessa branschbehov. Det visar hur långt företaget har kommit med tanke på att vår tidiga verksamhet huvudsakligen handlade om ASIC-designer som sökte snabbare designcykler och lägre utvecklingskostnader samt användare av EDA-programvara. Idag är vår kundbas mer computer scientists och data scientists. Det gör det ännu viktigare att vi levererar kraftfulla verktyg som hjälper dem att få maximal kraft från programmerbara enheter utan att behöva känna till alla arkitekturdetaljer. Jag tror att vårt initiativ PYNQ – Python on Zynq – kommer att vara ett viktigt steg i att göra avancerade programmerbara arkitekturer mer användbara för mer olikartade teknikcommunitys.

Expansionen av 5G
Hur kommer prioriteringarna att förändras i framtiden? Övergången till 5G är ett område som Xilinx har ägnat intensiva resurser åt och vi kan erbjuda värdefulla förslag som ingen annan kan. I många fall arbetar lösningar över de traditionella gränserna mellan molnet och Edge och integrerade plattformar som är energikrävande och kostnadskänsliga. Det finns mycket mer att göra när det gäller verktyg för att hantera den här spridningen av tillämpningar över dessa gränser.

Precis som IoT kommer 5G att vara starkt beroende av Edge computing och maskininlärning. Vi vet alla att dessa tekniker bara är i början av utvecklingen och att det de kommer att erbjuda mycket större möjligheter när vi förstår mer. I dag används maskininlärning kommersiellt i två faser: den första omfattar datainsamling, datamärkning och träning av neurala nätverk medan den andra fasen är driftsättning inom området av tränade inferensmotorer.

Redan nu kan vi se att den etablerade sekvensen är tungrodd och långsam och behöver stora mängder data och en mödosam märkning som kräver enorma resurser och infrastruktur. Många ser det som ohållbart framöver vad gäller energiförbrukning och time to market. Dessutom är tekniken inte tillgänglig för tillräckligt många utvecklare för att leverera de lösningar vi behöver. En övergång från traditionell dataintensiv träning av neurala nätverk till förstärkningsinlärning kan ge snabbare och mer ekonomiska strategier eftersom träning och driftsättning kan ske samtidigt.

Blockkedjans relevans
Jag vill nämna ytterligare en megatrend i branschen – blockkedjan. För vissa har den kanske redan fått ett dåligt rykte på grund av associationen till kryptovaluta, men jag tror att den kommer att bli mer relevant än många av oss inser. Vem hade kunnat förutse utvecklingen av dagens internet när ARPANET dök upp som en enkel plattform för distribuerad databehandling och e-post? Genom projekt som Hyperledger med öppen källkod skulle blockkedjetekniken kunna bli en banbrytande plattform för att bygga upp förtroendet för transaktioner som utförs via internet.

Snart kommer vi kanske att prata om det betrodda internet som effektivt skyddar integriteten genom att ge människor möjlighet att bekräfta data utan att behöva skicka in mer data, och som slutligen ger en lösning på problem som falska nyheter genom att tydligt identifiera ursprung och informationskällor. Vi måste hitta sätt att effektivt bygga och skala blockkedjeapplikationer, och tekniker som ACAP, vilka effektivt accelererar beräkning, lagring och nätverksarbete, kommer att vara en viktig del av lösningen.


Figur 3. Konfigurerbara programmerbara acceleratorer skulle kunna stödja framtida betrodda internetnoder.

Förutsägbarheten i Moores lag kan ha blivit lite för bekväm och långsam. I framtiden kommer vi att behöva maximerar flexibiliteten, smidigheten och effektiviteten i vår teknik och nå ut till grupper som kanske inte känner till den men som vi måste inkludera för att göra de framsteg som vi alla behöver. Nu när Moores ligger bakom oss kan vi tydligare se det oundvikliga i Kurzweils lag om accelererande avkastning.

Ivo Bolsens, senior VP och CTO, Xilinx

Comments are closed.