Nycklarna som kommer att begränsa framtida prestanda för datorer och konsoler

Hur skulle du definiera prestandan för en PC eller en konsol? Var och en kommer att ha olika syn på vad de förväntar sig av båda enheterna, men som vi vet blir de mer och mer lika både vad gäller dygder och defekter. Idag kommer vi att ta itu med det senare, eftersom de begränsningar som vi kommer att se under de kommande åren kommer att markera framtiden för en bransch som alltmer fokuserar på spel och lämnar innehållsskapande och AI- och DL-uppgifter till den professionella sektorn. Detta kommer att vara prestanda eftersom latens påverkar PC- och konsolkomponenter.

I verkligheten, oavsett var vi tittar i branschen, är arkitekturerna, även om de är olika, alltmer fokuserade på mer specifika sektorer, ja, men de har samma bas, samma problem, samma fördelar. Det är därför vi kommer att se de viktigaste hårdvaruflaskhalsarna och deras utveckling för att förstå vart vi är på väg.

Olika komponenter, olika begränsningar, prestanda och latenser

Logiskt sett är begränsningarna eller flaskhalsarna olika i varje komponent, men de har något gemensamt i alla fall med större eller mindre betydelse: latens. I vissa fall är det nyckeln, i andra går det på tå, men det kommer utan tvekan att prägla prestationen de kommande åren. Dessutom är det otydligt för PC eller konsol, där de också påverkas, om de sparar sina särdrag.

För att ge oss en uppfattning om vad latens spelar roll har vi det här diagrammet som på något sätt blev känt vid den tiden och som illustrerar ganska bra vad det betyder i olika komponenter, nanosekunder, millisekunder och sekunder, jämfört med tid som vi normalt uppfattar som människor.

Som du kan se i en 3 GHz processor en fördröjning i klockcykler på endast 0.3 ns skulle innebära en uppfattning om 1 sekund för oss. Att komma åt L3, som i genomsnitt är cirka 12 ns beroende på processorns arkitektur, representerar 43 sekunder av vårt liv.

Handling	genomsnittlig latens	Sluttid för en person
Tiden för en klockcykel vid 3 GHz	0.3ns	1 2:a
Åtkomsttid till L1-cachen för en CPU	0.9ns	3 sekunder
CPU L2-cacheåtkomsttid	2.8ns	9 sekunder
L3 åtkomsttid	12.9ns	43 sekunder
RAM-åtkomsttid	Mellan 70 till 100 ns	Mellan 3.5 minuter och 5.5 minuter
I/O-timing för en NVMe SSD	Mellan 7 till 150 pikosekunder	Mellan 2 timmar och 2 dagar
HDD ingång och utgångstid	Mellan 1 och 10 ms	Mellan 11 dagar och 4 månader
Internet, åtkomsttid från San Francisco till New York	40ms	1.2 år
Internettid mellan San Francisco till Australien	183ms	6 år
Startar om virtualisering av ett OS	4 sekunder	127 år
Starta om en virtualisering	40 sekunder	1200 år
Starta om ett fysiskt system	90 sekunder	3 årtusenden

Om vi extrapolerar detta till RAM och gå upp till 100 ns skulle det motsvara att åka en sträcka till vårt mål på 5.5 minuter. Det kanske mest slående är internets latenstider, något vanligare som alla kan förstå, och det är att om vi har 40 millisekunder mellan San Francisco och New York skulle det motsvara att förlora 1.2 år av vårt liv och om vi förändras destinationen till Australien inte mindre än 6 år.

Därför är latens väldigt viktigt på en PC eller på en konsol, där, som vi ser, varje generation har kämpat i mer än 40 år för att minska den för att öka prestandan per instruktion och cykel. Med det sagt kommer vi att se hur det påverkar huvudkomponenterna och om det finns förbättringar i denna aspekt på kort eller lång sikt.

Processorlatens

Det är den komponent som lider mest. Före detta AMD Chefsarkitekt Jim Keller definierade det briljant på den tiden:

Prestandagränser är förutsägbarheten av instruktioner och data

Det vill säga, om du kan förutsäga vilka resurser som behövs för varje instruktion och data, kan du hantera dem bättre och därför generera mindre tid mellan dem eller öka prestandan.

Återigen är latensen här och det är att problemet sågs först av AMD och nu Intel kommer att lösa det delvis i Raptor Lake: öka storleken på cacharna för att minska åtkomsttider och passage av instruktioner och data i cachehierarkin.

Det man försöker är att inte komma åt RAM-minnet, eller begränsa åtkomstcyklerna så mycket som möjligt. AMD gjorde det redan med Ryzen och Zen 2 till Zen 3, Intel kommer att göra det nu i sin nästa arkitektur.

RAM och GDDR6-minne

Det är möjligen den viktigaste aspekten i dessa två komponenter. RAM-minne är alltid ifrågasatt på grund av latens, men det som verkligen efterfrågas är mer bandbredd, mer frekvens, mer hastighet utan att kompromissa med förhållanden med timings. DDR5 har släppt detta för gott och även om vi inte kommer att märka det lika mycket på PC som på servrar är det en nödvändig teknik för sektorn i stort.

När det gäller GDDR6 är latens inte lika viktig som den resulterande bandbredden, eftersom datorkapaciteten hos GPU:er ökar och de behöver leverera data från sina tillhörande minnen. Därför är latens sekundär, även om den är långt ifrån försumbar.

Det finns heller inga förbättringar i sikte jämfört med GDDR6X som sådan, där hastighet och frekvens ökas samtidigt som latensen bibehålls vid samma klockcykler.

SSD, prestanda och dess latens på PC

De är minst beroende av denna faktor, men latens är nödvändig för slumpmässiga operationer med hög bandbredd. Styrenheter behöver utbyta mer och mer data med celler och därför kan prestanda inte förloras med klockcykler som påverkar rå bandbredd baserad på IOPS.

Sammanfattningsvis är det processorkärnorna som påverkas mest av deras cache, något som kommer att hända inom kort med GPU:erna, eftersom de också ökar sin storlek och exporterar dem från Shaders-grupperna som AMD har gjort med Infinity Fabric och Infinity cache, där just de har för avsikt att inte vara beroende av en högre hastighet på GDDR på GPU:er och samtidigt inte ta upp plats på CU-enheter.

Det finns en mycket märklig animation som bara genom att klicka på de olika elementen som är representerade, förstår vikten av latensen hos systemet i dess olika komponenter perfekt. Du måste bara komma åt en hemsida och börja klicka för att se animeringen av hur elementen fungerar,

Det är särskilt intressant när vi fortsätter att klicka på systemminnet, sedan går vi till L2 och sedan L1 för att se organisationen och flödet av prestanda och latens mellan dem, riktigt nyfiken och lärorik. Därför har passagen av AMD med Zen 2 och Zen 3 varit avgörande för att kunna möta Intel till priset av ett mycket stort utrymme i DIE, något som Intel nu måste replikera och som det inte borde göra tidigare på grund av dess litografisk process. .

Temperatur, allvarligare än latens och prestanda på PC?

Logiskt sett är temperaturen en avgörande faktor för prestandan för alla chip. Problemet är att detta är inneboende i tekniken, eftersom alla chip som har en spänning kommer att få en högre eller lägre temperatur genom enkel operation. Ju större komplexitet chipet har, desto större antal kärnor och enheter har det, desto mer frekvens och logiskt desto mer spänning behöver det, ergo kommer det att värmas upp mer.

Som väntat är detta något tvetydigt, eftersom det alltid kommer att vara en begränsande faktor, men samtidigt är värme inte en teknisk faktor och vi får helt enkelt leva med det som vi har gjort sedan det första chippet skapades.

Kort sagt, latensen i PC och prestanda för de olika komponenterna är nyckelfaktorn som är begränsande och kommer att begränsa denna (prestandan) mer än någon annan, eftersom det inte är värt något att ha en högre generell hastighet om åtkomsttiden och överföring av information mellan komponenter försenas alltmer.