De sleutels die de toekomstige prestaties van pc's en consoles zullen beperken

Hoe zou u de prestaties van een pc of een console definiëren? Elk zal een ander standpunt hebben over wat ze van beide apparaten verwachten, maar zoals we weten, beginnen ze steeds meer op elkaar te lijken, zowel in deugden als in gebreken. Vandaag gaan we het hebben over dat laatste, aangezien de beperkingen die we de komende jaren gaan zien de toekomst zullen markeren van een industrie die zich steeds meer op games richt en contentcreatie en AI- en DL-taken overlaat aan de professionele sector. Dit zijn prestaties omdat latentie pc- en consolecomponenten beïnvloedt.

In werkelijkheid, waar we ook kijken in de industrie, de architecturen, hoewel verschillend, zijn steeds meer gericht op meer specifieke sectoren, ja, maar ze hebben dezelfde basis, dezelfde problemen, dezelfde voordelen. Daarom gaan we de belangrijkste hardware-knelpunten en hun ontwikkeling zien om te begrijpen waar we naartoe gaan.

toekomstige prestaties van pc's en consoles

Verschillende componenten, verschillende beperkingen, prestaties en latenties

De beperkingen of knelpunten zijn logischerwijs in elk onderdeel anders, maar hebben in alle gevallen met meer of minder belang iets gemeen: latency. In sommige gevallen is het key, in andere gevallen gaat het op zijn tenen, maar het zal ongetwijfeld de prestaties in de komende jaren markeren. Bovendien is het onduidelijk voor pc of console, waar ze, behoudens hun bijzonderheden, ook worden beïnvloed.

Om ons een idee te geven van wat latentie van belang is, hebben we deze grafiek die destijds op de een of andere manier beroemd werd en die vrij goed illustreert wat het betekent in verschillende componenten, nanoseconden, milliseconden en seconden, vergeleken met tijd zoals we normaal als mensen waarnemen.

Zoals je kunt zien in een 3 GHz processor een vertraging in klokcycli van slechts 0.3 ns zou voor ons een waarneming van 1 seconde betekenen. Toegang tot de L3, die gemiddeld ongeveer 12 ns is, afhankelijk van de architectuur van de processor, vertegenwoordigt 43 seconden van ons leven.

Actie gemiddelde latentie Voltooiingstijd voor één persoon
Tijd van een klokcyclus op 3 GHz 0.3ns 1 tweede
Toegangstijd tot de L1-cache van een CPU 0.9ns 3 seconden
Toegangstijd CPU L2 cache 2.8ns 9 seconden
L3 toegangstijd 12.9ns 43 seconden
RAM-toegangstijd Tussen 70 tot 100 ns Tussen 3.5 minuten en 5.5 minuten
I/O-timing van een NVMe SSD Tussen 7 en 150 picoseconden Tussen 2 uur en 2 dagen
HDD invoer- en uitvoertijd Tussen 1 en 10 ms Tussen 11 dagen en 4 maanden
Internet, toegangstijd van San Francisco naar New York 40ms 1.2 jaar
Internettijd tussen San Francisco en Australië 183ms 6 jaar
Virtualisatie van een besturingssysteem opnieuw starten 4 seconden 127 jaar
Start een virtualisatie opnieuw 40 seconden 1200 jaar
Start een fysiek systeem opnieuw op 90 seconden 3 millennia

Als we dit extrapoleren naar de RAM en tot 100 ns gaan, zou dit gelijk staan ​​aan een afstand van 5.5 minuten naar onze bestemming. Misschien wel het meest opvallende zijn de latentietijden van internet, iets wat iedereen kan begrijpen, en dat is dat als we 40 milliseconden tussen San Francisco en New York hebben, dit gelijk staat aan 1.2 jaar van ons leven verliezen en als we veranderen de bestemming naar Australië maar liefst 6 jaar.

Daarom is latentie erg belangrijk op een pc of op een console, waar, zoals we zien, elke generatie al meer dan 40 jaar vecht om deze te verminderen om de prestaties per instructie en cyclus te verbeteren. Dat gezegd hebbende, gaan we kijken hoe dit de hoofdcomponenten beïnvloedt en of er op dit aspect op korte of lange termijn verbeteringen zijn.

DRAM Latencia Cero

Processor latentie

Het is het onderdeel dat verreweg het meest te lijden heeft. Voormalig AMD Chief Architect Jim Keller definieerde het destijds briljant:

Prestatielimieten zijn voorspelbaarheid van instructies en gegevens

Dat wil zeggen, als je kunt voorspellen welke middelen nodig zijn voor elke instructie en data, dan kun je ze beter beheren en dus minder tijd ertussen genereren of de prestaties verhogen.

Nogmaals de latentie hier en het is dat het probleem eerst door AMD werd gezien en nu Intel zal het gedeeltelijk oplossen in Raptor Lake: vergroot de grootte van de caches om toegangstijden en de passage van instructies en gegevens in de cachehiërarchie te verminderen.

Er wordt geprobeerd om geen toegang te krijgen tot het RAM-geheugen, of de toegangscycli zo veel mogelijk te beperken. AMD deed het al met Ryzen en Zen 2 tot Zen 3, Intel zal het nu doen in zijn volgende architectuur.

Micro-operaties CPU

RAM en GDDR6-geheugen

Het is misschien wel het belangrijkste aspect in deze twee componenten. RAM-geheugen is altijd in het geding vanwege latentie, maar wat echt nodig is, is meer bandbreedte, meer frequentie, meer snelheid zonder de verhoudingen met timings in gevaar te brengen. DDR5 heeft dit voorgoed losgelaten en hoewel we het niet zo veel zullen merken op pc's als op servers, is het een noodzakelijke technologie voor de sector in het algemeen.

Wat GDDR6 betreft, is latentie niet zo belangrijk als de resulterende bandbreedte, aangezien de rekencapaciteit van GPU's toeneemt en ze gegevens uit de bijbehorende geheugens moeten leveren. Daarom is latentie secundair, hoewel het verre van verwaarloosbaar is.

Er zijn ook geen verbeteringen in zicht in vergelijking met GDDR6X als zodanig, waar snelheid en frequentie worden verhoogd met behoud van latentie bij dezelfde klokcycli.

SSD, prestaties en de latentie op pc

Ze zijn het minst afhankelijk van deze factor, maar latentie is noodzakelijk voor willekeurige bewerkingen met hoge bandbreedte. Controllers moeten steeds meer gegevens uitwisselen met cellen en daarom kunnen de prestaties niet verloren gaan met klokcycli die van invloed zijn op de onbewerkte bandbreedte op basis van IOPS.

Samenvattend zijn het de processorkernen die het meest worden beïnvloed door hun cache, iets dat over niet al te lange tijd zal gebeuren met de GPU's, aangezien ze ook hun omvang vergroten en ze uit de Shaders-groepen exporteren, zoals AMD heeft gedaan met Infinity Fabric en Oneindige cache, waar ze juist van plan zijn niet afhankelijk te zijn van een hogere snelheid van GDDR op GPU's en tegelijkertijd geen ruimte in beslag nemen op CU-eenheden.

Er is een zeer merkwaardige animatie die door te klikken op de verschillende elementen die worden weergegeven, perfect wordt begrepen hoe belangrijk de latentie van het systeem in de verschillende componenten is. Je hoeft alleen maar toegang te krijgen een website en begin te klikken om de animatie te zien van hoe de elementen werken,

Het is vooral interessant als we op het systeemgeheugen blijven klikken, dan gaan we naar L2 en dan naar L1 om de organisatie en de stroom van prestaties en latentie daartussen te zien, echt nieuwsgierig en leerzaam. Daarom was de passage van AMD met Zen 2 en Zen 3 cruciaal om Intel het hoofd te kunnen bieden ten koste van een zeer grote ruimte in de DIE, iets dat Intel nu moet repliceren en dat het niet eerder zou moeten doen vanwege zijn lithografisch proces. .

Latencia-rendimiento-pc

Temperatuur, serieuzer dan latentie en prestaties op pc?

Een bepalende factor in de prestatie van een chip is logischerwijs de temperatuur. Het probleem is dat dit inherent is aan de technologie, aangezien elke chip die een spanning heeft, door een eenvoudige bediening een hogere of lagere temperatuur zal hebben. Hoe groter de complexiteit van de chip, hoe groter het aantal kernen en eenheden, hoe meer frequentie en logischerwijs hoe meer spanning hij nodig heeft, dus hij zal meer opwarmen.

Zoals verwacht is dit enigszins dubbelzinnig, aangezien het altijd een beperkende factor zal zijn, maar tegelijkertijd is warmte geen technologische factor en moeten we er gewoon mee leven zoals we dat doen sinds de creatie van de eerste chip.

Kortom, de latentie in pc en de prestaties van de verschillende componenten is de belangrijkste factor die deze (prestaties) meer dan enig ander beperkt en zal beperken, aangezien het niets waard is om een ​​hogere algemene snelheid te hebben als de toegangstijd en de overdracht van informatie tussen componenten loopt steeds meer vertraging op.