HBM2 vs HBM3: Jämförelse och analys av dessa VRAM

Även om BIG Navi med RDNA2-arkitektur och dess Navi 2x-chips ännu inte har kommit ut på marknaden som sådan, är sanningen att AMD (och i mindre utsträckning NVIDIA) arbetar redan med att implementera efterföljaren till detta (som inte kommer att vara HBM2E): HBM3 . Även om vi inte vet för mycket om det idag har en serie jämförande data läckt ut mot HBM2 det är ganska intressant och kan tippa balansen i prestanda mellan de två företagen, hur mycket är förbättringen?

Som vi vet, HBM2 och HBM2E är två typer av VRAM med ett antal viktiga begränsningar för dess implementering och utveckling för GPU pommes frites. De har många fördelar ur prestanda och konsumtion, de är nuvarande av nödvändighet, men de kommer inte att vara framtiden som sådan.

För detta anländer HBM3, som inom det lilla vi vet om det kommer att avsluta problemen med sina två tidigare versioner. Fram till idag visste vi inte dess resultat, och framför allt hur mycket förbättring vi kan prata om jämfört med den version som den ersätter.

hbm2 vs hbm3

HBM2 vs HBM3: de första jämförelserna och prestationssimuleringarna kommer

HBM3-7

Som vi säger är de första uppgifterna redan här, förutom att de, som vanligtvis händer i dessa fall, inte erbjuds genom bandbredd, FPS eller någon annan gemensam metrisk inom spelbranschen.

Som ett högpresterande TOP-minne är affärsvärlden intresserad av att lära sig om förbättringar jämfört med HBM2 i ett exascale servermiljö, som i slutändan är världsdominerande för deras enorma kraft. Därför återspeglar de data vi kommer att se denna situation och fokuserar på att dra slutsatser för organisation, bandbredd, latens, kapacitet och makt.

HBM3-5

Frågan är klar och nyckel: i vilken utsträckning kommer framtida datorer att dra nytta av HBM3 kontra HBM2? Uppgifterna är ganska tydliga.

Som vi ser kommer optimeringen av HBM3 att bli en mer än viktig pelare i Exascale-system, och det är att det är möjligt att uppnå upp till en 1.7x ökning i hastighet i system över HBM2 med lite mer än antalet kärnor och delsystem-cachemätningar.

I HPCG kan bandbreddens prestanda skjuta upp till 600 GB / s i dessa miljöer från de 300 GB / s från vilka de första versionerna startar med låga hastigheter, ett scenario som upprepas till exempel i Stream.

HBM3-6

Det största problemet som HBM3 kommer att dra är just NoC-nätverk, där bandbredden är en flaskhals. Klustren kommer att få en liten förbättring i dessa fall så länge det inte finns någon sådan flaskhals, men det är inte en typ av minne som verkar vara för optimal för system som inte är exakt optimerade.

Antalet trådar, typer och storlekar av cache och kataloger är nyckeln

HBM3

Frekvensen och antalet kärnor har också mycket att säga, eftersom ökningen i bandbredd går från 1 till 2 GHz i 300 GB / s till 600 GB / s om nätfrekvensen är 5 GHz, något som just nu är utom räckhåll av nästan alla servrar i världen.

Det mest realistiska scenariot är en frekvens på 4 GHz, där det finns en liten minskning av den operativa bandbredden, särskilt i skala och kopia, men det är acceptabelt med tanke på den nuvarande effekten.

Antalet trådar, storlek på L1- och L2-cacheminnet samt antalet kataloger är också viktiga, särskilt i L1-cache. Skalbarhet är nästan 80% när man går från 12 till 24, något som inte återspeglas i de andra parametrarna men indikerar vikten som framtida arkitekturer kommer att ha vid denna tidpunkt, något som AMD har arbetat med under en tid och som Intel tog sig på allvar för drygt ett år sedan.

HBM3-2

Kortfattat, HBM3 för servrar är oerhört beroende av NoC-resurser, en maximal optimering krävs för att dra full nytta av det när det gäller bandbredd (mycket mer när de ökar sin sluthastighet i JEDEC) och i slutändan är det ett typminne som är mycket beroende av skalbarhet och Resurser.

I spel kommer det att bli ett mycket dyrt minne med nollfördelar, där det redan har varit vid flera tillfällen som inte ger någon nytta vid höga upplösningar och hertz. Det kommer dock säkert att användas av AMD i sin avancerade GPU när konsumtioner skyrocket och GDDR6 är inte ett alternativ på grund av dess spänning, där vi bara hoppas att det RDNA 2 kommer vara effektivare och därmed undvika implementering och kostnader på Lisa Su: s utrustning.

Å andra sidan har NVIDIA inga övertoner för användning av din GPU Tesla och kommer att fokusera på GDDR6 minnen 18 Gbps att öka bandbredden samtidigt som den totala konsumtionen av sina kort bibehålls, särskilt genom att dra nytta av nya noder 7 nm och 8 nm från TSMC och Samsung.