HBM2 vs HBM3: Comparație și analiză a acestor VRAM

Deși BIG Navi cu arhitectură RDNA2 și cipurile sale Navi 2x nu au venit încă pe piață ca atare, adevărul este că AMD (și într-o măsură mai mică NVIDIA) lucrează deja la implementarea succesorului acestuia (care nu va fi HBM2E): HBM3 . Deși astăzi nu știm prea multe despre el, s-au scurs o serie de date comparative HBM2 aceasta este destul de interesantă și poate propune echilibrul de performanță între cele două companii, cât de mult este îmbunătățirea?

După cum știm, HBM2 și HBM2E sunt două tipuri de VRAM cu o serie de limitări importante la implementarea și dezvoltarea acestuia pentru GPU chipsuri. Au multe avantaje din punct de vedere al performanței și al consumului, sunt prezentul din necesitate, dar nu vor fi viitorul ca atare.

Pentru aceasta, ajunge HBM3, care în ceea ce nu știm despre el, va pune capăt problemelor celor două versiuni anterioare. Până astăzi, nu știam performanțele sale și, mai ales, despre cât de multe îmbunătățiri putem vorbi în comparație cu versiunea pe care o înlocuiește.

hbm2 vs hbm3

HBM2 vs HBM3: sosesc primele comparative și simulări de performanță

HBM3-7

După cum spuneam, primele date sunt deja aici, cu excepția faptului că, așa cum se întâmplă de obicei în aceste cazuri, acestea nu sunt oferite prin lățime de bandă, FPS sau alte alte metrici comune din sectorul jocurilor.

Ca o memorie TOP de înaltă performanță, lumea afacerilor este interesată să afle despre îmbunătățiri ale HBM2 într-un an exascale mediul de server, care sunt în cele din urmă dominatorii mondiali pentru puterea lor extraordinară. Prin urmare, datele pe care le vom vedea reflectă această situație și se concentrează pe extragerea concluziilor pentru organizare, lățime de bandă, latență, capacitate și putere.

HBM3-5

Întrebarea este clară și cheie: în ce măsură PC-urile viitoare vor beneficia de HBM3 vs. HBM2? Datele sunt destul de clare.

După cum putem vedea, optimizarea HBM3 va fi un pilon mai mult decât important în sistemele Exascale, și este posibil să se obțină până la Viteză de 1.7x creștere în sisteme peste HBM2 cu puțin mai mult decât numărul de nuclee și cache-uri de subsistem măsoară.

În HPCG performanța în lățimea de bandă poate filma până la 600 GB / s în aceste medii de la 300 GB / s de la care primele versiuni pornesc cu viteze mici, scenariu care se repetă în Stream, de exemplu.

HBM3-6

Principala problemă pe care HBM3 o va trage este tocmai rețelele NoC, în care lățimea de bandă este un blocaj. Clusterele vor avea o ușoară îmbunătățire în aceste cazuri, atât timp cât nu există un astfel de blocaj, dar nu este un tip de memorie care pare a fi prea optim pentru sisteme care nu sunt optimizate cu exactitate.

Numărul de fire, tipuri și dimensiuni de cache, precum și directoarele sunt cheie

HBM3

Frecvența și numărul de nuclee au, de asemenea, multe de spus, deoarece creșterea lățimii de bandă merge de la 1 la 2 GHz în 300 GB / s la 600 GB / s dacă frecvența rețelei este de 5 GHz, ceva care acum nu este la îndemână. a aproape toate serverele din lume.

Cel mai realist scenariu este o frecvență de 4 GHz, unde există o ușoară scădere a lățimii de bandă operaționale, în special la scară și copie, dar este acceptabilă luând în considerare puterea curentă.

Numărul de fire, dimensiunea cailor L1 și L2, precum și numărul de directoare sunt, de asemenea, esențiale, în special în memoria cache L1. Scalabilitatea este de aproape 80% atunci când se trece de la 12 la 24, lucru care nu se reflectă în ceilalți parametri, dar indică importanța pe care o vor avea viitoarele arhitecturi în acest moment, lucru la care AMD lucrează de ceva timp și că Intel s-a luat în serios cu puțin peste un an în urmă.

HBM3-2

Pe scurt, HBM3 pentru servere depinde extrem de mult de resursele NoC, va fi necesară o optimizare maximă pentru a profita din plin de aceasta în ceea ce privește lățimea de bandă (mult mai mult atunci când își măresc viteza finală în JEDEC) și, în final, este un tip de memorie foarte dependent de scalabilitate și resurse.

În jocuri va fi din nou o memorie foarte scumpă cu zero beneficii, unde a fost deja în mai multe rânduri care nu oferă niciun beneficiu la rezoluții mari și hertz. Acesta va fi, însă, cu siguranță utilizat de AMD în GPU-ul său de înaltă performanță atunci când consumurile se ridică și GDDR6 este nu este o opțiune datorită tensiunii sale, unde avem doar speranța că ADN-ul 2 va să fie mai eficient și, astfel, să evitați implementarea și costurile sale cu echipamentele Lisa Su.

Pe de altă parte, NVIDIA nu are abonamente de utilizare din GPU Tesla și se va concentra pe GDDR6 amintiri 18 Gbps pentru a crește lățimea de bandă, menținând în același timp consumul general al cardurilor lor, în special profitând de noi noduri 7 nm și 8 nm de la TSMC și Samsung.