AMD Chiplets: Explicație detaliată a brevetului

Chiplets AMD

Acum câteva săptămâni a fost atribuit un brevet AMD a fost publicat, explică modul în care vor funcționa GPU-urile lor împărțite în mai multe jetoane, ceea ce va fi o regulă generală nu numai pentru ei, ci și pentru competiție. Unde știm asta NVIDIA Hopper și Intel Xe-HP sunt împărțite în mai multe jetoane. Dar soluția AMD este oarecum diferită de cea propusă de concurența sa, explicăm brevetul pentru chiplets AMD.

Motivul pentru care GPU-urile duale au dispărut din mediul intern și este răspunsul la întrebarea de ce nu mai vedem plăcile grafice compatibile cu NVIDIA SLI sau AMD Crossfire este același, aplicațiile pe care le folosim pe computerele noastre sunt programate pentru a utiliza o singură GPU.

GPU AMD Dual

În jocurile video pe PC, când utilizați un GPU dual. Sunt folosite tehnici precum Redarea cadrelor alternative, în care fiecare GPU redă un cadru alternativ față de celălalt sau Redarea cadrelor împărțite în care perechea de GPU-uri împart munca unui singur cadru.

În calculul prin GPU această problemă nu apare, motiv pentru care în sistemele în care plăcile grafice nu sunt utilizate pentru a reda grafica, găsim mai multe dintre ele care funcționează în paralel fără probleme. Mai mult, aplicațiile care folosesc GPU-uri ca procesoare de date paralele sunt deja concepute pentru a profita de GPU-urile în acest mod.

Creșterea dimensiunii GPU-urilor în ultimii ani

RDNA 2 mor

Dacă ne uităm la evoluția GPU-urilor din ultimii ani, vom vedea că a existat o creștere considerabilă în zona GPU-urilor de top de la o generație la alta.

Cel mai rău scenariu actual? Nu există încă un GPU care să aibă performanța ideală pentru jocurile 4K. Trebuie luat în considerare faptul că o imagine 4K nativă are de 4 ori mai mulți pixeli decât unul la 1080p și, prin urmare, vorbim despre o mișcare de date care este de patru ori mai mare decât cea necesară pentru Full HD.

În situația actuală din VRAM, avem cazul GDDR6, memoria menționată utilizează o interfață de 32 de biți pe cip, împărțită în două canale de 16 biți, dar, cu o viteză de ceas care determină creșterea consumului său de energie, aceasta conduce să căutăm alte soluții pentru a extinde lățimea de bandă.

Extinderea lățimii de bandă a VRAM

GDDR6 fond circuit

Dacă dorim să extindem lățimea de bandă, există două opțiuni:

  • Prima este creșterea vitezei de ceas a memoriei, dar trebuie să se țină cont de faptul că tensiunea este pătrată atunci când crește MHz și, odată cu aceasta, consumul de energie.
  • A doua este creșterea numărului de pini, care ar fi să treacă de la 32 de biți la 64 de biți.

Nu putem uita nici de lucruri precum PAM-4 folosit în GDDR6X, dar aceasta a fost o mișcare a Micron pentru a evita atingerea vitezei mari de ceas. Deci, ar trebui să se aștepte o magistrală pe 64 de biți pentru fiecare cip VRAM pentru un posibil GDDR7 ..

Nu știm ce vor face producătorii de VRAM, dar creșterea vitezei de ceas nu este opțiunea pe care credem că vor ajunge să o adopte într-un buget limitat de energie.

GPU-uri AMD VRAM

Nu știm ce vor face factorii de decizie VRAM, dar creșterea vitezei de ceas nu este opțiunea pe care credem că vor ajunge să o adopte.

Cu toate acestea, interfețele dintre GPU și VRAM sunt situate în exteriorul perimetrului GPU-ului în sine. Deci, creșterea numărului de biți este extinderea periferiei GPU-ului menționat și, prin urmare, mărirea acestuia.

Ceea ce este o serie de probleme adăugate datorită dimensiunii ridicate în ceea ce privește costul, acest lucru îi va forța pe producătorii de plăci grafice să utilizeze mai multe cipuri în loc de unul, și tocmai în acest moment intrăm în așa-numitele cipituri.

Tipuri de GPU bazate pe Chiplet

Chiplets AMD

Există două moduri de a împărți un GPU în Chiplets:

  • Împărțind un GPU unic, de dimensiuni masive, în mai multe chip-uri, acest compromis constă în faptul că comunicarea între diferitele părți necesită lățime de bandă masivă, care poate să nu fie fezabilă fără utilizarea de interfoane speciale.
  • Utilizați mai multe GPUS în același spațiu care funcționează împreună ca unul singur.

În articolul HardZone intitulat „Așa vor fi GPU-urile bazate pe Chiplets pe care le vom vedea în viitor” puteți citi despre configurația primului tip, în timp ce brevetul AMD privind GPU-ul său cu chiplets se referă la cele din al doilea tip .

Explorarea brevetului pentru chiplets AMD:

Primul punct care apare în fiecare brevet este utilitatea invenției, care vine întotdeauna în fundalul ei, care ne preocupă este următorul:

Proiecte monolitice convenționale care devin din ce în ce mai scumpe de fabricat. Chiplets au fost utilizate cu succes în Procesor arhitecturi pentru reducerea costurilor de producție și îmbunătățirea randamentelor. Deoarece natura sa computațională eterogenă se adaptează mai natural pentru a separa nucleele CPU în diferite unități care nu necesită multă intercomunicare între ele.

Mențiunea CPU-urilor este clară că se referă la AMD Ryzen și este că o bună parte a echipei de proiectare a arhitecturilor Zen a fost mutată în Radeon Technology Group pentru a lucra la îmbunătățirea arhitecturii RDNA. Conceptul de cipite nu este primul moștenit de la Zen, celălalt este Cache infinit, care moștenește conceptul de „Victim Cache” de la Zen.

În al doilea rând, problema interfonului la care faceți referire se referă la lățimea de bandă enormă de care au nevoie GPU-urile pentru a-și comunica elementele între ele. Care este impedimentul în fața construcției acestora în cioburi, datorită energiei consumate în transferul de date.

Munca unui GPU este paralelă prin natură. Cu toate acestea, geometria procesată de un GPU include nu numai secțiuni de lucru în paralel, ci și lucrări care necesită sincronizare într-o ordine specifică între diferitele secțiuni.

Consecința acesteia? Un model de programare pentru un GPU care distribuie munca pe diferite fire este adesea ineficient, deoarece paralelismul este dificil de distribuit între mai multe grupuri de lucru și cipuri diferite, deoarece este dificil și costisitor să sincronizeze conținutul de memorie al resurselor partajate în sistem.

gpu amd

Partea pe care am pus-o cu caractere aldine este explicația din perspectiva dezvoltării de software pentru care nu am văzut GPU-uri bazate pe chip-uri. Nu este doar o problemă hardware, ci o problemă software, deci este necesar să simplificăm.

De asemenea, din punct de vedere logic, aplicațiile sunt scrise cu vederea că sistemul are un singur GPU. Adică, deși un GPU convențional include multe nuclee GPU, aplicațiile sunt programate să vizeze un singur dispozitiv. Prin urmare, a fost o provocare din punct de vedere istoric să aducă metodologia de proiectare chiplet la arhitecturile GPU.

Această parte este esențială pentru înțelegerea brevetului, AMD nu vorbește despre împărțirea unui singur GPU în chip-uri, ceea ce face în procesorele sale, ci mai degrabă despre utilizarea mai multor GPU-uri în care fiecare este un chiplet, este important să păstrați în Ține cont de această diferență, deoarece soluția AMD pare mai concentrată pe crearea unui Crossfire în care nu este necesar ca programatorii să își adapteze programele pentru diverse GPU-uri.

Odată ce problema este definită, următorul punct este să vorbim despre soluția oferită de brevet.

Explorarea brevetului AMD Chiplet: soluția

Patente AMD Chiplets

Soluția la problema expusă propusă de AMD este următoarea:

Pentru a îmbunătăți performanța sistemului folosind chiplets GPU, menținând în același timp modelul curent de programare, brevetul ilustrează sisteme și metode care utilizează legături încrucișate pasive cu lățime de bandă mare pentru a conecta chiplets GPU între ele.

Partea importantă a brevetului sunt acele legături încrucișate, despre care vom vorbi mai târziu în acest articol, acestea sunt interfața de comunicare între diferitele cipuri, adică modul în care informațiile sunt transmise între ele.

În diferite implementări, un sistem include unitatea centrală de procesare (CPU) care este conectată la primul chiplet GPU din lanț, care este conectat la un al doilea chiplet prin reticulare pasivă. În unele implementări, reticulul pasiv este un interpozitor pasiv care se ocupă de comunicarea între cipuri .

Practic, se rezumă la faptul că acum avem un GPU dual care funcționează ca unul singur, care este compus din două cipuri interconectate printr-un interpozitor care ar fi situat mai jos.

Crosslink-uri pasive cu lățime de bandă mare

Patente AMD Chiplets

Cum comunică cipitoarele cu interpozitorul? Folosind un tip de interfață care comunică interfața Scalable Data Fabric (SDF) a fiecăruia dintre chip-uri, SDF-ul din GPU-urile AMD este partea care se află în mod normal între memoria cache de nivel superior a GPU și interfață. memorie, dar în acest caz există o memorie cache L3 între SDF-ul fiecărui chipset GPU și SDF și înainte de aceasta o interfață care intercomunicează cele două cipulețe între ele.

Patente AMD Chiplets

În această diagramă puteți vedea exemplul cu 4 cipuri GPU, numărul de interfețe HBX este întotdeauna 2 2 în care n este numărul de cipite din interpozitor. Privind la nivelul ierarhiei cache, L0 (nedescris în brevet) este local pentru fiecare unitate de calcul, L1 pentru fiecare Shader Array, L2 pentru fiecare chiplet GPU, în timp ce cache L3 ar fi o noutate, acest lucru este descris ca fiind cache-ul ultimului nivel sau LCC al întregului set GPU.

În prezent, diferite arhitecturi au cel puțin un nivel de cache care este consecvent pe întregul GPU. Aici, într-o arhitectură GPU bazată pe chiplet, plasează resursele fizice pe cipuri separate și le comunică în așa fel încât memoria cache de nivel superior să rămână consistentă pe toate cipurile GPU. Astfel, în ciuda funcționării într-un mediu paralelizat masiv, memoria cache L3 trebuie să fie consecventă.

În timpul unei operații, solicitarea către o adresă de memorie de la CPU la GPU este transmisă către un singur chiplet GPU, care comunică cu reticulul pasiv cu lățime mare pentru a localiza datele. Din punct de vedere al procesorului, se pare că vă îndreptați către un GPU monolitic cu un singur cip. Acest lucru permite utilizarea unui GPU de mare capacitate, compus din mai multe chip-uri ca și cum ar fi un singur GPU pentru aplicație.

Acesta este motivul pentru care soluția AMD nu este împărțirea unui GPU în mai multe chip-uri diferite, ci utilizarea mai multor GPU-uri ca și cum ar fi una, rezolvând astfel una dintre problemele pe care AMD Crossfire le-a adus și permite orice software pe care îl puteți utiliza GPU-uri în același timp ca și cum ar fi unul și fără a fi nevoie să adapteze codul.

Cealaltă cheie a legăturilor încrucișate pasive este faptul că, spre deosebire de ceea ce mulți dintre noi am speculat, acestea nu comunică cu GPU utilizând canale prin siliciu sau TSV, ci că AMD a creat o intercomunicare proprietară pentru construcția SoC-urilor. , Procesoare și GPU-uri, ambele în 2.5DIC și 3DIC, ceea ce ne face să ne întrebăm dacă interfața X3D care trebuie să înlocuiască Infinity Fabric.

Chipletele AMD sunt pentru RDNA 3 în continuare

Harta de ruta RDNA

Faptul că problema utilizării mai multor GPU-uri nu este o problemă a aplicațiilor concepute pentru calculul prin GPU-uri, arată foarte clar că soluția propusă de AMD în brevetul său vizează piața internă, în special GPU-urile arhitecturilor RDNA, există mai multe indicii despre:

  • În diagramele cipurilor brevetului apare termenul WGP, care este tipic pentru arhitectura RDNA și nu pentru CDNA și / sau GCN.
  • Menționarea într-o parte a brevetului de utilizare a memoriei GDDR, care este tipică pentru GPU-urile interne.

Brevetul nu descrie un GPU specific pentru noi, dar putem presupune că AMD va lansa primul GPU dual pe bază de chiplet când se lansează RDNA 3. Acest lucru va permite AMD să creeze un singur GPU în loc de diferite variații ale unei arhitecturi sub formă de cipuri diferite, așa cum a fost cazul astăzi.

GPU Multi.Tile

Soluția AMD contrastează, de asemenea, cu ceea ce se spune despre NVIDIA și Intel. Din prima știm că Hopper va fi prima sa arhitectură bazată pe chiplets, dar nu cunoaștem piața țintă, deci ar putea fi bine orientată către piața de calcul de înaltă performanță, cum ar fi jocurile.

În ceea ce privește Intel, știm că Intel Xe-HP este un GPU compus și din chip-uri, dar fără a fi nevoie de o soluție precum AMD, deoarece ținta Intel pentru GPU menționată nu este piața internă.