Gaming GPU vs HPC grafikkort, likheter och skillnader

Gaming GPU vs HPC grafikkort

För närvarande finns det två olika marknader som grafikkort är riktade mot. Det mest populära är spel där tiotals miljoner PC -videospelfans använder dem för att spela sina spel med bästa möjliga bildhastighet och / eller bästa grafik. Den andra marknaden är för högpresterande datorer eller HPC-GPU: er. Hur är de två graferna olika?

Det råder ingen tvekan om att grafikkort har genomgått en enorm utveckling de senaste åren. De erbjuder inte bara möjligheten att återge allt mer realistisk grafik, utan deras datorkraft används också för vetenskapliga tillämpningar av alla slag och detta har gjort det möjligt för dem att nå fler marknader än videospel. Men på olika marknader olika lösningar och som redan är känt, båda NVIDIA och AMD har arkitekturer utformade för vad som är reproduktion av tv -spel å ena sidan och å andra sidan för vetenskaplig beräkning.

På en generell nivå delar de en serie gemensamma element, men de har med sig en serie differentialelement som gör dem till olika varelser om vi jämför en HPC GPU arkitektur med en gaming -GPU. Det är därför vi har bestämt oss för att berätta om skillnaderna mellan båda typerna av GPU.

Datanoggrannhet, den största skillnaden i GPU HPC och spel

I ett tv -spel är det faktum att en del data inte är helt korrekt inte ett problem, eftersom man vanligtvis arbetar med det vi matematiskt kallar en approximation. Vilket består av att använda lägre precision, men med tillräckligt för att utföra en nära simulering. Detta beror på att mängden bitar som vi kan tilldela data i ALU: erna är begränsade och fler bitar per ALU, fler transistorer och med detta är storleken på transistorerna större. Eftersom transistorbudgeten för en kommersiell GPU är begränsad och datanoggrannheten inte är så viktig, hamnar detta offer.

Men i vetenskaplig beräkning är det annorlunda, dataens precision är mycket viktig för att utföra beräkningarna. En enkel variation i data kan leda till att modellen du arbetar med avviker för mycket eller till felaktiga resultat. Föreställ dig katastrofen som skulle vara om en GPU med låg precision används för att beräkna vissa element när du skapar ett nytt läkemedel och att på grund av brist på precision hamnar ett fel som resulterar i en hälsokatastrof. Därför använder många av GPU: erna som är utformade för HPC precisions 64-bitars flytande punkt-ALU: er. Vilket vi inte brukar se GPU: erna används för spel för ett mycket uppenbart faktum.

Användningen av instruktioner med högre precision kräver implementering av specialiserade ALU: er och med den förändringar i hela skuggarenheten, inte bara med avseende på implementeringen av dessa ALU, utan också när det gäller register, instruktionsuppsättningen och interkommunikation.

Kostnadsstrukturen är annorlunda på en HPC GPU

HBM 2

På konsumentmarknaden är det till exempel inte möjligt att sälja en stor GPU, för det som kunderna kan betala är väldigt lite, och inte heller kan extremt dyra typer av minne som HBM -minne användas. Vilket trots att det är bättre i två av de tre variablerna (storlek och förbrukning), förlorar när det gäller kostnader jämfört med GDDR6 -minne, vilket är mycket billigare.

Kostnadsbegränsningen förekommer inte för HPC-GPU: er eftersom de är utformade för en marknad där höga kostnader gör användningen av HBM-typminnen lönsamma. Därför använder GPU: er av denna typ vanligtvis denna typ av minne istället för GDDR6. Om dina kunder är villiga att betala kostnaden för en bättre typ av minne kommer de att göra det.

Den andra anledningen är att superdatorer och datacenter som använder HPC -grafikkort är det faktum att de vanligtvis har sin energiförbrukning redan budgeterad där varje watt som används måste användas maximalt. På grund av det faktum att HBM -minne har en mycket lägre förbrukning i pJ / bit än GDDR6 har det hamnat påtvingat sig själv på den marknaden och detta har gjort alla framtida HPC GPU -mönster baserade på användning av denna typ av minne, vilket kräver användning av interposers och därför 2.5DIC -strukturer.

Olika marknader, olika behov

Nvidia-A100-HPC

GPU: er för att återge grafik använder en serie enheter som vi kallar en fast funktion på grund av att de inte är programmerbara. Hans arbete? Utför vissa repetitiva och redundanta funktioner när du skapar den realtidsgrafik som vi ser på skärmen. HPC -grafikkort är olika, många av dessa enheter behöver inte dem och använder dem därför inte.

Vanligtvis börjar den enklaste ändringen av att konvertera en spel -GPU till en HPC -GPU med att förblinda videoutgången. Men som vi har sett i de andra två sektionerna går HPC GPU: er utöver det. Det som är sant är att tillverkare tenderar att lämna dessa typer av enheter i sina HPC -GPU: er. Vilket är minst sagt paradoxalt, särskilt när det gäller GPU: er som används i NVIDIA Tesla där de olika enheterna inte används. AMD, å andra sidan, i deras CDNA-baserade AMD Instinct har helt eliminerat dem från ekvationen.

Varför finns outnyttjade enheter kvar? På grund av att de tar lite plats stängs de av när de inte används och det är ett större jobb att ta bort dem från mitten och konfigurera om hela designen utan dem än att underhålla dem. De är trots allt inte kompletta processorer och tar väldigt lite plats. Nog för att inte störa trots att det är där. Även om den största förändringen är i grafikkommandoprocessorn har de flesta HPC -grafikprocessorer den enheten inaktiverad och kan därför inte bearbeta visningslistan som skapats av CPU för att skapa grafik.