Varför är AMD-GPU: er inte lika snabba som NVIDIA?

Det är resultatet av kontroverser, kanonfoder för användare som är lite relaterade till den rena njutningen av den teknik som båda företagen tillhandahåller och ändå är det ett faktum som har bibehållits sedan Radeon X800. NVIDIA tog kommandot över grafikkort i slutet av 2005 och har regerat med en järnhäft i 15 år sedan dess, men vad stoppar AMD från att lansera en GPU som överträffar sin rival?

Det finns flera viktiga faktorer som NVIDIA alltid har varit uppenbar när de lanserade nya GPU: er på marknaden och som AMD har börjat förstå i drygt två år.

amd och nvidia

Dessa faktorer är inte riktigt relevanta utöver själva arkitekturerna, men de har intressanta konnotationer som lämnar ett tydligt meddelande som lovar att förändra det aktuella grafikkortlandskapet.

arkitektur

AMD-Vs-NVIDIA-Minimum Heter

Vi utgår från att vi förstår naturen hos en GPU som sådan, det vill säga de är fantastiska ”gigantiska räknare” för FP-operationer, därför är de perfekta för parallella operationer. De allra flesta beräkningarna görs av FPU-enheter och till skillnad från processorer är dessa enheter som sådana inte programmerbara av programvarudesigners, utan snarare är de lite mer abstrakta och helt beroende av drivrutinen som stöder dem.

Detta lämnar AMD och NVIDIA att optimera sina produkter så få enheter på en PC har. Samtidigt är detta bara början på problemet med huvudargumentet i den här artikeln, och det är att NVIDIA tilldelar en så stor mängd resurser att dess utvecklingsgrupp internt kallas "NVIDIA Army".

AMD-Shader-motorer

Antalet programvaruutvecklare de har är mycket överlägsen AMD och här är en del av överlägsenheten hos deras GPU: er. Det måste förstås att i arkitekturerna och från exakt slutet av 2005 har grafikkorten samma enheter att fungera: ALU / FPU TMU och ROP (bortsett från motsvarande cacher och tydlig VRAM) och endast Turing har infört den nya RT Kärnor och tensorkärnor för olika uppgifter.

Detta förutsätter igen att mjukvaruoptimering i kombination med arkitektoniska förbättringar gör en större skillnad för varje generation om du inte avancerar snabbare än rivalen. För att vara specifik innehåller Navi som arkitektur två Shader-motorer blockerar att AMD i sin tur delar upp i den berömda Asynchronous Compute Motors (ACE) , där var och en har 5 WGP och två CU: er.

NVIDIA-arkitektur-SM-historia

För ren jämförelse har NVIDIA i Turing 6 GPC: er med 6 TPC: er i varje och två småföretag för varje block. Denna enkla syn på strukturen för varje arkitektur får oss att se att parallelliseringen av Huangs är mycket högre och mer konfigurerbar än AMD, som har mycket kraftfullare block helt och hållet, men som samtidigt innebär att de är mindre energieffektiva än din rival alternativ.

Slutligen måste det förstås att det finns en radikal skillnad i tillvägagångssättet för driften av båda arkitekturerna, som kommer från det förflutna genom enkel utveckling av samma: NVIDIA arbetar med skalarutförande enheter, AMD använder för sin del enheter som arbetar med vektorer.

Vad innebär detta? En helt annan optimering för att fungera av utvecklare och samtidigt för sin opacitet, det är en vägg som AMD försöker bryta ner och erbjuder enheter som är enklare att programmera och med bättre resurser.

Konsumtion

Ett annat problem som AMD har haft i flera år, och att även med en litografisk process som är mycket mer avancerad än konkurrentens, lyckas den inte vara före. Återigen är allt ett arkitektur- och optimeringsproblem.

NVIDIA kan deaktivera alla grupper av TPC: er och till och med hela GPC: er på millisekunder, variera arbetsbelastningen i hög grad och att de tillsammans med olika tekniker som kaklat eller högkvalitativ färgkomprimering gör att deras enheter fungerar mer effektivt och därför lyckas de öka prestanda genom att konsumera mindre energi.

Optimering är nyckeln och här lyckas NVIDIA genom driften av sina enheter göra mer än AMD i samma klockcykel. Du bör inte titta på detta så mycket ur prestanda (som uppenbarligen är bättre) men från konsumtion.

En skalär enhet tillåter en flytande instruktion och ett heltal samtidigt och per klockcykel. Omorganisationen av arkitekturen i NVIDIA gör det möjligt för en programmerare att arbeta med vektoroperationer på ett enklare sätt än i AMD, särskilt nu när Turing har tre olika väldifferentierade motorer inom varje SM.

Detta gör att rasterisering kan fokuseras bättre på dessa motorer, vare sig det är INT32 , FP32 eller Tensor Cores , tillåter, om inte nödvändigt, att inaktivera kompletta GPC: er eller någon av dessa motorer, vilket sparar förbrukning och är mer effektiv på jobbet. .

Priser

nvidia-vs-amd

Det är en avgörande faktor när vi pratar om vilken GPU som är “bättre”. För NVIDIA har strategin med höga priser som erbjuder innovativ teknik fungerat den här gången, men verkligheten är att både Ray Tracing och DLSS inte har varit ett så stort steg visuellt som avsett, och de har inte varit fria från kontroverser eller problem.

Att erbjuda en lägre produkt till ett lägre pris gör det inte bättre i sig, du måste veta hur du placerar den på ett attraktivt sätt. Avsnitten av konsumtion och arkitektur leder direkt till det och gör att AMD ses som det mest prisvärda alternativet per pris till ett större antal användare.

Navi förvånade NVIDIA vid denna tidpunkt, eftersom de arkitektoniska förbättringarna har varit djupa och det har varit ett betydande steg som gjorde att Huang lanserade en ny kortserie för att täcka luckor. Men verkligheten runt om i världen är att användaren värdesätter den teknik, prestanda och konsumtion som NVIDIA erbjuder till ett högre pris. Det är inte för ingenting som det äger mer än 60% av världsmarknaden, så vi är i positionen för dem som kan välja att betala något mer för att en NVIDIA GPU ska dra nytta av sin nya teknik och de som helt enkelt inte vill att gå igenom den ringen av olika skäl.

I alla fall har AMD i mer än 15 år normalt varit i släp i detta avsnitt. NVIDIA sätter priser med sina nya GPU: er och AMD fyller i luckorna med sina GPU: er.