RTX 3080 vs RTX 2080 Ti, är arkitekturförändringen värt det?

RTX 3000 kom ut för några månader sedan och ersatte RTX 2000, men hur jämför båda arkitekturerna sig och vad är förändringarna från en generation till en annan, är det ett så spektakulärt steg som NVIDIA säljer eller är de ganska små förändringar? Vi förklarar skillnaderna mellan Turing- och Ampere-arkitekturen.

Är det värt att byta ut en RTX 2000 mot en motsvarighet i RTX 3000? Ur vår synvinkel, om du vill ha maximal prestanda, ja, men samtidigt tror vi att det är viktigt att avmystifiera båda generationerna av GPU: er, så vi kommer att jämföra dem.

RTX 3080 vs RTX 2080 Ti

Hur är Turing och Ampere desamma i arkitektur?

NVIDIA GPU

Det finns ett antal element där det inte har skett några förändringar från en generation till nästa, så det har inte skett några interna förändringar och de fungerar fortfarande detsamma i Ampere jämfört med Turing.

Listan med objekt som inte har ändrats öppnas av kommandoprocessorerna i båda GPU: erna. Vilken är den del som ansvarar för att läsa kommandolistorna från huvudmenyn RAM och organisera resten av GPU element. Följt av de fasta funktionsenheterna för rendering via rasterisering: rasterenheter, tessellation, texturer och ROPS.

Den interna minnesstrukturen har inte heller förändrats, det vill säga cachehierarkin som förblir densamma i Ampere och inte har förändrats med avseende på Turing, eftersom den förblir densamma i båda arkitekturerna, det enda elementet i minneshierarkin är GDDR6X-minnet gränssnitt som används av GPU: er baserat på NVIDIA GA102-chipet, till exempel RTX 3080.

I vilka element skiljer sig Turing och Ampere

RTX 3070 3080 Ti

Vi måste gå in i SM-enheterna för att se förändringar i den Ampere-baserade RTX 3000 jämfört med den Turing-baserade RTX 2000 och de är förändringar som har gjorts på tre olika fronter:

  • Flytpunktsenheter i FP32
  • Tensor-kärnorna.
  • RT-kärnorna.

Utanför dessa element och utanför antalet SM-enheter, vilket är högre i GeForce Ampere än i GeForce Turing, är det ingen förändring, så NVIDIA har återvunnet en stor del av hårdvaran från föregående generation för att skapa den nya. . Och innan du drar slutsatsen att detta är något negativt, låt mig berätta hur vanligt i hårdvarudesign.

Flyttpunktsförändringar på GeForce Ampere SMs

VRAM

På alla GeForces upp till Pascal kallades alla flytande enheter för CUDA-kärnor av NVIDIA. Så utan vidare, utan att klargöra vad det innebar utöver flytande beräkningar. De antydde att de var 32-bitars precision flytande punktenheter.

Egentligen var CUDA-kärnorna faktiskt logikoaritmetiska enheter för 32-bitars flytpunktsberäkning, men också enheter av samma typ för 32-bitars heltal. Särheten? De fungerade omkopplade på ett sådant sätt att båda typerna inte kunde fungera samtidigt.

Pascal Turing

Med Turing förändrades saker och vad som kallas samtidig exekvering dök upp, anledningen är att GPU-tråden listar kombinerade trådar med heltal och flytande punkt och inte nådde den maximala platsupptagningen av SIMT-enheten med varje underolja, så NVIDIA beslutade om Turing för att tillämpa samtidig körning. I vilken en våg med 32 exekveringstrådar kan exekveras på ett kombinerat sätt mellan heltalet och ALU-enheterna med flytpunkt samtidigt, så länge dessa är tillgängliga.

SM Ampere

Detta innebär att 32-vågs trådfördelning, som är standardstorleken för NVIDIA-grafikprocessorer, kan fördelas över upp till 16 heltalstrådar och 16 flytpunkttrådar. Men någon på NVIDIA kom med att föreslå en förändring för Ampere, det vill säga den uppsättningen heltal ALU: er byts ut med en andra uppsättning flytande punkt-ALU: er, vilket inte kräver att resten av SM ändras.

Därför fördubblas beräkningshastigheten, mätt i TFLOPS, vid vissa tidpunkter och när villkoret att en 32-tråds flytpunktsvåg kommer in. Även om endast när de uppfylls under dessa förhållanden och om vi hade en enhet för att mäta TFLOPS-hastigheten skulle vi se att det inte är den som NVIDIA säger, vilket ger maximal topp i sina specifikationer, men att den skulle ha svängningar.

Tensorkärnor på GeForce Ampere

Ampere Tensor Core

Tensor Cores är systoliska matriser som först släpptes på NVIDIA Volta GPU: er, och de är systoliska matriser som är den typ av exekveringsenhet som används för att påskynda AI-baserade algoritmer. Dessa enheter, till skillnad från RT-kärnorna, använder SM-styrenheten och kan inte användas samtidigt som flytpunkten och heltalsenheterna, så även om de kan fungera samtidigt gör de det genom att ta bort ström från resten. enheter utom RT-kärnor.

Om vi ​​lägger till ALU-kvantiteten som RT-kärnorna bildar mellan en generation och den andra ser vi att det finns samma kvantitet men med en annan konfiguration. I Turing har vi 8 enheter, 2 per underkärna, på 64 ALU i vardera i en Tensor 4 x 4 x 4-konfiguration. I Ampere har Tensor Cores en konfiguration på 4 enheter, 1 per underkärna, med 128 ALU. för var och en av dem.

RT-kärnor på GeForce Ampere

RT Core RTX 3000

RT Cores är den minst kända delen av alla, eftersom NVIDIA inte har gett någon information om vad deras interna arbete är. Vi vet vad det gör, hur det fungerar, men vi vet inte vad elementen är inuti och vilka förändringar som har skett från en generation till en annan.

Det första som sticker ut är att NVIDIA nämner att RT Cores nu kan göra dubbelt så många korsningar per triangel, vilket inte betyder dubbelt så många korsningar per sekund. Anledningen till detta är att när man korsar BVH-trädet, är det att göra skärningspunkten mellan lådorna som är de olika noderna i trädet och endast den sista skärningspunkten mellan trädet är den som görs med triangeln, den som är det mest komplexa att utföra. Enheterna för beräkning av lådornas skärningspunkt är mycket enklare, i Turing har vi i teorin fyra enheter som arbetar parallellt för att gå igenom de olika nivåerna i ett träd och en enda enhet som utför skärningspunkten mellan strålen och triangeln.

Den andra förändringen på hårdvarunivå är förmågan att interpolera triangeln beroende på dess position i tid, vilket är nyckeln till implementeringen av Ray Tracing med Motion Blur, en teknik som fortfarande saknar motstycke i spel som är kompatibla med Ray Tracing. I händelse av att det finns andra ändringar har NVIDIA inte rapporterat detta offentligt och därför kan vi inte dra några ytterligare slutsatser.