AMD vil forbedre sine nye grafikkort ved at tilføje Tensor Cores

Juli 3, 2022 Matt Mills Hardware, Nyheder 0

I de senere år har eufemismerne kunstig intelligens, Deep Learning og andre magiske ord ikke været nogen anden måde at kalde tilføjelsen til hardwaren af en ny type enhed, der er i stand til at udføre matematiske operationer med matricer ved høj hastighed. Tja, mod alle odds, AMD har gemt en detalje i sine grafikprocessorer med RDNA 3-arkitektur det har med det at gøre. De kaldes WMMA instruktioner og de bringer en meget vigtig ændring, hidtil uhørt i AMD gaming grafikkort.

De af jer, der er mere veteraner, vil huske, hvordan ordet multimedie i 90'erne gav lige så stor genklang som kunstig intelligens i dag. Grunden? Tilføjelsen af SIMD-enheder i tidligere tiders processorer. I dag sker det samme med beregning af matricer og kunstig intelligens. Nå, AMD ville endelig have adopteret disse enheder i sine indenlandske GPU'er, efter fire år siden NVIDIA vil lancere sin første RTX med dem.

En enhed til at arbejde med matricer

En af NVIDIAs spydspidser i sine GPU'er er tilføjelsen af den såkaldte Tensorkerner til RTX, som ikke er andet end en type udførelse kaldet en systolisk array. Dens største fordel? Evnen til at arbejde med dataarrays ved høj hastighed. Disse typer af matematiske strukturer er afgørende for kunstig intelligens algoritmer og for at kunne lagre store mængder data. Hvad er et billede for eksempel? En række pixels.

Da en matrix ikke er andet end en vektor med N dimensioner, er der indtil nu blevet brugt vektorenheder eller SIMD'er til at udføre disse operationer, som kan udføre den samme instruktion parallelt med flere forskellige operander. Men selvom de kan udføre sådanne instruktioner, er de meget langsommere til at gøre det end det, vi kalder et systolisk array.

Nå, med NVIDIA, der har deres Tensor-drev og Intel efter at have tilføjet deres XMX, som bare er handelsnavne for det samme koncept, var den, der manglede, AMD. I hvert fald har fraværet været snarere i dets GPU'er til hjemmecomputere og arbejdsstationer. Siden i verden af højtydende computing eller HPC, har deres CDNA-baserede AMD Instinct været med disse drev i lang tid.

WMMA, Matrix Core Units til RX 7000

Det navn, som AMD giver til sine systoliske arrays, er Matrix Core Units , som har været ikke udgivet i RDNA og RDNA 2 . Nå, efter flere rygter, hvor det blev sagt, at AMD ikke ville satse på denne type enhed i sine GPU'er, viser det sig, at der i LLVM-lageret er referencer til medtagelse af WMMA-instruktioner til GFX11 , hvilket er, hvad AMD kalder sin RDNA 3-arkitektur fremtidige GPU'er som RX 7000 og processorer som Phoenix .

I depotet akronymet WMMA beskrives som Wave Matrix Multiplicer Akkumuler og beskrives som:

Disse operationer udfører matrix multiplikation og addition i form af: D = A*B+C.

Hvilket minder os om strukturen defineret af NVIDIA til at beskrive dens Tensor Cores. Desuden, som du kan se, brugte AMD's rivaliserende virksomhed også WMMA-konceptet. Desuden afsløres adoptionen i AMD GPU'er af denne type enhed med et diagonalt kig på kildekoden.

Den resulterende matrix (D) angivet i 32-bit eller 16-bit flydende komma og de 3 matricer, der opererer i 16-bit flydende komma eller BFLOAT16 format.
Den endelige værdi af D er i 32-bit heltal, og A, B og C i 4- eller 8-bit heltal.

Så sammenfattende: det finder vi AMD har tilføjet WMMA-instruktionerne i RDN A, som refererer til tilføjelsen af en enhed for at arbejde med matricer, dvs. AMD GPU'er får endelig deres egne Tensor Cores . Som er meget brugt i kunstig intelligens og var et af elementerne