Under de senaste åren har eufemismerna artificiell intelligens, Deep Learning och andra magiska ord inte varit något annat sätt att kalla tillägget till hårdvaran för en ny typ av enhet som kan utföra matematiska operationer med matriser i hög hastighet. Tja, mot alla odds, AMD har gömt en detalj i sina grafikprocessorer med RDNA 3-arkitektur det har med det att göra. De kallas WMMA instruktioner och de medför en mycket viktig förändring, som hittills inte hörts i AMD gaming grafikkort.
De av er som är mer veteraner kommer ihåg hur på 90-talet ordet multimedia resonerade lika mycket som artificiell intelligens idag. Anledningen? Tillägget av SIMD-enheter i processorerna från förr. Idag händer samma sak med beräkningen av matriser och artificiell intelligens. Nåväl, AMD skulle äntligen ha antagit dessa enheter i sina inhemska GPU:er, efter fyra år sedan NVIDIA kommer att lansera sin första RTX med dem.
En enhet för att arbeta med matriser
En av NVIDIAs spjutspetsar i sina GPU:er är tillägget av den sk Tensorkärnor till RTX, som inte är något annat än en typ av exekvering som kallas en systolisk array. Dess främsta fördel? Möjligheten att arbeta med datamatriser i hög hastighet. Dessa typer av matematiska strukturer är avgörande för artificiell intelligens algoritmer och för att kunna lagra stora mängder data. Vad är till exempel en bild? En rad pixlar.
Eftersom en matris inte är något annat än en vektor med N dimensioner, har hittills vektorenheter eller SIMD:er använts för att utföra dessa operationer, som kan utföra samma instruktion parallellt med flera olika operander. Men även om de kan utföra sådana instruktioner, är de mycket långsammare att göra det än vad vi kallar en systolisk array.
Tja, med NVIDIA som har sina Tensor-enheter och Intel efter att ha lagt till deras XMX, som bara är handelsnamn för samma koncept, var den som saknades AMD. Frånvaron har i alla fall snarare legat i dess GPU:er för hemdatorer och arbetsstationer. Sedan i världen av högpresterande datorer eller HPC, har deras CDNA-baserade AMD Instinct funnits med dessa enheter under lång tid.
WMMA, Matrix Core Units för RX 7000
Namnet som AMD ger sina systoliska arrayer är Matrix Core Units , som har varit ej släppt i RDNA och RDNA 2 . Nåväl, efter flera rykten där det sades att AMD inte skulle satsa på den här typen av enheter i sina GPU:er, visar det sig att det i LLVM-förvaret finns referenser till inkludering av WMMA-instruktioner för GFX11 , vilket är vad AMD kallar sin RDNA 3-arkitektur framtida grafikprocessorer som RX 7000 och processorer som Phoenix .
I förvaret förkortningen WMMA beskrivs som Wave Matrix Multiplicera ackumuleras och beskrivs som:
Dessa operationer utför matrismultiplikation och addition i form av: D = A*B+C.
Vilket påminner oss om strukturen som definierats av NVIDIA för att beskriva dess Tensor Cores. Dessutom, som du kan se, använde AMD:s rivaliserande företag också WMMA-konceptet. Dessutom avslöjas användningen av denna typ av enhet i AMD GPU:er med en diagonal titt på källkoden.
- Den resulterande matrisen (D) ges i 32-bitars eller 16-bitars flyttal och de 3 matriserna som arbetar i 16-bitars flyttal eller BFLOAT16-format.
- Det slutliga värdet på D är i 32-bitars heltal och A, B och C i 4- eller 8-bitars heltal.
Så sammanfattningsvis: vi finner det AMD har lagt till WMMA-instruktionerna i RDN A, som hänvisar till tillägget av en enhet för att arbeta med matriser, dvs. AMD GPU:er kommer äntligen att ha sina egna Tensor Cores . Som är mycket använda i världen av artificiell intelligens och var ett av elementen