Eufemismy umělá inteligence, Hluboké učení a další kouzelná slova v posledních letech nejsou žádným jiným způsobem, jak nazvat přírůstek do hardwaru nového typu jednotky schopné provádět matematické operace s maticemi vysokou rychlostí. No, navzdory všem předpokladům, AMD skryl detail ve svých grafických procesorech s Architektura RDNA 3 to s tím souvisí. Se nazývají WMMA pokyny a přinášejí velmi důležitou změnu, u herních grafických karet AMD dosud nevídanou.
Ti veteráni z vás si jistě vzpomenou, jak v 90. letech rezonovalo slovo multimédia stejně jako dnes umělá inteligence. Důvod? Přidání SIMD jednotek do procesorů z minulých let. Dnes se totéž děje s výpočtem matic a umělou inteligencí. AMD by po čtyřech letech konečně přijalo tyto jednotky do svých domácích GPU NVIDIA uvede s nimi své první RTX.
Jednotka pro práci s maticemi
Jedním z vrcholů NVIDIA v jejích GPU je přidání tzv Tenzorová jádra k RTX, které nejsou ničím jiným než typem provádění nazývaným systolické pole. Jeho hlavní výhoda? Schopnost pracovat s datovými poli vysokou rychlostí. Tyto typy matematických struktur jsou klíčové pro algoritmy umělé inteligence a pro schopnost ukládat velké množství dat. Co je to například obrázek? Pole pixelů.
Protože matice není nic jiného než vektor o N rozměrech, byly až dosud k provádění těchto operací používány vektorové jednotky nebo SIMD, které mohou provádět stejnou instrukci paralelně s několika různými operandy. Nicméně, ačkoli mohou provádět takové instrukce, jsou mnohem pomalejší než to, čemu říkáme systolické pole.
No, když NVIDIA má své jednotky Tensor a Intel po přidání jejich XMX, což jsou jen obchodní názvy pro stejný koncept, chybělo AMD. Každopádně absence byla spíše v jeho GPU pro domácí počítače a pracovní stanice. Vzhledem k tomu, že ve světě vysoce výkonných počítačů nebo HPC, jejich AMD Instinct na bázi CDNA je s těmito disky již dlouhou dobu.
WMMA, Matrix Core Units pro RX 7000
Jméno, které AMD dává svým systolickým polím, je Matrix Core Units , které byly nevydané v RDNA a RDNA 2 . Po několika fámách, ve kterých bylo řečeno, že AMD by na tento typ jednotky ve svých GPU nevsadilo, se ukázalo, že v úložišti LLVM jsou odkazy na zahrnutí instrukcí WMMA pro GFX11 , což je to, co AMD nazývá svou architekturou RDNA 3 budoucí GPU jako RX 7000 a procesory jako Phoenix .
V úložišti zkratka WMMA je popsán jako Wave Matrix Multiply Accumulate a je popsán jako:
Tyto operace provádějí násobení a sčítání matic ve tvaru: D = A*B+C.
Což nám připomíná strukturu definovanou společností NVIDIA pro popis jejích Tensor Cores. Navíc, jak vidíte, konkurenční společnost AMD také používala koncept WMMA. Kromě toho je přijetí tohoto typu jednotky v GPU AMD odhaleno diagonálním pohledem na zdrojový kód.
- Výsledná matice (D) zadaná v 32bitové nebo 16bitové pohyblivé řádové čárce a 3 matice pracující v 16bitovém formátu s pohyblivou řádovou čárkou nebo BFLOAT16.
- Konečná hodnota D je ve 32bitových celých číslech a A, B a C ve 4bitových nebo 8bitových celých číslech.
Takže shrnuto: najdeme to AMD přidalo instrukce WMMA v RDN A, což se týká přidání jednotky pro práci s maticemi, tj. GPU AMD budou mít konečně vlastní Tensor Cores . Které jsou ve světě umělé inteligence velmi používané a byly jedním z prvků