Rambo Cache grafických karet Intel Xe: Jak to funguje?

Během své prezentace v roce 2019 o budoucnosti Intel Architektura Xe, Raja Koduri zmínil o typu paměti, kterou Intel pokřtil „Rambo Cache“ a která je jednou z klíčových částí pro Intel Xe. Ale co přesně je Rambo Cache a jaké je její použití? Vysvětlíme vám to.

Jak uděláme obrovské množství GPU chiplety mezi sebou efektivně komunikují? Abychom mohli pracovat na interkomu, potřebujeme paměť, a to je místo, kde přichází Rambo Cache. Vysvětlíme, jak funguje a jakou má funkci.

Rambo Cache grafických karet Intel Xe

Rambo Cache jako rozdíl mezi Xe-HP a Xe-HPC

Situace Rambo Cache

Jak je vidět na snímku Intel, Rambo Cache je sám o sobě čip, který obsahuje paměť uvnitř, která bude použita výhradně v Intel Xe-HPC pro komunikaci mezi různými kameny / chiplety. . Zatímco Intel Xe-HP podporuje až 4 různé dlaždice, Intel Xe-HPC zpracovává mnohem větší množství dat, díky čemuž je tento další paměťový čip nezbytný jako komunikační most pro extrémně složité konfigurace z hlediska množství dat. GPU chiplety nebo dlaždice, jak jim Intel říká.

Mezipaměť Rambo XEMF

Mezipaměť Rambo bude umístěna mezi několik výpočetních dlaždic Intel Xe-HPC, aby se usnadnila komunikace mezi nimi. Compute Tiles nejsou nic jiného než GPU Intel Xe, ale specializují se na vysoce výkonné výpočty, takže klasické jednotky pevných funkcí v GPU nebudou v Intel Xe-HPC, protože se nepoužívají ve vysoce výkonných počítačích.

Rambo Cache však bude ve zbytku Intel Xe bezprecedentní, zejména u těch, které nebudou založeny na několika čipech, jako jsou Intel Xe-LP a Intel Xe-HPG. Ve specifickém případě Intel Xe-HP se zdá, že u 4 chipletů není Rambo Cache nutný, protože Interposer poskytuje dostatečnou šířku pásma pro komunikaci různých chipletů připojených na jeho vrchol.

Cílem je dosáhnout ExaFLOP

Intel Xe 7 nm

Víme, že limit týkající se počtu chipletů na interposeru je 4 GPU, ale z vyššího počtu to je, když propojení založené na EMIB interposeru již neposkytuje dostatečnou šířku pásma pro komunikaci, což činí nezbytným prvkem, který spojuje přístup do paměti a to je místo, kde by vstoupila Rambo Cache, protože by to Intelu umožnilo vytvořit složitější GPU než maximálně 4 chiplety, které dokáže vytvořit s EMIB.

Cíl? Umět vytvořit hardware, který kombinovaným způsobem může dosáhnout 1 PetaFLOP násilí nebo jinými slovy 1000 TFLOPS. Výkon mnohem vyšší než GPU, které máme v PC, ale nemluvíme o GPU pro PC, ale o hardwaru určeném pro superpočítače, s cílem dosáhnout milníku ExaFLOP, kterým je 1000 PetaFLOPS, a tedy 1 milion TeraFLOPS.

Velkou starostí hardwarových architektů je dosáhnout spotřeby energie, zejména při přenosu dat, více výpočtů více dat a více dat pohybuje více energie. Proto je důležité udržovat data co nejblíže procesorům, a právě tam přichází mezipaměť Rambo.

Mezipaměť Rambo jako mezipaměť nejvyšší úrovně

Hotchips Intel Architecture Xe (11)

Když máme několik jader, ať už mluvíme o a procesor nebo GPU a chceme, aby všichni měli přístup ke stejné paměti dobře na adresovací i fyzické úrovni, pak je nutná mezipaměť poslední úrovně. Jeho „geografické“ umístění v GPU je těsně před řadičem paměti, ale po soukromých mezipaměti každého jádra.

GPU dnes mají alespoň dvě úrovně mezipaměti, první úroveň je zbavena shaderových jednotek a je obvykle spojena s jednotkami textury. Druhá úroveň místo toho je sdílena všemi prvky GPU. V tomto případě jsou vaší propojovací cestou ke komunikaci, přístupu k nejnovějším datům a to vše, aby nedošlo k nasycení řadiče VRAM požadavky na něj.

Existuje však další úroveň, když máme několik úplných GPU vzájemně propojených ve stejné paměti, pak je potřeba další úroveň mezipaměti, která seskupuje přístupy ke všem pamětem. Intel Rambo Cache je řešením společnosti Intel pro sjednocení přístupu všech GPU, které společně tvoří Ponte Vecchio.