Intel GPU-arkitektur, skillnader mot NVIDIA och AMD

Intel GPU-arkitektur, skillnader mot NVIDIA och AMD

Vi associerar inte ofta Intel varumärke med grafikprocessorer eller grafikchips, vilket beror på att Intel hittills har varit kvar i det underpresterande segmentet. I vilka GPU: er integrerade i processorn och de ingångsnivåer där hög effekt inte är nödvändig ingår. Vilket innebär att det för många inte har samma intresse som NVIDIA och AMD GPU: er, men Intels grafikarkitektur har också intressanta punkter, som vi kommer att definiera nedan.

Intel har alltid varit den tredje i striden när det gäller GPU: er, det är ju inte deras huvudsakliga verksamhet och det handlar om något mer än vad de gör som är processorer. Även om de de senaste åren har de ökat resurserna och har en serie spel-GPU: er på startrampen. Arkitekturen har dock en rad olika punkter med tanke på dess konkurrens.

Exekveringsenheten, grunden till Intel GPU: er

Intel EU -visning

För att förstå skillnaden i organisationen eller arkitekturen hos Intel GPU: er jämfört med resten måste vi förstå att vi är i en NVIDIA eller AMD GPU Shader-enheten är den lägsta enheten, för Intel är det Execution Unit. vad består det exakt av? Varje exekveringsenhet är en processor som utformats för parallellism på nivån för exekveringstråden eller full TLP. Därför har den en styrenhet, posterna och motsvarande exekveringsenheter. Vilka är två SIMD-enheter med 4 32-bitars flytpunkt ALU och ytterligare 4 av heltal, som byts och stöder SIMD över register.

Tack vare SIMD i registret, genom att dela upp ALU: erna och deras tillhörande register, kan de arbeta med dubbelt så många operander per klockcykel för varje underavdelning som görs i precision. Således kan de utföra dubbelt så många 16-bitars flytpunktsoperationer som 32-bitars, men fyra gånger mer om de är 8-bitars. När det gäller exekveringsenheternas funktionalitet ansvarar de för att utföra Shader-programmen, trots allt motsvarar de SIMD-enheterna för Intel och AMD GPU: er och därför är deras uppgift densamma.

Intel Xe Execution Units

I Intel Xe har Raja Koduri-teamet gjort en viktig förändring i styrenheten, eftersom nu två exekveringsenheter delar samma styrenhet. En förändring som påminner mycket om den som AMD har gjort i sina RDNA-arkitekturer där två beräkningsenheter är grupperade i en enda arbetsgrupp. Något som inte borde överraska oss av hjärnflödet från AMD till Intel. Denna förändring har inneburit att styrenheten har uppdaterats, vilket säkert representerar en fullständig förändring av den interna ISA-enheten för Intel GPU: er för en mycket mer effektiv.

Sub-Slice, Shader-enheten

Intel Architecture Xe Hotchips (8)

Motsvarigheten av skuggningsenheter som NVIDIA och AMD GPU: er har, vi har redan sett att det inte är exekveringsenheterna, utan snarare undersegmenten. Inom dem hittar du körningsenheterna grupperade. Eftersom varje exekveringsenhet är en delmängd av en delskiva och skivan är överuppsättningen av underskivan kommer vi att se den senare senare. Varje underavdelning innehåller 16 exekveringsenheter inuti, vilket översätts till 64 FP32 ALU: er och 64 heltal ALU: er totalt. En siffra som gör dessa enheter ekvivalenta i rå datorkraft till deras AMD-ekvivalenter, Compute Units.

När det gäller resten av elementen som vi kan hitta inuti sublice är de klassikerna för en enhet av denna typ, även om Intel använder en annan nomenklatur än vanligt. Hur är fallet med den så kallade 3D Sampler, som fortfarande är den klassiska enheten för hantering och filtrering av texturer, helt enkelt har Intel gett ett annat namn till denna klassiska enhet med fast funktion som finns i alla 3D-grafikprocessorer sedan starten.

Intel Architecture Xe Hotchips (10)

Media Sampler är dock en mycket mer intressant bit eftersom den är unik för Intel GPU: er, den består av en serie fasta funktionsenheter, som är följande:

  • Video Motion Engine ger uppskattning av pixelrörelser, vilket är nyckeln för videokodare.
  • Adaptive Video Scalar är en enhet som kör bildutjämningsfilter.
  • De-Noise / De-Interlace är en enhet som ansvarar för att reducera brus i en bild å ena sidan och å andra sidan för att omvandla video i sammanflätat läge till progressivt läge.

Från och med Intel Xe har Media Sampler dragits tillbaka från underskivan och har blivit en oberoende enhet i sig själv. Vilket fortsätter att vara en differentiell bit med avseende på designen av NVIDIA och AMD.

The Slice, en annan vanlig del i GPU: er

Intel Architecture Xe Hotchips (7)

Skivan i Intel GPU-arkitekturen motsvarar Shader Engine eller GPC i fallet med NVIDIA. Olika namn för en organisation av enheter från varandra. Inuti finns underlicenser och en serie fasta funktionsenheter, vilket är vanligt med andra företags grafikprocessorer.

Även om nomenklaturen återigen kan vara förvirrande, till exempel i resten av arkitekturen är rasterenheten vanligtvis enhetlig och den som genererar djupbufferten, båda elementen förekommer i rasterfasen i en gemensam enhet när det gäller NVIDIA och AMD, men Intel gör det separat.

Detsamma gäller Pixel Dispatch och Pixel Back-End. Funktioner för ROP-enheterna som utförs här av två olika element. När allt kommer omkring är uppgiften som ska utföras i båda fallen densamma.

Intel GPU-cache-hierarkin

Intel cachar GPU

En av de differentierande punkterna för den vanliga arkitekturen för Intel GPU: er, jämfört med AMD och NVIDIA, är exakt hur cache-hierarkin är organiserad. När det gäller AMD finner vi att RX 6000 har en hierarki på fyra nivåer om vi räknar det nyligen införda Infinity cache. När det gäller NVIDIA skiljer sig cachehierarkin från Intel och AMD, men det handlar inte om konkurrensen mot Intel att vi vill fokusera på den här artikeln eftersom den inte är dedikerad till dem

Diagrammet i det här avsnittet indikerar den interna kommunikationen i GPU: n, både på del- och skivnivå. När det gäller subslice har vi det klassiska datacachen och delat lokalt minne. Men till skillnad från NVIDIA och AMD GPU: er har Intel traditionellt lagt till ytterligare en L2-cache som kan nås av både 3D Sampler och Media Sampler. Vilket gör GPU: s L3-cache till toppnivå GPU-cache.

Intel Xe GPU -arkitektur

Skillnaden mellan L1-cachen för data och därför för körningsenheterna och L2 för texturerna har förändrats i Intel Xe, där båda har kombinerats till en enda L1-cache med data och texturer. Så nu har de en helt standardkonfiguration jämfört med konkurrenskraftiga GPU: er.

En annan förändring är när det gäller L3 eller cache på sista nivån. Samtida grafikprocessorer stöder den så kallade Tiled Caching, som består i att de rasteriseras med brickor, men de gör det på den sista nivån cache och det finns en risk att data kommer att falla i minnet där energikostnaden för att återställa den skyrockets, så De har ökat den från 3 MB till 16 MB.