Intel GPU -arkkitehtuuri, erot vs NVIDIA ja AMD

Intel GPU -arkkitehtuuri, erot vs NVIDIA ja AMD

Emme usein yhdistä Intel grafiikkasuorittimilla tai grafiikkapiireillä, mikä johtuu siitä, että Intel on toistaiseksi pysynyt heikosti menestyvässä segmentissä. Siihen sisältyvät prosessoriin integroidut GPU: t ja lähtötason prosessorit, joissa suurta tehoa ei tarvita. Mikä tarkoittaa, että monille se ei ole yhtä kiinnostava kuin NVIDIA ja AMD GPU: t, kuitenkin Intelin grafiikka-arkkitehtuurilla on myös mielenkiintoisia kohtia, jotka aiomme määritellä alla.

Intel on aina ollut kolmas väite GPU: iden suhteen, loppujen lopuksi se ei ole niiden pääliiketoiminta ja kyse on jotain enemmän kuin mitä he tekevät, jotka ovat suorittimia. Vaikka heillä on viime vuosina lisääntynyt resursseja, ja lähtörampilla on joukko peliohjaimia. Sen arkkitehtuurilla on kuitenkin joukko erilaista kohtaa sen kilpailuun nähden.

Suoritusyksikkö, Intel-näytönohjainten perusta

Intel EU vieja

Ymmärtääksemme eron Intel-GPU: iden organisaatiossa tai arkkitehtuurissa verrattuna muihin, meidän on ymmärrettävä, että vaikka NVIDIA- tai AMD-tilassa GPU varjostinyksikkö on vähimmäisyksikkö, Intelin tapauksessa se on suoritusyksikkö. mistä se tarkalleen kuuluu? Jokainen suoritusyksikkö on prosessori, joka on suunniteltu rinnakkaisuuteen suorituslangan tai täyden TLP: n tasolla. Siksi sillä on ohjausyksikkö, tietueet ja vastaavat toteutusyksiköt. Mitkä ovat kaksi SIMD-yksikköä, joissa on 4 32-bittistä liukulukuista ALU: ta ja toinen 4 kokonaislukua, jotka ovat kytkettyjä ja tukevat SIMD: tä yli rekisterin.

Rekisterissä olevan SIMD: n ansiosta jakamalla ALU: t ja niihin liittyvät rekisterit alajakoa, ne voivat työskennellä kaksinkertaisella operandimäärällä kellojaksoa kohden kullekin tarkasti tehdylle alajaolle. Siten he voivat suorittaa kaksi kertaa niin monta 16-bittistä liukulukuoperaatiota kuin 32-bittinen, mutta neljä kertaa enemmän, jos ne ovat 8-bittisiä. Suoritusyksiköiden toiminnallisuuden osalta he vastaavat Shader-ohjelmien suorittamisesta, kun ne loppujen lopuksi vastaavat Intelin ja AMD-näytönohjainten SIMD-yksiköitä ja siksi heidän tehtävänsä on sama.

Intel Xe -suoritusyksiköt

Intel Xe: ssä Raja Koduri -tiimi on tehnyt merkittävän muutoksen ohjausyksikköön, koska nyt kahdella suoritusyksiköllä on sama ohjausyksikkö. Muutos, joka muistuttaa hyvin AMD: n RDNA-arkkitehtuureissa tekemää muutosta, jossa kaksi laskentayksikköä on ryhmitelty yhdeksi työryhmäksi. Jotain, joka ei saa yllättää meitä aivovuodolla AMD: stä Inteliin. Tämä muutos on tarkoittanut, että ohjausyksikkö on päivitetty, mikä edustaa varmasti täydellistä muutosta Intelin GPU: iden sisäisessä ISA: ssa paljon tehokkaammaksi.

Sub-Slice, Shader-yksikkö

Intel Architecture Xe -pihimikrot (8)

NVIDIA: n ja AMD-näytönohjaimien vastaavat varjostinyksiköt ovat jo nähneet, että se ei ole suoritusyksiköitä vaan pikemminkin aliosioita. Niistä löydät Suoritusyksiköt ryhmiteltyinä. Koska jokainen suoritusyksikkö on osajoukon osajoukko ja viipale on osajoukon supersarja, näemme jälkimmäisen myöhemmin. Jokaisessa alalohkossa on 16 suoritusyksikköä, mikä tarkoittaa yhteensä 64 FP32 ALU: ta ja 64 kokonaislukuista ALU: ta. Luku, joka tekee näistä yksiköistä raakalaskentatehon vastaavan AMD-ekvivalentteihinsa Compute Units.

Mitä tulee muihin alilajin sisällä oleviin elementteihin, ne ovat tämän tyyppisen yksikön klassikoita, vaikka Intel käyttää erilaista nimikkeistöä kuin tavallisesti. Kuinka ns. 3D-sampleri on edelleen klassinen yksikkö tekstuurien käsittelyyn ja suodattamiseen, yksinkertaisesti Intel on antanut tälle klassiselle kiinteän toiminnon yksikölle toisen nimen, joka löytyy kaikista 3D-grafiikkaprosessoreista sen perustamisesta lähtien.

Intel Architecture Xe -pihimikrot (10)

Media Sampler on kuitenkin paljon mielenkiintoisempi kappale, koska se on ainutlaatuinen Intel-näytönohjaimille, ja se koostuu sarjasta kiinteitä toimintoyksiköitä, jotka ovat seuraavat:

  • Video Motion Engine tarjoaa pikseliliikkeen estimoinnin, joka on avain videokoodereille.
  • Adaptive Video Scalar on yksikkö, joka suorittaa kuvan tasoitussuodattimet.
  • De-Noise / De-Interlace on yksikkö, joka vastaa kuvan kohinan vähentämisestä ja toisaalta videon muuttamiseksi lomitetussa tilassa progressiiviseen tilaan.

Intel Xe: stä alkaen Media Sampler on poistettu alaluokasta ja siitä on tullut itsenäinen yksikkö. Mikä on edelleen erilainen pala NVIDIA: n ja AMD: n mallien suhteen.

Slice, toinen yleinen pala näytönohjaimissa

Intel Architecture Xe -pihimikrot (7)

Intel GPU -arkkitehtuurin Slice on sama kuin Shader Engine tai NVIDIA: n GPC. Yksiköiden organisaation eri nimet toisistaan. Sisällä on alilevyt ja sarja kiinteitä toimintoyksiköitä, jotka ovat yhteisiä muiden yritysten näytönohjaimien kanssa.

Vaikka nimikkeistö voi taas olla hämmentävä, esimerkiksi muissa arkkitehtuureissa rasteriyksikkö on yleensä yhtenäinen ja syvyyspuskurin tuottava yksikkö, molemmat elementit esiintyvät rasterivaiheessa yhteisessä yksikössä NVIDIA: n ja AMD: n tapauksessa, mutta Intel tekee sen erikseen.

Sama koskee Pixel Dispatchia ja Pixel Back-Endiä. ROP-yksiköiden toiminnot, jotka tässä suoritetaan kahdella eri elementillä. Loppujen lopuksi molemmissa tapauksissa suoritettava tehtävä on sama.

Intel GPU -välimuistihierarkia

Intel Cache GPU

Yksi Intel GPU: iden yleisen arkkitehtuurin erottavista kohdista verrattuna AMD: hen ja NVIDIA: han on juuri se, miten välimuistihierarkia on järjestetty. AMD: n tapauksessa havaitsemme, että RX 6000: lla on neljän tason hierarkia, jos laskemme äskettäin liitetyt Ääretön välimuisti. NVIDIA: n tapauksessa välimuistien hierarkia eroaa Intelin ja AMD: n hierarkiasta, mutta Intelin kilpailusta ei ole kyse siitä, että haluamme keskittyä tähän artikkeliin, koska sitä ei ole omistettu niille

Tämän osan kaavio osoittaa GPU: n sisäisen tiedonsiirron sekä ala- että osatasolla. Alalajin tapauksessa meillä on klassinen tietovälimuisti ja jaettu paikallinen muisti. Mutta toisin kuin NVIDIA- ja AMD-näytönohjaimet, Intel on perinteisesti lisännyt ylimääräisen L2-välimuistin, jota voivat käyttää sekä 3D Sampler että Media Sampler. Mikä tekee GPU: n L3-välimuistista ylätason GPU-välimuistin.

Intel Xe GPU -arkkitehtuuri

Tietojen L1-välimuistin ja siten suoritusyksiköiden ja tekstuurien L2-välimuistin erottelu on muuttunut Intel Xe: ssä, jossa molemmat on yhdistetty yhdeksi L1-välimuistiksi tiedoille ja tekstuureille. Joten nyt heillä on täysin vakio kokoonpano verrattuna kilpaileviin näytönohjaimiin.

Toinen muutos on L3- tai viimeisen tason välimuisti. Nykyaikaiset grafiikkasuorittimet tukevat ns. Tiled Caching -ohjelmaa, joka koostuu siitä, että ne rasteroituvat ruuduilla, mutta tekevät sen viimeisen tason välimuistissa ja on vaarana, että data putoaa muistiin siellä, missä sen palauttamisen energiakustannukset nousevat, joten He ovat kasvattaneet sen 3 Mt: sta 16 Mt: iin.