Intel XeSS, tekniikka saada enemmän FPS -pelejä GPU -peleissä

Gaming-grafiikkasuorittimista suoritetuista huipputarkkuusalgoritmeista on tullut eri pelien kärki GPU valmistajille. Tulon kanssa Intel näille markkinoille he eivät ole halunneet jäädä jälkeen ja ovat kehittäneet oman vastineensa markkinoille NVIDIA DLSS ja AMD FSR nimellä Intel Xe Super Sampling. Miten Intel XeSS toimii ja miten se eroaa kilpailijoistaan?

Yhdessä lopullisen esityksen kanssa siitä, mitä aiemmin tunnettiin nimellä Xe-HPG ja joka on nimetty uudelleen ARC Alchemistiksi. Intel ei kertonut meille pelkästään uuden sukupolven grafiikkaarkkitehtuureistaan, vaan myös sitoutumisesta tekoälyyn tulevaisuudessa prosessori ja GPU. GPU: nsa erityistapauksessa he ovat kehittäneet algoritmin nimeltä Intel XeSS, joka kilpailee AMD: n FSR: ää ja NVIDIAn DLSS: ää vastaan. Jos ne vastaavat tavoitteita, mutta eivät tapaa toimia kolmen algoritmin välillä.

Miksi tarvitsemme huipputarkkoja algoritmeja?

Grafiikkaa käsiteltäessä kullekin pisteelle, fragmentille tai pikselille on määritetty ainakin yksi suorituslanka GPU: ssa, ja on otettava huomioon, että pikselimäärä on paljon suurempi kuin kohtauksen pisteiden määrä. Tämä tarkoittaa sitä, että kun resoluutiota lisätään, päädytään kasvattamaan samalla tavalla GPU: ssa suoritettavien ohjeiden määrää sekä sen tietoja, ja siksi myös kaistanleveys kasvaa.

Ongelma on siinä, että tämä edellyttää omistamista paljon suurempi GPU, ei vain johtuen eri yksiköiden lisääntymisestä, vaan myös siitä, että vaatimalla suurempaa kaistanleveyttä se vaatii myös monimutkaisempia muistiohjaimia. Älkäämme unohtako, että nämä sijoitetaan minkä tahansa prosessorin ulkoreunalle ja siksi ne liittyvät sen kokoon. Ja erityisesti emme voi unohtaa pelien näytönohjaimissa käytettyjen muistien suurta kulutusta.

Supertarkkuusalgoritmit, kuten AMD FSR, Intel Xess ja NVIDIA DLSS, pyrkivät ratkaisemaan tämän ongelman. Ne luottavat siihen, että laitteistoa lisätään pienellä prosenttiosuudella, alle 10%, saavuttaakseen suorituskyvyn, joka muuten vaatisi perinteisesti GPU: n koon kaksinkertaistamista. Kaikkeen tähän emme voi unohtaa Ray Tracingia, jonka algoritmi käyttää jopa kiihdytysrakenteita, kuten BVH, toimii pikselitasolla, joten supratarkkuusalgoritmit on otettu käyttöön olennaisena osana reaaliaikaista grafiikkaa.

Mikä on Intel XeSS?

Intel aikoo tarjota kaksi Intel XeSS -versiota ja siksi kaksi erilaista algoritmia. Molemmissa tapauksissa puhumme algoritmista, joka perustuu syvään oppimiseen ja tietokonenäköön, ja siksi käytetään päättelyhermoverkkoa, joka ennustaa kuvan korkeammalla resoluutiolla ja enemmän pikseliä pienemmästä resoluutiosta. ja siksi vähemmän pikseleitä.

Ensimmäinen variantti käyttää SIMD over register- tai SWAR-protokollaa, joita joillakin grafiikkasuorittimilla on, tämä mekanismi koostuu siitä, että 32-bittinen ALU voidaan jakaa kahteen 16-bittiseen ALU: hon, jotka suorittavat saman käskyn tai 4/8 bittiä. DP4A-muoto koostuu 4 8-bittisen operandin ryhmittelystä 32-bittiseen rekisteriin. Joten yksi XeSS -versioista voi toimia Intelin integroiduilla grafiikkasuorittimilla sekä millä tahansa tätä muotoa tukevalla GPU: lla, koska Intel tekee siitä avoimen lähdekoodin.

Toisaalta Intel XeSS: n toinen variantti on monimutkaisempi, koska se toimii Intel Arc -järjestelmän Tensor -yksiköillä, nimeltään XMX, mutta se ei toimi NVIDIA -grafiikkasuorittimissa, joissa on Tensor -ytimet. Intelin selitys ei ole muu kuin se, että NVIDIA pitää GPU: n Tensor -ytimien toiminnan, XMX -yksiköiden käytön ja kyvyn suorittaa äärimmäisen nopeita matriisilaskelmia, joita mullistavat verkot edellyttävät. Koska se ei toimi AMD -grafiikkasuorittimissa ja AMD: n grafiikkasuorittimissa ei tällä hetkellä ole tällaisia yksiköitä, toinen vaihtoehto olisi tarkoitettu yksinomaan Intelin grafiikkasuorittimille.

Miten Intel XeSS eroaa AMD- ja NVIDIA -ratkaisuista?

Itse asiassa se olisi kahden maailman välillä, koska siitä huolimatta, että se on a Syväoppimiseen perustuva ratkaisu kuten NVIDIA, Intelin he ovat vahvistaneet olevansa julkaisee sen täytäntöönpanokoodin kuten AMD on tehnyt FidelityFX Super -tarkkuudellaan. Kehittäjät voivat siis soveltaa sitä helpommin peleissä ja sovelluksissa. Se on strategia, joka AMD -algoritmin tapauksessa on mahdollistanut sen toteuttamisen odotettua enemmän, kuten vanhojen konsolien emulaattorit, Linux sovelluksia ja jopa pelejä, jotka eivät olisi saaneet tämän tyyppistä korjausta.

NVIDIA DLSS: n tavoin se ottaa huomioon myös ajallisuustiedot, jotka saadaan aikaisempien kehysten tiedoista. Tämä on jotain, mitä AMD FSR ei tee, koska punainen ratkaisu ottaa vain nykyisen kehyksen tiedot. Älkäämme myöskään unohtako, että AMD -algoritmi ei perustu tekoälyyn eikä siksi vaadi koulutusta, kun taas NVIDIA tekee. No, Intel on väittänyt, että XeSS ei myöskään, ja tässä asiat muuttuvat mielenkiintoisiksi.

Miksi XeSS ei tarvitse koulutusta?

Yksi niistä asioista, joka erottaa XeSS: n NVIDIA DLSS: stä, on se, että edellinen ei vaadi koulutusta . Koulutusprosessissa meillä on kaksi elementtiä samanaikaisesti, ensimmäinen vastaa ennustamisesta ja toinen valvonnasta. Kun konvoluution hermoverkon ennuste on väärä, valvontalaitteisto palauttaa kielteisen vastauksen ja hermoverkkoa tarkennetaan yhä enemmän, kunnes se oppii tekemään oikeat ennusteet.

Videopelissä, jossa ei toisteta yhtä ruutua, se on paljon vaikeampaa tehdä kuin elokuvassa, jossa on aina samat kehykset. Siksi yleensä tehdään hermoverkon kouluttaminen valvonnalla. Joka koostuu pelin suorittamisesta korkealla resoluutiolla järjestelmässä, kuvan pienentämisessä prosessissa, joka lisää kohinaa, ja näiden tietojen perusteella luodaan järjestelmään hermoverkko, jonka on tehtävä johtopäätös, jotta se voi tuottaa kuvan korkeammalle resoluutio.

Intel toteaa, että XeSS ei vaadi koulutusta ja siksi ulkopuolisen järjestelmän valvontaa ei tarvita. Tämän lausunnon todellisuus ei ole mikään muu kuin koulutusprosessi suoritetaan GPU: n omassa laitteistossa sen sijaan, että suoritettaisiin etälaitteistolla. Tätä varten GPU suorittaa pelin kahdessa samanaikaisessa tapauksessa samanaikaisesti, joista toinen toimii valvojana ja toinen hermoverkko on viritetty. Tämä antaa niille, jotka ottavat Intel Xessin käyttöön peleissään ja sovelluksissaan, hienosäätää algoritmia eivätkä ole riippuvaisia ulkoisista palvelimista.

Salaiset ainesosat, jotka Intel on integroinut XeSS -näytönohjaimiinsa

Koulutuksen nopeuttamiseksi Intel sisältää sarjan lisäyksiköitä GPU: ssa , Kuten Näytteenotin , yksikkö saa saman kuvan pienemmällä tarkkuudella ja joka laskee signaalin laadun heikkenemisen. Unohtamatta Takapropagaattori , mikä on avain itse GPU: n koulutusprosessin aikana. Tällä hetkellä emme tiedä, missä nämä yksiköt ovat konvoluution hermoverkon kouluttamiseen, mutta oletamme, että ne ovat tukiyksikkö lukuun ottamatta renderointimoottoria, mutta itse GPU: ssa.

Erittäin tarkkoja algoritmeja käytetään usein ylinäytteistysalgoritmit saadaksesi kuvan suuremmalla resoluutiolla. Jotkut käyttävät kaksikubista interpolointia, kun taas toiset, kuten FSR, käyttävät Lanczosin varianttia, vaikka ne kaikki toimivat GPU: n Shader -yksiköillä ja lopulta vähentävät niitä. Intel olisi sisällyttänyt skaalausyksiköt , joka kykenisi suorittamaan yhden tai useamman supersampling -algoritmin automaattisesti ja vapauttaisi Xe Core SIMD -yksiköt tästä tehtävästä, jolloin niitä voitaisiin käyttää muualla missä niitä tarvitaan.

Joten lopuksi, Intel XeSS lisää sarjan lisälaitteisto että tähän asti oli ennennäkemätön grafiikkasuorittimissa. Ei vain nopeuttaa näitä algoritmeja, vaan myös lisätä yhteensopivuutta ja helpottaa niiden toteuttamista eri markkinoilla olevissa peleissä. Olipa kyseessä viimeisimmät uutiset tai pelit, joiden takana on muutama vuosi. Voidaan siis sanoa, että Intel XeSS: n kanssa on ottanut hyvin huomioon kilpailijoidensa puutteet ja rajoitukset.