Intel AMX: Kuinka Intel käyttää tekoälyä prosessoreissaan

Tammikuu 6, 2021 Matt Mills Tarvikkeet, Uutta 0

Ei ole epäilystäkään siitä, että ns. Tekoälyn erikoistuneista yksiköistä on tullut yksi tärkeimmistä laitteistoista, varsinkin jos puhumme PostPC-laitteiden markkinoista, joissa kaikilla heidän SoC-laitteillaan on tämän tyyppinen yksikkö, mutta se ei ole PC: n tapauksessa, mutta asia voi muuttaa tilanteen täysin Intel AMX-laajennukset.

Tällä hetkellä, jos meillä on tietokone, ainoa tapa, jolla meidän on oltava erikoistunut yksikkö tekoälyyn, on ostaa erillinen laitteisto joko ostamalla tietokone GPU mistä NVIDIA RTX-tuoteperhe tai ostamalla FPGA, joka on asennettu PCI Express -porttiin.

Intel GNA, ennakkotapaus

Intelillä on tällä hetkellä sisäänrakennettu asema nimeltä GNA, joka voi käyttää joitain tekoälypohjaisia algoritmeja, mutta ei samalla tavalla kuin systolinen taulukko, koska GNA on SIMD-kokoonpanolla varustettu prosessori. Toisaalta Intel myy myös FPGA-pohjaisia ratkaisuja, ja Intel lupaa Intel Xe -näytönohjaimiensa kanssa integroida yksiköt Tensor Core -tyyliin.

Mutta mitä puhumme, on tämän tyyppisen yksikön täsmällinen integrointi a prosessori, siten, että suurempi määrä sovelluksia voi hyödyntää tämän tyyppisiä yksiköitä.

Vastaus Applen M1-malliin

Yksi eduista omenaM1 ei ole se, että ARM rekisterien ja ohjeiden joukko on energiatehokkaampi, mutta se tiettyihin sovelluksiin ja toiminnot sen Neural Engine on erittäin tehokas .

Tämän tyyppisistä yksiköistä on tullut avain älypuhelinten ja tablettien markkinoilla, koska ne mahdollistavat hyvin monimutkaisten tehtävien suorittamisen lyhyessä ajassa ja hyvin vähäisillä resursseilla, mikä on tehnyt PC-suorittimista jäljessä tässä suhteessa.

Intel AMX

Aivan kuten SIMD-yksiköt toivat mukanaan uusien x86-ohjeiden käyttöönoton, matriisi- tai tensoriyksiköiden käyttöönotto tuo mukanaan uuden tyyppisen käskyn, nimeltään AMX tai Advanced Matrix Extensions, joka otetaan käyttöön ensimmäisen kerran Intel Xeon -arkkitehtuurilla . Sapphire Rapids.

Laajennus lisää kaksi lisäelementtiä, toisaalta kaksiulotteisen ennätysjoukon, joka koostuu levyistä nimeltä "laatat" ja sarjasta kiihdyttimiä, jotka kykenevät toimimaan näillä laatoilla. Nämä kiihdyttimet jakavat muistin käytön johdonmukaisella tavalla muiden suorittimen elementtien kanssa ja voivat toimia lomitettuna muiden x86-suoritusyksiköiden kanssa ja rinnakkain niiden kanssa.

Kiihdytintä kutsutaan Tile Matrix Multiply tai TMUL, se on systolinen matriisi ALU-verkon muodossa, joka pystyy suorittamaan FMA (lisäys ja kertominen) -komennon yhdessä syklissä, joka käyttää tietueina levyjä, joista meillä on puhui edellisessä kappaleessa.

In AMD TMUL-yksikköä kutsutaan nimellä Data Parallel Cluster ja se on yksikkö, joka löytyy kussakin prosessorin ytimessä, vaikka Intel aikoo ottaa sen käyttöön ensimmäistä kertaa Sapphire Rapidsissa, ei ole epäilystäkään siitä, että aiomme nähdä se toteutettiin tulevaisuudessa muissa Intel-prosessoreissa.