Přichází nedostatek nové grafické karty kvůli AI?

Poptávka po hardwaru s umělou inteligencí za poslední rok exponenciálně vzrostla, zejména po GPU. To nás nutí přemýšlet, zda uvidíme a nedostatek grafické karty opět jako před nedávnem hornictví. Aby toho nebylo málo, NVIDIA představila produkty pro zásobování tohoto trhu ve svých VOP, což mnohé nutí přemýšlet, zda se noční můra vrátí.

Jako každý březen pořádá NVIDIA vlastní konferenci GTC zaměřenou na svět umělé inteligence a superpočítačů. Neprezentují v něm nic pro PC, ale produkty a služby v podobě softwaru a hardwaru související s AI a pro různá odvětví. Rozmach aplikací jako ChatGPT, Stable Diffusion a mnoha dalších založených na velkých jazykových modelech a generování obrázků z textu však způsobil, že poptávka v tomto ohledu roste. A samozřejmě, ti Jen Hsen Huang toho musí nějakým způsobem využít. I když pro nás je důležité, jak nás to ovlivní a uvidíme, jestli se opět nedočkáme nedostatku grafických karet.

Shrňte jakýkoli text pomocí AI Dokumentů Google

NVIDIA naskočila do rozjetého vlaku ChatGPT a po letech přináší svou duální grafickou kartu

Nedávno jsme vám řekli, že NVIDIA se bude snažit využít nový boom umělé inteligence se dvěma prvky, které jsou zřejmé. Na jedné straně prodej grafických karet, aby si velké společnosti a administrativy mohly nastavit své vlastní servery pro poskytování nebo využívání služeb založených na Deep nebo Machine Learning. Na druhé straně vytváření serverů v cloudu, aby k těmto zdrojům měly přístup malé a střední firmy.

No, respektive, a v prvním případě představili své NVIDIA H100 NVL Dual , který se skládá ze dvou grafických karet vzájemně propojených pomocí NVLink. Nejsou založeny na stejné architektuře jako RTX 40, ale na té určené pro trh superpočítačů, H100. Jeho zvláštností je, že množství VRAM, které mají celkem, je 188 GB typu HBM3, což znamená, že systém si rezervuje 2 GB na GPU pro určité úkoly. Váš cílový trh? Jeden z největších jazykových modelů ve stylu ChatGPT.

Co se týče druhého produktu, tak ano NVIDIA DGX mrak , superpočítačová cloudová služba, která umožňuje přístup k serverům NVIDIA, aby bylo možné využít výkon jejích GPU pro aplikace zaměřené na umělou inteligenci. Tyto servery budou založeny na Microsoft Azure a Google Cloud. Myšlenkou je, že takové servery si může pronajmout každá malá a střední firma.

Tarjetas Gráficas NVIDIA H100 NVL Dual

Bude nedostatek herních grafických karet?

Jak můžete vidět, NVIDIA neposouvá svůj RTX 40 směrem k trhu AI, místo toho používá svůj další čip, H100. Samozřejmě musíme vycházet ze skutečnosti, že jak nejnovější GeForce pro PC, tak tento výkonný čip pocházejí ze stejných sléváren využívajících uzel N4 TSMC. Proto poptávka po jednom nakonec teoreticky ovlivní poptávku po druhém, musíme však vzít v úvahu řadu důležitých bodů:

  • Marže grafických karet H100 jsou podstatně vyšší, dokonce i než u RTX 40, náklady na jednu z grafických karet HPC nové generace NVIDIA jsou téměř 10krát vyšší, než kolik platíte za RTX 4090.
  • I přes nárůst poptávky nebude tak velký, jako tomu bylo v případě těžby. Herní grafické karty jsou tedy bezpečné.

Musíme však vzít v úvahu, že čip H100 je poměrně velký, což znamená, že na jeden wafer vychází málo jednotek a poruchovost je poměrně vysoká. V každém případě po nich byla obrovská poptávka velkých nadnárodních společností, které si tento typ hardwaru mohou koupit. Jen si pomyslete, že pro ChatGPT 3 bylo potřeba 10,000 XNUMX grafických karet pro školení AI, nevíme, kolik jich bude pro novou verzi, ale několikrát jistější než ano. A nebudou jediní, kdo bude po zmíněném hardwaru poptávat. V každém případě uvidíme, zda TSMC a NVIDIA mají kapacitu tuto poptávku podpořit, aniž by to ovlivnilo jejich starší trh, i když dnes méně lukrativní.