Komt er een tekort aan nieuwe grafische kaarten door AI?

De vraag naar AI-hardware is het afgelopen jaar exponentieel gegroeid, vooral naar GPU's. Dit doet ons afvragen of we een grafische kaart tekort opnieuw zoals mijnbouw niet lang geleden deed. Om het erger te maken, NVIDIA heeft producten gepresenteerd om deze markt te bevoorraden in zijn GTC, waardoor velen zich afvragen of de nachtmerrie zal terugkeren.

Zoals elke maart houdt NVIDIA zijn eigen conferentie, de GTC, gericht op de wereld van kunstmatige intelligentie en supercomputing. Daarin presenteren ze niets voor pc, maar producten en diensten in de vorm van software en hardware gerelateerd aan AI en voor verschillende industrieën. Door de enorme toename van toepassingen zoals ChatGPT, Stable Diffusion en nog veel meer, gebaseerd op grote taalmodellen en het genereren van afbeeldingen uit tekst, is de vraag naar dit opzicht echter toegenomen. En natuurlijk moeten die van Jen Hsen Huang er op de een of andere manier van profiteren. Hoewel het voor ons belangrijk is hoe het ons beïnvloedt en kijken of we weer een tekort aan grafische kaarten gaan ervaren.

Vat elke tekst samen met de AI van Google Docs

NVIDIA springt op de ChatGPT-bandwagon en brengt zijn dubbele grafische kaart in jaren uit

We hebben u onlangs verteld dat NVIDIA zou proberen te profiteren van de nieuwe AI-boom met twee voor de hand liggende elementen. Enerzijds de verkoop van grafische kaarten zodat grote bedrijven en administraties hun eigen servers kunnen opzetten om diensten op basis van Deep of Machine Learning aan te bieden of te gebruiken. Anderzijds het creëren van servers in de cloud, zodat kleine en middelgrote bedrijven toegang hebben tot deze bronnen.

Welnu, respectievelijk, en in het eerste geval hebben ze hun gepresenteerd NVIDIA H100 NVL dubbel , die bestaat uit twee grafische kaarten die via NVLink met elkaar zijn verbonden. Ze zijn niet gebaseerd op dezelfde architectuur als de RTX 40, maar op degene die is ontworpen voor de supercomputermarkt, de H100. Het bijzondere is dat de hoeveelheid VRAM die ze in totaal hebben 188 GB is van het HBM3-type, wat betekent dat het systeem 2 GB reserveert per GPU voor bepaalde taken. Uw doelgroep? Een van de geweldige taalmodellen in de ChatGPT-stijl.

Wat het tweede product betreft, dat is het wel NVIDIA DGX Cloud , een supercomputing-cloudservice die toegang geeft tot NVIDIA-servers om de kracht van zijn GPU's te kunnen gebruiken voor AI-gerichte toepassingen. Deze servers zullen worden gebaseerd op Microsoft Azure en Google Cloud. Het idee is dat elke kleine en middelgrote onderneming dergelijke servers kan huren.

Grafische kaarten NVIDIA H100 NVL Dual

Komt er een tekort aan grafische kaarten voor gaming?

Zoals je kunt zien, verplaatst NVIDIA zijn voorraad RTX 40 niet naar de AI-markt, maar gebruikt het zijn andere chip, de H100. Natuurlijk moeten we uitgaan van het feit dat zowel de nieuwste GeForce voor pc's als deze krachtige chip uit dezelfde gieterijen komen die TSMC's N4-node gebruiken. Daarom zal de vraag naar de ene in theorie de vraag naar de andere beïnvloeden, maar we moeten rekening houden met een aantal belangrijke punten:

  • De marges van de H100 grafische kaarten zijn aanzienlijk hoger, zelfs dan een RTX 40, wat het kost voor een van NVIDIA's next-gen HPC grafische kaarten is bijna 10 keer wat je betaalt voor een RTX 4090.
  • Ondanks de stijging van de vraag zal deze niet zo groot zijn als in het geval van mijnbouw. Grafische kaarten voor gaming zijn dus veilig.

We moeten er echter rekening mee houden dat de H100-chip vrij groot is, wat betekent dat er weinig eenheden per wafer uitkomen en het uitvalpercentage vrij hoog is. Er is in ieder geval enorm veel vraag naar bij grote multinationals die dit soort hardware kunnen kopen. Denk maar aan dat voor ChatGPT 3 10,000 grafische kaarten nodig waren voor AI-training, we weten niet hoeveel er zullen zijn voor de nieuwe versie, maar vele malen zekerder dan ja. En zij zullen niet de enige zijn die naar die hardware vragen. In ieder geval zullen we zien of TSMC en NVIDIA de capaciteit hebben om aan deze vraag te voldoen zonder hun oudere markt te beïnvloeden, hoewel deze vandaag minder lucratief is.