Gaming-GPU vs. HPC-Grafikkarten, Ähnlichkeiten und Unterschiede

Gaming-GPU im Vergleich zu HPC-Grafikkarten

Derzeit gibt es zwei unterschiedliche Märkte, auf die Grafikkarten ausgerichtet sind. Am beliebtesten sind Spiele, bei denen zig Millionen PC-Videospielfans sie verwenden, um ihre Spiele mit der bestmöglichen Bildrate und / oder der besten Grafik zu spielen. Der andere Markt ist für High-Performance-Computing oder HPC-GPUs. Wie unterscheiden sich die beiden Diagrammtypen?

Es besteht kein Zweifel, dass Grafikkarten in den letzten Jahren eine enorme Entwicklung durchgemacht haben. Sie bieten nicht nur die Möglichkeit, immer realistischere Grafiken wiederzugeben, sondern ihre Rechenleistung wird auch für wissenschaftliche Anwendungen aller Art genutzt und hat damit mehr Märkte als Videospiele erreicht. Aber in verschiedenen Märkten unterschiedliche Lösungen und bekanntlich beides NVIDIA und AMD haben Architekturen, die einerseits für die Reproduktion von Videospielen und andererseits für wissenschaftliches Rechnen konzipiert sind.

Im Allgemeinen teilen sie eine Reihe gemeinsamer Elemente, aber sie bringen eine Reihe unterschiedlicher Elemente mit sich, die sie zu unterschiedlichen Kreaturen machen, wenn wir einen HPC vergleichen GPU Architektur mit einer Gaming-GPU. Aus diesem Grund haben wir uns entschlossen, Ihnen die Unterschiede zwischen beiden GPU-Typen zu erläutern.

Datengenauigkeit, der Hauptunterschied zwischen GPU HPC und Gaming

In einem Videospiel ist die Tatsache, dass ein Datenelement nicht ganz genau ist, kein Problem, da man normalerweise mit dem arbeitet, was wir mathematisch eine Approximation nennen. Das besteht darin, Zahlen mit geringerer Präzision zu verwenden, aber mit genug, um eine genaue Simulation durchzuführen. Dies liegt daran, dass die Anzahl der Bits, die wir den Daten in den ALUs zuordnen können, begrenzt ist und mehr Bits pro ALU, mehr Transistoren und damit die Größe der Transistoren größer ist. Da das Transistorbudget einer kommerziellen GPU begrenzt ist und die Datengenauigkeit nicht so wichtig ist, wird dieses Opfer letztendlich gebracht.

Aber beim wissenschaftlichen Rechnen ist das anders, die Genauigkeit der Daten ist sehr wichtig, um die Berechnungen durchführen zu können. Eine einfache Variation der Daten kann dazu führen, dass das Modell, mit dem Sie arbeiten, zu stark abweicht oder zu fehlerhaften Ergebnissen führt. Stellen Sie sich die Katastrophe vor, wenn eine GPU mit niedriger Genauigkeit verwendet wird, um bestimmte Elemente beim Erstellen eines neuen Medikaments zu berechnen, und dass ein Fehler aufgrund mangelnder Präzision zu einer Gesundheitskatastrophe führt. Daher verwenden viele der für HPC entwickelten GPUs präzise 64-Bit-Gleitkomma-ALUs. Was wir normalerweise nicht bei den für Spiele verwendeten GPUs sehen, ist eine sehr offensichtliche Tatsache.

Die Verwendung von Instruktionen mit höherer Genauigkeit erfordert die Implementierung von spezialisierten ALUs und damit Änderungen in der gesamten Shader-Einheit, nicht nur hinsichtlich der Implementierung dieser ALUs, sondern auch hinsichtlich der Register, des Instruktionssatzes und der Interkommunikation.

Die Kostenstruktur ist bei einer HPC-GPU anders

HBM 2

Im Consumer-Markt ist es beispielsweise nicht möglich, eine große GPU zu verkaufen, weil die Kunden sehr wenig bezahlen können, und es können auch keine extrem teuren Speichertypen wie HBM-Speicher verwendet werden. Die zwar in zwei der drei Variablen (Größe und Verbrauch) besser ist, aber im Vergleich zu GDDR6-Speicher, der viel billiger ist, an Kosten verliert.

Die Kostenbegrenzung tritt bei HPC-GPUs nicht auf, da sie für einen Markt konzipiert sind, in dem hohe Kosten den Einsatz von HBM-Speichern rentabel machen. Daher verwenden GPUs dieses Typs normalerweise diese Art von Speicher anstelle von GDDR6. Wenn Ihre Kunden bereit sind, die Kosten für einen besseren Speichertyp zu zahlen, dann werden sie es tun.

Der andere Grund ist, dass Supercomputer und Rechenzentren, die HPC-GPUs verwenden, ihren Energieverbrauch in der Regel bereits vorher budgetieren haben, wo jedes verbrauchte Watt maximal genutzt werden muss. Aufgrund der Tatsache, dass HBM-Speicher einen viel geringeren Verbrauch in pJ / Bit als GDDR6 hat, hat er sich auf diesem Markt durchgesetzt und alle zukünftigen HPC-GPU-Designs basieren auf der Verwendung dieses Speichertyps, der die Verwendung von Interposern und damit 2.5DIC-Strukturen.

Unterschiedliche Märkte, unterschiedliche Bedürfnisse

Nvidia-A100-HPC

GPUs zum Rendern von Grafiken verwenden eine Reihe von Einheiten, die wir eine feste Funktion nennen, da sie nicht programmierbar sind. Seine Arbeit? Führen Sie beim Generieren der Echtzeitgrafiken, die wir auf dem Bildschirm sehen, bestimmte sich wiederholende und redundante Funktionen aus. HPC-Grafikkarten sind anders, viele dieser Geräte benötigen sie nicht und verwenden sie daher nicht.

Normalerweise beginnt die einfachste Änderung beim Konvertieren einer Gaming-GPU in eine HPC-GPU mit dem Blenden der Videoausgabe. Aber wie wir in den anderen beiden Abschnitten gesehen haben, gehen HPC-GPUs darüber hinaus. Richtig ist, dass Hersteller dazu neigen, diese Art von Einheiten in ihren HPC-GPUs zu belassen. Was gelinde gesagt paradox ist, insbesondere im Fall der GPUs, die im NVIDIA Tesla verwendet werden, wo die verschiedenen Einheiten nicht verwendet werden. AMD hingegen hat sie in ihrem auf CDN basierenden AMD Instinct vollständig aus der Gleichung eliminiert.

Warum gibt es noch unbenutzte Einheiten? Nun, da sie wenig Platz beanspruchen, werden sie bei Nichtgebrauch ausgeschaltet und es ist eine größere Aufgabe, sie aus der Mitte zu entfernen und das gesamte Design ohne sie neu zu konfigurieren, als sie zu warten. Schließlich sind sie keine vollständigen Prozessoren und benötigen nur sehr wenig Platz. Genug, um trotz Anwesenheit nicht zu stören. Obwohl die größte Änderung im Grafikbefehlsprozessor besteht, ist diese Einheit bei den meisten HPC-GPUs deaktiviert und kann daher die vom erstellte Anzeigeliste nicht verarbeiten CPU Grafiken zu generieren.