Игровой GPU против видеокарт HPC, сходства и различия

Игровой графический процессор против видеокарт HPC

В настоящее время существуют два разных рынка, на которые нацелены видеокарты. Самыми популярными являются игры, в которых десятки миллионов фанатов компьютерных видеоигр используют их, чтобы играть в свои игры с максимально возможной частотой кадров и / или лучшей графикой. Другой рынок - для высокопроизводительных вычислений или графических процессоров HPC. Чем отличаются два типа графиков?

Нет сомнений в том, что видеокарты за последние годы претерпели огромную эволюцию. Они не только предлагают возможность воспроизводить все более реалистичную графику, но их вычислительная мощность также используется для научных приложений всех видов, что позволило им выйти на большее количество рынков, чем видеоигры. Но на разных рынках разные решения и, как уже известно, оба NVIDIA и AMD имеют архитектуры, предназначенные для воспроизведения видеоигр, с одной стороны, а с другой - для научных вычислений.

На общем уровне у них есть ряд общих элементов, но они несут с собой ряд дифференциальных элементов, которые делают их разными существами, если мы сравним HPC. GPU / ГРАФИЧЕСКИЙ ПРОЦЕССОР архитектура с игровым графическим процессором. Именно поэтому мы решили рассказать вам о различиях между двумя типами GPU.

Точность данных, основное различие в GPU HPC и играх

В видеоигре тот факт, что часть данных не совсем точна, не является проблемой, поскольку обычно работают с тем, что мы математически называем приближением. Которая состоит из использования цифр с более низкой точностью, но с достаточным количеством, чтобы выполнить близкое моделирование. Это связано с тем, что количество битов, которые мы можем назначить данным в ALU, ограничено и больше битов на ALU, больше транзисторов и, следовательно, размер транзисторов больше. Поскольку бюджет транзисторов коммерческого графического процессора ограничен, а точность данных не так важна, эта жертва в конечном итоге принесена.

Но в научных вычислениях все по-другому, точность данных очень важна для выполнения расчетов. Простое изменение данных может привести к слишком сильному отклонению модели, с которой вы работаете, или к ошибочным результатам. Представьте себе катастрофу, которая может произойти, если графический процессор с низкой точностью будет использоваться для расчета определенных элементов при создании нового лекарства, и что из-за отсутствия точности ошибка в конечном итоге приведет к катастрофе со здоровьем. Следовательно, многие графические процессоры, разработанные для высокопроизводительных вычислений, используют прецизионные 64-битные ALU с плавающей запятой. Обычно мы не видим графические процессоры, используемые для игр, по очень очевидному факту.

Использование инструкций с более высокой точностью требует реализации специализированных ALU и, вместе с тем, изменений во всем блоке шейдера, не только в отношении реализации этих ALU, но также в отношении регистров, набора команд и взаимодействия.

Структура стоимости отличается от HPC GPU.

HBM 2

Например, на потребительском рынке невозможно продать большой графический процессор, потому что клиенты могут заплатить очень мало, а также нельзя использовать чрезвычайно дорогие типы памяти, такие как память HBM. Которая, несмотря на то, что она лучше по двум из трех переменных (размер и потребление), проигрывает с точки зрения затрат по сравнению с памятью GDDR6, которая намного дешевле.

Ограничения по стоимости не возникает в случае графических процессоров HPC, поскольку они предназначены для рынка, где высокая стоимость делает использование памяти типа HBM прибыльным. Следовательно, графические процессоры этого типа обычно используют этот тип памяти вместо GDDR6. Если ваши клиенты готовы платить за память лучшего типа, они это сделают.

Другая причина заключается в том, что суперкомпьютеры и центры обработки данных, которые используют графические процессоры HPC, заключается в том, что их энергопотребление обычно заранее заложено в бюджет, где каждый используемый ватт должен использоваться по максимуму. Из-за того, что память HBM потребляет гораздо меньше пДж / бит, чем GDDR6, она в конечном итоге заняла свое место на этом рынке, и это сделало все будущие конструкции графических процессоров HPC основанными на использовании этого типа памяти, для чего требуется использование интерпозеров и, следовательно, структур 2.5DIC.

Разные рынки, разные потребности

Nvidia-A100-HPC

Графические процессоры для рендеринга графики используют серию модулей, которые мы называем фиксированной функцией из-за того, что они не программируются. Его работа? Выполняйте определенные повторяющиеся и повторяющиеся функции при создании графики в реальном времени, которую мы видим на экране. Видеокарты HPC разные, многие из этих устройств не нуждаются в них и поэтому не используют их.

Обычно простейшее изменение преобразования игрового графического процессора в графический процессор HPC начинается с ослепления видеовыхода. Но, как мы видели в двух других разделах, графические процессоры HPC выходят за рамки этого. Верно то, что производители, как правило, оставляют эти типы устройств в своих графических процессорах HPC. Что, мягко говоря, парадоксально, особенно в случае графических процессоров, используемых в NVIDIA Tesla, где разные блоки не используются. AMD, с другой стороны, в своей программе AMD Instinct на основе CDNA полностью исключила их из уравнения.

Почему неиспользованные единицы все еще там? Ну, из-за того, что они занимают мало места, они отключаются, когда не используются, и удалить их из середины и перенастроить весь дизайн без них - более сложная задача, чем поддерживать их. В конце концов, они не являются законченными процессорами и занимают очень мало места. Достаточно, чтобы не беспокоить, несмотря на то, что он был там. Хотя самое большое изменение касается графического командного процессора, у большинства графических процессоров HPC этот блок отключен, и поэтому они не могут обрабатывать список отображения, созданный ЦП для создания графики.