AMD улучшит свои новые видеокарты, добавив тензорные ядра

В последние годы эвфемизмы «искусственный интеллект», «глубокое обучение» и другие волшебные слова стали не чем иным, как называть добавление к оборудованию устройства нового типа, способного выполнять математические операции с матрицами на высокой скорости. Ну, вопреки всему, AMD спрятал деталь в своих графических процессорах с Архитектура RDNA 3 это связано с этим. Их называют WMMA-инструкции и они привносят очень важное изменение, до сих пор неслыханное в игровых видеокартах AMD.

Те из вас, кто больше ветераны, помнят, как в 90-х годах слово «мультимедиа» звучало так же, как сегодня искусственный интеллект. Причина? Добавление блоков SIMD в процессоры прошлых лет. Сегодня то же самое происходит с расчетом матриц и искусственным интеллектом. Что ж, AMD наконец-то внедрила бы эти блоки в свои отечественные GPU, спустя четыре года с тех пор NVIDIA запустит с ними свой первый RTX.

AMD улучшит свои новые видеокарты, добавив тензорные ядра

Блок для работы с матрицами

Одним из достижений NVIDIA в своих графических процессорах является добавление так называемого Тензорные сердечники к RTX, которые представляют собой не что иное, как тип исполнения, называемый систолическим массивом. Его основное преимущество? Возможность работы с массивами данных на высокой скорости. Эти типы математических структур имеют решающее значение для алгоритмов искусственного интеллекта и для возможности хранения больших объемов данных. Что такое изображение, например? Массив пикселей.

Матрицы тензоров IA

Поскольку матрица представляет собой не что иное, как вектор размерности N, до сих пор для выполнения этих операций использовались векторные блоки или SIMD, которые могут выполнять одну и ту же инструкцию параллельно с несколькими разными операндами. Однако, хотя они могут выполнять такие инструкции, они делают это намного медленнее, чем то, что мы называем систолическим массивом.

Что ж, у NVIDIA есть свои тензорные диски и Intel добавив свои XMX, которые являются просто торговыми названиями для одной и той же концепции, отсутствовал тот, кто был AMD. В любом случае, отсутствие было скорее в своих графических процессорах для домашних компьютеров и рабочих станций. Поскольку в мире высокопроизводительных вычислений или высокопроизводительных вычислений их AMD Instinct на основе CDNA уже давно используется с этими дисками.

WMMA, матричные базовые блоки для RX 7000

Название, которое AMD дает своим систолическим массивам, — Matrix Core Units. , которые были не выпущен в RDNA и RDNA 2 . Что ж, после нескольких слухов, в которых говорилось, что AMD не будет делать ставку на этот тип блока в своих GPU, выясняется, что в репозитории LLVM есть упоминания о включение инструкций WMMA для GFX11 , что AMD называет своей архитектурой RDNA 3. будущие графические процессоры, такие как RX 7000, и процессоры, такие как Phoenix .

В репозитории аббревиатура ВММА описывается как Волновая матрица, умножение, накопление и описывается как:

Эти операции выполняют матричное умножение и сложение в виде: D = A*B+C.

ВММА NVIDIA

Что напоминает нам структуру, определенную NVIDIA для описания своих тензорных ядер. Более того, как видите, конкурирующая с AMD компания также использовала концепцию WMMA. Кроме того, использование в графических процессорах AMD этого типа блоков видно при косом взгляде на исходный код.

  • Результирующая матрица (D) задается в 32-битном или 16-битном формате с плавающей запятой и 3 матрицы, работающие в 16-битном формате с плавающей запятой или BFLOAT16.
  • Окончательное значение D представляет собой 32-битные целые числа, а A, B и C — 4- или 8-битные целые числа.

Итак, резюмируя: мы находим, что AMD добавила инструкции WMMA в RDN A, который относится к добавлению единицы для работы с матрицами, то есть У графических процессоров AMD наконец-то появятся собственные тензорные ядра . Которые широко используются в мире искусственного интеллекта и были одним из элементов