Детальный анализ аппаратной архитектуры Steam Deck

Аппаратная архитектура Steam Deck

Презентация ПК Valve в виде портативной консоли, получившей название Steam Палуба застала многих из нас врасплох. Не только из-за того, что этого не ожидали, но и из-за того, что он предполагает. Возможность играть в компьютерные игры где угодно. Но насколько это способно? Вот почему мы решили проанализировать архитектуру.

Кто бы не хотел играть в свои любимые компьютерные игры на ходу? Это правда, что Nintendo Switch существует для игр высокой четкости на ноутбуке. Но надо учитывать, что не все игры идут на Nintendo консоли и есть игры для ПК, которые мы хотели бы взять с собой куда угодно, будь то номер в отеле, наша квартира или во время долгой поездки на автомобиле, куда мы этого не делаем. мы едем.

Вот почему мы решили провести анализ оборудования Steam Deck, особенно с учетом его полезности. Компьютерные игры в любом месте и в любом месте. Поэтому мы также приняли это во внимание и указали на те части, в которых, по нашему мнению, с точки зрения переносимости и Valve, и AMD мог бы сделать лучше.

Ван Гог, консольная технология нового поколения в большом масштабе

AMD Ван Гог Рембрандт

Если мы посмотрим на два основных помещения основного APU Steam Deck, то обнаружим, что у него есть ЦП Архитектура Дзен 2 и GPU / ГРАФИЧЕСКИЙ ПРОЦЕССОР с архитектурой RDNA 2 , два общих момента со всеми консолями нового поколения, но в меньшем масштабе. .

Начиная с CPU, Steam Deck использует 2-ядерный процессор Zen 4 CCX , вместо того, чтобы использовать 2 из них, как в консолях, так что это 4-ядерный и 8-поточный дизайн . Для нас удивительно, что устройство, работающее от батареи, выбирает многопоточность, но при этом необходимо учитывать, что затраты энергии на размещение 8 ядер намного выше. Ваша тактовая частота? Это между 2.4 ГГц и 3.5 ГГц . И снова мы обнаруживаем еще один удивительный элемент, если учесть, что мы говорим о системе, которая не предназначена для подключения к розетке.

ВСУ паровой палубы

Что касается GPU, у нас есть RDNA 2 с 8 вычислительными блоками , который движется со скоростью между 1 ГГц и 1.6 ГГц z, Valve не рассказала об использовании технологии AMD SmartShift, реализованной в RX 5000 и RX 6000 Gaming, а также в PlayStation 5 ВСУ. Но мы должны учитывать проблему теплового регулирования, которое приводит к снижению тактовой частоты процессора, графического процессора или обоих одновременно и более в устройствах с низким энергопотреблением.

Например, Nintendo делает это с Nintendo Switch, оставляя процессор на 1 ГГц и позволяя изменять скорость графического процессора. Только в тех случаях, когда есть переход экрана в виде затемнения черного или воспроизведение видео, которое нельзя пропустить. ЦП Nintendo Switch настроен на максимальную скорость для выполнения задачи копирования данных из флэш-памяти NAND консоли на Оперативная память. где расположены данные следующего уровня. Но в целом дизайн портативной системы, которая рассчитана на часы игр вдали от дома, редко приводит к увеличению скорости процессора и графического процессора.

Отсутствие Infinity Cache имеет решающее значение

Бесконечный кэш Consumo Мы не знаем, есть ли в Steam Deck Бесконечный кэш или нет , но мы думаем не потому, что на данный момент это не подтверждено для остальных APU AMD и кажется уникальной особенностью выделенных графических процессоров, а не встроенных. но мы знаем, насколько важен Infinity Cache с точки зрения производительности. Особенно из-за того, что текущие графические процессоры ведут себя растеризацией для тайлов. Мы не говорим о рендеринге плитки. Растр плитки встречается на всех NVIDIA Графические процессоры со времен Maxwell под названием Tiled Caching и на всех графических процессорах AMD со времен Vega под названием DSBR.

Идея состоит в том, что часть 3D-конвейера, которая идет от растра треугольника к нарисованному в буфере изображения, выполняется так же, как при рендеринге по тайлам, но с разницей. Плитки хранятся в кэше L2. Которая не является ОЗУ и поэтому не работает как таковая. Это означает, что любые данные, которые выпадают из строк кэша L2, попадают напрямую в оперативную память. Поскольку кэш L2 напрямую связан с пропускной способностью контроллера памяти, которая намного меньше со встроенным графическим процессором и 128-битной шиной LPDDR5. Так что шансы попадания данных в оперативную память намного выше.

В RDNA 2 для ПК и только в Radeon RX 6000 AMD добавила Infinity Cache, это дополнительный уровень кэша, который действует как Victim Cache, собирая отброшенные данные из кеша L2 и усваивая их внутри. Важность этого заключается в том, что доступ к данным, находящимся в Infinity Cache, увеличивает энергоэффективность, требуя для доступа меньше пДж / бит. Это правда, что LPDDR5 потребляет меньше, чем GDDR6, поскольку в среднем оно близко к 4 пДж / бит, но добавление Infinity Cache в APU сделало бы Steam Deck более эффективным.

Трассировка лучей не требуется, VRS

Портада для трассировки лучей Vulkan

Поскольку интегрированный графический процессор - это RDNA 2, он поддерживает трассировку лучей, учитывая включение модулей пересечения лучей. Но трассировка лучей - это не только расчет пересечения, но и обход дерева BVH. Это делается в RDNA 2 с помощью вычислений, и поверьте нам, что мощности в этом аспекте в случае Steam Deck недостаточно.

Другой темой является шейдинг с переменной скоростью, который группирует пиксели, к которым относится пиксельный или фрагментный шейдер, которые имеют общее значение цвета и программу шейдера, для обработки их как одного и затем копирования данных. Это дает производительность в зависимости от игры от 10% до 30% по сравнению с ее неиспользованием, за исключением сокращения доступа к VRAM, смертельно опасного, как мы уже говорили ранее, с точки зрения энергопотребления.

Большинство пользователей Steam Deck будут использовать свою существующую библиотеку Steam, где 99% игр не требуют трассировки лучей, и им не придется беспокоиться о возможностях трассировки лучей графического процессора Steam Deck.

Оперативная память, скорость, размер и доступ в Steam Deck

Контроллер памяти AMD Ryzen 4000
Во всех APU / SoC AMD, ЦП которых принадлежит к одному из поколений архитектуры Zen, есть один общий элемент: способ доступа. Во всех случаях его унифицированный контроллер памяти, UMC, обменивается данными с ОЗУ через 256-битную шину на скорости memclk, которая в памяти DDR и LPDDR составляет половину ее скорости передачи, в данном случае 2750 МГц, что вдвое меньше, чем у 5500. МТ / с. Общая пропускная способность? 88 ГБ / с, что более чем в три раза превышает 25.6 ГБ / с SoC Nintendo Switch.

Поэтому UMC был обновлен по сравнению с тем, который используется в APU Ryzen 4000 и Ryzen 5000 для ПК, поскольку он перешел от поддержки 4 каналов LPDDR4 к превышению того же количества каналов LPDDR5. Необходимо учитывать, что с каждым новым поколением любого типа памяти напряжение снижается для достижения тактовой частоты, это позволяет увеличить тактовую частоту и иметь более быструю оперативную память и, следовательно, с большей пропускной способностью. Проблема связана с энергоэффективностью, которая измеряется в пДж / бит, и можно сказать, что эволюция в этом аспекте идет вспять.

Поскольку ватты - это Джоули в секунду, мы можем легко экстраполировать пропускную способность оперативной памяти на то, что она потребляет в каждую секунду. Ответ? В Switch Deck у нас есть гораздо более высокий показатель, чем то, что потребляет ОЗУ Nintendo Switch, поэтому с самого начала у нас уже есть первая проблема с точки зрения дизайна: энергопотребление памяти намного выше, чем у ее прямых конкурентов. , что является одной из проблем, связанных с потреблением энергии и, следовательно, временем автономной работы.

Арифметика и интенсивность текстурирования в Steam Deck

В вычислениях существует концепция байтов на FLOP или байтов на операцию с плавающей запятой. Мы используем его для измерения арифметической интенсивности различных алгоритмов при их выполнении на графическом процессоре. Еще одна проблема, которую нужно измерить, - это то, что мы окрестили интенсивностью текстурирования, где она помогает нам проверить, есть ли узкое место в отношении захвата текстур по отношению к графическим процессорам с архитектурой ПК RDNA 2.

Для этого мы решили взять AMD RX 6700 XT, чтобы провести сравнение в рамках той же графической архитектуры. AMD RX 6700 XT, для сравнения с другим RDNA 2, имеет ширину 412.8 ГБ / с и мощность 13.21 терафлопс, что дает нам около 0.032 байта на FLOP. Максимальная мощность графического процессора Steam Deck составляет 1.6 терафлопс. с пропускной способностью 88 ГБ / с, как мы уже выяснили ранее. Цифру получим? 0.055 байта на FLOP , поэтому память не является узким местом по сравнению с AMD RX 6000 для настольных ПК для вычисления шейдеров и остальных графических шейдеров, кроме пиксельных или фрагментных шейдеров.

Вызов-оф-Duty-Modern-Warfare

Другая проблема для измерения арифметической интенсивности в Steam Deck связана с модулями текстурирования, которые работают вместе с пиксельными шейдерами. На RX 6700 XT скорость текстурирования составляет 413 GTexeles / s. В случае Steam Deck у нас есть 8 вычислительных блоков, каждый из которых создает 32 текстурных блока и максимальную тактовую частоту 1.6 ГГц, которая преобразуется в 51.2 Гтекселей / с. показатель. Применяя то же правило байтов на FLOP, мы можем измерить производительность в отношении текстурирования.

А что мы получаем? На RX 6700 XT это 0.99, если не сказать корреляция 1: 1, очевидно, полоса пропускания не будет использоваться для текстурирования. Это просто способ измерить интенсивность памяти для этой задачи. А что в случае со Steam Deck? Опять таки интенсивность памяти лучше - 1.71. Так что еще раз баланс между встроенным графическим процессором и пропускной способностью - одна из сильных сторон. Это гарантирует, что память не является узким местом для графической производительности консоли.

Темная часть, хранилище Steam Deck

Паровая колода

Базовая версия консоли поставляется с 64 ГБ EMMC , фигура, которая кажется смешным и где вообще невозможно будет установить что-либо, поэтому необходимо приобрести модуль M.2 2230, чтобы установить его внутри консоли. Маневр, который может привести к аннулированию гарантии, поскольку Valve не рекомендует возиться с консолью для этого. И именно здесь мы впервые хлопаем Valve по запястью. Поскольку на момент написания этой статьи мы можем найти модули M.2 2230 по гораздо более низкой цене, чем разница между разными моделями. Так что для нас было бы намного лучше предоставить легкий доступ через крышку к интерфейсу M.2.

Но что, если у нас закончится место и у нас нет M.2 SSD установлен? Не волнуйтесь, Valve разместила слот для карт памяти microSD. На первый взгляд это кажется очень хорошим, но производительность microSD при передаче данных очень и очень низкая и вы увидите, как множество игр станет вечным. Вот почему мы рекомендуем вам сначала перейти к M.2 2230 PCIe и установить его или, в противном случае, выбрать два самых продвинутых модуля.

Твердотельный накопитель Steam Deck

И дело не только в хранилище, но и в том, что мы говорим об увеличении пропускной способности в несколько десятков раз, а это означает, что устройство напрямую становится другим с точки зрения производительности. Однако, не забывая, что Steam Deck разработан как ноутбук, мы удивлены выбором этого типа хранилища. SSD-накопитель NVMe - это лучшая скорость доступа к памяти, которую вы можете установить в системе, это правда.

Лучшее в портативной системе? Не совсем, поскольку память eUFS 3.x имела бы больше смысла, поскольку нет смысла использовать NVMe PCIe, если игры, которые машина из каталога ПК сможет запускать без каких-либо проблем с производительностью, они и есть которые плохо пользуются преимуществами. С этого момента до выпуска игр, использующих преимущества твердотельных накопителей NVMe на ПК, Steam Deck потенциально устареет, чтобы запускать их на приличной скорости.

А теперь доделать экран

Паровая колода Pantalla

Для многих включение экрана с разрешением 800p и соотношением сторон 16:10 покажется шагом назад, но это не так, если мы примем во внимание связанные с этим затраты с точки зрения пропускной способности и вычислительных потребностей, которые имеют более высокое разрешение. .

Отрицательным моментом является то, что экран не OLED, поскольку этот тип экранов потребляет меньше, и проблема сжигания пикселей не должна быть проблемой в системе видеоигр. Принимая во внимание, что Nintendo применила ее в новой модели Switch, а тем, кто в Киото, потребуются годы, чтобы внедрить технологию, и когда они это сделают, это будет по выгодной цене. Включение OLED-экрана от Valve для своей Steam Deck было бы лучшим вариантом, и нет, мы не говорим, что экран плохой, но мы говорим о концепции энергопотребления, которая важна для портативной системы.

В любом случае у него достаточно разрешения, чтобы обеспечить хорошее качество изображения и производительность, поскольку Valve гарантирует, что все игры в своем каталоге работают с минимальной частотой кадров 30, что не идеально для всех игр.