Innosilicon Fantasy I : architecture et fonctionnalités

Lorsque nous parlons de GPU dans les PC, nous citons généralement trois sociétés américaines : AMD, NVIDIA et, dans une moindre mesure, Intel. Que se passerait-il si nous vous disions que des cartes graphiques apparaissent en Chine qui utilisent la technologie britannique dans leur GPU, mais assemblé et fabriqué en Chine ? Dans cet article, nous allons décrire l'architecture de l'Innosilicon Fantasy I.

Innosilicon Fantaisie I

Parler des architectures PowerVR d'Imagination, c'est presque comme parler d'une tragédie grecque. Depuis sa création et à travers différentes générations, nous l'avons vu sur plusieurs systèmes différents comme le SEGA Dreamcast, les cartes graphiques KYRO de ST Micro et même le PlayStation Vita. Leur point commun ? D'authentiques échecs commerciaux malgré la grande qualité de son GPU. Cependant, ils ont eu la chance d'être l'architecture graphique des processeurs de Apple appareils, jusqu'à ce que ceux de Cupertino décident de se débrouiller seuls et de "concevoir" leur propre architecture graphique pendant un certain temps.

Imagination Technologies Fantaisie I PowerVR

La période de désaccords entre Apple et Imagination conduit une nouvelle fois les Britanniques à chercher à licencier leurs architectures graphiques à des tiers. Actuellement, si nous regardons le panorama à la fois dans les appareils intelligents et dans le monde des PC, nous verrons comment Imagination et son PowerVR semblent avoir disparu.

Son absence dans le Android monde a été mis à profit par d'autres participants, tels que BRAS lui-même avec Mali ou Qualcomm avec son Adreno. Cela les a fait se tourner vers d'autres marchés, comme le fabricant chinois Innosilicon, célèbre pour ses ASIC pour le minage, qui a présenté il n'y a pas si longtemps sa Fantasy 1. Il s'agit de la première carte graphique basée sur un PowerVR depuis le début des années 2000 Kyro , mais peuvent-ils rivaliser avec NVIDIA et AMD dans l'espace PC ?

Qu'est-ce que le rendu en mosaïque ?

À la fin des années 1990, les concepteurs de cartes graphiques devaient lutter pour les performances avec un problème commun, le manque de bande passante. Les processeurs graphiques par rapport à ce qu'ils sont aujourd'hui étaient très simples. La première partie du pipeline 3D, avant rastérisation, a été calculée par le Processeur. La deuxième partie du changement a été réalisée par la carte graphique, qui nécessitait de grandes quantités de bande passante que la mémoire de l'époque ne pouvait fournir sans des coûts qui explosaient.

Pipeline Tile Rendeirng

La solution proposée par Imagination était le rendu par Tiles, qui reste toujours à la base de son architecture, donc même aujourd'hui la Fantasy I une fois la géométrie calculée dans le GPU lui-même, des étapes supplémentaires sont ajoutées par rapport à un GPU classique. Un Tile Renderer trie la position de la géométrie dans RAM en fonction de sa position dans la scène juste avant la pixellisation pour créer des listes d'affichage individuelles pour chaque tuile qu'il résoudra ensuite une par une pendant le processus de rendu.

Avantages

En raison de la petite taille de chaque bloc ou tuile, cela permet de le résoudre sans avoir à accéder à la VRAM, car ils utilisent la mémoire interne pour cela. Cela le rend également idéal pour le rendu paresseux qui utilise souvent plusieurs tampons d'image pour calculer l'éclairage de la scène. Son autre avantage est que la connaissance de la position des éléments dans la scène étant essentielle pour générer la structure de données spatiales pour le Ray Tracing, il est plus facile d'implémenter le Ray Tracing dans ce type d'architecture.

Inconvénients

Cependant, cela présente deux inconvénients. Le premier est qu'il nécessite un matériel plus complexe qu'un GPU classique pour atteindre les mêmes performances et, par conséquent, nous obtiendrons toujours des performances inférieures pour une puce de même taille, le second est que l'existence de mémoire haute vitesse comme GDDR ou HBM élimine son avantage dans un PC de jeu. C'est pourquoi ce type d'architecture est devenu standard dans les appareils de poche, où la bande passante mémoire pour des raisons de consommation est limitée.

PowerVR B-Series, l'architecture graphique de Fantasy I

Pour comprendre l'architecture des cartes graphiques Fantasy I d'Innosilicon, et accessoirement aussi ce qu'il y a à l'intérieur des processeurs d'Apple pour ses appareils, nous devons faire un tour de l'architecture actuelle d'Imagination et bien que nous sachions qu'elle a récemment été présentée La série C, également connu sous le nom de Photon, à l'heure actuelle, les appareils les plus avancés utilisent la série B d'Imagination comme architecture.

GPU Innosilicon Fantasy I

Le cœur de la série B

L'organisation de chacun de ces noyaux est la suivante :

Innosilicon Fantasy I PowerVR

  • Quatre blocs USC, Unified Shader Cluster, où chacun a jusqu'à 128 ALU dans FP32 pour un total de 512 par cœur. Étant donné la possibilité d'exécuter une instruction d'addition et de multiplication en un seul cycle d'horloge, il est capable d'effectuer 1024 opérations par cycle d'horloge.
  • 8 unités de texture, chacune capable de produire 4 texels, pour un total de 32.
  • 16 ROPS.
  • 1 unité de pavage.
  • 1 unité raster.

Chacun des cœurs est exclusivement responsable d'une tuile ou d'un bloc sur l'écran indépendamment du reste. Par conséquent, chacun d'eux a ses propres unités de raster et de tessellation. En plus de transporter une petite mémoire interne pour résoudre le tampon d'image à l'intérieur et réduire l'impact sur la RAM du système. Cependant, cette mémoire est utilisée exclusivement pour le ROPS et malgré les avantages du GPU, en raison des énormes cartes de texture utilisées aujourd'hui, il est nécessaire d'accéder à la VRAM pour obtenir les données de texture.

Fantasy I, le premier GPU chiplet

La grande nouveauté de l'Imagination B-Series utilisée dans Fantasy I est le fait qu'il s'agit du premier GPU composé de chiplets, c'est-à-dire de différentes puces qui fonctionnent ensemble comme un seul processeur. Pour ce faire, la liste d'écrans est envoyée au premier des quatre chiplets qui composent le GPU, tandis que les trois autres sont subordonnés. C'est une solution très similaire à celle qu'AMD a proposée dans les brevets avec RDNA 3 et qui sera sûrement commune à tous les GPU de ce type à l'avenir.

Cependant, cette solution diffère sur un point précis, l'utilisation du rendu par tuiles pour effectuer ce qui est du pré-rendu et pour pouvoir avoir plusieurs listes d'écrans non pas avant rastérisation, mais dès le début du pipeline 3D. Le concept n'est autre que le rendu de la scène sans shaders ni textures d'aucune sorte et à partir du pipeline informatique et non des graphismes. Cela vous permet d'organiser plusieurs listes de commandes et pas une seule qui vous permettra d'exploiter le grand nombre de cœurs lors du pré-rendu. Ce processus est effectué automatiquement une fois que le processeur de commandes du premier GPU a lu la liste d'écrans.

Cela nous permet d'avoir plusieurs listes d'écrans pour la même scène qui peuvent être organisées par les différents cœurs. C'est ainsi qu'il est réalisé qu'avec une configuration de 2 chiplets chacun est en charge d'une moitié de l'écran, avec 4 d'entre eux ils sont répartis sur un quart.

Qu'est-ce qu'Innosilicon a apporté à votre carte graphique ?

Cependant, tout le travail n'a pas été fait par les gens d'Imagination, mais Innosilicon a été celui qui a conçu le reste de la carte graphique, en ajoutant la conception du PCB et en choisissant le reste des matériaux. Là où ce qui ressort le plus, c'est l'utilisation de mémoires GDDR6 ou GDDR6X selon le modèle à utiliser, la prise en charge de DisplayPort 1.5 et HDMI 2.1, mais surtout l'utilisation de sa technologie Innolink, qui a été conçue pour communiquer en interne les quatre puces qui font partie du GPU.

Innolink Chiplets Fantaisie I

Plus précisément, nous avons deux variantes différentes, les appels de type A peuvent atteindre 5 TFLOPS de puissance en FP32 , il dispose d'une interface mémoire avec la VRAM GDDR128X 6 bits à 19 Gbps avec une bande passante de 304 Go/s. Le type B, en revanche, a deux GPU complets et, par conséquent, est composé de 8 chiplets au total et double le nombre

Innosilicon Fantasy Je ne suis pas pour votre PC

La réalité est que vous ne pourrez pas acheter les cartes graphiques Fantasy I d'Innosilicon pour les utiliser dans votre PC de jeu, et cela ne vous intéresserait pas non plus, car Imagination conçoit ses architectures pour les appareils de poche où Windows n'est pas le système d'exploitation dominant et ce n'est pas non plus DirectX, car nous trouvons une série de lacunes. Cela n'a aucun sens d'ajouter des fonctionnalités à votre matériel que votre client n'utilisera pas et le plus gros client de ces GPU, bien que secrètement, est Apple et plus particulièrement son API Metal.

Tarjetas Gráficas Innosilicon

Ironiquement, PowerVR est tellement lié à Metal, l'API utilisée dans iOS, macOS et le reste des systèmes d'exploitation d'Apple, qu'au final les gens de Tim Cook ont ​​fini par signer un accord avec Imagination afin qu'ils puissent continuer à développer le GPU intégré à leurs processeurs . Ainsi, dans l'actuel Apple A15, M1 et ses variantes Pro et Max, ce qu'il y a à l'intérieur est un PowerVR. La contrepartie de cela est que ceux de Cupertino ont créé l'idée générale qu'ils sont si puissants qu'ils peuvent créer tout le matériel d'un système et rivaliser pour les ressources contre le monde entier. La réalité est très différente.

Le fait qu'un GPU composé de 4 chiplets atteigne 6 TFLOPS alors que la plage d'entrée pour PC atteint déjà cela peut nous surprendre, mais il faut garder à l'esprit qu'il s'agit d'une conception conçue pour les processeurs mobiles, mais dans le but d'atteindre le cloud computing et ne pas être utilisé dans un PC de jeu.

Conçu pour les centres de données et le cloud computing

N'oublions pas que dans les serveurs il est normal d'utiliser plusieurs processeurs et que nous avons de plus en plus de serveurs basés sur des processeurs de smartphone. N'oublions pas non plus la tendance à virtualiser une carte graphique dans le cloud pour plusieurs clients, de par sa nature, la Fantasy I ne nécessite pas de virtualisation, chacun des chiplets qui la composent peut fonctionner comme un petit GPU.

Services ARM

On a donc une architecture qui dérive des mobiles et qui évolue jusqu'aux datacenters, mais sans passer par le voisinage qu'est le PC. Cela signifie qu'il manque une série de fonctionnalités qui sont aujourd'hui essentielles pour les jeux PC. C'est pourquoi, malgré le fait que l'apparence du Fantasy I puisse rappeler celle d'un GPU Gaming ou qu'il n'ait pas l'air sérieux avec ces couleurs, ils sont vraiment pour le cloud computing, même s'il s'agit d'une première génération. Sommes-nous confrontés à un futur où la carte graphique n'est plus entre les mains de l'utilisateur, mais du serveur ?

Dans tous les cas, la Chine en tant que superpuissance rivale des États-Unis doit être totalement indépendante d'un point de vue technologique et cela signifie créer ses propres solutions en dehors des solutions classiques de NVIDIA, Intel et AMD, dont on se souvient sont des sociétés américaines.