Innosilicon Fantasy I: arquitetura e recursos

Quando falamos de GPUs em PCs, costumamos citar três empresas americanas: AMD, NVIDIA e, em menor grau, Intel. O que aconteceria se disséssemos que estão aparecendo placas gráficas na China que fazem uso da tecnologia britânica em seus GPU, mas montado e fabricado na China? Neste artigo vamos descrever a arquitetura do Innosilicon Fantasy I.

Innosilicon Fantasia I

Falar sobre as arquiteturas PowerVR da Imagination é quase como falar sobre uma tragédia grega. Desde a sua criação e em diferentes gerações, vimos isso em vários sistemas diferentes, como o SEGA Dreamcast, as placas gráficas KYRO da ST Micro e até mesmo o PlayStation Vita. Seu ponto em comum? Falhas comerciais autênticas, apesar da alta qualidade de sua GPU. No entanto, eles tiveram a sorte de ser a arquitetura gráfica dos processadores de Apple dispositivos, até que os de Cupertino decidiram ir por conta própria e “projetar” sua própria arquitetura gráfica por um tempo.

Imagination Technologies Fantasia I PowerVR

O período de desentendimentos entre a Apple e a Imagination mais uma vez levou os britânicos a buscarem licenciar suas arquiteturas gráficas para terceiros. Atualmente, se olharmos o panorama tanto em dispositivos inteligentes quanto no mundo dos PCs, veremos como o Imagination e seu PowerVR parecem ter desaparecido.

A sua ausência no Android mundo foi aproveitado por outros participantes, como ARM se com Mali ou Qualcomm com seu Adreno. Isso fez com que eles se mudassem para outros mercados, como o fabricante chinês Innosilicon, famoso por seus ASICs para mineração, que apresentou há pouco tempo seu Fantasy 1. É a primeira placa gráfica baseada em um PowerVR desde o início dos anos 2000 Kyro , mas eles podem competir contra NVIDIA e AMD no espaço de PC?

O que é renderização em mosaico?

No final da década de 1990, os projetistas de placas gráficas tiveram que lutar pelo desempenho com um problema comum, a falta de largura de banda. Os processadores gráficos comparados com o que são hoje eram muito simples. A primeira parte do pipeline 3D, antes da rasterização, foi calculada pelo CPU. A segunda parte da mudança foi realizada pela placa gráfica, que exigia grandes quantidades de largura de banda que a memória da época não conseguia fornecer sem custos vertiginosos.

Pipeline de Rendeirng de Tile

A solução proposta pela Imagination foi a renderização por Tiles, que ainda continua sendo a base de sua arquitetura, então ainda hoje o Fantasy I uma vez que a geometria foi calculada na própria GPU, são adicionados estágios adicionais em relação a uma GPU convencional. Um Tile Renderer classifica a posição da geometria em RAM com base em sua posição na cena antes da rasterização para criar listas de exibição individuais para cada bloco que serão resolvidos um por um durante o processo de renderização.

Vantagens

Devido ao pequeno tamanho de cada bloco ou Tile, isso permite que seja resolvido sem ter que acessar a VRAM, pois utilizam memória interna para isso. Isso também o torna ideal para renderização lenta que geralmente usa vários buffers de imagem para calcular a iluminação da cena. Sua outra vantagem é que, como conhecer a posição dos elementos na cena é essencial para gerar a estrutura de dados espaciais para o Ray Tracing, é mais fácil implementar o Ray Tracing nesse tipo de arquitetura.

Desvantagens

No entanto, isso tem duas desvantagens. A primeira é que requer hardware mais complexo que uma GPU convencional para atingir o mesmo desempenho e, portanto, sempre obteremos desempenho inferior para um chip do mesmo tamanho, a segunda é que a existência de memória de alta velocidade como GDDR ou A HBM elimina sua vantagem em um PC para jogos. É por isso que esse tipo de arquitetura se tornou padrão em dispositivos de bolso, onde a largura de banda da memória por motivos de consumo é limitada.

PowerVR B-Series, a arquitetura gráfica de Fantasy I

Para entender a arquitetura das placas de vídeo Fantasy I da Innosilicon, e aliás também o que está dentro dos processadores da Apple para seus dispositivos, temos que fazer um tour pela arquitetura atual da Imagination e embora saibamos que recentemente foi apresentada a Série C, também conhecido como Photon, no momento os dispositivos mais avançados usam como arquitetura a Série B da Imagination.

GPU Innosilicon Fantasy I

O núcleo da série B

A organização de cada um desses núcleos é a seguinte:

Innosilicon Fantasia I PowerVR

  • Quatro blocos USC, Unified Shader Cluster, onde cada um tem até 128 ALUs em FP32 para um total de 512 por núcleo. Dada a capacidade de executar uma instrução de adição e multiplicação em um único ciclo de clock, ela é capaz de realizar 1024 operações por ciclo de clock.
  • 8 unidades de textura, cada uma capaz de produzir 4 texels, para um total de 32.
  • 16 ROPS.
  • 1 unidade de mosaico.
  • 1 unidade raster.

Cada um dos núcleos é responsável exclusivamente por um bloco ou bloco na tela, independentemente do resto. Assim, cada um deles tem suas próprias unidades de raster e tesselação. Além de carregar uma pequena memória interna para resolver o buffer de imagem dentro dela e reduzir o impacto na RAM do sistema. No entanto, esta memória é utilizada exclusivamente para o ROPS e apesar dos benefícios da GPU, devido aos enormes mapas de textura utilizados hoje, é necessário acessar a VRAM para obter os dados de textura.

Fantasy I, a primeira GPU chiplet

A grande novidade da Série B da Imagination usada em Fantasy I é o fato de ser a primeira GPU composta por chiplets, ou seja, diferentes chips que funcionam juntos como um único processador. Para isso, a lista de telas é enviada para o primeiro dos quatro chiplets que compõem a GPU, enquanto os outros três são subordinados. É uma solução muito semelhante à que a AMD propôs em patentes com RDNA 3 e que certamente será comum em todas as GPUs desse tipo no futuro.

No entanto, esta solução difere em um ponto específico, o uso da renderização por tiles para realizar o que é pré-renderização e poder ter várias listas de telas não antes da rasterização, mas desde o início do pipeline 3D. O conceito nada mais é do que renderizar a cena sem shaders ou texturas de qualquer tipo e a partir do pipeline de computação e não dos gráficos. Isso permite que você organize várias listas de comandos e não apenas uma que permitirá explorar o grande número de núcleos durante a pré-renderização. Este processo é realizado automaticamente uma vez que o processador de comando da primeira GPU tenha lido a lista de telas.

Isso nos permite ter várias listas de telas para a mesma cena que podem ser organizadas pelos diferentes núcleos. É assim que se consegue que, com uma configuração de 2 chiplets, cada um seja responsável por metade da tela, com 4 deles distribuídos em um quarto.

O que o Innosilicon trouxe para sua placa de vídeo?

No entanto, nem todo o trabalho foi feito pelo pessoal da Imagination, mas Innosilicon foi quem projetou o restante da placa gráfica, adicionando o design da PCB e escolhendo o restante dos materiais. Onde o que mais se destaca é o uso de memórias GDDR6 ou GDDR6X dependendo do modelo a ser usado, suporte para DisplayPort 1.5 e HDMI 2.1, mas especificamente o uso de sua tecnologia Innolink, que foi projetada para comunicar internamente os quatro chiplets que fazem parte da GPU.

Chiplets Innolink Fantasia I

Especificamente, temos duas variantes diferentes, as chamadas do Tipo A podem atingir 5 TFLOPS de potência em FP32 , possui interface de memória com VRAM GDDR128X de 6 bits a 19 Gbps com largura de banda de 304 GB/s. O tipo B, por outro lado, possui duas GPUs completas e, portanto, são compostas por 8 chiplets no total e o dobro dos números

Innosilicon Fantasy eu não sou para o seu PC

A realidade é que você não poderá comprar as placas gráficas Fantasy I da Innosilicon para usá-las em seu PC Gaming, nem estaria interessado, pois a Imagination projeta suas arquiteturas para dispositivos de bolso onde Windows não é o sistema operacional dominante e nem é DirectX, porque encontramos uma série de deficiências. Não faz sentido adicionar funcionalidades ao seu hardware que seu cliente não vai usar e o maior cliente dessas GPUs, ainda que secretamente, é a Apple e especificamente sua API Metal.

Tarjetas Gráficas Innosilicon

Ironicamente, o PowerVR está tão ligado ao Metal, a API usada no iOS, macOS e o resto dos sistemas operacionais da Apple, que no final o pessoal de Tim Cook acabou assinando um acordo com a Imagination para que possam continuar desenvolvendo a GPU integrada em seus processadores . Portanto, nos atuais Apple A15, M1 e suas variantes Pro e Max, o que está dentro é um PowerVR. A contrapartida disso é que os de Cupertino criaram a ideia geral de que são tão todo-poderosos que podem criar todo o hardware de um sistema e competir por recursos contra o mundo inteiro. A realidade é muito diferente.

O fato de uma GPU composta por 4 chiplets atingir 6 TFLOPS quando a faixa de entrada para PC já atinge isso pode nos surpreender, mas devemos ter em mente que é um design projetado para processadores móveis, mas com o objetivo de atingir a computação em nuvem e não deve ser usado em um PC para jogos.

Projetado para data centers e computação em nuvem

Não esqueçamos que em servidores é normal usar vários processadores e que temos cada vez mais servidores baseados em processadores de smartphones. Também não podemos esquecer a tendência de virtualizar uma placa gráfica na nuvem para vários clientes, por sua natureza, o Fantasy I não requer virtualização, cada um dos chiplets que o compõem pode funcionar como uma pequena GPU.

Servidores ARM

Portanto, temos uma arquitetura que deriva de dispositivos móveis e se expande para data centers, mas sem passar pela vizinhança que é o PC. Isso significa que falta uma série de recursos que hoje são essenciais para jogos de PC. É por isso que, apesar de a aparência do Fantasy I poder ser uma reminiscência de uma GPU para jogos ou não parecer séria com essas cores, elas realmente são para computação em nuvem, embora seja uma primeira geração. Estamos diante de um futuro em que a placa gráfica não está nas mãos do usuário, mas no servidor?

De qualquer forma, a China como superpotência rival dos Estados Unidos precisa ser totalmente independente do ponto de vista tecnológico e isso significa criar suas próprias soluções fora das clássicas da NVIDIA, Intel e AMD, que lembramos serem empresas americanas.