Normalmente não falamos sobre sistemas de servidor, no entanto, AMDdo MI300 tem chamado nossa atenção. Não pela sua estranha configuração, mas pelo facto de poder ser uma pista de como poderão ser os sistemas com hardware exclusivo da marca no futuro. O que incluiria não apenas futuros PCs, mas também consoles de videogame em potencial.
Os altos custos de fabricação e certos limites que antes não existiam tornam necessário buscar soluções alternativas ao projetar novos processadores ao construir sistemas complexos. Uma das tendências que mais soam no papel é a transferência da intercomunicação interna de um chip para o que chamamos de interposer em um circuito integrado 2.5D, ou seja, formado por vários chips pequenos ao invés de um único grande. O MI300 é o primeiro produto a cumprir essa promessa e, embora seja um processador de servidor e, portanto, computação de alto desempenho, é interessante dar uma olhada nele para o futuro.
AMD atinge memória totalmente coerente no MI300
Uma das particularidades das consolas de videojogos é o facto de o seu espaço de memória estar completamente unificado a nível físico, ou seja, todos os elementos partilham o acesso ao mesmo RAM chips de memória. No entanto, o que é feito é separar o espaço de armazenamento em duas metades diferentes para evitar conflitos quanto à coerência da memória. O ideal, porém, é que todo o espaço seja compartilhado, pois isso evitaria o uso de processos de cópia de uma parte da RAM para outra.
Ou seja, mesmo havendo memória fisicamente compartilhada, é necessário utilizar a unidade DMA para copiar de CPU espaço para GPU espaço e vice-versa. A unificação no endereçamento de ambos os pools de memória é uma das coisas que a empresa de Lisa Su tem falado, e não é uma piada, por uma década. No entanto, eles o vendem como uma das atualizações a serem observadas no MI300. De qualquer forma, uma das peculiaridades do padrão CXL é conceder essa capacidade ao PCI Express, mas isso tem um problema que abordaremos mais adiante.
Por que isso é uma pista para o futuro?
Até agora vimos a implementação de um sistema de memória totalmente coerente com um chip monolítico onde a CPU e a GPU compartilham o mesmo controlador de memória. Se você olhar bem, o MI300 é composto de vários chips com seu próprio controlador de memória e, no entanto, possui um mecanismo de coerência completo. Não é pelo uso de memória HBM, mas sim pelas mudanças feitas pela AMD no controlador de memória, principalmente da GPU desse mastodonte para servidores.
Claro, a graça está no fato de que o controlador de memória integrado está localizado e não é nenhum dos diferentes chiplets de CPU e GPU, mas sim no interposer, e é que todos eles estão montados em outro chip muito maior. , encarregados de comunicá-los entre si e com a memória do HBM. Agora, se pensarmos bem, como o referido interposer é uma peça à parte, então ele pode ser facilmente transferido para outro tipo de composição. Que tal um futuro console de videogame?
A tendência com custos crescentes é dividir os chips em vários, não é um capricho da AMD e foi demonstrado que certos componentes não escalam tão bem usando transistores menores, separando essas funções em chips separados feitos com nós mais baratos. Além do acima, o MI300 Interposer também inclui o chamado Cache Infinity como LLC, que é a chave para alcançar um sistema totalmente coerente.
Será que veremos no PC?
Uma configuração UMA em um computador não seria impossível, no entanto, isso significaria vender processador, gráficos e RAM compartilhada no mesmo pacote e não parece ser economicamente barato. A memória GDDR6 é usada no console devido à estrutura de custos, mas no PC o uso dessa memória seria mortal, por ter uma latência muito maior do que a RAM convencional. Ou seja, usando o mesmo processador perde-se desempenho. O DDR5? Ainda mais rápido que o DDR4, ele não tem largura de banda suficiente para ser viável para uma GPU integrada de alto calibre.
Então, no final, tudo o que resta é a memória HBM, extremamente cara para colocar em um sistema doméstico. Então, supondo que só temos consoles de jogos e uma futura placa de vídeo Radeon, talvez RDNA 4? Em que a função dos chiplets pequenos no tamanho RX 7000 é transferida para o interposer, dando a possibilidade de quebrar o chip principal. Resumindo, o que a AMD fez foi mover o clássico Northbridge, o que eles chamam de IOD em seu jargão de marketing, para o interposer.