As chaves que limitarão o desempenho futuro de PCs e consoles

Como você definiria o desempenho de um PC ou console? Cada um terá um ponto de vista diferente sobre o que espera de ambos os dispositivos, mas como sabemos, eles estão se tornando cada vez mais semelhantes tanto em virtudes quanto em defeitos. Hoje trataremos deste último, pois as limitações que veremos nos próximos anos marcarão o futuro de uma indústria que está cada vez mais focada em jogos e deixa a criação de conteúdos e tarefas de IA e DL para o setor profissional. Este será o desempenho, pois a latência afeta os componentes do PC e do console.

Na realidade, não importa para onde olhemos na indústria, as arquitecturas, embora diferentes, estão cada vez mais focadas em sectores mais específicos, sim, mas têm a mesma base, os mesmos problemas, as mesmas vantagens. É por isso que veremos os principais gargalos de hardware e seu desenvolvimento para entender para onde estamos indo.

desempenho futuro de PCs e consoles

Diferentes componentes, diferentes limitações, desempenho e latências

Logicamente, as limitações ou gargalos são diferentes em cada componente, mas têm algo em comum em todos os casos com maior ou menor importância: a latência. Em alguns casos é fundamental, em outros anda na ponta dos pés, mas sem dúvida marcará o desempenho nos próximos anos. Além disso, é indistinto para PC ou console, onde, guardadas suas particularidades, também são afetados.

Para nos dar uma ideia do que importa a latência, temos este gráfico que de alguma forma ficou famoso na época e que ilustra muito bem o que significa em vários componentes, nanossegundos, milissegundos e segundos, em comparação com o tempo como normalmente percebemos como humanos.

Como você pode ver em um Processador 3 GHz um atraso nos ciclos de clock de apenas 0.3 ns implicaria uma percepção de 1 segundo para nós. Acessar o L3, que leva em média cerca de 12 ns dependendo da arquitetura do processador, representa 43 segundos da nossa vida.

Açao Social latência média Tempo de conclusão para uma pessoa
Tempo de um ciclo de clock em 3 GHz 0.3ns 1 segunda
Tempo de acesso ao cache L1 de uma CPU 0.9ns 3 segundos
Tempo de acesso ao cache L2 da CPU 2.8ns 9 segundos
Tempo de acesso L3 12.9ns 43 segundos
Tempo de acesso à RAM Entre 70 a 100 ns Entre 3.5 minutos e 5.5 minutos
Tempo de E/S de um SSD NVMe Entre 7 a 150 picossegundos Entre 2 horas e 2 dias
Tempo de entrada e saída do HDD Entre 1 e 10ms Entre 11 dias e 4 meses
Internet, tempo de acesso de São Francisco a Nova York 40ms 1.2 anos
Tempo de Internet entre São Francisco e Austrália 183ms 6 anos
Reiniciando a virtualização de um sistema operacional 4 segundos 127 anos
Reinicie uma virtualização 40 segundos 1200 anos
Reinicialize um sistema físico 90 segundos 3 milênios

Se extrapolarmos isso para o RAM e ir até 100 ns, seria equivalente a percorrer uma distância até nosso destino de 5.5 minutos. Talvez o mais marcante sejam os tempos de latência da Internet, algo mais comum que qualquer um pode entender, que se tivermos 40 milissegundos entre São Francisco e Nova York equivaleria a perder 1.2 ano da nossa vida e se mudarmos o destino para a Austrália nada menos que 6 anos.

Portanto, a latência é muito importante num PC ou numa consola, onde, como vemos, cada geração luta há mais de 40 anos para a reduzir de forma a aumentar o desempenho por instrução e ciclo. Dito isto, veremos como isso afeta os principais componentes e se há melhorias neste aspecto no curto ou longo prazo.

DRAM Latência Zero

Latência do processador

É de longe o componente que mais sofre. Antigo AMD O arquiteto-chefe Jim Keller definiu isso de maneira brilhante na época:

Os limites de desempenho são a previsibilidade de instruções e dados

Ou seja, se você conseguir prever quais recursos são necessários para cada instrução e dado, então poderá gerenciá-los melhor e, portanto, gerar menos tempo entre eles ou aumentar o desempenho.

Novamente a latência aqui e é que o problema foi visto primeiro pela AMD e agora Intel vai resolver isso em parte no Raptor Lake: aumentar o tamanho dos caches para mitigar os tempos de acesso e a passagem de instruções e dados na hierarquia de cache.

O que se tenta é não acessar a RAM, ou limitar ao máximo os ciclos de acesso. A AMD já fez isso com Ryzen e Zen 2 a Zen 3, a Intel fará isso agora em sua próxima arquitetura.

Micro operações CPU

Memória RAM e GDDR6

É possivelmente o aspecto mais importante nesses dois componentes. A memória RAM está sempre em dúvida devido à latência, mas o que realmente se exige é mais largura de banda, mais frequência, mais velocidade sem comprometer as relações com os timings. O DDR5 desencadeou isso para sempre e embora não o notemos tanto nos PCs como nos servidores, é uma tecnologia necessária para o setor em geral.

Já para o GDDR6, a latência não é tão importante quanto a largura de banda resultante, uma vez que a capacidade computacional das GPUs está aumentando e elas precisam fornecer dados de suas memórias associadas. Portanto, a latência é secundária, embora esteja longe de ser desprezível.

Também não há melhorias à vista em comparação com o GDDR6X como tal, onde a velocidade e a frequência estão sendo aumentadas enquanto mantêm a latência nos mesmos ciclos de clock.

SSD, desempenho e sua latência no PC

Eles são os menos dependentes desse fator, mas a latência é necessária para operações aleatórias de alta largura de banda. Os controladores precisam trocar cada vez mais dados com as células e, portanto, o desempenho não pode ser perdido com os ciclos de clock impactando a largura de banda bruta com base em IOPS.

Em resumo, são os núcleos dos processadores os mais afetados pelo seu cache, algo que acontecerá em não muito tempo com as GPUs, já que elas também estão aumentando seu tamanho e exportando-os para fora dos grupos Shaders como a AMD fez com o Infinity Fabric e Cache Infinity, onde justamente pretendem não depender de uma velocidade maior de GDDR nas GPUs e ao mesmo tempo não ocupar espaço nas unidades CU.

Existe uma animação muito curiosa que apenas clicando nos diferentes elementos que estão representados se compreende perfeitamente a importância da latência do sistema nos seus diferentes componentes. Você só precisa acessar um site e comece a clicar para ver a animação de como os elementos funcionam,

É especialmente interessante quando continuamos clicando na memória do sistema, depois vamos para L2 e depois para L1 para ver a organização e o fluxo de desempenho e latência entre eles, muito curioso e instrutivo. Portanto, a passagem da AMD com Zen 2 e Zen 3 tem sido crucial para poder enfrentar a Intel ao custo de um espaço muito grande no DIE, algo que a Intel agora tem que replicar e que não deveria fazer antes devido ao seu processo litográfico. .

Latência-rendimento-pc

Temperatura, mais grave que latência e desempenho no PC?

Logicamente, um fator determinante no desempenho de qualquer chip é a temperatura. O problema é que isso é inerente à tecnologia, já que qualquer chip que tenha tensão terá uma temperatura maior ou menor pelo simples funcionamento. Quanto maior a complexidade do chip, maior o número de núcleos e unidades que ele possui, mais frequência e logicamente mais voltagem ele precisa, portanto, ele aquecerá mais.

Como era de se esperar, isso é um tanto ambíguo, pois será sempre um fator limitante, mas ao mesmo tempo o calor não é um fator tecnológico e simplesmente temos que conviver com ele como temos feito desde a criação do primeiro chip.

Resumindo, a latência no PC e o desempenho dos diferentes componentes é o factor chave que o limita e irá limitar este (desempenho) mais do que qualquer outro, pois de nada vale ter uma velocidade geral superior se o tempo de acesso e o a transferência de informações entre componentes está cada vez mais atrasada.