TFLOPS: Hvorfor de ikke er nyttige når man sammenligner avkastning

Hvis det er noe som alle ser på når man sammenligner ytelse mellom CPUer, GPUer eller konsoller, er det det TFLOPS . Men samtidig vet de aller fleste ikke hva de er, hva de måler og fremfor alt hvorfor de ikke egentlig er viktige i denne sektoren. I dag skal vi legge hvitt på svart på dette og andre temaer ved å enkelt beregne hvordan de måles og hvorfor de er så overvurderte.

Det er den evige kampen mellom de som prøver å gjøre den gjennomsnittlige brukeren oppmerksom på det faktum at TFLOPS som et ytelsestiltak ikke er det viktigste når du evaluerer ytelsen til en komponent eller et system, og blant dem som tar det som Guds ord. . .

TFLOPS: Hvorfor de ikke er nyttige

Hvordan forstå at dette tiltaket egentlig ikke er representativt som sådan? Vel, først bli kjent med henne.

Det riktige ville være å snakke om FLOPS, hvorfor?

GPU-NVIDIA

I utgangspunktet fordi TFLOPS ikke er noe mer enn en større måleenhet enn det avhenger i sin helhet ved hjelp av FLOPS eller Flytende punktoperasjoner per sekund, oversatt som flytende punktoperasjoner per sekund. Som navnet indikerer, er det enheten for ytelsesmåling for PC innen flytende punktoperasjoner, og som en standard er den definert av flere innen PC-verdenen som for eksempel LINPACK, for eksempel.

Med dette forstått oppstår det kontrovers, siden det er flere måter å måle FLOPS og derfor TFLOPS, der sistnevnte ikke er mer enn en større måleenhet for å gjenspeile milliarder av instruksjoner per sekund, særlig ti hevet til 12 FLOPS.

Standardene gjenspeiler to forskjellige målinger: sanntid og vedvarende , der ingen produsenter som hovedregel spesifiserer nøyaktig hvilken som er den de samler inn i dataene sine. Normalt tilbyr de sanntid, siden dette vanligvis sammenfaller med det maksimale topp av hver komponent, og tilbyr en noe partisk måling med den.

Hvorfor er det ikke riktig å sammenligne med TFLOPS?

NVIDIA Quad GPU IA

I utgangspunktet fordi TFLOPS er et tiltak som ikke tar hensyn til noe om arkitekturen, men heller beregningsenhetene og deres hastighet eller frekvens. Derfor legger den til side en hvilken som helst parameter som påvirker ytelsen, for eksempel innganger og utganger, arrangementet av cacher, deres forsinkelser, ALUer, busser og andre.

For å gi et enkelt og tydelig eksempel, får RX 5700 XT 9,754 2070 TFLOPS, mens RTX 7,465 får XNUMX XNUMX TFLOPS, noe som vil reflektere en forskjell på 30.66% mellom de to er imidlertid forestillingen praktisk talt den samme i det virkelige liv.

Hvordan kommer du til disse tallene? Meget lett:

  • TFLOPS-> Shaders x 2 x boost-frekvens
  • RTX 2070-> 2304 x 2 x 1620 -> 7,464,960 FLOPS -> 7,465 TFLOPS
  • RX 5700 XT -> 2560 x 2 x 1905 MHz -> 9,753,600 9,753 XNUMX FLOPS -> XNUMX XNUMX TFLOPS

As AMD gjør sine beregninger i Boost Clock, men det viser seg at frekvensen aldri når slike nivåer og er et sted mellom Game Clock og Base Clock, det er mer realistisk å sammenligne avkastning for å ta sistnevnte i stedet for førstnevnte, for hva RX 5700 XT ville ha omtrent 8,217 TFLOPS .

I tillegg til dette, for å sammenligne, må du vite ytelsen per watt og arkitekturen i det minste, med alle variasjonene som dette innebærer. Dette gjelder både CPUer, GPUer, konsoller eller andre komponenter som er verdt sitt salt, der det i mange tilfeller kraften til prosessor og GPU blir lagt til når det gjelder SoC, noe som ytterligere kompliserer målepinnen. .