Aritmetická intenzita a šířka pásma RAM nebo VRAM

Srpna 1, 2021 Matt Mills technické vybavení 0

Vztah mezi RAM a procesor je zcela symbiotický, zatímco RAM nemá smysl bez procesoru, nemůže bez něj žít bez ohledu na to, kde je. Jsou tedy součástí celku, který se navzájem živí. Existuje tedy vztah pro výkon a toto je aritmetická intenzita. Vysvětlíme, z čeho se skládá.

Procesor bez ohledu na to, zda je a procesor nebo GPU, nedělá nic jiného než zpracovávat data , což vede k potřeba paměti nakrmit. S odstupem času bohužel vzdálenost mezi rychlostí paměti a CPU roste, což vedlo k implementaci technik, jako je mezipaměť. Nesmíme zapomenout ani na latence mezi procesorem a pamětí, ke kterému dochází, když rozhraní mezi RAM a procesorem nemůže dostatečně rychle udělit nebo upravit data.

Nemůžeme však měřit výkon obecným způsobem, protože každý program nebo spíše každý algoritmus v každém programu má jiné výpočetní zatížení. A tady přichází termín aritmetické intenzity. Podívejme se však, co to je a z čeho se skládá, stejně jako další prvky, které mají co do činění s výkonem na počítači.

Co je to aritmetická intenzita?

Aritmetická hustota je měřítkem výkonu a skládá se z měření počtu operací s plovoucí desetinnou čárkou, které procesor provede v konkrétní části kódu. K jeho získání je počet operací s plovoucí desetinnou čárkou dělen počtem bytů, které algoritmus používá ke spuštění.

Jak užitečné to je? Skutečnost, že umožňuje v určitých oblastech výpočetní techniky, kde jsou pro konkrétní úkoly zapotřebí velmi výkonné počítače, mít nejlepší hardwarový systém pro provádění algoritmů za nejlepších podmínek. Tento model se používá hlavně ve vědeckých počítačích. Ačkoli to také slouží k optimalizaci výkonu v uzavřených systémech, jako jsou herní konzole.

V případě využití vysoce paralelní hardwarové architektury je vyžadována vysoká aritmetická intenzita, tj. Nízký poměr mezi šířkou pásma a výpočetní kapacitou od okamžiku, kdy je poměr mezi výpočetní kapacitou uvedených procesorů a dostupnou šířkou pásma paměti je vysoký. Protože je v mnoha aplikacích a zejména v grafice vyžadováno, aby byl výpočet zpracován několikrát, a proto je při srovnání vyžadován velký výpočetní výkon.

Výkon algoritmu a vztah s aritmetickou intenzitou

Při psaní algoritmu programátoři berou v úvahu výkon algoritmů, které ve svých programech píší, což je měřeno notací Big O, která měří průměr operací s ohledem na data. Zápis Big O není měřen pomocí žádného benchmarku, ale programátoři je spíše vypočítávají ručně, aby získali přibližnou představu o pracovní zátěži programů.

Nebo (1): Algoritmus nezávisí na velikosti zpracovávaných dat. Algoritmus s výkonem O (1) je považován za ideální a je nepřekonatelný.
O (n): doba provedení je přímo úměrná velikosti dat, výkon roste lineárně. Může se také stát, že a
O (log n): se vyskytuje v algoritmech, které obvykle rozsekávají a řeší problém po částech, jako jsou algoritmy řazení dat nebo binární vyhledávání.
O (n log n): je to evoluce toho předchozího, jde o další rozdělení rozlišení různých částí.
O (č ² ): existují algoritmy, které provádějí více iterací, protože musí data dotazovat vícekrát. Proto se obvykle jedná o vysoce opakující se algoritmy, a proto mají exponenciální výpočetní zátěž.
O (n!): Algoritmus, který následuje po této složitosti, je z hlediska výkonu naprosto chybný algoritmus a vyžaduje přepsání.

Ne všechny algoritmy mohou dosáhnout úrovně složitosti O (1) a některé z nich fungují na jednom typu hardwaru mnohem lépe než na jiném. Proto byly v posledních letech vyvinuty akcelerátory nebo procesory specifické pro doménu, které zrychlují jeden typ algoritmu nad ostatními. Obecnou myšlenkou je rozdělit algoritmy na části a s každým z nich zacházet s nejvhodnější jednotkou zpracování pro jeho aritmetickou intenzitu.

Poměr mezi komunikací a počítačem

Inverzní případ je poměr mezi komunikací a výpočtem, který se měří inverzně k aritmetické intenzitě, a proto je dosažen dělením počtu bytů výkonem v operacích s plovoucí desetinnou čárkou. Používá se tedy k měření šířky pásma potřebné k provedení této části kódu. Problém při měření pochází ze skutečnosti, že data nejsou vždy na stejném místě, a proto se jako reference používá šířka pásma RAM.

Je třeba vzít v úvahu, že to není zcela spolehlivé opatření, a to nejen kvůli tomu, že systém mezipaměti přibližuje data procesoru, ale také kvůli skutečnosti, že existuje fenomén latence, kdy každý typ paměť Použitá paměť RAM má různé výhody a nevýhody a výsledek se může lišit v závislosti na typu použité paměti.

Při výběru paměti v systému se dnes bere v úvahu nejen šířka pásma, ale také spotřeba energie, protože náklady na energii při přesunu dat přesahují náklady na jejich zpracování. Rozhodujete se tedy pro určité typy konkrétní paměti v určitých aplikacích. Samozřejmě vždy v rámci nákladů spojených s budováním systému a nejsou v superpočítači stejné jako v domácím PC.