Innosilicon Fantasy I:アーキテクチャと機能

PCのGPUについて話すとき、私たちは通常XNUMXつのアメリカの会社を指名します。 AMD, NVIDIA そして、より少ない程度に、 インテル。 英国の技術を利用したグラフィックカードが中国に登場していると言ったらどうなるでしょうか。 GPU、しかし中国で組み立てられ、製造されていますか? この記事では、InnosiliconFantasyIのアーキテクチャについて説明します。

イノシリコンファンタジーI

イマジネーションのPowerVRアーキテクチャについて話すことは、ギリシャ悲劇について話すこととほとんど同じです。 創業以来、さまざまな世代にわたって、SEGA Dreamcast、ST MicroのKYROグラフィックカード、さらには プレイステーション ヴィータ。 彼らの共通点は? GPUの高品質にもかかわらず、本物の商業的失敗。 しかし、彼らは幸運にも、 Apple クパチーノの人々が自分たちで行って、しばらくの間自分たちのグラフィックスアーキテクチャを「設計」することを決定するまで、デバイス。

イマジネーションテクノロジーズファンタジーIPowerVR

AppleとImaginationの間の不一致の期間は、英国人が彼らのグラフィックスアーキテクチャをサードパーティにライセンス供与しようとすることを再びもたらしました。 現在、スマートデバイスとPCの両方の世界でパノラマを見ると、イマジネーションとそのPowerVRがどのように消えたかがわかります。

その不在 Android 世界は、次のような他の参加者によって利用されています ARM マリまたはクアルコムとそのアドレノでそれ自体。 これにより、彼らは他の市場に移動しました。たとえば、マイニング用のASICで有名な中国のメーカーであるInnosiliconは、少し前にFantasy 1を発表しました。これは、Kyro2000年代初頭以来のPowerVRベースの最初のグラフィックカードです。 、しかし、彼らはPCスペースでNVIDIAやAMDと競争することができますか?

タイルレンダリングとは何ですか?

1990年代後半、グラフィックカードの設計者は、帯域幅の不足という一般的な問題でパフォーマンスを争わなければなりませんでした。 現在のグラフィックプロセッサと比較すると、グラフィックプロセッサは非常に単純でした。 ラスタライズ前の3Dパイプラインの最初の部分は、 CPU。 変更のXNUMX番目の部分は、グラフィックカードによって実行されました。これは、当時のメモリが高騰するコストなしでは提供できなかった大量の帯域幅を必要としました。

タイルRendeirngパイプライン

Imaginationによって提案されたソリューションは、Tilesによるレンダリングでした。これは、アーキテクチャの基盤であり続けているため、今日でも、GPU自体でジオメトリが計算されると、従来のGPUと比較して追加のステージが追加されます。 タイルレンダラーは、ジオメトリの位置をで並べ替えます RAM ラスタライズする直前のシーン内の位置に基づいて、タイルごとに個別の表示リストを作成し、レンダリングプロセス中にXNUMXつずつ解決します。

Advantages

各ブロックまたはタイルのサイズが小さいため、内部メモリを使用するため、VRAMにアクセスしなくても解決できます。 これは、シーンの照明を計算するために複数の画像バッファを使用することが多いレイジーレンダリングにも最適です。 他の利点は、シーン内の要素の位置を知ることがレイトレーシングの空間データ構造を生成するために不可欠であるため、このタイプのアーキテクチャでレイトレーシングを実装するのが簡単になることです。

デメリット

ただし、これにはXNUMXつの欠点があります。 XNUMXつ目は、同じパフォーマンスを実現するには従来のGPUよりも複雑なハードウェアが必要であるため、同じサイズのチップでは常にパフォーマンスが低下することです。XNUMXつ目は、GDDRやHBMは、ゲーミングPCでの利点を排除します。 そのため、このタイプのアーキテクチャは、消費上の理由でメモリ帯域幅が制限されているポケットデバイスで標準になっています。

PowerVR Bシリーズ、FantasyIのグラフィックアーキテクチャ

InnosiliconのFantasyIグラフィックカードのアーキテクチャ、およびちなみにそのデバイス用のAppleのプロセッサの内部にあるものを理解するには、Imaginationの現在のアーキテクチャを確認する必要があります。また、最近Cシリーズが発表されたこともわかっています。 Photonとして知られる現在、最先端のデバイスはImaginationのBシリーズをアーキテクチャとして使用しています。

Innosilicon Fantasy I GPU

Bシリーズのコア

これらの各核の構成は次のとおりです。

Innosilicon Fantasy I PowerVR

  • 128つのUSCブロック、Unified Shader Cluster。それぞれがFP32に最大512のALUを持ち、コアごとに合計1024です。 単一のクロックサイクルで加算および乗算命令を実行する機能を考えると、クロックサイクルごとにXNUMXの操作を実行できます。
  • それぞれが8つのテクセルを生成できる4つのテクスチャユニット、合計32。
  • 16ROPS。
  • テッセレーションユニット1つ。
  • 1ラスターユニット。

各コアは、他のコアとは関係なく、画面上のタイルまたはブロックを独占的に担当します。 したがって、それぞれに独自のラスターユニットとテッセレーションユニットがあります。 小さな内部メモリを搭載して内部のイメージバッファを解決し、システムRAMへの影響を軽減することに加えて。 ただし、このメモリはROPS専用に使用され、GPUの利点にもかかわらず、今日使用されている巨大なテクスチャマップのため、テクスチャデータを取得するにはVRAMにアクセスする必要があります。

ファンタジーI、最初のチップレットGPU

FantasyIで使用されているImaginationBシリーズの大きな目新しさは、チップレット、つまり単一のプロセッサとして連携して動作するさまざまなチップで構成された最初のGPUであるという事実です。 これを行うために、画面リストはGPUを構成する3つのチップレットの最初のものに送信され、他のXNUMXつは従属します。 これは、AMDがRDNA XNUMXの特許で提案したものと非常によく似たソリューションであり、将来、このタイプのすべてのGPUで確実に共通になるでしょう。

ただし、このソリューションは特定の点で異なります。タイルによるレンダリングを使用して事前レンダリングを実行し、ラスタライズする前ではなく、3Dパイプラインの最初から複数の画面リストを作成できるようにします。 コンセプトは、シェーダーやテクスチャを一切使用せずに、グラフィックスではなくコンピューティングパイプラインからシーンをレンダリングすることに他なりません。 これにより、事前レンダリング中に多数のコアを活用できるコマンドのリストだけでなく、コマンドの複数のリストを整理できます。 このプロセスは、最初のGPUのコマンドプロセッサが画面リストを読み取ると自動的に実行されます。

これにより、異なるコアで整理できる同じシーンの複数の画面リストを作成できます。 このようにして、2つのチップレットの構成で、それぞれが画面の半分を担当し、そのうちの4つがXNUMX分のXNUMXに分散されるようになります。

Innosiliconはグラフィックカードに何をもたらしましたか?

ただし、すべての作業がImaginationの人々によって行われたわけではありませんが、Innosiliconが残りのグラフィックカードを設計し、PCB設計を追加し、残りの材料を選択しました。 最も際立っているのは、使用するモデルに応じてGDDR6またはGDDR6Xメモリの使用、DisplayPort1.5およびHDMI2.1のサポートですが、具体的には、XNUMXつのチップレットを内部で通信するように設計されたInnolinkテクノロジーの使用です。 GPUの一部を構成します。

Innolink Chiplets Fantasy I

具体的には、XNUMXつの異なるバリアントがあり、タイプAの呼び出しが到達できます FP5の32TFLOPSの電力 、それは、128GB/秒の帯域幅で6Gbpsの19ビットGDDR304XVRAMとのメモリインターフェースを持っています。 一方、タイプBは8つの完全なGPUを備えているため、合計XNUMXつのチップレットで構成され、数はXNUMX倍になります。

イノシリコンファンタジー私はあなたのPC用ではありません

現実には、InnosiliconのFantasy Iグラフィックカードを購入してゲーミングPCで使用することはできません。また、Imaginationはポケットデバイス用のアーキテクチャを設計しているため、興味もありません。 Windows 一連の欠点が見つかったため、は主要なオペレーティングシステムではなく、DirectXでもありません。 クライアントが使用しない機能をハードウェアに追加することは意味がありません。これらのGPUの最大のクライアントは、ひそかにではありますが、Apple、特にそのMetalAPIです。

TarjetasGráficasInnosilicon

皮肉なことに、PowerVRはMetal、で使用されるAPIに非常に結びついています iOS、macOSおよびその他のAppleのオペレーティングシステム。最終的に、Tim Cookの人々は、プロセッサに統合されたGPUの開発を継続できるように、Imaginationとの契約に署名することになりました。 したがって、現在のApple A15、M1、およびそのProとMaxのバリアントでは、内部にあるのはPowerVRです。 これに対応するのは、クパチーノの人々が、システム内のすべてのハードウェアを作成し、全世界とリソースを競うことができるほど強力であるという一般的な考えを作成したことです。 現実は非常に異なります。

4つのチップレットで構成されるGPUがPCの入力範囲にすでに達したときに6TFLOPSに達するという事実は私たちを驚かせるかもしれませんが、それはモバイルプロセッサ向けに設計された設計であり、クラウドコンピューティングに到達することを目的としていることを覚えておく必要がありますゲーミングPCでは使用しないでください。

データセンターとクラウドコンピューティング向けに設計

サーバーでは複数のプロセッサを使用するのが普通であり、スマートフォンプロセッサをベースにしたサーバーがますます増えていることを忘れないでください。 また、複数のクライアントのクラウドでグラフィックカードを仮想化する傾向を忘れることはできません。その性質上、Fantasy Iは仮想化を必要とせず、それを構成する各チップレットは小さなGPUとして機能します。

Servidores ARM

つまり、モバイルから派生し、データセンターにスケールアップするアーキテクチャがありますが、PCである近隣を経由することはありません。 これは、今日PCゲームに不可欠な一連の機能が不足していることを意味します。 そのため、Fantasy Iの外観は、ゲーム用GPUの外観を彷彿とさせるか、それらの色では真剣に見えないかもしれませんが、それは第XNUMX世代ですが、実際にはクラウドコンピューティング用です。 グラフィックカードがユーザーの手に渡るのではなく、サーバーの手に渡るという未来に直面していますか?

いずれにせよ、米国のライバル超大国としての中国は、技術的な観点から完全に独立している必要があります。これは、米国企業であるNVIDIA、Intel、AMDの従来のソリューション以外に独自のソリューションを作成することを意味します。