インメモリコンピューティング はそのパラダイムのXNUMXつです を配置することから発生します RAM プロセッサに非常に近い 、同じパッケージ内、またはチップ自体内に配置されるまで。 This paradigm is going to be very important in the future since many processors will be accelerated in speed, bringing the memory physically closer to the processor.多くのプロセッサの速度が加速され、メモリが物理的にプロセッサに近づくため、このパラダイムは将来非常に重要になります。
この試験は インメモリコンピューティングではありませんか?
それに関しては普遍的な問題のXNUMXつ CPU パフォーマンスはメモリからの距離です。

時間の経過とともに、キャッシュメモリの使用など、この距離を緩和するメカニズムが使用されてきましたが、この差が大きくなるにつれて、メモリをプロセッサに近づけることによって距離を短くすることが非常に重要になります。これがメモリの概念です。インメモリコンピューティングが登場します。

コンセプトは、CPUがその命令を実行するのにかかるクロックサイクル数である命令のレイテンシがプロセスで短縮されるように、メモリをプロセッサに近づけることです。
3DICプロセッサ(通常は複数のコアやスタックメモリを備えたプロセッサ)の登場により、プロセッサ内で非常に大きなメモリ密度が可能になり、プロセッサ内(またはプロセッサに非常に近い)のメモリをあたかも使用できるようになります。それはRAMメモリまたはRAMの一部でしたが、高速でした。

The other reason for this is the fact that the instructions that are executed in conventional RAM have an energy consumption that is an order of magnitude and sometimes up to two orders of magnitude compared to the data being in the cache.これの他の理由は、従来のRAMで実行される命令のエネルギー消費量が、キャッシュ内のデータと比較してXNUMX桁、場合によっては最大XNUMX桁であるという事実です。 As a processor has a limited energy budget to function it is important that the instructions consume as little as possible in order to gain performance / consumption in their design.プロセッサは機能するためのエネルギーバジェットが限られているため、設計のパフォーマンス/消費量を増やすために、命令の消費量をできるだけ少なくすることが重要です。
In the current paradigm, the clock speed of a processor depends on the energy consumption of the most expensive instructions in that regard.現在のパラダイムでは、プロセッサのクロック速度は、その点で最も高価な命令のエネルギー消費に依存します。 The idea for the future is to take advantage of the memory being close to the processor so that certain instructions are carried out with a lower power consumption than now and allow dynamic clock speeds depending on the type of instruction.将来のアイデアは、プロセッサに近いメモリを利用して、特定の命令が現在よりも低い消費電力で実行され、命令のタイプに応じて動的なクロック速度を可能にすることです。 For example, lighter power instructions may run at higher clock speeds than others due to lower power consumption.たとえば、消費電力が少ないため、より軽い電力命令は他の命令よりも高いクロック速度で実行される場合があります。
言い換えれば、将来のCPUは固定クロック速度ではなく、各命令または任意の時点で実行される一連の命令に従って動的に変動します。
メモリをプロセッサに統合することによる帯域幅の改善。
The memory interface with the RAM at the physical level is serial, this means that if you want a high bandwidth you have to make the controller larger and since the memory controller is located on the periphery of the processor this means increasing the chip size and thus its costs.物理レベルのRAMとのメモリインターフェイスはシリアルです。つまり、高帯域幅が必要な場合は、コントローラを大きくする必要があります。メモリコントローラはプロセッサの周辺に配置されているため、チップサイズが大きくなります。そのコスト。 The other option is to increase the clock speed, but this exponentially increases the overall power consumption between the RAM and the processor that uses it.もうXNUMXつのオプションはクロック速度を上げることですが、これによりRAMとそれを使用するプロセッサ間の全体的な消費電力が指数関数的に増加します。
RAMを同じパッケージまたは同じチップに統合するという考え方は、通常はマトリックスで、より広いメモリインターフェイスを使用できるようにすることです。 For example, a 1024-bit bus would take up a very large space on the perimeter, but we can either connect the memory vertically to the processor or connect both separately to a common substrate.たとえば、XNUMXビットバスは周囲に非常に大きなスペースを占有しますが、メモリをプロセッサに垂直に接続するか、両方を別々に共通の基板に接続することができます。

This allows a 1024-bit interface, for example, to be converted to a 32 × 32 interface, occupying much less area.これにより、たとえばXNUMXビットのインターフェイスをXNUMX×XNUMXのインターフェイスに変換して、占有する領域を大幅に減らすことができます。 The idea of having a large number of pins for intercom means being able to achieve much higher clock speeds without having to pull very high clock speeds.インターコム用に多数のピンを使用するという考えは、非常に高いクロック速度を引き出すことなく、はるかに高いクロック速度を実現できることを意味します。
たとえば、64 GHzで2ビットバスを使用すると、128 GHzで1ビットバスと同じように消費されることはなく、XNUMX倍になるため、数を増やすことが重要であることに注意してください。メモリとの相互接続の。
計算RAMの考え方は、従来のメモリよりもはるかに広い帯域幅を、キャッシュとほぼ同じレベルで使用することです。これにより、帯域幅に依存する命令とレイテンシに依存する命令は、このパラダイムから等しく恩恵を受けます。 。
計算メモリのハンディキャップ:温度
The problem with adding a processor and memory together, to create what we call in-memory computing, is that they both generate a large amount of temperature together, so we run into the problem that despite decreasing the time per instruction in what the number of cycles is concerned.インメモリコンピューティングと呼ばれるものを作成するためにプロセッサとメモリを一緒に追加することの問題は、両方が一緒に大量の温度を生成することです。そのため、命令あたりの時間を短縮したにもかかわらず、サイクルが関係しています。 It can be limited in the clock speed in order to avoid reaching high temperatures in the process that fry the processor.プロセッサを揚げるプロセスで高温に達するのを避けるために、クロック速度を制限することができます。
It is also the reason why it is an extremely expensive solution and we may not see it in the domestic markets.それはまた、それが非常に高価なソリューションであり、国内市場では見られないかもしれない理由でもあります。 The fact that a processor with memory can achieve high clock speeds stably is a rarity and such processors may end up being so expensive that they are commercially unfeasible.メモリを備えたプロセッサが安定して高いクロック速度を達成できるという事実はまれであり、そのようなプロセッサは非常に高価になり、商業的に実行不可能になる可能性があります。
実際、これが高性能プロセッサの範囲で中期的に同じチップ上にメモリをスタックするという話がない理由ですが、プロセッサのメモリと同じではないメモリにプロセッサを追加するという話があります。 この概念は、計算RAMまたはインメモリコンピューティングまたはインメモリプロセッサと呼ばれます。