矢量性能建模–矢量处理器体系结构 - 芒果文档

📌 相关文章

📜 矢量性能建模–矢量处理器体系结构

📅 最后修改于: 2021-08-27 16:59:01 🧑 作者: Mango

矢量性能建模：
有两个参数来描述矢量处理器的性能–

渐近性能或理论峰值性能(r至基数∞)。
一半的演奏长度(n₁/ 2)。

理论峰值性能是处理器可以实现的最大可能计算速率，并以FLOPS(每秒浮点指令)表示。此参数可用于测量单个矢量处理器以及多个矢量处理器的性能。例如，单个Cray Y-MP处理器的渐近性能为167 MFLOPS，而Cray Y-MP 8处理器系统的渐近性能为2.6 GFLOPS。

顾名思义，半个性能长度就是矢量长度，其性能是峰值性能的一半。向量处理器的性能取决于向量启动时间和流水线深度。如果这些启动时间和流水线深度不断增加，则很难达到最佳性能。因此，可以预期至少达到峰值性能或n₁/ 2值的一半。

除了这些参数之外，任何多处理器系统的基本性能指标都与加速因子相同。加速因子以一个处理器的执行时间与“ P”处理器的执行时间之比的形式给出。也可以说是同时执行的“ P”个处理器的速度与单个处理器的速度之比。

该性能参数的特殊之处在于它考虑了执行时间，因此已经考虑了并行系统的所有开销。需要考虑的非常重要的一点是，不要针对并行处理器和单个处理器测试同一程序。这是因为在单个处理器和并行处理器上执行任务的算法会有所不同。

同样，在比较在单处理器和并行处理器中执行问题所需的时间时，在顺序处理器上要考虑的时间必须是所需的最佳算法时间。因此，我们可以说加速比可以表示为：