📜  矢量性能建模–矢量处理器体系结构

📅  最后修改于: 2021-08-27 16:59:01             🧑  作者: Mango

矢量性能建模:
有两个参数来描述矢量处理器的性能–

  • 渐近性能或理论峰值性能(r至基数∞)。
  • 一半的演奏长度(n₁/ 2)。

理论峰值性能是处理器可以实现的最大可能计算速率,并以FLOPS(每秒浮点指令)表示。此参数可用于测量单个矢量处理器以及多个矢量处理器的性能。例如,单个Cray Y-MP处理器的渐近性能为167 MFLOPS,而Cray Y-MP 8处理器系统的渐近性能为2.6 GFLOPS。

顾名思义,半个性能长度就是矢量长度,其性能是峰值性能的一半。向量处理器的性能取决于向量启动时间和流水线深度。如果这些启动时间和流水线深度不断增加,则很难达到最佳性能。因此,可以预期至少达到峰值性能或n₁/ 2值的一半。

除了这些参数之外,任何多处理器系统的基本性能指标都与加速因子相同。加速因子以一个处理器的执行时间与“ P”处理器的执行时间之比的形式给出。也可以说是同时执行的“ P”个处理器的速度与单个处理器的速度之比。

该性能参数的特殊之处在于它考虑了执行时间,因此已经考虑了并行系统的所有开销。需要考虑的非常重要的一点是,不要针对并行处理器和单个处理器测试同一程序。这是因为在单个处理器和并行处理器上执行任务的算法会有所不同。

同样,在比较在单处理器和并行处理器中执行问题所需的时间时,在顺序处理器上要考虑的时间必须是所需的最佳算法时间。因此,我们可以说加速比可以表示为: