VictorSuarezRovere和JulianKemmerer借助他们的CflexHDL/PipelineC工具

尽管在传统硬件仿真领域,“可编程逻辑门阵列”(FPGA)的名气要更高一些。但近期一些成功的FPGA光追游戏运算演示,再次吸引了许多人的目光,因为这通常是图形处理器(GPU)的优势领域。TechSpot报道称,来自两位开发者的新工作流工具,使得一枚普通的FPGA、能够实现较传统x86处理器更惊人的效率提升,为多个行业的节能运营开辟了新经验。
本次演示选择了一个在棋盘上弹跳的闪亮球形物体,且它用到了实时光线追踪功能——之前没人指望过一款中型FPGA芯片能够轻松应对此类应用。
不过更值得称道的,还是FPGA运行游戏所消耗的能量,远低于功能更强大的AMD笔记本电脑处理器。
在Artix7100T硬件上,VictorSuarezRovere和JulianKemmerer借助他们的CflexHDL/PipelineC工具,用C语言构建了这一演示所需的FPGA固件代码。
作为比较,两位开发者搬来了AMD锐龙R9-4900H平台、并编译了基于CPU软解(不使用集成的核显)的相同演示。
两者均在1080p下以大约60FPS的帧速率运行游戏,但需要截然不同的性能配置文件来完成任务。
据悉,Artix平台采用了28nm节点工艺的FPGA芯片,主频为148MHz、具有约10万个逻辑元件。
相比之下,锐龙R9-4900H是一款8C/16T的7nm处理器。开发人员在4.2GHz的加速频率附近,调用了该芯片的所有核心线程。
Rovere和Kemmerer估计,Artix的晶体管数量,大约只有这枚锐龙移动芯片的1/15。
尽管硬件规模上存在相当大的差距,但FPGA演示仅消耗了660mW的功率。而且就算没用到主动式散热解决方案,该芯片仍“几乎没有发热”。
另一方面,x86架构的锐龙R9-4900H的功耗达到了33W——不仅50倍于FPGA,风扇也在88℃的高温下猛转以实现相同的性能。
Rovere和Kemmerer据此推测,7nmFPGA芯片可进一步将能效差距扩大至6倍、同时功耗低至锐龙R9-4900H的1/300。
当然,我们不该彻底无视APU上的核芯显卡、或在搭配专用独显(GPU加速卡)下可实现的更高效能。
但这么做仍无法消除与Artix平台的差距,更别提采用更先进的FPGA解决方案来发起挑战了。
最后,感兴趣的朋友,可移步至PipelineC-Graphics的GitHub项目主页(白皮书),以获知更多细节。
