3月3日,《中国科学报》从刚刚落幕的国际可重构计算领域顶级会议“FPGA 2025”(以下简作FPGA’25)获悉,今年该会议的最佳论文奖颁发给了无问芯穹和上海交通大学、清华大学共同提出的视频生成大模型推理IP工作——FlightVGM。据了解,这是FPGA会议首次将该奖项授予完全由中国大陆科研团队主导的研究工作,同时也是亚洲国家团队首次获此殊荣。
据介绍,这项工作首次在可重构逻辑集成电路(FPGA)上实现了视频生成模型(VGMs)的高效推理,也是该团队继去年在FPGA上加速大语言模型FlightLLM(FPGA’24)后的最新系列工作。与英伟达3090 GPU相比,FlightVGM 在AMD V80 FPGA上实现了1.30倍的性能提升与4.49倍的能效提升(峰值算力差距超过21倍)。
《中国科学报》了解到,此前清华大学电子系已有相关工作分别于2016年和2017年被FPGA 国际会议收录,其中2017年的论文还在当年被评为唯一最佳论文,只是当时该工作系与海外团队共同完成。此次FPGA’25最佳论文的作者成员全部来自中国,这也是亚洲首次由单一国家团队获得该会议最佳论文奖。
作者团队在论文中提到,在大模型部署成本争议甚嚣尘上的产业背景下,以FPGA、ASIC等灵活可编程硬件和专用任务集成电路来提升硬件运行效率,或将成为大模型落地效率提升与成本降低的关键一环。2024年,无问芯穹曾以大语言模型定制推理IP FlightLLM 被FPGA会议录取,今年再次以VGM模型定制推理IP FlightVGM 拿下最佳论文奖,都是在通过创新硬件架构提升效率。据悉,这一系列研究成果现已被集成到无问芯穹自研大模型推理IP LPU(Large-model Processing Unit)之中,并已与合作伙伴开展合作验证。
论文第一作者刘军是上海交通大学博士生,共同一作曾书霖目前在清华大学从事博士后工作,通讯作者是清华大学电子工程系系主任和无问芯穹发起人汪玉和上海交通大学副教授、无问芯穹联合创始人兼首席科学家戴国浩。
论文链接:https://dl.acm.org/doi/10.1145/3706628.3708864
编辑:李华山