获悉,近日清华系并行程序工厂提供商「清醒异构」完成了由卓源资本、奇绩创坛、水木清华校友基金联合投资的天使+轮,本轮融资将主要用于新一代异构并行程序工厂产品Fiuggi.io与其搭载的自动并行编译系统FCC的迭代,以及公司人才梯度建设,同时针对工业控制、智能驾驶、消费电子和商业航天等领域的行业开发者进行针对性推广。
清醒异构成立于2021年1月,其核心研发团队首次实现了将自动并行技术封装在通用编译框架LLVM的中间层表示中,使得自动并行编译器的商业化落地成为可能。
目前以通用并行算力为代表的异构计算是大势所趋,其中代表公司英伟达的市值已将近是英特尔的3倍,“未来100%的程序都将是可并行的。”他说。
但与简单易行的串行开发相比,并行开发从算法设计到程序跑通需要考虑并行度设计、异构设计、性能调优、瓶颈加速、负载均衡、分支预测等大量繁杂的条件,同时并行计算工程师的人力成本高昂,技术和成本的高门槛导致并行程序的开发及生产工具整体发展较缓,难以满足市场需求。
除此之外,现阶段主流的开源编译器GCC和LLVM,只是将开发者书写的源代码翻译成机器可执行程序的最原始的工具,完全无法实现自动并行的功能,因此许多开发者不得不学习并使用OpenMP/OpenCL/CUDA等复杂的异构并行编程框架去开发相应的异构程序,开发效率低下。
因此,清醒异构提出了能够实现自动并行的工具——Fiuggi.io并行程序工厂,搭载自研的FCC系列自动并行编译器,可将开发者原本用串行逻辑书写的C/C++源代码,在经过自动并行编译后能有效利用计算设备中的多核算力并行执行。
今年3月,清醒异构已发布原型产品Fiuggi Compiler Collection 0.6 (FCC 0.6)。从目前发布结果来看,在x86与ARM架构下使用国际公认的多线程评测程序集PARSEC3.0中的Blackscholes性能对比,FCC自动并行性能已经在这一场景下完全达到手工并行编程的水平。
同时在AWS EC2的ARM服务器上,FCC0.6实测11种Polybench评测程序和100道LeetCode例题都实现了自动并行效果,性能超过其他开源及芯片厂商自研编译器的最多26倍。例如,针对目前工业控制领域普遍使用的Ransac平面提取算法,客户在没有修改源代码的前提下使用Fiuggi.io程序工厂,可将原本在单核CPU上需要运行20多秒的过程,在多核CPU上运行速度自动提升到0.7秒内。
余腾谈道,清醒异构FCC在国际上首次弥补了ARM架构下高性能编译器的空白,有望在不久的将来取代OpenMP/Pthread等并行计算框架,大大降低并行程序开发成本和高性能服务器使用难度。
提及竞争优势,余腾认为公司产品的独特性在于,目前市面上还没有玩家能实现将自动并行及优化封装在一个标准化产品中,同时这一产品广泛面向消费电子、航天等尚未被并行计算/异构计算赋能的柔性智能制造领域,这将是一个庞大的市场空间。
与此同时,清醒异构研发团队来自清华大学、帝国理工学院和利兹大学等高校,创始人兼CEO余腾曾在2019年入选国家博士后引进计划和清华大学“水木学者”计划,曾参与领导阿里、商汤、华为等多个校企合作项目;首席科学家王峥教授为全球异构编译方向杰出学者,入选ACM CGO名人堂,现任英国利兹大学智能软件技术讲席教授,英国阿兰图灵研究所会士,还曾负责ARM阿里、华为多个校企合作项目,发表领域内高水平论文100余篇。
落地方面,目前公司正与潜在客户沟通并达成采购意向,即将正式推出的Fiuggi.io并行程序工厂搭载FCC1.0原型产品,已经在以机械臂为代表的工业控制领域的多核CPU场景下得到客户验证,还获得了以边缘计算和蓝牙耳机为代表的商业航天和消费电子领域客户的积极反馈。
公司计划在今年内在工业控制、辅助驾驶、商业航天、消费电子四大领域拿到订单,并基于第一阶段的用户反馈快速推进标准化产品的迭代开发,将在定向行业中进行推广。同时在今年年底,公司预计可通过云上部署实现并行程序的一键替换,达到一天内高效部署的效果。
明年,清醒异构将推出面向GPU异构场景的FCC2.0版本,通过独有的自动并行技术,可更好地实现基于串行源代码的异构并行程序生成,利用GPGPU释放更多算力,同时加速赋能AI框架等更广泛的主流场景。