初创公司宣布开发可将CPU性能提升100倍的PPU

图片
​本文由半导体产业纵横(ID:ICVIEWS)综合
FlowComputing声称其 PPU 开创了“超级 CPU”的全新时代。
图片
现代计算机的瓶颈是什么?芬兰初创公司FlowComputing指出CPU。该公司声称,该公司开发的芯片技术“并行处理单元(PPU)”可以将CPU的处理能力提高多达100倍,并将满足当前人工智能开发所需的许多计算需求。
在计算机科学中,并行处理技术是一种通过同时执行多个任务来提高计算效率和性能的方法。
无需重写现有应用代码即可将 CPU 性能提高高达 100 倍
芬兰国家研究机构VTT的衍生公司 FlowComputing声称其 PPU 开创了“超级 CPU”的全新时代。
图片
实验室性能测试结果。来源:FlowComputing
虽然CPU与几年前相比已经有了很大的进步,但其基本处理方式却没有丝毫改变,一次只能做一件事。我们每秒通过多个核心和路径进行数十亿次的切换,但由于指令执行方式的基本限制,一个任务必须在下一个任务开始之前完成,但是,大量的事实并没有改变。出现浪费并成为瓶颈。
图片
与 Core i7 的相对性能比较。来源:FlowComputing
流计算的 PPU 消除了这一限制,并允许 CPU 从单通道切换到多通道。虽然 CPU 一次仍然只能处理一项任务,但 Flow 的 PPU 能够以纳秒级执行片上流量管理,从而使任务能够比以往更快地移入和移出处理器。
FlowComputing的PPU可以应用于任何CPU架构,并保持完全的向后兼容性。此外,通过重建和重新编译软件以与 PPU-CPU 组合配合使用,预计性能将进一步提高。Flow 已确认,如果您更改代码(无需完全重写)以利用该技术,您可以将性能提高多达 100 倍。该公司正在为想要优化支持 Flow 的芯片软件的开发人员提供重新编译工具。
图片
使用 FlowComputing 的 PPU 与 CPU 协作的图像
并行处理技术的核心思想是将一个任务拆分成多个子任务,并让这些子任务同时执行。通过这种方式,可以充分利用多核处理器或分布式系统的计算资源,提高计算效率。并行处理技术可以分为两种:基于进程的并行处理和基于线程的并行处理。基于进程的并行处理是以操作系统为中介,将多个独立的进程分配到不同的处理器上执行;基于线程的并行处理则是将一个进程拆分成多个线程,并让这些线程在同一个处理器上同时执行。
因此,好处不仅限于 CPU 性能的提高;其他连接单元(NPU、GPU 等)也可以间接受益于 PPU 性能的提高。
尽管这种并行化在研究层面已经成为可能,但它并不实用,因为它需要从头开始重写应用程序代码。如果 FlowComputing 的说法属实,那么他们无需更改任何代码即可实现这一目标。
然而,为了将其付诸实践,FlowComputing的PPU必须在芯片设计阶段集成。Flow 似乎表明该技术适用于基于 FPGA 的测试设置。
Flow 现在已经获得了 400 万欧元(约合 430 万美元)的种子融资,该资金由 Butterfly Ventures 领投,FOV Ventures、Sarsia、Stephen Industries、Superhero Capital 和 Business Finland 参与其中。
该公司还计划与AMD、苹果、Arm、英特尔、NVIDIA、高通等领先CPU公司合作,共同开发下一代先进CPU计算。该公司还寻求与较小的 CPU 初创公司合作,例如由传奇的芯片设计师 Jim Keller 领导的 Tenstorrent。
不过,值得注意的是,在实际应用中,要实现高效并行计算,需要考虑以下几个方面的因素:
任务划分:合理地将任务拆分成多个子任务是实现高效并行计算的关键。需要根据具体的任务特性和计算资源来制定合适的划分策略。
通信和同步:在并行计算中,各个子任务之间需要进行通信和同步以保证计算的正确性。需要选择合适的通信协议和同步机制来降低通信开销和提高计算效率。
负载均衡:在分布式系统中,各个节点的计算能力可能存在差异。为了充分利用系统资源,需要采取有效的负载均衡策略来分配计算任务。
性能优化:针对具体的计算任务和应用场景,需要采取相应的性能优化措施,如算法优化、数据压缩、预取技术等。
并行编程模型和框架:选择合适的并行编程模型和框架可以提高开发效率和应用性能。常见的并行编程模型和框架包括OpenMP、MPI、MapReduce等。
*声明:本文系原作者创作。文章内容系其个人观点,我方转载仅为分享与讨论,不代表我方赞成或认同,如有异议,请联系后台。