打破天花板!Cerebras全球最强芯40亿晶体管震撼登场
5月29日消息,Cerebras Systems借助其发布的全球最大的芯片——Cerebras WSE,在AI推理性能上超过了NVIDIA的集群系统。
Cerebras WSE芯片的面积十分庞大,其边长达到8.5英寸(约合22厘米),并且集成了惊人的40亿个晶体管。这一巨大的晶体管数量使WSE在AI推理任务中创造了世界纪录,其运行速度比相同规模的NVIDIA集群快约2.5倍。
在温哥华的WebSummit大会上,Cerebras首席信息安全官Naor Penso提到:“我们实现了全球最快的推理速度。就在上周,NVIDIA宣称其在Llama4上的处理速度达到了每秒1000个token,而Cerebras今天发布的基准测试结果显示,我们的速度高达每秒2500个token。”
WSE芯片通过高度集成的设计,将所有关键组件整合到一块芯片上,这种创新方式显著提升了整体性能。同时,它还配备了44GB的超高速RAM,为复杂运算提供了强大的支持。在我看来,这种集成化的解决方案不仅体现了现代芯片技术的进步,也展示了未来计算设备的发展方向。在摩尔定律逐渐放缓的背景下,这样的创新显得尤为重要,它让我们看到了突破传统限制的可能性,也为高性能计算领域带来了新的希望。
Penso指出:“AI运算需要庞大的内存支持,而Cerebras不需要像NVIDIA那样依靠外接芯片来实现。”
近期,独立机构ArtificialAnalysis发布了一项测试结果,他们对多家供应商的产品进行了评估,结果显示Cerebras的推理解决方案在Meta旗舰模型上的表现最为出色,成为唯一能够超越Blackwell的产品。 这一结果无疑为人工智能硬件市场注入了一股新的活力。Cerebras能够在众多竞争者中脱颖而出,不仅彰显了其技术实力,也证明了其在优化深度学习推理任务上的领先地位。这不仅仅是技术层面的一次突破,更是对未来AI计算发展方向的一种指引。随着AI应用需求的不断增长,像Cerebras这样能够提供高效能解决方案的企业,将在行业中占据越来越重要的位置。这也提醒其他厂商,持续的技术创新与性能提升将是保持竞争力的关键所在。
Cerebras的首席营销官Julie Shin提到,WSE(Wafer Scale Engine)并非基于传统的x86或ARM架构,而是一种全新设计的GPU加速架构。她进一步强调:“这并不是一种简单的技术演进,而是芯片领域的一次重大突破。” 在我看来,WSE的推出标志着计算行业正在经历一场深刻的变革。传统上,芯片设计大多围绕着特定的指令集架构展开,而WSE则完全跳出了这些框架,选择了一条更具创新性的道路。这种“从零开始”的设计思路不仅展现了技术上的勇气,也反映了当前对高性能计算需求的迫切性。在人工智能、大数据分析等领域的快速发展的背景下,WSE的出现无疑为解决现有计算瓶颈提供了新的可能性。这也提醒我们,未来的技术竞争不仅仅是性能的竞争,更是设计理念与思维模式的竞争。