AI大模型训练新技术揭秘:超算技术让英伟达费用降至1/6
智慧科技
据悉,中国工程院院士、清华大学计算机系教授郑纬民表示,在训练人工智能大模型时,采购超级计算服务或存储器成为一种新的解决策略。他提到,把大模型训练放在超算上进行,其成本仅为使用英伟达设备的六分之一。此外,他还分享了利用存储来提升计算效率的新思路,即通过存储和复用用户对话中的公共内容,减少了每次生成过程中的资源消耗。郑纬民还介绍了清华大学与月之暗面合作研发的Mooncake技术框架,该框架能够有效降低AI推理过程中的资源消耗。郑纬民建议,鉴于国内超级计算机的性价比高且性能稳定,企业可以考虑采用超算来进行AI大模型的训练。 这种通过利用超算进行大模型训练的方式,不仅有助于降低企业的成本压力,还能提高训练效率。这为我国企业在人工智能领域的发展提供了新的思路和技术支持,同时也展示了在基础设施建设方面的优势。随着技术的进步,未来可能会有更多创新的方法出现,帮助企业更高效地利用资源,推动人工智能技术的快速发展。