创新之路:揭秘中国先锋者如何引领国产科技突围
DeepSeek太过火爆,整个国产AI产业都调动起来了!
春节没过完,已快速兼容多种国产芯片,并在各大云平台上架,颇为热闹~
这一系列动向主要聚焦于以下三个方面:
平台层:华为云、阿里云和腾讯云等云服务提供商相继引入了DeepSeek相关的大型模型服务,价格维持不变甚至有所下调,性能与官方版本相当,从而实现零门槛部署API并开发各类应用。
算力层:一些国产算力厂商,如昇腾、壁仞等,已成功与生态系统中的伙伴合作,完成了与多种模型的适配,并相继推出了DeepSeekR1模型服务。这些举措不仅展示了国内企业在人工智能领域的技术实力,还表明了中国在推动自主可控技术发展方面的决心。通过与生态伙伴的合作,这些企业正在加速技术创新和应用落地,为行业的发展注入新的活力。这无疑是一个积极的信号,预示着中国在高性能计算和人工智能领域正逐步迈向更高的台阶。
应用层:华为小艺助手已经接入了DeepSeek模型,用户只需要将手机系统升级到鸿蒙系统即可体验这一新功能。这一举措不仅展示了华为在人工智能领域的持续投入与创新,也体现了国产AI技术正在逐步融入我们的日常生活。随着越来越多的应用厂商和手机助手开始采用国产AI模型,我们可以期待未来智能设备将更加智能化,同时也为国内科技企业提供了新的发展机遇。这无疑是中国科技领域的一大进步,有助于推动整个行业的技术革新和自主可控能力的提升。
实际上,国产大模型与国产芯片算力的生态适配已经取得了显著的成功。这一进展不仅展示了国内技术团队在人工智能领域的创新能力,也标志着我们在构建自主可控的信息技术体系方面迈出了坚实的一步。未来,随着更多应用场景的开发和优化,我们有理由相信,国产大模型与芯片的结合将会在多个领域发挥更大的作用,推动我国数字经济的快速发展。 这样的成就不仅是技术上的突破,更是对国家信息安全的重要保障。通过促进不同技术之间的深度融合,我们可以进一步提升整体的技术实力和市场竞争力。同时,这也为其他相关产业提供了良好的示范效应,鼓励更多的企业和研究机构投入到自主创新的研发中来。
破算力困局:国产AI生态的生死突围
DeepSeek的流行确实让国内的AI产业迅速响应起来,这不仅是因为其在技术上的显著优势,还因为它成功地展示了大模型在实际应用中的巨大潜力。DeepSeek的成功表明,高质量的大规模语言模型能够极大地提升用户体验,并为企业带来新的增长点。因此,无论是大型科技公司还是初创企业,都在积极研发或优化自己的AI产品,试图在这一波浪潮中抢占先机。 这种现象说明,技术创新不仅仅要关注理论上的突破,更需要关注如何将这些技术转化为实际应用,从而创造价值。同时,这也反映出市场对于先进AI技术的巨大需求。未来,随着更多企业和研究机构加入这一领域,我们有望看到更加丰富多样的AI产品和服务,为社会带来更多的便利与创新。
答案并非如此。
还有一个重要方面,是要应对全球算力供应链的不确定性,鉴于国际上的压力,确保大模型自主可控变得愈加迫切。
算力是支撑大模型发展的基石,根据不同的应用场景,可以细分为训练算力、推理算力和应用算力。 在当今这个数字化时代,算力的需求正以前所未有的速度增长。随着技术的进步,训练算力、推理算力以及应用算力在人工智能领域扮演着越来越重要的角色。尤其是在处理复杂的大规模数据集时,强大的训练算力能够显著提高模型的准确性和效率。而推理算力则确保了模型在实际应用中的实时响应能力,这对于自动驾驶、智能客服等应用场景至关重要。最后,应用算力则保证了这些模型能够在各种终端设备上顺畅运行,为用户提供更加便捷的服务体验。由此可见,不同类型的算力各有其独特的价值,共同推动了人工智能技术的发展与普及。
训练算力是指用于训练机器学习模型的计算资源,这个过程涉及到大量数据的输入、复杂的数学运算以及反复的迭代优化。由于其计算密集型特性,训练过程不仅耗时而且对硬件要求极高,同时还需要处理庞大的数据集。尽管如此,随着技术的进步,我们已经看到一些显著的改进。例如,新型GPU和TPU等专用硬件的出现,大大加速了深度学习模型的训练速度。此外,分布式计算框架的发展也在不断推动着这一领域的发展。这不仅提高了研究效率,也为更复杂模型的开发提供了可能。未来,随着算法和硬件的进一步融合,我们可以期待在训练算力方面取得更大的突破。
推理算力是将训练好的模型应用于实际数据以生成预测或结果的计算资源,过程比训练简单,但需求高效且低延迟。
应用算力是指支撑整个AI应用系统运行的计算资源,包括数据处理、模型推理、用户交互、存储和网络通信等方面。这些资源的高效利用不仅影响着AI系统的性能表现,也关系到用户体验的好坏。随着AI技术的快速发展,对高效率、低延迟的应用算力需求也日益增长。这要求我们在设计AI系统时不仅要考虑硬件的投入,还要注重软件算法的优化,以及整体架构的合理布局,以确保在复杂的使用环境中,AI系统能够稳定、高效地运行。 这样的发展态势表明,未来AI系统的竞争力将在很大程度上取决于其背后强大的应用算力支持。同时,这也提醒我们,持续的技术创新与优化将是满足不断增长的算力需求的关键所在。
目前,在中国的大模型产业发展中,高性能计算资源在很大程度上依然依赖于国外的技术,特别是在模型训练阶段。
训练环节之所以特别重要,是因为训练算力是人工智能模型从无到有的关键。大模型的进步依赖于不断优化和迭代模型,这需要持续不断的投入。随着技术的发展,我们看到越来越多的企业和研究机构开始重视这一环节。只有通过大量的数据训练和反复的模型调整,才能推动人工智能技术取得实质性的进展。这也意味着,未来的竞争将更多地集中在计算资源和算法优化上。如何高效利用这些资源,并在激烈的竞争中脱颖而出,将是每一个参与者都需要认真思考的问题。
在训练阶段,强大的算力是优化模型参数、提升模型性能的关键。当前主流的大模型动辄拥有数百亿、上千亿个参数,如此巨量的参数空间意味着海量的计算工作量。
唯有具备超大规模的算力集群,方能完成如此复杂的训练任务。而训练算法的创新,例如更为高效的并行化策略、更加智能的参数搜索方法等,也对算力水平提出了更高的需求。
训练算力作为AI技术创新的战略制高点,其自主可控程度直接决定产业发展主动权,掌控了大模型的训练过程,才算掌握了AI技术创新的核心。
在国产算力平台尚处拓荒期时,多数企业因技术门槛高、投入风险大而却步,科大讯飞作为先行者选择了一条“硬核突围”之路:
自2023年10月启动以来,科大讯飞与华为合作推出的万卡国产算力平台“飞星一号”已稳定运行,全年平均使用率达到94%,能够支持万亿参数的大模型训练。
2024年1月,“飞星一号”的最新成果讯飞星火V3.5成为首款完全采用国产算力进行训练的大规模模型。
一年过去了,讯飞星火仍然是唯一的一家全国产算力大模型。
为什么是唯一一家?
这既是由于全栈自研的技术处于深水区,从芯片指令集优化,到超大规模集群稳定性保障,技术复杂度呈指数级攀升。
长期投入战略定力的考验在于全算力国产化的进程,这需要企业持续多年进行高强度投入。然而,多数企业往往更倾向于选择现成的解决方案,这种路径依赖使得他们在训练算力方面始终难以摆脱对外部技术的依赖。 这一现象反映出企业在面对长期技术和资金投入时的犹豫与保守心态。尽管全算力国产化是提升自主可控能力的重要途径,但短期内很难看到显著成效,这也使得许多企业不愿意在这方面做出过多的投入。长远来看,只有打破这种路径依赖,才能真正实现核心技术的自主可控,推动整个行业的健康发展。
今年1月15日,科大讯飞推出了我国首个基于全国产算力训练的具有深度思考和推理能力的大模型——讯飞星火X1。这一成就与DeepSeek的发展路径不谋而合,两者都在推动中国人工智能技术的自主可控方面迈出了重要一步。讯飞星火X1的发布不仅标志着中国在人工智能领域取得了新的突破,也体现了国产技术的崛起,这对于提高国家在科技领域的竞争力具有重要意义。随着人工智能技术的不断进步,我们有理由相信,未来会有更多类似的创新成果涌现出来,为社会带来更广泛的应用和更深远的影响。
仅用1万张910B国产算力卡,科大讯飞在大模型研发方面取得了一系列显著成果,并且在国产算力平台上进行了大量创新性的适配和效率优化工作。通过这些努力,他们成功地在较少的算力资源和更小的模型尺寸下,在国产算力平台上实现了业界领先的深度学习能力和长文本推理效果。 这样的成就不仅展示了科大讯飞的技术实力,也体现了其对推动国产算力平台发展的积极贡献。这表明,即使在有限的资源条件下,通过技术创新和优化,也可以实现高质量的人工智能应用。这也为未来国产算力平台的发展提供了新的思路和方向。
可以说,真正实现了国产算力的极致效率,这不仅彰显了深厚的技术实力,更体现了非凡的战略勇气。这也标志着国产AI技术在处理复杂认知任务方面取得了重要进展。 这样的成就令人振奋,它不仅证明了国内科技企业在技术创新方面的巨大潜力,还展示了其在面对全球竞争时的决心与能力。未来,我们有理由相信,在不断攻克技术难关的过程中,国产AI将继续引领行业前沿,为国家的科技进步贡献力量。
科大讯飞董事长刘庆峰表示,讯飞团队正紧锣密鼓地进行技术迭代,预计在未来一个月内推出性能更为强大的升级版讯飞星火X1。这款新产品将在数学、教育、医疗以及科研等关键领域继续保持其领先地位。这不仅展示了公司在人工智能领域的持续创新能力,也体现了其在前沿科技应用上的不懈追求。未来,随着更多创新成果的不断涌现,我们有理由相信,讯飞将继续引领行业潮流,为社会带来更多的智能化解决方案。
与此同时,“飞星二号”——由科大讯飞、华为与合肥市大数据资产运营有限公司联手打造的中国国产超大规模智能计算平台,首批算力预计将于2025年交付试用。
这种国产AI生态协同产生了远超预期的“化学反应”:华为昇腾系列芯片在真实场景中得到千锤百炼,不断打磨、迭代出更适配AI应用的特性;讯飞模型通过与硬件深度适配,摆脱了算力瓶颈的桎梏,探索出的创新训练范式。
当下愈来愈多的企业加入战场,国产AI技术体系的独特性开始显现——它既非对国际技术的简单模仿,也非闭门造车的另起炉灶,而是在生态协同中进化演绎的全新物种。
科大讯飞董事长刘庆峰表示:“大家常说前人栽树,后人乘凉。在推进国产化大模型的道路上,总需要有人成为那个栽树的人。”市场热情高涨的背后,先行者们的远见和坚持,在这场AI竞赛中正展现出跨越时间周期的战略价值。
科大讯飞已实现训练算力、推理算力及应用算力的全面国产化。
从2024年1月至今,讯飞星火大模型已经实现了5次升级,持续对标GPT-4 Turbo和GPT-4o,还首发星火多语言大模型,给了世界第二选择。
在产业应用方面,科大讯飞作为少数能够全面覆盖政府(G)、企业(B)和消费者(C)三个方向的市场参与者,通过“GBC联动”的方式积极推动大模型的应用落地。这一策略不仅展示了科大讯飞在技术创新方面的领先地位,还体现了其对市场需求的深刻理解。通过整合不同领域的资源与需求,科大讯飞有效地推动了人工智能技术在各个层面的实际应用,为行业树立了新的标杆。这种全方位的发展模式有助于形成良性循环,进一步促进技术进步和市场拓展。
GBC联动,不仅需要在三大业务领域进行全面布局,更要充分利用其中的资源共享和协同效应。
G端打造示范效应,为B端和C端市场的扩展打下坚实基础;通过与行业领军企业的合作,在B端提升市场影响力,进一步增强C端产品在市场上的认知度和信任度;同时,C端用户的反馈和市场需求也为G端和B端的产品优化提供了重要的数据支持。
在这种策略下,具体取得哪些成果呢?
在模型迭代方面,2024年讯飞星火GB端的通用能力相对提升了25%,长文本处理效果相对提升了50%,行业图文效果相对提升了60%。
截至去年底,科大讯飞已经与中国石油、中国移动、中国海油等央国企及20多个行业的领先企业合作,共同发布了行业大模型,覆盖了300多个应用场景。这一系列的合作不仅彰显了科大讯飞在人工智能领域的技术实力,还体现了其在推动行业智能化转型方面的积极贡献。通过与这些行业龙头企业的深度合作,科大讯飞成功地将先进的AI技术应用到了实际业务中,为各行业带来了实质性的变革和提升。这也预示着未来更多行业将借助AI的力量实现更高效、智能的发展。
此外值得一提的是,科大讯飞在2024年成功斩获“央国企大模型第一”的殊荣,中标金额甚至超过了第二至第六名总和。在中标项目数量和金额方面,科大讯飞均实现了显著的领先优势。 这样的成绩不仅彰显了科大讯飞在人工智能领域的强大实力和技术水平,也反映了市场对其产品和服务的高度认可。这表明科大讯飞在技术创新和市场拓展方面走在了行业前沿,未来有望继续引领行业发展潮流。
△图源:智能超参数
依托于模型与算力的基础,通过行业数据的积累,以应用和服务作为切入点,最终形成“技术优势-商业回报-数据回馈”的良性循环,从而不断巩固自身的“护城河”。唯有如此,在错综复杂的市场竞争中才能找到自己的立足之地。
这场源于算力突破的技术革命,最终会转化为生态价值的全面释放——这或许就是中国AI为世界提供的最佳解答。 这场技术革命从算力突围开始,最终必将推动生态价值的全面释放,这可能是中国AI领域对全球未来发展的最佳贡献。值得注意的是,这样的变革不仅仅是技术层面的进步,更是经济和社会模式的深刻转变。随着人工智能技术的不断成熟与应用,我们有理由相信,它将在促进经济增长、改善社会服务以及解决复杂问题方面发挥越来越重要的作用。同时,这也提醒我们必须重视数据安全、隐私保护以及伦理道德等议题,确保技术进步能够惠及每一个人。
“通用人工智能是一场需要聚精会神的长跑”
若将时间线进一步向前推移,我们可以发现目前国内大模型的发展已经到达了一个关键阶段。
一方面,大型模型正朝着更高的智能水平不断发展,另一方面,关于AI产业生态也在进一步深化和巩固。无论是在基础层、模型层面还是应用层面,都在向着通用人工智能这一终极目标快速迈进。
这一观点在众多国内外专家的意见中也得到了进一步的支持:尽管对于AGI实现的时间线存在各种不同的看法,但确实已经进入了一个关键时期。
奥特曼在其年终总结中提到,在现有的GPU硬件条件下,实现通用人工智能(AGI)是可行的。他指出,OpenAI已经明确了AGI的实现路径,并且已经开始向更高的目标——超级智能迈进。 这种进展不仅令人振奋,也引发了广泛的讨论。一方面,它展示了当前计算能力的巨大潜力以及人工智能技术的快速进步。另一方面,这也意味着我们需要更加谨慎地考虑这些技术可能带来的伦理和社会影响。如何平衡技术创新与风险管理,将是未来需要重点关注的问题。
李飞飞的研究团队近期在人工智能领域取得了重要进展,他们成功构建了一个AI模拟世界,这一成果标志着在实现通用人工智能(AGI)的道路上迈出了关键一步。通过这个系统,AI能够仅仅依靠一张图片来生成一个可交互的三维环境。这不仅展示了AI在理解和处理复杂视觉信息方面的强大能力,也预示着未来AI在空间智能领域的巨大潜力。 这种技术的应用前景十分广阔,从虚拟现实到自动驾驶,再到远程协作,都将因此受益。尤其在空间智能方面,AI能够学习、理解并操作物理空间,这对于提高人类生活的便利性和安全性具有重要意义。当然,如何确保这些技术的安全性和伦理性,将是未来发展过程中需要重点关注的问题。
图灵奖得主LeCun和Hinton同样聚焦于大型模型快速发展背后的安全隐患,共同探索如何以人为本的方式推进人工智能的发展。这一议题同样是实现AGI过程中无法回避的关键问题。
在大家都在讨论如何实现以及还有多远的时候,科大讯飞董事长刘庆峰提出了一种独特的见解:通用大模型的潜力仍在不断被挖掘。然而,无论技术如何进步,核心能力必须掌握在自己手中,自己的大楼绝不能建立在别人的地基上。
如今在风起云涌的通用人工智能浪潮,刘庆峰认为,有没有自主可控的国产底座能力做支撑,这决定了我们在这条路上能走多远,决定了在通用人工智能这一波浪潮中,我们能不能享受这波红利,能不能成为美国之后全球智慧涌现的第二级。
做“飞星一号”的决定,实际上揭示了其背后的深层原因。这个项目不仅体现了我国在航天科技领域的持续探索与突破,更是国家综合实力和科技创新能力的体现。通过这一项目,我们可以看到中国在航天技术上的不断进步以及对未来太空探索的决心和信心。这不仅能够促进相关科学技术的发展,还能够提升国民对国家科技成就的自豪感。 总之,“飞星一号”的实施标志着中国在航天领域又迈出了坚实的一步,它所承载的意义远超项目的本身。
讯飞不仅走得远,还走得深。
科大讯飞在其创立第一天起,就一直坚持走国产化路线,立志“技术报国”,要让“中文语音技术由中国人做到最好,中文语音产业掌握在中国人自己手中”。这是做中国技术的初心,现在看来,其影响无比深刻。
外在鉴于众所周知的原因,科大讯飞成为最早被打压、最早放弃幻想的那一波玩家之一,经过一系列艰难攻关,其核心技术研究和产品开发平台逐步实现全面自主可控,才得以有今天生生不息的繁荣生态。
科大讯飞的战略选择,不仅对其自身发展具有重要意义,也为中国整个人工智能产业提供了宝贵的借鉴。在当前技术快速迭代的背景下,科大讯飞的成功经验表明,持续的技术创新和深度的行业应用是推动人工智能发展的关键因素。这无疑为其他企业指明了方向,鼓励它们加大研发投入,深化应用场景探索,以实现更广泛的商业化落地。通过这样的路径,中国的人工智能产业有望在全球竞争中占据更有利的地位。 发表的看法观点:科大讯飞的经验强调了技术创新与实际应用相结合的重要性。这种策略不仅有助于企业在激烈的市场竞争中脱颖而出,也为整个行业的发展树立了积极的典范。希望更多的中国企业能够从中获得灵感,共同推动中国人工智能产业迈向新的高度。
首先,底座大模型的创新是实现自主创新的关键驱动力。在全球底座模型迭代速度减缓的背景下,以讯飞为代表的参与者仍能不断升级大模型底座。
底座大模型的不断迭代与升级,不仅决定了AI系统的性能上限,还促进了AI技术在各个领域的广泛应用和创新发展。例如,在医疗领域,通过持续优化模型,AI系统能够更精准地辅助医生进行疾病诊断,提高诊疗效率。此外,这种技术进步也为科研人员提供了新的工具,加速了新药研发和临床试验的进程。 这样的持续改进不仅增强了AI系统的实用性,也展示了技术革新对于推动社会进步的巨大潜力。随着技术的不断成熟,我们有理由相信AI将在更多领域发挥其独特的优势,为人类带来更多的便利和福祉。
随着AI技术的不断进步,产业分工的优化趋势日益明显,形成了“基础层专注于算力的提升,应用层则更注重场景的创新”的新布局。 这种新的分工模式不仅有助于加速AI技术的研发进程,还能促进其在各个领域的广泛应用。基础层的持续攻坚能够确保AI拥有强大的计算能力,为复杂算法的运行提供坚实的基础。而应用层则通过深入研究具体的应用场景,使得AI技术能够更好地服务于社会和经济的发展,满足不同行业的需求。这一趋势表明,未来AI的发展将更加注重实际应用效果,从而实现技术与市场的深度融合。
基础层的企业可以专注于提升算力和算法效率,而应用层的企业则可以基于这些基础技术,开发出更多创新的应用场景。
另外,更为重要的是,增强安全边际是企业自主创新的关键保障。在当前变幻莫测的市场环境中,实现自主可控可以为行业构建“技术缓冲区”,使企业在遭遇外部环境变化时能够更加淡定地应对。
例如,在芯片供应紧张期间,拥有自主训练能力的企业能够通过优化算法和模型,降低对硬件的依赖,从而确保业务的稳定运行。这样的技术冗余不仅增强了企业的抗风险能力,还为整个行业提供了更多的安全保障。 这一现象表明,企业在面对供应链危机时,通过提升自身的技术能力和灵活性,可以有效减轻外部环境带来的冲击。这不仅是企业竞争力的重要组成部分,也提示我们在制定相关政策时,应更加重视技术创新和企业自主能力的培养,以构建更为稳健和灵活的产业生态。
最后,国产算力平台的兴起,确实为更多企业提供了前所未有的便利。这些平台不仅降低了技术门槛,还大大提升了企业的运营效率。在当前数字经济快速发展的背景下,国产算力平台的壮大无疑为中国企业在国际竞争中增添了重要砝码。这不仅有助于推动技术创新和产业升级,也为中小企业开辟了新的发展空间。 这种趋势表明,随着国家对科技创新的支持力度不断加大,国内科技企业正迎来前所未有的发展机遇。同时,这也提醒我们,在享受技术带来的红利时,还需持续关注数据安全与隐私保护等关键问题,确保行业健康发展。
企业无需重复造轮子,可以直接在国产平台上进行应用开发。这不仅简化了技术门槛,还加快了AI技术的普及和应用速度。国产平台的使用为企业提供了更加便捷和高效的开发环境,有助于推动技术创新和产业升级。通过利用这些成熟的平台,企业能够更专注于自身业务的核心竞争力,而无需在基础技术设施上耗费过多资源。这样的趋势对于整个行业来说是一个积极的信号,表明中国在科技领域的自主创新能力正在不断增强。
比如,为帮助各行各业更好地落地大模型,科大讯飞以“通专结合、端云联动、软硬一体”的方式助力更多企业完成数智化升级,构建了从“建算力、理数据、训模型”,到“落场景、保安全、精运营”的全套解决方案。目前,讯飞星火已成为央国企大模型的第一选择。
展望未来,AGI的实现仍然充满挑战,但也充满了希望。
在这个过程中,自主创新将成为核心要素。中国企业必须坚守自主可控的技术路径,持续增强自身技术能力,才能在未来竞争中获得优势地位。与此同时,产业分工将更为清晰,应用场景也会更加广泛,这使得企业能够更好地应对各种外部不确定性。
随着技术的持续发展,AGI已不再是遥不可及的梦想,而是我们共同追求的目标。正如科大讯飞董事长刘庆峰所言,这将是一场需要全力以赴的持久战。