ZeroSearch大模型问世:重新定义搜索成本与性能的新标杆
5月9日消息,阿里巴巴日前在GitHub等平台正式开源了ZeroSearch大模型搜索引擎。该框架是一种无需依赖真实搜索引擎即可有效提升大模型搜索能力的强化学习方法。
ZeroSearch通过充分利用大模型在大规模预训练中积累的知识,将其整合为一个高效的检索模块,可以根据用户的查询需求生成相关且有价值的内容。这一技术突破不仅提升了信息检索的效率,还赋予了系统动态调整生成内容质量的能力,这是传统搜索引擎难以企及的独特优势。 在我看来,ZeroSearch的出现标志着人工智能技术在信息检索领域的又一次飞跃。它不仅能够快速提供精准的信息,还能根据用户的具体需求灵活调整输出质量,这种能力对于满足多样化、个性化的信息需求具有重要意义。未来,随着这项技术的进一步发展,我们有理由相信,它将在提升用户体验的同时,推动整个行业向着更加智能化、高效化的方向迈进。
研究人员在NQ、TriviaQA、PopQA、HotpotQA等多个权威问答数据集上进行了全面评估。实验结果表明,一款70亿参数的监督微调模型借助ZeroSearch技术,在搜索能力方面取得了33.06的成绩;而参数规模扩大至140亿的模型,其搜索能力更是提升至33.97,成功超越了谷歌搜索32.47的表现。
研究人员利用SerpAPI借助谷歌搜索完成了总计约64,000次查询的训练任务,这一过程的花费大约为586.70美元(按当前汇率换算约合4238元人民币)。然而,当采用140亿参数的大模型在四块A100 GPU上进行模拟实验时,总成本仅需70.80美元(约合511元人民币),这意味着成本大幅下降了超过八成七。这种显著的成本优化无疑为人工智能技术的普及与应用提供了新的可能性。从我的角度来看,这不仅体现了技术进步带来的效率提升,也预示着未来AI研究可能更加注重性价比,从而推动更多创新成果走向实际应用。同时,这也提醒我们,在追求技术创新的同时,如何平衡投入产出比将成为一个值得深入探讨的话题。
参考链接:
论文地址:https://arxiv.org/abs/2505.04588
开源地址:https://github.com/Alibaba-nlp/ZeroSearch
抱抱脸:https://huggingface.co/collections/sunhaonlp/zerosearch-681b4ce012b9b6899832f4d0