首页 > 人工智能 > 人工智能
发布日期:2025-06-06 11:41:56

《阿里开源Qwen3:全新Embedding与Reranker,开启多语言跨语言新时代》

《阿里Qwen3重磅发布:全新Embedding与Reranker引领多语言跨语言革命》

   6月6日最新消息显示,阿里巴巴在今日凌晨正式开源了Qwen3-Embedding系列模型,其中包括Embedding和Reranker两个部分。这些模型专门针对文本表征、检索以及排序任务而设计,且是在Qwen3基础模型的基础上进一步训练而成。

   官方表示,在多项评测任务中,Qwen3-Embedding系列在文本表征与排序任务上表现出色。

   其具备如下特点:

   卓越的泛化能力:Qwen3-Embedding系列在多个下游任务评估中表现优异,处于行业前沿水平。其中,8B参数规模的Embedding模型在MTEB多语言Leaderboard榜单中排名第一(截至2025年6月6日,得分为70.58),其性能优于众多商业API服务。此外,该系列的排序模型在各种文本检索场景中效果突出,大幅提高了搜索结果的相关性。

   灵活的模型架构:Qwen3-Embedding 系列提供从 0.6B 到 8B 参数规模的 3 种模型配置,以满足不同场景下的性能与效率需求。开发者可以灵活组合表征与排序模块,实现功能扩展。

   此外,模型支持以下定制化特性:

   支持用户自定义表征维度:通过灵活调整维度设置,帮助用户更有效地控制应用成本;

   指令适配优化功能现已推出,用户可以自定义指令模板,从而在特定任务、语言或场景下获得更佳的表现效果。

   Qwen3-Embedding系列模型支持超过100种语言,不仅包含主要的自然语言,还覆盖多种编程语言。这一系列模型在多语言、跨语言以及代码检索方面表现出色,可以高效满足多语言环境下的数据处理要求。

   据介绍,嵌入模型以单段文本为输入,通过提取模型最后一层「EOS」标记对应的隐藏状态向量,生成输入文本的语义表示。而重排序模型则针对文本对(如用户查询与候选文档)进行处理,采用单塔架构来评估并输出两者之间的相关性得分。 在我看来,这种技术的应用前景非常广阔。嵌入模型能够精准捕捉文本的核心语义信息,这对于需要深度理解文本内容的场景尤为重要,比如智能搜索或内容推荐系统。而重排序模型则在提升匹配效率方面发挥了关键作用,特别是在面对大量候选文档时,它能快速筛选出最相关的选项,从而优化用户体验。未来,随着算法不断迭代升级,这类技术有望在更多领域发挥作用,为人们的生活带来更多便利。

   附开源地址如下:

   https://modelscope.cn/collections/Qwen3-Embedding-3edc3762d50f48

   https://modelscope.cn/collections/Qwen3-Reranker-6316e71b146c4f

   https://huggingface.co/collections/Qwen/qwen3-embedding-6841b2055b99c44d9a4c371f

   https://huggingface.co/collections/Qwen/qwen3-reranker-6841b22d0192d7ade9cdefea

   https://github.com/QwenLM/Qwen3-Embedding

   https://github.com/QwenLM/Qwen3-Embedding/blob/main/qwen3_embedding_technical_report.pdf

人工智能最新资讯
友情链接 百度权重≥3友情链接交换
数界探索  |  科技快讯中文网  |  经济脉动  |  科技先锋  |  财智慧  |  慧算财经  |  财经探秘  |  财经日报  |  今日财经  |  财经风向标
Copyright © 2025 智慧科技官网 网暻网络
备案号:陇ICP备16003923号-4 版权所有