阿里千问3向量模型开源,性能跃升40%

   时间:2025-06-07 07:47 来源:天脉网作者:唐云泽

近日,阿里巴巴开源了一项重大技术成果——通义千问3的全新向量模型系列Qwen3-Embedding(简称千问3向量模型)。这一模型以千问3为基石,专注于文本表征、检索和排序等关键任务,经过优化训练,性能相较于前一版本有了显著提升,高达40%。在业界权威的MTEB等榜单上,千问3向量模型甚至超越了谷歌、OpenAI、微软等国际科技巨头的顶尖模型。

Qwen3-Embedding系列模型的推出,标志着AI技术在文本处理领域迈出了重要一步。向量模型扮演着AI“翻译官”的角色,它能够将文本、图片等非结构化的人类认知信息,转化为机器更易解读的向量形式,进而实现高效的信息分类、检索和排序。这一过程对于提升AI的语义理解能力、信息检索效率以及多模态融合能力至关重要。基于千问3的强大基础,通义团队通过一系列创新技术,如对比训练、SFT和模型融合,精心打造了千问3向量模型,包括文本嵌入模型Qwen3-Embedding和文本排序模型Qwen3-Reranker。

千问3向量模型在核心任务上的表现令人瞩目。与上一版本相比,它在文本检索、聚类、分类等方面的性能提升幅度最高可达40%以上。得益于千问3的多语言能力,千问3向量模型系列能够支持超过100种语言,包括多种编程语言,这使其在多语言、跨语言及代码检索方面展现出强大的实力。

为了满足开发者的多样化需求,此次阿里巴巴开源了9款千问3向量模型,涵盖了从0.6B到8B等不同尺寸以及GGUF版本。开发者可以根据自己的实际需求,自由选择模型,灵活组合模块,甚至自定义向量或指令,以实现特定任务、语言和场景的深度优化。例如,在智能搜索和推荐系统中,开发者可以利用Qwen3-Embedding进行文本向量化;在RAG实践中,Qwen3-Reranker能够提升最终结果的相关性和准确性;Qwen3向量模型还可以与视觉理解模型结合,探索前沿的跨模态语义理解领域。

目前,千问3 Embedding和Reranker模型已经在魔搭社区、Hugging Face和GitHub等多个平台上开源,开发者还可以通过阿里云百炼直接使用API服务。这一举措无疑将极大地推动AI技术的发展和应用,为开发者提供更加便捷、高效的工具。

 
反对 0举报 0 收藏 0
 
更多>同类天脉资讯
全站最新
热门内容
媒体信息
新传播周刊
新传播,传播新经济之声!
网站首页  |  关于我们  |  联系方式  |  版权隐私  |  网站留言  |  RSS订阅  |  违规举报