英伟达前几天开源代码推理模型 OpenCodeReasoning(OCR)时,一个细节引发全球AI社区关注——其7B/14B/32B全系模型均基于阿里通义千问(Qwen2.5)微调。模型仅通过SFT训练,在 LiveCodeBench 和 CodeContests 测试基准上实现了先进的性能,超越了使用强化学习训练的替代方案。另外在LiveCodeBench评测中,OCR-Qwen-32B 以61.8% pass@1 的成绩超越OpenAI闭源模型O3-Mini:
比较有意思的是,英伟达团队并没有选择自己的基座模型 Nemotron, 而是选择了来自中国的千问系列模型,这并非孤例:
这些案例揭示了一个核心事实:Qwen已成为全球AI创新的“基础设施”。截至2025年5月,Qwen系列模型下载量超3亿次,衍生模型突破10万个,超越Llama成为全球第一开源大模型生态阵营。
五一前夕,Qwen3发布,作为国内首个实现"混合推理"能力的开源模型,Qwen3不仅达到了36万亿token的训练数据量,还支持119种语言和方言。通过混合专家(MoE)架构与混合推理机制的深度整合,在参数效率与任务适应性层面实现双重突破。旗舰模型Qwen3-235B-A22B在数学证明、代码生成等核心基准测试中,展现出与DeepSeek-R1、Grok-3等顶尖模型的竞争优势。
在衡量代码生成能力的LiveCodeBench评测中,Qwen3以70分刷新纪录,超越Grok3等闭源模型。其关键突破在于:
5月最新公布的Artificial Analysis 新一期大模型榜单中,千问3智能水平更是比肩o3、Grok3-mini-Reasoning 等国外顶尖闭源模型,也超过了 DeepSeek-R1、DeepSeek-V3-0324 等开源模型,又一次将全球开源模型冠军的头衔收入囊中。
Qwen3的部署成本仅为DeepSeek-R1的1/3,推理成本更是Claude3.7的1/20。小型 MoE 模型 Qwen3-30B-A3B 的激活参数量仅为 QwQ-32B 的 10%,但性能却更胜一筹。甚至像 Qwen3-4B 这样的小型模型,也能与 Qwen2.5-72B-Instruct 的性能相媲美。而 Qwen3-30B-A3B,总参数量 30B,激活参数仅 3B,消费级别显卡即可部署,整体性能堪比Qwen2.5-32B。另外阿里还开源了小尺寸的 Qwen3-0.6B,可以在手机等端侧部署。Trust Insights 联合创始人兼首席数据科学家评价:
Qwen3的多语言能力进一步大幅跃升,从之前支持的29种提升至支持119种语言和方言:
Qwen3发布后,日本技术团队迅速跟进,通过约70亿/60亿token规模的NSFW日语语料对 Qwen3-8B 和 30B-A3B 进行持续预训练得到的新的适合日文用户的模型并发布:
另外,在4月Qwen3发布前,日本经济新闻旗下的专业媒体“NIKKEI Digital Governance”通过日语对中日美等多国主要 AI 模型的性能测评后发布的综合排名显示:于今年 1 月发布的 “Qwen2.5-Max”,在 113 个参评模型里位列第 6 名。该模型除了在语法等基础语言技能上表现出色外,还在逻辑推理与数学领域斩获了优异成绩。
4.工具调用:原生支持MCP和增强的Agent能力
Qwen3通过原生支持MCP多模态协作协议,构建了面向智能体(Agent)生态的核心能力,其深度集成的工具调用架构支持跨平台设备控制与工业协交互,结合开箱即用的Qwen-Agent框架,开发者可快速构建复杂工作流,如生产线调度、跨端自动化等,标志着大模型从"生成答案"向"完成任务"的范式跃迁。
Qwen3采用Apache 2.0协议,允许免费商用,并通过魔搭社区、HuggingFace等平台提供全尺寸模型(0.6B至235B)与配套工具链。凭借其诸多优势,千问系列模型便于企业零成本集成和二次开发,吸引全球开发者广泛参与。
清华大学孙茂松教授近期在接受采访时表示,千问在开源领域已经超过了 Meta 的 LLaMA,这种获得国际认可的成就实属难得。他进一步指出,目前从学术论文的角度来看,国际上很多研究都是基于千问进行。在同样尺寸的模型比较中,有些效果在LLaMA上可能无法实现,但在阿里千问上却可以做出来,这也充分说明千问的小模型性能更优。这也侧面得到了推上网友的印证:
如今,千问已形成全球 AI 开源生态圈,衍生模型超 10 万,推动了 AI 技术的创新与普及:
斯坦福《2025 AI指数报告》显示,中美模型性能差距已从17.5%缩至0.3%,其中阿里6大模型入选,贡献度全球第三8。Qwen的崛起不仅是技术胜利,更是开源治理与生态构建的范式突破。
当英伟达、苹果等巨头选择Qwen作为AI基座时,其意义远超技术合作——这标志着中国开源模型已从“替代选项”升级为“首选标准”。Qwen的成功密码在于:极致性能、成本优势与生态开放性的三重共振。未来,随着Agent应用爆发与全球开发者持续涌入,Qwen或将重新定义AI创新的游戏规则,成为智能时代不可或缺的“中国引擎”。