IT博客汇 | 英伟达选择阿里千问背后的技术逻辑：中国开源大模型的全球崛起

英伟达选择阿里千问背后的技术逻辑：中国开源大模型的全球崛起

52nlp发表于 2025-05-16 01:27:55

英伟达前几天开源代码推理模型 OpenCodeReasoning（OCR）时，一个细节引发全球AI社区关注——其7B/14B/32B全系模型均基于阿里通义千问（Qwen2.5）微调。模型仅通过SFT训练，在 LiveCodeBench 和 CodeContests 测试基准上实现了先进的性能，超越了使用强化学习训练的替代方案。另外在LiveCodeBench评测中，OCR-Qwen-32B 以61.8% pass@1 的成绩超越OpenAI闭源模型O3-Mini：

比较有意思的是，英伟达团队并没有选择自己的基座模型 Nemotron，而是选择了来自中国的千问系列模型，这并非孤例：

DeepSeek-R1：其推出的6个带有推理能力的蒸馏模型，其中4个源自Qwen，在数学和代码任务中实现对标OpenAI O1-mini；
李飞飞团队：仅用16块H100 GPU和26分钟微调Qwen2.5-32B，便复刻出性能接近DeepSeek-R1的S1-32B模型，成本仅50美元；
苹果MLX框架：负责人Hannun公开称赞Qwen3的推理速度，并透露其已接入苹果AI技术栈。

这些案例揭示了一个核心事实：Qwen已成为全球AI创新的“基础设施”。截至2025年5月，Qwen系列模型下载量超3亿次，衍生模型突破10万个，超越Llama成为全球第一开源大模型生态阵营。

Qwen的成长之路：从代码到多语言的全面突破

五一前夕，Qwen3发布，作为国内首个实现"混合推理"能力的开源模型，Qwen3不仅达到了36万亿token的训练数据量，还支持119种语言和方言。通过混合专家（MoE）架构与混合推理机制的深度整合，在参数效率与任务适应性层面实现双重突破。旗舰模型Qwen3-235B-A22B在数学证明、代码生成等核心基准测试中，展现出与DeepSeek-R1、Grok-3等顶尖模型的竞争优势。

1. 代码能力更强，开源大模型的逆袭

在衡量代码生成能力的LiveCodeBench评测中，Qwen3以70分刷新纪录，超越Grok3等闭源模型。其关键突破在于：

混合推理架构：集成“快思考”（低算力秒回）与“慢思考”（多步深度推导），算力消耗降低30%；
长文本优化：通过渐进式训练与双块注意力机制，支持百万token级代码库分析，准确率超80%。

5月最新公布的Artificial Analysis 新一期大模型榜单中，千问3智能水平更是比肩o3、Grok3-mini-Reasoning 等国外顶尖闭源模型，也超过了 DeepSeek-R1、DeepSeek-V3-0324 等开源模型，又一次将全球开源模型冠军的头衔收入囊中。

2. 成本与性能的极致平衡

Qwen3的部署成本仅为DeepSeek-R1的1/3，推理成本更是Claude3.7的1/20。小型 MoE 模型 Qwen3-30B-A3B 的激活参数量仅为 QwQ-32B 的 10%，但性能却更胜一筹。甚至像 Qwen3-4B 这样的小型模型，也能与 Qwen2.5-72B-Instruct 的性能相媲美。而 Qwen3-30B-A3B，总参数量 30B，激活参数仅 3B，消费级别显卡即可部署，整体性能堪比Qwen2.5-32B。另外阿里还开源了小尺寸的 Qwen3-0.6B，可以在手机等端侧部署。Trust Insights 联合创始人兼首席数据科学家评价：

3. 多语言能力：跨语言生态扩展的基石

Qwen3的多语言能力进一步大幅跃升，从之前支持的29种提升至支持119种语言和方言：

国际通用语言：完整涵盖联合国六大官方语言（汉语、英语、法语、西班牙语、俄语、阿拉伯语）；
国家官方语言：包括德语、意大利语、日语、韩语、泰语、越南语等国家官方语言；
特色方言及小语种：特别纳入中国粤语、非洲斯瓦希里语、中东意第绪语、西亚亚美尼亚语、东南亚爪哇语、美洲海地克里奥尔语等具有文化代表性的地方语言；

Qwen3发布后，日本技术团队迅速跟进，通过约70亿/60亿token规模的NSFW日语语料对 Qwen3-8B 和 30B-A3B 进行持续预训练得到的新的适合日文用户的模型并发布：

另外，在4月Qwen3发布前，日本经济新闻旗下的专业媒体“NIKKEI Digital Governance”通过日语对中日美等多国主要 AI 模型的性能测评后发布的综合排名显示：于今年 1 月发布的 “Qwen2.5-Max”，在 113 个参评模型里位列第 6 名。该模型除了在语法等基础语言技能上表现出色外，还在逻辑推理与数学领域斩获了优异成绩。

4.工具调用：原生支持MCP和增强的Agent能力

Qwen3通过原生支持MCP多模态协作协议，构建了面向智能体（Agent）生态的核心能力，其深度集成的工具调用架构支持跨平台设备控制与工业协交互，结合开箱即用的Qwen-Agent框架，开发者可快速构建复杂工作流，如生产线调度、跨端自动化等，标志着大模型从"生成答案"向"完成任务"的范式跃迁。

开源即生态：从“能用”到“好用”

Qwen3采用Apache 2.0协议，允许免费商用，并通过魔搭社区、HuggingFace等平台提供全尺寸模型（0.6B至235B）与配套工具链。凭借其诸多优势，千问系列模型便于企业零成本集成和二次开发，吸引全球开发者广泛参与。

清华大学孙茂松教授近期在接受采访时表示，千问在开源领域已经超过了 Meta 的 LLaMA，这种获得国际认可的成就实属难得。他进一步指出，目前从学术论文的角度来看，国际上很多研究都是基于千问进行。在同样尺寸的模型比较中，有些效果在LLaMA上可能无法实现，但在阿里千问上却可以做出来，这也充分说明千问的小模型性能更优。这也侧面得到了推上网友的印证：

如今，千问已形成全球 AI 开源生态圈，衍生模型超 10 万，推动了 AI 技术的创新与普及：

结语：从“跟随者”到“定义者”

斯坦福《2025 AI指数报告》显示，中美模型性能差距已从17.5%缩至0.3%，其中阿里6大模型入选，贡献度全球第三8。Qwen的崛起不仅是技术胜利，更是开源治理与生态构建的范式突破。

当英伟达、苹果等巨头选择Qwen作为AI基座时，其意义远超技术合作——这标志着中国开源模型已从“替代选项”升级为“首选标准”。Qwen的成功密码在于：极致性能、成本优势与生态开放性的三重共振。未来，随着Agent应用爆发与全球开发者持续涌入，Qwen或将重新定义AI创新的游戏规则，成为智能时代不可或缺的“中国引擎”。