IT博客汇
  • 首页
  • 精华
  • 技术
  • 设计
  • 资讯
  • 扯淡
  • 权利声明
  • 登录 注册

    英伟达选择阿里千问背后的技术逻辑:中国开源大模型的全球崛起

    52nlp发表于 2025-05-16 01:27:55
    love 0

    英伟达前几天开源代码推理模型 OpenCodeReasoning(OCR)时,一个细节引发全球AI社区关注——其7B/14B/32B全系模型均基于阿里通义千问(Qwen2.5)微调。模型仅通过SFT训练,在 LiveCodeBench 和 CodeContests 测试基准上实现了先进的性能,超越了使用强化学习训练的替代方案。另外在LiveCodeBench评测中,OCR-Qwen-32B 以61.8% pass@1 的成绩超越OpenAI闭源模型O3-Mini:

    比较有意思的是,英伟达团队并没有选择自己的基座模型 Nemotron, 而是选择了来自中国的千问系列模型,这并非孤例:

    • DeepSeek-R1:其推出的6个带有推理能力的蒸馏模型,其中4个源自Qwen,在数学和代码任务中实现对标OpenAI O1-mini;
    • 李飞飞团队:仅用16块H100 GPU和26分钟微调Qwen2.5-32B,便复刻出性能接近DeepSeek-R1的S1-32B模型,成本仅50美元;
    • 苹果MLX框架:负责人Hannun公开称赞Qwen3的推理速度,并透露其已接入苹果AI技术栈。

    这些案例揭示了一个核心事实:Qwen已成为全球AI创新的“基础设施”。截至2025年5月,Qwen系列模型下载量超3亿次,衍生模型突破10万个,超越Llama成为全球第一开源大模型生态阵营。


    Qwen的成长之路:从代码到多语言的全面突破

    五一前夕,Qwen3发布,作为国内首个实现"混合推理"能力的开源模型,Qwen3不仅达到了36万亿token的训练数据量,还支持119种语言和方言。通过混合专家(MoE)架构与混合推理机制的深度整合,在参数效率与任务适应性层面实现双重突破。旗舰模型Qwen3-235B-A22B在数学证明、代码生成等核心基准测试中,展现出与DeepSeek-R1、Grok-3等顶尖模型的竞争优势。

    1. 代码能力更强,开源大模型的逆袭

    在衡量代码生成能力的LiveCodeBench评测中,Qwen3以70分刷新纪录,超越Grok3等闭源模型。其关键突破在于:

    • 混合推理架构:集成“快思考”(低算力秒回)与“慢思考”(多步深度推导),算力消耗降低30%;
    • 长文本优化:通过渐进式训练与双块注意力机制,支持百万token级代码库分析,准确率超80%。

    5月最新公布的Artificial Analysis 新一期大模型榜单中,千问3智能水平更是比肩o3、Grok3-mini-Reasoning 等国外顶尖闭源模型,也超过了 DeepSeek-R1、DeepSeek-V3-0324 等开源模型,又一次将全球开源模型冠军的头衔收入囊中。

    2. 成本与性能的极致平衡

    Qwen3的部署成本仅为DeepSeek-R1的1/3,推理成本更是Claude3.7的1/20。小型 MoE 模型 Qwen3-30B-A3B 的激活参数量仅为 QwQ-32B 的 10%,但性能却更胜一筹。甚至像 Qwen3-4B 这样的小型模型,也能与 Qwen2.5-72B-Instruct 的性能相媲美。而 Qwen3-30B-A3B,总参数量 30B,激活参数仅 3B,消费级别显卡即可部署,整体性能堪比Qwen2.5-32B。另外阿里还开源了小尺寸的 Qwen3-0.6B,可以在手机等端侧部署。Trust Insights 联合创始人兼首席数据科学家评价:

    3. 多语言能力:跨语言生态扩展的基石

    Qwen3的多语言能力进一步大幅跃升,从之前支持的29种提升至支持119种语言和方言:

    • 国际通用语言:完整涵盖联合国六大官方语言(汉语、英语、法语、西班牙语、俄语、阿拉伯语);
    • 国家官方语言:包括德语、意大利语、日语、韩语、泰语、越南语等国家官方语言;
    • 特色方言及小语种:特别纳入中国粤语、非洲斯瓦希里语、中东意第绪语、西亚亚美尼亚语、东南亚爪哇语、美洲海地克里奥尔语等具有文化代表性的地方语言;

    Qwen3发布后,日本技术团队迅速跟进,通过约70亿/60亿token规模的NSFW日语语料对 Qwen3-8B 和 30B-A3B 进行持续预训练得到的新的适合日文用户的模型并发布:

    另外,在4月Qwen3发布前,日本经济新闻旗下的专业媒体“NIKKEI Digital Governance”通过日语对中日美等多国主要 AI 模型的性能测评后发布的综合排名显示:于今年 1 月发布的 “Qwen2.5-Max”,在 113 个参评模型里位列第 6 名。该模型除了在语法等基础语言技能上表现出色外,还在逻辑推理与数学领域斩获了优异成绩。

    4.工具调用:原生支持MCP和增强的Agent能力

    Qwen3通过原生支持MCP多模态协作协议,构建了面向智能体(Agent)生态的核心能力,其深度集成的工具调用架构支持跨平台设备控制与工业协交互,结合开箱即用的Qwen-Agent框架,开发者可快速构建复杂工作流,如生产线调度、跨端自动化等,标志着大模型从"生成答案"向"完成任务"的范式跃迁。


    开源即生态:从“能用”到“好用”

    Qwen3采用Apache 2.0协议,允许免费商用,并通过魔搭社区、HuggingFace等平台提供全尺寸模型(0.6B至235B)与配套工具链。凭借其诸多优势,千问系列模型便于企业零成本集成和二次开发,吸引全球开发者广泛参与。

    清华大学孙茂松教授近期在接受采访时表示,千问在开源领域已经超过了 Meta 的 LLaMA,这种获得国际认可的成就实属难得。他进一步指出,目前从学术论文的角度来看,国际上很多研究都是基于千问进行。在同样尺寸的模型比较中,有些效果在LLaMA上可能无法实现,但在阿里千问上却可以做出来,这也充分说明千问的小模型性能更优。这也侧面得到了推上网友的印证:

    如今,千问已形成全球 AI 开源生态圈,衍生模型超 10 万,推动了 AI 技术的创新与普及:


    结语:从“跟随者”到“定义者”

    斯坦福《2025 AI指数报告》显示,中美模型性能差距已从17.5%缩至0.3%,其中阿里6大模型入选,贡献度全球第三8。Qwen的崛起不仅是技术胜利,更是开源治理与生态构建的范式突破。

    当英伟达、苹果等巨头选择Qwen作为AI基座时,其意义远超技术合作——这标志着中国开源模型已从“替代选项”升级为“首选标准”。Qwen的成功密码在于:极致性能、成本优势与生态开放性的三重共振。未来,随着Agent应用爆发与全球开发者持续涌入,Qwen或将重新定义AI创新的游戏规则,成为智能时代不可或缺的“中国引擎”。



沪ICP备19023445号-2号
友情链接