阿里巴巴正式推出Qwen3-Max

2025-09-24

阿里巴巴于 2025 年 9 月 5 日正式推出全新旗舰大语言模型Qwen3-Max-Preview，这是通义千问系列中首个参数量超过 1 万亿的模型，标志着中国 AI 技术在超大规模模型领域的重大突破。该模型在推理能力、多语言支持和复杂任务处理等核心维度实现显著提升，同时通过混合专家架构（MoE）和动态推理优化，在保持高性能的前提下大幅降低计算成本。

一、技术突破与核心能力

超大规模参数与训练数据

Qwen3-Max-Preview 采用非推理模型架构，参数量超过 1 万亿，训练数据覆盖 36 万亿 tokens（包括 119 种语言和方言），显著提升了多语言理解和长尾知识覆盖能力。实测显示，其在中文指令遵循、复杂逻辑推理和代码生成等任务上表现尤为突出，例如在数学推理基准测试 AIME25 中取得 80.6 分，编程能力评测 LiveCodeBench V6 中达到 57.5 分，超过 Claude Opus 4 等国际竞品。
混合推理机制与效率优化

模型支持动态思考预算分配，可根据任务复杂度自动切换 “快速响应” 或 “深度推理” 模式。例如，在处理简单查询时，关闭推理模式可将响应速度提升 3 倍，而在处理代码调试或数据分析等复杂任务时，开启推理模式能通过多步逻辑链生成更精准的结果。这种设计使 Qwen3-Max-Preview 在企业级应用中实现 “效率与质量” 的平衡。
超长上下文与工具集成

模型支持256,000 tokens 超长上下文窗口，可处理完整的法律文档、科研论文或多轮对话历史。同时，其原生支持 MCP 协议和函数调用，能无缝集成检索工具、代码解释器和外部 API，例如在金融场景中自动生成 SQL 查询分析市场数据，或在医疗领域调用知识库辅助诊断。

二、应用场景与商业化价值

企业级智能协作

Qwen3-Max-Preview 被定位为 “生产级 AI 引擎”，可直接嵌入企业工作流。例如，在会议纪要生成中，模型能自动识别关键行动项并关联知识库生成执行方案；在代码审查中，其代码分析能力可定位潜在漏洞并提供重构建议，效率较传统工具提升 40%。
多语言全球化服务

支持 100 + 语言的特性使其在跨境电商、国际客服等场景中具有显著优势。某跨境电商企业测试显示，使用 Qwen3-Max-Preview 的多语言客服机器人在阿拉伯语和西班牙语对话中，用户满意度提升 27%，响应延迟降低至 1.2 秒。

阿里巴巴正式推出Qwen3-Max

一、技术突破与核心能力

二、应用场景与商业化价值

最新文章