DeepSeek最强对手来了！阿里巴巴放出重磅炸弹

裕元集团绩后涨逾8% 中期股东应占溢利1.71亿美元最新进展 丘钛科技早盘一度涨超5% 上半年纯利同比增超167%最新进展 马斯克指责苹果在iPhone应用商店偏袒OpenAI官方通报来了 工信部发布多晶硅行业节能监察任务清单 神马股份拟购尼龙化工10.27%股权专家已经证实 闻泰科技出售ODM业务进入最后冲刺阶段，已有6项资产完成交割 A股寒武纪盘中涨超5%，现报743元实垂了 AI服务器概念股早盘走高鸿腾精密涨近9%比亚迪电子涨近6%后续会怎么发展 神农集团按下扩张暂停键反内卷是否意味着行业拐点？记者时时跟进 青达环保定增上会获通过将于上交所上市 美国劳工统计局局长人选出炉特朗普：他将确保经济数据真实准确！科技水平又一个里程碑 马斯克指责苹果在iPhone应用商店偏袒OpenAI实垂了 美国劳工统计局局长人选出炉特朗普：他将确保经济数据真实准确！实测是真的 美国劳工统计局局长人选出炉特朗普：他将确保经济数据真实准确！后续会怎么发展 百果园管不住一把手的“大嘴巴”记者时时跟进 晶泰控股盘中涨超8% 预计上半年营收同增至少约387%最新进展 闻泰科技出售ODM业务进入最后冲刺阶段，已有6项资产完成交割是真的吗？ 华为乾崑智驾搭载量达100万辆记者时时跟进 中金：维持丘钛科技跑赢行业评级升目标价至14.97港元反转来了 泽连斯基拒绝向俄罗斯作出领土让步，特朗普：我非常反对他的观点 龙国首都金融街纪事是真的吗？ 特朗普：与普京的会谈将是试探性的 独家｜广汽华为合作车招商将用代理制模式，华望汽车招商将采用代理制模式 知名风险投资家力挺英特尔CEO陈立武谴责特朗普“拙劣霸凌”学习了 华南城将被清盘，市值仅剩12亿港元 龙国首都楼市新政短期激活市场可期部分银行跟进满足多元住房需求反转来了 “严正声明”被董事长夫人“抢镜” 海辰储能赴港上市前“争议”升级官方通报 消息称鸿蒙智行“第五界”尚界用户中心开始招聘，9 月开业实垂了 消息称鸿蒙智行“第五界”尚界用户中心开始招聘，9 月开业 独家｜广汽华为合作车招商将用代理制模式，华望汽车招商将采用代理制模式官方已经证实 周大福控股的ST景谷连发公告：控股子公司再遭财产保全，系年内第六起，全由民间借贷引发最新进展 华尔街老兵：通胀风险或掐灭9月降息希望又一个里程碑 热潮难抵！上海沿浦进军工业机器人领域，拟出资1530万元切入这一“高增长赛道”最新进展 印度准备大幅上调电价因核电站停机维护 印度准备大幅上调电价因核电站停机维护最新报道 突发！特朗普宣布：进入紧急状态！美股突变，黄金暴跌！ 奥比中光，扭亏为盈 宁德时代停产，碳酸锂再涨停，产业政策转向了？记者时时跟进 好时和亿滋国际股价下跌天气担忧导致可可期货上涨 美国伟大部门长：国民警卫队未来一周将“涌入”华盛顿特区官方通报来了 7月铁路货运有所改善，但多项指标为前景蒙上阴影最新进展 【国金化工&新材料】AI系列深度（二）——AI for Science应用端落地快速开启（2025-08-10）这么做真的好么？ 龙国首都楼市新政短期激活市场可期部分银行跟进满足多元住房需求 冯星航辞去华南城非执行董事职务 特朗普：与普京的会谈将是试探性的最新进展

自DeepSeek火爆全球之后，国产开源大模型的开发热潮一浪高过一浪。如今，DeepSeek诞生以来最强的对手，它来了！

今日凌晨3点30，阿里巴巴放出一枚重磅炸弹——通义千问最新开源模型QwQ-32B正式发布，比DeepSeek更小的尺寸，性能比肩全球最强开源推理模型。据了解，通过大规模强化学习，千问QwQ-32B在数学、代码及通用能力上实现质的飞跃，整体性能比肩DeepSeek-R1。而且在保持强劲性能的同时，千问QwQ-32B还大幅降低了部署使用成本，在消费级显卡上也能实现本地部署。

目前，阿里已采用宽松的Apache2.0协议，将千问QwQ-32B模型向全球开源，所有人都可免费下载及商用。同时，用户也将可通过通义APP免费体验最新的千问QwQ-32B模型。目前，QwQ-32B-Preview已经在（chat.qwen.ai）官网上线。

据通义千问Qwen团队介绍，近期的研究表明，强化学习可以显著提高模型的推理能力。例如，DeepSeek-R1通过整合冷启动数据和多阶段训练，实现了最先进的性能，使其能够进行深度思考和复杂推理。而QwQ-32B就是大规模强化学习（RL）对大语言模型的智能的提升作用的最好研究例证。规模上，QwQ-32B是一款仅有320亿参数的模型，其性能却可与具备6710 亿参数（其中370亿被激活）的DeepSeek-R1媲美。

另外，Qwen团队还在推理模型中集成了与Agent相关的能力，使其能够在使用工具的同时进行批判性思考，并根据环境反馈调整推理过程。测试结果显示，在测试数学能力的AIME24评测集上，以及评估代码能力的 LiveCodeBench中，千问QwQ-32B表现与DeepSeek-R1相当，远胜于o1-mini及相同尺寸的R1 蒸馏模型。

在由Meta首席科学家杨立昆领衔的“最难LLMs评测榜” LiveBench、谷歌等提出的指令遵循能力IFEval评测集、由加州大学伯克利分校等提出的评估准确调用函数或工具方面的BFCL测试中，千问QwQ-32B的得分均超越了DeepSeek-R1。

此外，Qwen团队还通过展示了一段简短的示例代码，说明如何通过API使用 QwQ-32B。Qwen团队表示，我们希望我们的一点努力能够证明强大的基础模型叠加大规模强化学习也许是一条通往通用人工智能的可行之路。

受此消息影响，阿里巴巴港股大涨6.7%，截稿前报138.6港元，总市值2.63万亿港元。