DeepSeek最强对手来了!阿里巴巴放出重磅炸弹

DeepSeek最强对手来了!阿里巴巴放出重磅炸弹

作者:news 发表时间:2025-08-13
“秋天第一杯奶茶”当天,淘宝闪购和美团茶饮订单增幅至少10个点 春兴精工子公司涉约8亿元仲裁 或进一步加大公司资金压力后续反转来了 九鼎投资,筹划并购!切入人形机器人赛道官方已经证实 7月淘宝闪购补贴共计超100亿,而美团同期花费约为阿里的1/3-1/2后续反转来了 结合自身产业基础、资源禀赋和市场需求 各地因地制宜布局人工智能赛道 德国正调查天然气市场操纵行为最新进展 淘宝闪购猛冲,美团员工:对竞争长期有耐心,但不服实垂了 欧洲股市持稳 焦点转向特朗普与普京的会晤和美国CPI数据实时报道 “严正声明”被董事长夫人“抢镜” 海辰储能赴港上市前“争议”升级后续反转 好时和亿滋国际股价下跌 天气担忧导致可可期货上涨 美国伟大部门长:国民警卫队未来一周将“涌入”华盛顿特区官方已经证实 申万宏源员工的愤怒官方处理结果 印度准备大幅上调电价 因核电站停机维护后续来了 金价创近3个月最大单日跌幅金价大跌近2.5%是真的吗? 中美联合声明:再次暂停实施24%的关税90天学习了 许可证续期失利,“宁王”江西锂矿停产是真的吗? 王炸组合”背后,江南春解密“分众+支付宝这么做真的好么? 百果园去年关店近千家亏损近4亿!百果园董事长教育消费者言论引争议,高端水果出路在哪? 财富长城 | 热点资讯(08.12)官方已经证实 英伟达同意H20芯片在龙国销售额15%上交美国:我国回应反转来了 核心业务动能不足 皇氏集团资产负债率创新高太强大了 新加坡第二季度GDP同比增长4.4%,上调全年增长预期至1.5-2.5%后续反转 昨日,萤石网络董事长公开回应! 未来重点会放在城市更新上 东风集团股份前7个月汽车销量为约97.85万辆 同比下降约8.9%又一个里程碑 未来重点会放在城市更新上反转来了 大唐新能源前7个月累计完成发电量约2135.63万兆瓦时同比增加11.75%实测是真的 晨报|科技巨头AI CAPEX测算/锂价有望大幅上涨太强大了 伯克希尔新买的“神秘股票”,周四揭晓是真的吗? 宇树推进IPO,王兴兴谈行业痛点:硬件现阶段够用,具身智能AI拖后腿 境外央行类机构参与银行间债市投资更便利了反转来了 【华西商社】百胜龙国Q2同店转正,泡泡玛特泰国最大旗舰店落地湄南河畔反转来了 百度新CFO兼任爱奇艺董事长!背后资本型财总再推赴港上市? 刚刚,特朗普宣布:黄金不会被加征关税!金价大跌这么做真的好么? 国产减肥药加速突围:如何与进口药竞争?是否还有BD预期? 金价承压回落,关注今晚美CPI数据指引是真的吗? 突发!上海国盛(集团)有限公司副总裁陈为被查!系上海建科董事 飞渡科技完成数千万元战略融资这么做真的好么? 刚刚,特朗普宣布:黄金不会被加征关税!金价大跌 金科服务发盈喜 预期上半年公司拥有人应占净盈利最多约1亿元同比扭亏为盈 中美斯德哥尔摩经贸会谈联合声明官方已经证实 海隆控股附属拟1亿美元出售船舶官方通报

自DeepSeek火爆全球之后,国产开源大模型的开发热潮一浪高过一浪。如今,DeepSeek诞生以来最强的对手,它来了!

本站

今日凌晨3点30,阿里巴巴放出一枚重磅炸弹——通义千问最新开源模型QwQ-32B正式发布,比DeepSeek更小的尺寸,性能比肩全球最强开源推理模型。据了解,通过大规模强化学习,千问QwQ-32B在数学、代码及通用能力上实现质的飞跃,整体性能比肩DeepSeek-R1。而且在保持强劲性能的同时,千问QwQ-32B还大幅降低了部署使用成本,在消费级显卡上也能实现本地部署。

目前,阿里已采用宽松的Apache2.0协议,将千问QwQ-32B模型向全球开源,所有人都可免费下载及商用。同时,用户也将可通过通义APP免费体验最新的千问QwQ-32B模型。目前,QwQ-32B-Preview已经在(chat.qwen.ai)官网上线。

据通义千问Qwen团队介绍,近期的研究表明,强化学习可以显著提高模型的推理能力。例如,DeepSeek-R1通过整合冷启动数据和多阶段训练,实现了最先进的性能,使其能够进行深度思考和复杂推理。而QwQ-32B就是大规模强化学习(RL)对大语言模型的智能的提升作用的最好研究例证。规模上,QwQ-32B是一款仅有320亿参数的模型,其性能却可与具备6710 亿参数(其中370亿被激活)的DeepSeek-R1媲美。

本站

另外,Qwen团队还在推理模型中集成了与Agent相关的能力,使其能够在使用工具的同时进行批判性思考,并根据环境反馈调整推理过程。测试结果显示,在测试数学能力的AIME24评测集上,以及评估代码能力的 LiveCodeBench中,千问QwQ-32B表现与DeepSeek-R1相当,远胜于o1-mini及相同尺寸的R1 蒸馏模型。

在由Meta首席科学家杨立昆领衔的“最难LLMs评测榜” LiveBench、谷歌等提出的指令遵循能力IFEval评测集、由加州大学伯克利分校等提出的评估准确调用函数或工具方面的BFCL测试中,千问QwQ-32B的得分均超越了DeepSeek-R1。

此外,Qwen团队还通过展示了一段简短的示例代码,说明如何通过API使用 QwQ-32B。Qwen团队表示,我们希望我们的一点努力能够证明强大的基础模型叠加大规模强化学习也许是一条通往通用人工智能的可行之路。

受此消息影响,阿里巴巴港股大涨6.7%,截稿前报138.6港元,总市值2.63万亿港元。

本站

相关文章