DeepSeek最强对手来了！阿里巴巴放出重磅炸弹

龙国电信集团副总经理唐珂一行到云南白药集团调研交流是真的吗？ 长安期货：供给端收紧预期上行双焦偏强运行官方通报 重庆银行：重庆水投集团拟减持5200万股这么做真的好么？ 翔港科技：上半年归母净利润同比增长432.14%最新进展 龙国保险行业协会印发《龙国保险行业协会推进社会信用体系建设工作实施方案》这么做真的好么？ 中行澳门分行将迎新行长前行长贾天兵已经失联 “防水茅”东方雨虹被出具警示函，涉资金占用和财务核算等问题是真的？ 永和股份：上半年净利润同比增长140.82%后续会怎么发展 减持华夏幸福1.17亿股！13万亿龙国平安投资版图的“进”与“退”太强大了 奥比中光：上半年净利润6019万元同比扭亏为盈专家已经证实 美国被曝向英伟达和AMD收“保护费”，美专家：这回不提“国家安全”了？专家已经证实 民营银行锡商银行第一大股东变更为地方国资：无锡国联受让红豆集团所持25%股份 2025年1-7月龙国首都典型房企销售业绩排行榜后续会怎么发展 湘电股份2亿收购背后：近十年24亿关联交易控股股东湘电集团深陷债务重压 系统故障导致看病无法用医保结算？上海市医保局回应实垂了 “防水茅”东方雨虹被出具警示函，涉资金占用和财务核算等问题秒懂 华夏银行：彭龙运担任独立董事任职资格获核准 东莞银行香港子行正式开业城商行“走出去”再添新例 龙国电信集团副总经理唐珂一行到云南白药集团调研交流最新进展 特斯拉Model Y L续航里程751公里与长续航版Model Y相当实测是真的 派拉蒙以77亿美元、7年合约买下UFC赛事版权 锂电“反内卷”引爆盛新锂能，比亚迪离解套还有多远？实测是真的 任职12年后，沙河股份董事长陈勇因“工作调动”辞职公司：系集团内部正常调动实时报道 二季度企业经营韧性延续，投资谨慎观望 Orsted计划进行94亿美元配股发行，股价暴跌27%又一个里程碑 兴福电子：选举李少平为董事长聘任叶瑞为总经理官方通报来了 ETF日报：从居民资金入市、两融稳定增长的逻辑出发，可以关注业绩弹性较高，显著受益于股市活跃度的券商ETF又一个里程碑 决胜“十四五” 打好收官战 | 做好“减震器”“稳定器”！“十四五”期间保险业保障能力持续提高又一个里程碑 决胜“十四五” 打好收官战 | 做好“减震器”“稳定器”！“十四五”期间保险业保障能力持续提高官方已经证实 Orsted计划进行94亿美元配股发行，股价暴跌27%是真的？ 锂电“反内卷”引爆盛新锂能，比亚迪离解套还有多远？ 派拉蒙以77亿美元、7年合约买下UFC赛事版权 锂电“反内卷”引爆盛新锂能，比亚迪离解套还有多远？后续会怎么发展 宜搜科技战略投资Lightnet，锁定正大集团全球资源RWA核心入口官方通报 连续5年正收益，小众策略破圈！ 惠誉授予广州地铁离岸人民币债券A评级官方通报 铜冠铜箔公司深度研究：AI铜箔领跑者后续会怎么发展 轨交设备行业财务总监CFO观察：天宜新材侯玉勃薪酬与公司业绩倒挂薪酬涨21% 归母净利润却下滑1138%又一个里程碑 轨交设备行业财务总监CFO观察：祥和实业郑远飞年龄59岁为行业中最年长学历为大专薪酬为51万元 众擎机器人赵同阳：让机器人能如同朋友般值得信赖，亦能似家人般传递温暖最新进展 众擎机器人赵同阳：让机器人能如同朋友般值得信赖，亦能似家人般传递温暖 视源股份全栈自研机器人首次亮相世界机器人大会定位“3D 岗”生产力伙伴官方已经证实 美联楼价指数本年迄今微升0.05%学习了 狂奔的海尔消金为何面临合规困局秒懂 中汽协：1-7月零跑销量反超理想，新能源车销量集中在15-20万价格区间最新进展 总裁联播+政企双补，红星美凯龙818大促超级直播携9大品牌引爆全域流量学习了 自动化设备行业财务总监CFO观察：田中精机刘广涛薪酬与公司业绩倒挂薪酬74万元涨11% 归母净利润下滑1655%官方通报 自动化设备行业财务总监CFO观察：田中精机刘广涛薪酬与公司业绩倒挂薪酬74万元涨11% 归母净利润下滑1655%秒懂 美俄会谈在即，原油黄金盘中跌超1%，美股期货欧股走高，比特币创一个月新高

自DeepSeek火爆全球之后，国产开源大模型的开发热潮一浪高过一浪。如今，DeepSeek诞生以来最强的对手，它来了！

今日凌晨3点30，阿里巴巴放出一枚重磅炸弹——通义千问最新开源模型QwQ-32B正式发布，比DeepSeek更小的尺寸，性能比肩全球最强开源推理模型。据了解，通过大规模强化学习，千问QwQ-32B在数学、代码及通用能力上实现质的飞跃，整体性能比肩DeepSeek-R1。而且在保持强劲性能的同时，千问QwQ-32B还大幅降低了部署使用成本，在消费级显卡上也能实现本地部署。

目前，阿里已采用宽松的Apache2.0协议，将千问QwQ-32B模型向全球开源，所有人都可免费下载及商用。同时，用户也将可通过通义APP免费体验最新的千问QwQ-32B模型。目前，QwQ-32B-Preview已经在（chat.qwen.ai）官网上线。

据通义千问Qwen团队介绍，近期的研究表明，强化学习可以显著提高模型的推理能力。例如，DeepSeek-R1通过整合冷启动数据和多阶段训练，实现了最先进的性能，使其能够进行深度思考和复杂推理。而QwQ-32B就是大规模强化学习（RL）对大语言模型的智能的提升作用的最好研究例证。规模上，QwQ-32B是一款仅有320亿参数的模型，其性能却可与具备6710 亿参数（其中370亿被激活）的DeepSeek-R1媲美。

另外，Qwen团队还在推理模型中集成了与Agent相关的能力，使其能够在使用工具的同时进行批判性思考，并根据环境反馈调整推理过程。测试结果显示，在测试数学能力的AIME24评测集上，以及评估代码能力的 LiveCodeBench中，千问QwQ-32B表现与DeepSeek-R1相当，远胜于o1-mini及相同尺寸的R1 蒸馏模型。

在由Meta首席科学家杨立昆领衔的“最难LLMs评测榜” LiveBench、谷歌等提出的指令遵循能力IFEval评测集、由加州大学伯克利分校等提出的评估准确调用函数或工具方面的BFCL测试中，千问QwQ-32B的得分均超越了DeepSeek-R1。

此外，Qwen团队还通过展示了一段简短的示例代码，说明如何通过API使用 QwQ-32B。Qwen团队表示，我们希望我们的一点努力能够证明强大的基础模型叠加大规模强化学习也许是一条通往通用人工智能的可行之路。

受此消息影响，阿里巴巴港股大涨6.7%，截稿前报138.6港元，总市值2.63万亿港元。