DeepSeek最强对手来了!阿里巴巴放出重磅炸弹

DeepSeek最强对手来了!阿里巴巴放出重磅炸弹

作者:news 发表时间:2025-08-12
当AH股溢价率小于20%,银行股还香吗?后续来了 十大券商策略:A股仍处于牛市中继!避免参与似是而非的资金接力后续反转来了 以合理价格挖掘高质量资产——访永赢基金权益研究部总经理王乾 苏泊尔青花瓷餐具套装荣膺“国际CMF创新奖”官方通报 又一家合资险企变身纯外资,如何深耕龙国市场?后续反转 南芯科技25W Qi2.2磁吸无线充电模组解析太强大了 招商基金痛失一员猛将! 套息交易员加大对新兴市场的押注,因美联储降息在即科技水平又一个里程碑 股市回调将 “转瞬即逝”:华尔街认为人工智能和降息乐观情绪将推动反弹 人形机器人撕掉“花瓶”标签还要多久?亿元大单“破冰”,商业化元年终于来了! 十大券商策略:A股仍处于牛市中继!避免参与似是而非的资金接力 金龙羽上半年增收不增利,经营现金流“失血”后续反转 龙国首都楼市新政释放购房需求 更多城市有望跟进 观点与胡懋对话:入华30年,IWG发展新篇章 | 博鳌·融合的力量 南芯科技25W Qi2.2磁吸无线充电模组解析是真的吗? 百果园迟早要“迎合消费者”官方通报 专用设备行业董秘观察:电光科技曹汉君67岁 为行业内最年长 薪酬达91万元 华光环能连续5个交易日涨停,累计涨幅61.09%!反转来了 海马汽车:氢能汽车海马7X-H已在海南投放50台开展示范运营 通用设备行业董秘观察:迅安科技李德明68岁 为行业内最年长 2024年薪酬43万元反转来了 国网上海电力 | 上电股份 | 华东电力设计院 | 上海铁塔 | 采日能源 | 良信电器 | 天炜能源 | 欧秒电力 |宝临电气实垂了 IPO月报|悍高集团发行费用率畸高 报告期内创造盈利“神话”后续来了 海马汽车:氢能汽车海马7X-H已在海南投放50台开展示范运营 康华生物进入“对赌时代”记者时时跟进 专用设备行业董秘观察:天地科技范建为博士学历 薪酬达118万元 永和股份:上半年归母净利润2.71亿元,同比增长140.82% 去年关店近千家,亏损近4亿元!百果园董事长教育消费者言论引争议,高端水果出路在哪?这么做真的好么? 圣晖集成:上半年营业收入同比增长39.04% 全球化战略取得突破 当AH股溢价率小于20%,银行股还香吗? 美国西部将遭遇火灾、风暴及极端高温天气后续会怎么发展 长安汽车朱华荣拜访华为任正非:敬佩任总视野格局 突发公告!002898,董事会成员集体辞职!是真的吗? 晓鸣股份7月份销售鸡产品1992.76万羽 市场需求有望迎来季节性增长后续来了 【国泰海通消费】再论新消费配置机会 创业板人工智能周线五连阳!机构:AI应用渗透率提升,算力需求大于供给的趋势延续官方已经证实 周末,三大利好来袭!7月重要经济数据将公布最新报道 晓鸣股份7月份销售鸡产品1992.76万羽 市场需求有望迎来季节性增长最新报道

自DeepSeek火爆全球之后,国产开源大模型的开发热潮一浪高过一浪。如今,DeepSeek诞生以来最强的对手,它来了!

本站

今日凌晨3点30,阿里巴巴放出一枚重磅炸弹——通义千问最新开源模型QwQ-32B正式发布,比DeepSeek更小的尺寸,性能比肩全球最强开源推理模型。据了解,通过大规模强化学习,千问QwQ-32B在数学、代码及通用能力上实现质的飞跃,整体性能比肩DeepSeek-R1。而且在保持强劲性能的同时,千问QwQ-32B还大幅降低了部署使用成本,在消费级显卡上也能实现本地部署。

目前,阿里已采用宽松的Apache2.0协议,将千问QwQ-32B模型向全球开源,所有人都可免费下载及商用。同时,用户也将可通过通义APP免费体验最新的千问QwQ-32B模型。目前,QwQ-32B-Preview已经在(chat.qwen.ai)官网上线。

据通义千问Qwen团队介绍,近期的研究表明,强化学习可以显著提高模型的推理能力。例如,DeepSeek-R1通过整合冷启动数据和多阶段训练,实现了最先进的性能,使其能够进行深度思考和复杂推理。而QwQ-32B就是大规模强化学习(RL)对大语言模型的智能的提升作用的最好研究例证。规模上,QwQ-32B是一款仅有320亿参数的模型,其性能却可与具备6710 亿参数(其中370亿被激活)的DeepSeek-R1媲美。

本站

另外,Qwen团队还在推理模型中集成了与Agent相关的能力,使其能够在使用工具的同时进行批判性思考,并根据环境反馈调整推理过程。测试结果显示,在测试数学能力的AIME24评测集上,以及评估代码能力的 LiveCodeBench中,千问QwQ-32B表现与DeepSeek-R1相当,远胜于o1-mini及相同尺寸的R1 蒸馏模型。

在由Meta首席科学家杨立昆领衔的“最难LLMs评测榜” LiveBench、谷歌等提出的指令遵循能力IFEval评测集、由加州大学伯克利分校等提出的评估准确调用函数或工具方面的BFCL测试中,千问QwQ-32B的得分均超越了DeepSeek-R1。

此外,Qwen团队还通过展示了一段简短的示例代码,说明如何通过API使用 QwQ-32B。Qwen团队表示,我们希望我们的一点努力能够证明强大的基础模型叠加大规模强化学习也许是一条通往通用人工智能的可行之路。

受此消息影响,阿里巴巴港股大涨6.7%,截稿前报138.6港元,总市值2.63万亿港元。

本站

相关文章