DeepSeek最强对手来了!阿里巴巴放出重磅炸弹

DeepSeek最强对手来了!阿里巴巴放出重磅炸弹

作者:news 发表时间:2025-08-12
市场“错杀”了礼来?又一个里程碑 AI应用突发大跌,创业板人工智能ETF(159363)失守10日线!中际旭创逆市飘红,算力持续高景气这么做真的好么? 金融监管总局部署督导 保险业全力应对主汛期灾害 重磅!龙国神华筹划大规模重组,拟一次性整合13家核心资产!最新报道 重磅!龙国神华筹划大规模重组,拟一次性整合13家核心资产!后续来了 七成A/H股上市车企7月销量同比增长 乘联分会:多项指标再创新高、上调年度预测 直击WRC | 像真人一样表情生动!数字华夏多款人形机器人亮相官方处理结果 Meta与太平洋投资达成290亿美元AI数据中心协议学习了 Trade Desk股价暴跌,首席执行官警告关税对大型品牌广告商的影响后续反转来了 优优绿能:公司在积极探索跨界拓展的可能性 脑机接口成市场新风口,乐普医疗“精准踩点”引爆资本狂欢后续反转 优优绿能:公司在积极探索跨界拓展的可能性是真的? 重磅!龙国神华筹划大规模重组,拟一次性整合13家核心资产!这么做真的好么? 两极分化!-60%到1412%,透视险企短期健康险悬殊赔付率后续反转来了 刚刚,证监会宣布继续严把发行上市入口关!IPO不会再大规模扩容!反转来了 三鑫医疗中期分红:拟每10股派发现金红利1元 靖奇投资“宫斗”升级:法人被罢免仍发公告,合伙人斥其“钻空子”记者时时跟进 无锡锡商银行股权变更获批 无锡市国联发展(集团)将受让5亿股股份 七成A/H股上市车企7月销量同比增长 乘联分会:多项指标再创新高、上调年度预测 市场“错杀”了礼来? 湖北能源7月份发电量同比减少8.60%专家已经证实 重庆地产集团收购重庆水投集团所持重庆银行5200万股A股 金额不高于5.8亿元秒懂 罗马仕所持40万股权被冻结 农商行加入“基金费率战”,最低至0.1折 乖宝宠物拟授予不超过56万股限制性股票 价格47.55元/股 飞鹿股份股东何晓锋、刘雄鹰计划减持合计不超过641万股 二季度企业经营韧性延续,投资谨慎观望 环球印务上半年营收同比下降43.5% 亏损372万元 粤万年青股东合和投资控股减持105万股实时报道 开尔新材副总经理刘永珍计划减持不超过78万股 兴福电子:选举李少平为董事长 聘任叶瑞为总经理是真的吗? 重庆地产集团收购重庆水投集团所持重庆银行5200万股A股 金额不高于5.8亿元实测是真的 机器人“全明星阵容”大聚会 近百家上市公司参展 年内房企高管变动超50次最新报道 A股年内第三家 *ST天茂拟主动退市实时报道 机器人“全明星阵容”大聚会 近百家上市公司参展官方处理结果 3600点之上,怎么投?学习了 一餐饮店用草酸清洗龙虾制作外卖,南京通报:吊销经营许可证,行政处罚! 年内房企高管变动超50次 绳驱机器人亮相世界机器人大会 上市公司积极迭代关键腱绳材料 最高法发布保障举措 破解民营企业融资顽疾秒懂 近一月65只主动权益类基金“谢客” 这个周末传疯了!宁德时代枧下窝锂矿关停,锂矿股再度意念涨停?秒懂 十大券商策略:A股仍处于牛市中继!避免参与似是而非的资金接力学习了 谷歌,何时该放弃网络搜索,转而选择深度研究又一个里程碑 A股年内第三家 *ST天茂拟主动退市后续来了 香港招商引资显效:注册香港本地公司总数逾150万家 创历史新高 华创证券:促消费政策的5个看点后续反转 每天读研报,投资者收益翻倍的秘密武器太强大了 北约秘书长对“特普会”持乐观态度太强大了 近一月65只主动权益类基金“谢客”官方通报来了

自DeepSeek火爆全球之后,国产开源大模型的开发热潮一浪高过一浪。如今,DeepSeek诞生以来最强的对手,它来了!

本站

今日凌晨3点30,阿里巴巴放出一枚重磅炸弹——通义千问最新开源模型QwQ-32B正式发布,比DeepSeek更小的尺寸,性能比肩全球最强开源推理模型。据了解,通过大规模强化学习,千问QwQ-32B在数学、代码及通用能力上实现质的飞跃,整体性能比肩DeepSeek-R1。而且在保持强劲性能的同时,千问QwQ-32B还大幅降低了部署使用成本,在消费级显卡上也能实现本地部署。

目前,阿里已采用宽松的Apache2.0协议,将千问QwQ-32B模型向全球开源,所有人都可免费下载及商用。同时,用户也将可通过通义APP免费体验最新的千问QwQ-32B模型。目前,QwQ-32B-Preview已经在(chat.qwen.ai)官网上线。

据通义千问Qwen团队介绍,近期的研究表明,强化学习可以显著提高模型的推理能力。例如,DeepSeek-R1通过整合冷启动数据和多阶段训练,实现了最先进的性能,使其能够进行深度思考和复杂推理。而QwQ-32B就是大规模强化学习(RL)对大语言模型的智能的提升作用的最好研究例证。规模上,QwQ-32B是一款仅有320亿参数的模型,其性能却可与具备6710 亿参数(其中370亿被激活)的DeepSeek-R1媲美。

本站

另外,Qwen团队还在推理模型中集成了与Agent相关的能力,使其能够在使用工具的同时进行批判性思考,并根据环境反馈调整推理过程。测试结果显示,在测试数学能力的AIME24评测集上,以及评估代码能力的 LiveCodeBench中,千问QwQ-32B表现与DeepSeek-R1相当,远胜于o1-mini及相同尺寸的R1 蒸馏模型。

在由Meta首席科学家杨立昆领衔的“最难LLMs评测榜” LiveBench、谷歌等提出的指令遵循能力IFEval评测集、由加州大学伯克利分校等提出的评估准确调用函数或工具方面的BFCL测试中,千问QwQ-32B的得分均超越了DeepSeek-R1。

此外,Qwen团队还通过展示了一段简短的示例代码,说明如何通过API使用 QwQ-32B。Qwen团队表示,我们希望我们的一点努力能够证明强大的基础模型叠加大规模强化学习也许是一条通往通用人工智能的可行之路。

受此消息影响,阿里巴巴港股大涨6.7%,截稿前报138.6港元,总市值2.63万亿港元。

本站

相关文章