华发股份上半年营收增长53% 中期拟10派0.20元后续反转来了
现代牙科盈喜后涨超12% 预期上半年取得纯利同比增加约30.1%至37.6%
脑机接口概念强势,创新医疗再度涨停秒懂
中金:维持荣昌生物跑赢行业评级 升目标价至95.34港元是真的吗?
华新精科今起招股 8月25日申购这么做真的好么?
阅文2025年上半年归母净利同比大增68.5%至8.5亿元,短剧、衍生品增长势能强劲
派格生物医药-B早盘一度大涨超40% 公司核心品种PB-119商业化在即后续会怎么发展
苹果iPad mini发布在即 iPhone 15为新机让路跌至冰点价遭疯抢!学习了
龙国轮胎海外建厂三岔路口实垂了
京东健康绩后涨超11% 上半年净利润同比增长27.45%
稀土永磁概念异动拉升,华宏科技涨停官方通报
中金:维持网易-S跑赢行业评级 目标价263港元这么做真的好么?
创新转型获认可!复星医药率先成功发行10亿元中长期科技创新债券
美国收益率曲线陡峭拉响通胀警报,欧洲却现套利良机是真的吗?
西典新能上半年净利润增长52% 中期拟10派4元
美财长澄清:我没有施压美联储降息 只是谈论中性利率!学习了
科创板迎中长期布局机遇,长城上证科创板综合指数基金正在发行中
美联储9月降息预期限制美元涨幅,金价维持区间震荡,等待方向选择
牛市重要信号,7月非银存款激增!“牛市旗手”大爆发,券商ETF(512000)狂飙5%,东财爆量涨11%学习了
新规首例!A股跨境换股过会,外资做战投!官方已经证实
从存款搬家说起科技水平又一个里程碑
创新药概念震荡反弹,新天药业涨停
从存款搬家说起
主动权益基金多点开花 长城基金多只产品近一年业绩跻身同类前30%后续反转
苹果手机出现定位偏差?人在龙国首都手机定位川大
【券商聚焦】财通证券维持耐世特(01316)“增持”评级 指龙国整车制造商的订单持续强劲专家已经证实
创新药概念震荡反弹,新天药业涨停
世界人形机器人运动会开幕,“首程机器人科技体验店”向公众开放
万达集团及万达地产等被执行3.3亿后续反转来了
航空股早盘普遍走高 东方航空涨逾5%南方航空涨逾4%
航空股早盘普遍走高 东方航空涨逾5%南方航空涨逾4%后续会怎么发展
一脉阳光早盘拉升逾8% 海内外医学影像赛道火热官方通报来了
阅文集团(00772)升近5% 里昂指其业绩超预期 IP衍生GMV亮眼最新报道
抖音测试“快递”功能 知情人士:仅能查询散件信息,与电商平台无关实垂了
“牛市旗手”领跑,逾50亿资金抢筹!顶流券商ETF(512000)上探2.8%续刷年内新高!
卖惨视频为虚假摆拍,只为卖课牟利!美团骑手“苏星颜”被行政处罚最新报道
阅文集团(00772)升近5% 里昂指其业绩超预期 IP衍生GMV亮眼是真的吗?
Gartner在行业反击后放弃了“CXaaS”一词科技水平又一个里程碑
有问题也要用!DeepSeek R2因芯片问题而推迟发布:或跟华为有关
精优药业盘中涨逾13% 拟配发合共1.6亿股净筹款项用于新业务发展
前7个月投资增速有所放缓,分析师:基建“稳定器”作用或受到进一步倚重
PPI核弹引爆市场,美元兑日元反转,美联储降息仍有可能
万达集团及万达地产等被执行3.3亿反转来了
京东集团(09618)绩后挫逾3% 次季纯利跌5成 新业务经营亏损大幅扩大记者时时跟进
20年央企财务舵手叶才接任景顺长城基金法定代表人最新报道
日丰股份定增提交注册 拟募集资金2.3亿元官方处理结果
自DeepSeek火爆全球之后,国产开源大模型的开发热潮一浪高过一浪。如今,DeepSeek诞生以来最强的对手,它来了!

今日凌晨3点30,阿里巴巴放出一枚重磅炸弹——通义千问最新开源模型QwQ-32B正式发布,比DeepSeek更小的尺寸,性能比肩全球最强开源推理模型。据了解,通过大规模强化学习,千问QwQ-32B在数学、代码及通用能力上实现质的飞跃,整体性能比肩DeepSeek-R1。而且在保持强劲性能的同时,千问QwQ-32B还大幅降低了部署使用成本,在消费级显卡上也能实现本地部署。
目前,阿里已采用宽松的Apache2.0协议,将千问QwQ-32B模型向全球开源,所有人都可免费下载及商用。同时,用户也将可通过通义APP免费体验最新的千问QwQ-32B模型。目前,QwQ-32B-Preview已经在(chat.qwen.ai)官网上线。
据通义千问Qwen团队介绍,近期的研究表明,强化学习可以显著提高模型的推理能力。例如,DeepSeek-R1通过整合冷启动数据和多阶段训练,实现了最先进的性能,使其能够进行深度思考和复杂推理。而QwQ-32B就是大规模强化学习(RL)对大语言模型的智能的提升作用的最好研究例证。规模上,QwQ-32B是一款仅有320亿参数的模型,其性能却可与具备6710 亿参数(其中370亿被激活)的DeepSeek-R1媲美。

另外,Qwen团队还在推理模型中集成了与Agent相关的能力,使其能够在使用工具的同时进行批判性思考,并根据环境反馈调整推理过程。测试结果显示,在测试数学能力的AIME24评测集上,以及评估代码能力的 LiveCodeBench中,千问QwQ-32B表现与DeepSeek-R1相当,远胜于o1-mini及相同尺寸的R1 蒸馏模型。
在由Meta首席科学家杨立昆领衔的“最难LLMs评测榜” LiveBench、谷歌等提出的指令遵循能力IFEval评测集、由加州大学伯克利分校等提出的评估准确调用函数或工具方面的BFCL测试中,千问QwQ-32B的得分均超越了DeepSeek-R1。
此外,Qwen团队还通过展示了一段简短的示例代码,说明如何通过API使用 QwQ-32B。Qwen团队表示,我们希望我们的一点努力能够证明强大的基础模型叠加大规模强化学习也许是一条通往通用人工智能的可行之路。
受此消息影响,阿里巴巴港股大涨6.7%,截稿前报138.6港元,总市值2.63万亿港元。

