OpenAI新版4o逆袭-重返大模型竞技场榜首

OpenAI新版4o逆袭-重返大模型竞技场榜首

作者:news 发表时间:2025-08-16
反转来了 保姆机器人已被“提升日程”,全国现存机器人相关企业超89.1万家又一个里程碑 比亚迪商用车与京东牵手!打造超级CP!后续反转 A股银行股普遍下跌,工商银行等跌超2%官方已经证实 券商8月以来调研162家公司!宠物龙头人气最高,创新药出海受关注 网易云音乐盘中涨超5% 上半年经调整净利同比增加120.99%反转来了 是真的吗? ALL IN!美国人彻底迷上了用401(k)账户炒股…… 海工装备异动拉升,巨力索具触及涨停 华为 MatePad Air 2025 款开启预售:到手价 2999 元起后续来了 直线上冲!“牛市旗手”券商ETF(512000)飙涨2.7%,接力新高!长城证券3连板是真的? A股银行股普遍下跌,工商银行等跌超2%专家已经证实 特朗普:与普京的会晤富有成效后续来了 美国半导体巨头大跌超14%,市值一夜蒸发超1500亿元!发生了什么? 白宫后退一步:减少对华盛顿警局“接管”幅度,法官促成临时妥协记者时时跟进 今年以来“翻倍基”数量达16只实测是真的 “双普”峰会现场直击:美俄总统热烈握手后即兴坐进“野兽”密谈秒懂 券商中报喜报频传,“牛市”旗手王者归来?这么做真的好么? 扬州玺悦收到证监会境外上市备案反馈 需说明熊彬配偶胡佳惠未被认定为共同实际控制人的原因和依据反转来了 两年一次!医保“打包付费”将实行动态调整记者时时跟进 特朗普称与普京谈得非常好 并表示将“拭目以待”科技水平又一个里程碑 化工板块全天狂飙,化工ETF(516020)盘中涨超2%!机构力挺+资金持续加码,板块转机或至?专家已经证实 今年以来“翻倍基”数量达16只后续会怎么发展 特朗普暗示普京与泽连斯基的会晤正在计划当中官方处理结果 特朗普对普京说可能很快再见 华瑞指数云发布AI原生数据平台WADP:采用统一通用存储架构,实现AI算力与数据存力协同 华康洁净实控人谭平涛被广东监委立案并留置 近半个月转让可转债套现数亿元 突击减持背后存三大疑点后续反转来了 押注AI!Ackman一口气买了13亿美元亚马逊,增持谷歌后续来了 牛市重要信号,7月非银存款激增!“牛市旗手”大爆发,券商ETF(512000)狂飙5%,东财爆量涨11% 【专家观点】把加快推动科技创新和产业创新深度融合作为重要着力点 创新药概念震荡反弹,新天药业涨停 战略布局三大产品 艾为电子上半年净利润增长71%学习了 公开信炮轰大股东出资逾期后,汇源再发文指责临时股东会黑箱操作官方通报 新规首例!A股跨境换股过会,外资做战投! 美的架构再生变,微清事业部并入洗衣机事业部,前微清总裁马赤兵升任万东医疗董事长 【券商聚焦】东北证券首予腾讯音乐(01698)“买入”评级 指其行业地位稳固 业绩稳健快速增长 A股集体爆发,中证500领跑宽基指数 500ETF(159500)迎布局良机 美联储9月降息预期限制美元涨幅,金价维持区间震荡,等待方向选择实时报道 吃喝板块绝地反击!食品ETF(515710)拉升翻红,标的指数估值仍处底部!机构:白酒或已具备长期投资价值 【开源地产建筑】团队介绍&研究成果 【券商聚焦】财通证券维持耐世特(01316)“增持”评级 指龙国整车制造商的订单持续强劲秒懂 【券商聚焦】财通证券维持耐世特(01316)“增持”评级 指龙国整车制造商的订单持续强劲 换电概念持续走强,勘设股份、中恒电气双双涨停专家已经证实 生意社:8月15日鲁西化工异辛醇报价暂稳是真的吗?

在万众瞩目的新加坡OpenAI开发者日活动中,ChatGPT再度展现了其非凡的实力。最新版本的ChatGPT-4o(简称4o)在备受关注的大模型竞技场中一举夺魁,将此前占据榜首的Gemini拉下了马。

OpenAI新版4o逆袭

此次4o的更新重点在于“创意写作能力”,据官方介绍,新版本能够生成更加自然、吸引人且有针对性的文本,显著提升了文本的相关性和可读性。4o在处理上传文件方面也进行了优化,能够提供更深入的见解和更全面的回应。

o1的核心贡献者Karina Nguyen对此次更新表示了肯定。她指出,作为Canvas功能的一部分,改进写作是一个顶级用例,有望改变人机协作的方式,让创作过程更具创造性。尽管她承认这一研究问题非常主观且开放,但至少在写作方面取得的进展对于实现AGI(通用人工智能)的创造性智能至关重要。

OpenAI新版4o逆袭

在大模型竞技场的创意写作分榜上,新版4o(ChatGPT-4o-1120)的得分从上一个版本的1365跃升至1402,进步显著。同时,在代码能力、数学能力、困难任务以及风格控制等多个方面,4o也均有所提升,成功从之前的第二名跃升至第一名。

OpenAI新版4o逆袭

然而,尽管4o的表现亮眼,但网友们对于OpenAI迟迟未推出o1满血版仍表示不满。一些网友在社交媒体上直言,希望OpenAI能够尽快放出o1,与近期备受瞩目的DeepSeek等模型进行正面较量。甚至有网友调侃称,OpenAI的更新策略似乎就是每当有其他模型登上榜首时,便迅速推出新版本夺回第一。

OpenAI新版4o逆袭

尽管4o在创意写作方面取得了显著进步,但仍有网友对其生成的内容进行了测试,并发现系统仍能够准确识别出这些内容为AI所写。不过,也有网友对4o的更新进行了深入研究,并发现OpenAI在系统提示词方面进行了优化,新增了一道护栏,以确保ChatGPT在敏感话题上不会胡说八道。

OpenAI新版4o逆袭

目前,新版4o已在大模型竞技场中上线,感兴趣的读者可以前往体验并分享自己的感受。对于未来OpenAI是否会推出o1满血版,以及它将如何与其他模型进行竞争,我们拭目以待。

相关文章