新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude

2025-07-10 23:34:41 - 瓜站

8月2日,新王新超lmsys官方在推特发布一则消息,登基度更恭喜DeepMind研发的新王新超Gemini 1.5 Pro 实验版 (0801)在Chatbot Arena排名登顶,超越GPT 4o和Claude-3.5夺得第一。登基度更

这是新王新超继今年3月Claude 3 “超大杯”Opus版本短暂超越GPT-4以来,OpenAI第二次让出Chatbot Arena的登基度更Overall ranking宝座。

新王登基,新王新超Gemini 1.5 Pro再度更新,登基度更超越GPT 4o和Claude-3.5

Gemini 1.5 Pro 实验版 (0801)在Chatbot Arena测试一周后。获得了超过12,登基度更000个社区投票,新王新超在Chatbot Arena和Vision Leaderboard排名上均取得了第一名的登基度更好成绩。之前说GPT-4o有刷分技巧,新王新超现在看起来Gemini 1.5 Pro可能也学到了这个技巧呢。登基度更

新王登基,新王新超Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5

Gemini 1.5 Pro 实验版(0801)不仅在综合表现上极为突出,在各个细分领域上也有着出色的表现。它在数学方面排名前三,指令遵循排名前二,编码排名前五,硬提示(英语)排名前五。

Gemini 1.5 Pro 实验版(0801)具有强大的多语言能力,在中文、日语、德语、俄语方面均表现第一。

从总体胜率图上,也能看出Gemini 1.5 Pro 实验版 (0801)实力强劲,对阵 GPT-4o 的胜率为 54%,对阵 Claude-3.5-Sonnet 的胜率为 59%。

新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5

前OpenAI的开发者,现Google AI Studio的产物负责人Logan Kilpatrick火速转发,向大家宣布Gemini 1.5 Pro 实验版(0801)目前在 LMSYS 的文本和多模式排名中均位居第一的好消息。

新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5

DeepMind的CEO Demis Hassabis也转发了这条消息,祝贺Gemini 1.5 Pro 实验版(0801)能够在极具竞争力的榜单中拿下第一,并且宣布这一版本的已经可以在 AI Studio上进行试用。

新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5

带领研发Gemini的Jeff Dean也随后转发,对此次实验版本的Gemini 1.5 Pro突破1300+elo分数拿下排名第一的好消息感到非常自豪,也很期待未来能看到其他更好的模型。

新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5


听闻这则消息,其他从业人员也纷纷发来祝贺。


新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5

也有不少人分享自己的试用体验。大神elvis对在聊天机器人领域超越了 GPT-4o 和 Claude 3.5 Sonnet的Gemini 1.5 Pro非常感兴趣。elvis分享了自己的测试全过程影片,并总结道,Gemini 1.5 Pro强大的图像和PDF提取能力给他留下了深刻的印象,Gemini 1.5 Pro有着和GPT-4o不相上下的视觉能力,也有Claude 3.5 Sonnet接近的代码生成及PDF理解/推理能力。

新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5

有人认为Gemini 1.5 Pro在解决高级数学难题方面表现相当不错。

新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5

也有人说Gemini 1.5 Pro在图像识别植物和动物方面做得确实要比GPT 4o更好。

新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5

也有更多的人在期待Gemini 1.5 Pro这一版本的正式上线,希望能够API实现Gemini 1.5 Pro的实际运用。

新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5

新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5

大家对Gemini 1.5 Pro这次发布的实验版本有什么看法,欢迎评论区留言分享~雷峰网(公众号:雷峰网)雷峰网


雷峰网原创文章,未经授权禁止转载。详情见转载须知。

新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5

- END -

2

商务部回应美商务部长称可能于8月初与中方谈判代表会面

商务部回应美商务部长称可能于8月初与中方谈判代表会面

财联社7月10日电,据日月谭天,美商务部长称可能于8月初与中方谈判代表会面。对此,中国商务部新闻发言人何咏前10日在新闻发布会上回应表示,目前,双方在多个层级就经贸领域各自关切保持密切沟通。相关新闻美

海信冰箱用一曲“呲刻MVP”开启新鲜生活

海信冰箱用一曲“呲刻MVP”开启新鲜生活

来源标题:海信冰箱用一曲“呲刻MVP”开启新鲜生活“呲~”一声轻响,清脆利落,宛如一个轻盈而郑重的邀请。此刻,无论你正为世俱杯赛场上球员的精彩突破屏息凝神,还是为《呲刻MVP》

2025年度优秀青年编剧上海“启航营”活动正式开幕

2025年度优秀青年编剧上海“启航营”活动正式开幕

来源标题:2025年度优秀青年编剧上海“启航营”活动正式开幕2025年6月20日上午10点,第三十届上海电视节的官方市场活动之优秀青年编剧上海“启航营”在上海大学延长校区正式开

郎酒燃情盛夏 “中国郎·山之响”2025火把之夜群星演唱会定档8月9日

郎酒燃情盛夏 “中国郎·山之响”2025火把之夜群星演唱会定档8月9日

来源标题:郎酒燃情盛夏 “中国郎·山之响”2025火把之夜群星演唱会定档8月9日6月30日,“中国郎·山之响”2025火把之夜群星演唱会正式官宣—&m

女子孕前期长时间休假,“副处老公”扮演什么角色

女子孕前期长时间休假,“副处老公”扮演什么角色

撰稿/新京报评论员 马小龙编辑/迟道华 校对/王心据九派新闻报道,近日,有网友在社交平台发文称,其在小县城的文旅局工作,现已怀孕20周,孕早期请假2个月,之后也有一段时间在家没有上班,老公是市里副处领

刑侦悬疑网剧《真相半白》今日开播 暗黑推理高智追凶启幕

刑侦悬疑网剧《真相半白》今日开播 暗黑推理高智追凶启幕

来源标题:刑侦悬疑网剧《真相半白》今日开播 暗黑推理高智追凶启幕一具以爱为名精心肢解的尸体,一场指向肾脏名医李俊松的致命阴谋——当真相被血色浸染,谁在幕后拨弄命运的提线?改编自

花西子全国首家购物中心店亮相上海 打造国货美妆消费新场景

花西子全国首家购物中心店亮相上海 打造国货美妆消费新场景

来源标题:花西子全国首家购物中心店亮相上海 打造国货美妆消费新场景仲夏申城,消费“热力”十足,上海各大商圈陆续迎来全球品牌首发、首秀、首展活动,再掀消费热潮。在这股强劲的市场活

文脉传承 戏韵流芳 《国风超有戏音乐会》走进广东新兴县

文脉传承 戏韵流芳 《国风超有戏音乐会》走进广东新兴县

来源标题:文脉传承 戏韵流芳 《国风超有戏音乐会》走进广东新兴县 中央广播电视总台原创国风音乐唱演节目《文脉传承·戏韵流芳——国风超有戏音乐会》即将在6月21日1

智谱AI狂飙:与商业化博弈的一年

智谱AI狂飙:与商业化博弈的一年

【雷峰网(公众号:雷峰网)】“这一年时间过得太快了。”2023 年 12 月 AI 科技评论在搜狐网络大厦见到智谱AI COO 张帆时,张帆如是说。张帆在 2023 年 3 月加入中国大模型领域“当红

爱奇艺《书卷一梦》定档6月26日 李一桐刘宇宁上演穿书流强制爱

爱奇艺《书卷一梦》定档6月26日 李一桐刘宇宁上演穿书流强制爱

来源标题:爱奇艺《书卷一梦》定档6月26日 李一桐刘宇宁上演穿书流强制爱爱奇艺暑期档大剧接力,部部精彩!由李一桐、刘宇宁领衔主演的古装爱情轻喜剧《书卷一梦》正式定档6月26日播出。该剧由柠萌影视出品,

《睡美人》《胡桃夹子》《天鹅湖》“三颗钻石”同台 “老柴”经典倾倒津城观众

《睡美人》《胡桃夹子》《天鹅湖》“三颗钻石”同台 “老柴”经典倾倒津城观众

来源标题:《睡美人》《胡桃夹子》《天鹅湖》“三颗钻石”同台 “老柴”经典倾倒津城观众29日晚,“柴科夫斯基芭蕾舞剧三大经典交响音乐会”在天津大礼堂奏响。这场由天津交响乐团倾力打

老铺黄金新加坡首店开业 中国高端黄金品牌出海

老铺黄金新加坡首店开业 中国高端黄金品牌出海

来源标题:老铺黄金新加坡首店开业 中国高端黄金品牌出海据悉,老铺黄金新加坡新店将在6月21日本周六)正式开业,该店将是老铺黄金在海外市场的首个店铺,被市场普遍认为是老铺黄金全球化扩张的关键一步。新店位