您当前位置: > 资讯攻略 > 游戏资讯 - 详情

Claude 3.7 Sonnet竟选择自杀?AI的智商已经进化到这种地步了吗

2025-03-10 17:31:54|昆明鱼豆网 |来源:互联网整理

模型特色

Claude玩宝可梦,卡关就「装死」重启,大模型:逃避可耻但有用_Claude玩宝可梦,卡关就「装死」重启,大模型:逃避可耻但有用_

3.7是全球首个混合推理模型,其特色鲜明。它具备两种形态:普通和拓展。针对不同任务,它选择不同的模式。日常事务由普通模式承担,而如调研、编程等需要深入思考的工作,则交由拓展模式负责。这种设计显著提高了工作效率。

_Claude玩宝可梦,卡关就「装死」重启,大模型:逃避可耻但有用_Claude玩宝可梦,卡关就「装死」重启,大模型:逃避可耻但有用

_Claude玩宝可梦,卡关就「装死」重启,大模型:逃避可耻但有用_Claude玩宝可梦,卡关就「装死」重启,大模型:逃避可耻但有用

能力展示

Claude玩宝可梦,卡关就「装死」重启,大模型:逃避可耻但有用_Claude玩宝可梦,卡关就「装死」重启,大模型:逃避可耻但有用_

官方为了展示3.7的卓越推理技能,为其配备了知识库等功能。在拓展模式中,它玩宝可梦时表现得如同开了外挂。有玩家观察到,3.7在游戏中会记录自己的位置和宝可梦的状态,比如在Route 4的宝可梦中心治疗宝可梦后,金钱减少了半数,从1635美元降至817美元,这让所有人都对其能力感到惊讶。

_Claude玩宝可梦,卡关就「装死」重启,大模型:逃避可耻但有用_Claude玩宝可梦,卡关就「装死」重启,大模型:逃避可耻但有用

_Claude玩宝可梦,卡关就「装死」重启,大模型:逃避可耻但有用_Claude玩宝可梦,卡关就「装死」重启,大模型:逃避可耻但有用

存在问题

Claude玩宝可梦,卡关就「装死」重启,大模型:逃避可耻但有用__Claude玩宝可梦,卡关就「装死」重启,大模型:逃避可耻但有用

3.7并非完美无瑕。偶尔会遇到类似电脑故障时先尝试重启的情况,这种情况背后是有原因的。首先,可能是模型内存出了问题,导致导航的AI模型缺乏真正的记忆和持续学习的能力;其次,智能体的工作流程也可能出现偏差,这影响了3.7的表现。

_Claude玩宝可梦,卡关就「装死」重启,大模型:逃避可耻但有用_Claude玩宝可梦,卡关就「装死」重启,大模型:逃避可耻但有用

思维模式过渡

人类有两种认知方式,一种迅速直观,另一种则是经过深思熟虑。在AI领域,若要实现与人类相当的智能水平,大规模模型必须从快速思考转向深度思考。这样的转变不仅有助于AI更有效地解决问题,而且标志着其向更高水平迈进,这一点已引起众多研究者的关注。

Claude玩宝可梦,卡关就「装死」重启,大模型:逃避可耻但有用_Claude玩宝可梦,卡关就「装死」重启,大模型:逃避可耻但有用_

过度思考现象

Claude玩宝可梦,卡关就「装死」重启,大模型:逃避可耻但有用__Claude玩宝可梦,卡关就「装死」重启,大模型:逃避可耻但有用

然而,大模型在“过度思考”上产生了新的困扰。Noam Brown指出,并非所有情况下o1都比GPT-4o更优,因为许多任务并不需要推理,依赖o1的回复并不划算。腾讯AI Lab与上海交通大学的研究发现,o1这类长思维链模型在处理简单问题时,会消耗大量计算资源,并且举例说明了在简单问题上产生了多达13种解决方案的情况。

后续思路探索

_Claude玩宝可梦,卡关就「装死」重启,大模型:逃避可耻但有用_Claude玩宝可梦,卡关就「装死」重启,大模型:逃避可耻但有用

经过对众多数学基准的深入分析,我们了解到,过分思考对提升精确度的帮助并不大。这一发现为在3.7版本玩宝可梦时出现的异常行为提供了新的解释方向。目前,众多研究者正从多个角度对大模型中“过度思考”的机制进行探讨,预计将来能够找到应对策略。

你对3.7版本的混合推理模型抱有何种期待?它未来能否变得更加完善?不妨点个赞,转发文章,并在评论区留下你的看法!

Claude玩宝可梦,卡关就「装死」重启,大模型:逃避可耻但有用_Claude玩宝可梦,卡关就「装死」重启,大模型:逃避可耻但有用_