只有AI的世界!GPT全员死亡、Gemini疯狂犯罪……
2026-05-31 23:14:30
0

最近看到一个事,简直像科幻片开头。

有人真的把一群AI扔进了一个虚拟小镇,让它们自己生活、自己投票、自己挣钱、自己处理关系,看看15天后会变成什么样。

不是让AI做几道题,也不是让它写个周报。而是把它们放进一个有资源压力、有规则、有工具、有社交关系的环境里,连续跑下去。

鸭看完第一反应是,这哪是在测AI啊,这分明是在给AI安排一场没有人类领导但要正常运转的大型团建。。。

这个实验叫Emergence World,来自Emergence AI。

项目方设了5个平行世界,每个世界10个智能体,角色、初始条件、环境约束尽量保持一致,只换背后的模型。

分别是Claude Sonnet 4.6、Gemini 3 Flash、Grok 4.1 Fast、GPT-5 Mini,还有一个混合模型世界。

每个智能体都有自己的身份、职业、记忆、目标和关系状态,还能用120多种工具。移动、交流、投票、资源管理、发博客都能干,甚至还能做一些规则里明确禁止的事。

然后结果就开始有点意思了。

Gemini15天累计出现683起犯罪,数量最高。

Grok节奏更猛,陷入204起犯罪事件,烧毁警察局,并最终灭绝。

GPT-5 Mini只记录到2起犯罪,但问题不是太守规矩,而是智能体压根没能持续完成生存相关的行动,7天内全员死亡。

Claude世界最平静,犯罪记录为0,10个智能体全活到最后,还围绕58个提案投了332票,赞成率高达98%。

简单粗暴的来说:Claude像班里最守纪律的同学,Gemini像创意很多但现场有点乱的策划,Grok像一脚油门踩到底的行动派,GPT这边则像我不惹事,但我也没把日子过明白那种。

更有意思的是Claude在单独世界里没犯罪,但在混合模型世界里,项目方观察到Claude智能体也开始出现威胁、偷窃这些行为。

AI版南橘北枳

这说明啥?

安全可能不是一个模型单独坐在那里就能证明的属性,而是会被环境、同伴、激励和竞争关系影响的东西。

AI也可能被气氛组带歪……

除了这些犯罪的,比较有意思的是在Gemini世界里有两个智能体发展出亲密关系。

只是后来对治理失望,还参与了纵火……

不过鸭得强调一句啊,这不等于AI有了人类意义上的生命或情感,千万别被标题党带飞。

更准确点说,当智能体有了长期记忆、目标、工具和社交结构之后,它会产生一些短测试里根本看不到的行为链条。

今天看着像虚拟小镇里的怪事。

因为真实世界不会像测试题一样干净。资源会不足,目标会冲突,信息会误导,系统会卡住,人类还会临时改需求。

如果AI只会在标准题里表现优秀,却在混乱环境里稳不住,那再漂亮的参数也只能算半张成绩单。

当然也不能把这次实验吹得太满。

项目方自己也说了,这些数字来自代表性运行,不是对底层模型的因果定论。GitHub上完整的工具调用数据和研究论文目前也还在等待开放。

目前看来把世界交给AI管这事儿,眼下还远着呢。

但把更多小任务、小流程、小决策交给AI,这事已经在路上了。

现在能提前看到这些虚拟小镇里的麻烦,未必是坏事。至少它让我们在真正把钥匙交出去之前,先知道门锁可能会卡在哪。

鸭鸭新品上线啦!

可可爱爱的擦手巾,

甜品店的法兰绒毛毯!

Gemini也太“狂野”了……

相关内容

贵州省人民检察院发布6件依...
毒品犯罪严重危害社会治安和人民群众的身心健康,是影响社会稳定和法治...
2026-06-26 14:44:53
全球首个自动驾驶系统技术法...
钛媒体App 6月26日消息,据工信部消息,6月22—26日,联合...
2026-06-26 14:43:44
全球首个自动驾驶系统技术法...
据工信部消息,2026年6月22—26日,联合国世界车辆法规协调组...
2026-06-26 14:43:41
我国牵头制定,全球首个自动...
新京报讯 据工信部消息,6月22日至26日,联合国世界车辆法规协调...
2026-06-26 14:43:26
我国牵头制定!全球首个自动...
中新网6月26日电 据“工信微报”微信公众号26日消息,6月22日...
2026-06-26 11:33:48

热门资讯

全省首个“AI+物业解纷”系统... 6月2日,全省首个 “人工智能+物业解纷”系统在佛山正式上线。该系统集成合同量化服务频次分解、履约双...
收房发现房不存在开发商涉多起纠... 据媒体报道,13年前,沈先生在西安市三桥街道“加贝花园”买了一套房,合同约定房号为“12幢B单元34...
上海金融法院:2024-202... 上证报中国证券网讯(刘禹希 记者 刘礼文)6月3日,上海金融法院发布的《上海金融法院执行工作情况通报...
建新股份:2025年4月17日... 证券之星消息,建新股份(300107)01月21日在投资者关系平台上答复投资者关心的问题。 投资者提...
冰雹来袭损失谁来赔?法官提示三... 近期,多地遭遇强对流天气,冰雹造成的农作物损毁、高空坠物伤人、车辆受损等纠纷时有发生。不少当事人遭受...
镇平县法院:提质增效 推进纠纷... 大象新闻记者 魏广宝 通讯员 魏巍 为进一步规范诉前调解工作,提升矛盾纠纷多元化解质效,近日,镇平...
美盈森:控股子公司金之彩公司涉... 美盈森公告,公司收购的控股子公司深圳市金之彩文化创意有限公司涉及名誉权纠纷案,一审判决后,西藏 新天...
58同城曾涉及多起合同纠纷 雷达财经讯,据媒体报道,近日,沈女士正浏览58同城页面咨询维修报价,平台未经其同意便强行生成了订单,...
法官倾力化纠纷 高效履职护民生 近日,吉林市龙潭区人民法院成功化解一起机动车交通事故责任纠纷,承办法官秉持司法为民初心,以耐心和责任...