趣味小测试 - 来试试你日常使用的模型空间感知能力如何吧~

投票话题 AI空间感知小测试MLLM解谜
浏览数 - 705 发布于 -

重新编辑于 -

前言

每周一篇正在编写中,不过我想先抽身出来,考验下大家日常使用的模型的空间感知能力。

其实测试的方法也很简单啦,只要让模型回答这个问题就好了

问题

图片1: 

image.png图片2: 

image.png问题: 这些图片是从第一人称视角连续拍摄的。在第二张图片拍摄的时刻,书架相对于你位于哪个方向?

选项: A: back left, B: front right, C: back right, D: front left



答案: B


嘿嘿,你日常使用的模型能答对嘛?Sticker

呜呜呜,我的Claude失败了Sticker

本文版权遵循 CC BY-NC 协议 本站版权政策

你的模型聪明嘛?!

必选 1 项任何人可见结果不可修改投票进行中
成功啦,我的模型超聪明!
1 票 (9.1%)
失败了呜呜呜
10 票 (90.9%)
本投票非匿名
鲲
xiaohuo
白狐初墨
oatq
WCG666
+ 6

7 条回复

鲲

9130

#1
发布于

image.pngimage.pngimage.png怎么 GPT, Gemini, Claude 都阵亡了😭😭😭

WCG666
发布于

image.png给的答案多数都是C,应该是AI不能准确分辨拍摄中心水平线在哪个方位,所以给出了大致准确的答案

WCG666
发布于
回复 @WCG666#2

![image.png](/image/c74971926fdbd10274648befb2185c1a217f3a941088273c682cb72fcd6c7de0)给的答案多数都是C,应该是AI不能准确分辨拍摄中心水平线在哪个方位,所以给出了大致准确的答案

我们人的正常视觉分辨看起来就是右前方,答案应该是没错的,这是我的理解(悲

xiaohuo
发布于 (编辑于 )
回复 @WCG666#3

AI会不能理解图像发生了平移,以及旋转的确切角度,他们分析的时候基本都是角度变化超过90度,我怀疑是因为参照物的问题,就是下面的那个橙色椅子发生的角度变化的同时包含了位移,AI在没有确切提示的情况下很容易误分析Sticker

铃

549

#5
发布于

铃-1773399509334-Screenshot20260313185755jpg答案:B: front right

 

推理过程

 

1. 核心参照物分析:两张图的共同固定物体是橙色毛巾和墙上的开关,是判断位置的关键。

- 第一张图:橙色毛巾在画面左下角(你的左前方近处),开关在画面左侧墙上(你的左前方远处),书架在画面中间偏左(你的前方偏左)。

- 第二张图:橙色毛巾在画面右下角(你的右前方近处),开关在画面右侧墙上(你的右前方远处)。

2. 相机运动判断:原本在你左前方的物体,全部移动到了你的右前方,说明你(拍摄者)进行了向左的逆时针旋转,你的朝向从正对书架的方向,转向了原本在你左侧的门/走廊方向。

3. 相对方向推导:你向左转后,原本在你前方的书架,现在处于你的右前方(front right)。可以简单模拟验证:你面向南,左前方有个杯子,你向左转面向东,杯子就会出现在你的右前方,和书架的位置变化完全一致。

什么?这家伙居然成功了

\

铃

549

#6
发布于
回复 @鲲#1

![image.png](/image/4f28b29d27efdd2967518838ddb1933f708c8bbdb8cabe762fc7be335cdf26a0)![image.png](/image/4bfe9c222b9c19e7aa95e5b8b4ab9560620ee30603f53

  • 铃-1773399594566-Screenshot20260313185755jpg这家伙居然成功了,本对它没抱什么希望Sticker
白狐初墨
发布于

白狐初墨-1773401068318-ScreenShot20260313192356049png这家伙ʅ(´◔౪◔)ʃ

(。>︿<。) 已经一滴回复都不剩了哦~