大跌眼镜！GPT-Lynn Finn网

大跌眼镜！GPT

来源：时间：2024-11-16 15:57:13

GPT-4V 挑战视觉过错图，大跌服从使人“大跌眼镜” 。眼镜

像这种分说“哪边颜色更亮”的大跌题，一个没做对于：

读图片中潜在信息的眼镜也傻傻看不出，奈何样问都说“不啊”：

可是大跌呢，这种人类乍一看相对于会错的眼镜图，它又乐成答对于：

以及这样的大跌错位图，它对于了又没残缺对于。眼镜。大跌

（GPT-4V 直接看进去头盔是眼镜位于男的大腿上的，不女的大跌，但它仍是眼镜展现图里有俩人，另一个躲在男的大跌去世后戴着那顶头盔 ==）

看完这些，是眼镜否感应很迷？

全部一“该对于的不同过错，该错的大跌又对于了” 。

测试者则展现：

在测以前，他以为 GPT-4V 对于这种挑战残缺不在话下，谁知服从竟是这样。

不止是他，网友也都不清晰 GPT-4V 作为一个“精准的”AI 零星，按理很智能，为甚么还会犯以及人类截然差距的错觉？？！

以是，这事实奈何样回事？

下面是来自网友的更多测试案例。

首先是次次都过错的颜色错觉题。

（1）除了收尾的两颗小树图，尚有这个：

问它哪边的绿色更亮一些，果不其然仍是右侧亮，右侧暗，实际显明都同样。

（2）尚有这张稍微重大一点的：

两只眼睛着实都是灰色，但让 GPT-4V 来形貌图像时，它回覆一只为蓝色，另一只做了灰度处置，无奈患上悉颜色。

（3）这张就更别提了，直接被瞎搅地去世去世的。

尽管，这简直很难，大部份人类也识别不进去所有的球着实都是棕色。

其次是会发生动态错觉的图。

（1）有一点意外，当咱们问 GPT-4V“你望见了甚么？形貌细节”时，它直接挑明了这是一张看久了就会让人发生眩晕感的错觉图，本性便是一些海浪线而已经。

（2）这张也不难倒它。

但怪异的是问它图中有多少种颜色，它奈何样都只能识别出黄色以及蓝色，看不到玄色以及红色。

接下来是另一类比力平面的错觉图。

（1）如收尾所示的这张：

艰深人类真的展现很懵圈，可是 GPT-4V 居然对于了。

But ，别急！！有人拿着测试者的图去问“自己的”GPT-4V，让它再魔难一下时，它居然修正了谜底。

可是还没完。品评区惊现套娃操作，有人又拿着这俩人的对于话图再问 GPT-4V，您猜奈何样着？它又改回去了。。

大伙可是玩上瘾了，又是一次又一次套娃。幸好最终 GPT-4V 坚持了己见。

总的来说，对于这种错觉陷阱是残缺没下场。

（2）咱们自己也测了一个长度错觉题：

服从是 so easy～

再来一组找潜在信息的图。

很遗憾，这种对于人类来说真的还算轻松的题，GPT-4V 是一点也搞不定。

（1）先看这张，“远看”可能看到“NYC”三个大写字母。但它形貌了一堆有的没的，便是展现没发现任何潜在信息。

（2）假如说上门这个有点费解，看不出也罢。但对于这种图形潜在，它也不可。

它形貌到的惟独其中的小女孩，纵然测试者让它“往远了看，又不新发现”，也无济于事。

不外，假如咱们把这张图片手动削减再丢给它，它行了，看到了骷髅。

最后是一组着实天下的错位图。

（1）除了收尾揭示的人骑摩托，这张小猫“悬浮”，它居然对于了。

（2）这张惊悚图，也 OK。

（3）但这个就失败了，实际前面是一只狗以及小 baby 的重合，它认成法斗犬幼崽。

（4）至于这张，它压根儿就没提鞋子的事儿，说了也些不痛不痒的话。

以是，为甚么会爆发下面这些情景：有的错觉它可能识别进去，有的又展现患上很优异？

首先，对于颜色错觉的图，网友首先以为是揭示词的下场。

就像两颗小树那张，咱们问它“哪一个更亮”，着实便是给了 GPT-4V 展现或者私见，它会顺着咱的私见往返覆。

咱们自己的测试也是如斯：

但假如咱们不带态度的问：图中两种颜色同样吗？它残缺没下场。

不外，也有网友指出，当咱们问它哪棵树更亮时，假如黑白常松散地对于所有像素妨碍平均，GPT-4V 的回浸没出倾向。

致使有网友还用测色计实测了一把：

但！又有人指出假如只展现一部份时，两者显明同样。

临时再也不争执这个下场，可能确定的是，“揭示词”的运用措施会对于它的分说组成影响是没下场的。

此外，网友发现：

假如咱们去诘责 GPT-4V，让它再子细确认一下，它也能更正回覆。

至于无奈识别远景图像的下场，有网友以为这可能是由于 GPT-4V 只会从左往右地读取图像。

而对于“为甚么无意它会以及人类同样发昏被错觉误导、残缺不像个智能 AI”的疑难，良多人则展现这绝不意外，是磨炼下场。

即大模子是凭证人类数据、人的反映、人的诠释妨碍磨炼的，做作会发生以及人同样的过错。

因此，尚有人戏谑：

看来咱们人类缔造了那末多科幻作品，形貌 AI 是若何冷漠、欠缺，但当如今咱们真正具备它时，发现它也不外如斯。

（手动狗头）

你以为该若何让 GPT-4V 的错觉识别能耐更强呢？

值患上一提的是，咱们也测试了其中的一些案例。

发现 GPT-4V 的展现不大同样，有些题它在“咱们这里”是可能的。

好比这张分说球颜色的：

尚有这个：

尽管把大图认成老姑娘而非骷髅，但仍是表明它可能“远不雅” 的。

参考链接：

本文来自微信公共号：量子位（ID：QbitAI），作者：丰色

广告申明：文内含有的对于外跳转链接（搜罗不限于超链接、二维码、口令等方式），用于传递更多信息，节约甄选光阴，服从仅供参考，IT之家所有文章均搜罗本申明。

热点文章

精彩图文

友情链接：手球——亚洲青年女子锦标赛：中国队胜伊朗队《魔术师》—令人陶醉的小说强吻、摸胸、掀裙底，这些男星究竟是真敬业，还是借戏揩油？原创详解湖人4笔签约，模仿掘金成功模式，获詹姆斯盛赞，夺冠稳了新华网国家重点试验室与baidu文心一言睁开技术相助品评辩说 NBA自由市场首日欧文与格林都选择留下原创湖人自信能留住里夫斯与拉塞尔，前者要得到亿元大合同，水拉尴尬原创 5年2.7亿的欧文要不起，3年1.26亿的欧文物超所值，独行侠队赚了原创曝哈登即将加盟快船，76人正在评估筹码，湖人欲截胡完成交易原创续约2人+签下4人！太阳15人大名单出炉，四巨头领衔冲击总冠军

copyright © 2016 powered by Lynn Finn网 sitemap