人工智能空想性视错觉：机器能在无生命物体上识别人脸吗？_综合

　　 AI pareidolia: Can machines spot faces in inanimate objects? | MIT News

　　1994年，佛罗里达州的珠宝设计师戴安娜·达伊瑟(Diana Duyser)在一个烤奶酪三明治中发现了她认为是圣母玛利亚的形象，她保存了这个三明治，后来以2.8万美元的价格拍卖。但是我们对空想性视错觉，即在物体不存在的情况下看到物体的面孔和图案的现象，到底了解多少呢?

　　麻省理工学院计算机科学与人工智能实验室(CSAIL)的一项新研究深入研究了这一现象，引入了一个广泛的、人类标记的5000张空想图像数据集，远远超过了以前的收藏。利用这个数据集，研究小组发现了几个令人惊讶的结果，这些结果是关于人类和机器感知之间的差异，以及在一片吐司中看到人脸的能力如何挽救了你远房亲戚的生命。

　　该研究发表在arXiv预印本服务器上。

　　麻省理工学院电子工程和计算机科学博士生、CSAIL附属机构、这项工作的首席研究员马克·汉密尔顿(Mark Hamilton)说:“长期以来，面孔幻想性视错觉一直吸引着心理学家，但在计算机视觉界，它在很大程度上尚未得到探索。”“我们希望创造一种资源，可以帮助我们了解人类和人工智能系统如何处理这些虚幻的面孔。”

　　那么这些假脸揭示了什么呢?首先，人工智能模型似乎不能像我们一样识别出不切实际的面孔。令人惊讶的是，研究小组发现，直到他们训练算法来识别动物面孔，它们才在检测空想面孔方面变得明显更好。这一意想不到的联系暗示了人类识别动物面孔的能力(对生存至关重要)与我们在无生命物体上看到面孔的倾向之间可能存在进化联系。

　　汉密尔顿说:“这样的结果似乎表明，幻想性视错觉可能不是来自人类的社会行为，而是来自更深层次的东西:比如快速发现潜伏的老虎，或者识别鹿的方向，这样我们的原始祖先就可以捕猎了。”

　　另一个有趣的发现是研究人员称之为“幻想性视错觉的金发姑娘区”，这是一类最容易发生幻想性视错觉的图像。

　　麻省理工学院电子工程和计算机科学教授、该项目的首席研究员威廉·t·弗里曼(William T. Freeman)说:“在一个特定的视觉复杂性范围内，人类和机器都最有可能在非人脸物体中感知人脸。”“太简单了，没有足够的细节来构成一张脸。太复杂的话，它就会变成视觉噪音。”

　　为了揭示这一点，该团队开发了一个方程，模拟了人类和算法如何检测虚幻的面孔。在分析这个方程时，他们发现了一个明显的“空想峰值”，在那里看到面孔的可能性最高，对应于具有“恰到好处”复杂性的图像。这个预测的“金发姑娘区”随后在真实的人类受试者和人工智能面部检测系统的测试中得到了验证。

　　这个名为“事物中的面孔”的新数据集让之前通常只使用20-30个刺激的研究相形见绌。这个尺度允许研究人员探索最先进的面部检测算法在对空想面孔进行微调后的表现，表明这些算法不仅可以被编辑来检测这些面孔，而且它们还可以作为我们自己大脑的硅替身，允许团队提出和回答关于空想面孔检测起源的问题，这些问题在人类身上是不可能提出的。

　　为了建立这个数据集，该团队从LAION-5B数据集中挑选了大约20,000张候选图像，然后由人类注释者精心标记和判断。这个过程包括在感知到的面孔周围画出边界框，并回答关于每张面孔的详细问题，比如感知到的情绪、年龄，以及这张脸是偶然的还是故意的。

　　“收集和注释成千上万的图像是一项艰巨的任务，”汉密尔顿说。“这个数据集的存在很大程度上要归功于我的母亲，”一位退休的银行家，“她花了无数个小时亲切地给图像贴上标签，供我们分析。”

　　这项研究也有潜在的应用，可以通过减少误报来改进人脸检测系统，这可能对自动驾驶汽车、人机交互和机器人等领域产生影响。数据集和模型还可以帮助产品设计等领域，在这些领域，理解和控制幻想性视错觉可以创造出更好的产品。

　　“想象一下，能够自动调整汽车或儿童玩具的设计，使其看起来更友好，或者确保医疗设备不会无意中出现威胁，”汉密尔顿说。

　　“人类本能地解读具有人类特征的无生命物体的方式令人着迷。例如，当你瞥一眼电源插座时，你可能会立即想象它在唱歌，你甚至可以想象它会如何“动嘴唇”。然而，算法并不能像我们一样自然地识别这些卡通面孔，”汉密尔顿说。

　　“这就提出了一个有趣的问题:是什么解释了人类感知和算法解释之间的差异?”空想性视错觉是有益的还是有害的?为什么算法不会像我们一样经历这种效应呢?这些问题引发了我们的调查，因为这种经典的人类心理现象还没有在算法中得到彻底的探索。”

　　当研究人员准备与科学界分享他们的数据集时，他们已经在展望未来了。未来的工作可能涉及训练视觉语言模型来理解和描述空想的面孔，这可能会导致人工智能系统以更像人类的方式参与视觉刺激。

　　“这是一份令人愉快的报纸!”它读起来很有趣，它让我思考。汉密尔顿等人提出了一个诱人的问题:为什么我们能在事物中看到面孔?”加州理工学院艾伦·e·帕克特电气工程教授彼得罗·佩罗纳(Pietro Perona)说，他没有参与这项工作。

　　正如他们指出的那样，从例子中学习，包括动物的脸，只能解释这一现象的一半。我敢打赌，思考这个问题将教会我们一些重要的东西，让我们了解我们的视觉系统是如何在生活中接受的训练之外进行概括的。”

　　汉密尔顿和弗里曼的合著者包括丰田研究所(Toyota research Institute)的研究员西蒙·斯坦特(Simon Stent);Ruth Rosenholtz，脑与认知科学系首席研究科学家，NVIDIA研究科学家，前CSAIL成员;和CSAIL成员博士后Vasha DuTell, Anne Harrington, MEng '23和研究科学家Jennifer Corbett。

　　这项工作将于本周在欧洲计算机视觉会议上发表。

　　更多信息:Mark Hamilton等人，在事物中看到面孔:空想性视错觉的模型和数据集，arXiv(2024)。DOI: 10.48550/ arXiv .2409.16143期刊信息:由麻省理工学院提供

　　本文由麻省理工学院新闻(web.mit.edu/newsoffice/)转载，这是一个报道麻省理工学院研究、创新和教学新闻的热门网站。

　　引用人工智能空想性视错觉:机器能识别无生命物体的面孔吗?(2024年9月30日)检索自https://techxplore.com/news/2024-09-ai-pareidolia-machines-inanimate.html本文档

　　作品受版权保护。除为私人学习或研究目的而进行的任何公平交易外，未经书面许可，不得转载任何部分。的有限公司

　　内容仅供参考之用。

打卡网声明：未经许可，不得转载。