2025-11-14 21:01来源:本站

当露娜七个月大的时候,在她的科学家父亲的要求下,她开始戴上一顶亮粉色的头盔,头盔上有一个摄像头,每次大约一个小时,它会捕捉她所看到、听到和说的一切。
她的父亲布伦登·莱克(Brenden Lake)是纽约大学(New York University)的认知科学家,他在那里研究训练人工智能的更好方法。在家里,他训练人类智能,我的意思是他是一个父亲。最近一个周日的早上,他举起一个机器人木偶,问正在拿出木制玩具的露娜:“那是给机器人用的吗?”“哦,天哪!”他用一种愚蠢的布偶声音补充道。卢娜似乎不太感兴趣——小孩子总是活在自己的星球上——但几分钟后,她回来捡起了木偶。“机器人,”她说。“机器人。”她重复了一遍,打消了人们对她意图的怀疑。她爸爸惊讶地转向我;他以前从没听她说过“机器人”。她刚才学会这个词了吗?
一岁半的Luna已经掌握了一项目前人工智能模型仍难以掌握的技术。人类能够从很少的例子中学习,这意味着即使是一次接触也可以巩固银手木偶和组成机器人的音素之间的联系。相比之下,人工智能可能需要几十个或几百个例子;像ChatGPT这样的大型语言模型是在数千亿甚至数万亿的单词上训练的,这是一个非人的数据量。莱克告诉我:“要听到这么大规模的字数统计,需要1000年的时间。”考虑到人类需要更少的时间和更少的单词来掌握语言,人工智能能被更有效地训练吗?它能像一个蹒跚学步的孩子那样学习吗?
这些问题是雷克最初记录女儿早年生活的动机。(他用一种更感性的方式说服了他的妻子:他们可以捕捉和回放露娜在婴儿时期的里程碑。)和其他25个左右的婴儿一起,露娜是BabyView研究的一部分,这是斯坦福大学开展的一个项目,旨在准确捕捉幼儿在以惊人的速度学习语言的关键时期所看到和听到的东西。Lake希望有一天能将来自Luna和其他机器人的数据输入到他自己的模型中,以找到更好的训练人工智能的方法,并找到更好的方法来理解孩子们是如何完成无处不在却又非凡的语言学习壮举的。

摄影机头盔的使用(王惠健)
最近的技术飞跃——在人工智能和硬件方面——为科学家研究发展心理学提供了新的工具。相机和麦克风现在足够小,足够轻,婴儿可以长时间佩戴,包括在家里。2010年初,斯坦福大学(Stanford)的发展心理学家迈克尔·弗兰克(Michael Frank)和两位同事决定在他们自己的婴儿身上安装头部摄像头。弗兰克现在是BabyView研究的负责人。他们会追踪孩子的发育,从6个月大开始,那时婴儿有足够的脖子力量,不会被相机打扰,到2岁半左右,蹒跚学步的孩子真正开始抗议。然而,弗兰克的孩子从一开始就不同意;她非常讨厌头上戴任何东西。“我没有勇气”继续下去,他告诉我,他的女儿也退学了。但从另外两个婴儿以及后来的第三个婴儿收集的数据于2021年作为一个名为SAYCam的研究数据集发布。
不久之后,Frank决定将BabyView做得更大、更有野心,这款游戏有着同样的理念,但会有更多的婴儿、更清晰的音频和更高分辨率的视频。这些结果数据将在网上共享,但为了保护婴儿的隐私,只有机构研究人员可以访问,参与者可以选择在共享视频之前删除视频。
雷克决定给女儿报名babyview——幸运的是,露娜还能忍受头部摄像头——因为他立刻对使用SAYCam语料库来训练人工智能产生了兴趣。在基本层面上,它能起作用吗?去年冬天,他在纽约大学的团队在《科学》杂志上发表了一篇广为宣传的论文,该论文表明,即使是经过61小时低分辨率视频训练的人工智能模型,也可以对显示球、猫和汽车等物体的图像进行分类,这些视频只占SAYCam婴儿清醒时间的1%。他的实验室的一系列其他研究发现,在SAYCam上训练的人工智能模型可以形成自己的类别,比如“食物”、“车辆”和“衣服”,或者与名词或动词对应的单词簇——就像你可能期望一个蹒跚学步的孩子在了解世界时所做的那样。
需要明确的是,莱克和他的同事们并没有声称在计算机上复制了幼儿的实际学习方式。毕竟,这些模型是在视频和文本片段上进行训练的——对现实世界丰富感官体验的拙劣模仿。但这些研究最有趣的是对概念的证明。例如,在语言习得领域,专家们长期以来一直在争论,婴儿在多大程度上天生就具有学习语言的知识、策略和偏见。在一个极端的情况下,人们可以假设婴儿出生时是一张白纸。AI模型一开始确实是一张白纸;如果仅仅用一小部分婴儿的视听经验来训练它们,就能让它们对球和猫进行分类,那就说明了神经网络是如何“从零开始”学习的,纽约大学莱克学院的研究科学家、论文的第一作者王伟(Wai Keen Vong)说。然而,以成年人的标准来看,这个模型可能并不那么令人印象深刻;它的整体准确率略高于60%。也许它需要更多的数据,也许它需要一种不同的学习方式。
这就是事情变得有趣的地方。雷克希望给人工智能配备一些婴儿在实验室实验中似乎表现出来的策略。例如,当孩子们看到一个新词——比如“水壶”——他们似乎本能地知道“水壶”指的是水壶的整体,而不仅仅是它的把手、材料或颜色。当他们看到两个物体——一个熟悉的和一个不熟悉的——他们会认为他们听到的新词指的是这个新物体。这些策略可能会帮助婴儿在杂乱、混乱的日常生活中筛选,它们也可能帮助人工智能更像孩子一样学习,尽管人工智能离真正模仿孩子还差得很远。
也就是说,人工智能模型也可以激发关于儿童如何学习的新想法。奥斯汀大学(University of Austin)的发展心理学家陈宇(Chen Yu)向我讲述了他与合作者进行的一项研究。在这项研究中,父母和孩子在实验室里玩玩具时都戴着头戴式摄像头。奇怪的是,Yu和他的合作者注意到,在孩子的POV上训练的计算机视觉模型比在父母的POV上训练的模型表现得更好。孩子的观点对学习更有帮助吗?他们想知道孩子们是否更彻底地操纵玩具,前后转动玩具以从不同的角度看物体。Yu说,通过这些支持人工智能的方法,可以产生新的假设,然后可以在实验室进行测试。琳达·史密斯(Linda Smith)是于的经常合作者,也是印第安纳大学(Indiana University)儿童认知发展的长期研究员。她告诉我,几十年前她刚开始研究时,“人工智能和人类认知是一个领域。”都是同样的人。”这两个领域可能已经分道扬镳,但重叠仍然是完全合理的。
在他的学术生涯中,莱克曾教过一个人工智能模型如何书写,他也一直在寻找创造一个更像人类学习的人工智能的方法。这自然使他想到了儿童的学习方式。“在已知的宇宙中,孩子是最令人印象深刻的学习者,”他告诉我。在有了自己的孩子之后,他认为为人父母可能会给他的研究带来新的见解。有吗?我好奇地问,因为我家里也有一个1岁的孩子,他的智力进步可能是我所见过的最了不起的事情。不完全是,他承认。看着孩子们学习是如此迷人,如此令人惊讶,如此有趣。但这个过程也是如此直观——如果任何家长都能这么容易地理解他们的孩子是如何学习的,我们不是早就明白了吗?