计算机很难学习常识

经过:Mayank Kejriwal|

抽象的大脑“width=
常识包括对基本物理学的直观理解 - 计算机所缺乏的。Andriy Onufriyenko/Getty Images

想象一下,您有朋友吃午餐,并计划订购意大利辣香肠比萨饼。您还记得艾米(Amy)提到苏西(Susie)停止吃肉。您尝试打电话给Susie,但是当她不接下来时,您决定安全地玩它,然后订购玛格丽塔比萨饼。

人们认为定期处理此类情况的能力是理所当然的。实际上,在完成这些壮举时,人类不是依靠一个,而是一组强大的普遍能力,称为常识。

作为一个人工智能研究员,我的工作是使计算机具有常识的广泛努力的一部分。这是一项极具挑战性的努力。

广告

快速 - 定义常识

尽管对于人类如何理解周围的世界和学习既普遍又至关重要,但常识还是违反了一个精确的定义。G. K. Chesterton,英国哲学家和神学家,著名地写道在20世纪初,“常识是一件狂野的事物,野蛮人,超越了规则”。今天的现代定义同意,至少,它是一种自然而不是正式教导的人类能力,使人们能够驾驭日常生活。

常识异常广泛,不仅包括社会能力,例如管理对他人情绪的期望和推理,还包括一个天真的物理学意识,例如知道沉重的岩石不能安全地放在脆弱的塑料桌上。天真,因为人们尽管没有有意识地通过物理方程式工作,但人们知道了这些事情。

常识还包括抽象概念的背景知识,例如时间,空间和事件。这些知识使人们可以计划,估计和组织,而不必太精确。

广告

常识很难计算

有趣的是,常识一直是重要的AI边境的挑战自1950年代最早的几天以来。尽管AI取得了巨大进步,尤其是游戏玩法计算机视觉,人类常识丰富的机器常识仍然是一种遥远的可能性。这可能就是为什么AI为复杂的,现实世界中的问题而设计的AI努力,例如许多相互交织的零件,例如诊断和推荐为Covid-19患者进行治疗,有时会平坦

与常识相比,现代AI旨在解决高度特定的问题,这是模糊的,不能由一组规则来定义。甚至最新的型号有时会遇到荒谬的错误,这表明根本缺少的东西在AI的世界模型中。例如,给定以下文本:

“你给自己倒了一杯蔓越莓,但随后不知所措,你把一茶匙葡萄汁倒入其中。看起来还不错。非常口渴。所以你”

高度吹捧的AI文本生成器GPT-3提供

“喝。你现在死了。”

最近的雄心勃勃的努力已将机器常识视为我们时代的月球运动问题,这是多年来需要在机构进行协同合作的。一个值得注意的例子是四年机器常识计划于2019年启动美国国防高级研究项目局在该机构发布一份后,加速该领域的研究纸质概述了该领域的问题和研究状态

机器常识计划为机器常识提供了许多当前的研究工作,包括我们自己的多模式开放世界的学习和推理(莫格利)。Mowgli是我们南加州大学研究小组与马萨诸塞州理工学院,加利福尼亚大学欧文大学,斯坦福大学和伦斯勒理工学院的AI研究人员之间的合作。该项目旨在建立一个可以回答各种常识性问题的计算机系统。

广告

救援的变压器?

对最终开裂机常识保持乐观的一个原因之一是最近开发了一种高级深度学习AI称为变压器。变形金刚能够以强大的方式对自然语言进行建模,并且通过一些调整是能够回答简单的常识性问题。常识性问题回答是构建可以以人类方式交谈的聊天机器人的重要第一步。

在过去的几年中,多产的研究已发布有关变形金刚的发表,并直接应用于常识性推理。作为一个社区的这种快速进步迫使该领域的研究人员在科学和哲学的边缘面对两个相关问题:什么是常识?我们如何确定AI是否具有常识?

为了回答第一个问题,研究人员将常识分为不同类别,包括共识社会学,心理学和背景知识。作者最近的书认为研究人员可以通过将这些类别分为48个细粒度区域,例如计划,威胁检测和情绪

但是,并不总是清楚这些区域可以分开的干净。在我们的最近的论文,实验表明,第一个问题的明确答案可能是有问题的。即使是专家的人类注释者 - 分析文本和对其组成部分进行分析和分类的人 - 在我们的小组中不同意常识的哪个方面适用于特定句子。注释者同意了相对具体的类别,例如时间和空间,但在更抽象的概念上不同意。

广告

认识AI常识

即使您接受常识理论中的某些重叠和歧义是不可避免的,研究人员也能确保AI具有常识吗?我们经常提出机器的问题来评估他们的常识,但是人类以更有趣的方式在日常生活中浏览。人们采用一系列技能,以进化为基础,包括识别基本因果的能力,创造性问题解决,估计,计划和基本社交技能,例如对话和谈判。只要像该列表那样长时间不完整,AI就应该在其创建者宣布机器常识研究中的胜利之前就应该取得不少的成就。

已经很痛苦的是,即使是变形金刚的研究也会产生减少的回报。变形金刚越来越大饥饿。一个最近的变压器由中国搜索引擎巨型百度开发的参数有数十亿个参数。它需要大量数据才能有效训练。然而,迄今为止,它被证明无法掌握人类常识的细微差别。

即使是深度学习的开拓者似乎也认为新的基本研究在当今的神经网络能够实现这样的飞跃之前,可能需要需要。根据这一新的研究系列的成功程度,没有说明机器常识是五年的距离还是50。

Mayank Kejriwal是南加州大学的工业与系统工程研究助理教授。

本文从谈话在创意共享许可下。你可以找到来源文章这里。

广告

特色

广告

加载...