思博网

为什么人类无法真正完全忘记事情，但是机器可以？

来源：思博网发布时间：2016-03-30 点击量：

（本文转载于思博网，如有侵权，请联系删除）

人类越来越倾向于依赖机器作为认识自己的方式。长期以来机械世界都为人体的工作方式提供着类比。

　　「在尝试解释生物学上，我们一直有技术上的类比，」卡内基梅隆大学机器人学家Chris Atkeson 说，「有一种关于大脑如何工作的想法是觉得大脑是液压的。人们描述液压时钟和心脏泵血。然后我们有了蒸汽机作为（我们身体）工作方式的类似。再然后我们有了电。」

　　1948 年，数学家和哲学家诺伯特·维纳出版了他的著作《控制论》，进一步扩大了这个传统；这本书使用计算机-大脑的类比奠定了人们现在思考信息时代的基础。

　　当然，今天计算机已经在解释生命系统中占据了突出的位置。人们常常将大脑描述成计算机一样，就好像我们的记忆是存储在灰质做成的硬盘中一样。仔细审视一下，可以发现这样类比的拙劣程度并不比其之前的比喻性的比较更少。而这样的比喻的局限性是双向的。机器学习是一种通过向计算机展示图像或其它信息的大数据集来训练其识别模式的方法，该方法常被描述是以一定的方式教育计算机大脑「看见」世界。这就意味着：机器与人类都是在过去见过的事物的基础上积累知识。

　　「计算机『看见』的每一样事物都基于它『知道』什么……依赖于你的『看见』是什么含义。」iRobot 的软件工程师 Emily Pittore 在给我的一封电子邮件中写道，「我使用着重引号是因为我对过于随意地将人类认知的语言应用到计算机上有些犹豫。」

　　「如果你说的『看见』是指『光学输入』，那么计算机总是看见相同的事物，」她说。换句话说，机器会忽略轻微的美学亮点和传感器噪声，而「人类有一个远远更复杂的传感器——眼球和大脑。」

　　为什么人类无法真正完全忘记事情？

　　人类的视觉处理也会受到他们已知事物的严重影响——但他们实际看见或感知的可能会相差很大，甚至当输入相同时也一样。这是根据上个月发表在 Journal of Experimental Psychology 期刊上的一篇题为《人类感知和表现》的文章所得出的结论，该研究基于约翰霍普金斯大学研究者的发现。这些研究者进行了一系列实验，以找到对阿拉伯字母的预先知识对不同的人感知阿拉伯字母的方式有怎样程度的影响。

　　研究人员发现，同样的字母在不同的人看来是不同的，这依赖于他们是否能够阅读阿拉伯文。而尽管他们评估的关注点是字母，但研究者表示，这些发现也可适用于任何事物——物体、照片、插图等等。总而言之结论是：你已知晓的东西将会极大影响你看事物的方式。这听起来很直观，对吗？但是这些发现比它们看起来更为微妙。

　　「我们不只是说，『噢，你是专家，所以你看事物不一样』。」约翰霍普金斯大学认知科学研究生、该研究的主要作者 Robert Wiley 说，「微妙的一点是不只是你的显性知识（explicit knowledge）会真正改变你的视觉系统。还有一些意识都无法触及的事物。」

　　这就是为什么人类无法真正完全忘记事情的原因。因为我们首先就不知道怎么就解开所见与如何看见之间的连接。你可能会忘记一个事实或失去你曾拥有的某个技能，但却没有办法探查——也就没有办法刻意改进——其发生的方式，在此过程中暴露给特定的输入已经改变了你的感知。

　　但是机器可以忘记

　　事实上，一些计算机科学家表示为此目的而设计计算机正越来越重要。机器学习系统的部分承诺是计算机将有能力处理海量的数据流，比如类似人脸识别中的海量数据。在这些计算能力的作用下，整个产业都在发生改变。随着通过庞大的网络的敏感数据的激增，人类需要能够告诉计算机什么时候和确切地怎样忘记被称为数据沿袭（数据沿袭，指的是记录有关每个数据块的包执行和数据转换的历史纪录）的海量信息，包括复杂信息、计算记录以及由类脑计算网络衍生出的信息。

　　「这样的忘记网络（forgetting system）必须仔细跟踪数据沿袭，甚至需要跨统计处理或机器学习，并使该沿袭对用户可见，」来自利哈伊大学和哥伦比亚大学的计算机科学教授 Yinzhi Cao 和 Junfeng Yang 写道，「他们让用户使用不用的粒度（granularity）水平指定要遗忘的数据……然后这些系统移除这些数据并还原其所带来的影响，这样今后所有的操作都会像该数据从未存在过一样。」

　　Cao 和 Yang 在 2015 年的一篇论文中阐述了他们对该系统的想法，该论文与2015年发表在IEEE的期刊 Security & Privacy上。他们说，从一个更大的集合中擦除一个单独的数据线程具有很多潜在的效益。一些人可以从一台机器上移除他们的敏感个人数据。学者可以使用忘记（unlearning）来清理或矫正分析数据，从而开发出更为精确的预测算法。

　　这种操作数据的能力可以被看做是它自身的安全威胁——比如说，如果数据被恶意篡改——但 Cao 表示，将有保护措施。比如：「在欧盟，移除与某人相关的的搜索结果之前，谷歌需要请求者的带照片的身份证明的扫描件。」他在一封电子邮件中说，「这只是验证的一种方法，还有其它方法涉及到用户名/密码、双因素认证、指纹等等。」

　　这一想法已经让计算机科学家们感到兴奋了。Cao 和 Yang 接受了美国国家科学基金会 120 万美元的资助以进一步发展这一概念。如果他们取得了成功，并且如果机器忘记真的可以像 Cao 和 Yang 建议的那样，变成了一个至关重要且无处不在的计算功能，那么忘记系统（forgetting system）对人们思考人脑处理功能的方式又意味着什么呢？大概并不会有太多含义，直到新技术出现并提供一个更具说服力的类比。

　　「我们对大脑还有很多不理解，但我们确实知道他们并不神奇。」纽约大学心理学和神经科学教授 Gary Marcus 去年在《纽约时报》上写道，「它们只是物质的异常复杂的排布。飞机可能飞起来并不像鸟，但它们都遵循于同样的力进行升降。同样道理，也没有理由认为大脑可以免受计算定律的约束。」

　　人类-机器的比喻从不完美，但它们可以是有用的，即使计算机可以以人类所不能的方式学习和忘记。「我们想用由这些巨型计算机器提供的概念模型做更多事，」文化人类学家 Margaret Mead 在 1948 年谈论计算机时说道，据 Ronald Kline 的著作《The Cybernetics Moment》，「说人的身体是一台机器没有什么陷阱，而只是这些方法，尤其是数学家在这些机器问题中所使用的方法，可能是可用于更精确思考人类行为的工具。」

作者：ADRIENNE LAFRANCE
编译：微信公众号：机器之心

（查看原文电话咨询：13544847908 QQ咨询：1176391287 ）

思博网

上一篇：超级干货 | 医学专利申请实用教程三部曲

下一篇：说明书附图出现重大失误怎么解决