人工智能:人类对机器的教育

行业趋势 2020年 01月 21日

啊,人工智能!如今,人工智能被视为科技发展与计算机算法的巅峰,但它给予人类美好梦想的同时,也会带来噩梦。自2016年起,人工智能便万众瞩目,而今更是挂在每个人嘴边的热点,可有时候,甚至“人工智能”一词都会被人误用。法国国民议会议员、数学家赛德里克·维拉尼 (Cédric Villani) 在其2018年提交的报告《有意义的人工智能》(For A Meaningful Artificial Intelligence) 中指出,“人工智能的雄心在于理解并复制人类认知”。

“人工智能”一词让人们相信计算机本身便可拥有智能。但果真如此吗?一台机器,即便是最先进的机器,真的能复制人类复杂的大脑吗?

何谓“智能”?

要回答上述问题,首先必须定义“智能”一词。有时,我们认为“智能”仅指“记忆”,这肯定将“智能”的概念简单化了。如果智能只是记忆的话,那么一个装满文件的档案柜也是智能的!在《韦氏词典》中,“智能”的定义为“学习或理解事物的能力;应对新事物或解决困难的能力”。因此,“智能”应指人类能妥善适应或应对环境的品质。

不过,人们随意做出的决定也不算智能,只有那些依照明显的逻辑推理而做出的决策才是智能的。在决策过程中,人们会调动其实际经验或理论经验(即通过个人学习或集体学习获得的外部经验),而记忆便在其中扮演了重要角色。毋庸置疑,计算机肯定拥有记忆。在机器学习的帮助下,计算机同样擅长依照丰富的经验进行决策(欲了解更多机器学习相关内容,可阅读我们的机器学习系列文章)。与它们的人类伙伴一样,通过机器学习,计算机可利用历史数据和数学模型来做出符合具体情况的决策。从这个层面来说,人工智能确实智能,它既掌握大量记忆,又能因此适应环境。

人工智能的高光时刻

首先,我们必须牢记,人工智能的核心——机器学习算法——是人类设计出来完成具体任务的。为了做到这点,人们先向计算机输入大量案例,在这些案例中,每种可能行为都被多次完成。接着,人们再具体设定所有合格条件或限制条件。计算机的任务即找出这些条件、行为和结果之间的联系,最后进行决策。

人工智能就像孩子一样,需要先学习,之后才能独立行动。例如,这篇文章列举了孩子学习区分水果的例子。我们可将这个例子拓展一下:孩子如何学习分辨可食用的水果和不可食用的水果呢?这类知识代代相传,而且每一代人都会以个人经验不断加以补充。

再以 Nextflix 为例,之所以每份 Nextflix 的用户资料都是独一无二的,是由于 Nextflix 平台所采用的算法支持个性化的用户体验,向用户推荐新内容和已观看的内容。虽然人类干预作用重大,但一旦计算机完成算法学习,它们便不再需要人类的干预,而能独立完成任务!因此,人们想将那些对于人类而言耗时复杂的任务自动化。实际上,在许多领域内,计算机的自动决策已随处可见,如休闲娱乐业(AlphaGo、AI 创作的音乐)、自动驾驶汽车、法律系统、医疗系统等。

当然,人工智能的出现并非意味着抛弃人类智力。相反,人工智能往往为人类智力服务,对其起增强补充的作用。在爱沙尼亚,人工智能可用于处理法院积压的小额索赔案件。医生们也能利用人工智能发现病人X光片中的异常现象。这些人工智能的一小步,却是人类的一大飞跃!

人工智能的至暗时刻

虽然人工智能取得了许多令人瞩目的成绩,但也曾遭受一些严重失败。例如,谷歌图片 (Google Photos) 算法将非裔美国人误认作大猩猩的丑闻、微软公司声名狼藉的种族主义聊天机器人(上线24后随即被迫下线)。这究竟是因为计算机不够智能,还是由于冷酷的道德缺失?

实际上,算法模型容易出错,与下列几个因素有关:

  • 数据质量差(如在谷歌图片事件中,用于训练计算机的样本无法代表所有人群)或数据本身存在偏见(若求职者选拔过程历来存在性别歧视,则很难训练出一个没有性别歧视的求职者选拔算法)
  • 遗漏关键主题信息,导致遗忘基本条件;缺乏商业头脑
  • 开发模型时出现错误

种种事例皆表明,人工智能的这些失败源于算法背后的人类,一如法律上父母应为未成年子女负责。即使行业本身存在性别偏见(仅22%的人工智能专业人士为女性),但对性别偏见有所了解之后,人们依然可以逐步完善算法,提高算法的智能程度。为解决道德难题,研究人员正努力将相关道德考量纳入算法。在这方面,研究人员综合利用历史数据和更细化的数据类别(如:人脸识别算法分为男性/女性组别),在全球范围内衡量算法表现。只有当算法能保证在所有数据类别中均表现出同样的精准度时,该算法才会被认为是相关算法。

“人工智能可以不带任何偏见”只是一种虚妄的幻想。它是某种存在状态的产物。人类创造了人工智能,因此它从诞生之初便浸淫于一种文化之中,即它的创造者的文化。

AI 女性计划 (Women in AI合作创始人卡洛琳•莱尔 (Caroline Lair)

“人工教育”比“人工智能”更恰当

若没有人类的干预,计算机对数据的归纳概括能力和偏见管理能力将存在局限:或存在于初始数据中,或源于算法开发过程中人类的影响。同理,单独的个人也无法从他人经验或汇集的观点中获益,并且也无法归纳概括他们所拥有的知识或合理化个人决策。

此外,人工智能也受到法律约束,不过这将促使人工智能朝更好的方向发展。例如,欧洲的《通用数据保护条例》通过限制 cookie 有效期、要求征得用户的明确同意等措施来限制算法能收集和处理的信息类别。这些举措将直接影响算法记忆,进而影响人工智能。

如今,数据收集(线上收集或线下收集)受到严格监管。无需用户同意、不受限制地存储信息的时代已经一去不复返了。若无法保存数据,人工智能将永远无法掌握信息。它不像实体店的销售员,可以随着时间推移逐渐累积个人经验和客户知识。

归根结底,人类干预和知识共享造就了计算机智能。因此,我们可以说,其实人工智能根本不存在,人机之间的互动只是从人到机器的单向交流。人工智能尚处于襁褓之中,还远未达到具备任何道德良知的程度。对人工智能更准确的称谓应当是“人工教育”,因为这只是人类对机器的教育,而机器对人类的教育尚未实现。

还想再来一杯茶吗?