1.2.2 人工智能的沉浮起落

人工智能是如何由边缘走向中心的?

早期的人工智能研究聚焦于机器的记忆和逻辑推理,机器在这方面很早就表现出比人类更强的能力。在第二次世界大战中,交战方都使用了飞机和火炮,要想打得准,必须精确计算以确定炮口的方位和角度,才能保证射出去的炮弹命中目标。1946年初,在美国国防部的支持下,宾夕法尼亚大学研究出世界上第一台计算机ENIAC(如图1-3所示)。当时美国正在研究原子弹——就是当年绝密而后来轰动世界的“曼哈顿计划”——原来计划用这台计算机来精确计算原子弹爆炸的高度和波及范围,以便更好地发挥原子弹的威力,但是当这台计算机研发成功时,第二次世界大战已经结束了好几个月,它失去了用武之地。这台计算机占地150平方米,总重30吨,使用了18 000只电子管、6000个开关、7000只电阻、10 000只电容器,耗电量140千瓦,每秒可以进行5000次加法运算,比人类最快的计算速度快了1000倍以上。

图1-3 世界上第一台计算机ENIAC

在计算机发明之前,有三位杰出科学家对计算机理论做出了突出贡献。

第一位是约翰·冯·诺依曼,他创立了早期计算机的系统结构,就是把程序指令存储器和数据存储器合并到一起的计算机架构,即冯·诺依曼架构。冯·诺依曼也参加了“曼哈顿计划”,他的任务就是精确计算原子弹爆炸的高度,以便美国空军做好相应准备。

第二位是图灵,他是英国数学家和密码学家。第二次世界大战期间,他为英军培训了许多密码破译人才,为破译德军密码设计了多种方法,其中最为人称道的是他发明了破译机,用它破译德军密码又快又准,为盟军最终打败德军立下了汗马功劳。图灵对计算机“思考”问题非常热衷,设计了“图灵测试”,也就是让一台计算机和一个人分别回答测试人员的提问,采用盲测方式,最终由测试人员根据回答判定哪个是计算机、哪个是人类,以此探究机器是否能模拟出与人类相似或令人无法区分的智能。其实图灵关心的是如何让机器代替人类完成一些工作,只要能够做到这一点,就说明机器是具有智能功能的,机器还是要靠人类为它编制的程序去完成任务的。

第三位是克劳德·艾尔伍德·香农,他是一位美国数学家,也是信息论的创立者。图灵和冯·诺依曼分别在41岁和53岁去世,香农则继续探索,推动人工智能成为专门的学科。20世纪90年代,他开创的信息论在世界各地被应用于计算机领域并获得快速发展。不幸的是,他本人晚年患上了阿尔茨海默病,世界上最聪明的人之一却饱受精神疾病的折磨。

人工智能在发展的早期,主要用于处理一些遵循明确规则的事务,这与人类的逻辑思考方式相似。人们通过编制计算机能够识别的程序来让其工作,例如计算、下棋等。随着运算速度的提升,计算机在计算方面的能力远远超过了人类。但是,鉴于人类大量处理的是没有固定规则的事务,根据这类处理的需要,人类发明了神经网络(或称神经元)计算。

杰弗里·辛顿是一位谦逊的英国计算机科学家,是现代神经网络计算最重要的开创者之一。他通过模仿人类在形象思维时神经元之间的联系,发明了利用大数据计算分析得出结论的方法。计算机将存储在计算机内不同位置的数据联系起来进行协同处理,与人类的神经元处理信息很相似,所以这被称为神经网络计算。

传统人工智能的局限在于计算机只能按照一系列基本规则运行。杰弗里·辛顿和另一位研究人员发明了“反向传播”算法,这后来在神经网络中广泛使用。它使得神经网络通过调整连接权重来学习,从而实现自学习、自组织,当计算机输出的结果与正确的结果相同时,计算机就会记住赋予的权重,形成“记忆”,永远不会错了。如果输出的结果与正确的结果不符,神经网络就会设置一个错误信号,然后将其返回输入端,流程会更改原先设定的权重,这时再次检测输出端结果,循环往复,直到结果正确为止。

一般而言,计算机所拥有的神经元越多,它能够处理的信息就越复杂,更大的神经网络通常能够更优地得到正确的结果。举例来说,如果要让计算机识别一幅图像上的宠物是猫还是狗,那么就该想想人类大脑是如何识别这两种动物的:显然,我们并不是依据动物的定义进行识别的,而是依据模糊的经验进行判断,从而得出结论的。事实上,我们也没有完全搞明白这样的识别机制。一个计算机神经网络的前几层会对图像进行抽样,选取图像重要的特征,删除背景等非关键内容,分析特定内容,只要神经网络参数足够多,计算机得出的结论就会更大概率地接近真实结论。这就是人工智能大模型参数的意义,“大力出奇迹”。

随着计算机运算能力的快速提高,人们可以对运算进行分层处理,人类只需要训练第一层特征,之后的训练都由计算机自己完成。每次得出的结论是对还是错,计算机可以通过与在互联网上找到的猫的图像进行比对,如果不符合猫的特征,计算机会将结果反馈到上层神经网络,通过调整权重重新计算,直到得出正确的结果。对于各种各样的类似猫而不是猫的动物,比如老虎,计算机可以一层一层地分析,确定该动物不是猫而是老虎,进而分清它是哪种类型的老虎。

在整个分析过程中,深度学习网络能够识别出许多特征,其中一些可能与当前的任务无关,而另一些则高度相关,机器会记住这些高度相关的特征,以便在未来遇到相似图像时能快速识别。除了上述的图像识别,语音识别技术也已经成熟并大量应用于日常生活中。识别不同语言并充当翻译对计算机来说实在“易如反掌”,只需一本字典加上语法规则就足够了。计算机最难识别的是人名和小地方的地名,因为它们大多没有命名规律。

人工智能的发展并非一帆风顺,而是经历了沉浮起落。

1956年,达特茅斯会议第一次提出“人工智能”这个概念。这次会议中,众多学科中最杰出的10位科学家在新英格兰地区汉诺威市的达特茅斯学院齐聚一堂,其中有香农、约翰·麦卡锡和马文·明斯基,他们在最后的会议文件中定义了人工智能:“人们将在一个假设的基础上,继续进行有关人工智能的研究,那就是学习的各个方面,或智能的各种特性,都能够实现精确描述,以便我们能够制造机器来模仿学习的这些方面和特性。人们将尝试使机器读懂语言,创建抽象概念,解决目前人们的各种问题,并且能自我完善。”

20世纪60年代形成了人工智能的第一次热潮。这一时期的发展以符号逻辑为主要特征,用某种符号逻辑来表示已有的知识和要解决的问题。几何定理证明程序、国际象棋程序、跳棋程序、规划系统等一批有影响力的成果陆续产生,感知机器模型出现,而神经网络受到很多研究者的关注。1958年,人工智能的创始人之一赫伯特·西蒙曾乐观预测10年内计算机将打败国际象棋世界冠军,不过这一预言并没有如期实现,直到约40年之后,IBM的“深蓝”国际象棋计算机才最终完成这一壮举。事实证明,人工智能发展的难度远远超出当时科学家的预测。很快,人工智能的第一次热潮退去,进入了10年左右的低谷期。

人工智能第二次热潮的标志性事件是在1982年,日本启动了雄心勃勃的第五代计算机工程,准备在10年内建立可高效运行的Prolog智能计算系统。20世纪80年代中期,神经网络计算也迎来了一次革命。反向传播学习算法的提出,使得神经网络成为研究重点,这是与符号逻辑并驾齐驱的一种连接方法。20世纪80年代末,人工智能开始结合数学理论,形成更实际的应用。但是随着1991年日本第五代计算机工程宣告失败,人工智能的发展又进入了长达20年的第二个漫漫寒冬。

2006年,杰弗里·辛顿和鲁斯兰·萨拉赫丁诺夫在《科学》杂志上首次提出了多层神经网络系统的概念,即通过多层神经网络,机器可以更多地代替人来标定答案对错,借助无监督的逐层初始化方法,可以解决神经网络训练困难的问题。正是这篇论文,将深度学习导入人工智能系统,开启了人工智能第三次热潮。图1-4示出了深度学习相比传统算法的突破。深度学习神经网络使得计算机的识别率越来越高,在语音识别、图像识别、机器翻译等方面的应用越来越广泛。2016年,基于深度学习的人工智能围棋程序战胜了围棋高手李世石,进一步掀起了人工智能发展的热潮。

图1-4 深度学习相比传统算法的突破

我们经常在媒体上、在文艺作品里知悉有关人工智能的五花八门的表述,如人工智能、机器学习、神经网络、深度学习等,很容易混淆。按照我国人工智能专家陈云霁等人所著《智能计算系统》中的定义,人工智能是一个很大的范畴,包括机器学习、计算机视觉、符号逻辑等不同的分支。其中,机器学习分支又有许多子分支,如神经网络、贝叶斯网络、决策树、线性回归等。目前,主流的机器学习方法是神经网络计算,而神经网络计算中先进的技术是深度学习。

现在国际上正在研究新一代人工智能的发展方向。究竟什么是新一代人工智能,还没有形成统一认识。比较一致的看法是,新一代人工智能是基于神经网络的智能计算系统。具体来说,每个神经元都可以从外界输入数据,科学家为每个神经元赋予一个权重,计算机对所有的神经元进行加权计算之后,通过一个非线性函数得到该神经元的输出。几十年来,通过感知机模型、反向传播训练方法、卷积神经网络、深度学习等方法,人工智能研究不断深入,应用越来越广泛。从图1-5中可以看到70多年来人工智能研究历程中的一些重要里程碑事件。

图1-5 人工智能研究的重要里程碑事件

按照陈云霁的观点,新一代人工智能将不再单纯追求智能算法的加速,而是通过近乎无限的计算能力,给人类带来前所未有的机器智能。这里的核心问题在于如何通过高计算能力提升智能。如果只是把一个深度学习模型做大、做复杂,那么高计算能力也仅能将某些模式的识别精度再提高几个百分点,难以触及智能的本质。因此他设想,未来的新一代智能计算系统将是一个通用人工智能发育的沙盒虚拟世界,通过近乎无限的计算能力来模拟一个逼近现实的虚拟世界,在虚拟世界中,人工智能发育、成长、繁衍出海量的智能主体(或者说人工生命),智能主体可以在虚拟世界中成长,通过和外界环境的交互,逐渐形成自己的感知、认知和逻辑能力,甚至理解虚拟世界、改造虚拟世界。这就是通用人工智能追求的最终目标,实现这个目标可能需要三五十年甚至三五百年,但是为了人类的进步,仍然值得朝这个目标努力。