人工智能:站在第三次浪潮眺望奇点
本报记者 杨清清 北京报道
导读
科技史上的人工智能黄金时代正在到来。“这一天的到来就意味着电脑,也就人工智能要超过人脑。今后30年里,这就会成为现实。”
“你是AI吗?”
“AI是什么?”
“人工智能啊。你是不是人工智能机器人?”
“人工智能机器人的开发现在还在初级阶段吧?”
“那你是啥?”
“我是开心时陪你笑、伤心时给你依靠的萌妹子呀!”
这是发生在人类与微软小冰之间再普通不过的一个对话。如果不是事前知道小冰是聊天机器人,恐怕很难一开始就能当即分辨出交谈对象的身份。就如微软小冰自诩的那般,她就像一个天真无邪的“萌妹子”,面对用户的“骚扰调戏”,时常卖萌打趣,展现自己的社交“天赋”。
相较之下,DeepMind开发的AlphaGo则以绝对理性的姿态,淡定自若地向世人呈现自己作为机器物种的智慧之极。这也正是它最令人唏嘘之处:一个汲取技术、摒弃情感元素的智能机器人,甫一出现,便颠覆了人类既往的全部智慧、经验与认知。
这种颠覆不仅仅存在于某个单一领域。事实上,在医疗、教育、助理、购物等日常生活的方面,人工智能技术所塑造的绝对理性机器人正在加速渗透。在此过程中,不乏科技巨头争霸,亦不乏新兴创业者的身影。无论是巨头还是创业者,都争先恐后地生怕错漏了手中这一捧潮水。
“我们处在人工智能的时代,我们相信这能打造更好的生活。我们所面临的各个领域都有很多未解之谜,科学家通过人工智能,可以做到更多的事情。” Alphabet执行董事长施密特就此指出。
不管你是迎迓、接受还是厌恶、抗拒,科技史上的人工智能黄金时代正在到来。2017年2月27日,软银董事长孙正义在世界移动大会(MWC)发表演讲,再次表达了他对“奇点”的展望,“这一天的到来就意味着电脑,也就人工智能要超过人脑。今后30年里,这就会成为现实。”
理智与情感
“我去,这也能行?!”在听说时下国外直播网站Twitch上最火的GTA5主播是个AI时,一位用户发出了这样的感叹。
《GTA5》(中文名《侠盗猎车5》)是一款开放式动作冒险游戏。在Twitch中,辟有专门直播GTA5战况的板块,且极为热门,主播数量极大。然而近日,一名诞生尚未满月、只会开车且车技极差(例如经常将车开到沟里)的“小鲜肉”,单次直播收获了超过30万人次观看的成绩,在GTA5区内观众排名前列。
这个“小鲜肉”名为查尔斯,是一个使用神经网络进行深度学习以逐渐掌握自动驾驶车辆的人工智能程序,最近被工程师放入游戏《GTA5》中进行驾驶训练。不过目前,查尔斯还是一名“马路杀手”。从直播来看,查尔斯极爱逆行,在狭窄道路超车,无视石头、水泥等障碍物。
在幸灾乐祸的观众面前,查尔斯的驾驶技术还有待成长。不过如今,更加熟练的人工智能机器人已能够在实际生活中尝试驾驶技术。利用人工智能大脑,百度、谷歌、苹果等公司已经开始测试无人驾驶汽车,苹果公司近日已完成三部雷克萨斯RX450h SUV上有关自动驾驶软件的测试,百度更是宣称在2020年前将逐步开放高速公路和普通城市道路上的全自动驾驶。
在更多领域,技能性人工智能也在发挥不同的作用。无论是微软的Cortana(小娜)、苹果的Siri还是亚马逊的Alexa,或是IBM的Watson,都能够在一段时间内帮助人类完成任务,体现出功能性价值。近期热门的各类智能音箱,其中便搭载了人工智能语音机器人,用户可以向智能音箱就天气、交通、美食等方面提问,音箱内的人工智能机器人当即能够作答。
不过,严格来说,《GTA5》的查尔斯还不能算一个真正的主播,因为它从未与观众进行任何互动。如果一定要归类的话,查尔斯应该算是AlphaGo类的人工智能机器人,并且处于极为初级的学习阶段。相较之下,微软小冰更加贴近与人类之间的互动,向更偏重情感力、创造力的方向发展。
“小娜的设计初衷是去做事情,小冰则是与人建立长久的关系。一个人每天要讲几千句话,但并非所有话都一定是去做什么事情,而是为了交流。”此前在接受21世纪经济报道等媒体采访时,微软公司全球执行副总裁沈向洋指出,“现在并没有数字机器能够与人类建立长久关系,就是因为产品没有做到这个地步,令人类对机器有信任、机器对人类有理解。”
因此,小冰在很长一段时间里,除了与用户嬉笑怒骂之外,看起来是“无用”的。直到2015年底入职东方卫职播报天气;2016年12月,小冰并入QQ聊天功能“厘米秀”,与年轻用户进行互动。最近,小冰还放出大招,在对1920年后的519位现代诗人、上千首诗反复学习10000次之后,出版了个人诗集《阳光失了玻璃窗》。
“人工智能的计算能力已经被证明了,未来最重要的是脑神经科学。”沈向洋指出,“智能的起源在于大脑,但人类对大脑结构的理解如今少之又少,脑神经科学发展缓慢。未来脑科学加上人工智能,从科研角度而言,是最令人兴奋的,其中就包括情感这件事。”
通用AI仍遥远
然而,无论是走情感路线还是理智路线,通用型人工智能尚属遥远。
自1956年的夏天诞生于达特茅斯会议之后,人工智能业已经历三次浪潮。第一次浪潮中,人们惊呼着“人工智能来了”、“再过十年机器会超越人类”,陆续发明了首款感知神经网络软件,证明了数学定理。
第二次,随着上世纪80年代Hopfield神经网络和BT训练算法的提出,出现语音识别、语音翻译计划等以及日本提出的第五代计算机。然而,由于未能真正进入人类日常生活之中,前两次浪潮最终归于沉寂。
如今第三次人工智能浪潮的兴起,得益于深度学习技术的突破。该技术是一种需要训练大型神经网络的“深层”结构,且每层可以解决不同方面的机器学习。其特点是,无需再依赖于硬件代码和事先定义的规则,而是依靠模拟人类大脑的神经网络系统,从案例和经验中习得算法。
“人工智能的不同技术应用处于不同阶段。其中,语音识别处于推广和普及阶段,三至五年之后,计算机的语言识别能力会超过人类。10年之内,视觉方面的图像识别也会发展得非常好。无人驾驶汽车领域,已经能够实现一些类似能够分析过去的人工智能功能。具有有限记忆的人工智能,正处于实验室研究阶段。”沈向洋指出,“然而,具有自我意识的人工智能,离我们还有很远的距离。”
神经网络、深度学习等技术架构早已存在多年,它们之所以在近5至10年产生飞跃,得益于数据、硬件和算法的改变。
根据IDC数字领域报告显示,至2020年,每年数据量将达到44ZB(1ZB合1万亿G),5年内年复合增长率将达到141%。随着数据量的增长,神经网络便会更有效率,机器语言可解决的问题数量也在增加。
硬件能力的提升,增强了神经网络产生结果的速度与准确率。有别于传统基于数据中心架构的CPU,GPU与并行架构的使用能够更快训练机器学习系统,通过使用图像芯片,网络能够更快迭代,以确保训练的准确性;诸如微软和百度使用的特制硅FPGA,能够令深度学习系统做出更快推断;超级计算机的计算能力,则可帮助探索深度学习的进一步可能性。
在更加丰富的数据量、更优质的硬件能力的前提下,如今的研发更多是面向算法,例如伯克利的Caffe、谷歌的TensorFlow和Torch这类开源框架。
尽管取得了巨大的技术进展,以深度学习为驱动力的人工智能技术更多仍停留在分类、聚类和预测阶段,如图像、文本、语音的识别、对比寻找相似项目,或基于相关数据进行预测等。然而,能够完全复制人类独立学习、决策能力等在内智慧的通用人工智能(或说强人工智能),还仅仅停留于理论想象之中。
它的瓶颈更多体现在计算能力不足上。目前,类似全脑模拟的技术已经被用于实现通用人工智能的目标,然而其所需的计算力远远超出当前的技术能力。未来随着量子计算机取得突破,该瓶颈方才有望打破。
中科院5月3日宣布,我国科学家成功构建世界首台超越早期经典计算机的光量子计算机,并实现了十个超导量子比特的高精度操纵,打破此前美国保持的记录。量子计算是利用量子相干叠加原理,在原理上具有超快的并行计算和模拟能力,可以为经典计算机无法解决的大规模计算难题提供有效解决方案。中国科学技术大学教授潘建伟团队利用自主发展的综合性能国际最优的量子点单光子源,通过电控可编程的光量子线路,构建了针对多光子“玻色取样”任务的光量子计算原型机。
但光量子计算机在人工智能的广泛应用,仍有很长的一段路要走。
科技巨头争霸
世界科技的每次飞跃,离不开科技巨头的引领。
过去20年,谷歌的搜索算法从1998年的PageRank演变至2015年的RankBrain,从基于链接的网站排名转变为采用人工智能驱动的查询匹配系统;云技术方面,谷歌于2016年5月公布了TPU ASIC(专用集成电路),并在近日举办的Google I/O大会推出Cloud TPU,以支持AI的神经网络训练及推理。
在人工智能收购战中,谷歌同样当仁不让,其中最为著名的便是2014年1月谷歌收购英国人工智能公司DeepMind。该次收购不仅提升了Alphabet的神经网络功能,并将其应用于各种人工智能驱动的项目中,包括AlphaGo。
亚马逊同样积极在公司内部和云端使用机器学习技术。2015年4月,亚马逊发布Amazon ML,能够为毫无经验的客户提供云数据的机器学习功能。2016年5月,亚马逊开源DSSTNE,并通过改善搜索、定制化产品推荐以及语音识别,改善端到端的用户体验。
苹果公司同样是人工智能领域活跃的收购商。被其收入囊中的公司,包括Vocal IQ、Perceptio、Emotient、Turi以及Tuplejump等。在收购Vocal IQ及Perceptio的同时,苹果公司挖到英伟达CUDA库以及GPU加速软件项目负责人。在此之前,公司最初的人工智能成功之一是Siri,它也是首款嵌入移动技术的虚拟助手。
微软在试图将人工智能大众化。21世纪经济报道记者了解到,微软公司的人工智能研究团队人数超过5000人,关注于改变人类与机器互动的体验。同时,微软正在积极将融合人工智能的功能嵌入公司核心服务中,并在对话计算、自然语言处理等方面取得进展。通过进一步打造基于GPU和FPGA的微软智能云Azure,为机器学习提供动力和速度。
IBM一直是人工智能领域的先驱。过去10年内,IBM在认知计算方面拥有超过1400项专利,硅/纳米技术上有7200项专利。其取得的成就不仅包括上世纪90年代的深蓝,还有2011年的Watson。目前,Watson的应用包括病患治疗分析、基于Twitter数据的股票推荐、零售行业的消费者行为分析及对抗网络安全威胁。
人工智能的发展,芯片至关重要。2016年9月5日,软银公司宣布完成对英国芯片设计公司ARM的收购交易,约合320亿美元。
中国企业正在拼命追赶。5月4日,百度董事长李彦宏通过内网发布全员信,希望百度从全球最大的中文搜索引擎彻底转型人工智能科技公司。将人工智能作为公司发展的战略转型方向,这称得上是拼尽全力了。