1. 引言
2017年日本名古屋举办了一年一度的RoboCup (机器人世界杯),40多个国家和地区的400余人机团队在机器人足球等五大竞技项目中展开激烈角逐。我国“优必选”机器人与清华大学联队获得了技术挑战赛亚军,距离机器人足球队战胜人类世界杯冠军仅一步之遥。看了这场高智能的RoboCup,与会者无不感叹,“机器人变成人的时代到来了!”
2. 机器人与人类的差异性及技术壁垒分析
人与机器的根本区别在于人的生命性和智慧性。人有自组织功能,具有自主生存和发展能力,是有理智、意志的智慧型动物。人的智慧主要表现在其随机应变和当机立断。机器人是由人类制造的、能协助人们从事某些活动的工具。发明机器人的目的,是减轻人类劳动强度、提高工作效率,或从事不适于人类进行的高危性活动,而不是使之与人类分庭抗礼。
2.1. 机器人与人类肢体行动上的差异——机械部分不如人类方便灵活
现在进行时的机器学习,已经发展成人工智能,对我们日常工作生活产生了重大影响,但机器人并不是什么都能学会,机器人(Robot)由人操纵,行动笨拙,只能不断重复地做某些动作,除了制造业的专用机器手臂,机器人的动作远不如人类灵敏。机器人本质上是人们制造的机器,它没有自组织功能,没有理智和意志,机械性、刻板性是机器的最大特点。无论机器人多么先进,永远摆脱不了人的控制。
2.2. 机械脑没有人脑快——智能部分靠0和1的单算法很难超过人
机械“大脑”是机器人的核心,一般由计算机或单片机系统控制。机器人的大脑神经就是集成电路,具有信息处理、发布指令功能,支配着机器人的正常运作。机器人按其智能程度可分为一般机器人和智能机器人。一般机器人的大脑是按照预先编好的程序顺序进行工作,使用终端限位开关、制动器、插销板和定序器来控制机器人的活动。而智能机器人的大脑神经元之间存在很多高效网络,主要包括传感型机器人、交互型机器人、自立型机器人。传感型机器人是利用和处理传感信息实现控制与操作;交互型机器人是通过计算机系统进行人机对话,实现对机器人的控制。交互型机器人具备一定的决策能力、交互能力、与外界信息交换能力、学习模仿能力。自立型机器人无需人为干预,能够在各种环境下自动完成预定任务。智能机器人的智能体现在它可以根据外界环境的变化主动做出反应,改变自身运动规律,这种“自适应”过程主要通过深度学习来实现,其动机在于建立、模拟人脑进行分析学习的神经网络,模仿人脑机制来识别图像、声音和文本等数据。机器人大脑的深度学习、自主学习过程就是不断提高其神经网络效率的过程。
然而无论是一般机器人还是智能机器人,其智能部分都只是依靠0和1的简单算法来实现的。因此与人脑相比,在某些方面其具有相当大的劣势,比如避障,几乎所有的无人驾驶和自动驾驶研发团队都在苦苦思索避障算法,而避障算法的应用是及其广泛的,很多领域比如无人机也要用到,避障算法是整个无人驾驶和自动驾驶行业的拦路虎,因为它决定了最后的1%的安全性,而现有的vfh避障算法和dwa避障算法只能算非常原始的起步,完全不能满足实际需要。
2.3. 量子计算机领域的突破——不确定性复杂性太多
早前有人认为机器人的突破需要量子计算机领域的突破,但是量子计算机的实用性较差,这是因为,一方面虽然目前不断有Grover搜索算法、量子化学模拟算法等新的量子算法出现,但数量远不可与传统算法相提并论。量子算法设计困难,真正的量子计算难以实现,不确定性太多。另一方面,制造量子比特需要极为苛刻的环境条件,为了利用超导震荡电路的量子基态,超导量子比特需要被维持在20 mK的温度(−273.13摄氏度)。离子阱量子比特中需要利用射频电磁场将单个或少数几个离子囚禁在很小的空间范围之内,这样的环境,本身就充满了太多的复杂性。即使有了如此苛刻的环境,量子比特在制造或操作的过程中会有各种干扰和误差,导致量子比特的寿命极短,操作的可靠性也很低。当今世界上最好的超导量子比特寿命只有200 us左右,不到1 ms,其操作错误率约0.1%。离子阱的寿命略长,但也是秒级别,因此量子比特极为脆弱 [1] 。
2.4. 神经网络没有突破——很难在神经感应找到突破口
近年来,人工智能研究中效果最好的系统被认为是神经网络。但神经网络是“黑箱”。经过训练的神经网络虽然能够进行数据分类,但设计者知其然而不知所以然。在视觉数据方面,自动化实验确定的数据特征让升级网络做出反应,但文本处理系统不透明。为了解释神经网络的决策,CSAIL研究者把网络分为两个模块。第一个模块提取训练数据中的文本片段,文本片段对其长度和连贯性评判,然后传给第二个模块进行预测和分类。
3. 机器人局部智能突破的启示
3.1. 阿法狗的冷冰模式成功的启示
2017年,阿尔法狗与象棋大师柯洁对弈,最终阿尔法狗以3:0获胜再次震撼了棋迷,全世界的棋手只能再次接受人类已经无法在棋盘上战胜人工智能这个事实。阿尔法狗让全世界更多的棋迷前所未有地领悟智能机器人的“深奥幽玄”。看人类下棋,能够体会他们在对局中的心理和情绪波动。而看阿尔法狗下棋,只能揣摩它对当下棋局形势判断,是紧张还是平稳,完全感觉不到它的“心情”起伏和下一步意图,旁观者只能感觉到阿尔法狗的每一手棋都是冷冰冰的。
阿尔法狗在人机对弈中之所以能够取胜,就是因为它有像园丁一样“剪枝”补棋的独特能力,从而让花木长得更好。这种“剪枝”思维方式,就是排除一些不必要的搜索和计算,让复杂问题简单化,其每一步看似“臭棋”,但结果都是石破天惊、神秘莫测的棋局,这就是阿尔法狗的高智商。阿尔法狗之所以能在双方边界已经确定的地方先手补棋,彻底排除变化的可能性,就是为了此后不再考虑这里的应对,从而减少计算量。这种遵照最基本的围棋规则和计算方法,经过对比,筛选出下一步棋,从而使得阿尔法狗常常让人类棋手“看不懂”其棋局。
2017年10月18日,DeepMind团队公布了代号为AlphaGo Zero的最强版阿尔法狗,它能“自学成才”。新一代的AlphaGo Zero,不依赖于任何人类的棋谱,不参考人类任何先验知识,完全靠自己强化学习和参悟,仅三天时间就可以自己左右互博490万棋局。AlphaGo Zero棋艺增长远超阿尔法狗,以100:0完胜后者。而此前,阿尔法狗曾花了几个月时间,学习人类三千万棋局,才打败人类。这种突破性的技术进化是推动人工智能技术进步的重要能源,如果人工智能按这种模式持续进化,其局限性将大大减少,未来出现完全独立自主化的超级人工智能机器人似乎也将在人类的预料之中。
3.2. 机器人Teo弹钢琴带有情感的实现的启示
意大利的机器人Teo,有19个手指,能够演奏任何旋律或者歌曲,并比任何人类钢琴家弹奏得都要快,可以踩着鼓点自弹自唱,还可以通过语音辨识和面部表情与听众产生交互作用。Teo的演奏技术让国际钢琴大师郎朗都震惊了。人工智能学习钢琴的演奏技巧并不难,其速度可以轻而易举的超过人类。如果说下围棋只要冷冰冰的数学思维,而弹钢琴则展现的则是人类的情感。在Teo面前,情感已不再是人类的专利。可以想象,随着人工智能的发展,如果机器人完全掌握了人类情感的大数据,并能够解读和表达人类情感的时候,机器人成为艺术家或许也不足为奇了。
3.3. 科大讯飞语音语意思维过程成功的启示
2017年,美团外卖联合科大讯飞共同推出了一款“智能语音助手”的人工智能产品,这款基于丰富的大数据及多项人工智能技术,能够让骑手在送餐过程中使用最自然的语音交互完成接单、上报等操作,不再需要手动操作手机,同时系统还将根据骑手骑行状态自动唤起交通安全提示,从而减少安全隐患、保障骑手生命安全。
近年来,语音识别系统(InterReco)迅速发展,对大段中文语音的识别率达到90%以上,应用领域语义理解正确率85%以上,已成功应用于电信、金融、能源、交通、政府等主流行业。MIUI语音助手能提供20项语音指令操作。能够快速打开应用,只要记住应用名称,对着语音助手说打开某应用就可以。通过语音读取银行卡号码,既方便又安全。它还能通过语音控制收听在线音乐,询问天气情况,将某人的联系方式发送给他人,这些都可一句话直接轻松完成。
4. 机器人如何“成为”人类甚至超过人类
4.1. 神经网络技术的运用
在日本国立科学博物馆,一款新机器人Alter比其他“同事”都要先进,因为它是一款嵌入神经网络的机器人。这种神经网络机器人能够通过传感器感应周围事物,按自己意愿做动作。Alter最先进的部分是安装了Izhikevich神经元的内置“中枢模式发生器” (CPG),由42个气动执行器进行动作驱动。CPG可以让机器人拥有自主意识的运动模式,通过内置传感器监测到周围的物体、温湿度或声音形成特定动作。这种机器人不仅需要更高智能的AI,而且需要更接近人类神经网络,对周围环境及事物产生适当反应。因此,随着机械神经网络技术的突破,可以实现机器人像人一样进行语言交流、动作互动。
4.2. 末端神经是否具有记忆功能
人类大脑是一个由约140亿个神经元组成的繁复的神经网络。神经元是神经系统的基本单位,也是记忆的基本单位,由树突、细胞体、轴突构成的一个细胞。外界刺激产生的信息在神经元之间以生物电位单向传播,一个神经元的轴突释放递质传递化学信号给下一个神经元的树突,然后被转化成电信号在神经元中传递到其轴突,再转化成化学信号传递给下个神经元。轴突末端的突触于下一个神经元的树突联系的形成和强化生成了记忆 [2] 。
智能机器人要很好地完成一项工作任务,就必须具备与任务有关的一些重要记忆功能。目前人类大脑的记忆原理已完全被破解,不久以后就可以据此研制出具有人类思维方式的机器人,他们能够独立思考,懂得联想甚至有情有义。这些机器人模仿或者超越人的智能,在某些记忆、存储等方面将会远远超越人类 [3] 。
4.3. 训练神经的记忆功能
布朗大学计算机科学教授特里克斯成功检测了机器人记忆能力的数据。她建立一个机器学习模型,使机器人能够自动学习操纵对象,依靠产生的样本数据来训练机器人的记忆能力。她认为,“机器人能够产生‘记忆’是有前提条件的。如果把一个陌生景象放到机器人面前,该机器人基本上无法记忆这些东西,因为它的‘思维’里没有这个景象的信息,也没有针对该景象做过训练。”特里克斯所构建的机器学习模型可以让机器人在错误中进行学习,经过反复试验,直到它能成功地记忆起这种景象。在尝试和错误交替过程中,可以产生一系列的关于该景象的图片信息库。特里克斯的计划预示着终将有一天可以让机器人获得更准确的记忆能力。
近年来,机器学习的应用技术如自动驾驶汽车以及图像识别的应用技术都得到了迅猛的发展,就是因为这些领域有大量的样本数据可以用来训练这些机器记忆模型。机器人记忆能力滞后,主要原因在于样本数据少,无法训练神经网络。神经网络是一个由几个简单高度互连的处理元件组成的计算机系统,可以通过对外部输入的动态回应来处理信息。它主要是通过处理大量的被标记的数据,从而记忆理解不同情形的能力 [4] 。
从这个意义上讲,人和机器人没有本质区别。如果把人看作生物化学的机器、蛋白质的机器,那么机器人实际上就是金属的或者其他材料的机器。现代神经生理学和脑科学认为,人的情绪来源于激素,记忆来自神经细胞的网状结构,任何大脑微观结构上的改变都能引发人思维的变化。电脑也能模仿生物神经系统,电脑“神经系统”也能对刺激做出反应,根据外部信息的变化调整运行方式。因此,具有分布存储、并行处理、自学习、自组织以及非线性映射等优点的神经网络与其他方法相结合,取长补短,最终也能使机器人能和人类一样拥有自主思想,具备记忆力和创造力 [5] 。
4.4. 大脑中节点——中央处理器功能
机器人要眼观六路、耳听八方,离不开一颗强劲的大脑——高性能中央处理器和高效算法。机器人是复杂的机电一体化装置,综合运用了机械与精密机械、微电子与计算机、自动控制与驱动、传感器与信息处理以及人工智能等多学科的最新研究成果。为了将这些成果融合起来,真正形成认知、感受和行动的能力,使机器人能够理解并应对真实的世界,准确完成操作任务,其搭载的计算平台需满足多种要求,包括感知能力、控制能力、计算能力、功耗控制、易用性。借助由GPU、FPGA和其他智能引擎等协处理器与CPU组成的异构中央处理器来提升计算性能,已成为当下机器人开发的热点。异构计算作为一种特殊的并行计算方式,能够根据每个计算子系统的结构特点为其分配不同的计算任务,在提高计算性能、能效比和实时性保障方面体现出传统架构所不具备的优势,不断在各种计算需求量较大场合得到应用。这种比CPU高出十多倍的定位频率,使得机器人拥有双倍的运动速度,而不会“迷失方向”。有了如此智慧的大脑,机器人将变得更加耳聪、眼明、腿快、手稳,融入我们的日常生活,为人类提供更好的服务 [6] 。
4.5. 区块链技术的广泛运用
区块链技术简称BT (Blockchain technology),也叫分布式账本技术,是一种基于互联网数据库的技术,能够去中心化、公开透明,让每个人均可参与数据库记录。
面对人工智能、区块链技术这种颠覆世界的浪潮,智能机器将改变一切——机器人和自动化技术使体力劳动者受到重创,在不久的将来,我们将生活在一个“机器同机器”交流的“数据驱动”的世界里,人们的经验和投入不再那么重要,越来越多的机器人彼此进行交流和交易:司机会被无人驾驶取代,超市见不到收银,餐厅可以智能点餐、自动刷卡结账等,大数据分析被用于预测房屋价值、改善交通流量、分析医疗图像、处理保险索赔,各个场所随处可见机器人在穿梭。
在区块链技术和智能合约背景下,数字革命的创新周期更短,创新步伐也更快,由此带来的社会变化的速度和规模,使得人们难以理解和适应,但同时也会有更多新的工作机会,可以通过互联网更快地分配自己的工作,能够提供更多与大众建立直接关系的机会,可以直接面向大众分享内容,在没有“中间人”或“代理人”的情况下获得报酬。在即将到来的数字世界中,最重要的将是那些最“人性化”的技能,无论机器人有多“智能”,“人性化”的技能都是最难训练、最难复制的技能 [7] 。
4.6. 广域一体化智能突破
“智能广域机器人”(Smart Wide Area Robot)理论基础是电力混成控制论,其主旨是将一切不满足要求和不满意的状态都分类定义为事件,通过控制使系统回归至正常运行状态。
随着更高电压等级交流输电线路的建设,我国电网互联的程度不断增强。但大规模新型可再生能源发电基地的接入,电动汽车等新型客户与负荷性微电网大量涌现,以及电源性微电网和分布式电源等组成的新电网的调度运行,是我国智能电网安全可靠运行中面临的主要问题。中国科学院院士、清华大学教授卢强认为,“将整个电力大系统控制得如同一台智能机器人,这种具有多指标自趋优运行能力的电网是电网智能的最高形式,实质是‘智能广域机器人’”。
智能广域一体化是衡量电网某时刻是否处于趋优状态,是否自动调控,将整个电力大系统控制得如同一台智能机器人。要想真正实现Smart-WAR,必须在建立智能电网基础量测设施与动态SCADA系统的基础上,实现机器智能与人的智能结合 [8] 。
4.7. 实现机器人训练进化
“计算机科学之父”——阿兰·图灵在60多年前就提出著名的“图灵测试”预测:到2000年,人类可用10 GB的计算机设备,制造出可在5分钟的问答中骗过30%成年人的人工智能。这种预测已经变为现实:2014年6月7日在阿兰·图灵逝世60周年纪念日这一天,在英国皇家学会举行的“2014图灵测试”大会上,聊天程序“尤金·古斯特曼”首次通过了图灵测试,这个时间只比图灵的预测稍微晚一点。
未来的设想是,将生命终结的高智商人类大脑冷冻,之后使用人工智能和纳米技术存储重要数据,通过“个性化芯片”将其数据编码嵌入机器人的芯片和传感器中,再通过克隆纳米技术使死人“起死回生”,人造身体功能将通过脑波由人类思想进行控制,机器人将运用“原”高智商人类的会话风格、行为模式、思维过程以及人体功能从事各种社会活动。
人类给予机器人高级智商,与人类的差别越来越小,未来机器人将能完成人类所能完成的所有工作——从事日常服务、工业制造、医疗、科研、抢险救灾甚至作战等活动。当人工智能(AI)技术植入计算机、物联网设备、云计算平台,未来30年内机器人不仅在数量上会超越人类,其智力水平也将超越人类,IQ最终达到一万,而天才爱因斯坦的IQ才200左右。电影《我与机器人》勾勒了一幅2035年,我们将与智能型机器人共同生活的美妙场景。世界机器人世界杯协会预测到2050年,机器人足球队将战胜人类世界杯冠军而“加冕”称王。对此,一些机器人研究专家认为,“以当前的科技发展速度,机器人超越人并非神话。人的大脑是由呈区域节点式分布的上百亿个神经元组成,节点之间相互连接,而智能机器人是通过感知网络节点设计来实现思维活动的,当机器人的每一个节点都超越单个人,机器人变成“人”的时代就会真正来临。”
参考文献