中国日报网1月5日电 由中国日报和网易新闻联合主办的2019影响力峰会1月5日在北京举行,本届峰会的主题是“预见未来”。中国工程院院士邬贺铨在“预见科技未来”环节,发表了《迎接人工智能的未来》的演讲。
他表示,人工智能对经济效益有很大的贡献,但他也提到了人工智能目前还有很多不足的地方。对于人工智能取代人类的话题,邬贺铨很乐观的表示,一半以上的人是不会被人工智能取代的。
邬贺铨表示,人工智能可以在医疗保健、汽车和金融服务业取得不错的效果。但目前人工智能还有很多的不足。图灵奖的获奖者说,目前机器学习只是曲线的拟合,一个诺贝尔奖经济学奖得主(Judea Pear)说“人工智能不过是统计学”,也就是说目前还是有很多不够的地方。
提到就业问题,邬贺铨认为,人工智能确实会取代很多现在的就业,49%的劳动人口可能会被取代,但一半以上的人是不会被取代的。
“因为人工智能没有情感,有情感创作的文艺工作是不能被取代的,人工智能不能取代文艺,要由人来做。”邬贺铨举例道。
以下为邬贺铨演讲全文:
邬贺铨:各位领导、各位专家早上好。我发言的题目是“迎接人工智能的未来”。
我们可以看看支撑人工智能发展的技术,比如CPU的芯片、存储器、光纤、移动通信、超算、大数据……用十年的时间来看,有些是60几倍,有些是成本两万倍下降,光纤通信10年100倍容量提升,移动通信10年1000倍的速率提升,超算能力1000倍的提升,算法我在这里没写,但等会儿会说到,大数据量大概是32倍的提升。这是前几年统计下来的网络主要设备年均性能改进的增速。
互联网近年已经是第50年了,50年的互联网到现在还保持互联网流量年增60%,这些增速也会对未来人工智能技术的发展给予很大的影响。
现在深度神经网络,就算你写本书告诉计算机什么是猫什么是狗,它也学不会,但如果像对待人类小孩的教学方式那样,感性地把一堆猫和狗的视频送到深度神经网络,它就会分类,分类结束后,如果照片视频上有标签,它就会知道分的这类是猫。如果篮子里有个小狗,放进去,它照样会分类为“狗”。所以深度神经网络实际上是个分类器,但你告诉它是什么,它就学会了。
机器学习是深度神经网络的主要技术,从10年里机器学习的论文里可以发现现在机器学习的技术热点,可以看到神经网络和进化编程等计算密集型算法在机器学习研究中的出色表现。
AlphaGo下棋。人每天吃饭大概要输入2500卡路里的能量,卡路里换算成焦耳大概是1000万焦耳,下围棋5个小时大概要消耗人类3.3兆焦耳。AlphaGo跟李世石下棋时用了1000多个CPU,176个GPU,一个CPU功率100W,1个GPU200W,换算出来是173000W(这是以秒计的),如果5小时就是3000兆焦耳,这相当于李世石用的能耗是AlphaGo能耗的千分之一,也就是说,人工智能目前还需要很大的能量支持。
后来隔了一年,改进了AlphaGoZero,换算成TPU,它只是AlphaGo原有1/12(的能耗),用1/12的能耗跟AlphaGo下棋,100比0,当时AlphaGo还要搜集所有的围棋棋谱,然后训练三个月,AlphaGoZero只需要了解围棋的规则,两个AlphaGoZero互相对应,能把所有人类没有走过的棋谱都走完,它就能战胜了。所以优化算法、改进硬件,包括GPU替换CPU(提高了三倍),TPU替换GPU(提高了15到30倍)。
最近不单AlphaGoZero围棋天下无敌,而且通过自学2个小时,还击败了日本的将棋(有点像中国的象棋),自学4个小时,把国际象棋也全部打赢了。
在医学上,刚刚过去的三个月,谷歌在机器学习又开发了AlphaFold,AlphaGo的折叠,所谓折叠是来预测蛋白质结构的,在蛋白质结构预测的国际竞赛里,打败了所有由人组成的各种团队,这有什么意义?如果能解释蛋白质的结构,我们的很多疾病(包括癌症)可能就会找到解决办法。所以现在很多人工智能用在医学上开发药物,美国人工智能能比医生提早六年诊断出阿兹海默病,医疗人工智能的器械也开始投入商用了。
除此之外我们看一看蛋白质折叠结构,我们可以通过人工智能将它解释出来。
我们知道门捷列夫开发元素周期表用了很长时间,现在假设我们不知道元素周期表,利用人工智能程序,几个小时就可以把元素周期表重新定义出来。也就是说,人工智能确实能做好多事。
在语音识别方面,人工智能已经超过了人,一般人类语音识别的错误率是5.1%,现在百度对汉语的语音识别,微软对应于的语音识别已经比这个水平要高了。当然,在嘈杂噪声环境下,识别率现在也只有54%,不过人更识别不了,人还达不到这个水平。
包括人脸识别,中国上海依图科技的人脸识别率在万分之一,误失率前提下可以通过98%,银行柜台人员用肉眼比对,误差一般在1%,也就是说机器准确性是超过人的眼睛的。
当然,动态三维活体检测更难,下面的图是小布什的原相,右边的小部什头像和原图一样,但嘴型和上图的胖子嘴型一样,我们听不出胖子讲什么,但小布什可以通过口形恢复出他讲话的声音,读懂唇语。
我们知道张学友在好几场演唱会上抓到了逃犯,这不是因为张学友,而是演唱会门口的人脸识别门口。所以张学友说“抓逃犯是我的正业,唱歌只是副业”。
机器视觉应用于什么?这是一个肺部CT照片,大家可以从中发现有没有长瘤子、有没有癌症,但CT可以扫描出几百张图片,很麻烦,我们通过人工智能把这些CT照片还原成一个肺,看看有没有纤维化,再看看肺周边的器官怎么样。腾讯利用它的人工智能技术,目前它可以检测肺里非常小的肿瘤,而且筛查率还是相当准确的。
语音识别可以用于医学,还有图像识别,可以重建三维影像,比如医学教育,包括在增进医疗手术的辅导可以起到很好的作用。
在产业上,清华和英业达合作(做影像电路板的),影像电路板很复杂,可以看看该连的线是不是连了,不该连的线是不是没连,人的肉眼很容易错检,但利用机器视觉就可以发觉人的肉眼没法儿发现的问题,每年的经济效益9000万。
人工智能对经济效益的贡献,有一些统计,人工智能可以改进劳动生产率,可以增加激发消费需求、可以提高产品质量,有人预测2017到2030年,人工智能对劳动生产率的贡献超过GDP的55%,分析了不同国家,其中中国占了全球将近一半,2030年人工智能会带来7万亿美元的GDP增长贡献,占GDP的26.1%,这个数字来源于普华永道,这里面讲了几个领域,是最重要的人工智能应用领域
AI指数比较高的应用效果比较好的:一是医疗保健,二是汽车,金融服务业不错,制造业反而比金融服务零售业还要低一点,而现在我们首先会在物流上用。
以自动驾驶为例,麦肯锡估计2025年带来的经济规模将达到万亿美元,降低交通事故,每年能挽救3到15万人的生命,减少废气排放90%,麦肯锡还认为到2030年人工智能可以为全球额外贡献13万亿美元的GDP增长,普华永道的估计是15.7万亿,平均年均GDP会增加1.2%。他后面那句话更重要:足以比肩19世纪的蒸汽机、20世纪的工业机器人和21世纪的信息技术。
人工智能擅长什么?它适应的工作场景要满足五个条件:
围棋很难,围棋的棋局空间很大,1.43后面有768个“0”,但它的信息是完全确定的,具有静态和结构性特点,所以计算机没问题,它不怕难、不怕烦,可以做到,但打麻将就不一样了,这是非合作对弈,虽然有规则但很难,所以AlphaGo不一定能打过人类;
电子游戏也一样,现在在《星际争霸》游戏里,人工智能还达不到一般专业水平。
自动驾驶在简单路况中是好的,复杂路况就很难,因为行人和司机不见到都遵守交通规则,很难用训练的办法掌握,还需要驾驶员的经验和知识,而且人类犯错是偶然的,机器一旦犯错可能就是系统性的;
人工智能可以检测肿瘤,但医院还不敢这么用,因为人工智能本身可以告诉你应该做什么,但它不会告诉你为什么,比如人工智能诊断一个病人,最后得出结论“锯掉一条腿”,但不告诉你为什么,那医院敢锯掉腿吗?
还有很多功能是人工智能难以胜任的,神经网络是以输入为导向的算法,首先的前提是大量数据,而且数据要比较准确,如果受了干扰他就很难,医生受干扰可能会产生很多错误,比如北加州一个组织(美国公民自由联盟)利用亚马逊面部识别算法把美国535位国会议员的照片和美国警察局掌握的2.5万名罪犯照片进行比对,发现28个议员被当成了罪犯。分类数据终美国的数据严重偏向白人男性,所以黑皮肤的可能就容易被错认。
目前机器学习还有很多不足,图灵奖的获奖者说,目前机器学习只是曲线的拟合,一个诺贝尔奖经济学奖得主(Judea Pear)说“人工智能不过是统计学”,也就是说目前还是有很多不够的地方。
刚才我用的两张图映射的猫和狗的区别有个曲线,但只要拟合的地方稍微错一点,可能就会发生错误。比如本来是熊猫,在照片上加上一些噪音,机器就可能识别成长臂猿,所以人工智能识别目前来讲还是比较娇气的。
大家看这张图,有人看是顺时针转,有人看是逆时针转,哪怕是同一个人,一会儿看着是顺时针转,眨眨眼睛却变成了逆时针转,究竟是顺还是逆?其实只是左腿在前还是右腿在前的问题,是你的错觉。
为什么会出现这个错觉?因为它正好处于人工智能辨识(包括人辨识)的分界线,这时就可能发生误导。
比如这个图里的圆圈,大家都觉得它是滚动的、是圆的,可是真的是这样吗?每个球都这样走吗?不一定,我们可以看看。实际上每个球走的都是直线,所以人工智能的模型是会被误导的。
大家看这几张图的照片,好像是真人,实际上不是,左边是画出来的,右边是根据画出来的所形成的,也就是说,它不是真人,而是人工智能画出来的,将来拍电视剧、拍电影,用不着花高价钱请“小鲜肉”,画一个就可以。
大家看看这段小视频,这个车怎么突然出毛病,发神经病了?(见视频),实际上这是一个真实交通事故的视频,但把交通事故中跟它对撞的另一辆车抹掉了,大家看着觉得莫名其妙,所以人工智能“有图未必有真相”。
当然,神经网络现在还在演进,关键是怎样选择正确框架以及训练,清华大学的张钹院士说我们要把感知和认知放到同一个空间里,不是简单用概率统计的理论,要用模糊级的理论来重新定义它,否则我们没办法跟机器人交流,机器人之间也没办法交流。
机器学习着重于通过数据了解环境,而人类能够同时洞悉不同的环境,群体学习是人类与生俱来的本领,而电脑是不具备的。我曾经跟一个搞人工智能的公司说,识别语音、下围棋都不算什么,能不能组织11人的机器人足球队,什么时候踢赢皇马了,那你就算厉害了,因为11人的机器人足球队是要群体活动的。
这张图中最后一个打问号的地方应该放(几个数字),人很容易看出来应该放哪个,因为第一行232,第二行343,第三行应该是454,可是人工智能就很难看出来,因为人工智能要获得人类常识不是那么容易的。
刚才谈到就业,实际上人工智能确实会取代很多现在的就业,49%的劳动人口可能会被取代,但一半以上的人是不会被取代的,因为人工智能没有情感,有情感创作的文艺工作是不能被取代的,人工智能不能取代文艺,要由人来做。美国高德纳咨询公司以及世界经济论坛发布的《2018未来就业》报告中都说,实际上取代了一部分工作,但会新增一些工作岗位。人工智能会带来数字鸿沟,发达国家、先进企业,还会拉大社会贫富悬殊,高智能岗位会增加,一般劳动岗位会减少,自动驾驶出了问题是谁的责任?机器人创作的小说、诗歌是否享有相应的知识产权?有法律道德的问题,还有安全问题,如果人工智能杀人了怎么办?
最后,总书记提到,要加快发展新一代人工智能,是我们赢得全球科技竞争主动权的重要抓略抓手。
清华大学张钹院士说,我们现在正在通往AI的路上,现在走得并不远,在出发点附近,但人工智能永远在路上,大家要有思想准备,而这也就是人工智能的魅力。
人工智能会使得我们的生活更美好,或是走到我们的反面,这一切取决于人类自己。
谢谢。