中国类脑强人工智能初创公司宣布实现全球首次“片上学习”

作者:周文婷 来源:中国日报网
2016-09-19 15:20:41

中国类脑强人工智能初创公司西井科技9月17日在沪宣布,该团队在全球范围内首次实现“片上学习”(on-chip learning)。

在机器学习领域,“片上学习”较目前流行的“在线学习”又往前跨了突破性的一大步,这意味着机器学习能在硬件端直接完成,通过硬件层面的不断“自我学习”和“自我提高”,实现高效率、低功耗。

中国类脑强人工智能初创公司宣布实现全球首次“片上学习”
人工智能

未来,无论是在移动智能终端、家用智能终端或是大数据专用服务器等多领域,“片上学习”都将展现其独有且强大的优势。

“片上”自主学习画风分类

抽象画、巴洛克、花卉、室内、肖像、极简主义、波普艺术、超现实主义……多种画派和画风,让人眼花缭乱。

对于普通人来说,即便浸润艺术多年,想要做到看一眼便能直接分出画作流派,并不是件容易的事。机器是否能做到这一切?

自2014年起,加州理工大学Sergey Karayev 等人收集了Wiki-paintings画作以来,全球不少团队已加入机器快速识别、分类的研究中,以此来检验机器学习的成果。

最近,西井科技的神经形态实验室首次在全球范围内实现了“片上学习”,并将此技术直接在Wiki-paintings画作集上进行测试。结果显示,机器能在短短 1 秒内自动完成1000多张图片的分类,正确率接近100%。

9月17日,西井科技在上海科博会现场演示了“片上学习”过程。随意点击几种画风、画派在硬件端的“片上学习”后,希望能从1万幅油画中正确而快速地找到选中的画风、画派。

期间,芯片可随时中断学习,以测试学习效果。结果我们发现,随着芯片学习进度的推进,油画识别与分类的正确率将逐步上升,直至经过8至10秒的一段完整学习后,识别的正确率接近100%。

“片上学习”此前研究进展缓慢

机器学习的目的就是让机器具有类似于人类的学习、认识、理解事物的能力。

从全球范围内来看,目前机器学习常用“在线学习”,即按照顺序、循序地学习,不断地去修正模型,进行优化。

与此同时,研究人员也未停止对“片上学习”研究,因为只要实现这一技术,就能直接在硬件上完成学习与测试,进而让基础算法的研发迭代,产品的升级有着更短的周期和更高的效率,并且消耗更少的能源。

事实上,从1990年代起,大量的研究便集中在如何将算法嵌入硬件的理论研究中,但那时针对的仅是诸如非常简单的波形、信号处理。

到了2010年后,由于维持摩尔定律硬件的研发成本不断提高,刺激了学术界与工业界对于专用芯片的研究,开始有了配置硬件的高级语言接口。

不过“片上学习”在严苛的硬件环境中依旧研究进展缓慢,并没有一个成型的应用于实际问题的演示,一直停留在理论研究阶段。

现阶段,在硬件中部署机器算法更多还是“在线学习”,即用大规模高性能计算平台进行模型训练,然后将训练好的模型再直接部署在硬件中。

“片上学习”四大优势

据介绍,西井科技此次实现的“片上学习”,打个比方来说,就好像学生身边时刻跟随着一位“私教”,直接在芯片上边学习边测试训练成果,最大的优势是真正实现“无网络”情况下的“自我学习、自我实时提高”。

而“在线学习”则好比学生定期去“学校”上课,回家后做作业来测试学习效果,再将优化过的模型灌输在硬件中,每一次新的学习都需通过网络、云端等手段重新进行传输、迁移。

其次,因为“片上学习”可以实现本地化学习,从而帮助机器大幅度提升效率,提高运算速度。在网络环境相对严苛或有限的情况下,“片上学习”的芯片消耗的带宽和流量更少,大幅降低云端服务器的通讯成本,且耗时更少。毕竟“在线学习”需要更高质量的网络环境,在数据传输时会造成延迟。

谷歌的AlphaGo就是“在线学习”的典型,在今年与李世石比赛时,AlphaGo的服务器在美国中西部,通过谷歌云服务连接到韩国首尔的对局室,谷歌总部团队必须确保AlphaGo与谷歌的服务器连接顺利。

另外,“在线学习”算法存储在后台服务器或云端,在算法更新或使用时会产生高功耗,若实现算法本地化后可大大节约功耗。

据悉,2015年中国数据中心的电耗为1000亿度,年耗电量超过全社会用电量的1.5%。一些大企业的数据中心能源费用甚至能达到数十亿元。

若“片上学习”被运用在数据中心,可本地化处理数据,服务器运行带来的功耗成本也随之大大下降,大幅度降低企业的电费支出,更重要的是提升大数据挖掘、视频流处理的质量与效率。

尤其值得一提的是,“片上学习”使得终端手持设备更“智能”成为可能,手机、眼镜和无人机等的智能水平都能达到一个新的境界,实现“无网络”状态下的深度学习,同时也使超级计算机小型化成为可能。

以基因测序为例,因涉及大量的运算,目前来说依靠超级计算机处理。对于我们来说,依靠片上学习能大幅节省排序时间,医院就可以作为小型化的计算终端,提前在医院进行基因排序。

在家用智能终端方面,因为实现了“片上学习”而非过去的“在线学习”,智能路由、智能办公室服务器都能实现算法的本地化,更加保障了数据的安全和私密性。(中国日报上海分社 周文婷)

标签: