取消
搜索历史
热搜词
原创
活动
创新2.0
I T
产业
当前位置:首页 >互联网•IT > 互联网+ > 互联网化 > 正文
人工智能产业发展繁荣离不开数据驱动和计算能力的提升
来源:学习时报  作者:佚名 2017-12-28 12:07:29
人工智能作为当今世界上最重要的科技之一,其走过了60年“三起两落”的发展历程,已融入人们生产生活的各个方面。“智能+”时代正在加速向我们走来。在人工智能风口到来之际,构建应用场景、找准突破口成为人工智能应用落地的重中之重。

人工智能作为当今世界上最重要的科技之一,其走过了60年“三起两落”的发展历程,已融入人们生产生活的各个方面。“智能+”时代正在加速向我们走来。在人工智能风口到来之际,构建应用场景、找准突破口成为人工智能应用落地的重中之重。

人工智能产业发展繁荣离不开数据驱动和计算能力的提升。大数据、计算能力、人工智能之间正在形成一种共生生态,大数据人工智能提供源源不断的动力,人工智能衍生出了诸如深度学习、强化学习、迁移学习、对抗学习等新型算法,硬件计算能力的有力提升有效地缩减了算法迭代改进周期。未来可从四个方面形成合力,加速人工智能应用落地。

明确应用场景边界。人工智能技术尚未达到强人工智能水平,产业落地过程中应避免好高骛远。例如,机器人脸识别在绝大多数情况下比人识别的效果要好,但是在需要知识、想象力的特殊情况下,与人脑还是存在较大差距。现阶段以深度学习为代表的人工智能技术并不善于解决通用性问题,人工智能技术要实现产业落地并形成商业价值,需要清晰其所能解决的特定领域问题,并有明确的应用场景边界。将人工智能的功能需求限定在有限的特定问题边界之内,这样得出的解决方案才能相对可行可靠,如借助视听传感器能够自主规划扫地方案的扫地机器人等。

闭环数据反馈循环。谷歌、Facebook、英特尔、微软、苹果、特斯拉,中国的BAT等人工智能前沿公司,通常都具有一个共同的特征——闭环的数据反馈循环。例如,Google、百度等互联网广告系统能够根据用户点击及输入等操作,自动收集到用户一手数据,抽取关键特征并输入深度学习神经网络,神经网络训练好后能用于对用户行为的预测,进而提高用户体验。从应用终端收集数据,再用数据训练模型,之后用模型提高用户应用体验,用户应用后又产生新的数据,这就形成了闭环的数据反馈循环。其内部就可以完成自动数据收集、标注、训练与反馈,这使得人工智能算法实时迭代优化的更加便利。

海量高质量数据。随着移动互联网和物联网的快速发展,数据量正在以指数级增加,根据IDC统计,全球数据总量预计2020年达到44ZB,中国数据量将达到8060EB,占全球数据总量的18%。对于自然语言、音频和视频等数据,其分析越来越聚集于提取其中的语义,包括情感分析、文档主题模型、依存模型、问答语义分析等。以深度学习为代表的人工智能技术,本质上是一个具有多层的神经网络,通过大数据计算来自动学习最终的网络参数,不同的网络参数能够识别出不同的物体,但需要依赖规模庞大的高质量带标签数据集,才能够保证其学习质量。

高性能计算硬件。深度学习模型需要很高的内在并行度、大量的浮点计算能力以及矩阵运算,按环节可分为前期训练、云端推理、终端推理等三个阶段。在前期训练和云端推理环节,需要进行规模庞大的运算量,CPU+GPU架构成为目前多数人工智能企业的主流选择。然而,构建GPU集群的成本非常高昂,仅购置一块Nvidia Tesla K80的费用近4万元。FPGA具备较高的性能功耗比和重构灵活性,百度采用FPGA打造百度大脑专用AI芯片,微软打造的Brainwave平台也是基于英特尔Stratix 10 FPGA芯片。在终端推理环节,由于智能手机、语音交互、VR/AR等终端设备需求不同,需要定制化、低功耗、低成本的嵌入式解决方案,其市场呈现更加多样化竞争态势,如寒武纪的1A处理器、地平线的BPU芯片等,华为Mate 10的麒麟970芯片搭载了神经网络单元NPU,使得其在处理相关人工智能任务(如图像识别等)时有50倍能效和25倍性能的提升。

编辑:程梦玲
关键字:     人工智能  数据分析  云计算  产业发展   
活动 直播间  | CIO智行社

分享到微信 ×

打开微信,点击底部的“发现”,
使用“扫一扫”即可将网页分享至朋友圈。