取消
搜索历史
热搜词
视频
活动
创新2.0
I T
产业
CIO说

欧喜投资IT总监姚凯:人工智能还是人工弱智

作者:姚凯
摘要:一直关注人工智能,也试图尝试在一些场景中引入人工智能,和几家公司交谈,认识到现在市场的一些问题。恰逢前不久董小姐闯红灯的事件刷屏,不少报道讲责任归咎于“人工弱智”。
欧喜投资IT总监姚凯:人工智能还是人工弱智

欧喜投资IT总监 姚凯

近几年,人工智能的推广和宣传迅猛异常,也有不少案例落地。整个市场蓬勃发展,但也出现了鱼龙混杂的现象。人工智能的应用,目前比较成熟的技术有人脸识别、自动语音识别等。在工业领域也有一些辅助缺陷检查,以及设备维护等案例宣传。但在实际使用过程中,用户和银行对银行人工智能的服务反馈大相径庭。甚至还出现了打着人工智能的幌子后台用真人服务的报道。

人工智能的场景固定

从目前人工智能的实施来看,所有人工智能应用场景的成功案例都是比较单一的。以人脸识别为例,尽管应用的范围很广,如银行开户、机场安检、酒店入住都有它的身影。但究其根本,就是通过一个人的面部照片或实时采集的面部影像,确定这个人姓甚名谁。而后,只是在不同的情况下嵌套和调用这个场景。因为大规模的使用,目前这个识别场景已经很成熟了。但即便如此,在董小姐这个案例上,如此成熟的技术还是翻了船。我认为这主要是因为在场景应用时,存在背景的干扰,正好公交车车身广告上的人脸图片被采集到,从而被机器误识别。

这个案例从算法来看是成功的,因为人工智能成功识别出了董小姐。但从应用来看却是失败的,因为算法不能区分真人和图片。这也是很多金融APP在做人脸识别时要用户眨眼抬头,挤眉弄眼的原因。但在人工处理时,就没有这个问题,因为人做识别时是通过多个维度来判断,包括面容、语音、表情等等,所以不需要用户做出有损形象的动作。

从以上分析来看,人工智能在使用时需要对所采集到的数据质量做一个预判断,或者是控制采集的环境,或者是筛选采集的数据,其应用只有在满足人工智能设计的环境和数据要求时才可以有一个精确的结果。但就目前而言,人工智能还不能自动智能的对数据进行过滤。

在人工智能的客服领域,这个问题尤为突出。在和用户的交互过程中,很多时候用户的表达并不是算法设计的标准输入,导致客户所获得的反馈文不对题,因此用户往往抱怨这是人工弱智的表现。

人工智能自学的局限性

提到人工智能,目前市场上大家谈得最多的是卷积神经网络和贝叶斯分析。这两种算法以及相关的框架如tensorflow等,是很多公司实施的参考。

我们需要认识到,人工智能的研究已经有几十年的历史,期间出现了各种方法。全球著名的算法问题专家、机器学习领域的先驱人物佩德罗·多明戈斯在《终极算法》一书中把人工智能的算法分为五大类,我们谈的卷积神经网络和贝叶斯分析等只是其中两大类的几个方法而已。其他方法或者遇到了瓶颈有待突破、或者还在理论探索、或者在过去红极一时仍发现有缺陷。因此,我们现在谈的人工智能更多是人工智能的应用,根基在于理论的探索。

计算机技术的发展,导致运算能力的大幅度提高从而显现出现有方式的优势。简单来说,是一种蛮干的方式,拼的是体力,也就是计算机的性能。

这两种方法,都是基于对大量数据的归纳去优化算法提升精度。因此,这两种算法需要大量的数据支撑,以及后台需要打码工厂的人员进行人工识别判断、训练算法。这种方法是衡水高中和毛坦厂中学的题海战术,通过大量练习建立条件反射。我们听说的AlphaGo自己和自己下几百万盘棋就是这种练习的极致。而这只相当于4岁以下儿童的认知水平,因为随着年岁的增长,人类会逐渐开始运用推理来解决问题,用小的数据集训练。从这个角度看,现在的人工智能是“弱智”也不为过。

人工智能需要大数据

正如上面所提到的,目前的人工智能技术是一种归纳的方法,因此需要大量数据的支撑,数据越多,算法越优化。这也是国内人脸识别技术发展如此迅速的原因。首先是中国有世界上最大规模的人口,而身份证的普及采集了大量的人脸数据。同时有政府的大力支持,前期允许企业进行持续的尝试,优化算法。

但是,在工业领域推广人工智能,会存在一定的障碍。首先,对于工业生产,数据量是有限的。以缺陷检测为例,企业追求的是低缺陷,以6sigma为目标,因此生成的缺陷相对较少。当然,我们可以转换思路,训练机器识别正常产品,凡是不正常的就是缺陷品。但是,不同的缺陷是不一样的,在这种情况下,如果要对缺陷进行分类,有针对性的调整工艺,就只能人工处理了。

其次,企业对人工智能误判的容忍度相对较低。误判会导致人工成本的上升,生产效率的下降和生产节拍的变慢,这就给训练的过程带来了更高的要求。对于连续生产,目前机器图像识别的速度远远落后与于生产的速度。我听到的一个案例大概只是生产节拍的1/4。这也是机器识别应用的一个障碍。

警惕算法绑架

使用者和企业用户往往对所用的算法所知有限,如果算法的结果是可以接受的,用户倾向于相信这个算法,以后可能很少会对算法进行进一步的验证。而所有成功的算法结果都是趋于收敛的,也就是根据实际对算法进行优化,是结果和实际的偏差在一个可接受的范围。但这是对已发生的历史进行的分析。如果基于这个模型来预测未来的情况,就会出现一个算法的正反馈。你越相信模型的结果并采取行动,模型的结果就越准确,模型结果越准确,你也就越相信模型。

最后,大家就不再考虑模型的局限性了,成了一种集体无意识。这一个问题点在股票交易市场的量化交易就暴露过,有人的误操作导致大额卖单,触发交易算法认为市场趋势看空需要抛出,抛出更进一步触发算法对市场看空的认识。据报今年双11用户根据系统推荐下单的数量,已经超过了直接下单的数量。系统推荐是根据用户的购买习惯,身份等进行画像有针对性地推送的,用户认为推荐的东西基本符合自己的心意,也就懒得再在电商平台浩如烟海的产品里进一步搜索评估了。一定意义上,人已经被算法控制了。进一步来讲,如果企业用人工智能进行市场分析,发现效果不错。竞品也采用同样或相似的算法。大家基于同意的预测采取相同,这是不是事实上的托拉斯了呢?

人工智能的普及是对人工的有益补充,但我们需要认识人工智能的局限性,包括数据量和使用场景的局限,以及算法的局限性。人工智能还是一个发展中的技术,我们需要在合适的情况下使用,让人工智能为我所用,而不是被它所控制。

更多

分享到微信 ×

打开微信,点击底部的“发现”,
使用“扫一扫”即可将网页分享至朋友圈。