取消
搜索历史
热搜词
原创
活动
创新2.0
I T
产业
当前位置:首页 >人工智能 > 正文
未来AI可能只需少量的数据,而不是更多
来源:业路网  作者:佚名 2019-11-07 09:32:25
在当今的数字经济中,没有什么资产比数据更有价值。将数据称为“新石油”已经到了陈词滥调的地步。正如最近的《经济学家》杂志标题所说,数据是“世界上最有价值的资源”。

在当今的数字经济中,没有什么资产比数据更有价值。将数据称为“新石油”已经到了陈词滥调的地步。正如最近的《经济学家》杂志标题所说,数据是“世界上最有价值的资源”。

由于数据在推动机器学习和人工智能解决方案中发挥着至关重要的作用,因此今天的数据如此受到高度重视。从Netflix的推荐引擎到Google的无人驾驶汽车,要训练一个有效运行的AI系统,需要大量的数据。

结果就是对越来越大的数据产生了迷恋。根据流行的智慧,拥有最多数据的他可以构建最好的AI。从IBM到通用电气的老牌公司都在争相将自己重新命名为“数据公司”。软银的愿景基金(Vision Fund)是世界上最大,最具影响力的技术投资者,这毫不掩饰事实,即寻求初创公司支持的重点是数据资产。用软银领导人孙正义(Masayoshi Son)的话说,“那些统治数据的人将统治世界”。

随着商业和技术界越来越多地将数据定位为最终的制表王,人们对一个重要现实的关注已很少:人工智能的未来可能会大大减少数据密集性。

人工智能的前沿,正在进行各种努力来开发不需要大量标记数据集的改进形式的AI。这些技术将重塑我们对AI的理解,并以深刻的方式破坏业务格局。行业领导者最好注意。

综合数据

今天,为了训练深度学习模型,从业人员必须收集成千上万,数百万甚至数十亿的数据点。然后,他们必须在每个数据点上粘贴标签,这是一个昂贵且通常是手动的过程。如果研究人员不需要费力地收集和标记现实世界中的数据,而是可以从头开始创建他们需要的确切数据集怎么办?

领先的技术公司(从Nvidia等知名竞争对手到Applied Intuition等初创企业)正在开发方法,以几乎完全免费的方式完全数字化地制作高保真数据。这些人为创建的数据集可以根据研究人员的确切需求进行定制,并且可以包含数十亿种替代方案。

Nvidia仿真技术主管Mike Skolones说:“出去改变现实世界中的照明非常昂贵,而且您无法在室外场景中改变照明。”但是您可以使用综合数据。

随着合成数据准确地逼近现实世界数据,它将使人工智能民主化,削弱专有数据资产的竞争优势。如果一家公司可以通过仿真快速生成数十亿英里的真实驾驶数据,那么Waymo投资十年收集的几百万英里的真实世界驾驶数据有多有价值?在可以按需廉价地生成数据的世界中,跨行业的竞争动态将被颠覆。

随着人工智能在未来几年变得越来越智能,它可能需要更少的数据,而不是更多。

少量学习

与当今的AI不同,人类不需要学习成千上万的例子就可以学习新概念。正如Google一项颇具影响力的研究论文所说:“一个孩子可以从一本书中的一张照片中概括出“长颈鹿”的概念,但是我们最好的深度学习系统需要成百上千个示例。

为了使机器智能真正发挥其功能,它应该能够从少数示例中学习和推理人类的行为。这是AI中一个重要领域的目标,即“少数学习”。

鲜为人知的学习取得了令人兴奋的最新进展,特别是在计算机视觉领域。(当仅使用一个或零个数据点时,该技术分别称为“单次学习”或“零次学习”。)研究人员已经开发了可以在适当情况下实现最新性能的AI模型。基于一个或几个数据点的面部识别等任务。

目前,这些进步仍主要局限于学术界。但是,随着小数据方法在未来几年中从学术界转移到商业化生产,它们将从根本上改变AI的完成方式,从而侵蚀大数据资产在此过程中的重要性。

深度学习先驱,谷歌和百度前AI负责人安德鲁·吴(Andrew Ng)解释说:“如果在智能手机上进行外观检查,则不会有一百万张刮擦智能手机的照片。”“如果只用100或10张图像就可以工作,那么它将打破许多新的应用程序。”

强化学习

在不需要大量实际数据的情况下取得重要进步的最终AI方法是强化学习。

在强化学习中,一个AI模型不是通过蛮力数据摄取而是通过自我指导的反复试验来学习:让模型在给定的环境中尝试不同的动作是放任的,并且在收到关于哪个模型的反馈时逐渐优化其行为行动是有利的。

强化学习助长了AI突破,这是近年来获得最广泛宣传的突破之一:DeepMind在古老的Go游戏中击败了世界上最好的人类玩家。

DeepMind的原始模型AlphaGo通过结合历史数据和强化学习来学习游戏。但是真正的非凡成就来自更复杂的后继者AlphaGo Zero。除了游戏规则外,AlphaGo Zero绝对没有任何先验数据。没有其他输入,仅通过与自己的对战,AlphaGo Zero就比任何人或机器都更了解Go的游戏:它击败了最初的AlphaGo 100-0。

“专家数据集通常很昂贵,不可靠或根本不可用,”AlphaGo Zero团队解释道。“相比之下,强化学习系统是根据自身的经验进行培训的,原则上可以使它们超越人类的能力,并可以在缺乏人类专业知识的领域中运作。”

除棋盘游戏外,强化学习正在机器人、化学工程、广告等领域找到实际应用。强化学习代表了AI中的一种新颖方法:与其不需要大量的预先存在的数据集,它还可以生成自己的数据,并随着时间的流逝而学习。随着它进入商业应用,强化学习将代表对大数据正统观念的又一挑战。

结论

人工智能的世界在不断变化。随着该领域的前沿技术飞速发展,当今最前沿的方法论可能会在明天过时。

目前,最主要的AI范例是深度学习,它依赖于多达数十亿的标记数据点来训练神经网络识别模式并做出预测。由于神经网络非常渴望数据,因此业务和技术领导者已沉迷于积累最大的数据集,希望数据将成为AI驱动世界中最终的竞争优势。

但是深度学习是AI漫长道路上的一个终点,而不是其最终目标。将当今的神经网络的海量数据需求作为长期业务战略的基础,是无法理解未来AI的未来范式转变。合成数据、快速学习和强化学习等领域的最新进展表明,随着AI在未来几年变得越来越智能,它可能需要更少的数据,而不是更多。

这些新范例将重塑AI格局,并重新定义公司竞争的条件。对于有远见的商人和技术人员来说,这将是一个巨大的机会。

编辑:yunyun
关键字:     AI  大数据  数字化 
活动 直播间  | CIO智行社

分享到微信 ×

打开微信,点击底部的“发现”,
使用“扫一扫”即可将网页分享至朋友圈。