取消
搜索历史
热搜词
原创
活动
创新2.0
I T
产业
当前位置:首页 >互联网•IT > 互联网+ > 产业互联网 > 正文
医疗AI的技术理解及审批雷区
来源:美柏医健公众号  作者:程一盛 2018-08-06 09:20:36
最近一两年来,医疗AI一直是投资界最热门的话题之一,同时也有大量资本涌入这个充满想象力的领域。但是根据笔者对该领域创业公司的观察,发现已经有一些同质化比较严重的产品出现,同时一些发展较快的企业已经开始寻求取得监管部门的认证。

对于医疗产品,获得审批才能走向市场,审批的重要性不言自

明。但很多公司在这个阶段却不是很顺利,笔者希望通过本文给投资人和创业者梳理一下医疗AI产品在监管部门审批中可能存在的雷区。本文主要有两个方向:第一是从技术角度来理解 AI,着重于较为人知的图像识别方面的AI。第二是关于医疗AI产品在获得审批方面可能存在的雷区,着重通过产品的核心要素来分析报证过程中可能存在的“雷区”。

1

医疗AI简述

医疗AI 定义金字塔

\

基础层

:通过软硬件的基础设施,收集用户、药物及病理数据,并使数据互通互联,为人工智能的应用提供支持与可能。

技术层

:通过语音/语义识别、计算机视觉技术,对非结构化数据进行分析提炼。“学习”大量病理学数据文本,使机器掌握问答、判断、预警、实施的能力。

应用层

:是指人工智能与不同细分领域的结合,以解决医疗行业中的某种业务需求,如智能诊断、药物研发、智能健康管理、智能语音等医疗场景。

以上引自——鲸准数据相关报道[1]。

目前来看,行业巨头偏向底层技术,技术壁垒比较高,市面上合格的人工智能人才比较匮乏,市场提供了非常有竞争力的薪资。目前创业公司扎堆应用层方面的项目,这样的项目比较容易变现,开发容易见效。

对比国内和国外的医疗人工智能图谱,国内最热门的是医学影像识别,国外热门的有医学影像以及帮助药物开发方面的应用。对于药物研发产业来说,研发效率和成功率的提升非常重要,如果我们用研发费用作为参考,来计算市场潜力,我们会明白这样的选择无疑是很合理的。国内也有相关方面的公司,并且进展良好,但是相对比例较低。

医疗是人工智能各个应用领域中相对活跃的。大量创业公司在2014年之后集中涌现,但是行业独角兽显然起步更早,比如新晋独角兽Heartflow,以CT-FFR产品为核心,在2014年就获得了FDA批准。2018年4月,FDA也批准了IDx公司的第一个AI读片软件IDx-Dr。国内外的投资机构对AI也格外青睐,投资项目数量和金额在这几年都明显增长。

\

但是无论国内还是国外,目前AI项目的融资轮次都还集中在早期,只有少数公司进行到了B+轮之后,更多的是天使轮以及A轮。整个行业比较年轻化,集中度低,尚未出现明显的独角兽或者垄断。

总的来说,全球人工智能同步性高,美国,欧洲,中国都有良好的人才储备,大部分企业还处在早期。创业公司机会很大,但是同时竞争也会非常激烈。医药巨头们纷纷搭建自己的AI团队,创业公司最好避免与大公司直接竞争。真正好的项目,开发进度快的项目肯定会受到资本青睐。

2

以技术角度来理解AI项目

根据笔者与学校Machine Learning 授课教授交流,文献阅读以及各家医疗AI公司披露的公开信息和观点来看,我们可以简单地认为,目前,“弱人工智能”的核心是数据而不是算法。

加州大学洛杉矶分校UCLA、统计学和计算机科学教授、视觉、认知、学习与自主机器人中心主任朱松纯曾在视觉求索的一篇文章《浅谈人工智能:现状、任务、构架与统一 | 正本清源》中提出了乌鸦智能和鹦鹉智能来比喻弱人工智能和强人工智能

乌鸦能自主分析判断,通过衔小石头来帮助自己喝到瓶子中的水,这可以认为是我们一直想达到的人工智能的状态,但是目前人工智能产品更多的是鹦鹉学舌,现在市场上的AI产品多是用大数据量训练出来的,是单一方向上的“专家”。

这一轮人工智能有前所未有的进步,可以归结为以下两个原因:

第一, 大量数据的积累。特别是在医学方面,随着医院各个系统的电子化和信息化,可以用于训练的数据大量累积。

第二, 计算机计算力的提升。近些年,以云计算以及GPU为代表的计算力提升极大减少了训练模型所需要的时间。[2]

将大量的数据和计算力结合,研究人员得以在较短的时间里完成模型的搭建,并做出原型软件。基于以上认识,我们可以归纳出分析A I项目的几个要点:

核心开发团队最好是人工智能人才和医疗人才兼备。目前多数团队在算法改进方面都是人工智能团队,这样容易造成核心算法同质化严重。以图像识别为例,各个团队和核心底层算法都是卷积神经网络,如果在算法层面没有独到之处,那非常容易在数据量累积到一定程度,各家软件的特异性,敏感性趋同。国内团队方面,图玛深维的首席科学家,兼有生物医学工程和计算机双重背景,这样的复合型人才价值是巨大的。复合背景的团队可以着重关注。

注意甄别各个团队用的数据情况。在训练数据方面,数据的来源,质量,种类都需要注意,数据来自公开数据集还是从固定医院采集,包括使用仪器都应该纳入考虑范围。在测试数据方面也是同样的考量,主要是考虑到人工智能产品的试用范围。

项目需要和医院有良好的合作关系以及医生对产品的认可。毕竟产品最终还是要交付给医院方面用的,和业界能保持紧密的联系有助于项目的开发以及后续改进。

目前医学的发展肯定不是完美的 ,学界可能对人体的认知存在问题,所以如果我们用过多的规则去规范AI可能适得其反。深度学习作为AI的最大特性,它是优点,因为它可以自己改进自己,但是从某种意义上讲就是一个不同的产品,所以这样的特点也给监管层带来了困扰。

在概率统计的框架下,目前很多公司采用的模式都是针对一个特定的任务来设定一个Loss function,用大量的数据来训练一个模型,这就导致了模型可能很难解释。而且,在医学图像识别方面用的核心底层算法神经网络本来就是一个没有theory,但是有很多engineering的算法。这个问题可能会让监管层感到困惑。

3

向监管机构(FDA,CFDA)

报证中可能存在的雷区

以IDx-DR和全自动数字病例分析仪和DNA细胞自动检测分析仪为例子。

目前FDA批复的唯一医疗AI读片软件IDx-DR 用于糖尿病视网膜病变, 但该产品的问题在于限定了拓普康(Topcon)的NW400 眼底镜,只能看糖网。

已经被CFDA,CE和FDA批准的武汉兰丁,DNA细胞自动检测分析仪(审批过程中没提到AI,但宣传口径都是AI),有擦边球的感觉。

\

目前CFDA,涉及AI的产品,无论是申报二类还是三类器械,都需要去中国食品药品鉴定研究院做鉴定。但是目前中检院现在只有2个库,一个是肺结核数据库,一个是眼底数据库。如果不是这两个领域的,可能需要等中检院建完了库才能拿到认证,认证时间不可确定,需要格外谨慎。需要跟进中检院建库的进度。但是已经建库的方面问题在于行业竞争已经非常激烈了,需要考虑风险。

根据IDx-DR的审批结果, 它的FDA批件更多是一个象征意义,由于仪器限制的存在,导致了该产品在市场的可用场景过少。在新产品的审批的时候,必需考虑到AI产品核心模型的兼容性问题。新产品需要在不同图片质量,不同仪器情况下都有较高的敏感性和特异性。

武汉兰丁的模式值得思考,笔者认为,该模式存在监管层面风险。这样的tricky的的技法一旦受到监管层关注,很有可能前功尽弃,甚至还会受到追加处罚。

根据动脉网对武汉兰丁的专访,以及披露出来的CFDA批准函原件,文件对武汉兰丁的产品的界定如下:

该产品有硬件和软件两部分组成,其中硬件部分由光学显微镜、自动平台、CCD摄像头、计算机及计算机外设组成。软件部分由三维自动定位调焦模块、图像采集与存储功能模块、图像处理功能模块、图像分析功能模块、诊断报告输出功能模块及远程会诊功能模块组成。

在产品界定里面没有提到任何人工智能相关描述,但是武汉兰丁现在所有宣传口都在以人工智能的名义做营销点。根据兰丁方面的宣传看,他们仪器很有可能是实质上运用了人工智能技术。

现阶段全世界都处于医疗AI的风口,笔者对于武汉兰丁的做法存保留意见。

4

总结

本文介绍了医疗AI的基本公司分类以及目前市场上比较成功的项目Heartflow 和IDx-Dr。从技术角度简单介绍了医疗AI发开的关键点, 并结合已经获得FDA和CFDA产品以及从中检院了解到的信息和大家探讨了医疗AI在审批过程中可能存在的雷区。基于获批的相关案例,以及各国监管机构在对待AI审批的准备方面,无论是正在创业的医疗AI公司或者对此类产品有兴趣的投资公司,都需要酌情考虑。希望本文章能让读者有所启发。

参考文献:

[1]: "一张图看AI医疗:241起国内融资,帮你发现AI医疗的下一个热点." 36æ°ª. Accessed July 23, 2018. http://36kr.com/p/5090544.html.

[2]:《视觉求索》微信公众号——浅谈人工智能:现状、任务、构架与统一 | 正本清源

编辑:申栋栋
关键字:       卫生医疗  人工智能  物联网 
活动 直播间  | CIO智行社

分享到微信 ×

打开微信,点击底部的“发现”,
使用“扫一扫”即可将网页分享至朋友圈。