在多个研究中,人工智能已经成功击败人类医生,但在大规模落地前,医疗人工智能还有很多课要补。 行业的狂欢和泡沫,是任何一个新技术浪潮的必经之路。 最后胜出的,必是那些创造了真实价值的技术和产品。 在2017年那场史诗级的围棋对决中,人类战力最强的棋手柯洁以0∶3败于阿尔法狗,人类终被自己的模仿品——人工智能(AI)超越。 接下来,它会在哪个领域战胜人类?猜测落在医疗上。
人工智能在多个医疗细分领域曾与人类医生交手,2016年5月至今,比分结果是AI 6胜、3平、2负。医生已然落于下风。
2017年岁末,斯坦福大学教授吴恩达领导的机器学习小组开发出一种名为CheXnet的算法,能够更敏锐地捕捉胸部X光片中的肺炎迹象,在诊断肺炎的比拼中,也一举击败四名放射科医师。
这些火种足以让产业界信心爆棚。谷歌、IBM、英特尔等国际巨头和国内的“BATK”(百度、阿里、腾讯、科大讯飞),都加紧布局,一大批初创公司也喷涌而出。
人口老龄化加剧、慢性病患者群体增长、优质医疗资源紧缺、公共医疗费用攀升等多重压力,使AI入医疗被寄望成为这一全球性压力的泄压阀。 泄出的压力也正是机遇的源头。 尤其在中国,人口数量成为优势,医疗数据的基础大,可以给医疗AI提供充沛的燃料。 业内的普遍看法是,在该领域,国内企业有弯道超车的机会。
然而,AI的泡沫已然吹起,医疗能否独善其身?
一、 现在很热的人工智能在医疗领域的应用发展到了什么程度? 真正能像《终结者》里的超强人工智能并没有出现,在任何一个领域都没有。 一般按照水平高低,人工智能可以分成三大类:弱人工智能、强人工智能和超人工智能。 现在所有的人工智能研究都没有突破弱人工智能,包括全球最顶尖的alphaGo,包括深蓝,包括watson。 其基本原理都是统计数据,从中归纳出模型,只能专注完成某方面的任务,与传统工具没有本质的区别。 目前的机器学习归根到底只是高度拟合,与具有自主心智、独立意识、机器情感之类科幻影片中人工智能形象相比还差着好多个霍金。 需要担心的其实并不是人工智能的失控,是盈利目标裹挟下的商业道德失控。
二、 人工智能在医疗领域的应用是目前最火热,含金量也是较高的一个领域。 有机构调研数据显示:目前国内有近200家从事医疗人工智能的公司,累计融资金额超过180亿元人民币。 产品主要以软件为主,业务面向主体包括医院、药店、药企、研究机构、保险公司、移动医疗,可应用场景主要有医学影像、疾病风险预测、药物研发、健康管理等,不过都处于早期阶段,例如,医学虚拟助理类产品一般只能让病人做选择题,还达不到siri的水平。 百度、阿里、腾讯等BAT三巨头在医疗人工智能领域也都已经展开布局,但同样,大多产品尚未成熟,算法模型处于训练优化阶段,虽有商用试水,但没有大规模成熟应用。
三、 医疗影像是人工智能在医疗领域应用的热门中热门。 无他, 相对实现条件最成熟。 在医疗大数据中,超过 80%的数据来自于医学影像,海量数据是建模的基础。 一般做法是:从放射科提取图像;对之进行图像分割、提取图像有意义的特征区域;然后进行预处理、标注,将这些数据交给机器进行训练,训练好的模型就可以帮助医生进行影像辅助决策了。 当前流行的机器学习在处理医学影像识别上其实有天然优势,利用数据量以及计算量作为模型驱动力,卷积神经网络(CNN)以及深度神经网络(DNN)等深度学习算法已经超越传统方法的图像识别性能。 中国团队在《cells》上发表论文,称其主研发的精确诊断眼病和肺炎两大类疾病的人工智能(AI)工具,它的总体准确度达到了96.6%。
四、 当然,人工智能还可以可以进行其他医学数据收集,比如病历文献分析、诊疗结果把控等。 理论上来说,人工智能可以实现流程自动化,提升流程效率,提高诊断准确度,将在包括医学影像在内的诸多领域中发挥主要作用。 然而,想要投入大规模使用仍需要解决的两个问题:一是标准数据来源,二是成本。 大型计算能力、存储都是成本。 计算力和存储倒是越来越便宜, 这也使得越来越多的AI得以民用推广的原因(智能语音、拍图购物啊背后全是AI)。 真正的瓶颈在数据的来源以和数据的质量。 无论你想要AI看皮肤肿瘤还是看眼睛,目前主流采用的都是基于神经网络训练, 第一要点是需要海量数据进行训练。 数百万张统一标准、高质量的医疗图像常常只是打底的基础。 文章开头说的那个例子中AI虽然整体的识别率高于医生,但其实对恶性肿瘤平均符合率也只有75%,现场有的医生数据是高于它的。 很显然,它的模型还需要进一步训练,以大力完善。 数据从哪儿来?
五、
真实世界中的医疗数据非常之分散。 一方面国内医院出于数据安全和其他原因不愿意共享和公开,另一方面缺乏统一的标准,不同医院产生的影像数据质量参差,很难使用。 京津冀一些医院已经实现影像互认,这只是对于人。对于机器来说,使用影像扫描设备不同造成的机器识别依然困难,比如CT排数不同,电流、电压、扫描时间等参数不同,可能AI就需要重新训练。 所以,现在很多做AI的公司主要在一线城市和三甲医院合作,或采用一些公开的数据做初始训练,想要临床使用,这显然远远不够。 就目前的现状,仅医学数据质量的提升和共融共通,可能需要非常非常长的时间周期。 而,在数据采集的时候,谁来确保被采集者的数据安全问题?
六、 目前来说,AI依然是一个处于婴儿期的产品,技术不完善,应用昂贵。 听起来非常高大上的人工智能医疗,在目前阶段数据采集大多靠人工(有些可穿戴设备数据可以自动上传)。 在数据处理的第二阶段:数据的标注也是纯人工在做。 数据标记员需要对每一张图像进行人工分类、画框、注释、标记,以给机器学习提供先验经验。 这是一个随着AI新兴的岗位,纯劳动密集型,就像工厂流水线的工人一样,只是换成了电脑和鼠标。 可以说,AI造成了一部分结构性失业又创造了另外一些需求。
七、 畅想一下,在现有的条件下AI可以做的事情也还是很多的。 智能医疗影像识别虽然不够完美但是依然可以大量缓解医生不足的问题,医疗助手可以对病人进行轻问诊、减少过度医疗;还有人机协同的手术机器人、智能生物兼容的生理监测系统、基于人工智能开展大规模基因组识别,高通量新药研发等等。 放眼整个行业,一个逐渐清晰的场景就是,影像AI会率先支撑基层医疗。基层医院用影像AI筛查以后,发现一些有问题或者看不准的病例,再交由上级医院的医生来确诊。
再看远些,医疗AI技术如果能够突破应用关,将顶级医生的诊断能力标准化后,交给基层医院,为基层医生提供辅助诊断,会在很大程度上改善医疗资源的紧张状况。
麦肯锡全球研究所预测,大面积使用人工智能诊断疾病可能不会太快发生,即使早已入局的巨头们,也不过是入门级水平,这并不妨碍AI会成功渗入,成为医疗的底层技术,就像之前的IT技术一样。
人工智能和人类医生比谁更聪明,可能还会持续。
《新英格兰医学杂志》认为,这种争论没有意义,如何让人工智能和人类医生一起,实现任何单一方都无法提供的临床效果,才是关键。
行业的狂欢和泡沫,是任何一个新技术浪潮的必经之路。最后胜出的,是那些创造了真实价值的技术和产品。
欢迎大家阅读本公众号文章后踊跃留言,每周三将从上周留言中选出一位读者,赠送专业书籍一本!
注意: 本公众号推出投融资对接服务,可为人工智能、大数据创业企业对接投资机构,人工智能、大数据创业企业如有融资需求,可与编辑联系 |