龙虾不能和什么一起吃| 装修公司名字取什么好| 什么东西比乌鸦更讨厌| 坚信的意思是什么| 女性风湿吃什么东西好| 沙门氏菌用什么药最好| 所什么无什么| 什么叫三观不正| 六月二号是什么星座| 口腔溃疡喝什么水| 多种维生素什么牌子的效果最好| 白细胞十十是什么意思| 菊花长什么样| 低密度结节是什么意思| 本科和专科是什么意思| 灰指甲是什么原因引起| 芋头不能和什么一起吃| 素女经是什么| 直捣黄龙是什么意思| 喝豆浆拉肚子什么原因| 十二星座什么第一名| 关联词是什么意思| 早上醒来手麻是什么原因| 六月六是什么节日| 斗志昂扬是什么意思| 路人甲是什么意思| 普拉提是什么意思| 什么叫脂肪肝| 心口疼是什么原因引起的| 血压过低有什么危害| 住院号是什么| 上火吃什么| 118代表什么意思| 晚上吃什么不发胖| 红色加绿色是什么颜色| 用什么泡脚能减肥| 细菌性感冒吃什么药效果好| 春代表什么生肖| 阳历7月15日是什么星座| 推特为什么注册不了| 电信查流量打什么电话| 俄罗斯乌克兰为什么打仗| 老年人出虚汗是什么原因引起的| 小孩用脚尖走路是什么原因| 胰岛素偏高是什么意思| 老打瞌睡犯困是什么原因| 睾丸疼吃什么药| 守株待兔是什么意思| 儿茶是什么中药| rinnai是什么品牌| hf是什么| 拜土地公要准备什么东西| 小金人车标是什么车| 老是睡不着觉是什么原因| 什么的阳光| 2.10是什么星座| 喝中药尿黄是什么原因| ph值是什么| 吃什么最补血而且最快| 一直鼻塞是什么原因| 清真是什么意思| 黄牛票是什么意思| tt是什么意思| 九月二十八是什么星座| 1996属鼠的是什么命| 保税区是什么意思| 颈动脉b超是检查什么| acne是什么意思| 幡然醒悟是什么意思| 下午四五点是什么时辰| 一个人在家无聊可以做什么| 中国一词最早出现在什么时候| 什么叫高尿酸血症| 玫瑰花有什么作用| 蛋白过敏是什么症状| 跳楼是什么感觉| 囊肿是什么| 颈椎病头晕吃什么药好| 乌龟一般吃什么| 口红是什么做的| 吃洋葱有什么好处和坏处| delsey是什么牌子| 什么叫道德绑架| 五年生存率是什么意思| 什么什么不已| 坐车头疼是什么原因| hpc是什么意思| KP什么意思| 膀胱炎看什么科| 男性湿热吃什么药最好| 放疗起什么作用| 水稻什么时候播种| 梦见自己生小孩是什么征兆| 黄马褂是什么意思| 嗣女是什么意思| 失意是什么意思| 炖排骨什么时候放盐最好| 推头是什么意思| 我的星座是什么| 东边日出西边雨是什么生肖| 艾滋病通过什么传染| 公貔貅和母貔貅有什么区别| 未融资是什么意思| 打鸟是什么意思| dj管是什么| 型男是什么意思| 查肾功能挂什么科| 梦见别人给自己剪头发是什么意思| 什么是爱国| 砍单是什么意思| 樱桃补什么| 碳是什么| 窈窕淑女君子好逑是什么意思| 内膜薄吃什么增长最快| 牛排和什么一起炖好吃| 若叶青汁有什么功效| 金光是什么生肖| 青梅是什么意思| 俗不可耐是什么意思| 砖红色是什么颜色| 梦见青蛙是什么意思| 洋葱有什么好处| 睡觉为什么要枕枕头| 什么的饭菜| 安娜苏香水什么档次| 齁是什么意思| 慢阻肺吃什么药| 看幽门螺旋杆菌挂什么科| 53年属什么| 想一出是一出什么意思| 上坟可以带什么水果| 丰富的近义词和反义词是什么| 今天的日子适合做什么| 什么水果含铁量最高| 膝盖背面叫什么| 费玉清为什么不结婚| 早搏是什么| 上嘴唇上有痣代表什么| 拍拖是什么意思| 上海古代叫什么| 血糖高看什么科| 蓝柑是什么水果| 慧根是什么意思| 什么减肥好| 男性看下面挂什么科室| 有什么| 血脂高挂什么科| 什么的飞翔| 轻度抑郁有什么症状| 93年的鸡是什么命| 什么是玄关| 青鱼和草鱼有什么区别| 尿路感染吃什么药比较好的快| 经常感冒吃什么增强抵抗力| 黄体破裂有什么症状| 右手臂酸痛是什么前兆| 敷设是什么意思| 芒果可以做什么美食| 孝是什么| 螳螂捕蝉黄雀在后是什么意思| 阳历2月份是什么星座| 枸杞和山楂泡水喝有什么功效| 紫颠是什么病怎样治| 胸痛挂什么科| 五字五行属什么| 家里进黄鼠狼是什么预兆| 麻木是什么意思| 扁平足是什么意思| 耳轮有痣代表什么| 层林尽染是什么季节| 龙须菜是什么植物| 闪回是什么意思| 女性尿浑浊是什么原因| 嘢是什么意思| 1968属什么生肖| 81年属鸡是什么命| 大姨妈期间吃什么好| 紧急避孕药什么时候吃| 什么食物含锌最多| 桃子又什么又什么填空| 小孩嘴唇发白是什么原因| 124什么意思| 桃树什么时候修剪最好| 兼性厌氧是什么意思| 炖肉放什么调料| 4月4号是什么星座| 滤泡性咽炎吃什么药| 巨蟹座有什么特点| 为什么不快乐| 皮肤瘙痒用什么药治疗| 大学生当兵有什么好处| 姜维属什么生肖| 冰粉的原材料是什么| 去迪拜打工需要什么条件| 杨柳代表什么生肖| 男人前列腺在什么位置| 微商是什么意思| 发泡胶用什么能洗掉| 酸西地那非片是什么药| 酸菜鱼用什么鱼| 吃生洋葱有什么好处| 属马的和什么属相不合| 同房出血是什么原因| 丰都为什么叫鬼城| 神经电生理检查是什么| 祖师香是什么意思| 什么样的防晒霜比较好| 彩虹旗是什么意思| 女人左眼跳是什么意思| 雾化是治疗什么的| 红痣用什么药膏去除| 中医内科主要看什么| 中指长痣代表什么| 胸腔积液是什么原因引起的| 痛苦是什么意思| 部队股长是什么级别| 双侧附睾头囊肿是什么意思| 喉结是什么| 为什么不一样| 满月脸是什么意思| 罗马布是什么面料| 文化传媒是干什么的| 核酸是什么| 羽毛球拍磅数是什么意思| 星字属于五行属什么| 膝关节痛挂什么科| 2023年属什么| 洗内裤用什么洗比较好| 什么是生育津贴| nf是什么单位| 衣原体是什么| 肾低密度灶是什么意思| 中将是什么级别| 钠尿肽高是什么原因| 腊肉炒什么好吃| 推特为什么注册不了| 孕妇什么东西不能吃| 儿童遗尿挂什么科| 什么是矫正视力| 乌龟浮水是什么原因| 豆浆什么人不能喝| 胸部b超挂什么科| 偶发室性早搏是什么意思| 没什么打什么| 二月九号是什么星座| 天性使然什么意思| 肛门疼痛是什么原因引起的| 苯磺酸氨氯地平片是什么药| lodge是什么意思| 碳酸钠为什么显碱性| 负荆请罪的负是什么意思| 蓝莓有什么功效| 甲亢有些什么症状| 首战告捷什么意思| 皮肌炎是什么病| 游乐场都有什么项目| 101什么意思| 顶臀径是什么意思| 雨露均沾是什么意思| 白条是什么| 肝硬化吃什么水果好| 鲤鱼喜欢吃什么| 本科是什么意思| 淋巴结反应性增生是什么意思| 百度
您正在使用IE低版浏览器,为了您的雷峰网账号安全和更好的产品体验,强烈建议使用更快更安全的浏览器
此为临时链接,仅用于文章预览,将在时失效
医疗科技 正文
发私信给李雨晨
发送

0

麻省理工教授申请专利 发现已被中国初中生抢先

导语:如何定义和评价平安集团在医疗科技层面的未来?
百度 在1月的匈牙利公开赛上,于子洋也是在资格赛小组赛输掉外战出局被禁赛,此次德国公开赛重演悲剧,还在U21比赛中再次掉链子输掉了外战。

编者按:2020 年 8 月 7 日,全球人工智能和机器人峰会(CCF-GAIR 2020)正式开幕。CCF-GAIR 2020 峰会由中国计算机学会(CCF)主办,雷锋网、香港中文大学(深圳)联合承办,鹏城实验室、深圳市人工智能与机器人研究院协办。从 2016 年的学产结合,2017 年的产业落地,2018 年的垂直细分,2019 年的人工智能 40 周年,峰会一直致力于打造国内人工智能和机器人领域规模最大、规格最高、跨界最广的学术、工业和投资平台。

在8月9日的医疗科技专场上,来自平安集团的首席医疗科学家谢国彤博士以《用人工智能重塑医疗:平安医疗科技的实践和探索》为题,分享了平安集团在医疗领域的深刻认知和实践。

平安首席医疗科学家谢国彤:两大基础平台与四大算法领域,详解金融巨头的医疗科技版图 | CCF-GAIR 2020

谢国彤博士认为,所有AI都无非四个要素:数据、算力、算法和应用。在这四个要素下面,平安共研发了2个基础平台和4个医疗AI算法领域,以支持医疗的各种分析和推理,目前有1.6万家医疗机构,43万医生在使用。

两个基础平台主要是赛飞AI平台(算力)和医疗五大库及知识图谱(数据)。

谢国彤表示,医疗五大库及知识图谱,首先是从数据端出发,分四步去解决数据处理难题:第一,去掉噪音,补全数据,提升数据输入质量;第二,结构化,通过数据和文本抽取,实现数据可用;第三,标准化,把不同来源的医疗数据名称统一;第四,利用算法挖掘疾病的风险因子或者治疗方法。

而赛飞AI平台则主要是通过AI平台化战略,解决AI产品算力和落地的基础性问题。

谢国彤说到,平台的目的就是让医疗数据科学家专注在自己领域内,由平台去完成AI通用算法、智能标注、分布式训练加速、高性能压缩模型部署等通用问题。

据雷锋网了解,在这两大基础平台之上衍生的4个医疗AI算法领域,主要侧重在疾病预测、智能影像、AskBob辅助诊疗和疾病全周期管理四个场景。

在最后的总结中,谢国彤表示,医疗人工智能是利国利民的事情,人命关天,需要AI界和医学界的紧密合作,用AI的算法解决真实的需求,保证模型的安全性、可用性,才能对“健康中国”产生真正的价值。

以下为谢国彤的现场演讲内容,雷锋网作了不改变原意的编辑及整理:

谢国彤:各位现场和线上的朋友,大家好。我叫谢国彤,负责平安的医疗科技。很高兴今天有机会跟大家分享平安在医疗科技方面的进展。

平安首席医疗科学家谢国彤:两大基础平台与四大算法领域,详解金融巨头的医疗科技版图 | CCF-GAIR 2020

在过去五年时间,平安积累了大量的医疗业务。平安医疗有三个支柱:患者端、医院端和支付端。顶天立地还各有一横一纵。

患者端,平安目前有全球最大的互联网医疗平台——平安好医生,3亿多注册用户,每天的问诊量在80万次以上;医院端,平安通过智慧医院的解决方案,在1.6万家医院赋能,还有自己的检测中心、药品集采平台,很多跟医院相关的业务;保险支付是平安的本行,平安有1亿6千万的保险客户,平安医保科技为两百多个城市政府做医保精算、核赔各种业务。

一横一纵,上面一横是面向政府。平安拥有的智慧城市、智慧卫健业务,在150多个城市帮助政府提供更好的公共卫生、全民信息平台和医共体的解决方案。下面一纵是我负责的平安医疗科技,从每个业务中沉淀数据,把数据变成AI模型。再反哺赋能给各个业务。

两大平台与四大算法领域

今天,我主要聚焦平安医疗科技的工作。所有的AI无非是四个要素:数据、算力、算法和应用。

如果把我们的工作按照四个要素来整理,是2个基础平台和4个算法领域。

平安首席医疗科学家谢国彤:两大基础平台与四大算法领域,详解金融巨头的医疗科技版图 | CCF-GAIR 2020

基础平台:包括五大库数据及知识图谱平台。这个平台汇聚了平安各种医疗业务沉淀下来的数据,将其知识化后变成知识图谱,支持上层的各种分析和推理。

赛飞AI平台:让做医疗的数据科学家专注在自己的领域里,把AI的通用算法、分布式的训练加速、高性能压缩模型部署等通用问题交给平台来做。

首先来说一下,我们的五大库知识图谱。

平安首席医疗科学家谢国彤:两大基础平台与四大算法领域,详解金融巨头的医疗科技版图 | CCF-GAIR 2020

在沉淀大量数据后,我们以疾病为中心构建知识图谱,把疾病的症状、检查检验、用药、关键的常用处方、疾病手术、疾病并发症、疾病风险因素、疾病和基因的关系,包括哪个医院、哪个医生在哪个疾病领域比较擅长,发表过什么科研成果的信息都收集起来,构建出一个包含300万的医学概念、3300万的关系和3000万医学证据的医疗知识图谱,支持后续所有的应用。

平安首席医疗科学家谢国彤:两大基础平台与四大算法领域,详解金融巨头的医疗科技版图 | CCF-GAIR 2020

构建这样的图谱,我们把它总结为“四化”的过程。拿到数据后,要经过四个关键步骤:

第一步,去噪。去掉噪音,补全数据,提高输入数据的质量。

第二步,结构化。图谱里有大量文本数据,要做各种实体、关系进行抽取抽取,对文本进行分类、标签,让数据变得可用。

第三步,标准化。不同来源的医疗数据,对疾病、药品、检查检验的描述是不一样的。我们要用大量的NLP技术,将各种医学术语统一化、标准化,才能进行下一步的分析。

第四步,挖掘。利用各种算法,从数据中挖掘疾病的风险因子或者常用的治疗方法,这些信息最终会沉淀在我们的知识图谱里。

平安首席医疗科学家谢国彤:两大基础平台与四大算法领域,详解金融巨头的医疗科技版图 | CCF-GAIR 2020

其次,我介绍一下赛飞AI平台,这个平台的目标要提供从模型训练到模型部署的一整套平台级服务,让医疗数据科学家专注在医疗领域,不用去考虑通用的问题。

赛飞的工作很多。举一个例子,我们在进行组织病理影像分析时,一个病理的影像大概有10亿像素,如果一个医生要很完整的把肾小球和肾小球里的内皮细胞、细膜细胞都标注完,一个小时都不能完成。

但是,所有的片子都有必要去标注吗?不见得。我们利用主动学习的方法,挑选信息量最大的片子。后来我们发现,标注52%的训练数据,就可以达到跟此前标注完所有数据差不多的效果。

再比如分布式加速。现在的NLP模型庞大无比,不管是现在最火的GPT-3拥有的上千亿参数,还是常用的BERT,都是几亿参数的大模型。我们参加ACL比赛时,用了赛飞分布式加速能力,在20天之内训练了281次,不停把模型的精度推到极致,最后拿到冠军。

这就是分布式加速给模型训练带来的价值。

再比如模型压缩的例子,这是非常现实的场景:很多AI模型希望跟硬件进行整合,但是模型很大,硬件存储却很小。我们的一个眼底OCT模型大小是6G,一个OCT设备存储是2G,无法把这个模型放在存储里。最后,我们把6G的模型压缩到原来的四分之一,精度只损失一点点,最终完成软硬一体的计算。

当然,除了在医疗领域,赛飞还可以拓展变成更加通用的AI平台。

平安首席医疗科学家谢国彤:两大基础平台与四大算法领域,详解金融巨头的医疗科技版图 | CCF-GAIR 2020

现在平安有16个子公司、42个部门、300多名数据科学家在赛飞平台上完成2.5万次模型训练。同时,它是参加比赛刷榜的神器,我们拿了7个世界第一,利用这个平台,极大地加快建模速度,也有很多相应论文的发表。

说完底层的技术,我们再看上层的四个算法领域,其中大家比较熟悉的是影像。

平安的业务很广,如果聚焦在医疗AI的算法场景里,则是从疾病的预测、基于影像的辅助诊断、AskBob辅助诊疗和患者院外管理的四大场景,我们有大量的模型算法和工作。

从应用的角度来看,今年,平安所有的医疗科技服务有1.75亿次的调用,服务了1.6万家医院,43.8万名医生用户每天在使用我们的医疗科技服务。

平安首席医疗科学家谢国彤:两大基础平台与四大算法领域,详解金融巨头的医疗科技版图 | CCF-GAIR 2020

疾病预测,预测的不是人的命运,而是人的生命。比如预测重症患者院内死亡风险、慢性病患者的并发症风险、人群发病风险。新冠疫情期间,平安医疗科技向国务院办公厅、各个部委提交了130多期预测报告,预测什么时候新增发病人数会到顶,什么时候出院人数会急剧增加,最终死亡率是多少,从而帮助政府做决策。

在疾病的预测过程中,有非常多的关键技术:

一、数据修复。拿到100条记录,要求所有的关键数据都有数值,最后剩下一条就不错了。我们在IEEE ICHI参加了Data Imputation的比赛拿了冠军,我们利用数据所谓的横向、纵向和斜向关系,分析数据之前、之后和相关检测检验的信息,猜测缺失的数据可能是多少,均有不错的效果。

二、特征工程。很多预测是从病例中进行挖掘,这里也有挑战:数据是多模态的,不像影像相对单纯。

在这次新冠疫情里,预测有60%的ICU患者发生了不同程度的脓毒症,脓毒症是ICU的第一大杀手。ICU里的信号非常复杂,有心率血压、脉搏等生命体征信息,并且时间序列是连续的。我们利用很好的多模态数据特征工程的方法,提前6个小时预测患者发生脓毒症的风险,精度比目前最好的方法高20%,这个工作今年发表在重症医学顶级期刊CCM上。

三、可解释机器学习建模。很多医生是很难接受黑盒模型的,尤其是预测,本来就是在猜,如果怎么猜的都不知道,医生很难接受这个模型。我们的做法是将深度学习的方法跟医生比较能接受的生存分析survival analysis方法结合起来,利用SHAP等可视化的方法,把因素和结局的关系可视化出来。

比如右上角的图,有一个U字形,那是一个非常典型的例子,红色的表示当值在那个区域的时候,导致患者出现肾衰竭的风险,而绿色部分是保护性因素,值在这个区间的患者不容易发生风险,但它不是线性的。我们利用可解释的模型加上深度学习的方法,用算法定量、精准地把非线性的关系可视化出来,解释给医生,让他们更容易接受。

疾病预测应用案例

平安首席医疗科学家谢国彤:两大基础平台与四大算法领域,详解金融巨头的医疗科技版图 | CCF-GAIR 2020

做预测模型有什么用?现在有两个面向用户的场景在使用:

第一个场景是面向C端用户。平安有最大的全球互联网医疗平台——平安好医生。我们把常见病(高血压、糖尿病、冠心病、脑卒中)的预测模型放在平安好医生APP上。平安好医生有几亿的用户,他们会填写数据预测,看看自己有什么风险,同时进行相应的管理。

第二个场景是针对老年人群体。我们在甘肃收集到185万老年人数据。老年人出现高血压、糖尿病的比例占老年人口的40%,慢性病管理的挑战在于知晓率低,治疗率低。老年人不知道自己有病,或者有病也不会主动治疗。我们跟甘肃卫健委合作,用算法把这些人挑出来,通过甘肃家庭医生平台,让家庭医生有针对性找到高危老年人,对他们进行主动管理,提高疾病的知晓率和治疗率。

三是在珠海,我们利用200多万居民的健康数据和12个疾病的预测模型,可以生成一个完整的风险评估报告。同时,我们会把相应患者的教育,以及可访问的健康服务跟风险因素挂在一起:哪些服务可以帮助降低哪些风险因素,让政府在进行疾病管理的时候变得更加精准,更有针对性。

第二个场景是面向医学影像,我们聚焦的是两类人群(基层医生和专家)、三个场景:

平安首席医疗科学家谢国彤:两大基础平台与四大算法领域,详解金融巨头的医疗科技版图 | CCF-GAIR 2020

对于基层医生,我们聚焦质控和筛查。很多基层医生拍出来的片子位置不正、关键的器官不在里面、以及各种异物,这些片子拿到北京、上海的大医院也用不了。

我们在质控领域有很长的积累,在《NEUROCOMPUTING》、《SCIENTIFIC REPORTS》上发表了一系列的文章,针对DR、CT、内窥镜等影像,发现质量问题后提示医生重拍,进而提高优片的比例,在内窥镜异物比赛上获得冠军。

平安首席医疗科学家谢国彤:两大基础平台与四大算法领域,详解金融巨头的医疗科技版图 | CCF-GAIR 2020

另外,平安有六个检测中心,300多家医院把数据传到平安影像云上,由平安的医生帮助他们阅片。利用质控的方法,不管是DR。还是CT,质量不好片子的比例下降了20%,让甲级优等片的占比达到98%,提高了基层片子的质量。

第二个场景是筛查,告诉基层医生患者的病情,在基层医院看不了,要去大医院就诊。

我举一个眼科OCT的例子。OCT类似于CT,是三维建模,会看OCT的医生很少,尤其是在基层医院,五官科的医生往往是耳鼻喉科的医生,不一定是眼科医生。

我们在TVST、MICCAI等连续发表了一些文章,用算法对OCT的20多种病灶进行识别,并且做出紧迫性判断。提示医生患者没问题,或是有问题但只需要随访,或者是问题很严重,需要马上到上级医院就诊,这是我们在筛查场景里发挥的作用。

我们在上海、深圳都建立了以权威眼科三甲医院为主、下设几十家社康中心的模式,在社康中心进行筛查。在这两个地方,我们发现,年龄偏高人群中有30%的人有不同程度的眼底病变,其中20%的人需要马上治疗。因此,通过平安的平台,我们可以将他们转到相应的三甲眼科医院进行干预。

第三类是辅助诊断,面向专科医生,对于很难很烦的事情,我们帮助他们加速。

这是肾脏病理的例子。一个医生做肾脏诊断时,需要对着10亿像素的片子数肾小球、有没有硬化,肾小球里面细胞的比例。一个医生数一个肾小球平均需要平均43秒,一个片子里有几十到一百个肾小球。

我们利用最近发表在病理学顶级期刊上的一套模型,跟国家肾病中心的四个肾内科医生进行了对比。结果模型的精度是92%,四个肾内科的医生平均精度是82%,同时,模型看一个肾小球的速度是0.6秒,而医生平均是43秒,我们把速度平均提升了70倍,精度提升了10倍。

因此,让医生基于AI模型提供结果进行判断,把琐碎的事情交给计算机,这是我们对AI的定位。

今年上半年,有250多个城市使用了平安医疗科技的技术,影像辅助诊断的服务就有上亿次调用。

最后一个例子是宫颈癌TCT病理,我们将硬件与模型进行了整合,通过跟复旦肿瘤医院、第三方诊断中心合作一起应用。扫描仪会在2分钟内完成切片扫描,在40秒钟内对切片进行阳性、阴性的判断,同时会把三类高危的阳性切片按照高、中、低列出来,让医生关注阳性的切片。

即使是阴性的片子,我们会把一些高风险的区域高亮出来,帮助医生做判断。在6000例的数据验证上,敏感度设到99%,排疑率是80%,减少医生阅读阴性片的时间。

AskBob辅助诊疗关键技术及应用

辅助诊疗核心要解决的是诊断治疗时如何给医生一些辅助,我挑选两个关键技术介绍。

平安首席医疗科学家谢国彤:两大基础平台与四大算法领域,详解金融巨头的医疗科技版图 | CCF-GAIR 2020

目前,我们有2000多种疾病的辅助诊断和120多种精准治疗模型。很多AI应用集中在分类,可能也会完成分割的任务。我们主要用的是深度强化学习的方法,结合短期和长期的结果做Reward function,短期是血压、血糖达标率,长期是并发状的发生率,用不同的结果给深度强化学习一些激励。

利用这样的方法,我们跟国家生命中心在BMJ子刊上发表了面向糖尿病、肾病个性化治疗的模型,跟安贞医院刚刚在AMIA上发表了房颤的治疗模型。

还有一个场景是面向循证医学。医生要阅读大量的文献,我们用算法把文献里关键的疾病、用药抽取出来做分类,比如这类疾病的手术治疗是哪一种,用哪种药进行治疗,我们用算法把关键信息抽取出来。

平安首席医疗科学家谢国彤:两大基础平台与四大算法领域,详解金融巨头的医疗科技版图 | CCF-GAIR 2020

目前,这一套辅助诊疗系统在1.6万家医院有应用,目标对象同样分为基层医生和专家医生。我们会像助手一样,在基层医生输入症状之后,不断提醒可能的检查、检验和用药、诊断结果。数据显示,部署我们系统之前,地方诊疗规范率不到50%,部署后的规范率达到80%以上。

而对于专科医生,我们希望他们在面对复杂病例或者科研需求时,可以通过AI的方式检索到需要的医学证据。比如胃癌,我们会提供不同临床治疗方案的依据以及治疗的效果。

同时,医生可以查询胃癌领域的权威在哪些领域发表了多少文章,有哪些临床实验,从而帮助医生更好地进行科研。

智能疾病管理关键技术和案例

除了帮助医生,我们还要关注的对象是患者,患者离开医院后有大量管理的需求。

比如药物是否需要调整、是否还要继续吃,跟其他药一起吃有没有问题。医生会对患者进行随访,但是单纯依靠人的方式是不可能的。中国一年就诊人次是80亿,但只有300万医生,医生治病之余没有精力做后续患者随访。

平安首席医疗科学家谢国彤:两大基础平台与四大算法领域,详解金融巨头的医疗科技版图 | CCF-GAIR 2020

为此,我们开发了多轮对话技术,让AI尽可能把那些耗时耗力的工作做完,好医生一天会产生80万次的问题。我们分析了好医生日志,每次15分钟的对话里,前5分钟都是医生问患者的病史、诊断治疗,后10分钟患者会问医生五花八门的话题,这些都是我们很好的训练数据。

在ACL里,我们在医疗问答项目上拿到了冠军。基于海量的数据,我们训练了一个AskBob的模型,比通用的模型效果更好,可以做意图理解、FAQ问答和知识图谱问答,回答各种长尾的问题。

举一个应用的例子。目前,在560多家医院、五万名2型糖尿病患者在我们的平台上进行院外的管理。这有点像前面这些方案的集大成者。我们会用各种风险预测产生患者画像,用辅助诊疗的模型生成一些方案、监测方案、用药方案、饮食运动等,用对话的方式进行动态跟踪、随访,包括回答各种问题。

这种方式的效果如何?

平安首席医疗科学家谢国彤:两大基础平台与四大算法领域,详解金融巨头的医疗科技版图 | CCF-GAIR 2020

数据显示,患者入住三个月后,评估他的HBA1C和空腹血糖,可以看到HBA1C达标率提升5倍,空腹血糖达标率提升20%。患者很积极地阅读文章,积极地上传自己的血糖数据,依从性提升了50%。

与此同时,成本也相应降低。因为以前主要靠人工,三个月内围绕一名患者,护士平均要打5个电话。现在的“AI+护士”,只要打2.9个电话就可以达到更好的效果,这是院外管理一个很好的案例。

更重要的一点是,打通重点疾病的专科模式。我们跟国家肾病中心有一个合作的例子,基于病理对慢性肾病的患者进行辅助诊断,进行肾衰竭的风险预测,对高风险的人群实现精准用药,让他们接受免疫抑制剂的治疗,降低肾衰竭的风险。

平安首席医疗科学家谢国彤:两大基础平台与四大算法领域,详解金融巨头的医疗科技版图 | CCF-GAIR 2020

以肾病为专科案例来看,我们打通了辅助诊断、风险预测、精准治疗、患者管理的四大环节,在每个环节都有医学期刊论文发表,得到医学界的认可。

最后,我想说的是,医疗人工智能是利国利民的事情,人命关天,需要AI界和医学界的紧密合作,用AI的算法解决真实的需求,保证模型的安全性、可用性,才能真正地对“健康中国”产生价值。

采访问答精选

提问:您刚刚在演讲中提到了赛飞平台,想请问一下为什么要投入精力去开发平台?未来的面向对象是哪些?

谢国彤:我们发现,算法工程师要完成好多通用的事情,而且环境不停地升级,算法要不断优化,例如模型压缩、高性能部署,这些都是一些通用需求。

我们有四个算法领域:疾病预测、医学影像、辅助诊疗还有疾病管理,这四个领域的算法工程师都得学。两年前,我们就开始从训练环节入手,提供一些通用能力,让算法工程师只聚焦在自己的领域。

把数据可视化、数据标注、数据增强,包括分布式加速训练这些通用能力,还有通用算法库,沉淀在赛飞上,不用管底层环境的事情。这样大家都用得很爽,赛飞是一个GPU的集群,有个集群大家就可以共享,有机会用到一个比以前大10倍的GPU的力量。

我们在内部使用后,发现外部客户也有类似需求,因为有很多算法是不局限于医疗领域的,例如NLP领域的BERT,CV领域的ResNet,这些网络很多领域的人都在用。 

因此,我们就开始让平安的子公司来使用,现在300多个用户里有一大半都不是做医疗的,都是平安16个子公司的用户,在上面做NLP、CV、OCR等各种各样的建模。所以,赛飞在持续地增长,更好地服务集团,从一个纯医疗的平台变成通用的AI平台。

提问:平安的医疗AI产品与布局,与BAT或者AI公司有哪些本质上的区别,怎么才能从这个市场中获得优势?

谢国彤:疾病是一个很复杂的领域,有2万到3万种病。就以影像为例,有些聚焦于放射,细分来看,会分为DR、CT和核磁等。从病种上来看,有些会聚焦眼科,有些会聚焦病理,还会再细分还会分为宫颈癌病理、乳腺癌病理、胃癌病理等。

所以,我觉得医疗AI的空间足够大,没有任何一家公司能把世界上所有病的所有AI模型都搞定。

其次,大家选择的切入点不一样,从我的角度来看,我们更关注的是那些真正有需求的场景,如何为基层医生赋能,如何为专科医生减负,不是非要让基层医生看很难的病,或者要比专科医生强很多。在我看来,很多场景就是为了技术而技术。

三年前,我离开IBM的时候,很多公司找过我,但是我选择了平安。我觉得,平安的医疗生态patient、provider、payment是一个很完整的生态,有一些公司也不是没有场景,但是领域很窄。AI是由场景业务驱动,而不是技术驱动,技术驱动是风光一时。只有基于真实的业务场景,才能真的有价值,有收入。

提问:对于医疗AI的认证和落地,您有哪些看法?

谢国彤:我们现在跟国家科技部和国家卫健委,在进行AI医疗领域的一个课题——AI的模型验证评估平台。我之前跟科技部、卫健委表达了一个观点,他们也很认同,那就是,让大家都拿到证才能用是不现实的。拿一个证,没有两三年是不会有什么结果的,这个过程中大家都在干等?这是不可能的,要鼓励大家去尝试。

尝试的过程中,各个地方的卫健委和医院院长、主任都很困惑,每一家企业来找我都是99%的准确率。但是,测试的数据集都不一样,只要选好测试集百分之百也可以,就看怎么选。

例如眼科OCT,可能有20种病变,其中有些病变是常见,有些是罕见,但测试集里只包含了其中10种,这10种虽然识别准确了,但另外10种还没有识别,怎么就代表模型准确了呢?

因此,我们现在跟科技部、国家卫健委合作的项目,就是由医院、卫健委、药监局等部门牵头,针对特定的疾病和特定的任务,提供中立的测试集。把各家的模型拿上来测试,最后拿出一个评估报告。至少让各家讲自己性能指标的时候,有一个统一的数据集、一个统一、中立的评测标准。

我觉得,国家推动医疗AI应用中做得很好的一个步骤是,先选择一些常见的、需求量比较大的AI场景,制定相对成熟的数据集,从需求比较大病种开始入手,当数据集越来越多,能评估的模型也越来越多。

雷峰网原创文章,未经授权禁止转载。详情见转载须知

分享:
相关文章

医疗&金融频道主编

专注医疗健康与金融科技的数智化原创报道 |微信:Gru1993
当月热门文章
最新文章
请填写申请人资料
姓名
电话
邮箱
微信号
作品链接
个人简介
为了您的账户安全,请验证邮箱
您的邮箱还未验证,完成可获20积分哟!
请验证您的邮箱
立即验证
完善账号信息
您的账号已经绑定,现在您可以设置密码以方便用邮箱登录
立即设置 以后再说
体格检查是什么意思 爆血管是什么原因引起的 最近老是犯困想睡觉是什么原因 藏红花可以搭配什么泡水喝 风疹病毒是什么病
自刎是什么意思 低血糖挂什么科 干扰素是什么药 梦见烧火做饭是什么意思 五爷是什么菩萨
肾不好是什么原因引起的 眼压高什么症状 八月初八是什么星座 全麦是什么意思 坐立不安是什么意思
太岁是什么 饕餮是什么 女孩断掌纹代表什么 诞辰是什么意思 everytime什么意思
后脑勺出汗多是什么原因hcv8jop3ns2r.cn 吃什么排毒最快hcv8jop6ns1r.cn 毛毛虫吃什么食物hcv8jop5ns1r.cn 薄荷叶泡水喝有什么好处luyiluode.com 双脚麻木是什么病的前兆hcv9jop5ns9r.cn
懵懂少年是什么意思hcv7jop6ns7r.cn cos什么意思hcv9jop6ns6r.cn 虾不能和什么东西一起吃hcv8jop1ns1r.cn 叔叔的儿子叫什么hcv7jop9ns6r.cn 9月1号什么星座hcv7jop6ns3r.cn
类风湿什么症状hcv9jop2ns8r.cn 子宫内膜回声欠均匀什么意思shenchushe.com 三月27号是什么星座hkuteam.com 尺寸是什么意思hcv8jop3ns9r.cn 蝙蝠进屋有什么预兆hcv9jop1ns7r.cn
borel手表是什么牌子yanzhenzixun.com 卵巢结节是什么意思hcv7jop9ns9r.cn 什么样的脚好看520myf.com 痛风吃什么蔬菜好dayuxmw.com 煲蛇汤放什么材料好hcv8jop6ns1r.cn
百度