以智能诊断为铺垫,康夫子欲基于知识图谱打造AI医疗大脑

33.jpg

谈到医疗人工智能大数据的前景时,我们首先想到的是,这些“黑科技”的准确率需达到多少,才会有大规模的应用?

根据北京康夫子科技有限公司最新测试结果表示,他们的智能诊断系统针对常见病典型症状的准确率已超过90%,超过某国际顶尖医疗诊所的症状诊断工具(symptom checker)10个百分点。而据相关资料显示,国内各类医院的平均误诊率在30%左右。

北京康夫子科技有限公司是一家专注于人工智能技术在医疗健康领域应用研发的技术驱动型公司,成立于2015年。凭借知识抽取和知识推理、表示等知识图谱构建技术,康夫子打造出“医疗大脑”和“饮食营养”两项重要的知识图谱。

“医疗大脑”被业界评价为“接地气”的临床辅助决策和循证医学产品。它是以数万本医学教科书、近百万份临床病历、千万篇医疗论文为基础,保证数据的科学性。同时,以千万条通俗语言的实际问诊记录为拓展,建立口头医学与文献医学之间的词汇关联,将普通公众对症状的描述和对疾病的理解准确地映射在严肃医疗平面。“医疗大脑”能有效优化医疗服务流程,提高医疗卫生服务和行业效率。

除了“医疗大脑”之外,康夫子还推出了国内最大的营养知识图谱,并针对孕妇人群开发“孕食助手”APP,为近百万孕妇用户提供方便、准确的孕期饮食指导。康夫子的营养知识图谱通过搜索合作每天为数百万孕妇提供数据服务。深度技术背景的核心团队

据了解,康夫子的核心团队成员均有深厚的行业技术背景。创始人CEO张超毕业于电子科技大学计算数学专业,曾在新加坡国立大学从事人工智能方向的研究工作。2010年加入百度,担任百度自然语言处理部资深研发工程师、文本知识挖掘方向负责人,是知识图谱、实体建模方面的专家;

康夫子CTO张冲毕业于山大计算机系,是前百度高级研发工程师,拥有丰富的架构、工程开发经验;2011年加入百度,先后在网页搜索、自然语言处理部门从事搜索排序、网页权重计算、本体知识库、知识图谱相关研发工作;

CMO李志朋是前卫计委疾控司处长、前地坛医院主治医师,北医本科、澳大利亚新南威尔士大学硕士,在20余年医疗从业经历中积累了大量的临床经验&医疗资源。三步“训练”智能诊断

据张超透露,智能诊断的高准确率主要通过三个步骤实现:知识抽取、知识表示、逻辑应用。

第一步:知识抽取,类似医生记忆医学知识。医疗AI的首要任务是构建医疗知识图谱进而支撑一系列的应用。知识图谱一直是各大AI公司的必争之地,相比谷歌、百度等巨头基于Wikipedia、百科等半结构化站点来构建知识图谱,康夫子采取了基于无结构化文本抽取来构建知识图谱。这是由于医学的复杂性导致其知识还存在于教科书籍、论文、科普文章等无结构化文本中。

同时,康夫子在知识抽取方面有着领先的原创技术:1、康夫子的系统可以自动从海量文献中学习到书写某种知识的“规律”后进行二次大规模自动抽取;2、康夫子设计了一套高性能计算框架来缓解上一步中的复杂计算。

第二步:知识表示,类似医生积累医疗经验。在得到结构化的医学知识后,康夫子要让这些知识具备推理的能力。共分两方面:

1、基于深度学习技术(Deep Learning)的知识量化表示:把疾病、症状通过量化表示,进而实现一些推理行为,如患者说“胃不舒服”,系统会交互判断到底是“恶心”、“胃酸”还是“胃胀”?

2、知识关系权重表示:许多传统概率统计模型是建立在独立假设之上的,但实际上这是不合理的,比如在根据一组症状推导可能患有的疾病时,必须考虑症状之间的演变逻辑。

第三步:逻辑应用,类似医生问诊服务。受限于医学的复杂性和知识壁垒,不仅是患者,有时候连医生都无法考虑周全。这时候就需要系统能智能交互,分析患者的病情,并进行智能提问来获取更多的患者特征。传统诊断的“天花板”困局

谈及与传统诊断产品的效果差异时,张超认为,传统诊断学思维在效果上很快就会达到瓶颈,主要由四个方面导致:

1、知识规模:传统诊断学思维大多使用人工编辑的知识库,知识库规模较小,而康夫子借助领先的信息自动抽取技术,诊断知识条数已超过500万条;

2、知识更新:以案例来说,大叶性肺炎典型症状为“铁锈色痰”,这条知识是几十年前发现的,并广泛存在于各种临床知识库中。但当今临床案例中,大叶性肺炎往往没有“铁锈色痰”症状,因为相当比例的患者早期会自行服用阿莫西林等抗生素药物,导致铁锈色痰不明显或者不出现; 传统诊断工具在信息更新上比较滞后,导致诊断效果下降;

3、知识推理:传统诊断思维大多采用决策树的结构,比如患者主诉“牙疼、咳嗽、头疼”症状,当传统的诊断学看到“牙疼”时,基本就往牙周疾病进行诊断,而康夫子智能诊断会基于知识库推理出这个“牙疼”是由感冒引起,进而给出更正确的诊断;

4、知识表示:临床工具要做到“接地气”,一定得在自然语言处理上花精力,让机器能明白用户在问题描述上的多样性,这是传统诊断工具急需攻克的难题。综合辅助临床决策 

据悉,康夫子智能诊断系统目前已经学习了近万本医学书籍、2000万篇医学论文,针对近1万多种疾病、数千种症状、化验指标、用药反应等知识构建了知识图谱。在2016年7月中旬发布的1.0.1版本中,覆盖热门症状5000种,ICD10常见疾病4000种。它针对医生执业考试题中症状诊断部分Top1(推断出的可能患有概率最高的疾病)命中准确率>75%,Top3(推断出的可能患有概率前三的疾病)命中准确率>90%。

在谈到应用场景上,张超介绍,医疗AI的本质是增大医疗资源的供给,因此在医疗资源短缺的场景下,医疗AI会发挥极大的价值。在医生临床辅助决策方面,医疗AI可以辅助社区医生、全科/家庭医生更好地行医;在服务患者方面,会通过一些B端医疗机构提供患者自诊、导诊的服务;同时,康夫子还会开放医疗知识图谱去帮助医疗机构去提升他们产品(如HIS系统、智能硬件)的智能化水平。

11.jpg

在临床辅助方面,张超分享了一个案例:康夫子的一位实习生以主诉“体重下降”、“乏力”去校医院就诊,服药后一直不见好转。后来去某三甲医院,医生通过发现患者“轻微手抖”而建议去做甲状腺检查,最后确诊为甲亢。此时,如果通过康夫子微信端Demo可以发现,基于“体重下降”、“乏力”、“手抖”等状况即可准确给出“甲亢”的可能,如果同时提供“甲状腺素:偏高”特征,那么“甲亢”的可能性会进一步增高。

由此可见,康夫子智能诊断系统能极大地辅助全科医生来进行诊断。医生需要做的是,聆听患者的病情描述,捕捉有用信息提供给辅助决策系统,最后综合辅助决策系统的结论给出患者治疗方案。

康夫子计划考虑更多的诊断特征来提升诊断的准确率甚至实现个性化诊断,如,患者群体特征(年龄、性别、时间、地域等等)、患者病史、生活习惯等,让诊断变得更智能。不过,张超表示,智能诊断只是“医疗大脑”(医学知识图谱+推理逻辑)的一部分。希望通过“医疗大脑”把许多工作串联,比如先诊断,再提供治疗建议、用药建议、预后管理等。截至目前,康夫子已为医疗健康领域的数家知名企业提供了知识内核和相关技术服务,包括百度、360搜索、中粮数字健康、深圳京柏医疗等。