医疗大数据的关键是AI人工智能技术在电子病历中的应用

电子病历后结构化病历质控微信wxid123765fg

大健康产业也迎来了发展机遇期,“健康中国”正式升级为国家战略。医疗界的大数据革命已经到来,医疗大数据受到资本市场的热捧,但信息化发展时间较短、标准不统一、数据量大、非结构化等问题阻碍了大数据的整合与应用,特别是对电子病历数据的整合应用困难。电子病案不只是病程记录。在临床实践中,更是最重要的工具之一,它为大数据世界、病理学路径驱动治疗以及实时循证临床决策提供了一个窗口。为此,必须实现对电子病历的智能分析、数据提取和医疗信息潜在应用的挖掘。

在2015年中华医院信息网络大会上,对目前医院电子病案应用水平进行了统计。参加数据填报的医院家数为2622家,其中5级及以上电子病历应用水平的医院共有16家,仅占6%,开展电子签名应用的医院只有20%,医院应用电子签名平均水平为2.99。可见,我国电子病历系统的应用水平仍然很低,只是电子病历升级带来的医院信息化投资市场潜力巨大
目前,电子病历在我国的应用还不够成熟,所以要将电子病历中的临床数据用于分析研究,还需要解决一系列的标准化问题。与此同时,在电子病历互联互通方面,大型电子病历企业出于各自的利益(限制患者转诊),也不愿意将数据互联互通,
2016-2018年,国务院办公厅印发了《关于促进和规范健康医疗大数据应用发展的指导意见》,鼓励各类医疗机构推进健康医疗大数据采集、存储,强化应用支撑和运营技术保障,打通数据资源共享通道。以居民电子健康档案、电子病历、电子处方等为核心,加快建设和完善基础数据库。为进一步加强卫生信息标准的推广与应用,国家卫生计生委统计信息中心在委员会计划和信息司的领导下,组织开展了卫生信息互联互通标准化成熟度测评项目工作,从四个方面对区域卫生信息平台和医院信息平台进行了综合测试和评估:数据资源标准化建设、互联互通标准化建设、基础设施建设和互联互通应用效果。促进跨机构、跨地域的互联互通和信息共享,包括以测试促用、以测试促改革、以测试促建设。

卫计委针对我国电子病历的系统功能应用水平,电子病历系统功能应用水平共分8个等级(0-7级)。
医疗大数据的挖掘与利用,将对医学研究和临床治疗具有深远的意义,随着电子病历标准化的不断完善,打破数据壁垒,提高电子病历临床数据的质量,才能使医疗大数据真正发挥其作用和价值。
怎样打破数据壁垒呢?借助人工智能深度学习技术,大数医达的医疗数据采集平台,通过卷积神经网络、自动编码器等算法,将自然语言的医疗记录翻译成结构,经过标注和编码,可以自动提取各种医学名词,并按预定格式进行编排,从而彻底解决了电子病历看似无法突破的难题:采用大规模分布式平台、医疗知识图谱、医疗语料库等算法,实现了病历的结构化翻译。在面对千奇百怪甚至有错别字的原始病历时,系统能自动根据病历前后文,比较症状描述、诊断结果、化验内容和医嘱备注等,估计该医学名词被其他医学名词替代的可能性,从而建立可疑同义词词库。正如做同义替换题一样,弄清楚上下文之间的逻辑关系,充分考虑整个句子的语境,才能判断出能够替换的词。利用人工智能技术,将标准不统一的电子病案进行结构化、标准化,实现医院间数据的灵活交换和集成,消除数据孤岛。
伴随着全国医疗大数据建设的推进,电子病历正逐渐成为医疗信息化升级的重点,成为数字化、智能化医疗发展的关键支撑。AI技术将充分挖掘电子病历的价值,为临床研究、新药研发和健康管理提供支撑,随着大数据和人工智能技术的深入发展,电子病历未来的作用和价值将迅速放大。

展开查看详情

1.电子病历后结构化 平 台 介 绍 / A I 助 力 医 疗

2.什么是电子病历后结构化? 电子病历后结构化,即电子病历数据 建构工具,能快速将各类临床医疗电 子文书进行解析,提取文书中的关键 数据。包含出院小结、病程录、检查 报告、护理记录…… 能帮助医院充分利用现有的电子病历 数据,对现有的病历数据进行结构化 处理并提取关键内容进行分析;同时, 还可实现电子病历自动质控的功能, 轻松提升电子病历的应用等级。

3.电子病历后结构化-评级的刚性需求 2020年,所有三级医院要达到分级评价4级以 电子病历评级4级要求全院信息共享,越往后 上,二级医院要达到分级评价3级以上 越注重数据对医疗的智能化的支撑作用。因 而对电子病历信息数据的提取要求越高,颗 0级:未形成电子病历系统。 粒度越细,甚至拆分到词汇,唯有这样的数 1级:独立医疗信息系统建立。 据信息才能更好地被统计、分析、查找和再 2级:医疗信息部门内部交换。 3级:部门间数据交换。 利用 4级:全院信息共享,初级医疗决策支持。 5级:统一数据管理,中级医疗决策支持。 电子病历后结构化系统,无论再细的数据颗 6级:全流程医疗数据闭环管理,高级医疗决 粒度也能自动提取,从容地应对评级 策支持。 7级:医疗安全质量管控,区域医疗信息共享。 8级:健康信息整合,医疗安全质量持续提升。

4.电子病历后结构化的技术难度 医疗智能化离不开电子病历后结构化系统,电 子病历的结构化是医疗信息化发展的一个重要 环节,是打通医疗信息化壁垒,医疗数据互联 互通的必由之路 然而,电子病历结构化面临着两大技术难点:

5.难度一:电子病历的输入问题 • 电子病历是体现医生诊治思路的重要文 两种输入汉字方法的比较 书,每位医生都有自己独特的病历书写 急性阑尾炎的主诉为例 习惯,如果采用固定的模板选项,则会 • 自由化输入(包括拷贝复制法输入): 严重影响医生的思维,而非结构化的自 右下腹持续性疼痛4小时 然语言描述又很难被计算机识别。如何 • 选择性录入: 选择疼痛部位“右下腹、右上腹、脐下…”; 能从“医生看懂”提升到“计算机能看懂”, 选择疼性质“持续性、转移性、…”; 需要计算机在浩如烟海的医疗知识中进 选择疼痛种类“疼痛、刺痛、剧痛…”; 行学习,才能全面、准确的理解电子病 选择疼痛时间“1、2、3、4….” 选择时间单位“年、月、日、小时…” 历中描述的内容。

6.难度二:文档格式多样性问题 • 各厂商研制的病历文档的类别多种多样,格式迥异;同时 各类医疗文本格式也不尽相同,如病程录、治疗过程、巡 查记录、化验单、入院记录等信息。格式不同,数据组合 也会有很大的差别 • 如何能让计算机根据病历内容来深度语义理解,来抽取出 相应的知识点,是计算机训练的重要课题

7.我们运用人工智能领域最新技术,对双向循环神经网络、条件随机场等算法进行了进一 步改进,创造性的实现了通过融合多个模型进行结构化拆分的方法。 同时还构建了大 规模的医疗语料知识库,并聘请医疗专业团队进行语义标注。得益于多模型融合技术和 大规模标注语料库,算法的准确程度和分拆的专业可信程度都得到了显著的提升 我们的后结 我们的后结构化产品能识别不 构化平台技 同厂商、不同科室、表达方式 术优势 各不相同的病历文本

8.采用Transformer结合CRF 构建通用的智能电子病历后结构化平台 我们的电子病历后结构化平台,以大量临床数据为基础,采用全新的人工智能技术,建立不同的电 子病历结构化模型,构建了通用的医疗电子文书解析平台 多模型结合 用大量语料对算法模型进行训练 人 工 智 能 后结构化算法模 大规模电子病历 技 专业化语料标注 术 型 数据集 应 用 医院临床病历数据库

9.人工智能自然语言处理技术的全新的模 BiLSTM(双向循环神经网络)的引入,解决了同 时考虑上下文信息的问题,而CRF(Conditional Random Fields,条件随机场)的引入则对标签的 预测建立了约束条件,从而可以体现出标签之间 相互影响的关系。 实践中,CRF应用在BiLSTM的顶层,即把BiLSTM 的输出作为CRF的输入。这样就得到了当前最流 行的方法:BiLSTM结合CRF算法。其中,BiLSTM 的作用是感知;而CRF能学习上下文信息,结合 输出层结果和标签序列的全局概率,预测出最大 概率的标签序列。

10.人工智能自然语言处理技术的全新的模 我们在此基础上进行了进一步的改造。 Transformer模型是最近一年多来NLP领域 最 重 要 的 进 展 。 与 BiLSTM 一 样 , Transformer模型可以对输入序列每个字 之间的特征关系进行提取与捕捉。通过自 注意力机制和对多个基本的编码器 (Encoder)与解码器(Decoder)单元进 行连续堆叠,Transformer模型可以发现 单字在不同语境下的不同语义,从而实现 了一词多义的区分,比BiLSTM具备更强的 特征提取性能。

11.人工智能自然语言处理技术的全新的模 在实践中,我们只使用了Transformer的编码器部分(某 种 意 义 上 说 , 更 像 是 Bert , 即 双 向 Transformer 的 Encoder),通过多层的自注意力计算结合残差的计算, 将最顶层的Encoder单元的输出作为CRF的输入,就得到 命名实体的标签分类。 我们将电子病历中通过自然语言描述的人体部位、疾病 名称、症状、化验项目、检查项目、手术、治疗等术语, 界定为医学命名实体,通过上述Transformer结合CRF的 算法,进行了实体识别及提取的试验。由于我们标注的 词汇相对比较核心,即未包括各种修饰类的形容词,因 此识别效果比之前的一些研究成果要高出很多。

12.人工智能自然语言处理技术的全新的模 Transformer结合CRF的算法,既克服了CRF算法难以识别上下文语义的缺点,又克服了 BiLSTM结合CRF算法容易梯度消失和难以并行化计算的不足。有了这一算法的精准识别和 提取,我们就可以在“电子病历结构化分拆系统”中进一步构造后结构化模板:即key或 value包含一个或多个实体,再组合修饰词共同构成,从而实现电子病历的准确拆分 导入自然语言描述的电子病历 后台自动结构化处理

13.系统展示

14.为什么要使用我们的产品? 1、提高评级-刚性需求 • 电子病历评级4级要求全院信息共享,越往后越注重数据对医疗的智能化的支撑 作用。因而对电子病历信息数据的提取要求越高,颗粒度越细,甚至拆分到词汇, 唯有这样的数据信息才能更好地被统计、分析、查找和再利用。使用我们的产品 能轻松提高数据质量,从容面对评级。 2、实现医疗数据互联互通 • 基于电子病历的院内信息互联互通是电子病历应用水平评级的硬性要求,但实际 上同一家医院内的不同系统之间的电子病历格式都可能不尽相同,而文档或段落 粒度的病历数据可利用性差,不能完全满足互联互通的要求。借助于电子病历后 结构化工具,将自然语言描述的电子病历转化成为结构化细粒度的数据,就可以 实现院内医疗数据在字段级的互联互通。 3、助力电子病历质控 • 由于“人可读、机不可读”的特点,评价自然语言描述的病历的质量,往往需要消 耗大量的人力资源。通过运用电子病历后结构化工具,就可以分解出构成电子病 历的各结构化信息要素,结合行业标准,也就可以自动评判医生是否全面、完整 的描述了治疗过程各方面情况,从而实现了病历质量评价的目标。

15.为什么要使用我们的产品? 4、支持科研数据分析 • 临床科研分析所需要的关键数据可能淹没在通过自然语言描述的非结构化病历中, 导致统计数据不准确、也不完整。科研人员如需提取病历中的关键信息,就需要 人工阅读病历文本并进行查找,不但效率低下,且容易导致遗漏。有了后结构化 助手,就可以快速提取出关键信息,构建结构化的电子病历数据用于统计分析。 5、积累结构化病历模板 • 基于“前结构化的模板”的电子病历系统会影响医生的思路,主要是因为实际上临 床上可能出现的情况千差万别,而这类病历给出的可选项既不够全面,也不够灵 活。因此,只有通过“后结构化”分拆了各科室、各专业的大量电子病历后,才能 充分积累临床上遇到的各种情况及其对应的术语。这样形成的模板才是研发“结构 化电子病历”的基础,因此“后结构化”是积累结构化电子病历模板的必由之路。 6、更多的应用领域 • 电子病历后结构化也可以为构建更加精细更加全面的患者画像、医疗数据知识图 谱等数据知识库做支持,还可为临床辅助决策、治疗方案推荐、患者预后评估等 系统作为数据的基础。

16.我们的产品优势? 识别不同各类病历文本 • 我们运用人工智能领域最新技术,对双向循环神经网络、条件随机场等算法进行了进一步改进, 创造性的实现了通过融合多个模型进行结构化拆分的方法。 我们还构建了大规模的医疗语料知识 库,并聘请医疗专业团队进行语义标注。得益于多模型融合技术和大规模标注语料库,算法的准 确程度和分拆的专业可信程度都得到了显著的提升, 这也使我们的后结构化产品能识别不同厂商、 不同科室、表达方式各不相同的病历文本。 无需对接医疗设备 • 各个医院使用各种不同医疗设备接口各不相同,对接接口非常麻烦。我们的 系统无需接口,不与医院现有的系统对接,单独使用。只要导入自然语言描 述的临床医疗文本,即可自动生成结构化数据。

17.我们的产品优势? 现场部署+云系统,任意选择 • 我们提供两种使用方式以供选择,其一为现场独立部署,单独安装在独立 设备上,无需接口,不影响医院其他设备使用;其二采用云端服务,操作 简便,成本更底。 量身定制的医疗软件 • 根据各个医院不同场景不同科室的具体需求,进行个性化定制型再开发, 满足医院特定需求,提供更贴心的服务。

18.期待与您合作! 平 台 介 绍 / A I 助 力 医 疗