团体标准网
(19)国家知识产权局 (12)发明 专利 (10)授权公告 号 (45)授权公告日 (21)申请 号 202211069279.X (22)申请日 2022.09.02 (65)同一申请的已公布的文献号 申请公布号 CN 115171835 A (43)申请公布日 2022.10.11 (73)专利权人 北京智源人工智能研究院 地址 100084 北京市海淀区中关村东路1号 院8号楼三层B201D-1 (72)发明人 安波  (74)专利代理 机构 北京动力号知识产权代理有 限公司 1 1775 专利代理师 梁艳 (51)Int.Cl. G16H 10/60(2018.01) G06F 16/31(2019.01)G06F 16/35(2019.01) G06F 40/242(2020.01) G06F 40/279(2020.01) G06V 10/82(2022.01) G06V 30/413(2022.01) (56)对比文件 CN 114530223 A,202 2.05.24 CN 110705293 A,2020.01.17 CN 114582448 A,202 2.06.03 CN 113724819 A,2021.1 1.30 US 20213 57702 A1,2021.1 1.18 审查员 傅志良 (54)发明名称 病例结构化模 型训练方法、 装置和病例结构 化方法 (57)摘要 本发明公开了病例结构化模 型训练方法、 装 置和病例结构化方法, 属于精准医疗技术领域。 模型训练方法包括: 获取已标注标签的病例文本 训练数据, 其中, 所述标签包括各个医疗事件分 别对应的医疗事件类型, 以及, 获取各个所述医 疗事件类型各自对应的医疗事件模板; 根据所述 病例文本训练数据和各个所述医疗事件模板训 练Bart预训练语言模型, 以得到用于输 出病例文 本所属的医疗事件类型及病例结构化数据的病 例结构化模 型。 实现了端到端的事件抽取病例结 构化。 通过采用统一的框架实现不同类型的医疗 事件的抽取, 满足了病例文本中蕴含的丰富类型 医疗事件的建模与抽取。 还能够共享不同类型的 事件之间的共性, 以实现迁移学习, 降低对标注 数据的依赖 。 权利要求书2页 说明书7页 附图3页 CN 115171835 B 2022.12.23 CN 115171835 B 1.一种病例结构化模型的训练方法, 其特 征在于, 包括: 获取已标注标签的病例文本训练数据, 其中, 所述标签包括各个医疗事件分别对应的 医疗事件类型, 以及, 获取 各个所述医疗 事件类型各自对应的医疗 事件模板; 根据所述病例文本训练数据和各个所述医疗事件模板训练Bart预训练语言模型, 以得 到用于输出病例文本所属的医疗 事件类型及病例结构化数据的病例结构化模型, 包括: 将所述病例文本训练数据和各个所述医疗事件模板输入预设的Bart预训练语言模型, 以使该Bart预训练语言模型依次进 行元素识别和元素 组合, 以在所述病例文本训练数据中 抽取各个类型的医疗事件并将所述医疗事件转化为序列模式数据, 而后将所述序列模式数 据进行结构化转化, 得到对应的病例结构化数据; 所述获取已标注标签的病例文本训练数据, 包括: 从接收到的病例文本中提取文本块, 和/或, 根据选择 的医疗事件类型, 并基于该医疗事件类型 的医疗事件模板, 利用 词典和规 则生成病例文本并从病例文本中提取文本块; 对所述文本块进行医疗事件类型的标注, 以得到对应的病例文本训练数据; 各个所述 医疗事件类型包括: 就诊事件、 主诉事件、 现病史事件、 既往史事件、 个人史事件、 婚姻史事 件、 生育史事 件、 月经史事 件、 家族史事 件和过敏史事件中的任意组合。 2.如权利要求1所述的病例结构化模型的训练方法, 其特征在于, 所述从病例文本 中提 取文本块包括: 基于MedBert+BiLSTM+CRF模型从所述病例文本中提取 得到文本块。 3.如权利要求1所述的病例结构化模型的训练方法, 其特征在于, 在所述从接收到的病 例文本中提取文本块之前, 还 包括: 接收病例文本, 和/或, 接收病例文本 图片并对该病例文本 图片进行文本识别, 得到对 应的病例文本 。 4.如权利要求1至 3任一项所述的病例结构化模型的训练方法, 其特 征在于, 还 包括: 基于待应用所述病例结构化模型的目标医院对应的医疗术语别名训练数据, 采用Bert +ESIM模型对所述病例结构化数据进行医疗术语归一 化训练。 5.如权利要求1至 3任一项所述的病例结构化模型的训练方法, 其特 征在于, 还 包括: 对所述病例结构化数据进行可视化校验, 并将校验结果作为所述病例结构化模型下一 轮训练的训练数据。 6.一种病例结构化方法, 其特 征在于, 包括: 获取病例文本; 将所述病例文本输入到病例结构化模型中, 以使该病例结构化模型输出所述病例文本 所属的医疗 事件类型及病例结构化数据; 所述病例结构化模型预先基于权利要求1 ‑5任一项所述的病例结构化模型的训练方法 训练得到 。 7.一种病例结构化模型的训练装置, 其特 征在于, 包括: 训练数据获取模块, 用于获取已标注标签的病例文本训练数据, 其中, 所述标签包括各 个医疗事件分别对应的医疗事件类型, 以及, 获取各个所述事件类型各自对应的医疗事件 模板; 所述获取已标注标签的病例文本训练数据, 包括: 从接收到的病例文本中提取文本 块, 和/或, 根据选择的医疗事件类型, 并基于该医疗事件类型的医疗事件模板, 利用词典和权 利 要 求 书 1/2 页 2 CN 115171835 B 2规则生成病例文本并从病例文本中提取文本块; 对所述文本块进行医疗事件类型的标注, 以得到对应的病例文本训练数据; 各个所述 医疗事件类型包括: 就诊事件、 主诉事件、 现病史事件、 既往史事件、 个人史事件、 婚姻史事 件、 生育史事 件、 月经史事 件、 家族史事 件和过敏史事件中的任意组合; 模型训练模块, 用于根据所述病例文本训练数据和各个所述医疗事件模板训练Bart预 训练语言模型, 以得到用于输出病例文本所属的医疗事件类型及病例结构化数据的病例结 构化模型, 包括: 将所述病例文本训练数据和各个所述医疗事件模板输入预设的Bart预训练语言模型, 以使该Bart预训练语言模型依次进 行元素识别和元素 组合, 以在所述病例文本训练数据中 抽取各个类型的医疗事件并将所述医疗事件转化为序列模式数据, 而后将所述序列模式数 据进行结构化转化, 得到对应的病例结构化数据。 8.一种存储器, 其特征在于, 存储有多条指令, 所述指令用于实现如权利要求1 ‑5任一 项所述的病例结构化模型的训练方法, 或者, 实现如权利要求6所述的病例结构化方法。 9.一种电子设备, 其特征在于, 包括处理器和与 所述处理器连接的存储器, 所述存储器 存储有多条指令, 所述指令可被所述处理器加载并执行, 以使所述处理器能够执行如权利 要求1‑5任一项所述的病例结构化模型的训练方法, 或者, 执行如权利要求6所述的病例结 构化方法。权 利 要 求 书 2/2 页 3 CN 115171835 B 3

.PDF文档 专利 病例结构化模型训练方法、装置和病例结构化方法

文档预览
中文文档 13 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 病例结构化模型训练方法、装置和病例结构化方法 第 1 页 专利 病例结构化模型训练方法、装置和病例结构化方法 第 2 页 专利 病例结构化模型训练方法、装置和病例结构化方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 02:15:55上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。