电子病历实体识别
目录
一、课题背景 3
二、中文电子病历命名实体和实体关系标注体系建立 5
2.1 命名实体分类 6
2.1.1 疾病(Disease) 6
.1.2 疾病诊断分类(Disease Type) 6
2.1.3症状(Symptom) 7
2.1.4检查(Test) 7
2.1.5治疗(Treatment) 7
2.2.1疾病和症状的修饰 8
2.2.2治疗的修饰 9
三、实体标注细节 9
3.1 疾病 DIS,DISEASE 9
3.2 症状 10
3.2.1患者向医生陈述的不适感觉(症状) SYM,SYMPTOM 10
3.2.2医生观察到的(体征)ST 10
3.3检查 TES,TEST 10
3.4 治疗 10
3.4.1药品 DRU,DRUG 11
3.4.2手术 SUR,SURGERY 11
3.4.3措施(非手术,非药品的治疗) PRE,precaution 11
3.5实体修饰词标注 11
3.5.1否认词(AT,absent)标注: 11
3.5.2条件词(CL,conditional)标注: 11
3.5.3既往信息词(PT,past) 11
3.5.4时间标注统一标为 TE 12
3.5.5!!可能性词 12
3.5.6程度词标注 12
3.5.7解剖位置 12
3.5.8频率词 (FW,Frequency Word) 12
四、难点 13
三、实体标注细节
通过分析电子病历,医生针对患者的诊疗活动可以概括为:通过患者自述(自诉症状) 和检查结果(检查项目)发现疾病的表现(症状),给出诊断结论(疾病),并基于诊断结论, 给出治疗措施(治疗方案)。这个过程可以看出,医疗活动主要涉及四类重要信息:症状、疾病、检查和治疗,涉及的具体描述如下:
1)疾病:泛指导致患者处于非健康状态的原因,比如:诊断、病史。
2)疾病诊断分类:疾病诊断相关分组,比如“高血压,极高危组”中的“极高危组”。
3)症状:泛指疾病导致的不适和显示表达的检验检查结果,分为:自诉症状和体征(异 常检验检查结果)。
4)检查:泛指为了得到更多的由疾病导致的异常表现以支持诊断而采取的检查设备、 检查程序、检查项目等。
5)治疗手段:泛指为了治愈疾病、缓解或改善症状而给予患者的药物、手术和措施等。
3.1疾病 DIS,DISEASE
疾病必须是能够治疗的,其语义范围包括:疾病或者综合征、受伤或中毒、先天性畸形、 病毒细菌、病理功能、细胞或分子功能障碍、获得性异常、解剖异常、肿瘤进程、精神或行为障碍等。
1。1。1 疾病诊断分型 DT, DISEASE TYPE
疾病的具体分类,表示疾病的进展程度,疾病诊断分类一般出现在诊断里。如:
1)失代偿期 DT
2)III 期 DT
3)II 型 DT
3.2症状
症状是能够被改善或治愈的,并且能够被否定词修饰,为疾病的表现。包括患者向医生 陈述的不适感觉(症状)和医生观察到的(体征)或者检查结果,如:
3.2.1患者向医生陈述的不适感觉(症状) SYM,SYMPTOM
1)疼痛时伴有右下肢活动受限。(“疼痛“ 、”右下肢活动受限”);
2)伴活动后心慌气短。(“心慌”、“气短”)
3.2.2医生观察到的(体征)ST
1)双肺听诊可闻及少量痰鸣音。(“痰鸣音”)
2)自带胸片示左下肺症病变。(“左下肺症病变”)
3)双肺听诊无著征。(“著征”)
3.3检查 TES,TEST
检查是为了发现、证实疾病或症状,找到更多关于疾病或症状的信息而施加给患者的检 查项目,包括:化验过程,诊断过程等。本文转载自http://www.biyezuopin.vip/onews.asp?id=15249如:
1)头 CT 显示脑实质内高密度灶。(“CT”)
2)血压最高达到 180/130mmHg。(“血压”)
3)双肺听诊无著征。(“听诊”)
4)自带胸片示左下肺症病变。(“胸片”)
3.4治疗
治疗是能够治疗疾病或者缓解症状而施加给患者的手段,包括手术、药品、措施等。本
标注语义类型包括:药物、手术。如:
3.4.1药品 DRU,DRUG
1)奥扎格雪、脑蛋白水解物等静点 (药物“奥扎格雪”和“脑蛋白水解物”)。
3.4.2手术 SUR,SURGERY
1)4 年前行胆囊切除术。(手术“胆囊切除术”)
2)鼻内镜下行双筛、双上颌窦。(手术“鼻内镜”)
3.4.3措施(非手术,非药品的治疗) PRE,precaution
3.5实体修饰词标注
3.5.1否认词(AT,absent)标注:
各瓣膜区未闻及病理性杂音 全腹无压痛、反跳痛及肌紧张
3.5.2条件词(CL,conditional)标注:
在某种条件具备的情况下才发生的词。
比如:该患者于入院前 3 个月开始出现阵发性胸闷、心慌,常于饮酒后出现。再如:吃红薯后血糖升高
3.5.3既往信息词(PT,past)
明确表示患者过去有过的治疗史或疾病症状,比如: 有多年心脏病史。
该患者于入院前 3 个月开始出现阵发性胸闷、心慌,常于饮酒后出现。
3.5.4时间标注统一标为 TE
该患者于入院前 3 个月开始出现阵发性胸闷、心慌,常于饮酒后出现。
3.5.5!!可能性词:
不确定当前会发生,需要进一步的证据确认的词。如: 不排除缺血性疾病。/右肺中下叶考虑创伤性湿肺
待证实词:当前不会发生,但预期会发生。比如: 手术一周后会有局部瘙痒
3.5.6程度词标注(AM,AMOUNT),非量化的数量描述词,如大小、多少、程度(明显等)等
双肺听诊可闻及少量痰鸣音。
3.5.7解剖位置
器官(REG,REGION) 部位词(ORG,ORGEN)
3.5.8频率词 (FW,Frequency Word)
患者走路不稳,偶有头晕。时有胸闷气短。
反复胸闷,憋气,持续时间长短不等。标注格式:
突 发 AM 头 晕 SYM 伴 O
恶 心 SYM
呕 吐 SYM
3 小 时 TE