《环境与职业医学》杂志官方网站 《环境与职业医学》杂志官方网站

首页> 当期目录> 正文

2018, 35(10):943-948.doi:10.13213/j.cnki.jeom.2018.18194

职业性三氯乙烯药疹样皮炎数据库构建及应用成果


1a. 广东药科大学公共卫生学院, 广东 广州 510300 ;
1b. 广东药科大学医药信息工程学院, 广东 广州 510300 ;
2. 广东省职业病防治院应急办, 广东 广州 510300

收稿日期: 2018-03-11;  发布日期: 2018-11-06

基金项目: 国家自然科学基金项目(编号:81502769)

通信作者: 蔡先发, Email: cxianfa@126.com  

作者简介: 柳柳(1993-), 女, 硕士生; 研究方向:公共卫生信息学; E-mail:

[目的] 根据三氯乙烯药疹样皮炎患者电子病历构建数据库,为该病的流行病学研究、病因分析、临床治疗及预后提供可靠的数据。

[方法] 通过查阅文献,了解三氯乙烯药疹样皮炎的研究方向,确定数据库的结构。收集和分析1988—2014年间广东省职业病防治院收治的所有新发职业性三氯乙烯药疹样皮炎患者的病历资料,并将其按照基本情况、临床表现、辅助检查、激素使用情况以及住院费5个部分进行归纳和整理,利用EpiData 3.1建立数据库。

[结果] 建立了一个包含基本情况、临床表现、辅助检查、激素使用情况、住院费5个板块,共196例患者的三氯乙烯药疹样皮炎数据库, 并根据此数据库完成了三项科研项目和13篇论文。

[结论] 本数据库包含病例多且信息全面,数据完整,有科研价值,能为该病的流行病学调查、治疗方案的完善以及基于机器学习的预测等提供可靠的数据支持。

关键词: 三氯乙烯药疹样皮炎;  EpiData;  数据库;  应用;  电子病历 

三氯乙烯(trichloroethylene)是重要的有机氯溶剂,广泛用于电子、五金等行业的清洗工艺,主要用作金属脱脂剂、清洗剂以及有机萃取剂。三氯乙烯暴露可引起职业性三氯乙烯药疹样皮炎(occupational medicamentosa-like dermatitis induced by tric hloroethylene,OMDT),该病为职业性免疫增强损伤疾病,以Ⅳ型超敏反应为主[1],主要临床表现为皮损、发热、肝脏损害及浅表淋巴结肿大。OMDT发病率低,不易诊断,危害大,病死率曾高达14.7% [2]。关于此病过去虽有研究,但纳入的样本量少,缺乏代表性。目前该病种还没有一个完整的数据库。虽然患者病历资料丰富,但整理、归纳较少,缺乏能支持科研的高质量数据库。建立该病种的数据库,有助于加强对患者的管理和规范对该病的治疗。RAJKOMAR等[3]的研究中也显示,可通过对健康档案的深度挖掘预测患者住院期间的死亡风险、计划之外的再住院风险、住院时间和出院诊断(受试者操作特征曲线下面积分别是0.93、0.75、0.85、0.90)。

目前国内外也存有各种疾病数据库。早在1973年,美国国立卫生研究院(National Institute of Health,NIH)建立了关于癌症的数据库,即监测、流行病学和结果数据库(surveillance,epidemiology and end results,SEER)(https://seer.cancer.gov/resources/),又在2005年建立了癌症基因组图谱(the cancer genome atlas,TCGA)(https://cancergenome.nih.gov/)。在我国,原国家卫生部启动了脑卒中筛查与防治工程,于2011年4月正式成立脑卒中筛查与防治工程委员会,并建立“中国卒中数据中心”(http://202.38.153.225:9958/healthcare/);郝荣章等[4]在2011年建立了8大类158种食源性疾病信息的数据库;但职业病领域的数据库建立仍有待开发。

为增强OMDT研究结果的可靠性,充分利用患者临床资料,本项目组采用EipData软件对1988—2014年广东省职业病防治院收治的OMDT患者病历资料进行整理,建立包括从流行病学特征、临床表现、实验室检查、治疗用药情况以及出院等全部信息的数据库。

1   材料与方法

1.1   OMDT患者数据库构建流程

先查阅文献,了解OMDT目前及以后可能的研究方向,确定所建数据库的内容;收集患者病历信息,并按照事先确定的内容对患者信息归纳整理;利用EpiData 3.1建立数据库,录入数据。具体步骤见图 1

图 1

数据库构建流程图

1.2   对象

以广东省OMDT患者为主,选取1988—2014年间广东省职业病防治院收治的新发OMDT病例,对其病图 1数据库构建流程图历进行整理和信息录入。纳入标准:由职业病诊断医师依据GBZ 185—2006 《职业性三氯乙烯药疹样皮炎诊断标准》 [5]集体诊断确认的病例;或2006年前根据GBZ 18—2002 《职业性皮肤病诊断标准(总则)》 [6]诊断的病例,本研究组织诊断医师依据GBZ 185—2006 《职业性三氯乙烯药疹样皮炎诊断标准》重新判定确认的病例。排除标准:无发病时详细临床资料的病例。

1.3   数据库结构和录入规则

OMDT为变态反应性职业病[1],根据其发病特征和发病机制,数据库主要分为基本情况、临床表现、辅助检查、激素使用情况、住院费5个板块,各变量的录入规则如下。

1.3.1   基本情况

由于本病是接触三氯乙烯而引起的,所以基本情况中除了一般信息(病历号、姓名、性别等)以外,还增加了工作相关情况和职业暴露情况,如:工作单位、工种、工作中的防护措施、同工厂有无病例、接触三氯乙烯的浓度、开始接触的时间、入院时首次检测尿中三氯乙酸(TCA)水平、TCA检测时脱离接触的天数、脱离接触时患者尿中TCA水平等。其中,脱离接触时尿中TCA水平=入院时检测的尿中TCA水平×2n/2.4n为脱离接触的天数,2.4为TCA的代谢半衰期(2.4 d,57.6 h)[7]

1.3.2   临床表现和辅助检查

临床表现主要是通过查阅病历中患者主诉和现病史,以及体格检查等内容,记录症状和体征的相关信息。同时还需记录患者每一次的辅助检查结果,特别是入院后首次检查和出院时检查结果。根据辅助检查结果,进行肝功能损害程度分级。参照GBZ 59—2010 《职业性中毒性肝病诊断标准》 [8],以急性期血清谷丙转氨酶(ALT)超过实验室正常参考值为肝功能损害判定标准,并根据急性期总胆红素(TBIL)水平进行肝功能损害程度分级:TBIL ≤ 17.1 μmol/L是轻度以下损害,17.1 μmol/L < TBIL ≤ 51.3 μmol/L是轻度损害,51.3 μmol/L < TBIL < 85.5 μmol/L是中度损害,TBIL ≥ 85.5 μmol/L是重度损害,再根据发热、皮疹和肝功能损害进行病情程度分级[1]

1.3.3   激素使用情况

通过查阅医嘱,记录患者每天使用激素的情况。因激素种类较多,使用情况较为复杂,故将所有激素统一转换为以甲泼尼龙琥珀酸钠(又称为甲强龙、甲基强的松龙)的剂量录入,根据等效剂量,其他种类激素剂量换算公式如下:地塞米松:甲泼尼龙:强的松=0.75:4.00:5.00(单位mg)[9]

1.3.4   住院费

根据患者病历,除了录入住院总费用外,还有所包含的自负费用。并对住院费进行分类,如综合医疗服务类、诊断类、治疗类等,分别汇总录入。

1.4   建立数据库

1.4.1   建立调查表文件(QES)

在Windows 7操作系统中运用EpiData 3.1软件设计录入文件。本次调查表中的变量类型有数值型、文本型、日期型、自动ID号、布尔逻辑等。同时在调查表的设计过程中,尽量将病历中的文本信息转化为数值型,方便数据的统计分析。采用“ {}”的方式生成变量名,括号内为英文或英文加数字。变量名的长度尽量保持在8个字节以内,命名应保持一定的规律,简洁且具有描述性,比如:住院总费用和自付费用的变量名分别设置为“ {totexp}”和“ {selfexp}”,ABO血型直接设置为“ {ABO}”。

1.4.2   生成数据库(REC)

创建与调查表文件名一致的数据库文件。数据库一旦建成,若后期需要修改,可以直接在QES文件中修改。若无QES文件,可通过工具中的“根据REC文件生成QES文件”利用REC创建一个QES调查表,再进行修改[10]

1.4.3   建立核查文件(CHK)

通过设置核查文件,实时检查录入数据的合理性、正确性,保障数据录入质量和控制录入的流程。对年龄、性别等数值型变量限制其允许录入的数值或范围,如将字段“ SEX”设置为只能录入数字1或2;实现两变量之间的跳转,如婚姻状况若为未婚,则跳过后面的子女个数直接录入下一变量(血型),且将婚姻状况和血型之间的变量内容清除;对于患者性别、年龄等不能有缺失信息的变量,通过核查文件使其必须录入;通过编程自动计算每一份数据的录入时间,了解录入的整体情况,并可作为录入人员的考核指标[11];对可能的异常值进行提醒,如当输入的年龄小于18或者大于80时,通过自动弹出的消息框提醒记录者进行核查确认。

1.5   预录入

根据最初做好的数据库先选取5份病例进行预录入,并导出为所需的格式,用于检查CHK文件的有效性,以及导出的数据集中每个变量的变量名是否完整、正确。根据录入过程的实际情况和录入人员的反馈信息,进一步修改完善调查表。

对调查表的修改有:在预录入过程中,对核查文件进行调试,并对错误语句进行更改;将“籍贯”这一变量由字符型变量改为数值型变量,降低出错的可能;对一些字符型变量(如现住地址,工作单位等)设置更多的变量长度;在调查表文件中增加制表符“@”,使变量录入框在录入表格中自动对齐,优化问卷的视觉效果。

2   结果

2.1   数据库基本情况

1988—2014年间,广东省职业病防治院收治与三氯乙烯有关的病例共有210例,符合诊断标准的有207例,其中11例已经在基层医院治疗一段时间,缺少发病时的详细临床资料,故未纳入。最后所建立的数据库中包含了196例新发OMDT患者,其中男性110人,女性86人,发病年龄M(P25P75)为22(19,27)岁。

数据库主要分为基本情况、临床表现、辅助检查、激素使用情况、住院费5个部分。其中,基本情况包含有一般信息、工作相关情况、职业暴露情况、既往史;临床表现包括症状和体征;辅助检查包含患者每一次的检查内容,如心电图检查、肝脾B超检查、血液学检查、尿液检查、生物化学检验、免疫学检查以及相关等位基因基因型检测;激素使用情况包括每天使用的激素种类、激素使用总时间,以及换算后整个治疗过程中的首次激素剂量、总剂量、平均剂量、最大剂量、减量时间、减量剂量等;住院费中包含了综合医疗服务费、诊断类、治疗类、康复类、中医类、西药类、中药类、血液和血液制品类、耗材类、其他类,并记录了其中的自负总费用。每部分所包含的变量具体如图 2

图 2

职业性三氯乙烯药疹样皮炎数据库结构

对于数据库中各变量的缺失情况,在基本情况中,除接触三氯乙烯的浓度外,其余变量缺失率均≤ 1%;在临床表现中,86.4%的变量缺失率≤ 20%;在辅助检查中,82.9%的变量缺失率≤ 20%;在激素使用情况和住院费中,各变量的缺失率均≤ 20%。

2.2   研究成果

基于本数据库,获得的研究成果有:完成了3项科研项目的研究工作,包括2项国家科技支撑计划[分别是“十二五”国家科技支撑计划课题“职业中毒与职业性肺病的诊断与治疗技术研究”(2014BAI12B01),“十一五”国家科技支撑计划项目“重金属和有机溶剂对工人健康损害的生物监测和预防控制研究”(2006BAI06B02)]和1项国家自然科学基金[三氯乙烯代谢产物水合氯醛和三氯乙醇与三氯乙烯药疹样皮炎的关系研究(81502769)];完成了13篇论文[12-24],主要在流行病学研究、激素治疗方案、临床路径、发病机制、生物标志、免疫功能变化等方面取得了一定的成果;完成了1项软件著作权申请(职业性三氯乙烯药疹样皮炎临床路径智能管理系统V1.0——计算机软件著作权登记证书(软著登字第1639858号);培养博士1名,硕士2名。

3   讨论

EpiData为完全免费软件,占用空间小,界面友好,操作简单,实用性强,CHK文件的设置也有效防止了异常数据进入数据库。在实践过程中,调查表也可以根据具体情况实时修改完善,且数据可导出为多种格式并在各种统计软件(SAS,SPSS,STATA,EXCEL等)中分析,非常适用于病历资料的整理。

本次基于EpiData软件建立的OMDT数据库,基本上覆盖了目前国内外关于该疾病研究的主流内容,涵盖资料完整,信息准确。而该病发病以我国广东地区为主[2, 25],所以数据库中的样本具有代表性。相比于一般疾病的数据库[26-27],本数据库具有以下特点。

根据疾病特点选取有意义的变量。通过前期研究了解到OMDT是由三氯乙烯接触引起的高敏反应[18],所以发病受工作环境、工种、职业暴露和自身因素的影响。故相比于其他疾病的数据库,本数据库在基本信息板块增加了工作相关的情况和职业暴露情况说明,如工作单位、工作地点、工种、接触三氯乙烯的浓度、防护措施,以及可能相关的等位基因基因分型(人类白细胞抗原[28]、N-乙酰基转移酶2 [29])信息。

从难点和研究的热点出发。目前糖皮质激素被认为是治疗OMDT最有效的药物,但使用不当也会诱发各种副作用而损害患者健康。因此,如何“早期、适量、足程使用激素”,提高治愈率,减少并发症成为了当前治疗OMDT的关键技术问题[24],也是研究的热点。但目前激素使用方法和剂量并无统一标准,且疾病治疗周期长,用药情况复杂,主要依靠临床医生各自的经验给药。故整理时,需通过人工查阅医嘱,查找和记录每位患者每一次激素使用的种类、时间以及用量,再统一转换为以甲泼尼龙琥珀酸钠的剂量录入,此过程较为复杂,需仔细核对。

变量类型以数值型和逻辑变量为主。在数据录入和整理时,病历中的临床表现多为字符型,使得研究人员无法快速有效地对临床信息进行统计分析和数据挖掘,故需人工查阅病历资料将其转换为数值型或逻辑变量,方便后期的研究,如:将主述中的皮疹转换为分类变量(1为有皮疹,2为无皮疹),皮疹分型也转换为分类变量(1为剥脱性皮炎,2为重症多形红斑,3为表皮坏死松懈症,4为多形红斑),入院前是否已经使用激素可转换为布尔逻辑(是/否)。

当然,在研究中也发现了一些局限性。将字符型变量转换为数值型,虽然最终的数据便于后期整理和统计分析,但工作量大,且工作人员容易出错,无法体现出计算机辅助管理系统的高效性,其结果必然导致数据库可靠性和准确性降低。故在后续的研究中,可将病历系统与文本识别相结合,通过计算机直接对文本进行分类,可有效降低错误率并减轻工作人员负担。

本次OMDT数据库的建立,主要利用EpiData软件根据OMDT病历资料进行调查表的设计,编写核查文件,再对其进行整理和录入。选取的变量主要根据该病的发病特点和机制,详细记录了病人基本信息,工作情况,临床表现,辅助检查结果,激素使用情况等。此数据库样本齐全,数据完整,包含信息面广且有针对性,变量类型以数值型为主,可运用该数据库进行更为深入的流行病学调查和临床特征分析,为疾病的干预研究提供更新的思路和建议;同时,可通过数学建模对重要的指标进行预测,如利用贝叶斯网络,K近邻(k-Nearest Neighbor)等分类算法预测患者转归(临床治愈、好转或死亡)和激素使用情况(如首次使用量、最大剂量、最大剂量使用时间、平均剂量),达到完善治疗方案的目的;利用relief等降维的方法分析影响住院时间、住院费等的主要因素,以减少疾病负担,为职业病防治的效果评价提供依据。故本数据库值得在临床科研中推广。

图 1

数据库构建流程图

Figure 1
图 2

职业性三氯乙烯药疹样皮炎数据库结构

Figure 2 [注]数据库中变量未全部列出。

参考文献

[1]

黄永顺.三氯乙烯药疹样皮炎免疫损伤类型及致敏物质研究[D].广州: 南方医科大学, 2015.

http://cdmd.cnki.com.cn/Article/CDMD-12121-1016003083.htm

[2]

李来玉, 黄汉林, 何家禧, 等.广东150例职业性三氯乙烯药疹样皮炎病例的职业流行病学调查[J].中国职业医学, 2006, 33(5):333-336.

[3]

RAJKOMAR A, OREN E, CHEN K, et al. Scalable and accurate deep learning with electronic health records[J]. npj Digit Med, 2018, 1:18.

[4]

郝荣章, 王立贵, 邱少富, 等.食源性疾病数据库的建立[J].公共卫生与预防医学, 2011, 22(5):5-9.

[5]

职业性三氯乙烯药疹样皮炎诊断标准: GBZ 185-2006[S].北京: 法律出版社, 2006.

[6]

职业性皮肤病诊断标准(总则): GBZ 18-2002[S].北京: 法律出版社, 2004.

[7]

IKEDA M, IMAMURA T. Biological half-life of trichloroethylene and tetrachloroethylene in human subjects[J]. Int Arch Arbeitsmed, 1973, 31(3):209-224.

[8]

职业性中毒性肝病诊断标准: GBZ 59-2010[S].北京: 法律出版社, 2010.

[9]

中华人民共和国卫生部.糖皮质激素类药物临床应用指导原则[J].中华内分泌代谢杂志, 2012, 28(2):171-202.

[10]

LAURITSEN J M, BRUUS M. EpiData(version 3.1). A comprehensive tool for validated entry and documentation of data[M]. Odense Denmark:The EpiData Association, 2004.

[11]

郭郡浩, 刘玉秀, 蔡辉.用EpiData录入数据计时功能的实现[J].中国临床药理学与治疗学, 2008, 13(7):792-795.

[12]

黄永顺, 黄汉林.职业性三氯乙烯药疹样皮炎免疫损伤研究进展[J].中国职业医学, 2010, 37(2):157-159, 162.

[13]

吴奇峰, 叶晓光, 陈甦生, 等.三氯乙烯药疹样皮炎研究概况[J].中国职业医学, 2010, 37(3):255-256, 258.

[14]

吴奇峰, 陈甦生, 夏丽华, 等.影响三氯乙烯药疹样皮炎患者住院时间多因素分析[J].中国职业医学, 2011, 38(5):422-423.

[15]

吴奇峰, 赵娜, 李聪, 等.三氯乙烯药疹样皮炎患者淋巴细胞亚群与肝功能损害相关分析[J].职业卫生与应急救援, 2013, 31(1):1-3, 11.

[16]

夏丽华.三氯乙烯的职业危害与防护[J].现代职业安全, 2013(1):104-106.

[17]

黄永顺, 越飞, 夏丽华, 等.三氯乙烯药疹样皮炎患者补体3水平降低与肝功能损害关系分析[J].中国职业医学, 2014, 41(1):36-41.

[18]

HUANG Y, XIA L, WU Q, et al. Trichloroethylene hypersensitivity syndrome is potentially mediated through its metabolite chloral hydrate[J]. PLoS One, 2015, 10(5):e0127101.

[19]

HUANG YS, HUANG HL, WU QF, et al. Follow-up assessment of two cases of trichloroethylene hypersensitivity syndrome:a case report[J]. Exp Ther Med, 2016, 12(2):895-900.

[20]

李瑞文, 张宗军, 周珊宇, 等.职业性三氯乙烯药疹样皮炎患者血清非酶抗氧化物浓度变化分析[J].实用预防医学, 2017, 24(11):1366-1368.

[21]

吴奇峰, 夏丽华, 曾子芳, 等.职业性三氯乙烯药疹样皮炎临床路径研制[J].中国职业医学, 2017, 44(4):420-424, 429.

[22]

李瑞文, 张宗军, 李斌, 等.职业性三氯乙烯药疹样皮炎患者血清甲状腺激素水平分析[J].中国卫生检验杂志, 2017, 27(6):872-874.

[23]

吴奇峰, 赵娜, 李聪, 等.影响职业性三氯乙烯药疹样皮炎转归临床指标的研究[J].工业卫生与职业病, 2017, 43(1):19-23.

[24]

吴奇峰, 夏丽华, 梁伟辉, 等.职业性三氯乙烯药疹样皮炎患者糖皮质激素使用方法分析[J].中国职业医学, 2016, 43(6):633-638.

[25]

李来玉, 陈秉炯, 黄先青, 等.广东省职业性三氯乙烯皮肤损害的发病情况及分析[J].中国工业医学杂志, 1998, 11(6):349-351.

[26]

李月云.乳腺恶性肿瘤EpiData数据库构建与应用[D].青岛: 青岛大学, 2013.

http://cdmd.cnki.com.cn/Article/CDMD-11065-1013228403.htm

[27]

张文献.急性冠脉综合征介入诊治EpiData数据库的建立与应用[D].昆明: 昆明医科大学, 2013.

http://cdmd.cnki.com.cn/Article/CDMD-10678-1013332806.htm

[28]

张峻. HLA-B提呈抗原肽在三氯乙烯药疹样皮炎发病中的作用[D].北京: 中国疾病预防控制中心, 2013.

http://cdmd.cnki.com.cn/Article/CDMD-84501-1016282290.htm

[29]

李来玉, 冷曙光, 郑玉新, 等.三氯乙烯药疹样皮炎代谢酶基因多态性的病例对照研究[J].中国职业医学, 2002, 29(3):4-8.

上一张 下一张
上一张 下一张

[基金项目] 国家自然科学基金项目(编号:81502769)

[作者简介] 柳柳(1993-), 女, 硕士生; 研究方向:公共卫生信息学; E-mail: 313038190@qq.com

[收稿日期] 2018-03-11 00:00:00.0

【点击复制中文】
【点击复制英文】
计量
  • PDF下载量 (7)
  • 文章访问量 (1295)
  • XML下载量 (0)
  • 被引次数 (0)

目录

职业性三氯乙烯药疹样皮炎数据库构建及应用成果

导出文件

格式

内容

导出 关闭
《环境与职业医学》杂志官方网站