《环境与职业医学》杂志官方网站 《环境与职业医学》杂志官方网站

首页> 当期目录> 正文

2020, 37(2):192-196.doi:10.13213/j.cnki.jeom.2020.19520

人工智能技术在尘肺病诊断中的应用研究进展


杭州医学院职业病防治研究所, 浙江 杭州 310013

收稿日期: 2019-07-29;  发布日期: 2020-03-14

基金项目: 浙江省医学重点学科-支撑学科(11-ZC02);浙江省公益技术研究社会发展项目(2012C33098);浙江省卫生适宜技术成果转化计划(2013ZHA005);浙江省公益技术应用研究项目(2017C33048)

通信作者: 陈钧强, Email: john@tohz.com  

作者简介:

张敏(1978-), 女, 博士, 助理研究员; E-mail:zhangm@zjams.com.cn

利益冲突  无申报

尘肺病诊断主要依据医学影像学的判断,目前人工智能(AI)已经运用到尘肺病医学影像学的辅助诊断上。临床上贰期和叁期尘肺病诊断并不困难,困难之处在于无尘肺病和壹期尘肺病的诊断,其诊断结论往往差异很大,特别是诊断经验不足的医师很容易出现漏诊、误诊的情况。AI技术在尘肺病影像诊断中的应用就是着重解决无尘肺病和壹期尘肺分类诊断的问题。本文综述了近年来AI技术在尘肺病诊断中的应用研究,重点阐述支持向量机(SVM)和人工神经网络(ANN)这两种AI技术在尘肺病分类诊断中的应用,并分析其优缺点;展望卷积神经网络(CNN)技术和其他AI深度学习算法在未来应用到尘肺病图像分类的可能,分析其存在的困难及今后突破的方向。

关键词: 尘肺;  人工智能;  支持向量机;  人工神经网络 

人工智能(artificial intelligence,AI)起源于二十世纪五六十年代,随着深度学习和卷积神经网络(convolutional neural network,CNN)的飞速发展,2012年逐渐进入医疗领域,实现了AI在远程诊断、疑难杂症会诊和基于图像识别技术的影像学、病理学和皮肤病学诊断等的产业化和应用。中国虽然较晚进入AI领域但进展迅猛,截至2018年6月,中国共有89家医疗AI创业企业获得投资,总金额约219.38亿元,中国的医疗AI产业正在快速发展[1]。目前AI在图像识别技术方面的应用研究最多,也更加成熟,医学影像学上的人工智能辅助诊断应用也是医疗AI产业中最有期望取得突破的医学专业内容。

尘肺病是所有职业病中发病率最高、危害最严重的一种疾病[2],作为终身性疾病,对社会经济发展和个人身心健康都会造成巨大的影响。临床上诊断贰期和叁期尘肺病并不困难,但无尘肺病和壹期尘肺病的诊断结论差异较大,特别是诊断经验不足的医师很容易出现漏诊、误诊的情况。尘肺病诊断主要依据医学影像学的判断,我国也有相应的尘肺病标准片做参照,诊断工作看似简单实则不易,基于AI技术的尘肺病智能诊断应用研究在国内外均有开展,但目前还未见临床应用[3]。本文综述了近年来AI技术在尘肺病诊断中的应用研究,并分析存在的困难及今后发展的方向。

1   AI在尘肺病诊断中的应用

培养一位合格的影像医师至少需要5~8年的时间,需要大量的临床实践才能胜任工作。AI解放了人类的大脑,具有丰富的知识存储能力、自我学习能力及多维思考能力,对于高强度、重复性、机械性的影像学诊断活动不会疲惫,不会视觉疲劳。影像医生可以把节约出来的时间从事创新性的思考及课题研究[1]。尘肺病作为一种肺部弥漫性纤维化的疾病,高千伏X线胸片和数字化X线胸片是尘肺病筛查和诊断的有效手段;CT片还没有诊断标准,但在辅助诊断中发挥重要作用。CT在尘肺病诊断中的主要作用是在发现肺大泡、肺气肿、胸膜改变,且在与纵隔或横膈重叠的大阴影的诊断上,比X线胸片有很大优势,在与其他疾病的鉴别诊断上也起着重要作用。目前基于AI的医学影像学主要应用在CT的肺结节识别上,对于尘肺病诊断来说,胸片的AI诊断还需要做大量的研究工作。在临床实践中,尘肺病诊断医师根据胸片对贰期、叁期尘肺的诊断并不困难,因此,基于数字胸片的AI辅助诊断系统开发更多集中在壹期和早期尘肺病胸片的评估和诊断上,这些研究似更具临床意义[4]

基于计算机辅助检测系统(computer-aided detection,CAD)的尘肺病胸片计算和分析方法,大致分为两类:一类是在胸片上检测出圆形或不规则小阴影,然后对比国际劳工组织尘肺病标准片,将胸片分为正常或尘肺胸片[5];另一类是对胸片肺纹理进行分析以诊断尘肺[4, 6],对尘肺病胸片肺纹理特征的研究是这几年研究的热门课题,主要通过灰阶直方图、灰阶共生矩阵、功率谱和胸片频率来计算纹理特征,不同的方法和数据设置表现出不同的特质。实践中,分析结果取决于多种关键因素,如使用的数据库、提取和选择的肺纹理特征、分类方法等,这些都会影响CAD系统结果的评估[4]

胸片纹理特征分析对诊断尘肺病准确率较高,但是早期的胸片肺纹理特征分析存在许多缺陷,如计算量庞大、数字胸片清晰度不够等[7]。近年来,随着支持向量机(support vector machines,SVM)和人工神经网络(artificial neural network,ANN)等技术的引入,计算机分析胸片肺纹理的能力和尘肺病诊断准确性都大幅度提高。

2   SVM技术分类诊断尘肺病

SVM技术是一种二分类算法,是基于间隔最大化的一种监督分类学习方法。SVM是线性分类器,加入核函数后,得到高维空间的分类函数,可以处理非线性分类问题,使它成为非线性分类器。分类过程也就是机器学习的过程,获得最大间隔分类是肺结节分类中需要的功能。

Zhu等[4]利用小波的能量纹理特征和不同尺度小波变换信号来计算40例壹期和贰期尘肺患者的胸片肺纹理特征。考虑到不相关特征的影响,将小波纹理与决策树(decision trees,DTs)模型的相关性来选择肺纹理特征。以小波能量系数作为纹理特征,建立SVM诊断分类模型。采用五倍交叉验证法进行开发,并根据受试者工作特征(receiver operating characteristic curve,ROC)曲线和曲线下面积(area under the curve,AUC)对各模型的最终性能进行比较。基于连续7个尺度的小波变换后提取的28个能量特征,SVM分类器比之前的具有更高的性能(精确度为87.2%,AUC值为0.94)。运用SVM对正常人、壹期和贰期尘肺患者的区分已达到较高水平,准确率达92.0%,不亚于对叁期尘肺诊断的准确率[4]。Zhu等[7]把胸片分成6个肺野(a~f),每个肺野用决策树算法计算出22个小波能量纹理特征,使用SVM模型对尘肺病患者胸片的每个肺野分类训练,肺野c和f区域的AUC均低于其他4个区域,所以各个肺野集成的SVM分类比单个肺野的SVM分类具有更高的诊断性能,该模型对早期发现尘肺病具有良好的潜力。这些研究表明用选定特征的SVM分类来诊断尘肺切实可行。

利用SVM分类器的全自动CAD方案对开展尘肺病大规模的筛查非常有帮助。Yu等[6]对300例正常人和125例尘肺病例的胸片进行自动分类测试,结果表明基于SVM分类器的全自动CAD获得较高的分类准确性。首先,根据我国的尘肺病诊断标准,通过主形状模型方法将胸部X射线图像分割成6个非重叠肺野。然后,将不同尺寸的分滤波器应用于胸部图像以增强小阴影的细节,并且分别从每个肺野的原始图像和处理图像中计算纹理特征。从特征集中提取最相关的特征之后,通过胸片6个肺野的分类概率值来执行最终分类。SVM的计算机辅助诊断技术能有效分类矽肺胸片的小阴影,供放射科医生参考[8]。SVM分类诊断在尘肺病AI诊断中具有良好的应用前景。

目前,SVM分类在肺结节中运用逐步成熟,基于云设计和新的肺部结节分类框架,可以降低假阳性率、提高准确度、降低计算成本,SVM早期检出肺癌的灵敏度高达97.45% [9]。Xiang等[10]用逻辑回归、ANN、K最近邻、随机森林和SVM对388例实体性肺结节患者建立预测模型,以评估肺结节的恶性程度。结果显示在5个模型中,SVM算法具有最高的AUC和最佳的灵敏度(90.3%)、特异性(80.4%)、阳性预测值(93.9%)、阴性预测值(71.2%)和准确性(88.0%)。在预测实体性结节的恶性程度方面,SVM可能是一种有用的辅助算法。

SVM优点明显,对于边界清晰的分类和高维分类效果好,使用训练集中的支持向量,可以节约内存,对于千以内的样本分类更好。SVM的缺点是样本量较大时,矩阵计算将耗费大量的内存和计算时间,训练时间较长,难以实现大样本分类训练。针对这个问题,有许多科学家改进了运算方法,如顺序最小优化算法[11];SVM从大空间中选择有高辨别力的特征时存在困难,Taskin等[12]关注降维问题,并提出一种新的特征选择算法,明显减少计算负荷的同时,也获得高分类精度;经典的SVM技术是二分类的技术,但实际应用中临床疾病属于多分类的情况比较多,要解决多类的问题,可以通过多个分类器的组合来解决,一对一组合模式和组合决策树等,形成优势互补的算法,解决多类问题[13]

3   ANN技术分类诊断尘肺病

ANN是以数学模型模仿大脑神经网络结构和学习能力而建立的一种机器学习过程。ANN把大量的处理单元互相连接形成复杂网络结构,通过对已知信息的反复学习训练,逐步调整改变处理单位连接权重,达到信息处理、模拟人脑组织输入输出的功能。

Okumura等[14]开发了一种基于ANN分类的CAD系统,对尘肺胸片纹理特征进行分类。图像数据库由36张胸片组成,从0到3分为四类。从胸片中选择矩阵大小为32×32的感兴趣区域(regions of interest,ROI)。从每一个ROI中获得灰度级直方图、灰度级差异直方图、灰度级游程矩阵和灰度级共生矩阵等特征图像。基于ROI数据,每一种肺纹理特征训练第一层ANN,第一层ANN获得的结果输出训练第二层ANN,最后,从第三层ANN获得最终尘肺病胸片的分类。第三层ANN通过AUC分析。最高级别尘肺病和最低级别尘肺病AUC值分别为0.89±0.09和0.84±0.12。此项研究表明具有4种肺纹理特征的三阶段ANN分类性能较高。这种ANN分类方法可用于协助放射科医师将尘肺病从0到3分类。

Okumura等[15]开发一种基于规则+ANN功率谱分析尘肺病的CAD系统。从2张正常肺胸片和15张异常肺胸片中选择具有32×32矩阵大小的ROI区域,从窗函数、顶帽变换和灰度共生矩阵分析得到3种新的增强方法。再通过傅里叶变换计算所有ROI的功率谱。然后使用基于规则+ANN方法对于正常和异常胸片的ROI分类,结果显示在最高类别(严重尘肺病)和最低类别(早期尘肺病)的胸部X线胸片上,AUC平均值分别为0.93和0.72。基于规则+ANN分类方法结合3种新的增强方法有助于协助放射科医师进行尘肺病分类,用于区分异常和正常胸片的ROI,这种CAD系统能有效减少假阳性和假阴性的判定。

神经网络可以实现任何复杂非线性的映射,适合于求解复杂的分类问题,具有自学能力。神经网络的主要优点,在于它们能够胜过几乎所有其他的机器学习算法。例如在癌症检测中,对于性能的要求非常高,因为性能越好,可以治疗的人越多。

神经网络最明显的缺点是“黑匣子”性质,表现为输出结果没有明确的解释,导致网络训练失败,这与是否选择合适的网络结构,训练有无陷入局部极值,新加入的样本是否对已经学习的网络有影响,找不到反映样本内含的规律等有关。另外,开发时间长,耗时耗力,需要明确算法的细节,需要数千过万的标记样本才进行精准运算,完成深度学习和训练的周期长,需要数周时间。针对ANN的问题,Shi等[16]提出了一种基于大规模训练的方法,这个方法可有效地减少胸部影像中肺部结节的假阳性。

4   CNN技术诊断肺结节

近年来CNN是AI在图像方面最常用的算法,取代了传统的神经网络。CNN是目前图像处理领域研究最多的深度学习技术,国际上许多成功的模型都是基于CNN。跟传统的图像处理方法相比,CNN把原始图像看成是一个或多个二维向量而直接分析,不需要对图像进行前期预处理。CNN采用局部连接、权值共享等方式避免了传统的神经网络用全连接方式而导致参数量巨大、网络训练耗时等甚多的难题。CNN有着很强的空间抽象能力,二维(2D)的卷积操作等效于在一个图像上进行特征抽取,Annarumma等[17]用CNN对470 388张成人胸部X线片进行自动实时分诊研究,根据AUC值确定CNN的敏感性(71%)和特异性(95%),CNN系统能检测到的正常胸片与历史数据相比,明显减少了平均出报告天数,CNN系统对成人胸片进行自动实时分诊在临床上是可行的。Kim等[18]运用CNN人工智能对106 179位成人和5 941位儿童的前后位和后前位胸片分类进行研究,采用AUC值评估CNN在成人和儿童X线胸片,其数据分析准确度分别为99.6%和98.0%;成人胸片的敏感性和特异性分别为99.6%和99.5%,儿童胸片的敏感性和特异性均为98.0%。表明CNN对成人和儿童的胸片都可以进行快速分类。

对于CT这种三维数据,三维(3D)CNN能更好地提取特征。CNN的算法应用于低剂量CT图像来检测肺部结节的效能已在临床运用,刘聪等[19]提出一种基于3D-CNN和逆卷积算法来检测肺结节,以辅助医生诊断肺结节的量和良恶属性,3D-CNN可以计算肺结节的直径、体积、体素值分布等信息,3D-CNN可以根据结节的毛刺、分叶、钙化等属性来判断结节良恶性。该算法取得了94.1%的结节检出率,为医生的诊断提供重要参考,有效地提高了医生的工作效率且降低漏检率。金文忠等[20]应用CNN分析3 750例低剂量CT影像数据进行肺结节检测,结果与6名资深影像专业医生诊断结果进行比较,CNN智能辅助诊断肺结节的敏感度高达96.6%,正确率、阳性预测值,阴性预测值均较高。通过对结节误诊、漏诊和确诊的原因分析,CNN具有较强的自我进阶能力,这种CAD系统在检测肺结节上具有可靠性和成长性,是门诊和体检工作中肺结节筛查的有效辅助工具。CNN有助于放射科医生发现早期肺癌,对减少假阳性起着关键作用[21]。随着CNN智能辅助诊断肺结节技术的发展,预计不久的将来CNN技术也将用于尘肺病的分类诊断。

目前,肺结节的AI检测除了SVM、ANN和深度卷积神经网络(deep convolutional neural network,DCNN)分类器等方法外,还有一些新的计算分类方法,如朴素贝叶斯分类器和神经模糊分类器,不仅对肺结节正常或异常进行分类,还对肺癌分期进行分类,提高了分类精度[22]

世界上没有一种AI的学习算法能够解决所有的问题,使用哪种机器学习算法,取决于要解决的分类问题。有时候需几种算法共同使用,以弥补各自的缺点。在早期肺结节影像AI诊断中,采用多种算法结合的方式,可使分类精确度更高。如Kailasam等[13]使用DCNN、CNN、定向梯度直方图、定向梯度扩展直方图(和局部二值模式等提取影像特征),以及用SVM、K最近邻、决策树和随机森林结合提取肺影像特征,进行结节和非结节分类。

5   小结

尘肺病属于肺间质性疾病,尘肺病胸片的鉴别诊断在影像学中较为困难,可能是因为不同尘肺病胸片阴影呈现多样性和复杂性,以及不同放射科医生对胸片分析方法和经验的差异性。AI智能系统的计算机输出结果可提高放射科医生分析胸片的准确性和完整性。许多研究人员正在研发用于检测尘肺病胸片表征的CAD,通过几何图形的形状和大小度量与肺间质疾病的胸片纹理结合分析来区分正常和异常的间质性疾病[6],特别是三维图像运用到AI智能诊断,加速了尘肺病智能分类的发展。

随着AI智能辅助诊断尘肺病影像的日趋成熟,AI辅助尘肺病影像诊断将运用到临床,这将大幅度提高我国基层医院尘肺病影像的诊断水平,特别是对没有经验的实习医师,使用基于CAD的AI系统可以大幅提高其诊断水平和缩短阅片时间[23]。“AI+医生”的双重阅片机制减少漏诊的同时,也减轻阅片医生的负担。AI辅助诊断融入日常临床工作,可以提示不同年资、地区、医院、影像医师之间判读结果的一致性;对于不同结果,权威专家还可以通过AI进行系统规范性指导,这对于阅片能力相对较弱的医师和基层医疗机构具有重大意义[1]。AI的出现有望解决基层单位缺少专家的问题[3],也可加快向基层医院传播先进诊疗技能的速度并降低医疗成本。

然而,目前的AI智能诊断系统还不能完全取代放射科医生,因为它对特定分类的特异性算法有限,需要更多的深入研究以确保AI诊断的准确性