摘要:
背景 暴露组构成了一个有前景的框架,通过明确考虑多重检验、避免选择性报告来提升关于环境暴露对健康影响的理解,但暴露组研究在同时考虑多种相关暴露方面受到了挑战。
目的 比较线性回归法在分析暴露组与健康相关性中的性能。
方法 在模拟研究中,设定237个暴露协变量,它们具有真实的相关结构并且对其中0~25个协变量呈线性相关的健康结局。主要比较统计方法的假阳性率(false discovery proportion,FDP)和灵敏度。
结果 在所有模拟设定中,弹性网络和稀疏偏最小二乘回归法的灵敏度为76%,FDP为44%;图形单元进化随机搜索(Graphical Unit Evolutionary Stochastic Search,GUESS)和删除/替换/添加(deletion/substitution/addition,DSA)算法的灵敏度为81%,FDP为34%。全环境关联分析(environment-wide association study,EWAS)尽管灵敏度更高,但平均FDP达到86%,但性能弱于前两者。当评估协变量间高度相关的暴露组暴露矩阵时,其性能明显下降。
结论 暴露之间的相关性是暴露组研究的一项挑战。在真实的暴露组情况下,本研究所考察的统计学方法有效区分真实预测变量与相关协变量的能力有限。尽管GUESS和DSA在灵敏度和FDP之间平衡方面稍好,但他们在所有考察的情景及属性上并未比其他多因素统计方法效力更好,在选择这些方法时也应考虑计算的复杂性和灵活性。