摘要:
背景 识别癌症风险是预防癌症的第一步。自1971年以来,国际癌症研究机构(IARC)专刊计划已评估了近1 000种化学品的致癌风险。通常根据公众提名、专家建议、已发表的致癌性数据及公共卫生意义来选择需进行危害评估的化学品。
目的 本文提出一种新的补充性策略,即使用化学信息学、数据库一体化和智能文本挖掘技术来识别需进行危害评估的化学品。
讨论 为了从广泛的被提名备选农药种类中进行选择,我们识别和筛选了近6 000种相关化学结构,并在之后系统汇编了980种农药的信息,还创建了网络图,通过化学相似性,农药类别,及公开的癌症流行病学、癌症生物试验和致癌机制研究相关信息实现了聚类可视化。本方法支持对2015年3月和6月的IARC专刊会议中涉及的草甘膦、马拉硫磷、对硫磷、杀虫畏、二嗪农、二氯二苯基三氯乙烷(DDT)、林丹和2,4-二氯苯氧乙酸(2,4-D)进行高优先度评估。
结论 这种系统性的方法考虑到了化学相似性且能够覆盖多个数据源,因此风险评估者以及研究人员可使用该方法,在待危害识别化学品的选择和优先度排序、风险评估、相关法规或进一步的调查方面进行信息梳理、了解并提高效率。这种方法可以推广到一系列的结局和化学品,包括职业致癌物、药品和食品。