苏州润新生物科技有限公司研究人员发表论文,旨在建立能够预测中药成分肝毒性的定量构效关系(quantitative structure-activity relationship,QSAR)模型。研究指出,用人工合成化合物及中药成分作为训练集,建立了对中药成分的肝毒预测能力较高的推进式决策树模型。
从LTKB数据库和国内文献中收集得到了286个人工合成化合物和62个中药成分,作为建立预测模型的训练集,利用简单决策树、随机森林和推进式决策树3种树形算法进行模型构建。为验证模型的预测能力,选择了22个中药成分(外部测试集)进行肝毒性实验,然后将实验结果与模型预测的结果进行比较。
3种树形算法模型均具有较好的自我预测能力,模型内部交叉验证(leave-one-out和leave-10%-out)结果都在78%~85%之间;但简单决策树和随机森林算法构建的模型对无肝毒化合物预测的准确率显著低于对有肝毒化合物预测的准确率,显示了较大的对有肝毒化合物预测的偏爱性;而利用推进式决策树算法所构建模型的预测偏爱性较小,总体预测能力也较高(准确率82%)。因此选用推进式决策树模型作为最优模型,对外部测试集中22个中药成分的肝毒性进行预测,准确率达到73%,比单用人工合成化合物作为训练集所构建的模型有更高的预测准确率和更小的偏爱性。