关键词:
有机化学品
稀有鮈鲫
机器学习
急性毒性
定量结构活性关系(QSAR)
摘要:
搜集有机化学品对稀有鮈鲫(Gobiocypris rarus)急性毒性数据,并采用部分斑马鱼(Danio rerio)和黑头呆鱼(Pimephales promelas)的急性毒性数据,建立了基于机器学习的有机化学品对稀有鮈鲫急性毒性预测方法.首先使用二分类模型判定有机化学品对稀有鮈鲫是否会产生急性毒性,若判定为有急性毒性,再使用回归模型预测其半致死浓度LC_(50).对不同机器学习模型进行对比,二分类模型中支持向量机最优,训练集和测试集的准确率分别为92.4%和88.6%;回归模型中弹性网络回归法最优,训练集和测试集的调整R^(2)分别为0.87和0.75,留一法交叉验证系数Q_(LOO)^(2)为0.52,外部验证系数Q_(EXT)^(2)为0.71.两种模型具有较好的准确性、稳健性和预测能力.第一电离势和正辛醇水分配系数对分类影响较大,拓扑荷对回归预测结果影响较大.