蘇州潤新生物科技有限公司研究人員發(fā)表論文,旨在建立能夠預測中藥成分肝毒性的定量構(gòu)效關系(quantitative structure-activity relationship,QSAR)模型。研究指出,用人工合成化合物及中藥成分作為訓練集,建立了對中藥成分的肝毒預測能力較高的推進式?jīng)Q策樹模型。
從LTKB數(shù)據(jù)庫和國內(nèi)文獻中收集得到了286個人工合成化合物和62個中藥成分,作為建立預測模型的訓練集,利用簡單決策樹、隨機森林和推進式?jīng)Q策樹3種樹形算法進行模型構(gòu)建。為驗證模型的預測能力,選擇了22個中藥成分(外部測試集)進行肝毒性實驗,然后將實驗結(jié)果與模型預測的結(jié)果進行比較。
3種樹形算法模型均具有較好的自我預測能力,模型內(nèi)部交叉驗證(leave-one-out和leave-10%-out)結(jié)果都在78%~85%之間;但簡單決策樹和隨機森林算法構(gòu)建的模型對無肝毒化合物預測的準確率顯著低于對有肝毒化合物預測的準確率,顯示了較大的對有肝毒化合物預測的偏愛性;而利用推進式?jīng)Q策樹算法所構(gòu)建模型的預測偏愛性較小,總體預測能力也較高(準確率82%)。因此選用推進式?jīng)Q策樹模型作為最優(yōu)模型,對外部測試集中22個中藥成分的肝毒性進行預測,準確率達到73%,比單用人工合成化合物作為訓練集所構(gòu)建的模型有更高的預測準確率和更小的偏愛性。