English 中國科學院 聯系我們  
 
站內檢索
 您現在的位置:首頁 > 新聞中心 > 科研動態
蔣華良、鄭明月團隊通過多任務深度神經網絡建立藥物調控激酶譜的預測分析方法
發表日期: 2019-08-27
打印 關閉 浏覽次數:

  蛋白激酶(protein kinases)是细胞功能的关键调节分子,是生物体内最大且功能最多样的基因家族之一。因此,激酶是开发治疗癌症、炎症、糖尿病、心血管疾病和阿尔兹海默症等相关疾病药物的重要靶标。然而,由于激酶家族蛋白质(特别是催化域)结构的高度保守性,给高效选择性激酶抑制剂的开发带来了巨大挑战。

  二十一世紀以來,隨著計算機計算能力的迅猛提升和大數據的湧現,深度學習在機器學習算法的基礎上快速崛起,並在藥物研發領域得到廣泛應用。然而,對許多尚未經過充分深入研究的激酶靶標,目前已有的數據還遠遠達不到訓練中等規模神經網絡所需的量級。因此,傳統的單任務神經網絡模型通常難以取得較好的泛化性能。

  为了解决这一问题,蒋华良、郑明月团队采用了多任务深度神经网络(multitask deep neural network)建立分类模型解决化合物的激酶谱预测问题。多任务深度神经网络通过任务间的迁移学习,可以高效解决具有相关性的多类别分类问题,对于众多激酶靶标,共享的保守催化域使得多重活性预测任务紧密相关。因此,利用多任务深度神经网络可以有效减少特定激酶数据不足对模型泛化性能的限制。此外,多任务神经网络只需建立一个模型即可对整体激酶谱进行预测,无需多次建模,并且通过使用共享表示减少了模型参数的规模,可以使模型的训练学习过程更加高效。

  上述研究結果近期在線發表于Journal of Medicinal Chemistry,题为“Deep Learning Enhancing Kinome-Wide Polypharmacology Profiling: Model Construction and Experiment Validation” ,并被选为封面论文。中國科學院上海药物研究所药物设计与发现中心(DDDC)郑明月为论文通讯作者,第一作者是中國科學院上海药物研究所药物发现与设计中心博士研究生李叙潼。

  全文鏈接:https://doi.org/10.1021/acs.jmedchem.9b00855

Journal of Medicinal Chemistry文章标题

基于多任務神經網絡的藥物激酶譜預測流程

多任務神經網絡與隨機森林預測表現對比

(左)对五个化合物预测与实验得到的激酶图谱,标记为红色的激酶表示预测或实验测定为活性。(右)预测与实验得到的激酶家族选择性,当一个家族的odds ratio显著大于1(红色),认为化合物对该激酶家族具有选择性。

 

 

 

评 论
  版权所有 中國科學院上海药物研究所 滬ICP備05005386號-1
地址: 上海市浦东张江祖冲之路555号 邮编:201203 电话: 86-21-50806600

沪公网安备 31011502008305号