近日,我院智能计算与农业信息系统学科团队李富义教授课题组在期刊《Computers in Biology and Medicine》(数学与计算生物学小类一区、工程技术大类二区期刊,2022年影响因子为6.698)上发表题为“Digerati—A multipath parallel hybrid deep learning framework for the identification of mycobacterial PE/PPE proteins”的最新研究成果。best365体育官网平台为该论文第一作者单位,李富义教授为通信作者和第一作者,课题组助研郭旭东为论文共同第一作者。
结核分枝杆菌中PE/PPE家族蛋白质被认为与宿主-病原体的相互作用、毒力和疾病致病性有关。为快速准确识别该家族蛋白质,用于后续的功能注释,该论文提出了第一个基于深度学习的PE和PPE家族蛋白质识别算法框架—Digerati,能够准确识别PE_PGRS和PPE蛋白质。该研究采用多路并行混合方法,结合多层卷积神经网络,双向长短期记忆网络和自注意力机制有效地学习PE/PPE蛋白质的高效特征表示,提升了PE/PPE家族蛋白质的识别能力。实验表明,Digerati的预测性能明显优于BLASTP、PHMMER和HHsuite等传统方法。这项研究成果为结核分枝杆菌家族蛋白质识别提供了快速准确的算法模型,揭示了该家族蛋白质的特异性特征。
该研究得到了国家自然科学基金(62202388)、国家重点研发计划(2022YFF1000104)、秦创原引用高层次创新创业人才项目(QCYRCXM-2022-230)和best365体育官网平台人才科研经费等项目的资助。
论文链接:https://www.sciencedirect.com/science/article/pii/S0010482523006200?dgcid=author