报告人:乔亮
时间:2025年10月15日13:30
地点:闵行校区化学楼135/线上直播

报告题目:深度学习用于蛋白质组和后修饰蛋白质组
报告人简介:乔亮,复旦大学化学系教授、博导。2015年入选国家级人才计划青年项目,2020年获批国家自然科学基金委优秀青年科学基金项目,2025年获批国家自然科学基金委青年科学基金项目(A类)。在Nature Machine Intelligence、PNAS、Nature Communications、Chem、JACS、Angew. Chem. Int. Ed.、Anal. Chem.等SCI期刊上发表论文160余篇。授权发明专利13项。主编著作3部。主持国家重点研发计划等国家和省部级科研项目12项。获中国物理学会质谱分会“2025年度质谱优秀青年人物”、美国华人质谱学会(CASMS)“CASMS Young Investigator Award 2023”、中国物理学会质谱分会2020-2023年度“质谱青年奖”提名奖等。
报告内容简介:
近年来,深度学习被广泛用于质谱数据解析,包括信号和噪音的识别、分子二级谱图的预测、色谱保留时间的预测等,显著促进了质谱数据的解析能力。随着蛋白质组学技术的快速发展,大量质谱数据的积累为深度学习技术在蛋白质组数据分析问题上的应用提供了可能。
我们发展了基于深度学习的数据非依赖采集模式 (DIA) 蛋白质组数据解析的新算法DeepDIA,设计了基于卷积神经网络和循环神经网络的深度神经网络模型来预测肽段的二级质谱图 (MS/MS) 和归一化保留时间 (iRT),还设计了预测肽段在质谱中的可检测性的深度学习模型,从而可以直接由蛋白质序列出发利用计算机模拟构建参考谱图库;最终实现了完全不需要实验,从公共蛋白质组数据库出发的DIA数据直接解析,且鉴定、定量到的蛋白数多于DDA建库所得到的结果。
在无后修饰蛋白的基础上,我们采用一种预训练的Transformer模型 (BERT) 进而实现了磷酸化肽段二级谱图的精准预测并将预测谱图用于磷酸化位点定位评估。我们首先预测了目标肽段和诱饵肽段的二级质谱图,并与实验谱图进行比较计算余弦相似度,对于每一张谱图计算余弦相似度差值,利于目标肽段和诱饵肽段的余弦相似度差值分布进行FLR评估。DeepFLR不仅可以准确预测磷酸化肽段质谱,同时还可以精确估计位点定位错误率。
最近,我们提出了DeepGP,一个基于Transformer和图神经网络 (GNN) 的混合深度学习框架,用于预测糖肽的MS/MS和保留时间。我们通过对DeepGP在合成和生物样本数据集上的综合基准测试,验证了其在区分相似糖型方面的有效性。更进一步的,我们证实了采用DeepGP预测谱图可以在缺乏诊断离子的前提下实现相近糖型的区分。我们还证明了DeepGP结合数据库搜索可以显著提高糖肽的检测灵敏度。
观看方式:拔尖计划2.0全国线上书院直播

