衡阳网站建设公司电话专业维护网站的公司
衡阳网站建设公司电话,专业维护网站的公司,wordpress博客卡,口碑营销5t模型在生命科学领域#xff0c;高通量测序技术产生了海量的转录组、蛋白质组、磷酸化蛋白质组等组学数据#xff0c;描绘着细胞内在的分子全景。然而#xff0c;如何从这数以TB计的数据中#xff0c;精准识别出关键的调控因子并理解其背后的生物学机制#xff0c;一直是科学家…在生命科学领域高通量测序技术产生了海量的转录组、蛋白质组、磷酸化蛋白质组等组学数据描绘着细胞内在的分子全景。然而如何从这数以TB计的数据中精准识别出关键的调控因子并理解其背后的生物学机制一直是科学家们面临的巨大挑战。传统的差异表达、富集分析等方法往往止步于统计显著性难以深入揭示其生物学功能。这一困境如今有望被一种融合了前沿人工智能技术的新方法打破。2025年1月8日华中科技大学薛宇教授团队在Nature Biomedical Engineering杂志上发表了题为A deep learning and large language hybrid workflow for omics interpretation的研究论文。该研究开发了一种名为“蓝猫LyMOI”的革命性混合工作流它将深度学习的精准预测能力与大语言模型的常识推理能力相结合首次为大规模组学数据的机制性解读提供了一个高效、智能且具备“生物学家思维”的解决方案。“蓝猫”为组学数据装上“AI大脑”典型的组学数据解读需要科学家们从海量分子中筛选出候选目标分子并基于大量文献阅读梳理它们之间的相互作用关系最终形成一套完整的机制性解释。这是一个耗时耗力的过程。“蓝猫”工作流的创新之处在于它巧妙地将这一过程自动化、智能化。该工作流的核心是一个“双核引擎”大型图模型研究团队整合了涵盖562个真核物种、涉及超过109万个蛋白质的近1.88亿个相互作用数据构建了一个超大规模的知识图谱。随后利用先进的图卷积网络技术对该图谱进行预训练和逐层微调使其能够从复杂的分子网络中学习并预测在特定生物情境下起关键作用的调控因子。大语言模型研究团队通过创新的“提示词工程”引导GPT-3.5生成了数万个高质量的生物学知识对。在此基础上“蓝猫”能够针对大型图模型预测出的关键分子自动生成“机器思维链”像一位博学的生物学家一样推理并阐述这些分子在生物系统中扮演的具体角色和作用机制。以自噬为例验证“蓝猫”的强大效能为了验证“蓝猫”的效能研究团队以细胞自噬——这一与多种疾病相关的关键细胞过程——作为模型系统。他们收集并处理了1.3 TB的、涵盖人类、小鼠、大鼠和酵母四种生物体的自噬相关多组学数据。结果显示与传统差异表达分析平均仅能覆盖4.1%的已知自噬调控基因相比“蓝猫”的预测将这一比例显著提升至30.9%极大地提升了组学数据挖掘的生物学相关性。通过“蓝猫”的指导研究团队成功在酵母中发现Gin4、Elm1、Rvs167和Ste50共4个蛋白激酶是新的潜在自噬调控因子并揭示其调控自噬的分子机制。从虚拟到现实发现抗癌治疗新靶点与新策略更具转化医学价值的是“蓝猫”成功地将目光投向了癌症治疗。它推理出两种人类癌蛋白——CTSL和FAM98A是抗肿瘤药物双硫仑DSF触发保护性自噬所必需的关键因子。后续的细胞实验证实沉默这两个基因能有效减弱DSF介导的自噬并抑制癌细胞的增殖。最令人振奋的发现来自于动物实验将DSF与Z-FY-CHO一种先前用于预防SARS-CoV-2感染的CTSL特异性抑制剂联合使用在体内实验中表现出远超预期的肿瘤生长抑制效果。这为DSF的临床应用以及针对CTSL的癌症联合疗法开辟了全新的道路。综上所述薛宇教授团队开发的“蓝猫”工作流不仅是一个强大的组学数据解读工具更代表了一种AI与人类专家协同探索生命奥秘的新范式。它通过赋予机器“常识”与“推理”能力加速了我们从海量数据到生物学机制再到潜在治疗策略的转化进程有望为未来生物医学研究带来颠覆性的变革。图1. 实验流程。首先通过零样本提示词策略驱动大语言模型解读了四种真核生物的全基因组基因与自噬的潜在关联。随后将大语言模型产生的合成数据集与THANATOS收录的自噬调控因子数据集相结合作为标签数据用于大型图模型的训练。该图模型基于涵盖562种真核生物的109万余个蛋白质及其1.9亿条相互作用或互作同源物构建而成。接着通过对收集的1.3 TB自噬相关多组学数据进行归一化处理和特征编码成功构建了“蓝猫LyMOI”的深度学习预测模块。该模块分别在营养饥饿诱导的酵母自噬模型和双硫仑诱导的哺乳动物自噬模型中完成预测验证。思维链提示词策略驱动大语言模型推理分子调控关系构成了“蓝猫”的推理模块。最后利用“蓝猫”的推理模块系统阐释了不同自噬诱导条件下的分子调控机制。华中科技大学唐大超、张弛、张玮之为该论文的共同第一作者薛宇教授和彭迪副教授为该论文的通讯作者。四川大学贾大教授、复旦大学杨力教授、北京理工大学刘滨教授、澳门大学沈汉明教授、华中科技大学同济医学院陈刚教授、孙朝阳教授、武汉大学崔逸仙教授、华中科技大学张珞颖教授等也为课题提供了大力支持。原文链接https://www.nature.com/articles/s41551-025-01576-5制版人 十一最全1000植物核基因组数据库IMP (点击图片直达)高颜值免费 SCI 在线绘图(点击图片直达)往期精品(点击图片直达文字对应教程)LinuxPythonR绘图NGS基础GEO高级生信自学生信书籍系列教程心得体会转录组经典宏基因组蛋白质组单细胞系列测序发展史免费在线画图色彩搭配图形排版图形解读ChIP-seqTCGAGSEAWGCNA海哥组学傻瓜系列文章写作CytoscapeExcelPPT机器学习公众号投稿联系陈同 chentong_biology163.com