中国科学家团队发现大量全新RNA病毒

繁体

财联社10月10日讯,据中山大学微信公众号,10月9日,中山大学医学院施莽教授团队与阿里云李兆融团队在《细胞》杂志(Cell)发表论文报告了180个超群、超过16万种全球RNA病毒的发现,这是迄今为止规模最大的RNA病毒研究,大幅扩展了全球RNA病毒的多样性。

该研究将人工智能技术应用于病毒鉴定,发现了传统方法未能发现的病毒“暗物质”,探索了病毒学研究的新路径。

中国科学家团队发现大量全新RNA病毒

中国科学家团队发现大量全新RNA病毒

文章第一作者侯新(左三)和阿里云团队在中山大学医学院合影

传统病毒发现方法遇瓶颈 人工智能突破“已知”探“未知”

病毒是地球生态系统的重要组成部分,也与人类的健康密切相关。但是,目前已知的病毒种类仍十分有限,用更高效、更精准的方法发现和鉴定新病毒,一直是病毒学研究的基础工作。

最早,人们通过分离培养病毒,在显微镜下观察确认病毒的存在。随着生命组学的发展,科学家们能够利用测序技术,比较未知病毒和已知病毒核酸序列的相似性,识别和鉴定新病毒。这种方法十分依赖对病毒的既有认知。

然而,RNA病毒是一种高度分化、种类繁多且容易变异的病毒,尤其在面对缺乏同源性或同源性极低的“暗物质病毒”时,这种序列同源性比对的方法很容易失灵。

中国科学家团队发现大量全新RNA病毒

使用人工智能对全球病毒圈深度挖掘并分类

人工智能技术的引入使突破“已知”寻找“未知”成为可能。研究中,团队采用的核心算法LucaProt是一种能够深度学习的Transformer模型,在大量学习病毒和非病毒基因组序列后,可以自主形成一套关于病毒的判断标准,从而在大量的RNA测序数据集中挖掘出病毒序列。在测试中,LucaProt表现出极高的准确性和特异性,假阳性率为0.014%,假阴性率为1.72%。在与其他病毒挖掘工具的对比中,它也在处理较长序列的方面展现出优势。

“人工智能的算法模型能够挖掘出我们之前忽略或根本不知道的病毒,这种能力在疾病防控和新病原的快速识别中尤为重要。特别是在疫情暴发时,人工智能的速度和精度可以帮助科学家更快地锁定潜在病原体。”施莽说。

发现大量全新RNA病毒 刷新全球病毒圈认知

利用LucaProt,研究团队对来自全球生物环境样本的10,487份RNA测序数据进行病毒挖掘,发现了超过51万条病毒基因组,代表超过16万个潜在病毒种及180个RNA病毒超群(相当于门或纲的分类级别),使RNA病毒超群数量扩容约9倍。其中23个超群无法通过序列同源方法识别,被称为病毒圈的“暗物质”。

“这些病毒不仅指感染人类的病原体,还包括广泛存在于环境中的、感染各类生物的病毒。各种动物、植物、单细胞原生生物、真菌、细菌和古菌都可能感染病毒。深入了解环境中的病毒,有助于我们更好地理解整个生态系统的运作机制。”论文第一作者侯新博士介绍,“此外,我们还可以利用这种方法发现与人类疾病密切相关的病毒,用于新发传染病的监测和预警。”

依靠数据挖掘出来的新病毒,是否会停留在数字层面?通过对新发现病毒的分析,科学家们对病毒圈的认知也在不断深化。

中国科学家团队发现大量全新RNA病毒

新发现病毒的遗传多样性(黄色部分)

在这项研究中,团队报告了迄今最长的RNA病毒基因组,长度达到47,250个核苷酸;发现了超出以往认知的基因组结构,展现出RNA病毒基因组进化的灵活性;识别到多种病毒功能蛋白,特别是与细菌相关的功能蛋白,进一步表明还有更多类型的RNA噬菌体亟待探索。

研究指出,新发现的病毒分布在地球的各类生态环境中。总体上,落叶层、湿地、淡水和废水环境的病毒多样性最高。然而,在南极底泥、深海热泉、活性污泥和盐碱滩等极端环境中,RNA病毒的多样性和丰度并不低,甚至在深海热泉的高温环境中,仍有RNA病毒在活跃复制。

“这项研究中,病毒的发现运用了人工智能的技术,但分类仍基于现有的体系进行。面对远源的新病毒,现有的分类体系已经显得力不从心。未来,这一体系在门、纲等更深层次的分类上,可能会有大规模的调整。”施莽说,“我们的研究展示了病毒多样性的深度,但广度仍有待更多样本的补充。病毒的多样性远超人类想象,我们目前所看到的仍是冰山一角。”

人工智能技术广泛应用 或助力破解更多科研难题

LucaProt虽然是一个专门为RNA病毒发现设计的模型,但它同时融合了对蛋白质序列和隐含结构信息识别的功能,也可用于蛋白质功能的鉴定。在论文中,研究团队开源了LucaProt模型,并通过在线网站分享给全球科学家。

“这个框架正在逐步成为该领域的前沿工具,也开始被应用到其他类型的蛋白质鉴定和功能发现任务上。”阿里云生物计算总监李兆融表示,人工智能正在逐步改变科学家解决包括病毒学在内的各类科学问题的方式。

中国工程院院士、中国疾控中心传染病溯源预警与智能决策全国重点实验室主任徐建国院士表示,LucaProt的成功标志着人工智能算法在病毒发现方面的重大突破。未来,人工智能方法有望成为微生物学领域的主要工具,并可应用于病毒对人类致病性的预测。

上海生物信息技术研究中心主任、广州国家实验室李亦学研究员认为,LucaProt能够从序列和空间结构两个水平上,融合提取RNA病毒基因组序列的长程相关信息和组成特征,能够先验地识别数据中RNA病毒组成的模式和特征,这是传统的基于同源分析的进化分析方法难以企及的。因此可以看到,人工智能在解决生物学科学问题中具有更广泛的应用潜力。

中国科学家团队发现大量全新RNA病毒

中山大学团队和阿里云团队在中山大学医学院讨论工作

施莽介绍,这项研究与阿里云飞天实验室的AI4S-生物计算团队合作开展,他们专注于生物序列的基础模型研究。中山大学团队负责病毒学方面的问题,而阿里云团队则专注于人工智能模型的开发和计算。“双方经常互相拜访,一起坐下来讨论问题,帮助彼此理解对方不熟悉的领域。”施莽说,“我们希望继续通过跨领域、紧密的科研合作,充分利用云计算和人工智能的优势,解决生命科学领域的重要问题。”

中国科学家团队发现大量全新RNA病毒

中山大学团队访问阿里云

来源:财联社

本文初摘录于:2024-10-11,最后校对或编辑于:2024-10-11

1
0

本页面二维码

© 版权声明:

本站资讯仅用作展示网友查阅,旨在传播网络正能量及优秀中华文化,版权归原作者所有。

如有侵权请 联系我们 予以删除处理。

其他事宜可 在线留言 ,无需注册且留言内容不在前台显示。

了解本站及如何分享收藏内容请至 关于我们。谢谢您的支持和分享。

猜您会读:

  • 日本想联中抗美,中方提出要求并指明方向

    1月16日,中央外办主任王毅在北京会见由日本自民党干事长森山裕、公明党干事长西田实仁率领的日本执政党代表团。而就在三天前的1月13日,据国防部的消息,中国人民解放军东部... 2025-01-19
  • 直播带货“AB”货套路:“原切肥牛卷”疑似“合成肉”?网红李维刚、呼和浩特市农牧局致歉

    近日,有网友称在网红李维刚的直播间买到的“原切肥牛卷”疑似“合成肉”。1月17日,李维刚在抖音上发布视频致歉称,日前,接到部分消费者投诉,称买到的牛肉卷疑似非原切,非... 2025-01-19
  • 国家高值医用耗材联采办主任高雪被调查

    经济观察网 记者 张铃 张英2025年1月18日,经济观察网从多个信源获悉,国家组织高值医用耗材联合采购办公室主任、天津市政协委员、天津市医保局医药采购中心主任高雪被调查... 2025-01-18
  • 李嘉诚,大撤退

    李嘉诚,大撤退

    作者 | 南风窗记者 宝珠、编辑 | 何子维2025年刚开始,李嘉诚就有了新动作。此次事关中药资产。1月1日,李嘉诚旗下的和黄医药(HK.0013)宣布出售其在上海和黄药业45%的... 2025-01-17
  • 向饭圈文化坚决说“不”!王楚钦、张博恒等名将纷纷解散粉丝群

    1月15日,国乒运动员王楚钦球迷会解散粉丝群。近日来,还有多位国羽运动员相继解散其粉丝群。据统计,1月11日开始,包括中国羽毛球队官博,运动员王昶、梁伟铿、何济霆、任翔... 2025-01-17
  • 万科执行总裁祝九胜被抓

    1月15日,万科企业股份有限公司执行董事、总裁、首席执行官祝九胜被公安机关带走。1月16日,数个消息源告诉了经济观察网记者上述信息。记者多次拨打祝九胜的手机电话,未有人... 2025-01-17
  • "日本更邪恶,把中企教坏了"

    ► 文 观察者网 齐倩当地时间1月13日,美国钢铁巨头克利夫兰·克利夫斯公司CEO洛伦科·贡萨尔维斯在宾州举行的新闻发布会上对日本进行了猛烈批评,称美国的这个亲密盟友“... 2025-01-15
  • 新华社三问深圳小学生数学期末考卷

    20片羽毛球场地,有54人打球,问单打双打的场地各有多少;《长城谣》歌词中的“四万万同胞心一样”是近似数还是精确数;海底捞针、瓜熟蒂落、旭日东升、水滴穿石等成语所描述... 2025-01-14
  • “火烧洛杉矶”——惊人的内幕和意想不到的事

    “火烧洛杉矶”——惊人的内幕和意想不到的事

    一场洛杉矶大火,让很多人的美国梦破灭了。有些人做梦也没有料到,这样的事情会落到自己头上,本以为只是个吃瓜看客,没想到被动成了“演员”。洛杉矶的大火让很多人终于意识... 2025-01-14
  • 台湾省媒体:台湾将在北部部署NASAMS防空系统

    据台媒《台北时报》称,台湾将在该岛北部部署从美国购买的NASAMS防空系统。该报援引台湾防务部门的消息写道:“台湾从美国订购的NASAMS将部署在台北和新北的重要战略位置,以... 2025-01-12

名著精选