本文内容整理自:中国科学院生态环境研究中心助理研究员 王东麟老师在第四届“氮素生物地球化学循环”学术论坛的行业析平报告实录
随着大家对生命未知领域的探索,越来越多的需要依靠测序技术对生物的过程、代谢的应用特性进行解析。尤其是基于境宏基因据分现在广泛利用的二代测序技术,也是基于短序列的测序方式,它能够以一种较高性价比的方式,给广大的科研工作者以及实际的生产过程中的工作人员,提供非常有用的信息。
这种测序技术需要我们对生物学过程,超算包括对计算机代码有些理解的基础,其中会包含一些生物信息学领域的专属名词,甚至会要求具备编程基础。这也造成了大家对环境宏基因组的组数分析过程上手难度的增加。宏基因组的行业析平测序量,一般在6~10GB+,往往带来的是对计算成本,尤其是计算时长高的消耗。基于北京超级云计算中心(以下简称北京超算)的应用算力资源和平台,我们搭建了能够对环境宏基因组数据进行分析的软件和平台,在这个平台上能实现群落功能的分析,并且整合了宏基因组分箱技术,以及基于深度学习的病毒组分析。
1Tb的基于境宏基因据分数据大约100个样本,每个样本测序深度在10个G左右。单纯使用服务器进行分析大约需要150天,超算在基于北京超算搭建的宏基因组数据分析平台上进行计算,7-20天之内就可以完成数据分析,大大的节约了时间成本和计算费用成本。
北京超算能够提供非常强的组数硬件支持,满足计算需求的同时提供7X24小时的专属客服支持。近几年来通过与北京超算的行业析平合作达成了一些论文计算的分析过程,并发表了一些文章。
案例1 湿地植物根际锰氧化物强化氨氧化过程
在解析锰氧化过程中,应用利用宏基因组分析平台,发现锰氧化过程和氨氧化过程存在耦合作用。锰氧化的基于境宏基因据分过程中其实缺乏在湿地中的探索,我们在全国各个城市进行湿地样本收集。对根际土和非根际土进行宏基因组测序,超算以及常规的理化指标的测定。
可以看到,组数宏基因组的测序量大约是3.7个TB。19年底到20年上半年,我的整个服务器都在跑这个数据还没有跑完。在开发了基于超算的计算流程和计算软件后,两个月内完成了所有的计算任务。简单分享一下我计算的成果。
我发现在芦苇根际中锰氧化物的丰度含量比较高。锰氧化主要是微生物(介导)的,所以我就好奇这个过程中到底有没有锰氧化基因有一个富集呢。基因的丰度是通过宏基因测序,然后加上计算获得的。我在对它进行不同分类比较的时候发现,根际和非根际锰氧化基因的组成类型其实是不一样的,植物根际可以显著的富集几种类型的锰氧化基因。
除此之外,湿地植物的根际核心微生物和锰氧化的含量,有些微生物是和它呈正相关的,有些是呈负相关的。正负相关的这些微生物中,最明显的功能上的区别在于:正相关的这些微生物中有一部分是能够执行氨氧化过程的。同样的,在人工湿地中我们发现了锰氧化物和铁氧化物都是微生物群落结构关键的驱动因子,同时,锰氧化物的含量和氨氮浓度之间呈非常显著的正相关性。大家都知道氨氧化很大程度上是由微生物(介导)的,尤其是在人工湿地水处理的过程中。在锰的氧化过程中,锰氧化物起到了非常关键的作用。它们二者之间到底有没有比较强的关联性呢?在生物学角度,我们对锰氧化基因和氨氧化基因之间进行了线性的回归分析,分析发现它们两个之间有非常强的线性关系。是不是别的氮转化的过程也和锰氧化的基因有这样的相关性呢?我们把剩下的一些氮转化过程的关键基因与锰氧化基因进行了关联分析,发现除了氨氧化基因,别的氮转化基因并没有和锰氧化基因形成显著的线性相关性。
我们又通过自建amoA的数据库,把执行氨氧化过程的微生物分成氨氧化古菌、氨氧化细菌和完全氨氧化菌。通过比较分析,我们发现人工湿地中常规的水处理环境中,完全氨氧化菌的比重比较高,高于常规的氨氧化细菌,并且锰氧化基因的丰度也与完全氨氧化菌之间呈正相关性。
对环境的解析过程,最主要的目的之一是为了把它更好的应用于污染治理过程中,在河北省晋州市龙门村,我们搭建了一个人工湿地的中试装置。面向当地农村的生活污水,我们在一些人工湿地中人为的向其中加入锰砂,即锰氧化物。我们发现加入的这部分锰氧化物可以提升氨氮的去除负荷,同时amoA的丰度也是得到了非常强的提升。
从自然发展到人为干预污染去除的过程中,由于前期使用超算获得微生物相关的数据,大大节省了分析的时间,有效提升了效率。
案例2 饮用水快速滤池完全氨氧化过程
在另一个水处理的环境中,我们考察了饮用水的快速砂滤池,在这个工程水处理的装置中微生物的一些过程。同样,我们对它进行了采样和测序,数据集大约是1个TB的测序深度。同样在过程中,我们发现氨氮转化比较好,而且和amoA的基因丰度也形成比较线性的关系。通过数据库比对分析发现,其中完全氨氧化菌起到了非常关键和重要的作用。它和锰的转化,锰氧化基因的转化过程,一同协同对整个砂滤池中的污染物形成了降解。
利用基于北京超算开发的宏基因组数据分析平台,能够快速的提取其中的微生物信息,并对病毒数据进行分析,解析水环境中相对完整的相互作用的网络;通过开发基于AI深度学习的算法,能够对噬菌体形成非常好的识别,包括对宿主的预测。
北京超算AI智算云平台可以提供非常丰富的GPU的计算资源,科研工作者无需自建资源即可完成建模任务,帮助没有深度学习经验的同学实现对病毒的解析。
(报告现场)
文章
288
浏览
4319
获赞
2945
“包里有两元,就想分一元帮助别人”
她虽然是名东奔西跑的打工者,平时也不舍得吃和穿,却舍得把钱用在帮助别人身上……她就是芦山县芦阳街道居民杨能芬。2月19日,见到杨能芬时,她正在同朋友商量,如何帮助汉源县九襄镇困境家庭学生小刘读书。通过我国拟修改刑法:调整行贿罪的起刑点和刑罚档次
我国拟修改刑法 加大力度惩治行贿犯罪刑法修正案十二)草案25日提请十四届全国人大常委会第四次会议审议。该修正案草案共修改补充刑法7条,其中草案加大了对行贿犯罪惩治力度,同时增加惩治民营企业内部人员腐败“8小时睡眠论”被质疑,你每天睡多长时间?
暑假期间,许多孩子开始睡懒觉。除此之外,诸多上班族也选择在周末补觉,每天睡到中午甚至是下午。你知道吗?其实我们笃信的“8小时睡眠论”是错误的。专家指出,睡得太多并不能缓解疲惫,甚至会打乱自身的睡眠周期成都大运会第一金!曹茂园夺得武术男子南拳金牌
成都大运会第一金!曹茂园夺得成都大运会武术男子南拳金牌,这也是中国代表团第一金。紧绷安全生产弦 增强排险除患能力
现场授课,讲解消防面罩使用技巧消防应急演练现场本报讯近日,雅安市人民医院四川大学华西医院雅安医院)以下简称:市人民医院)召开2022年安全生产部署会,总结2021年安全生产工作,安排部署2022年安全财富中国500强新风向
7月25日,《财富》杂志官网发布2023年《财富》中国500强排行榜。总体上看,今年500家上榜的中国公司在2022年的总营业收入达到15万亿美元,净利润达到7171亿美元。今年,该榜单首次采取申报制服务期不算教龄,特岗教师难“进城”
2021年6月26日,2021年中央特岗教师招聘考试个旧一中考点,考生走出考场。视觉中国/图)一直待在村小的特岗教师王遥想“进城”。她的三年服务期早已结束,希望通过教师调配考试,考入市区的学校。但当考生态环境部总工刘炳江:空气质量从量变到质变的拐点尚未出现
2023年7月17日,上海迎来蓝天白云“水晶天”,外滩景区天空云卷云舒。 视觉中国图/图)2023年,空气质量有所反弹。开年以来,受扩散条件不利、沙尘天气同比增多和春节期间烟花爆竹燃放影响,我国出现近深化川渝合作 带动一批重大项目落地实施
2022年是成渝地区双城经济圈建设的关键一年。日前,推动成渝地区双城经济圈建设联合办公室印发《关于做好共建成渝地区双城经济圈2022年重大项目实施有关工作的通知》,给出年度项目清单及保障措施。今年,川揭秘:究竟什么原因让腾讯、华为、阿里巴巴等互联网大厂多次选择卓宝?
【建材网】伴随着工业化、城镇化、信息化三化融合,中国的数字化在不知不觉间已立于世界潮头。数字化已成为社会发展的主要驱动力,数字化转型成为全社会的共识。互联网企业逐渐向制造、交通、新能源等领域渗透,&l成都大运会开幕在即,南方周末记者探营主媒体中心
谁打破了猪周期?一场博弈与共谋
河北邯郸鸡泽县,村民在树林里散养的巴马香猪。视觉中国/图)近期,A股上市猪企相继发布2023年上半年业绩预告,亏损情况较为普遍,连“猪茅”牧原股份002714.SZ)也预亏25.5亿-32.5亿元。农压紧压实责任 确保疫情防控各项措施落地落实
本报讯4月4日,清明小长假第二天,市委常委、宣传部部长聂颖带队前往我市主要旅游景区、电影院、书城、医院等地调研疫情防控工作开展情况,他强调,要严格按照疫情防控要求,压实责任,细化管控措施,坚决筑牢外防多地公共充电桩涨价,开新能源汽车也不省钱了?
近日,多地新能源公共充电桩涨价。视觉中国/图)2023年6月以来,郑州、上海、重庆等地的新能源车车主纷纷在社交平台上称,公共充电桩的充电价格较过去有所上涨,有的充电单价甚至接近2元/度,同时晒出支付截【无界之境】中国建博会(上海)开拓美学构想,打破设计境界
【建材网】2022年9月5-8日,中国建博会上海)XDDS当代潮流家居观念展将在上海虹桥•国家会展中心举行。WAZZOR瓦瑟系统门窗将以“无界之境——建筑