3全基因组测序及生物信息分析

文章正文
发布时间:2024-10-29 20:25

解淀粉芽孢杆菌(Bacillus amyloliquefaciens)是一种与枯草芽孢杆菌(B. subtilis)亲缘性很近的细菌,家电清洗13825404095其菌体生长快、易培养、抗逆性强,能够产生脂肽类、肽类、细菌素和抗菌蛋白等多种抗菌物质[],这些抗菌物质种类繁多、稳定性高、抑菌谱广、抑菌活性强、不易产生抗药性,对人体和动植物的细胞安全且不会造成环境污染,是近年来植物病害生物防治、动物饲料加工、生鲜农产品防腐保鲜、医药研发、污水治理等领域研究的热点[-]。

近年来,有研究者采用液相色谱-质谱法分析了解淀粉芽孢杆菌纯化后的发酵产物,发现含有表面活性素(Surfactin)同系物和小分子量的抑菌肽成分[]。对胡椒瘟病生防菌B. subtilis VD18R19全基因组测序及比较基因组学分析发现,该菌含有6个抑菌次级代谢产物合成基因簇,编码表面活性素、大侧柏素、儿茶酚型嗜铁素、杆菌溶素、聚酮化合物、羊毛硫类细菌素等抑菌物质[]。Arrebola等从B. amyloliquefaciens发酵产物中分离出具有抑制病原真菌作用的IturinA脂肽[]。Wong等报道从解淀粉芽孢杆菌发酵产物中分离出可抑制肝癌、结肠癌细胞生长的蛋白质[]。An等从解淀粉芽孢杆菌的发酵产物中分离得到对食物腐败菌有抑制作用的细菌素[]。从解淀粉芽孢杆菌中获得次级代谢产物合成基因簇和抑菌活性成分的研究备受学者青睐。

我们项目组在健康的橡胶树树根中筛选到一株内生解淀粉芽孢杆菌(BS-3),该菌对橡胶树褐根病菌(Phellinus noxius)、尖孢炭疽病菌(Colletotrichum acutatum)、小孢拟盘多毛孢(Pestalotiopsis microspora)、橡胶疫霉(Phytophthora heveae)多种病原真菌具有很好的抑菌效果。传统的试验分析和鉴定方法很难全面地分析生防菌中的抗性物质且耗时耗力,难以充分挖掘其全部抗菌基因和揭示生防作用机理[]。为了深入研究BS-3菌株防病功能的内在原因,本研究采用第二代BGISEQ平台与第三代PacBio平台相结合的测序技术对解淀粉芽孢杆菌BS-3全基因组测序,在获得BS-3菌株全基因组序列的基础上,借助GO、KEGG、COG、NR和Swiss-Prot数据库注释BS-3菌株基因功能、预测菌株BS-3的次级代谢产物基因簇和比较基因组学分析,以期对挖掘次级代谢产物基因资源、高效开发利用BS-3和对其抑菌机理的研究提供生物信息学基础。

1 材料与方法 1.1 材料 1.1.1 菌株

菌株解淀粉芽孢杆菌BS-3分离自云南省景洪市橡胶树根,对多种病原菌有抑制作用,保存于云南省热带作物科学研究所植物保护与微生物利用研究中心。

植物病原真菌:橡胶树褐根病菌(Phellinus noxius)、尖孢炭疽病菌(Colletotrichum acutatum)、小孢拟盘多毛孢(Pestalotiopsis microspora)、橡胶疫霉(Phytophthora heveae)均保存于云南省热带作物科学研究所植物保护与微生物利用研究中心。

1.1.2 主要试剂和仪器

细菌基因组DNA提取试剂盒,布鲁克(北京)科技有限公司;DL2000 DNA Marker,北京天根生化科技有限公司。PCR仪,Applied Biosystems公司;电泳仪,北京六一生物科技有限公司;NanoDrop 2000,赛默飞世尔科技公司。

1.1.3 培养基

LB培养基(g/L):蛋白胨10.0,酵母提取物5.0,NaCl 10.0;PDA培养基(g/L):马铃薯200.0、葡萄糖20.0。固体培养基均添加琼脂粉15 g/L。1×105 Pa灭菌30 min。

1.2 方法 1.2.1 植物病原真菌拮抗试验

采用平板对峙法,在PDA平板中间分别放置橡胶树褐根病菌、尖孢炭疽病菌、小孢拟盘多毛孢、橡胶疫霉4种植物病原菌的菌块,菌块四周划线接种BS-3,以只接种病原菌的处理为对照,重复3次,28 ℃恒温箱中培养5 d,测量抑菌圈直径(对照组菌落生长直径−处理组菌落生长直径),观察抑菌情况并拍照。

1.2.2 菌株总DNA提取

菌株BS-3接种于LB培养基中,在37 ℃、180 r/min条件下培养12 h,将培养液10 000×g离心5 min收集菌体,采用细菌基因组DNA提取试剂盒提取基因组,操作步骤参照试剂盒说明书。使用1%的琼脂糖凝胶电泳和NanoDrop 2000检测DNA样品的浓度、纯净度和降解程度。

1.2.3 全基因测序

本次测序委托深圳华大基因股份有限公司完成。样本质检合格后,使用Covaris仪超声波打断DNA样品,进行文库构建。采用第二代BGISEQ平台与第三代PacBio平台相结合的测序技术进行测序。

1.2.4 基因组组分分析

使用pb-falcon v2.2.3软件对三代Reads进行组装,并对二代数据组装结果进行2次Polish (pilon v1.23软件)。编码基因预测使用GeneMarkS软件(V4.17) ()[];重复序列的预测使用RepeatMasker (Version open-4.0.5)软件和TRF (Tandem Repeats Finder,V4.07b)[-];tRNA预测通过tRNAscan-SE软件(V1.3.1)[],rRNA预测采用RNAmmer软件(V1.2)[],sRNA确定采用cmsearch程序(V1.1rc4)[-]。基因岛预测采用IslandPath-DIOMB软件(V0.2)[],前噬菌体预测通过PhiSpy软件[](V2.3),CRISPR预测利用CRISPRdigger[](V1.0)。

1.2.5 基因功能分析

(1) 基因功能注释

使用BLAST软件与Gene Ontology (GO)[]、Kyoto Encyclopedia of Genes and Genomes (KEGG)[-]、Cluster of Orthologous Groups of Proteins (COG)[]、Non-Redundant Protein Database (NR)[]、Carbohydrate-Active EnZymes Database (CAZy)[]、Type Ⅲ Secretion System Effector Protein (T3SS)[]、Virulence Factor Database (VFDB)[]、Pathogen Host Interactions (PHI)[]、Swiss-Prot[]数据库进行比对,获得功能注释信息。

(2) BS-3的进化和比较基因组学分析

根据全基因组注释信息,选择gyrA基因序列及NCBI数据库比对分析结果,利用MEGA 7.0软件的Neighbor-Joining法构建系统发育树;同时将菌株BS-3的基因组序列与参考菌B. amyloliquefaciens subsp. FZB42 (CP000560)的基因组序列基于Mummer进行比对分析。

(3) 拮抗物质分析

利用antiSMASH 3.0 (https://fungismash.secondarymetabolites.org)对菌株BS-3中次级代谢产物合成基因簇进行预测[]。结合基因注释结果和NCBI BLAST比对分析结果,分析菌株BS-3次级代谢产物中的抑菌物质及编码基因簇。

2 结果与分析 2.1 病原真菌拮抗试验

拮抗试验发现,BS-3对尖孢炭疽病菌(Colletotrichum acutatum)、橡胶树褐根病菌(Phellinus noxius)、小孢拟盘多毛孢(Pestalotiopsis microspora)、橡胶疫霉(Phytophthora heveae)的生长均具有良好抑制效果,如所示,抑菌圈直径分别为62.96、41.36、51.49、51.49 mm。

 
图 1 菌株BS-3对病原菌的拮抗作用 Figure 1 The antagonism of strain BS-3 against pathogens 注:A:尖孢炭疽病菌;B:褐根病菌;C:小孢拟盘多毛孢;D:橡胶疫霉;a:菌株BS-3对尖孢炭疽病菌的拮抗作用;b:菌株BS-3对褐根病菌的拮抗作用;c:菌株BS-3对小孢拟盘多毛孢的拮抗作用;d:菌株BS-3对橡胶疫霉的拮抗作用 Note: A: Colletotrichum acutatum; B: Phellinus noxius; C: Pestalotiopsis microspora; D: Phytophthora heveae; a: The antagonism of strain BS-3 against Colletotrichum acutatum; b: The antagonism of strain BS-3 against Phellinus noxius; c: The antagonism of strain BS-3 against Pestalotiopsis microspora; d: The antagonism of strain BS-3 against Phytophthora heveae  

 

2.2 菌株BS-3全基因组概况

采用第二代BGISEQ平台与第三代PacBio平台相结合的测序技术,对细菌BS-3的全基因组进行测序。菌株BS-3全基因组大小为3 870 130 bp,平均GC含量为46.88%,共编码基因4 161个;所有编码基因的总长度为3 463 893 bp,编码基因的平均长度为832 bp,含有串联重复(Tandem Repeat,TR)序列122个,总长为10 580 bp,大小为6−282 bp,其中小卫星(Minisatellite) DNA 98个,总长为7 148 bp,大小为10−60 bp,微卫星(Microsatellite) DNA 2个,总长为78 bp。含有tRNA基因92个,5S rRNA 10个,16S rRNA和23S rRNA各9个,sRNA 10个。BS-3基因组测序数据提交至GenBank,登录号为CP060384,BS-3基因组图见。将BS-3的全基因组信息与其他已测序的近缘芽孢杆菌比较分析[],如所示,BS-3与FZB42的大小较为接近,而GC含量的比例也较为接近,但BS-3的Protein-Coding Sequences基因数却比FZB42多468个。

 
图 2 B. amyloliquefaciens BS-3基因组图 Figure 2 Genomic map of the B. amyloliquefaciens BS-3 注:由外至内,第1圈表示编码基因的分布;第2圈表示COG注释基因分布;第3圈表示KEGG注释基因分布;第4圈表示GO的注释基因分布;第5圈表示ncRNA分布 Note: From the outer to inner circle, the first circle is the distribution of the coding genes; The second is the COG annotated genes; The third is the KEGG annotated ggenes; The fourth is the GO annotated genes; The fifth circle is the distribution of ncRNA  

 


表 1 解淀粉芽孢杆菌BS-3全基因组特征及其与其他近缘芽孢杆菌比较 Table 1 Genomic features of the B. amyloliquefaciens BS-3 genome and comparison with other Bacillus relatives

Items   B. amyloliquefaciens FZB42   B. amyloliquefaciens B9601-Y2   B. amyloliquefaciens BS-3   B. subtilis 168  
Genome size (bp)   3 918 589   4 238 624   3 870 130   4 214 630  
GC content (%)   46.4   45.8   46.9   43.5  
Protein-coding sequences   3 693   4 159   4 161   4 106  
Average CDS size (bp)   933   890   832   895  
Number of tRNAs   89   91   92   86  

2.3 基因组的功能注释

采用GO、KEGG、COG、NR、CAZy、T3SS、VFDB、PHI、ARDB和Swiss-Prot数据库将预测基因的蛋白序列与各功能数据库进行Diamond比对(e value≤1e-5),选取Score最高的比对结果(默认Identity≥40%,Coverage≥40%)进行注释。最终注释统计数据见,发现菌株BS-3基因组共有4 161个基因得到成功比对注释。其中,在NR、Swiss-Prot、COG、GO数据库中得到功能注释的基因较多,分别为4 040、3 328、2 875、2 620个,占基因总数的97.09%、79.98%、69.09%、62.97%;而在CARD数据库中得到注释的基因最少,仅有22个,占基因总数的0.53%。

表 2 菌株BS-3基因功能注释数据库分布情况 Table 2 Database distribution of gene functional annotation from the strain BS-3

Type   Gene number  
NR   4 040  
Swiss-Prot   3 328  
KEGG   1 885  
COG   2 875  
TCDB   459  
GO   2 620  
PHI   157  
VFDB   62  
ARDB   30  
CARD   22  
Secretory   80  
T3SS   80  
CAZY   137  

2.3.1 GO注释结果

将菌株BS-3氨基酸序列与GO数据库进行比对和统计分析,得到菌株功能基因的分布情况。共有2 620个基因在GO数据库中被注释到,GO数据库按照细胞组分(Cellular Component)、生物学过程(Biological Process)、分子功能(Molecular Function) 3个方面对蛋白进行注释(),而生物学过程、细胞组分和分子功能分支各25、11和10个,共计46个分支。在细胞组分中,共2 450个基因得到注释,其中与细胞部分(Cell Part)、细胞(Cell)、细胞器(Organelle)有关的基因表现出最高相关性,各有914、914、198个;生物学途径类共5 967个基因被注释,涉及最多的基因与细胞内过程(Cellular Process)、代谢过程(Metabolic Process)有关,各有1 464、1 466个;分子功能分支共3 271个注释结果,其中涉及最多的基因与结合(Binding)、催化活性(Catalytic Activity)、转运活性(Transporter Activity)有关,分别为1 186、1 408、236个。

表 3 菌株BS-3基因组GO功能分类 Table 3 Gene ontology classification of the genome of strain BS-3

Ontology   Class   Gene number  
Biological process   Biological adhesion   16  
Biological regulation   516  
Cell proliferation   2  
Cellular component organization or biogenesis   143  
Cellular process   1 464  
Death   4  
Developmental process   68  
Establishment of localization   525  
Growth   4  
Immune system process   7  
Localization   553  
Locomotion   42  
Metabolic process   1 466  
Multi-organism process   49  
Multicellular organismal process   23  
Negative regulation of biological process   26  
Nitrogen utilization   1  
Positive regulation of biological process   15  
Regulation of biological process   488  
Reproduction   57  
Reproductive process   38  
Response to stimulus   275  
Rhythmic process   1  
Signaling   150  
Viral reproduction   34  
Cellular component   Cell   914  
Cell junction   1  
Cell part   914  
Extracellular region   23  
Extracellular region part   23  
Macromolecular complex   179  
Membrane-enclosed lumen   35  
Organelle   198  
Organelle part   95  
Virion   34  
Virion part   34  
Molecular function   Antioxidant activity   11  
Binding   1 186  
Catalytic activity   1 408  
Electron carrier activity   1  
Enzyme regulator activity   13  
Molecular transducer activity   90  
Nucleic acid binding transcription factor activity   203  
Protein binding transcription factor activity   62  
Structural molecule activity   61  
Transporter activity   236  

2.3.2 COG注释结果

对菌株BS-3基因组中具有生物学功能的蛋白编码基因进行COG注释,结果发现共有2 875个蛋白编码基因被注释到。如所示,基因功能注释结果共分为25类,分别有1、1、167、58、306、89、248、184、131、221、283、123、202、63、117、173、95、301、210、171、31、87、2、31、2个基因注释分类到A−Z,其中氨基酸代谢及转运(Amino Acid Transport and Metabolism)的注释结果最为丰富,共306个,占注释基因总数的10.64%;其次为常规功能预测(General Function Prediction Only)基因,共301个基因,占注释基因总数的10.47%,而转录(283个基因,9.84%)、碳水化合物转运和代谢(248个基因,9.88%)、翻译、核糖体结构和生物合成(221个基因,7.69%)的基因也得到较多的注释,此外还有210个(7.3%)功能未知的基因,有待今后进一步研究。

 
图 3 菌株BS-3基因组COG数据库比对分析结果 Figure 3 COG functional classification of the strain BS-3  

 

2.3.3 KEGG注释结果

将菌株BS-3与KEGG数据库进行比对分析,对应到KEGG Pathway的1 855个基因富集在194条代谢通路中,占菌株基因总数的44.85%;基因数大于等于20的代谢通路有24个()。KEGG富集分析显示,ABC转运蛋白(ABC Transporters)、双组分调节系统(Two-Component System)、细菌的群体行为调控机制(Quorum Sensing)是最主要的3种代谢通路,分别有120、107和70个基因注释结果;此外,嘌呤代谢(Purine Metabolism)、核糖体(Ribosome)、嘧啶代谢(Pyrimidine Metabolism)、丙酮酸代谢(Pyruvate Metabolism)、氧化磷酸化(Oxidative Phosphorylation)通路与菌株基因组相比具有较高的相关度。

表 4 菌株BS-3基因组KEGG数据库主要代谢通路分析 Table 4 Main metabolic pathways of the strain BS-3 from KEGG database

Map number   Map name   Gene number (≥20)  
Map02010   ABC transporters   120  
Map02020   Two-component system   107  
Map02024   Quorum sensing   70  
Map00230   Purine metabolism   59  
Map03010   Ribosome   53  
Map00240   Pyrimidine metabolism   44  
Map00620   Pyruvate metabolism   33  
Map02040   Flagellar assembly   33  
Map00190   Oxidative phosphorylation   31  
Map00250   Alanine, aspartate and glutamate metabolism   30  
Map00500   Starch and sucrose metabolism   30  
Map00270   Cysteine and methionine metabolism   29  
Map00520   Amino sugar and nucleotide sugar metabolism   29  
Map00550   Peptidoglycan biosynthesis   28  
Map00970   Aminoacyl-tRNA biosynthesis   27  
Map00010   Glycolysis / Gluconeogenesis   23  
Map00260   Glycine, serine and threonine metabolism   23  
Map02030   Bacterial chemotaxis   22  
Map02060   Phosphotransferase system (PTS)   22  
Map00630   Glyoxylate and dicarboxylate metabolism   21  
Map00640   Propanoate metabolism   21  
Map00564   Glycerophospholipid metabolism   20  
Map00730   Thiamine metabolism   20  
Map00860   Porphyrin and chlorophyll metabolism   20  

2.3.4 CAZy功能分析

将基因组序列与CAZy数据库进行比对,发现菌株BS-3的基因组中共有140个基因编码的蛋白质结构域属于CAZy家族,包括20类糖苷水解酶(Glycoside Hydrolases,GHs)家族的蛋白49个、9类糖苷转移酶家族的蛋白(Glycosyl Transferases,GTs) 36个、6类碳水化合物酯酶(Carbohydrate Esterases,CEs) 17个、2类多糖裂解酶(Polysaccharide Lyases,PLs) 3个、辅助酶4个、3类碳水化合物结合组件(Carbohydrate-Binding Modules,CBMs) 31个。土壤中存在植物病残体,这些病残体物质的主要组分是糖类和蛋白质类,而菌株BS-3中含有编码内切葡聚糖酶(endo-1,4-β-D-glucanase,EC3.2.1.4)、β-葡萄糖苷酶(β-glucosidase,EC3.2.1.21)、α-淀粉酶(amyE,EC3.2.1.1)等酶的基因,从基因角度分析进一步了解菌株BS-3的生防作用机理。

2.3.5 NR数据库和Swiss-Prot数据库的注释

将菌株BS-3的基因序列翻译为相应的氨基酸序列,并与NR数据库进行比对,基因组中有4 040个基因在NR数据库上得到注释,得到B. amyloliquefaciens、B. subtilis、B. velezensis、B. nakamurai、B. paralicheniformis、Streptococcus pneumoniae和Paenibacillus sp.这7类物种,数量分别为3 237、1 599、342、36、1、70和3个。Swiss-Prot是一个精选的蛋白质序列数据库,包括蛋白质功能、结构、翻译后修饰、变异等描述,菌株BS-3中有3 328个基因的蛋白序列功能在该数据库中得到有意义的注释。

2.3.6 毒力因子分析

将菌株BS-3的基因组与VFDB数据库进行比对分析,在菌株BS-3的基因组发现62个毒力因子基因,其中最大基因为1 168 bp,最小基因为56 bp,具体结果如所示。这说明菌株BS-3有可能释放毒力因子来抑制病原菌的生长。

表 5 菌株BS-3基因组VFDB数据库注释结果 Table 5 The annotation results of the strain BS-3 from VFDB database

Gene_id   Align length (bp)   Gene_id   Align length (bp)   Gene_id   Align length (bp)  
BS3_GM000167   331   BS3_GM001595   303   BS3_GM002704   388  
BS3_GM000364   156   BS3_GM001721   730   BS3_GM002705   148  
BS3_GM000444   305   BS3_GM001965   233   BS3_GM002706   389  
BS3_GM000527   688   BS3_GM002234   65   BS3_GM002746   251  
BS3_GM000632   493   BS3_GM002235   1 154   BS3_GM002747   215  
BS3_GM000664   147   BS3_GM002236   293   BS3_GM002785   569  
BS3_GM000708   149   BS3_GM002237   529   BS3_GM002786   116  
BS3_GM000730   571   BS3_GM002239   253   BS3_GM002787   105  
BS3_GM000788   70   BS3_GM002390   253   BS3_GM002852   221  
BS3_GM000792   420   BS3_GM002427   250   BS3_GM002854   490  
BS3_GM000797   199   BS3_GM002509   384   BS3_GM002855   1 168  
BS3_GM000804   217   BS3_GM002543   200   BS3_GM002919   396  
BS3_GM000805   78   BS3_GM002552   553   BS3_GM003021   336  
BS3_GM000807   346   BS3_GM002553   170   BS3_GM003162   330  
BS3_GM000808   652   BS3_GM002575   190   BS3_GM003166   221  
BS3_GM001060   301   BS3_GM002599   220   BS3_GM003174   231  
BS3_GM001153   197   BS3_GM002649   252   BS3_GM003336   805  
BS3_GM001300   119   BS3_GM002651   56   BS3_GM003832   548  
BS3_GM001301   265   BS3_GM002675   184   BS3_GM004007   257  
BS3_GM001552   274   BS3_GM002680   357   BS3_GM004103   284  
BS3_GM001578   192   BS3_GM002681   284  

2.3.7 耐药基因分析

通过ARDB数据库注释,找到菌株BS-3的基因组有耐药基因30个,耐受药物林可霉素(Lincomycin)、氯霉素(Chloramphenicol)、磷霉素(Fosfomycin)、青霉素(Penicillin)、抗菌物(na_Antimicrobials)、喹嗪(qa_Compound)、氨基糖苷(Aminoglycoside)、万古霉素(Vancomycin)、甲氧苄啶(Trimethoprim)、四环素(Tetracycline)、杆菌肽(Bacitracin)、脱氧胆酸盐(Deoxycholate)、大环内酯(Macrolide)、链霉素(Streptomycin)、膦胺霉素(Fosmidomycin)共15种,具体结果如所示。

表 6 菌株BS-3基因组ARDB数据库注释结果 Table 6 The annotation results of the strain BS-3 from ARDB database

Gene_id   Resistance type   Antibiotic resistance  
BS3_GM000038   lmrb   Lincomycin  
BS3_GM000196   blt   Chloramphenicol, doxorubicin, fluoroquinolone, puromycin  
BS3_GM000246   fosb   Fosfomycin  
BS3_GM000318   bl2a_1   Penicillin  
BS3_GM000350   bl2a_iii   Penicillin  
BS3_GM000461   ykkc   na_antimicrobials  
BS3_GM000462   ykkd   na_antimicrobials  
BS3_GM000899   qac   qa_compound  
BS3_GM000900   emre   Aminoglycoside  
BS3_GM001037   vanrc   Vancomycin  
BS3_GM001235   dfra20   Trimethoprim  
BS3_GM001373   vanrg   Vancomycin  
BS3_GM001660   tetl   Tetracycline  
BS3_GM001965   vanrg   Vancomycin  
BS3_GM002153   baca   Bacitracin  
BS3_GM002189   mdtg   Deoxycholate, fosfomycin  
BS3_GM002337   blt   Chloramphenicol, doxorubicin, fluoroquinolone, puromycin  
BS3_GM002486   bcra   Bacitracin  
BS3_GM002599   vanrg   Vancomycin  
BS3_GM002884   bcra   Bacitracin  
BS3_GM003174   vanra   Vancomycin, teicoplanin  
BS3_GM003488   mphb   Macrolide  
BS3_GM003507   lmrb   Lincomycin  
BS3_GM003543   mdr    
BS3_GM003613   vanrg   Vancomycin  
BS3_GM003625   lmrb   Lincomycin  
BS3_GM003690   qac   qa_compound  
BS3_GM003809   ykkc   na_antimicrobials  
BS3_GM003986   ant6ia   Streptomycin  
BS3_GM004012   rosa   Fosmidomycin  
注:−:无
Note: −: None
 

2.4 菌株BS-3的进化和比较基因组学分析

因芽孢杆菌属内的种间亲缘关系较近,不能采用16S rRNA基因来分析芽孢杆菌属物种间的进化关系。近年来报道可以用gyrA基因区分枯草芽孢杆菌种间的差异,将菌株BS-3与9株Bacillus sp.来源的GyrA蛋白序列构建进化树,发现菌株BS-3与FZB42、UCMB5113、Y2来源的GyrA蛋白聚在一起(),说明其亲缘关系非常相近,同属于解淀粉芽孢杆菌。

 
图 4 基于BS-3及近缘种GyrA蛋白氨基酸序列构建进化树 Figure 4 Phylogenetic tree reconstructed based on GyrA protein sequence to analyse the relationship between BS-3 and its related bacterial species 注:括号中的序号为相关菌株GenBank的登录号;分支点上的数字表示Bootstrap支持率;标尺表示1%的序列进化差异 Note: The numbers in parentheses represent the sequence accession numbers in GenBank; The numbers in each branch points denote the percentages supported by bootstrap; The scale presents 1% sequence variance  

 

将BS-3与B. amyloliquefaciens subsp. plantarum str. FZB42的全基因组进行共线性分析,观察两者基因组之间序列的插入、缺失等信息()。从中可以看出,2株基因组高度相似,但也存在翻转、易位等基因组重排。

 
图 5 B. amyloliquefaciens BS-3与FZB42的共线性分析 Figure 5 Synteny analysis of B. amyloliquefaciens BS-3 and FZB42  

 

2.5 拮抗物质 2.5.1 次级代谢产物合成基因簇分析

次级代谢产物是微生物在一定的生长时期,以初级代谢产物为前体合成的一系列大分子生长非必需物质,用anti-SMASH对菌株BS-3基因组进行次级代谢产物分析,预测得到10个次级代谢产物基因簇(),并从中发现4类具有抗菌活性的物质:多烯类(Bacillaene)、丰原素(Fengycin)、儿茶酚型嗜铁素(Bacillibactin)和表面活性肽(Surfactin)。其中,Cluster 3与BGC0001089 c1来源的Bacillaene合成基因簇相似性为100%;Cluster 4与BGC0001095 c1来源的Fengycin合成基因簇相似性为93%;Cluster 7与BGC0000309 c1来源的Bacillibactin合成基因簇相似性为100%;Cluster 10与BGC0000433 c1来源的Surfactin合成基因簇相似性为86%;Cluster 8与BGC0001184 c1来源的杆菌溶素(Bacilysin)合成基因簇相似性为100%。比对发现菌株BS-3基因组中还存在4种功能未知的基因簇(Cluster 2、5、6、10),其中Lantipeptide 1种、T3PKS (Type Ⅲ PKS)类1种、萜类(Terpene) 2种,这表明菌株BS-3中可能存在合成新抑菌物质的基因簇,具有较大的农业和药业应用潜力。

表 7 菌株BS-3次级代谢产物合成基因簇 Table 7 Gene clusters of secondary metabolite of B. amyloliquefaciens BS-3

Cluster ID   Nucleotide length (bp)   Gene number   Cluster type   Ratio of genes show similarity (%)   Most similar known cluster  
Cluster1   41 245   48   Otherks   BGC0000693 c1(7%)   Butirosin  
Cluster2   20 744   27   Terpene      
Cluster3   102 705   52   Transatpks-NRPS   BGC0001089 c1(100%)   Bacillaene  
Cluster4   110 379   76   Transatpks-NRPS   BGC0001095 c1(93%)   Fengycin  
Cluster5   21 884   24   Terpene      
Cluster6   41 107   55   T3PKS      
Cluster7   66 776   70   Bacteriocin-NRPS   BGC0000309 c1(100%)   Bacillibactin  
Cluster8   41 419   47   Other   BGC0001184 c1(100%)   Bacilysin  
Cluster9   65 411   49   NRPS   BGC0000433 c1(86%)   Surfactin  
Cluster10   22 598   20   Lantipeptide      
注:−:无
Note: −: none
 

从2.4中选择3株参与gryA分析的芽孢杆菌近缘种,对基因组中已知功能的基因簇进行统计,统计结果如所示,除丁酰苷菌素(Butirosin)外,其他近缘菌种基因组中均有BS-3中含有的化合物,而Butirosin与菌株BGC0000693 c1来源的基因簇相似性仅为7%,说明该基因簇可能合成新的抑菌物质,有待今后进一步研究。

表 8 次级代谢产物基因簇对比表 Table 8 The comparison of secondary metabolite gene clusters

Compound   Enzyme   Y2   BS-3   FZB42   B. subtilis 168  
Surfactin   NRPS   1   1   1   1  
BacillomycinD   NRPS/PKS   1     1    
Fengycin   NRPS   1   1   1   1  
Putative peptide   NRPS       1    
Bacillibactin   NRPS   1   1   1   1  
Bacilysin/anticapsin   NRPS   1   1   1   1  
Macrolactin   PKS   1     1    
Bacillaene   NRPS/PKS   1   1   1   1  
Difficidin   PKS   1     1    
Amylocyclicin   RPS   1     1    
Mersacidin   RPS   1     1    
Butirosin   Otherks     1      
注:−:无
Note: −: none
 

2.5.2 其他抑菌物质

据报道芽孢杆菌中的碱性丝氨酸蛋白(Alkaline Serine Protease)能够有效地杀死线虫,同时解淀粉芽孢杆菌FZB42和解淀粉芽孢杆菌Y2具有减少植物根部的根结线虫的能力,基因分析菌株BS-3中的碱性丝氨酸蛋白酶(BS3_GM000172)与解淀粉芽孢杆菌FZB42在氨基酸水平上相似性很高,这说明菌株BS-3可能有具有减少根部线虫的能力。

3 讨论

随着农业的快速发展,农药用量不断增加,使用化学农药所带来的高残留、高污染及对人畜的危害等问题逐渐突显。兼具安全、绿色、高效特性的绿色防控技术成为当下研究热点,其中应用生物拮抗菌来防治各种病害被证实为一种安全有效的新方法。芽孢杆菌在生物防治领域对农作物病害有很好的防治效果,同时其在促进植物生长[]、降解除草剂、治理水污染等方面也具有较好的作用,因而备受科研工作者关注[]。

本团队从橡胶根部分离到了一株内生细菌BS-3,经过拮抗试验发现菌株BS-3对橡胶树褐根病菌、尖孢炭疽病菌、小孢拟盘多毛孢、橡胶疫霉病菌的生长均具有良好的抑制效果。传统的实验和鉴定方法很难全面地分析芽孢杆菌抗菌物质,也不能充分挖掘其全部抗菌基因。为了深入研究该菌,本研究利用全基因组测序和生物信息学分析技术得到了菌株BS-3的基因组序列,确定菌株基因组大小为3 870 130 bp,共编码基因4 161个,同时将基因组数据与GO、COG、KEGG、NR等数据库进行比对分析,完成菌株BS-3基因组功能注释及数据统计工作,并采用gryA基因确定了BS-3的分类地位,并从分子生物学的角度探究其抑菌作用中可能发挥作用的基因簇。

16S rRNA基因序列是种属鉴定和细菌系统发育的分类工具,但解淀粉芽孢杆菌和枯草芽孢杆菌亲缘关系很近,是形态特征相似的芽孢杆菌属,采用16S rRNA基因序列无法准确区分[]。在基因组测序之后,解旋酶A亚基编码基因以及组氨酸激酶基因分子标记基因可以进一步确定两者的分类[]。对菌株BS-3的全基因组信息进行分析,并与其他已测序的近缘解淀粉芽孢杆菌比较,发现菌株BS-3基因组大小与其他已测序的近缘解淀粉芽孢杆菌较为接近,GC含量也较为相似;菌株BS-3解旋酶A亚基编码基因的蛋白序列与相似物种构建进化树,发现其与解淀粉芽孢杆菌FZB42和解淀粉芽孢杆菌Y2亲缘关系非常相近,同属于解淀粉芽孢杆菌。

大多数病原真菌细胞壁的主要成分是几丁质,几丁质酶能催化几丁质水解生成N­乙酰氨基葡萄糖,破坏真菌细胞壁的结构完整性,从而抑制一些真菌孢子萌发和菌丝生长[]。在生物防治过程中,除几丁质酶外,还有葡聚糖酶、纤维素酶、蛋白酶等能够与几丁质酶协同作用,使抑菌效果更加显著[]。本研究从菌株BS-3基因组中共获得CAZy家族的编码基因140个,包括糖苷水解酶家族的49个、糖苷转移酶家族的蛋白36个、碳水化合物酯酶17个、多糖裂解酶3个、辅助酶4个、碳水化合物结合组件31个。这些CAZy家族包含了β-1, 3-葡聚糖酶、几丁质酶等细胞壁降解酶的相关基因,推测菌株BS-3降解病原真菌的细胞壁为其抑菌机理之一。

采用antiSMASH工具预测菌株BS-3的次级代谢产物基因簇,得到脂肽类和聚酮类抗生素基因簇10个,包括4个未知功能的基因簇、5个相似度较高的抗生素合成基因簇(Bacillaene、Fengycin、Bacillibactin、Bacilysin、Surfactin)和1个相似度仅为7%的抗生素基因簇(Butirosin)。Bacillaene是一种对细菌和真菌均有抑制作用的多聚烯类抗生素,能抑制蛋白合成;Fengycin对植物病原真菌、细菌和线虫都有抗性,主要由肽链以内酯键与β-羟基脂肪酸结合而成[]。Bacillibactin能竞争性结合环境中对病原菌生长和发挥活性必需的可溶性铁离子,是一种对铁离子具有高亲和性的螯合剂[]。Bacilysin是目前已知芽胞杆菌合成结构最简单的肽类抗菌物质之一,由L-氨基酸抗荚膜菌素残基和L-丙氨酸残基组成[]。Wu等报道菌株B. velezensis FZB42产生的杆菌溶素能杀死铜绿微裹藻,抑藻率达98.78%[]。Surfactin是一种广谱抗菌物质,有很强的表面活性,而且能抗病毒和支原体[];López等研究报道Surfactin与Fengycin同时作用于菜豆和番茄叶子部位,可显著降低灰霉病的发病率[]。Butirosin是一种氨基糖苷类抗生素,对革兰氏阴性菌特别有效,本研究中发现的Butirosin抗生素基因簇与BGC0000693 c1来源的最高相似度仅为7%,说明该基因簇可能合成新的抑菌物质,有待今后进一步研究。此外,菌株BS-3中存在碱性丝氨酸蛋白酶基因,而有报道证明芽孢杆菌中的碱性丝氨酸蛋白能够有效杀死线虫[],推测菌株BS-3分泌抑菌物质为其抑菌机理之一。

4 结论

本文采用第二代Illumina与第三代PacBio平台相结合的测序技术,对生防菌BS-3进行全基因组测序,得到了菌株BS-3的基因组序列信息。通过比较全基因组和其中的GyrA蛋白序列,确定芽孢杆菌BS-3的分类地位为解淀粉芽孢杆菌;发现BS-3基因组中存在5种重要的次级代谢产物基因簇和一种新的抗生素基因簇(Butirosin),同时从BS-3基因组中发现能够降解病原菌细胞壁的β-1, 3-葡聚糖酶、几丁质酶和抑菌蛋白(碱性丝氨酸蛋白)的相关基因,预测菌株BS-3能够通过产生多种拮抗活性化合物、细胞壁水解酶类以及抑菌蛋白实现防病效果,在农业方面具有很大的应用潜力。