聚苹果酸(PMLA)是以苹果酸为唯一单体的均聚高分子聚合物,属于聚酯类聚合物,具有高生物相容性、高水溶性、生物可吸收性、化学可衍生性、可降解性和无免疫原性等多种优良性能,在生物医药、食品和生物材料领域具有潜在的应用前景。研究表明产黑色素短梗霉(Aureobasidium melanogenum)是一种具有较强产PMLA能力的类酵母真菌,对该菌种进行基因组测序及组装可为改造菌种,提高产量提供理论依据。
不同k-mer长度对产黑色素短梗霉clean reads进行组装结果见表1,组装结果显示,产黑色素短梗霉基因组大小约为44 Mb。其中,在k-mer长度为127时得到N50值为908694,L50值为14,基因组覆盖度为121.2×。基于该结果可以判断该菌基因组长度理论值在44 Mb左右;且随着k-mer长度的增加,N50值增大,L50值减小;若继续增大k-mer值会进一步优化组装参数。但由于SPAdes软件进行组装的k-mer值最大为127,这可能是考虑到继续加大k-mer值对测序深度要求较高,从而提高测序成本。
2 三代测序组装结果及基因组结构注释
基于PacBio平台的单分子测序共产生46 Gb大小的bam基因组测序文件,转换为fasta文件后,根据二代组装结果设置基因组大小为44 Mb进行组装。各组装软件组装结果如表2所示,其中,选用Canu组装的最优结果通过quickmerge软件与其他组装结果进行融合,并结合二代测序文件进行基因组纠正(polish),在删除重复contigs后的最终组装结果见表3。
结合转录组测序文件进行基因组结构注释共注释出15684 个基因,并找到基因编码区与氨基酸预测区,因结合转录组测序文件进行结构注释,这些基因可能包含有可变剪切和重复注释的结构,会增加注释出的基因数目。因此,进行功能注释和基因名称注释后需删除重复的基因名;最终,共获得6202 个基因注释结果。
3 GO、KEGG、COG以及antiSMASH次级代谢注释结果
5 PMLA合成相关基因结构预测
讨 论
结合基因组及转录组测序结果可以组装并注释出质量较高的基因组。本研究通过三代测序(Pacbio sequel II平台)、二代测序(Illumina NovaSeq 6000)平台对产黑色素短梗霉基因组进行测序,因三代组装需要预估基因组大小,因此,首先通过二代数据进行基因组预组装共得到44 Mbp基因组大小。之后考察了不同组装软件对产黑色素短梗霉基因组的组装效果,在一般的默认选项下,Canu软件得到了较好的组装效果。对该组装结果通过二代数据修正并去重后得到包含26 个contigs、N50为2204220、GC值为50.09%、大小为42 Mb的较高质量基因组组装结果。通过转录组数据对该组装结果进行结构注释,共找到6202 个基因。产黑色短梗霉属于出芽短梗霉的亚种,其在不同环境中也会呈现出酵母状与菌丝体状的不同形态。将基因组组装与注释结果与酵母和丝状真菌的模式生物基因组进行比较;其中酿酒酵母(Saccharomyces cerevisiae)基因组大小为12.15 Mb,编码6016 个蛋白,GC含量为38.15%;构巢曲霉基因组大小为30.30 Mb,编码10008 个蛋白,GC含量为50.10%。因此,产黑色素短梗霉基因组组成更偏向构巢曲霉,且本实验室先前通过无参转录组注释发现很多与构巢曲霉同源的基因。因构巢曲霉是丝状真菌的模式生物,该结果提示产黑色素短梗霉可能同样适用构巢曲霉的分子转化方法。
本文《高产聚苹果酸黑色素短梗霉CGMCC18996全基因组组装注释及关键蛋白分析》来源于《食品科学》2023年44卷第16期213-219页,作者:王舸楠,李佳谦,李雨桐,陈世伟,王淑贤,赵廷彬,贾士儒,乔长晟。DOI:10.7506/spkx1002-6630-20220906-059。
电话: 010-87293157
地址: 北京市丰台区洋桥70号
版权所有 @ 2023 中国食品杂志社 京公网安备11010602060050号 京ICP备14033398号-2