报告解读|微生物多样性—Alpha多样性分析(二)

元莘生物 2024-08-01 15:11:51

前言

上期给大家分享了微生物多样性-OTU聚类和物种注释(加链接),本期小编给大家带来的是微生物多样性—Alpha多样性分析的报告解读。在微生物多样性分析的报告中,Alpha多样性分析是生态学中生物多样性的一个重要的组成部分,也是比较基础的一部分。

话不多说,我们直接往下看~

Alpha多样性是指一个特定区域或生态系统内的多样性,主要分析每个样本中微生物群落本身的多样性,是反映丰富度和均匀度的综合指标。Alpha多样性主要与两个因素有关:一是种类数目,即丰富度;二是多样性,群落中个体分配上的均匀性。群落丰富度(Community richness)的指数主要包括Chao1指数和ACE指数。群落多样性(Community diversity)的指数,包括Shannon指数和Simpson指数。

各指数意义

(1)ACE指数是反映物种丰富度的指数,ACE指数评估样本中物种组成的丰富度和均匀度,数值越大表示该环境的物种越丰富,各物种分配越均匀。其计算公式如下:

Srare表示含有“abund”条序列或者少于“abund”的OTU数目; Sabund表示多于“abund”条序列的OTU数目。

(2)Chao指数是反映物种丰富度的指数,chao指数估算样品中所含OTU数目的指数,数值越大代表样本中所含物种越多。计算公式如下:

其中,Schao1表示估计的OTU数;Sobs表示观测到的OTU数;n1表示只有一条序列的OTU数目;n2表示只有两条序列的OTU数目。

(3)Shannon是反映物种多样性的指数,包括物种丰富度和物种在各种间个体分配的均匀度,当物种的丰富度和均匀度都高时,Shannon指数值才最大。

Simpson是反映物种多样性的指数,表示从一个群落中连续两次抽样所得到的个体数属于同一种的概率,值越大表明样本的物种丰富度越低。

其中,Sobs表示观测到的OTU数目;ni表示含有i条序列的OTU数目;N表示所有的序列数。

(4)Coverage 是指各样本文库的覆盖率,其数值越高,则样本中序列被测出的概率越高,而没有被测出的概率越低。该指数反映本次测序结果是否代表了样本中微生物的真实情况。

其中,n1表示含有一条序列的OTU的数目;N表示抽样中出现的总的序列数目。

根据多样性指数的计算公式,对每一个样本进行生信分析,获得Alpha多样性指数表,如下图所示:

其中,“()”的数值分别表示统计学中的下限和上限值,表示各指数值在此范围内波动

Sample ID:样本名称;Reads:被分入所有OTU中的总优化序列数;OTU:本次实验中该样本优化序列划分得到的OTU数目;0.97:相似性水平为0.97。

元莘生物扩增子报告中Alpha多样性指数结果目录:

根据Alpha多样性指数表,分别对各个指数进行参数检验和非参数检验分析(若两组样品比较则分别使用 R 中的 wilcox.test 函数和 t.test 函数,若两组以上的样品比较则分别使用 R 中的 kruskal.test 函数和 anova 函数),通过参数检验和非参数检验筛选不同条件下的显著差异的 Alpha Diversity 指数,并进行多样性箱线图可视化。

多样性指数箱线图

注:横坐标是分组名称;纵坐标是不同分组下的 Alpha 多样性指数的值。其中,箱子展示了指数的极值、上四分位、下四分位以及中位数,通过对中位数的比较来判断多样性指数的高低。中位数大,表示该组的多样性指数更高;反之亦然。箱子上的字母,可以判断分组之间是否显著:如果两组之间标注不同的字母,表示两组之间无显著差异;若有显著差异,则用“*”表示。

元莘生物扩增子报告中多样性指数箱线图结果目录:

与物种多样性相关的曲线

(1)稀释曲线

稀释性曲线是从样本中随机抽取一定数量的个体,统计这些个体所代表的物种数目,并以个体数与物种数来构建曲线。它可以用来比较测序数据量不同的样本中物种的丰富度,也可以用来说明样本的测序数据量是否合理。采用对序列进行随机抽样的方法,以抽到的序列数与它们所能代表OTU的数目构建Rarefaction curve,当曲线趋向平坦时,说明测序数据量合理,更多的数据量只会产生少量新的OTU,反之则表明继续测序还可能产生较多新的OTU。因此,通过作稀释性曲线,可得出样本的测序深度情况。

稀释性曲线示意图

注:横坐标:随机抽取的测序数据量;纵坐标:观测到的OTU数量。

元莘生物扩增子报告中稀释曲线结果目录:

(2)Shannon-Wiener曲线

Shannon-Wiener是反映样本中微生物多样性的指数,利用各样本的测序量在不同测序深度时的微生物多样性指数构建曲线,以此反映各样本在不同测序数量时的微生物多样性。当曲线趋向平坦时,说明测序数据量足够大,可以反映样本中绝大多数的微生物信息。使用97%相似度的OTU,利用mothur计算不同随机抽样下的Shannon值,利用R语言工具制作曲线图。

Shannon-Wiener曲线示意图

注:横坐标:随机抽取的测序数据量;纵坐标:Shannon-Wiener指数值。

元莘生物扩增子报告中稀释曲线结果目录:

(3)Rank-Abundance曲线

Rank-abundance曲线是分析多样性的一种方式。构建方法是统计单一样本中,每一个OTU所含的序列数,将OTUs按丰度(所含有的序列条数)由大到小等级排序,再以OTU等级为横坐标,以每个OTU中所含的序列数(也可用OTU中序列数的相对百分含量)为纵坐标做图。Rank-abundance曲线可用来解释多样性的两个方面,即物种丰度和物种均匀度。在水平方向,物种的丰度由曲线的宽度来反映,物种的丰度越高,曲线在横轴上的范围越大;曲线的形状(平滑程度)反映了样本中物种的均度,曲线越平缓,物种分布越均匀。

Rank-Abundance曲线示意图

注:横坐标:OTU等级,“500”代表样本中按照丰度排列第500位的OTU;纵坐标:该等级OTU中序列数的相对百分含量,即属于该OTU的序列数除以总序列数,纵坐标轴上数字,例如“100”代表相对丰度为100%,“10”代表相对丰度为10%,依次类推。

(4)Specaccum物种累积曲线

物种累积曲线( Species accumulation curves)是用于描述随着样本量的加大物种增加的状况,是调查样本的物种组成和预测样本中物种丰度的有效工具,在生物多样性和群落调查中,被广泛用于样本量是否充分的判断以及物种丰富度( species richness) 的估计。因此,通过物种累积曲线不仅可以判断样本量是否充分,在样本量充分的前提下,运用物种累积曲线还可以对物种丰富度进行预测(默认在样本量大于10个时分析)。

物种累积曲线示意图

注:横坐标表示样本量;纵坐标表示抽样后OTU数目。其结果反映了持续抽样下新OTU(新物种)出现的速率。在一定范围内,随着样本量的加大,若曲线表现为急剧上升则表示群落中有大量物种被发现;当曲线趋于平缓,则表示此环境中的物种并不会随样本量的增加而显著增多。利用物种累积曲线可以作为对样本量是否充分的判断,曲线急剧上升表明样本量不足,需要增加抽样量;反之,则表明抽样充分,可以进行数据分析。

元莘生物扩增子报告中稀释曲线结果目录:

另外,绘制Rank-Abundance曲线和物种累积曲线的云平台小工具也同步上线,老师们可根据自己的需求使用小工具进行绘图,操作简单易上手,快用起来吧~

云平台链接:http://cloud.origin-gene.com/

元莘生物扩增子报告中Rank-Abundance曲线、物种累积曲线数据路径:

0 阅读:3

元莘生物

简介:专注于分子生物学好和高性能计算在医学领域的应用