登录  注册 退出

密码子图书馆

您现在的位置是: 首页 > 扫盲知识库 > FAQ锦集

FAQ锦集

这个统计检验可用于判断PCA/PCoA等的分群效果是否显著!

豌豆先生 2021-10-13 21:43:48FAQ锦集
了解了基本概念 方差分析中的“元”和“因素”是什么? 下面我们看下PERMANOVA。PERMANOVA是多元方差分析的非参数变体。它用来比较多组观测样本的统计指标值的异同。它利用距离矩阵(如欧式距离、Bray-Curtis距离)对总方差进行分解,分

了解了基本概念 方差分析中的“元”和“因素”是什么? 下面我们看下PERMANOVA。

PERMANOVA是多元方差分析的非参数变体。它用来比较多组观测样本的统计指标值的异同。

它利用距离矩阵(如欧式距离、Bray-Curtis距离)对总方差进行分解,分析不同分组因素或不同环境因子对样品差异的解释度,并使用置换检验对各个变量解释的统计学意义进行显著性分析。

目的是检测不同分组的响应变量如菌群构成是否有显著差异。因主要用函数adonis进行分析,有时也称为adonis 检验。

The goal of this test is to tell you if there are significant differences in your response variables among your groupings.

原始假设 (null hypothesis)是每组样本在其检测指标构成的检测空间中的中心点 (centroid)和离散度dispersion无差别。

计算出P值小于0.05时拒绝原假设,也就是不同组样品在检测空间的中心点或分布显著不同。

该检验需要预先计算试验样品在检测指标定义的多维空间的距离,如欧式距离、Bray-Curtis距离等。

The null hypothesis that the centroids and dispersion of the groups as defined by measure space are equivalent for all groups. A rejection of the null hypothesis means that either the centroid and/or the spread of the objects is different between the groups.

比如,对宏基因组检测的物种丰度数据进行PCA/NMDS/PCoA降维可视化后,不同组的样品之间存在一些重叠,那怎么判断这些组之间的样品构成是否存在显著差别呢?

这就需要用到PERMANOVA检验了,检验不同组的样品中心点是否重叠。

当然,PERMANOVA并不依赖于某种降维方法,而是依赖于距离矩阵。如果检测出p值大于0.05,表示不同组的物种构成或相对丰度没有显著差异。

PERMANOVA对检测数据的分布没有任何限制,也不受组之间数据协方差不同的影响,对多重共线性和很多0-值不敏感,其依赖的前提假设是:

  1. 每个对象的数据具有可交换性 (exchangeable)

  2. 可交换的对象(样品)彼此独立

  3. 每个样品的检测数据有一致的多变量分布(每组数据的离散程度相近)

PERMANOVA分析等同于分组变量为解释变量矩阵的哑变量时的基于距离的冗余分析 (db-RDA)。

这个统计检验可用于判断PCA/PCoA等的分群效果是否显著!(图1)

PERMANOVA测试的统计值是伪F值 (pseudo F-ratio),类比于ANOVA分析的F值。它的计算方式是不同组样品之间的距离(或距离的排序)平方和(图中黄色部分)除以同一组样品之间的距离(或距离的排序)平方和(图中蓝色部分),具体如下面公式。

更大的F值表示更强的组分离。通常这个值的显著性要比这个值本身的大小更有意义。

这个统计检验可用于判断PCA/PCoA等的分群效果是否显著!(图2)

PERMANOVA采用数据置换的方式计算pseudo F-值的统计显著性,比较随机置换数据获得的pseudo F-值是否高于或等于实际观测到的值。如果多于5%随机置换计算的pseudo-F值高于实际观测值,则表示不同组的样品之间不存在显著差异 (p-value > 0.05)。

It is vital that the correct permutational scheme is defined and only exchangeable units are permuted. In nested studies, this would mean restricting permutations to an appropriate subgroup of the data set. At times, exact permutation tests either cannot be done, or are restricted to so few objects, that they are not useful.

参考

  1. https://www.scribbr.com/frequently-asked-questions/one-way-vs-two-way-anova/

  2. MANOVA的前提假设 https://www.real-statistics.com/multivariate-statistics/multivariate-analysis-of-variance-manova/manova-assumptions/  https://www.statology.org/manova-assumptions/

  3. https://statistics.laerd.com/statistical-guides/one-way-anova-statistical-guide.php

  4. https://www.yunbios.net/h-nd-570.html

  5. https://mp.weixin.qq.com/s/v_k4Yhe9rBWM9y9A3P3wQw

  6. https://mp.weixin.qq.com/s?__biz=MzUzMjA4Njc1MA==&mid=2247484678&idx=1&sn=f95418a311e639704e9848545efc7fd7&scene=21#wechat_redirect

  7. https://chrischizinski.github.io/rstats/vegan-ggplot2/

  8. https://chrischizinski.github.io/rstats/adonis/

  9. https://chrischizinski.github.io/rstats/ordisurf/

  10. https://www.rdocumentation.org/packages/vegan/versions/1.11-0/topics/adonis

  11. https://www.jianshu.com/p/dfa689f7cafd

  12. https://stats.stackexchange.com/questions/312302/adonis-in-vegan-order-of-variables-non-nested-with-one-degree-of-freedom-for

  13. https://stats.stackexchange.com/questions/188519/adonis-in-vegan-order-of-variables-or-use-of-strata?noredirect=1

  14. https://github.com/vegandevs/vegan/issues/229

  15. https://stats.stackexchange.com/questions/476256/adonis-vs-adonis2

  16. 清晰解释Type I, Type II, Type III https://mcfromnz.wordpress.com/2011/03/02/anova-type-iiiiii-ss-explained/

  17. 清晰解释Type I, Type II, Type III https://stats.stackexchange.com/questions/60362/choice-between-type-i-type-ii-or-type-iii-anova

  18. https://thebiobucket.blogspot.com/2011/08/two-way-permanova-adonis-with-custom.html#more

  19. adonis的前提条件 https://thebiobucket.blogspot.com/2011/04/assumptions-for-permanova-with-adonis.html#more

  20. 作者的论文 https://static1.squarespace.com/static/580e3c475016e191c523a0e2/t/5813ba8b5016e1a5b61f454a/1477687949842/Anderson_et_al-2013-ANOSIM+vs.+PERMANOVA.pdf


文章转自微信公众号  生信宝典