登录  注册 退出

密码子图书馆

您现在的位置是: 首页 > 扫盲知识库 > FAQ锦集

FAQ锦集

微生物多样性的FAQ

密码子图书馆 2021-10-05 09:40:59FAQ锦集
1. 不同批次测序的数据可以合并吗?有没有什么关卡?回复:这个需要具体情况具体分析:如果不同批次测序数据的测序区域、扩增引物、扩增参数、测序仪器和测序模式都是一致的,那么可以合并起来做分析;否则,由于前述实验参数的不一致,会给不同批次测序数据的合并分

1. 不同批次测序的数据可以合并吗?有没有什么关卡?

回复:这个需要具体情况具体分析:如果不同批次测序数据的测序区域、扩增引物、扩增参数、测序仪器和测序模式都是一致的,那么可以合并起来做分析;否则,由于前述实验参数的不一致,会给不同批次测序数据的合并分析带来干扰和系统误差。如果确实需要进行合并,我们推荐使用QIIME 2流程进行数据合并分析,采用DADA2过滤去噪,可以修正扩增子的测序错误,确定更多的真实变异,数据分析效果会优于传统的OTU聚类方法。


2. 预测菌群功能的那个软件叫什么?

回复:我们使用的是最新版本的PICRUSt 2软件进行预测的。PICRUSt将菌群与功能建立了“映射”,从推出至今已近6年,引用2500余次,是菌群功能预测的不二之选。相比V1版本,具有以下两大优势:1.任何OTU/ASV直接预测功能;2.数据库扩大10倍,包括来自以下数据集的基因家族: COG, EC, KO, PFAM, TIGRFAM等数据库功能注释结果,可以用官方推荐的STAMP差异分析或者LEfSe进行后续分析。STAMP以及LEfSe均是差异分析的利器,是微生物多样性结果中重要展示的分析方法。


3. ROC曲线怎么做?

回复:受试者特征(Receiver-Operating Characteristic,ROC)曲线分析是一种常用的统计学分析方法,在医学研究中主要用于评价诊断试验的效能。它是一种biomaker鉴定的经典展示形式,通过计算各个试验的ROC曲线下的面积(Area Under The Curve,AUC),对不同试验条件的诊断价值进行比较,AUC值>0.5才有诊断意义,越趋近于1,则诊断价值越佳。


4. 纵向不同时间处理组的能不能做LEFse分析?

回复:可以的。在 LEfSe分析中,我们会与老师确认比较组信息,不同的比较组设置,会获得的结果(生物标记物)也是不一样的,因此老师可以在此分析中找到不同时间处理组中显著变化的微生物。


5. LDA图,怎么做?

回复:LDA是线性判别的一个标准,它所对应的分析是LEfSe差异分析,它使用的秩和检验,做该分析的目的是找到不同组间在丰度上有显著性差异的物种,即候选的biomarker。具体步骤如下:

Step1:利用Kruskal-Wallis 秩和检验检测所有的特征物种,通过检测不同组间的物种丰度差异,获得显著性差异物种。

Step2:利用Wilcoxon秩和检验检测上步获得的显著性差异物种的所有亚种是否都趋同于同一分类级别。

Step3:使用线性判别分析(LDA),得到最终的差异物种(即biomarker)。

目前有两种做法,一是通过整理数据上传至公共网站http://huttenhower.sph.harvard.edu/galaxy/进行分析,二是使用linux操作系统进行。前者我们有相应的教程,如有需求,请发邮件至support@lc-bio.com。后者您可以参考相关教程进行。在联川进行的微生物组项目,均可免费获得LEfSe的分析结果。


6. LDA值怎么设定?

回复:我们默认的参数设置为 LDA score>3.0,p value <0.05,主流杂志都接受的参数设定。您也可以根据自己的结果进行调整,LDA值的阈值一般选择2到4。相对而言,LDA值越大说明条件越严苛,结果越可信。


7. 两种分组Alpha多样性组间没有显著性的统计学差异(p<0.05),代表的意义是什么?

回复:Alpha多样性反映的是样本内的微生物群落的丰富度和均匀度,如果两组Alpha多样性评价指标中有部分指标是有显著性差异的,也可以说明两组间的物种数目和均一性上存在差异,可以在文章中进行描述。如果两组Alpha多样性各个评价指标都没有显著性差异,代表两组样本的丰富度和均匀度没有显著差异。这时可以再结合Beta多样性的分析结果,进一步来确认两组样本在菌群组成上是否存在差异。


8. 16S和代谢组怎么关联到一起啊?

回复:目前我们的相关性分析是基于两组学中差异显著的微生物(属水平)和正负离子下差异显著的二级代谢物进行相关性分析,默认模型使用Pearson,展现形式如热图和网路图。

图片

图片

菌群与代谢物相关性热图分析

图片

图片

菌群与代谢物相关性网络分析


9. 老师,能讲一下物种堆叠图,左边的进化怎么看吗?

回复:见下图,左边的进化分析是基于Bray-Curtis距离算法,根据每个样本的菌群组成的相似性进行的进化分析,层层聚类。

图片

图片

10. 两家公司得到的测序序列长度不一样,能合并分析吗?

回复:数据需要复核,符合生物学逻辑的从数据层面是可行的。


11. 环境因子怎么分析?

回复:关于环境指标,有以下两种分析(1)RDA分析:RDA分析是约束化的主成分分析(PCA),它的优点就是考虑了环境因子(如土壤研究中的pH值,酸碱度,疾病研究中临床理化因子等)对样本的影响,可同时反映样本,环境因子和物种三者或两两之间的关系。(2)相关性分析:你需要提供要与微生物数据做相关性分析的指标,我们会和你确认需要进行相关性分析的微生物数据,一般建议使用属水平的高丰度微生物或差异比较属水平的微生物进行分析,默认采用Pearson模型(可以根据要求,更换相关性分析模型及参数),展现形式如热图、网络图。


12. 关联性分析时样本数必须保持一致吗?

回复:是的。一一对应有两层意义:一是只有一一对应,两者才有关联分析的生物学意义,尤其是当生物学重复并不是特别好的情况下。二是在相关性分析中,算法要求,两组学样本一一对应。


13. 微生物数据怎么和临床指标一起分析?

回复:首先,你需要提供要与微生物数据做相关性分析的临床指标,比如BMI,空腹血糖等等,我们会和你确认需要进行相关性分析的微生物数据,一般我们建议使用属水平的高丰度微生物或差异比较属水平的微生物进行分析,默认采用Pearson模型(可以根据要求,更换相关性分析模型及参数),展现形式如热图、网络图。

14. 以前用OTU分析了,还可以利用原来的数据进行Feature分析吗?

回复:由于QIIME2流程中降噪过程会过滤掉很多序列,因此只要原来的数据量足够(最低数据量要求:有效数据 >3万Tags),是可以使用原始数据进行重分析的。

15. 16S可以和靶向还是非靶向代谢组学的数据进行关联?还是都可以?

回复:16S数据既可以和靶向代谢组数据,也可以和非靶向代谢组数据进行关联分析。

文章来源:微信公众号联川生物