跟着iMeta学做图|分面箱线图展示alpha多样性并用标注差异分析结果

本教程相关代码已经上传至 https://github.com/iMetaScience/iMetaPlot/tree/main/230107FacetsBoxplot 如果你使用本代码,请引用:Yu-Xi Zhu. 2022. Gut microbiota composition in the sympatric and diet-sharing Drosophila simulans and Dicranocephalus wallichii bowringi shaped largely by community assembly processes rather than regional species pool. iMeta 1: e57. https://doi.org/10.1002/imt2.57
代码编写及注释:农心生信工作室
写在前面
箱线图 (boxplot) 是一种基于五位数摘要(“最小”,第一四分位数(Q1),中位数,第三四分位数(Q3)和“最大”)显示数据分布的标准化方法, 可以表示微生物群落的alpha多样性。本期我们挑选2022年10月13日刊登在iMeta上的Gut microbiota composition in the sympatric and diet-sharing Drosophila simulans and Dicranocephalus wallichii bowringi shaped largely by community assembly processes rather than regional species pool - iMeta | 扬州大学杜予州团队揭示同域内同食物的两种昆虫肠道微生物群落装配机制,选择文章的Figure 1A进行复现,基于vegan包和ggplot2包,讲解和探讨alpha多样性的计算、箱线图的可视化以及用ANOVA进行差异分析并用字母标注显著性,先上原图:
图片
接下来,我们将通过详尽的代码逐步拆解原图,最终实现对原图的复现。
R包检测和安装
01
安装核心R包vegan、ggplot2以及一些功能辅助性R包,并载入所有R包。
生成测试数据
02
由于缺少原始数据,因此本例使用vegan包自带的dune数据集进行测试。dune数据集的格式是otu表转置后的格式,包含了20个样品,每个样品有30个物种丰度,每一行是一个样品,每一列是一个物种。
03
计算alpha多样性,包括均匀度、丰富度和香农指数。
04
创建函数一步计算alpha多样性。
05
利用函数calculate_alpha(),创建绘图所需数据框并重命名其中的列:
作图预览
06
接下来,逐一预览不同alpha多样性的箱线图:
图片
图片
图片
07
现在,需要绘制分面箱线图,以在同一张图片中表示三种不同的alpha多样性,为此,我们需要将plot_df的宽表转化为长表:
图片
08
到这一步,基本的分面箱线图已经完成,但我们注意到原图做了差异分析,并用字母标记了差异分析结果。这里我们以参数检验中的one-way ANOVA为例进行差异分析(默认总体符合正态分布和方差齐性,所以在这里没有做正态检验和方差齐性检验):
09
如何用abc字母标注差异分析的结果,是本文的难点。为此,我们利用agricolae包的orderPvalue()函数来得到显著性标记。这个函数需要四个参数,因此要对数据提前处理:
10
将整个ANOVA分析和显著性标记过程打包成一个函数anova_sig()便于后续绘图,在这个函数里我们还添加了分组最大值和sd值的计算:
11
最后,用geom_text()来添加abc标记,成品图可以根据个人喜好用AI微调:
图片
完整代码
以上数据和代码仅供大家参考,如有不完善之处,欢迎大家指正!
第1卷第1期
第1卷第2期
第1卷第3期
第1卷第4期
期刊简介
“iMeta” 是由威立、肠菌分会和本领域数百位华人科学家合作出版的开放获取期刊,主编由中科院微生物所刘双江研究员和荷兰格罗宁根大学傅静远教授担任。目的是发表原创研究、方法和综述以促进宏基因组学、微生物组和生物信息学发展。目标是发表前10%(IF > 15)的高影响力论文。期刊特色包括视频投稿、可重复分析、图片打磨、青年编委、前3年免出版费、50万用户的社交媒体宣传等。2022年2月正式创刊发行!
联系我们
iMeta主页:http://www.imeta.science
出版社:https://onlinelibrary.wiley.com/journal/2770596x
投稿:https://mc.manuscriptcentral.com/imeta
邮箱:office@imeta.science