医学常用统计分析方法概括

在面对手头上的数据时是否无从下手?在选择统计学方法时不知是否恰当?其实这里面都是有套路的,下面我们将数据分为连续型资料和分类资料;在不同的数据类型下,将处理因素分为单因素和多因素,对医学常用的统计分析方法进行归纳总结,便于大家对照和选择。
1 连续型资料
图片
图1 连续型资料的分析方法选择思维导图
注:
多样本完全随机设计中,方差分析的两两比较方法可用LSD检验,Bonferroni校正等方法实现;秩和检验的两两比较可用Bonferroni校正,Nemenyi检验等方法实现;
LINE分别指自变量与因变量之间存在线性关系,各观测间相互独立,残差e 服从正态分布,方差齐性。
01
单因素单样本
首先,我们来看连续型资料,例如,已知普通小鼠体重的均值,研究者需分析某种新饲料喂养的小鼠体重是否不同于普通小鼠。该研究的结局变量体重为连续型变量,处理因素为喂养新饲料。按照图1,首先检验数据是否正态,若正态则使用t检验,否则使用Wilcoxon秩和检验。
02
单因素两样本
例如喂养两组小鼠,一组喂养原饲料,一组喂养新饲料,比较2组小鼠体重否有差异。该研究的结局变量体重为连续型变量,处理因素为喂养不同饲料,本例为两独立样本。按照图1,首先检验数据是否正态,方差齐,若正态、方差齐,使用t检验或方差分析;若正态、方差不齐,使用t´检验;否则使用Wilcoxon秩和检验。
03
单因素多样本
例如喂养多组小鼠,分别喂养不同的饲料,比较各组小鼠体重是否有差异。为了控制某些非处理因素对实验结果的影响,这里会采取不同的设计方案,本例为完全随机设计。按照图1,首先检验数据是否正态,方差齐,若正态、方差齐,使用方差分析;否则使用Kruscal-wallis H秩检验。
04
多因素样本
我们知道,影响小鼠体重的因素不仅仅只有饲料的种类,还有例如年龄、性别、进食量等各种因素的影响。虽然有些因素在单因素研究中可以通过不同的设计方案控制,但是我们也会经常面对多因素的数据资料。按照图1,首先检验数据是否满足LINE条件,若满足LINE条件,则使用多元线性回归或者协方差分析,否则使用广义线性模型GLM。
2 分类资料
图片
图2 分类资料的分析方法选择思维导图
注:n:样本量;T:理论频数;b,c:配对四格表中的b、c格
01
四格表资料
某医院研究观察不同药物治疗老年2型糖尿病的疗效,采用降糖1号和玉泉丸两种药物治疗患者,得到两种药物治疗的有效人数和无效人数。分析两种药物的疗效是否相同,因变量为是否有效(有效、无效),属于分类变量,是单因素,可整理成四格表,非配对。按照图2,若n≥40且所有T≥5,使用2×2卡方检验;若n≥40但有1≤T
03
R×C表资料
如果医院使用了三种药物治疗患者,观察不同药物的疗效,治疗结果分为显效、有效和无效,分析三种药物的疗效是否相同,因变量为治疗效果(显效、有效、无效)属于单向有序分类变量,是单因素,可整理成3×3表。按照图2,使用秩和检验。
04
多因素分类资料
对糖尿病的治疗效果可能还有年龄、锻炼情况、饮食和体重等因素的影响,分析这些影响因素对糖尿病治疗效果的影响,因变量为治疗效果(显效、有效、无效)属于单向有序分类变量,影响因素为多因素。按照图2,使用有序多分类logistic。
还有一种比较特殊的资料,生存资料,该资料蕴涵结局和时间两个方面的信息。单因素生存资料采用Log-rank检验,多因素生存资料采用Cox比例风险回归模型。
今后,我们会陆续推出一系列推文,具体介绍如何使用R语言对不同类型的资料进行统计分析。请关注!
制作:蔡敏
初审:何冠豪、胡建雄
审核:肖建鹏、刘涛
指导:马文军
关于我们
《数据分析和应用》致力于为全国各地公共卫生与医学工作者(机构)提供专业可靠的统计咨询、研究设计、数据分析及调研报告等服务(详细见公众号菜单栏),欢迎有需要的人员和机构与我们联系。