如何在科技论文中选择合适的统计检验方法

互推小编 2023-12-25

唐穆宗长庆二年（822年）七月，白居易被任命为杭州的刺史，唐敬宗宝历元年（825年）三月又出任了苏州刺史。在长庆三、四年（823、824年）间的春天，白诗人在一次踏青归来后，写了一首《钱塘湖春行》。

这首诗原文是这么写的："孤山寺北贾亭西，水面初平云脚低。几处早莺争暖树，谁家新燕啄春泥。乱花渐欲迷人眼，浅草才能没马蹄。最爱湖东行不足，绿杨阴里白沙堤。"，其中的那半句“乱花渐欲迷人眼”，用来形容科研狗在撰写科技论文包括SCI论文面对选择统计检验方法时的麻乱，就再贴切不过了。

因为统计学中的检验方法多种多样，而且在不同的假设、不同的数据样本的前提之下，使用的统计检验方法也不同：

简单线性回归(Simple Linear Regression)；

多元回归分析(multiple regression) ；

逻辑回归(logistic regression)；

卡方检验(chi-square test ) ；

T检验(Student's t test)；

方差分析(Analysis of Variance，ANOVA)；

多元方差分析（ multivariate analysis of variance ，MANOVA）；

零反应检验；

符号检验(Sign test)；

秩和检验(Rakumtet)和Ridit检验；

Hotelling检验；

White检验；

Brusch-pagan检验（异方差的检验方法）；

…

确实有一种“迷人眼”的感觉，但写科技论文的人们都离不开对研究数据进行统计学上的检验，即通常人们所说的“统计检验”。

什么是统计检验？

统计检验亦称“假设检验”。根据抽样结果，在一定可靠性程度上对一个或多个总体分布的原假设作出拒绝还是不拒绝（予以接受）结论的程序。作出的决定常取决于样本统计量的数值与所假设的总体参数是否有显著差异。这时称差异显著性检验。检验的推理逻辑为具有概率性质的反证法。

统计检验用于假设检验，它们的主要作用有：

确定预测变量是否与结果变量有统计上的显著关系。PS：注意是有显著关系，具体是什么样的关系，还需要进一步分析。
估计两组或更多组数据之间的差异程度。

在进行统计检验前，一般会假设变量和结果之间、数据组之间没有关系或没有差异的零假设H0，然后通过统计检验，确定观察到的数据是否超出了由零假设预测的值的范围。

比如对比甲乙两个小组的小白鼠的呼吸速度，甲乙两组的小白鼠处于相互独立的环境，而组内的小白鼠处于相同的环境。那么为了证明两种不同的环境对小白鼠的呼吸有影响，研究者可以设计反驳结论的零假设H0:甲组的均值=乙组的均值，而支持结论的备择假设Ha:甲组的均值≠乙组的均值。

统计检验需要确定两组小白鼠呼吸速度均值相同的概率有多大呢?如果研究的统计检验过程中将该试验重复100次，那么将可能会有5次机会得到均值相同的结果。于是，这个均值不相同的概率零假设H0的可能性就是0.05，没错，这个0.05就是大名鼎鼎的P值（P-value）阈值。按惯例，事件发生的概率等于小于0.05，就应该属于小概率事件，因此两组小白鼠呼吸速度的均值相同即零假设H0可能性不大，从而通过反证支持了统计检验想要得到的研究结果Ha。

用统计检验方法拒绝了零假设就是支持了备择假设，也就是支持了研究结果以及结论。

而这种统计检验也是目前在科研过程中最常用“假设检验”方法。

两个基本要素

虽然统计检验的方法多，但如果已经知道要处理的变量类型（变量是被研究对象的属性），就可以照葫芦画瓢地使用流程图为数据选择正确的统计检验。要确定使用哪种统计检验，研究者需要知道的两个基本要素：

收集的数据是否符合某些假设。
要处理的变量类型。

下面详细讲解两个基本要素。

1.统计假设

统计检验所验证的统计假设通常有以下几个类型：

无自相关假设(观察的独立性)：统计检验中包含的观察值/变量不相关（例如，单个受试者的多个观察值/变量不是独立的，而多个不同受试者的观察值/变量是独立的）。

方差齐性假设：各组数据间的方差相似。如果一组数据比其他组数据有更多的变异（离散），这将限制验证的有效性。

正态性假设：数据服从正态分布（又称钟形曲线）。这个假设只适用于定量数据。

如果采集的数据不符合正态性或方差齐性的假设，可以执行非参数统计检验（对于统计总体分布形式未知或虽已知却不能用有限个参数刻画的数据，使用不必/很少依赖于总体分布形式的统计推断方法），这样就可以直接进行数据比较，而无需对数据分布进行任何预先的假设。

如果统计检验的数据不符合独立观察的假设，那么可以使用一个重复测量验证或包含区组变量的验证来解释数据。

2.变量类型

变量的类型通常决定了可以使用哪种类型的统计检验，分为定量变量和分类变量两种。

定量变量表示事物的数量（如长度、重量、产量、人口、速度和温度等）。定量变量的类型包括：

连续变量（continuous）：表示度量值，通常可分为小于1的单位（如0.75克）。在一定区间内可以任意取值，其数值是连续不断的，相邻两个数值可作无限分割，即可取无限个数值。
离散变量（discrete）：表示计数，通常不能被划分成小于1的单位（例如1棵树）。值只能用自然数或整数单位计算，其数值是间断的，相邻两个数值之间不再有其他数值，这种变量的取值一般使用计数方法取得。

分类变量又称为定性变量，表示事物的分组（如职业、教育程度、性别）。分类变量的类型包括：

有序分类变量（ordinal）：用顺序描述事物等级或顺序，变量值可以是数值型或字符型，可以进而比较次序或优劣，如成绩的排名，又如喜欢的程度：很喜欢、一般、不喜欢。
无序分类变量（nominal）：取值之间没有顺序差别，仅做分类，又可分为二分类变量和多分类变量。二分类变量是指将全部数据分成两个类别，如男、女，对、错，阴、阳等，二分类变量是一种特殊的分类变量，有其特有的分析方法。多分类变量是指两个以上类别，如血型分为A、B、AB、O。

有序分类变量和无序分类变量的区别是：前者对于“比较”操作是有意义的，而后者对于“比较”操作是没有意义的。

这四种数据的等级从低到高依次为：无序分类变量(nominal) <有序分类变量(ordinal)< 离散型数值变量(discrete)< 连续型数值变量(continuous)。