CMC专栏--如何采用Minitab软件进行 T-检验?(二)

发布于: 雪球转发:0回复:0喜欢:0

博腾微信公众号将不定期连载CMC(化学/生产/控制)相关文章,欢迎关注。本期文章约3300字。

一、前言

前面章节已经讲述了三种类型T-检验的相关概念,不同的T-检验适用于何种情形,以及在进行T-检验之前需要确保数据呈现正态分布和方差齐性。本文将根据有关的案例继续讲述如何采用Minitab进行T-检验分析。

 二、如何采用Minitab 19进行

单样本T-检验?

一家药品生产商正在开发某种制剂产品,并从放大实验中随机抽取了10个样本。结果如下:

99.1%      105.1%      103.5%      110.0%       100.2%

106.2%        98.4%      101.3%      102.8%         97.9%

现在需要估计这些样本结果是否与100%标示量的目标值存在显著差别,或者说根据这些样本结果,能否估计总体均值为100%,我们可以采用单样本T检验进行样本数据的分析。

在进行单样本T检验之前,需要先进行数据的正态性检验,其分析步骤如下:

01

数据在Minitab电子表格中按如下方式排列:

02

选择统计-基本统计-正态性检验,出现下面的对话框。在出现的对话框中,光标放在“变量”处,双击左侧“C2”到右侧的“变量”栏。继续选择“Anderson-Darling”并单击“确定”,以完成正态性检验

左右滑动查看更多

其P值为0.754,大于0.05,说明数据符合正态分布的。这样我们可以进行下一步的T-检验。

03

选择统计-基本统计-单样本t检验,出现下面的对话框。选择“一个或多个样本,每列一个”,放置光标在下面的“空白框”,双击左侧“C2”到右侧的“空白框”。继续勾选“进行假设检验”并输入“100”“假设均值”

04

选择“选项”,出现下面的对话框。置信水平的默认值为95.0%,在“备择假设”处选择“均值 ≠假设均值 ”

05

单击“确定”两次,完成数据分析,与此类似的图形将会出现:

单样本t检验可创建99.69至105.21的置信区间。因此,可以说有95%的可信度,放大生产过程中总体平均值在标示量的99.7%和105.2%之间。另外,结果表明使用这些样本结果,估计总体均值等于100%的原假设不能被拒绝,因为t统计量为2.01,对应的p值为0.076>0.05。换句话说,如果想要拒绝原假设,那么将有7.6%的机会犯错。如果要求的置信度为95%,则拒绝原假设是不可接受的。

三、如何采用Minitab 19进行

两样本T-检验(未配对)?

药品生产商正在开发某产品贴片,用于商业放行。某一时刻,制造商正在比较两个试验批次的贴片附着力,结果列于下表。根据粘附质量(g/part),这两个最新的试验批次之间的附着力是否有显著差异?该处样本数量不相等(n1 = 20,n2 = 18)。

两批贴片的黏附质量 (g/part)

Lot A

Lot B

2107.1

2108.8

2357.2

2946.6

2353.1

2215.5

2912.4

2495.5

2050.4

2286.2

2392.7

2715.9

2505.8

2685.8

2681.4

2681.6

1947.6

2047.5

2082.8

2514.7

2782

2785.3

2648

2274.4

1986

1819

2224.9

2889

2655.7

2828.5

2962

1939.4

2081.3

1878.9

2452.7

2929

2486.3

2418

N/A

在进行t-检验之前,先要检验两组数据的正态性以及方差齐性,其Minitab中的分析步骤如下:

01

假设数据在Minitab电子表格中按如下方式排列:

02

选择统计-基本统计-正态性检验,出现下面的对话框。在出现的对话框中,光标放在“变量”处,分次双击左侧“C1和C2”到右侧的“变量”栏。继续选择“Anderson-Darling”并单击“确定”,以完成正态性检验。

左右滑动查看更多

因为P值都是大于0.05,所以两组数据符合正态分布。

03

选择“统计-方差分析-等方差检验”,出现下面的对话框。选择“每个因子水平的响应数据单独一列”,光标放在“响应框”处,依次双击左侧“C1-C2”到右侧的“响应框”

04

继续点击“结果”,勾选下方对话框中所有的选项。点击“确定”两次完成等方差检验

因为多重比较和Levene的P值均大于0.05,所以两组数据方差齐。

05

选择统计-基本统计-两样本t检验,出现下面的对话框。选择“每个样本位于自己的列中”,放置光标在下面的“样本1框”,双击左侧“C1”到右侧的“样本1框”。放置光标在下面的“样本2框”,双击左侧“C2”到右侧的“样本2框”

06

选择“选项”,出现下面的对话框。置信水平的默认值为95.0%,假设差值为0.0,在“备择假设”处选择“差值 ≠假设差值 ”

07

单击“确定”两次,完成数据分析,与此类似的图形将会出现:

两样本t检验的置信区间为-469至-51 g /part。由于零不在区间内,因此可以拒绝这两个批次具有相等粘附力的原假设。查看两样本t检验比率方法,结果为t = -2.52,p = 0.016,原假设可以被错误拒绝的可能性仅为1.6%或98.4%的置信度即可以说明两批次生产的贴片,其粘附性存在明显差异。

四.    如何采用Minitab 19进行

配对T-检验?

在某产品的放行过程中,两种检测方法用于评估制剂原料的含量。两种分析方法分别测试了十个不同批次的样品,结果如下表所示。比较这两种检测方法的结果是否有显著差异?假设总体结果以该原料的含量为正态分布,则可以使用配对t检验,因为使用这两种方法都测试了多个批次。

使用两种分析方法测试的不同批次的含量结果比较

批次

方法A

方法B

1

17.2

17.8

2

17.6

17.2

3

19.3

19.1

4

17.6

17.9

5

18.3

18.9

6

17

18.1

7

17.7

17.6

8

18.1

18.1

9

18.3

18.1

10

17.6

17.8

在进行配对t-检验之前,先要检验两组数据的正态性以及方差齐性,其Minitab中的分析步骤如下:

01

假设数据在Minitab电子表格中按如下方式排列:

02

选择统计-基本统计-正态性检验,出现下面的对话框。在出现的对话框中,光标放在“变量”处,依次双击左侧 “C2和C3”到右侧的“变量”栏。继续选择“Anderson-Darling”并单击 “确定”,以完成正态性检验。

左右滑动查看更多

因为P值都是大于0.05,所以两组数据符合正态分布。

03

选择“统计-方差分析-等方差检验”,出现下面的对话框。选择“每个因子水平的响应数据单独一列”,光标放在“响应框”处,依次双击左侧“C2-C3”到右侧的“响应框”

04

继续点击“结果”,勾选下方对话框中所有的选项。点击“确定”两次完成等方差检验。

因为多重比较和Levene检验的P值均大于0.05,所以两组数据方差齐。

05

选择统计-基本统计-配对t检验,出现下面的对话框。选择“每个样本单独一列”,放置光标在下面的“样本1框”,双击左侧“C2”到右侧的“样本1框”。放置光标在下面的“样本2框”,双击左侧“C3”到右侧的“样本2框”

06

选择“选项”,出现下面的对话框。置信水平的默认值为95.0%,假设差值0.0,在“备择假设”处选择“差值 ≠假设差值 ”

07

单击“确定”两次,完成数据分析,与此类似的图形将会出现:

分析检验结果发现两种方法之间没有显著差异(t = 1.29,p = 0.229)。或者,可以以95%的置信度计算置信区间(-0.523 ~ 0.143)。由于零包含在区间内,因此可以确定两种方法之间没有显着差异。在这里再次声明结果并不能证明两种方法是相同的,只是没有检测到统计学上的显着差异。

五、结语

T-检验是最常用的统计检验方法之一,可以用于评估单个样本的均值是否与假设均值不同,或者两个独立样本的均值是否不同。只适用一个离散的自变量(该自变量可以是一水平或两水平)和一个连续的因变量。T-检验需要数据服从正态分布以及方差齐性,如果数据不符合正态性分布或者方差不齐,则我们需要采用非参数检验。单样本t-检验、两样本t-检验以及配对t-检验与之对应的非参数检验分别为单样本符号检验(One-Sample sign test)、曼-惠特尼检验(Mann-Whitney test)以及威尔科克森符号秩检验(Wilcoxon signed-rank test)。具体该选用何种检验可以查看“如何采用Minitab进行T-检验(一)”中的流程图。

参考文献:

1.   Practical Statistics for Pharmaceutical Analysis with Minitab Applications.

下期预告

如何采用Minitab进行方差分析(一)