博腾微信公众号将不定期连载CMC(化学/生产/控制)相关文章,欢迎关注。本期文章约3300字。
一、前言
前面章节已经讲述了三种类型T-检验的相关概念,不同的T-检验适用于何种情形,以及在进行T-检验之前需要确保数据呈现正态分布和方差齐性。本文将根据有关的案例继续讲述如何采用Minitab进行T-检验分析。
二、如何采用Minitab 19进行
单样本T-检验?
一家药品生产商正在开发某种制剂产品,并从放大实验中随机抽取了10个样本。结果如下:
99.1% 105.1% 103.5% 110.0% 100.2%
106.2% 98.4% 101.3% 102.8% 97.9%
现在需要估计这些样本结果是否与100%标示量的目标值存在显著差别,或者说根据这些样本结果,能否估计总体均值为100%,我们可以采用单样本T检验进行样本数据的分析。
在进行单样本T检验之前,需要先进行数据的正态性检验,其分析步骤如下:
01
数据在Minitab电子表格中按如下方式排列:
02
选择统计-基本统计-正态性检验,出现下面的对话框。在出现的对话框中,光标放在“变量”处,双击左侧“C2”到右侧的“变量”栏。继续选择“Anderson-Darling”并单击“确定”,以完成正态性检验。
左右滑动查看更多
其P值为0.754,大于0.05,说明数据符合正态分布的。这样我们可以进行下一步的T-检验。
03
选择统计-基本统计-单样本t检验,出现下面的对话框。选择“一个或多个样本,每列一个”,放置光标在下面的“空白框”,双击左侧“C2”到右侧的“空白框”。继续勾选“进行假设检验”并输入“100”到“假设均值”。
04
选择“选项”,出现下面的对话框。置信水平的默认值为95.0%,在“备择假设”处选择“均值 ≠假设均值 ”。
05
单击“确定”两次,完成数据分析,与此类似的图形将会出现:
单样本t检验可创建99.69至105.21的置信区间。因此,可以说有95%的可信度,放大生产过程中总体平均值在标示量的99.7%和105.2%之间。另外,结果表明使用这些样本结果,估计总体均值等于100%的原假设不能被拒绝,因为t统计量为2.01,对应的p值为0.076>0.05。换句话说,如果想要拒绝原假设,那么将有7.6%的机会犯错。如果要求的置信度为95%,则拒绝原假设是不可接受的。
三、如何采用Minitab 19进行
两样本T-检验(未配对)?
药品生产商正在开发某产品贴片,用于商业放行。某一时刻,制造商正在比较两个试验批次的贴片附着力,结果列于下表。根据粘附质量(g/part),这两个最新的试验批次之间的附着力是否有显著差异?该处样本数量不相等(n1 = 20,n2 = 18)。
两批贴片的黏附质量 (g/part)
Lot A
Lot B
2107.1
2108.8
2357.2
2946.6
2353.1
2215.5
2912.4
2495.5
2050.4
2286.2
2392.7
2715.9
2505.8
2685.8
2681.4
2681.6
1947.6
2047.5
2082.8
2514.7
2782
2785.3
2648
2274.4
1986
1819
2224.9
2889
2655.7
2828.5
2962
1939.4
2081.3
1878.9
2452.7
2929
2486.3
2418
N/A
在进行t-检验之前,先要检验两组数据的正态性以及方差齐性,其Minitab中的分析步骤如下:
01
假设数据在Minitab电子表格中按如下方式排列:
02
选择统计-基本统计-正态性检验,出现下面的对话框。在出现的对话框中,光标放在“变量”处,分次双击左侧“C1和C2”到右侧的“变量”栏。继续选择“Anderson-Darling”并单击“确定”,以完成正态性检验。
左右滑动查看更多
因为P值都是大于0.05,所以两组数据符合正态分布。
03
选择“统计-方差分析-等方差检验”,出现下面的对话框。选择“每个因子水平的响应数据单独一列”,光标放在“响应框”处,依次双击左侧“C1-C2”到右侧的“响应框”。
04
继续点击“结果”,勾选下方对话框中所有的选项。点击“确定”两次完成等方差检验。
因为多重比较和Levene的P值均大于0.05,所以两组数据方差齐。
05
选择统计-基本统计-两样本t检验,出现下面的对话框。选择“每个样本位于自己的列中”,放置光标在下面的“样本1框”,双击左侧“C1”到右侧的“样本1框”。放置光标在下面的“样本2框”,双击左侧“C2”到右侧的“样本2框”。
06
选择“选项”,出现下面的对话框。置信水平的默认值为95.0%,假设差值为0.0,在“备择假设”处选择“差值 ≠假设差值 ”。
07
单击“确定”两次,完成数据分析,与此类似的图形将会出现:
两样本t检验的置信区间为-469至-51 g /part。由于零不在区间内,因此可以拒绝这两个批次具有相等粘附力的原假设。查看两样本t检验比率方法,结果为t = -2.52,p = 0.016,原假设可以被错误拒绝的可能性仅为1.6%或98.4%的置信度。即可以说明两批次生产的贴片,其粘附性存在明显差异。
四. 如何采用Minitab 19进行
配对T-检验?
在某产品的放行过程中,两种检测方法用于评估制剂原料的含量。两种分析方法分别测试了十个不同批次的样品,结果如下表所示。比较这两种检测方法的结果是否有显著差异?假设总体结果以该原料的含量为正态分布,则可以使用配对t检验,因为使用这两种方法都测试了多个批次。
使用两种分析方法测试的不同批次的含量结果比较
批次
方法A
方法B
1
17.2
17.8
2
17.6
17.2
3
19.3
19.1
4
17.6
17.9
5
18.3
18.9
6
17
18.1
7
17.7
17.6
8
18.1
18.1
9
18.3
18.1
10
17.6
17.8
在进行配对t-检验之前,先要检验两组数据的正态性以及方差齐性,其Minitab中的分析步骤如下:
01
假设数据在Minitab电子表格中按如下方式排列:
02
选择统计-基本统计-正态性检验,出现下面的对话框。在出现的对话框中,光标放在“变量”处,依次双击左侧 “C2和C3”到右侧的“变量”栏。继续选择“Anderson-Darling”并单击 “确定”,以完成正态性检验。
左右滑动查看更多
因为P值都是大于0.05,所以两组数据符合正态分布。
03
选择“统计-方差分析-等方差检验”,出现下面的对话框。选择“每个因子水平的响应数据单独一列”,光标放在“响应框”处,依次双击左侧“C2-C3”到右侧的“响应框”。
04
继续点击“结果”,勾选下方对话框中所有的选项。点击“确定”两次完成等方差检验。
因为多重比较和Levene检验的P值均大于0.05,所以两组数据方差齐。
05
选择统计-基本统计-配对t检验,出现下面的对话框。选择“每个样本单独一列”,放置光标在下面的“样本1框”,双击左侧“C2”到右侧的“样本1框”。放置光标在下面的“样本2框”,双击左侧“C3”到右侧的“样本2框”。
06
选择“选项”,出现下面的对话框。置信水平的默认值为95.0%,假设差值0.0,在“备择假设”处选择“差值 ≠假设差值 ”。
07
单击“确定”两次,完成数据分析,与此类似的图形将会出现:
分析检验结果发现两种方法之间没有显著差异(t = 1.29,p = 0.229)。或者,可以以95%的置信度计算置信区间(-0.523 ~ 0.143)。由于零包含在区间内,因此可以确定两种方法之间没有显着差异。在这里再次声明结果并不能证明两种方法是相同的,只是没有检测到统计学上的显着差异。
五、结语
T-检验是最常用的统计检验方法之一,可以用于评估单个样本的均值是否与假设均值不同,或者两个独立样本的均值是否不同。只适用一个离散的自变量(该自变量可以是一水平或两水平)和一个连续的因变量。T-检验需要数据服从正态分布以及方差齐性,如果数据不符合正态性分布或者方差不齐,则我们需要采用非参数检验。单样本t-检验、两样本t-检验以及配对t-检验与之对应的非参数检验分别为单样本符号检验(One-Sample sign test)、曼-惠特尼检验(Mann-Whitney test)以及威尔科克森符号秩检验(Wilcoxon signed-rank test)。具体该选用何种检验可以查看“如何采用Minitab进行T-检验(一)”中的流程图。
参考文献:
1. Practical Statistics for Pharmaceutical Analysis with Minitab Applications.
下期预告
如何采用Minitab进行方差分析(一)