概率统计23——假设检验理论（2）

概率统计23——假设检验理论（2）

假设检验实际上是用反证法做出非对即错的判断：先假定原假设是对的，然后将抽样数据代入相应的分布中去验证，观察原假设的数值是落在接受域还是拒绝域，由此做出是接受还是拒绝原假设的判断。

值得注意的是，不同于以往严格的数学证明，假设检验是建立在小概率事件原理的基础之上。由于小概率事件也有可能发生，因此并不能百分之百确定原假设一定不成立，也就是说，原假设也有判断错误的时候。

两种错误类型

假设检验有两种判断错误的类型，统计学家给出了专业的名称：第一类错误和第二类错误。

第一类错误（false reject）：错误地拒绝，H₀是对的，却拒绝了它。也就是说，计算结果落在拒绝域，但真实结果是在接受域。

第二类错误（false accept）：错误地接受，H₀是错的，却接受了它。也就是说，计算结果落在接受域，但真实结果是在拒绝域。

第一类错误也叫Ⅰ 型错误或弃真错误，第二类错误也叫Ⅱ 型错误或存伪错误。我觉得还是忘记这些文绉绉名称，记住false reject和false accept即可，毕竟这两个英文短语更直白，更容易理解。

假设检验的理想情况是能过做出与实际相符的正确断言，但由于抽样数据的随机性，根据样本计算的统计量必然会与整体的真实数值存在差异，这种差异可能导致出现四种判断结果：

错误的概率

既然假设检验无法保证百分之百有效，那么我们就需要研究两类错误出现的概率，由此将假设检验的功效数值化。

先来看第一类错误。

第一类错误是在H₀正确的时候错误地却拒绝了它，这就意味着我们的判断结果落在了拒绝域内：

结果落在拒绝域内的概率与显著性水平一致，因此α的数值决定了出现第一类错误概率：

随着α的减小，第一类错误出现的概率也随之减小。当α=0时，第一类错误完全消失，也就是永远不会拒绝H₀，这有点像过去的“守旧派”对于“法先王”的绝对拥护，无论时代怎么进步，“法先王”都必须服从，任何改革都视为大逆不道。

可以看出，由于α的值很小，所以犯第一类错误的几率也很小。

再来看第二类错误。

第二类错误是在H₀错误的时候接受了它，一个本应落在拒绝域内的点却落在了接受域内：

我们用β表示第二类错误出现的概率，只要α确定了，β也就确定了。一个草率的判断是β=1-α，按照这种计算方式，β=0.95，这意味着第二类错误出现的概率高达95%！如果这样，那么假设检验还有什么用？

实际上β的计算比α难得多。

　　

我们延用产品元件的故事。μ₀是改善前总体的均值，μ₁是改善后总体的均值，改善前后的标准差一致，都是σ=6。

原假设H₀：改善前与改善后是同一个正态分布，μ₀=μ₁=600。

备择假设H₁：改善前与改善后是不同的正态分布，μ₀=600< μ₁=603。

公司用新技术制造了大量元件，从中多次抽取容量是m（m≥30）的样本进行检验。根据中心极限定理，样本均值的分布服从均值为总体均值，方差为总体方差1/m的正态分布：

对样本均值进行标准化处理：

使用0.05显著性水平，在标准正态分布下，查表可知临界值是1.645。

当Z₀ > 1.645时，将拒绝H₀假设。

再来看均值的逆运算：

也就是说，如果抽样的均值大于601.802，就应该拒绝相信H₀。

现在可以计算出标准正态分布下β区域的临界值：

结论是，如果改善后的功率均值是603，那么以此为条件，犯第二类错误的概率是β=0.137。通过β的计算过程可以看出，只有当H₁假设是一个固定的值时，才能计算出β。如果H₁假设不是固定，比如只给出了μ₁ > 603，那么将无法根据①计算出z₁，也就无法进一步求得β。

一个常见的问题是，既然一开始就知道了H₀和H₁的均值和方差，为什么还要使用标准化处理？直接计算临界值岂不是更简单？

我们的确可以直接通过计算机解求得X~(μ₀, σ²)时的临界值，但这是总体分布下的临界值，而我们的假设检验是基于抽样，并非总体，此时用到的理论是中心极限定理，因此才大费周章地使用标准化形态。

　　出处：微信公众号 "我是8位的"

　　本文以学习、研究和分享为主，如需转载，请联系本人，标明作者和出处，非商业用途！

　　扫描二维码关注作者公众号“我是8位的”
相关阅读:
海康威视web插件安装后还是不能看视频问题
 超详细解释 react，flux，redux 的概念与关系
 vue3和react虚拟DOM的diff算法区别
 leetcode 78. 子集 js 实现
 js 实现扁平数组转为树形结构数组及树形结构数组转为扁平数组
 vite 为什么比 webpack 快？
实现一个简单版 Vue2 双向数据绑定
 leetcode 415. 字符串相加 js 实现
 transform rotate实现环形进度条
 leetcode 258. 各位相加 js 实现
原文地址：https://www.cnblogs.com/bigmonkey/p/12582174.html

概率统计23——假设检验理论（2）

两种错误类型

错误的概率