NeymanPearson中文Spring2014 - Rhea

Hypothesis Testing

模式识别 的目标是将新观察的特征向量进行分类。为了进行分类的决定，需要通过魔钟判决规则(decision rule)。在 统计学模式识别 一般假设特征向量是个随机变量“X”，又有个概率密度函数或者概率质量函数，并且此函数依赖其分类。如下假设有两个类型：（ $ω 1,ω 2$ ）, 以便写公式也不失一般性。如此X的概率密度或质量函数是 $P (X | ω i)$ (如下称pdf)。每个类型的先验概率写成 $P (ω i)$ 。

统计学的主要部分之一是假设检验。下面描述假设检验在统计学模式识别的眼神。

贝叶斯（Bayes)判决规则

将 $g i (X)$ 是 $ω i$ 的后验概率(posterior probability)。选 $ω 1$ 或 $ω 2$ 的判决规则为: 如果 $g 0 (X) > g 1 (X)$ ,就选 $ω 0$ , 不然选 $ω 1$ 。据贝斯定理, 判决规则能以 似然比(likelihood ratio) $0 (X)$ 表示:

$\begin{align} & g_0(X) > g_1(X) \\ \Rightarrow & P(\omega_0|X) > P(\omega_1|X) \\ \Rightarrow & \frac{P(X|\omega_0)P(\omega_0)}{P(X)} > \frac{P(X|\omega_1)P(\omega_1)}{P(X)} \\ \Rightarrow & P(X|\omega_0)P(\omega_0) > P(X|\omega_1)P(\omega_1) \\ \Rightarrow & l(X)=\frac{P(X|\omega_0)}{P(X|\omega_1)} > \frac{P(\omega_1)}{P(\omega_0)} = k \end{align}$

k 是个常数,而且由于 $P (ω 2) = 1 - P (ω 1)$ , k 可以看待是先验概率的比值（odds) 。

贝叶斯错误

为了评估判决规则的效果，需要计算错误的概率。计算需要如下的记法定义：

$\epsilon_0$ = P(错误选ω₁ ｜ ω₀正确）， $\epsilon_1$ = P(错误选ω₀ ｜ ω₁正确）
R_i是选ω_i的领域：
$R_i=\{x\in X | choose \ \omega_i\}$
r(X)= min(g₀(X),g₁(X))。

在贝叶斯决定规则下，错误几率等于贝叶斯错误几率(Bayes error rate)：

$\begin{align} \\ \epsilon_{Bayes} & = E(r(X)) = \int min(P(\omega_0)P(X|\omega_0), P(\omega_1)P(X|\omega1))dX \\ &= P(\omega_0) \int_{R_1}P(X|\omega_0)dX + P(\omega_1) \int_{R_0} P(X|\omega_1)dX \\ &= P(\omega_0)\epsilon_0 + P(\omega_1)\epsilon_1 \end{align}$

统计学假设检验的决定规则

如果你曾经上过入门的统计学课，你大概能想起传统的 假设检验. 如下为例子:

一位人类学研究者对一名太平岛部落，认为此部落预期寿命比一般人长。把 $μ$ 定义为此部落预期寿命。全世界人口的预期寿命是67.2年。为了检验他的假设，他从公开记录随机选出了100个讣告作为随机样本,发现样本平均预期寿命是72，样本表春差是15。把 X̄ 定义为样本平均值，样本标准差 S，而且由于两都是来自随机样本，两都是随机变量。由于然后用如下的假设检验:

零假设 (H0): $μ - 67.2 = 0$
对立假设(H1): $μ - 67.2 > 0$
检验统计量: $T = \frac{\bar{X} - 67.5}{\sqrt{S^{2}/N}} \sim N(0,1)$ .
决策规则: 若 $T < Z_{\alpha}$
则选H0不然选H1.

如上的H0、H1 、与 $\alpha$ 是传统的记法。 $\alpha ＝$ P(此判决规则让选H1 | H0正确)。在这种检验，”H0正确但选H1“的错误叫做第一型错误。反而”H1正确但选H0“叫做第二型错误。所以 $\alpha ＝$ = P(第一型错误)。

这种假设检验最重要的特点是决定规则的目标是控制 $\alpha$ 不超越.05。

从统计学模式识别的角度上看此假设检验，H0 和 H1是两种类别 -- 可以换回原来的 “ω” 记法。随机特征向量是 T,而且条件pdf是高斯分布（标准正常密度分布）。研究者从T抽一次抽样值 t=（72 － 67.2）/(15 * 15 / 100) = 2。各类的先验概率是平等的。如下图片显示两类的pdf。

粉红色的领域是在贝斯决定则下（平等先验概率）第一型错误的概率。红色的领域是固定在.05一下第一型错误的领域 -- 在标准正常分布就是高于1 - .05分位点＝高于1.644。贝斯的领域同时依赖 $\omega_0$ 跟 $\omega_1$ 的分布 -- 具体说它依赖 $\omega_0$ 密度函数剪 $\omega_1$ 密度函数的根。但是如果只想控制第一型错误，只需要看 $\omega_0$ 分布。在这个检验，2 > 1.644, 决定规则让选H1.研究者大概要在他的论文宣告P值(显著性概率)为P(T>2| $\omega_0$ 正确）＝ 0.022，也就在是Ho的分布下2以上的曲线下面积。

这种检验的决定规则控制第一型错误的概率是为了避免在脆弱的证据下报道肯定的研究成果。它用如下的站落:

首先将P(第一型错误)＝ε₀ 固定在一定的数量α。
然后将P(第二型错误)＝＝ε₁控制在尽可能少的数量。满足此条件的决定规则在统计学中叫做“一致最大功效检验(UMP test)”。

Neyman-Pearson引理表明哪种决定规是UMP：

Neyman-Pearson引理：决定规则当UMP test的充分必要条件如下：

ε₀被固定在一位常数α然后决定规则是

如果 $l(X)=\frac{P(T|Ho)}{P(T|Ha)} > k$

决定选Ho，不然选Ha。

NeymanPearson中文Spring2014 - Rhea

Contents

Hypothesis Testing

贝叶斯（Bayes)判决规则

贝叶斯错误

统计学假设检验的决定规则

Alumni Liaison