Difference between revisions of "Ness slecture 2014" - Rhea

Revision as of 01:02, 3 May 2014

Neyman-Pearson: How Bayes Decision Rule Controls Error
A slecture by Robert Ness

Partly based on the ECE662 Spring 2014 lecture material of Prof. Mireille Boutin.

模式识别 的目标是将新观察的特征向量进行分类。为了进行分类的决定，需要通过某种判决规则(decision rule)。在 统计学模式识别 一般假设特征向量是个随机变量“X”，又有个概率密度函数或者概率质量函数，并且此函数依赖其分类。如下假设有两个类型：（ $ω 0,ω 1$ ）, 以便写公式也不会失去一般性。因此X的概率密度或质量函数是 $P (X | ω i)$ (如下称pdf)。每个类型的先验概率写成 $P (ω i)$ 。

统计学的主要部分之一是假设检验。下面描述假设检验在统计学模式识别的验证。

贝叶斯（Bayes)判决规则

将 $g i (X)$ 是 $ω i$ 的后验概率(posterior probability)。选 $ω 1$ 或 $ω 2$ 的判决规则为: 如果 $g 0 (X) > g 1 (X)$ ,就选 $ω 0$ , 不然选 $ω 1$ 。据贝斯定理, 判决规则能以 概率比(likelihood ratio)表示:

$\begin{align} & g_0(X) > g_1(X) \\ \Rightarrow & P(\omega_0|X) > P(\omega_1|X) \\ \Rightarrow & \frac{P(X|\omega_0)P(\omega_0)}{P(X)} > \frac{P(X|\omega_1)P(\omega_1)}{P(X)} \\ \Rightarrow & P(X|\omega_0)P(\omega_0) > P(X|\omega_1)P(\omega_1) \\ \Rightarrow & l(X)=\frac{P(X|\omega_0)}{P(X|\omega_1)} > \frac{P(\omega_1)}{P(\omega_0)} = k \end{align}$

k 是一个常数。贝叶斯（Bayes)判决规则就说明可以通过概率比与常数的比较进行决定，叫做概率比检测(likelihood ratio test)。

贝叶斯错误

为了评估判决规则的效果，需要计算错误的概率。计算需要如下的记法定义：

$\epsilon_0$ = P(错误选ω₁ ｜ ω₀正确）， $\epsilon_1$ = P(错误选ω₀ ｜ ω₁正确）
R_i是选ω_i的领域：
$R_i=\{x\in X | choose \ \omega_i\}$
r(X)= min(g₀(X),g₁(X))。

在贝叶斯决定规则下，错误几率等于贝叶斯错误几率(Bayes error rate)：

$\begin{align} \\ \epsilon_{Bayes} & = E(r(X)) = \int min(P(\omega_0)P(X|\omega_0), P(\omega_1)P(X|\omega1))dX \\ &= P(\omega_0) \int_{R_1}P(X|\omega_0)dX + P(\omega_1) \int_{R_0} P(X|\omega_1)dX \\ &= P(\omega_0)\epsilon_0 + P(\omega_1)\epsilon_1 \end{align}$

统计学假设检验的决定规则

如果你曾经上过入门的统计学课，你大概能想起传统的 假设检验. 如下为例子:

一位人类学研究者争对一个太平岛的部落，认为此部落预期寿命比一般人长。把 $μ$ 定义为此部落预期寿命。全世界人口的预期寿命是67.2年。为了检验他的假设，他从公开记录中随机选出了100个讣告作为样本,发现样本平均预期寿命是72，标准差是15。把 X̄ 定义为样本平均值， S为样本标准差，两个都是来自随机样本，两个都是随机变量。然后用如下的假设检验:

零假设 (H0): $μ - 67.2 = 0$
对立假设(H1): $μ - 67.2 > 0$
检验统计量: $T = \frac{\bar{X} - 67.5}{\sqrt{S^{2}/N}} \sim N(0,1)$ .
决策规则: 若 $T < Z_{\alpha}$
选H0否则选H1.

如上的H0、H1 、与α是传统的记法。α是 P(此判决规则选H1 | H0正确)的上限。在这种检验，”H0正确但选H1“的错误叫做第一型错误，”H1正确但选H0“叫做第二型错误。所以 P(此判决规则选H1 | H0正确)= P(第一型错误)。

这种假设检验最重要的特点是决定规则的目标是控制P(第一型错误)在α下。 假如α＝.05。

从统计学模式识别的角度上看此假设检验，H0 和 H1是两种类别 -- 可以换回原来的 “ω” 记法。随机特征向量是 T,而且条件pdf是高斯分布（标准正常密度分布）。研究者从T抽一次抽样值 t=（72 － 67.2）/(15 * 15 / 100) = 2。各类的先验概率是平等的。如下图片显示两类的pdf。

粉红色的领域是在贝斯决定规则下（平等先验概率）第一型错误的概率。红色的领域是固定在.05以下第一型错误的领域 -- 在标准正常分布高于1 - .05分位点＝高于1.644。贝斯的领域同时依赖 $\omega_0$ 跟 $\omega_1$ 的分布 -- 具体说它依赖 $\omega_0$ 密度函数减 $\omega_1$ 密度函数的根。但是如果只想控制第一型错误，只需要看 $\omega_0$ 分布。在这个检验，2 > 1.644, 决定规则让选H1.研究者大概要在他的论文宣告P值(显著性概率)为P(T>2| $\omega_0$ 正确）＝ 0.022，也就在是Ho的分布下2以上的曲线下面积。

这种检验的决定规则控制第一型错误的概率是为了避免在脆弱的证据下报告肯定的研究成果。它用如下的段落:

首先将P(第一型错误)＝ε₀ 固定在一定的数量α。
然后将P(第二型错误)＝ε₁控制在尽可能少的数量下。满足此条件的决定规则在统计学中叫做“一致最大功效检验(UMP test)”。

Neyman-Pearson引理：决定规则当UMP test的充分必要条件如下：

ε₀被固定在一位常数α然后决定规则是

如果

$l(T)=\frac{P(T| \omega_0 )}{P(T| \omega_1)} > k$
决定选 $\omega_0$

如果

$l(T)=\frac{P(T| \omega_0 )}{P(T|\omega_1 )} < k$
决定选 $\omega_1$ 。

结论

传统的统计学假设检验的目标是将一个类别的错误概率固定在一定的水平下，然后尽可能减少另一个列别的错误概率。统计学假设检验认为一种错误要比另一种严重，但是贝叶斯决定规则给两种错误平等待遇。Neyman-Pearson 引理说明进行概率比检测是满足统计学假设检验目标的充分必要条件。不过贝叶斯决定规则毕竟是概率比检测，所以贝叶斯决定规则的结果是固定一个类别的错误概率在一定的水平下，然后尽可能减少另一个列别的错误概率。

References

Mireille Boutin, "ECE662: Statistical Pattern Recognition and Decision Making Processes," Purdue University, Spring 2014.
Casella, George, and Roger L. Berger. Statistical inference. Vol. 70. Belmont, CA: Duxbury Press, 1990.
Fukunaga, Keinosuke. Introduction to statistical pattern recognition. Academic press, 1990.

Questions and comments

If you have any questions, comments, etc. please post them On this page.

Back to Spring 2014 ECE662 page

@@ Line 8: / Line 8: @@
-'''模式识别''' 的目标是将新观察的特征向量进行分类。为了进行分类的决定，需要通过魔钟'''判决规则(decision rule)'''。在 '''统计学模式识别''' 一般假设特征向量是个随机变量“X”，又有个概率密度函数或者概率质量函数，并且此函数依赖其分类。如下假设有两个类型：（<span class="texhtml">ω<sub>0</sub>,ω<sub>1</sub></span>）, 以便写公式也不失一般性。如此X的概率密度或质量函数是<span class="texhtml">''P''(''X'' | ω<sub>''i''</sub>)</span> (如下称pdf)。每个类型的'''先验概率'''写成<span class="texhtml">''P''(ω<sub>''i''</sub>)</span>。
+'''模式识别''' 的目标是将新观察的特征向量进行分类。为了进行分类的决定，需要通过某种'''判决规则(decision rule)'''。在 '''统计学模式识别''' 一般假设特征向量是个随机变量“X”，又有个概率密度函数或者概率质量函数，并且此函数依赖其分类。如下假设有两个类型：（<span class="texhtml">ω<sub>0</sub>,ω<sub>1</sub></span>）, 以便写公式也不会失去一般性。因此X的概率密度或质量函数是<span class="texhtml">''P''(''X'' | ω<sub>''i''</sub>)</span> (如下称pdf)。每个类型的'''先验概率'''写成<span class="texhtml">''P''(ω<sub>''i''</sub>)</span>。
-统计学的主要部分之一是'''假设检验'''。下面描述假设检验在统计学模式识别的眼神。
+统计学的主要部分之一是'''假设检验'''。下面描述假设检验在统计学模式识别的验证。
 == 贝叶斯（Bayes)判决规则  ==
-将<span class="texhtml">''g''<sub>''i''</sub>(''X'')</span> 是<span class="texhtml">ω<sub>''i''</sub></span>的'''后验概率(posterior probability)'''。选<span class="texhtml">ω<sub>1</sub></span>或<span class="texhtml">ω<sub>2</sub></span>的判决规则为: 如果<span class="texhtml">''g''<sub>0</sub>(''X'') &gt; ''g''<sub>1</sub>(''X'')</span>,就选<span class="texhtml">ω<sub>0</sub></span>, 不然选<span class="texhtml">ω<sub>1</sub></span>。据贝斯定理, 判决规则能以 '''似然比(likelihood ratio)'''表示:
+将<span class="texhtml">''g''<sub>''i''</sub>(''X'')</span> 是<span class="texhtml">ω<sub>''i''</sub></span>的'''后验概率(posterior probability)'''。选<span class="texhtml">ω<sub>1</sub></span>或<span class="texhtml">ω<sub>2</sub></span>的判决规则为: 如果<span class="texhtml">''g''<sub>0</sub>(''X'') &gt; ''g''<sub>1</sub>(''X'')</span>,就选<span class="texhtml">ω<sub>0</sub></span>, 不然选<span class="texhtml">ω<sub>1</sub></span>。据贝斯定理, 判决规则能以 '''概率比(likelihood ratio)'''表示:
 <math>\begin{align}
@@ Line 25: / Line 25: @@
 </math>
-k 是一位常数。贝叶斯（Bayes)判决规则就说明可以通过似然比与常数的比较进行决定。此手续叫做'''似然比检测(likelihood ratio test)'''。
+k 是一个常数。贝叶斯（Bayes)判决规则就说明可以通过概率比与常数的比较进行决定，叫做'''概率比检测(likelihood ratio test)'''。
 == 贝叶斯错误 ==
@@ Line 48: / Line 48: @@
 如果你曾经上过入门的统计学课，你大概能想起传统的 '''假设检验'''. 如下为例子: <br>
-<blockquote>一位人类学研究者对一名太平岛部落，认为此部落预期寿命比一般人长。把 <span class="texhtml">μ</span> 定义为此部落预期寿命。全世界人口的预期寿命是67.2年。为了检验他的假设，他从公开记录随机选出了100个讣告作为随机样本,发现样本平均预期寿命是72，样本表春差是15。把 X̄ 定义为样本平均值，样本标准差 S，而且由于两都是来自随机样本，两都是随机变量。由于 然后用如下的假设检验:
+<blockquote>一位人类学研究者争对一个太平岛的部落，认为此部落预期寿命比一般人长。把 <span class="texhtml">μ</span> 定义为此部落预期寿命。全世界人口的预期寿命是67.2年。为了检验他的假设，他从公开记录中随机选出了100个讣告作为样本,发现样本平均预期寿命是72，标准差是15。把 X̄ 定义为样本平均值， S为样本标准差，两个都是来自随机样本，两个都是随机变量。然后用如下的假设检验:
 <br>
 零假设 (H0): <span class="texhtml">μ − 67.2 = 0</span>
@@ Line 58: / Line 58: @@
 决策规则: 若 <math> T < Z_{\alpha}  </math>
-则选H0不然选H1. </blockquote>
+选H0否则选H1. </blockquote>
-如上的H0、H1 、与α是传统的记法。α是 P(此判决规则让选H1 | H0正确)的上限。在这种检验，”H0正确但选H1“的错误叫做第一型错误。反而”H1正确但选H0“叫做第二型错误。所以 P(此判决规则让选H1 | H0正确)= P(第一型错误)。
+如上的H0、H1 、与α是传统的记法。α是 P(此判决规则选H1 | H0正确)的上限。在这种检验，”H0正确但选H1“的错误叫做第一型错误，”H1正确但选H0“叫做第二型错误。所以 P(此判决规则选H1 | H0正确)= P(第一型错误)。
-'''这种假设检验最重要的特点是决定规则的目标是控制P(第一型错误)在α下。'''假如α＝.05。
+''这种假设检验最重要的特点是决定规则的目标是控制P(第一型错误)在α下。'' 假如α＝.05。
 从统计学模式识别的角度上看此假设检验，H0 和 H1是两种类别 -- 可以换回原来的 “ω” 记法。随机特征向量是 T,而且条件pdf是高斯分布（标准正常密度分布）。研究者从T抽一次抽样值 t=（72 － 67.2）/(15 * 15 / 100) = 2。 各类的先验概率是平等的。如下图片显示两类的pdf。
@@ Line 68: / Line 68: @@
 '''[[Image:Rplot.png]]'''
-粉红色的领域是在贝斯决定则下（平等先验概率）第一型错误的概率。红色的领域是固定在.05一下第一型错误的领域 -- 在标准正常分布就是高于1 - .05分位点 ＝ 高于1.644。贝斯的领域同时依赖<math> \omega_0 </math> 跟<math> \omega_1 </math>的分布 -- 具体说它依赖<math> \omega_0 </math>密度函数剪<math> \omega_1 </math>密度函数的根。但是如果只想控制第一型错误，只需要看<math> \omega_0 </math>分布。在这个检验，2 > 1.644, 决定规则让选H1.研究者大概要在他的论文宣告P值(显著性概率)为P(T>2| <math> \omega_0 </math> 正确）＝ 0.022，也就在是Ho的分布下2以上的曲线下面积。
+粉红色的领域是在贝斯决定规则下（平等先验概率）第一型错误的概率。红色的领域是固定在.05以下第一型错误的领域 -- 在标准正常分布高于1 - .05分位点 ＝ 高于1.644。贝斯的领域同时依赖<math> \omega_0 </math> 跟<math> \omega_1 </math>的分布 -- 具体说它依赖<math> \omega_0 </math>密度函数减<math> \omega_1 </math>密度函数的根。但是如果只想控制第一型错误，只需要看<math> \omega_0 </math>分布。在这个检验，2 > 1.644, 决定规则让选H1.研究者大概要在他的论文宣告P值(显著性概率)为P(T>2| <math> \omega_0 </math> 正确）＝ 0.022，也就在是Ho的分布下2以上的曲线下面积。
-这种检验的决定规则控制第一型错误的概率是为了避免在脆弱的证据下报道肯定的研究成果。它用如下的站落:
+这种检验的决定规则控制第一型错误的概率是为了避免在脆弱的证据下报告肯定的研究成果。它用如下的段落:
 *首先将P(第一型错误)＝ε<sub>0</sub> 固定在一定的数量α。
-*然后将P(第二型错误)＝ε<sub>1</sub>控制在尽可能少的数量。满足此条件的决定规则在统计学中叫做“一致最大功效检验(UMP test)”。
+*然后将P(第二型错误)＝ε<sub>1</sub>控制在尽可能少的数量下。满足此条件的决定规则在统计学中叫做“一致最大功效检验(UMP test)”。
 Neyman-Pearson引理：决定规则当UMP test的充分必要条件如下：
@@ Line 87: / Line 87: @@
 ==结论==
-传统的统计学假设检验的目标是将一个类别的错误概率固定在一定的水平下，然后尽可能减少另一个列别的错误概率。统计学假设检验认为一种错误要比另一种坏，但是贝叶斯决定规则给两种错误平等待遇。Neyman-Pearson 引理说明进行似然比检测是满足统计学假设检验的目标的目标的充分必要条件。不过贝叶斯决定规则毕竟就是似然比检测。所以贝叶斯决定规则的结果也就是固定一个类别的错误概率在一定的水平下，然后尽可能减少另一个列别的错误概率。
+传统的统计学假设检验的目标是将一个类别的错误概率固定在一定的水平下，然后尽可能减少另一个列别的错误概率。统计学假设检验认为一种错误要比另一种严重，但是贝叶斯决定规则给两种错误平等待遇。Neyman-Pearson 引理说明进行概率比检测是满足统计学假设检验目标的充分必要条件。不过贝叶斯决定规则毕竟是概率比检测，所以贝叶斯决定规则的结果是固定一个类别的错误概率在一定的水平下，然后尽可能减少另一个列别的错误概率。
 == References  ==