费希尔判别
出处:按学科分类—哲学、宗教 上海教育出版社《心理学大辞典上卷》第348页(1074字)
判别分析的一种方法。
费希尔判别利用降维和方差分析的思想建立线性判别函数,对降维后的总体利用距离判别建立判别规则,并以此对样品(被试)作出归属何个总体的判别分析。设有k个p维总体G1,G2,…,Gk,样本均值分别为,
,…,
,样本协方差矩阵分别为S1,S2,…,Sk。
考虑样品x=(x1,x2,…,xp)′的p个变量的线性组合y=c′x=cixi,它将p维空间的点变换为直线上的点(降维),变换后总体G1,G2,…,Gk的样本均值分别为
=c′
,
=c′
,…,
=c′
,样本方差分别为c′S1c,c′S2c,…,c′SkC。描述变换后各总体间差异的指标是方差
(
)2=
c′Bc,其中
=
i,B=
(xi-
)(xi-
)′。描述变换后各总体内差异的指标是各总体变换后方差的平均值
c′Sic=
c′Wc,其中W=
Si。变换后总体间差异与总体内差异的比值Δ(c)=
称为判别效率函数。费希尔判别是要使判别效率函数Δ(c)达到极大。这样的c(如果有的话)不是唯一的,为确定起见,加上约束条件c′Wc=1,即判别效率函数中的分母等于1。
设λ1≥λ2≥…≥λs>0为矩阵W-1B的非零特征根,e1,e2,…,es为相应的特征向量(满足Wei=1)。可以证明,当c取为矩阵W-1B的最大特征根λ1对应的特征向量e1(满足
We1=1)时,Δ(c)达到最大值λ1。称y1=
x为第一判别函数。若这个线性判别函数还不能很好区分各个总体,可取λ2对应的特征向量e2建立第二判别函数y2=
x。
若还不够,依此类推,可建立多个判别函数,这样得到的判别函数方差为1,且彼此不相关,即Cov(yi,yj)=Cov(x,
x)=
Wej=0,(i≠j)。设共有r个判别函数,它们将原来的p维空间的点x=(x1,…,xp)变成r维空间的点y=(y1,…,yr)。对于总体Gi,变换后(仍记为Gi)的样本均值为
=(e1′
,…,er′
),样品x0变换为y0=(y01,…,y0r),y0到总体Gi的距离(注意到y=(y1,…,yr)的协方差矩阵为单位矩阵,马氏距离即为欧氏距离)平方为d2(y0,Gi)=(y0-
)′(y0-
),i=1,…,k。这样,在变换后的空间中应用距离判别,就得到费希尔判别的规则:若d2(y0,Gi)=
(y0,Gj),则将x0判归总体Gi,i=1,…,k。
若各总体的协方差矩阵相等,则判别效率函数中的W取为混合类内协方差矩阵(即把k个样本合并为一个样本来计算协方差矩阵)。对于两个有相同协方差矩阵的正态总体,费希尔判别结果与距离判别结果一致。