《模式识别》试题库
一、基本概念题
1.1 模式识别的三大核心问题是:                        、                        、                        。1.2、模式分布为团状时,选用                        聚类算法较好。 1.3 欧式距离具有            。  马式距离具有                。
(1)平移不变性 (2)旋转不变性 (3)尺度缩放不变性 (4)不受量纲影响的特性1.4 描述模式相似的测度有:                                            。
(1)距离测度  (2)模糊测度    (3)相似测度  (4)匹配测度
1.5 利用两类方法处理多类问题的技术途径有:(1)            ;(2)              ;
中国慕课在线登录
(3)                  。其中最常用的是第      个技术途径。
1.6 判别函数的正负和数值大小在分类中的意义是:                              ,                                                    。
1.7 感知器算法        。
(1)只适用于线性可分的情况;(2)线性可分、不可分都适用。                                            1.8 积累位势函数法的判别界面一般为                。  (1)线性界面;(2)非线性界面。
1.9 基于距离的类别可分性判据有:                              。
(1)1
[]w B Tr S S -    (2) B
W
S S          (3) B W B S S S +1.10 作为统计判别问题的模式分类,在(                          )情况下,可使用聂曼-皮尔逊判决准则。1.11 确定性模式非线形分类的势函数法中,位势函数K(x,x k )与积累位势函数K(x)的关系为(                )。
1.12 用作确定性模式非线形分类的势函数法,通常,两个n 维向量x 和x k 的函数K(x,x k )若同时满足下列三个条件,都可作为势函数。①(                                                  );②(                                                  );
③ K(x,x k )是光滑函数,且是x 和x k 之间距离的单调下降函数。
1.13 散度J ij 越大,说明w i 类模式与w j 类模式的分布(                  )。当w i 类模式与w j 类模式的分布相同时,J ij =(      )。
1.14 若用Parzen 窗法估计模式的类概率密度函数,窗口尺寸h1过小可能产生的问题是(                    ),h1过大可能产生的问题是(                                      )。
1.15 信息熵可以作为一种可分性判据的原因是:                                                          。
1.16作为统计判别问题的模式分类,在(                            )条件下,最小损失判决规则与最小错误判决规则是等价的。
1.17 随机变量l(x  )=p( x  |w 1)/p( x  |w 2),l( x  )又称似然比,则E {l( x
)|w 2}=(                      )。在最小误判概率准则下,对数似然比Bayes 判决规则为(                                      )。 1.18 影响类概率密度估计质量的最重要因素是(                                                                )。
1.19 基于熵的可分性判据定义为)]|(log )|([1
x P x P E J i
c i i x H
w w ∑=-=,J H 越(    ),说明模式的可分性越强。当P(w i | x
) =(      )(i=1,2,…,c)时,J H 取极大值。
1.20 Kn 近邻元法较之于Parzen 窗法的优势在于(                                                                )。上述两种算法的共同弱点主要是(                          )。
1.21 已知有限状态自动机Af =(∑,Q ,d ,q 0,F ),∑={0,1};Q ={q 0,q 1};
d :d (q 0,0)= q 1,d (q 0,1)= q 1,d (q 1,0)=q 0,d (q 1,1)=q 0;q 0=q 0;F ={q 0}。现有输入字符串:(a) 00011101011,(b ) 1100110011,(c) 101100111000,(d )0010011,试问,用Af 对上述字符串进行分类的结果为(                                  )。
1.22 句法模式识别中模式描述方法有:                                      。
(1)符号串  (2)树    (3)图    (4)特征向量
1.23设集合X ={a,b ,c,d }上的关系, R ={(a,a),(a,b ),(a,d ),(b ,b ),(b ,a),(b ,d ),(c,c),(d ,d ),(d ,a),(d ,b )},
则a,b ,c,d 生成的R 等价类分别为 ( [a ]R =            ,[b]R =            ,[c ]R =            ,[d]R =      )。
1.24 如果集合X 上的关系R 是传递的、(      )和(      )的,则称R 是一个等价关系。1.25一个模式识别系统由那几部分组成?画出其原理框图。1.26 统计模式识别中,模式是如何描述的。
1.27 简述随机矢量之间的统计关系:不相关,正交,独立的定义及它们之间的关系。
1.28 试证明,对于正态分布,不相关与独立是等价的。
1.29 试证明,多元正态随机矢量的线性变换仍为多元正态随机矢量。
1.30 试证明,多元正态随机矢量X
的分量的线性组合是一正态随机变量。
第二部分 分析、证明、计算题第二章 聚类分析
2.1 影响聚类结果的主要因素有那些?2.2 马氏距离有那些优点?
2.3 如果各模式类呈现链状分布,衡量其类间距离用最小距离还是用最大距离?为什么?
2.4 动态聚类算法较之于简单聚类算法的改进之处何在?层次聚类算法是动态聚类算法吗?比较层次聚类算法与c-均值算法的优劣。
2.5  ISODATA 算法较之于c-均值算法的优势何在?2.6 简述最小张树算法的优点。
2.7 证明马氏距离是平移不变的、非奇异线性变换不变的。
2.8 设,类p w 、 q w 的重心分别为 p x  、 q x
,它们分别有样本 p n 、
q n 个。将和 q w 合并为 l w ,则 l w 有q p l n n n +=个样本。另一类 k w 的重心为 k x
。试证明 k w 与 l w 的距离平方是
2222pq
l
k q p kq l
k q kp
l
k p kl
D n n n n D n n n D n n n D +-
++
+=
2.9 (1)设有M 类模式w i ,i=1,2,...,M ,试证明总体散布矩阵S T 是总类内散布矩阵S W 与类间散布矩阵S B 之和,即S T =S W +S B 。
(2)设有二维样本:x1=(-1,0)T ,x2=(0,-1)T ,x3=(0,0)T ,x4=(2,0)T 和x5=(0,2)T 。试选用一种合适的方法进行一维特征特征提取y i  = W T x i  。要求求出变换矩阵W ,并求出变换结果y i  ,(i=1,2,3,4,5)。(3)根据(2)特征提取后的一维特征,选用一种合适的聚类算法将这些样本分为两类,要求每类样本个数不少于两个,并写出聚类过程。2.10 (1)试给出c-均值算法的算法流程图;
(2)试证明c-均值算法可使误差平方和准则∑∑
∈=--=)
()()()()(1
)
(k j i x k j i T k j i c
j k z x z x J
w
最小。
其中,k 是迭代次数;)
(k j z  是 )
(k j w 的样本均值。
2.11 现有2k +1个一维样本,其中k 个样本在x=-2处重合,另k 个样本在x=0处重合,只有1个在x=a >0处。若a=2(k +1),证明,使误差平方和准则Jc 最小的两类划分是x=0处的k 个样本与x=a 处的1个样本为一类,其余为另一类。这里,
c  N j
Jc = ∑ ∑(x i -m j )2    j=1 i=1
其中,c 为类别数,N j 是第j 类的样本个数,xi ∈w j,i=1,2,...,N j,m j 是第j 类的样本均值。
2.12 有样本集}01,55,45,54,44,10,00{⎪⎪⎭
⎝⎛⎪⎪⎭⎫  ⎝⎛⎪⎪⎭⎫  ⎝⎛⎪⎪⎭⎫  ⎝⎛⎪⎪⎭⎫  ⎝⎛⎪⎪⎭⎫  ⎝⎛⎪⎪⎭⎫  ⎝⎛,试用谱系聚类算法对其分类。
2.13 设有样本集S =},...,,{21n x x x    ,证明类心 z  到S 中各样本点距离平方和 ∑=--n
i i T i z x z x 1
)()(    为最小时,有 ∑==n i i x n z 1
1
2.14 假设s 为模式矢量集X 上的距离相似侧度,有,0,(,)0x y s x y ">>且当0a >时,
(,)/(,)d x y a s x y =。证明d 是距离差异性测度。
2.15 证明欧氏距离满足旋转不变性。
提示:运用M ink ow ski 不等式,对于两矢量T
1[,,]l x x x =L 和
min min max max m m (),(),(),()()ss ss ss ss ss ss ss ss
avg avg ean ean d s d s d s d s d s ,满足
1/1/1/1
1
1
()
()
()
p
p
p
l
l
l
p
p
p
i i i i i i i y y x x ᆪ+===+���2.16证明:
(a)如果s 是类X 上的距离相似侧度,,0,(,)0x y s x y ">>,那么对于 0a ">, (,)s x y a +也是类X 上的距离测度。
(b )如果d 是类X 上的距离差异性测度,那么对于0a ">, d a +也是类X 上的距离差异性测度 2.17 假设:
f R
R
+
+
是连续单调递增函数,满足
()()(),,f x f y f x y x y R
+
+ᆪ+"ᆪ
d 是类X 上的距离差异性测度且00d ᆪ。证明 ()f d 也是类X 上的距离差异性测度。 2.18  假设s 为类X 上的距离相似侧度,有,0,(,)0x y s x y ">>, :
f R
R
+
+
是连续单调递增函
数,满足
1
11()()(),,x y
f x f y f x y R +
+ᆪ"ᆪ+证明()f x 是X 上的距离相似侧度。
2.19  证明:对于模式矢量集X 上任意两个矢量x  和 y
21(,)(,)(,)
x y x y x y d d d ᆪᆪᆪ

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。