多变量图表示法:
多变量的图表示法是将多变量用平面上的直观图形进行表示,以帮助人们去思维和判断。常用的图表示法有:雷达图、塑料图、轮廊图、星座图、脸谱图等等正则化点变量以体积平均量来表示。
基本介绍:
图形是对数据资料进行探索性研究的重要工具,当人们在运用其他统计方法对所得数据资料进行分析之前,往往习惯于把各数据在一张图上画出来,以直观地反映资料的分布情况及各变量之间的相关关系。当变量较少时,可以采用直方图、条形图、饼图、散点图或是经验分布的密度图等方法,对于变量个数少于3的情况,这样做是简单而有效的。而当变量个数为3时,虽然仍可以做三维的散点图,但这样做已经不是很方便,当变量个数大于3时,就不能用通常的方法作图了。自20世纪70年代以来,统计学家研究发明了很多多维变量的图表示方法,以借助图形来描述多元数据资料的统计特性。
因为对数据资料的图表示法只是以一种直观的方式再现资料,不同的研究者习惯的资料显示方式可能会有很大不同,因此,不同于其他统计方法,大部分图表示法都没有非常严格的画图方
法,研究者可以根据自己的习惯设定某些规则以更方便地揭示数据之问的联系。故此,本章对各种图表示方法原则上只给出作图的思想及思路,而不对严格的数学公式作过多说明。
常见的多变量图表示法:
散点图矩阵
散点图矩阵是借助两变量散点图的作图方法,它可以看作是一个大的图形方阵,其每一个非主对角元素的位置上是对应行的变量与对应列的变量的散点图。而主对角元素位置上是各变量名,这样,借助散点图矩阵可以清晰地看到所研究多个变量两两之间的相关关系。由此也可以看出,散点图矩阵方法还不是真正意义上的多变量作图方法,它反映的仍是两两变量之间的相关关系,而不能直接反映多个变量之间的关系,借助它来对资料分类也是比较困难的;然而,因其直观,简单,容易理解,散点图矩阵还是受到了广大实际工作者的喜爱,很多统计软件也加入了作散点图矩阵的功能。
脸谱图
脸谱图是用脸谱来表达多变量的样品,由美国统计学家H.Chernoff于1970年首先提出,该方
法是将观测的p个变量(指针)分别用脸的某一部位的形状或大小来表示,一个样品(观测)可以画成一张脸谱。他首先将该方法用于聚类分析,引起了各国统计学家的极大兴趣,并对他的画法作出了改进,大部分统计软件也收入了脸谱图分析法。现在已有很多研究者将该方法应用于实际问题的多变量统计分析中。
脸谱图分析法的基本思想是由15~18个指针决定脸部特征,若实际问题变量更多将被忽略(有新的画图方法取消了脸的对称性并引入更多脸部特征,从而最多可以用36个变量来画脸谱),若实际问题变量较少则脸部有些特征将被自动固定。统计学家曾给出了几种不同的脸谱图的画法,而对于同一种脸谱图的画法,将变量次序重新排列,得到的脸谱的形状也会有很大不同。此处我们不对脸谱的各个部位与原始变量的数学关系作出说明,而只给出其作图的思想及软件实现方法。
按照H.Chernoff于1973年提出的画法,采用15个指标,各指标代表的面部特征为:1表示脸的范围;2表示脸的形状;3表示鼻子的长度;4表示嘴的位置;5表示笑容曲线;6表示嘴的宽度;7~11分别表示眼睛的位置、分开程度、角度、形状和宽度;12表示瞳孔的位置;13~15分别表示眼眉的位置、角度及宽度。这样,按照各变量的取值,根据一定的数学函数关
系,就可以确定脸的轮廓、形状及五官的部位、形状,每一个样本点都用一张脸谱来表示。而脸谱容易给人们留下较为深刻的印象,通过对脸谱的分析,就可以直观地对原始资料进行归类或比较研究。
雷达图和星图
雷达图是目前应用最为广泛的对多元数据资料进行作图的方法,利用雷达图可以很方便地研究各样本点之间的关系并进而对样品进行归类。设要分析的资料共有p个变量,雷达图的标准画法如下:先画一个圆,将圆p等分并由圆点连接各分点,将所得的P条线段作为坐标轴,根据各变量的取值对各坐标轴作适当刻度,这样,对每个观测的每个变量的取值,在相应坐标轴上都有一个刻度。对任一样本点,就可以分别在p个轴上确定其坐标,在各坐标轴上点出其坐标并依次连接p个点,就可以得到一个p边形,这样,每一个样本点就用一个p边形表示出来,通过观察各个p边形的形状,就可以对各个样本点的相似性进行分析。当样本数目较小时,可以在一个圆中画出所有的样本点,当样本数目较大时,也可以每一个样本点画一个p边形进行分析。
S-Plus软件收入了雷达图的画法。EXCEL软件也提供了画雷达图的功能,它适合于观测数较
少的情形,这时可以方便地把各观测画到一张图里面,便于对各指标进行对比,但是,当观测数比较多时,画到一张雷达图里面就不太容易看出各观测之间的接近程度,用EXCEL当然也可以对每一个观测画一张雷达图,但此时转差率已经很低了。
星图的形状与雷达图很相似,甚至有的文献把两者看成一回事。S-Plus软件可以一次生成多个观测的星图,每一个观测生成一张星图。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论