评分排序优化模型
摘要
一年一度的全国大学生数学建模竞赛,是一项规模宏大的课外科技活动之一。所给问题要求建立一个评分排序优化模型,正是针对建模竞赛中重要环节——答卷评分排序环节而提出的,具有很重要的实际应用意义。答卷的评分排序只有做到科学、合理、公正,才能评选出优秀的作品。根据这些特点,我们对所给问题运用统计数学中的统计学原理建立模型,由简单到复杂,由片面到均衡兼顾,逐步优化。建模前期,我们对所给数据进行了筛选,部分答卷为零分或只有两个数据,也许违反了竞赛规则和评阅规则,将作为废卷处理,剔除这一小部分答卷的数据。首先,我们建立了常用的简单模型I——均值评比模型,其数学表达式为得到最初的名次,前五名的答卷编号分别为。。。。。然后,考虑到模型I忽略了不同评委对同一份答卷的差异,及评委的自身知识水平的限制和主观成份的波动误差影响,结果存在很大的误差。在对均值评比模型改进的基础上建立了模型II——标准分模型。其数学表达式为,由于该模型成立的前提条件是服从正态分布,故借助SPSS对数据进行了单样本K-S正态检验和描述性统计分析,可得每位评委的评分服从正态分布及相关统计数据,使用MATLAB软件编程计算出所有评分的标准分,再利用模型I求出均值,
进行名次排序,前五名的答卷编号分别为。。。。。其次,对数据进行单因素方差分析,可得各评委的评分偏好存在较大的差异,给每位评委加权,建立了模型III——加权评分模型,其数学表达式为
利用MATLAB软件编程求解出所有加权后的评分,依旧用模型I求出均值,进行名次排序,得到新的名次,前五名的答卷编号分别为。。。。。。
最后,对三个模型进行评价,并对其结果进行对比分析。
关键词均值、正态检验、描述性统计、标准化、单因素分析、加权
一、 问题重述………………………………… …………………3
二、 问题分析………………………………………… …………3
三、 模型的假设…………………………………………………4
四、 符号的定义……………………………… …………………5
五、 模型的建立与求解………………………………… ………6
第一部分 准备工作……………………………………
第二部分 建立评分排序优化模型……………………
(一) 模型I——均值评比模型………………………8
(二) 模型——标准分模型………………………
(三) 模型——加权评分模型……………………
六、 结果分析……………………………………………………
七、 模型的评价与推广…………………………………………10
八、 参考文献……………………………………………………11
九、 附录…………………………………………………………
评分排序优化模型
一、问题重述
全国大学生数学建模竞赛是全国高校规模最大的课外科技活动之一,评卷是其中一个至关重要的环节。评卷以假设的合理性、建模的创造性、结果的正确性和文字表述的清晰程度为主要标准。对同一问题,给参赛者提供了较大的创新空间,运用不同的数学知识和方法,建立数学模型。同时也给评卷工作带来一定的难度。尽管评卷者大都为建模方面的专家,但由于各自研究方向的局限、对某些理论理解程度的不同,常常会在评阅中带有主观的成份,造成对同一答卷评判会略有差异。如何根据每个专家的评分,公正合理地评选出优秀的作品,是一个值得研究的问题。
评卷工作的评委由该赛区竞赛组委会聘请(指定),通常为该赛区高校教师。为保证评卷工作的准确、公平、合理,对评委除了专业能力的要求外,制定了如下评卷规则:(1)评委不能是该校本年度数学建模比赛的指导教师。(2)评阅每题的评委人数根据答卷的多少按比例分配,但不能少于三人。(3)评阅采取回避制,评委不能评阅本校的参赛论文。(4)保证每份答卷有三人评阅。
    赛区在评阅前,对所有的论文进行编号,论文中没有任何可能显示答题人身份的标志,并根据上述的评卷规则,把论文分派给每位评委。
    1为某赛区B题各评委的按照事先的评分标准评出的成绩。根据这些资料,利用数学建模的方法,给答卷一个科学、合理、公正的排序,以便评出优秀的作品。
二、问题分析
主要是表达对题目的理解,特别是对附件的数据进行必要分析、描述(一般
都有数据附件),这是需要提到分析数据的方法、理由。
评分排序优化问题研究有非常重要的意义。全国大学生数学建模竞赛是一种大型的重大赛事,评分的科学、合理、公正更是尤为重要,只有做到科学、合理、公正,才能真正体现这种大型竞赛的价值。而评委自身的知识领域局限和主观成分对评分造成的偏差无可避免,建立一种评分排序优化模型,以消除或减少评委的系统误差带来的对参赛队成绩影响,很有实际运用意义。
评分排序优化问题属于数理统计中优化综合评比的数学问题,对于解决此类问题要用数理统计的相关原理进行分析,建立模型。
附件所给数据是195份答卷所有评分的原始数据,总共有9位评委参与评卷,根据评卷规则,每份答卷由三位评委评阅并给原始评分。可能由于作弊抄袭等原因,有14份答卷全为零分,考虑这小部分答卷的数据对总体数据分析影响不大,因此视为废卷,剔除这部分数据。我们用单样本K-S正态检验、描述性统计分析和单因素方差分析等方法进行数据分析。首先,我们建立一个简单的直接取平均分的数学模型I,然后考虑评委自身限制和主观因素影响,将所有评委的评分转化到统一价值尺度中,建立一个标准分模型II,根据每位评委评分偏好的不一致性,为减少这种不一致性带来的误差,将建立加权评分模型III,根据每个模型求出每份答卷的最终成绩,进行排序,并将结果进行比较分析.
三、模型假设
1. 假设每份答卷都有绝对分数,能够反映其真实水平,且每份答卷分数服从正态分布;
2.假设每位评委所评分数服从正态分布;
3.假设每名评委独立评卷,互不影响;
4.假设每名评委的评分偏差服从以他的尺度偏差为期望的正态分布。
5. 假设答卷的分数制度为百分制。
四、符号定义
:第j位评委的评阅卷数
:第j位评委对第i份答卷的评分,规定当第j位评委不对第i份答卷评分时, =0
:第j位评委评分的均值
:第j位评委评分的标准差
:第i份答卷的综合评分
:第j位评委对第i份答卷的评分标准化后的评分
:所有答卷评分的均值
:所有答卷评分的的标准差
五、模型的建立与求解
第一部分:准备工作
(一)数据的处理
1、答卷编号B004B015B019B034B060B064B067B076B091B094B144B148B157B185数据全部缺失,或由于抄袭等原因所有评分都给了零分,故将其 视为废卷,不予考虑。
2、答卷编号B158数据残缺,只有两个评委的评分,不符合保证每份答卷有三人评阅的评卷规则,或某位评委发现该份答卷违反了竞赛规则,评为零分,将其视为废卷,不予考虑。
3、剔除废卷后的数据有如下特点:①每份答卷按照竞赛评卷规则评阅人数都为3人;②九位评委都参与了评阅,但每份答卷对应的评委无明显的一致性,也就是说相同的三位评委一起评阅多份答卷的概率不大,数据较分散。
(二)单样本K-S正态检验:用SPSS软件检验每位评委的评分服从正态分布。
(三)描述性统计分析:用SPSS软件描述性统计分析,将每位评委所对应的特征值进行列表。
(四)单因素方差分析:用MATLABanova1命令分析比较9位评委的评分偏好及评分离散程度。
(五)预测的准备工作:根据数据特点,对总体和个体的特点进行比较,以表格或图示方式显示。
第二部分:建立评分排序优化模型
(一)模型I——均值评比模型
1.模型I的数学表达式:
该模型是一般的常规比赛中最常用的成绩评判方法,对多组成绩采用直接平均的方法即得
最终成绩。
2. 模型I的求解
利用办公软件Excel对数据进行求和取平均、排序,即得所有答卷在模型I下的排名。
3.模型I的评价
模型I 是最简单快捷的成绩评定办法,但存在很大的缺陷,就是忽略了评委的主观成分对评分的影响,造成很大的误差,成绩均值并未能真正反映其真实水平。因此,需要综合考虑评委自身知识水平的限制及主观成分的影响,下面将对所有评分进行标准化处理,我们建立了模型II.
(二)模型Ⅱ——标准分模型
由于每一个评委给出的分数体现不同试卷在他心中的排名的差异,那么把分数整体平移是不会改变这种差异的。根据文献[3]的思想,就可以得到模型Ⅱ,即将每位评卷老师的均值平移到同一个基点,这个基点我们选取所以老师所给出的分数的均值。而每位老师方差的
不同导致每位老师所给出的每一分对总分的贡献不同,因此我们把所有老师的离散(即方差)调到同一水平,这个水平我们就选取所有老师方差的均值,于是模型Ⅱ就更能体现评卷的公平性
1.建立模型前的准备:每位评委评分分布的正态性检验
借助spss软件对9位评委的评分进行单样本K-S正态检验,结果如下:
评委1
评委2
评委3
评委4
评委5
评委6
评委7
评委8
评委9
K-S正态检验统计量
.719
.907
.581
.812
.650
.623
.905
1.079
少儿编程排名前十名1.484
P
.680
.383
.889
.526
.792
.832
.386
.442
.024
由上表可得,每位评委的显著性水平(P值)都大于0.05,因此每位评委的评分服从正态分布。
2.模型Ⅱ的数学表达式如下:
 
由于标准化后的数会出现负数和小数点,使用起来不方便,因此再对标准化后的Z 分数进行T分数变换:
                           
    取均值: 
模型Ⅱ的总数学表达式为   
3.模型Ⅱ的求解
(1)借助SPSS软件对数据进行描述性统计分析,可得每位评委的评阅卷数、评分的最小值和最大值、均值、标准差,直接使用操作命令,既简单又快捷,省去用其他软件编程的麻烦。执行后结果如下:
评阅卷数
最小值
最大值
均值
标准差
评委1
61
30.00
65.00
45.9508
8.15971
评委2
59
28.00
79.00
49.3390
10.16012
评委3
63
30.00
68.00
45.5714
9.43178
评委4
60
22.00
55.00
38.0667
7.03711
评委5
57
28.00
82.00
52.4386
11.84124
评委6
60
33.00
67.00
44.1500
6.39339
评委7
62
34.00
65.00
47.5806
7.68125
评委8
62
31.00
69.00
49.4194
8.76384
评委9
56
28.00
66.00
38.0357
7.45401

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。