评分排序优化模型
摘要
一年一度的全国大学生数学建模竞赛,是一项规模宏大的课外科技活动之一。所给问题要求建立一个评分排序优化模型,正是针对建模竞赛中重要环节——答卷评分排序环节而提出的,具有很重要的实际应用意义。答卷的评分排序只有做到科学、合理、公正,才能评选出优秀的作品。根据这些特点,我们对所给问题运用统计数学中的统计学原理建立模型,由简单到复杂,由片面到均衡兼顾,逐步优化。建模前期,我们对所给数据进行了筛选,部分答卷为零分或只有两个数据,也许违反了竞赛规则和评阅规则,将作为废卷处理,剔除这一小部分答卷的数据。首先,我们建立了常用的简单模型I——均值评比模型,其数学表达式为,得到最初的名次,前五名的答卷编号分别为。。。。。然后,考虑到模型I忽略了不同评委对同一份答卷的差异,及评委的自身知识水平的限制和主观成份的波动误差影响,结果存在很大的误差。在对均值评比模型改进的基础上建立了模型II——标准分模型。其数学表达式为,由于该模型成立的前提条件是服从正态分布,故借助SPSS对数据进行了单样本K-S正态检验和描述性统计分析,可得每位评委的评分服从正态分布及相关统计数据,使用MATLAB软件编程计算出所有评分的标准分,再利用模型I求出均值,
进行名次排序,前五名的答卷编号分别为。。。。。其次,对数据进行单因素方差分析,可得各评委的评分偏好存在较大的差异,给每位评委加权,建立了模型III——加权评分模型,其数学表达式为
利用MATLAB软件编程求解出所有加权后的评分,依旧用模型I求出均值,进行名次排序,得到新的名次,前五名的答卷编号分别为。。。。。。
最后,对三个模型进行评价,并对其结果进行对比分析。
关键词:均值、正态检验、描述性统计、标准化、单因素分析、加权
目 录
一、 问题重述………………………………… …………………3
二、 问题分析………………………………………… …………3
三、 模型的假设…………………………………………………4
四、 符号的定义……………………………… …………………5
五、 模型的建立与求解………………………………… ………6
第一部分 准备工作……………………………………
第二部分 建立评分排序优化模型……………………
(一) 模型I——均值评比模型………………………8
(二) 模型Ⅱ——标准分模型………………………
(三) 模型Ⅲ——加权评分模型……………………
六、 结果分析……………………………………………………
七、 模型的评价与推广…………………………………………10
八、 参考文献……………………………………………………11
九、 附录…………………………………………………………
评分排序优化模型
一、问题重述
全国大学生数学建模竞赛是全国高校规模最大的课外科技活动之一,评卷是其中一个至关重要的环节。评卷以假设的合理性、建模的创造性、结果的正确性和文字表述的清晰程度为主要标准。对同一问题,给参赛者提供了较大的创新空间,运用不同的数学知识和方法,建立数学模型。同时也给评卷工作带来一定的难度。尽管评卷者大都为建模方面的专家,但由于各自研究方向的局限、对某些理论理解程度的不同,常常会在评阅中带有主观的成份,造成对同一答卷评判会略有差异。如何根据每个专家的评分,公正合理地评选出优秀的作品,是一个值得研究的问题。
评卷工作的评委由该赛区竞赛组委会聘请(指定),通常为该赛区高校教师。为保证评卷工作的准确、公平、合理,对评委除了专业能力的要求外,制定了如下评卷规则:(1)评委不能是该校本年度数学建模比赛的指导教师。(2)评阅每题的评委人数根据答卷的多少按比例分配,但不能少于三人。(3)评阅采取回避制,评委不能评阅本校的参赛论文。(4)保证每份答卷有三人评阅。
赛区在评阅前,对所有的论文进行编号,论文中没有任何可能显示答题人身份的标志,并根据上述的评卷规则,把论文分派给每位评委。
表1为某赛区B题各评委的按照事先的评分标准评出的成绩。根据这些资料,利用数学建模的方法,给答卷一个科学、合理、公正的排序,以便评出优秀的作品。
二、问题分析
主要是表达对题目的理解,特别是对附件的数据进行必要分析、描述(一般
都有数据附件),这是需要提到分析数据的方法、理由。
评分排序优化问题研究有非常重要的意义。全国大学生数学建模竞赛是一种大型的重大赛事,评分的科学、合理、公正更是尤为重要,只有做到科学、合理、公正,才能真正体现这种大型竞赛的价值。而评委自身的知识领域局限和主观成分对评分造成的偏差无可避免,建立一种评分排序优化模型,以消除或减少评委的系统误差带来的对参赛队成绩影响,很有实际运用意义。
评分排序优化问题属于数理统计中优化综合评比的数学问题,对于解决此类问题要用数理统计的相关原理进行分析,建立模型。
附件所给数据是195份答卷所有评分的原始数据,总共有9位评委参与评卷,根据评卷规则,每份答卷由三位评委评阅并给原始评分。可能由于作弊抄袭等原因,有14份答卷全为零分,考虑这小部分答卷的数据对总体数据分析影响不大,因此视为废卷,剔除这部分数据。我们用单样本K-S正态检验、描述性统计分析和单因素方差分析等方法进行数据分析。首先,我们建立一个简单的直接取平均分的数学模型I,然后考虑评委自身限制和主观因素影响,将所有评委的评分转化到统一价值尺度中,建立一个标准分模型II,根据每位评委评分偏好的不一致性,为减少这种不一致性带来的误差,将建立加权评分模型III,根据每个模型求出每份答卷的最终成绩,进行排序,并将结果进行比较分析.
三、模型假设
1. 假设每份答卷都有绝对分数,能够反映其真实水平,且每份答卷分数服从正态分布;
2.假设每位评委所评分数服从正态分布;
3.假设每名评委独立评卷,互不影响;
4.假设每名评委的评分偏差服从以他的尺度偏差为期望的正态分布。
5. 假设答卷的分数制度为百分制。
四、符号定义
:第j位评委的评阅卷数
:第j位评委对第i份答卷的评分,规定当第j位评委不对第i份答卷评分时, =0
:第j位评委评分的均值
:第j位评委评分的标准差
:第i份答卷的综合评分
:第j位评委对第i份答卷的评分标准化后的评分
:所有答卷评分的均值
:所有答卷评分的的标准差
五、模型的建立与求解
第一部分:准备工作
(一)数据的处理
1、答卷编号B004、B015、B019、B034、B060、B064、B067、B076、B091、B094、B144、B148、B157、B185数据全部缺失,或由于抄袭等原因所有评分都给了零分,故将其 视为废卷,不予考虑。
2、答卷编号B158数据残缺,只有两个评委的评分,不符合保证每份答卷有三人评阅的评卷规则,或某位评委发现该份答卷违反了竞赛规则,评为零分,将其视为废卷,不予考虑。
3、剔除废卷后的数据有如下特点:①每份答卷按照竞赛评卷规则评阅人数都为3人;②九位评委都参与了评阅,但每份答卷对应的评委无明显的一致性,也就是说相同的三位评委一起评阅多份答卷的概率不大,数据较分散。
(二)单样本K-S正态检验:用SPSS软件检验每位评委的评分服从正态分布。
(三)描述性统计分析:用SPSS软件描述性统计分析,将每位评委所对应的特征值进行列表。
(四)单因素方差分析:用MATLAB的anova1命令分析比较9位评委的评分偏好及评分离散程度。
(五)预测的准备工作:根据数据特点,对总体和个体的特点进行比较,以表格或图示方式显示。
第二部分:建立评分排序优化模型
(一)模型I——均值评比模型
1.模型I的数学表达式:
该模型是一般的常规比赛中最常用的成绩评判方法,对多组成绩采用直接平均的方法即得
最终成绩。
2. 模型I的求解
利用办公软件Excel对数据进行求和取平均、排序,即得所有答卷在模型I下的排名。
3.模型I的评价
模型I 是最简单快捷的成绩评定办法,但存在很大的缺陷,就是忽略了评委的主观成分对评分的影响,造成很大的误差,成绩均值并未能真正反映其真实水平。因此,需要综合考虑评委自身知识水平的限制及主观成分的影响,下面将对所有评分进行标准化处理,我们建立了模型II.
(二)模型Ⅱ——标准分模型
由于每一个评委给出的分数体现不同试卷在他心中的排名的差异,那么把分数整体平移是不会改变这种差异的。根据文献[3]的思想,就可以得到模型Ⅱ,即将每位评卷老师的均值平移到同一个基点,这个基点我们选取所以老师所给出的分数的均值。而每位老师方差的
不同导致每位老师所给出的每一分对总分的贡献不同,因此我们把所有老师的离散(即方差)调到同一水平,这个水平我们就选取所有老师方差的均值,于是模型Ⅱ就更能体现评卷的公平性
1.建立模型Ⅱ前的准备:每位评委评分分布的正态性检验
借助spss软件对9位评委的评分进行单样本K-S正态检验,结果如下:
评委1 | 评委2 | 评委3 | 评委4 | 评委5 | 评委6 | 评委7 | 评委8 | 评委9 | |
K-S正态检验统计量 | .719 | .907 | .581 | .812 | .650 | .623 | .905 | 1.079 | 少儿编程排名前十名1.484 |
P值 | .680 | .383 | .889 | .526 | .792 | .832 | .386 | .442 | .024 |
由上表可得,每位评委的显著性水平(P值)都大于0.05,因此每位评委的评分服从正态分布。
2.模型Ⅱ的数学表达式如下:
(,)
由于标准化后的数会出现负数和小数点,使用起来不方便,因此再对标准化后的Z 分数进行T分数变换:
取均值:
模型Ⅱ的总数学表达式为
3.模型Ⅱ的求解
(1)借助SPSS软件对数据进行描述性统计分析,可得每位评委的评阅卷数、评分的最小值和最大值、均值、标准差,直接使用操作命令,既简单又快捷,省去用其他软件编程的麻烦。执行后结果如下:
评阅卷数 | 最小值 | 最大值 | 均值 | 标准差 | |
评委1 | 61 | 30.00 | 65.00 | 45.9508 | 8.15971 |
评委2 | 59 | 28.00 | 79.00 | 49.3390 | 10.16012 |
评委3 | 63 | 30.00 | 68.00 | 45.5714 | 9.43178 |
评委4 | 60 | 22.00 | 55.00 | 38.0667 | 7.03711 |
评委5 | 57 | 28.00 | 82.00 | 52.4386 | 11.84124 |
评委6 | 60 | 33.00 | 67.00 | 44.1500 | 6.39339 |
评委7 | 62 | 34.00 | 65.00 | 47.5806 | 7.68125 |
评委8 | 62 | 31.00 | 69.00 | 49.4194 | 8.76384 |
评委9 | 56 | 28.00 | 66.00 | 38.0357 | 7.45401 |
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论