元分析方法的几个基本问题
【作 者】夏凌翔
【作者简介】夏凌翔,西南师范大学心理学院博士研究生。(重庆 400715)
【内容提要】元分析是在传统的文献综述的基础上发展起来的一种新的将定性分析与定量分析相结合的文献综合方法。该方法能较好克服传统文献综述的种种问题,但也存在综述研究所具有的一些难以克服的通病。元分析在国外已经得到广泛应用,但在我国的社会科学研究中还很难见到有人使用该方法,不少学者对其还缺乏了解。同时,元分析也容易被误用。因此,有必要在社会科学领域加大对元分析方法的介绍、讨论和应用。
【摘 要 题】方法
【关 键 词】元分析/文献综述/研究方法
【正 文】
元分析是一种新的将定性分析与定量分析相结合的文献综合方法,自从美国教育心理学家Glass在1976年首次命名以来,已经在国外的社会科学研究中广泛应用,大量介绍元分析方法的书籍出版,一些应用
软件也相继问世,但在我国的社会科学研究中却很少见到这样的研究,不少学者甚至还不了解元分析究竟是什么,因此很有必要对元分析的方法进行介绍和讨论。本文讨论元分析的涵义、目的与意义、局限以及历史,以期能够对元分析方法在我国社会科学研究中的引入、讨论和应用起到抛砖引玉的作用。
    一、元分析的涵义
元分析的英文是meta-analysis,Meta是英文中的前缀,有更加全面或超常规的综合的意思。国内将其译为元分析、荟萃分析、整合分析、汇总分析、二次分析、集成分析、再分析、汇后分析等,还有许多学者直接使用Meta分析。它还有许多同义词,如总观评述(overview)、定量评论(quantitative review)、定量综合(quantitative synthesis)、资料汇总(data pooling)、资料综合(data synthesis)等。Glass对元分析的定义是:以综合已有的发现为目的,对单个研究结果进行综合的统计学分析方法。[1]之后的许多统计学家也作了类似定义,即把元分析仅看作是对以往研究结果进行定量合并的统计分析方法。因此,Milos把前阶段的元分析称作典型或定量元分析(classic meta-analysis or quantitative meta-analysis)[2]。随着元分析方法应用范围的扩大和自身的发展,学者们认识到元分析中应该既有定量分析也有定性分析,因此不再将元分析简单看作一种统计分析,而是作为综合多个同类研究的结果,对研究效应进行定量合并的分析研究过程和系统方法,如Ellenberg将其定义为:对具有共同研究目的相互独立的多个研究结果给予定量分析,合并分析,剖析研究差异特征,综合评价研究结果。[3]Sacks等对其的定义
是:对以往的研究结果进行统计学的合并和严谨的系统综述方法。[4]
简单地说,元分析就是应用特定的设计和统计学方法对以往的研究结果进行整体的和系统的定性与定量分析。它是回顾性和观察性的,是对传统综述的一种改进,是概括以往研究结果的一种方法,包括大量的方法和技术,具有全面、系统和定量的特点,可以用以对以前的具有不同研究设计的和不同时期收集到的资料进行整合。它最初应用于随机对照试验,现在已扩大到非实验性研究。
    二、元分析的目的和意义
科学研究都必须建立在前人研究的基础之上,而实践工作者也非常关心一些基本问题的研究结论,如某种心理疗法的效果究竟如何。因此,总结前人的研究是一项很重要的工作,这就是所谓的文献综述(literature review)。但传统的文献综述常常难以让人满意,因为它容易出现以下几个问题:(1)以定性分析或描述为主,难以给出一个定量的结论。同时,当所研究的实验数量不断增加时,得出错误结论的机率也随之增加。(2)如果有关研究的数量众多,如有500个,那么要从这么多的研究结果中得出一个一般性的结论已超出了个人的能力。(3)综述者究竟使用了哪些文献常常不得而知。因为综述者一般不会详细交待文献检索的范围和方式,比如是否同时进行计算机检索和手工检索,计算机检索中使用了哪些数据库,哪些关键词,是否检索了硕士论文和博士论文,检索了哪些语种的外文文献等。综述者一般也不会交待进行综述时排除了哪些检索到的文献,其依据是什么。(4)传统综述中没有考虑研
究质量、样本大小等因素对研究结论带来的影响。(5)使用同样的文献,不同的综述者可以得出不同的结论。综述者常常没有或难以说清其依据什么最后得出一个结论,特别是对于那些有争议的问题,是如何看待和判断不同甚至是完全相反的研究结果的。因此综述者很可能基于自己的见解,采取简单化的方式处理一些研究结果,从而得出与自己观点类似的结论。
总之,传统的文献综述未使用任何系统方法来对所综述内容的原始数据进行收集、综合,也未进行定量综合,因此常常只是罗列以往的研究结果,同时研究结论不可避免带有主观性。
元分析作为一种定量的综合文献的方法和传统的文献综述是有很大不同的,它可以在很大程度上克服传统的文献综述中的这些问题。因为元分析是较高一级逻辑形式上的文献综述,以原始研究结果为单位,设计较严密,强调对有关研究进行全面的文献检索,有明确的文献纳入和排除的标准,系统地考虑了研
究的对象、方法、测量指标等对分析结果的影响,对纳入文献进行了严格评价,并在此基础上对结果进行定量的合并。所以,与传统的文献综述相比,元分析能最大限度地减少各种偏倚,确保结论的科学性、客观性和真实性。
具体地说,元分析具有以下作用:(1)解决研究结果的矛盾,定量估计研究效应的平均水平,为进一步的研究和做出决策提供全面的文献总结。应用元分析可以得到同类研究的平均效应水平,使有争议甚至相互矛盾的研究结果得出一个定量的结论,同时使效应估计的有效范围更精确。(2)提高统计分析
的功效。有时候由于样本量较小等原因,使研究结果不能得出统计学上的显著差异,并不一定就是处理无效应。这时,应用元分析把许多同类研究结果进行合并分析,因此增大了样本量,起到改进和提高统计学检验功效的目的,可以使一些相对较弱的效应也显现出来,同时也提高了对结论的论证强度和效应的分析评估力度。(3)揭示和分析多个同类研究的分歧。由于研究水平、条件、抽样等原因可能使同类研究的质量有较大差异,多个研究结果也可能存在较大分歧,这时元分析可以揭示出单个研究中的不确定性,并通过异质性(齐性)检验(tests for heterogeneity)等方法考察研究间异质性(hete rogeneity)的原因,揭示文献异质性的来源,估计可能存在的各种偏倚(bias)。(4)为确定新的研究问题和对新实验的设计提供帮助。通过元分析能发现以往研究的不足之处,回答单个研究中尚未提及或不能回答的问题,揭示单个研究中存在的不确定性,并据此提出新的研究假说、课题和方向。(5)具有处理大量文献的能力,不受研究数目的限制。(6)节省研究费用。由于研究对象数量的限制、各种干扰因素的影响以及研究本身的偶然性等原因,许多研究结果可能不一致甚至相反,要解决这个问题除了使用元分析外,还可以通过严格设计大规模随机试验来进行验证。但这种办法费时、费力,使用元分析则可以节约费用。(7)研究发表偏倚(publication bias)等综述研究中不可避免的问题。
总之,元分析是获取和评价大量文献的科学方法,在当今知识爆炸的时代,当需要系统总结、分析以往的工作,为科学决策提供依据时,元分析是合并现有信息的最好方法之一,有助于研究者和实践工作者对文献进行分析与评价,从而在较少的时间、人力和物力的投入下获取更多的信息。
    三、元分析的局限性与质量控制
虽然与传统的文献综述相比元分析具有许多优点,但也存在着不少局限与问题,因此关于元分析的争论
从来就没有停息过,如Feins认为,元分析方法本身存在一些缺陷,例如其结果的重复性,精确性较差,不适合外推,甚至有时会造成错误的结论。[5]因此在学习和应用元分析之前必须对其自身的局限有充分的认识。#p#分页标题#e#
1.各种偏倚(bias)及其控制。可以说,在元分析的各个步骤中均有可能产生偏倚,而偏倚的存在对元分析的结果产生较大影响,甚至会使元分析产生错误的结论。常见的偏倚可以划分为汇集偏倚、选择偏倚(selection bias)和研究内偏倚三类。其中,选择偏倚是指根据文献纳入标准选择符合要求的文献时产生的偏倚,包括纳入标准偏倚和选择者偏倚等,其主要是由于元分析者有时会根据自己想要得到的结果和已有的知识,有目的地选择或放弃某些文献造成的。研究内偏倚是在资料提取时产生的偏倚,主要包括从纳入的研究中提取的数据信息不准确所致的提取者偏倚,以及对研究质量的评价不恰当产生的研究质量评分偏倚等。最后,也是最难控制的是汇集偏倚问题。
元分析是对以往研究的再次分析,一个好的元分析应包括所有与课题有关的资料。但由于多种原因,不可能收集到同一研究问题的全部资料,这就是汇集偏倚。出现汇集偏倚有多种原因:一是因为研究者检索用词不当或检索策略失误导致漏检或误检文献的查偏倚;二是因为检索文献时限定为某种语言文献
引起的语种偏倚;三是一项研究结果以系列研究形式发表导致的多重发表偏倚,以及最难控制的发表偏倚(publication bias)。发表偏倚是指具有统计学显著意义的研究结果(阳性结果)较无显著性意义的结果(阴性结果)或无效的结果被报告和发表的可能性更大的倾向。出现发表偏倚的原因很多,如杂志编辑部对阴性结果的采用率明显低于阳性结果,编辑的喜好及作者声望,此外还有文件抽屉(filed drawer)问题。文件抽屉是指作者及其资助单位都不愿提供无显著性意义的结果(阴性结果)或无效的结果的一种倾向。当某研究明显预示不能出现阳性结果时,往往会被研究者终止,或者得出阴性结果后,研究者认为不大可能被发表而不撰写论文。这些研究结果就这样被研究者丢在抽屉里不再理会了。由于几乎所有作者、资助单位及杂志编辑部都更愿意报道统计检验显著的结果,因此发表偏倚以及抽屉文件现象究竟有多严重是难以估计的,但如果这两种偏倚存在任何一种,那么仅就发表的文章所做的元分析的结果就有可能夸大效应的作用。
要减少汇集偏倚对元分析结果的影响,首先要全面收集发表和未发表的研究,不过搜索未发表的研究是相当困
难的。其次,要识别和控制发表偏倚和文件抽屉,还可以应用有关统计方法评估各种偏倚对研究结果的影响,如绘制漏斗图(funnel plot)、秩和相关检验、线性回归法、失效安全系数(failsafe N,Nfs)、敏感性分析(sensitivity analysis)等等。其中失效安全系数是一种常用方法,通过它能计算出需要多少个阴性试验的结果才能使结论逆转。
总的来说,元分析目前还不能很好解决潜在的各种偏倚问题,这是元分析的局限,也是进行元分析必须注意的问题。
2.收集到的资料中缺少元分析所需的数据。有许多收集到的文献常由于以下原因而不能被利用:(1)只收集到摘要;(2)文献对最初的研究结果进行的是有选择的报道;(3)文献对原始数据描述不完整。这就使进入元分析的文献大大减少,从而降低了元分析的综合能力。
3.关于各独立研究的质量评价(quality assessment)问题。进行元分析时,各个研究的质量常常是参差不齐的,如果把高质量和低质量的研究合并在一起,并给予相同的权值(weight),就会带来结果的偏倚甚至是错误,因为低质量的研究在结果估计时就可能已经存在错误和无法纠正的偏倚了,因此包含低质量的研究会增加结果变量的变异度和偏倚,增大犯第一或第二类错误的概率。因此,有很多学者都推荐使用各种质量评估办法,并建议将质量评分作为权值以调整结果。但质量评分又增加了主观标准,不同的评价者可能会得出不同的结果,同时可能严重地混淆异质性来源。由于争论的存在,究竟该如何解决这个问题,目前还没有定论。
4.桔子与苹果问题及其控制。对元分析的最尖锐的批评之一就是认为其不应该将研究对象、结果测量指标、实验设计以及测量方式等不同的各项研究所得的结果结合在一起,因为这就好比将桔子与苹果拿来比较,是很难得出正确结论的。目前主要是通过进行异质性检验来缓解这个问题。
weight的几种形式
5.异质性(heterogeneity)的处理问题。资料间存在异质性时,是否进行或怎样进行元分析,还是个没有完全解决的问题。有学者反对将不同研究背景的研究结果进行合并。而目前常用的方法还是通过进一步核实资料的可靠性与处理方式,出异质性的来源,并不轻易剔除异质性文献。有学者推荐用质量评估法评价每个异质成分,如没有研究质量方面的严重缺陷,则可以按相同变量进行分层合并分析,或是利用随机效应模型进行合并分析。还有学者提出不应武断地用某种权重公式来强求结果的合并,应首先尽量使各个研究达到一致,使研究的某些特点不成为元分析结果混杂的来源。目前常用方法是按不

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。