专题文献的计量学研究方法
怎么大批量数据核对差异【作 者】陈文爱/杨璐/赵瑞刚
量化分析是一种重要的研究方法,文献计量学是进行文献定量研究的重要手段,日趋成熟的理论和方法已广泛应用于期刊研究、学科分析、文献质量评价、科学生产率研究等等方面。应用文献计量学方法对特定研究机构发表论文进行分析,通过专业分布体系、学科发展状况、科研成果分布、科学生产率研究,对揭示研究机构科学生产的组织结构、交流活动情况、学术水平及其发展变化规律提供了量化分析的手段和技术。特别是随着信息技术和互联网的迅速发展,一批全文期刊数据库研制成功,对文献进行全方位的搜集、整理和分析研究的条件已经成熟。事实上,采用数据库技术对文献进行搜集、整理、检索和利用是最为有效的途径和方法[1]。利用文献计量学的理论和方法,对选定的专题文献进行计量学分析,揭示该专题的发展势
态、影响力、文献特点,已经成为图书馆学、情报学工作者进行文献计量学应用研究的重要方向,受到越来越多的重视[2]。
1 材料与方法
对研究机构所发表的文献进行计量学研究,需要确定样本,建立统计指标,使用数学和统计学工具处理数据,进行归纳和总结。根据研究和评价的需要,选定进行研究的专题,选择检索词,制定检索策略。以国内公开发行的期刊、内部出版物以及其他类型文献资料为对象,以网络数据库和图书馆、文献中心为文献源,通过互联网在线检索、计算机光盘检索、人工查等方式获得著者、著者数、文献量、著者单位、著者所属地区、著作年代、文献源、文献内容等原始数据。建立原始数据Access数据库,对原始数据进行检查校对,以确保文献数据的唯一性和准确性。为便于计量分析,从基本数据库演化出一系列辅助字段和辅助数据表,最后把合格数据分离出来另建数据库,作为专题文献统计分析的基础样本[3]。
1.1 样本源
样本源的选择和确定,需要考虑所选定研究机构的组织结构和科研特点。选择样本源的方法有三种:一是以研究机构发表论文的内部统计数字为样本,二是以各类数据库或检索工具为样本源;三是以研究机构出版的刊物为样本源。实际应用中一般从数据库或检索工具获得
1 材料与方法
对研究机构所发表的文献进行计量学研究,需要确定样本,建立统计指标,使用数学和统计学工具处理数据,进行归纳和总结。根据研究和评价的需要,选定进行研究的专题,选择检索词,制定检索策略。以国内公开发行的期刊、内部出版物以及其他类型文献资料为对象,以网络数据库和图书馆、文献中心为文献源,通过互联网在线检索、计算机光盘检索、人工查等方式获得著者、著者数、文献量、著者单位、著者所属地区、著作年代、文献源、文献内容等原始数据。建立原始数据Access数据库,对原始数据进行检查校对,以确保文献数据的唯一性和准确性。为便于计量分析,从基本数据库演化出一系列辅助字段和辅助数据表,最后把合格数据分离出来另建数据库,作为专题文献统计分析的基础样本[3]。
1.1 样本源
样本源的选择和确定,需要考虑所选定研究机构的组织结构和科研特点。选择样本源的方法有三种:一是以研究机构发表论文的内部统计数字为样本,二是以各类数据库或检索工具为样本源;三是以研究机构出版的刊物为样本源。实际应用中一般从数据库或检索工具获得
样本,并使用内部统计数据和研究机构出版物的统计数据进行核对、补充,以期获得最完整数据。《中国学术期刊全文数据库》是目前世界上最大的连续动态更新的中国期刊全文数据库,收录了1979年至今国内约7700种综合期刊与专业特期刊的全文数据,数据量大,更新快,使用简便,准确率高,是目前国内文献计量学研究主要采用的样本源。
1.2 统计方法
统计指标主要包括文献数量、类型、学科、引文、著者数、主题词、著者单位等。样本源选定后,需要考虑研究目的和机构的研究范畴、性质、特、实力等等因素,选择研究机构一定时期内发表的论文为样本,建立统计指标体系,并进行各项指标的数据统计工作。
应用统计学抽样统计、表格法、折线图法对文献进行专项分析比较,相对于传统研究方法更加便捷客观。这些方法的介入使文献结构以及发展变化方面的信息清晰地显示出来。在具体应用中统计学中有着诸多的对于情报分析尤其是对文献揭示具有重要意义的统计方法,合理地对这些方法加以运用将有利于文献分析从定性分析向定量分析、由静态分析向动态分析的转变。
2 分析与讨论
按照评价方向,做出专题文献的年代分布、著者分布、地区和单位分布、文献原分布、文
1.2 统计方法
统计指标主要包括文献数量、类型、学科、引文、著者数、主题词、著者单位等。样本源选定后,需要考虑研究目的和机构的研究范畴、性质、特、实力等等因素,选择研究机构一定时期内发表的论文为样本,建立统计指标体系,并进行各项指标的数据统计工作。
应用统计学抽样统计、表格法、折线图法对文献进行专项分析比较,相对于传统研究方法更加便捷客观。这些方法的介入使文献结构以及发展变化方面的信息清晰地显示出来。在具体应用中统计学中有着诸多的对于情报分析尤其是对文献揭示具有重要意义的统计方法,合理地对这些方法加以运用将有利于文献分析从定性分析向定量分析、由静态分析向动态分析的转变。
2 分析与讨论
按照评价方向,做出专题文献的年代分布、著者分布、地区和单位分布、文献原分布、文
献内容分布和分析。
2.1 文献年代分布
文献数量的年代分布可以从一个方面说明专题的研究进展程度[4]。文献计量学研究中一般将专题文献的数量按年度序列排序,并采用时间段的方式描述文献数量的变化关系。在相同的时间区域文献量的分布具有差异,能够反映专题研究的发展过程,并划分专题研究的活跃势态,因此,专题研究时间分布区间跨度越大差异就越明显。专题文献量在年代上分布呈现明显差异的,一般可以根据文献量递增的趋势按照三个时间段进行统计。例如第四军医大学教师杨瑞华等对国内微量元素与脑功能关系进行14年文献计量学研究,根据文献量在年代上分布情况,将国内微量元素与脑功能关系概括为起步、活跃、成熟阶段,从文献计量学的角度定量描述了国内微量元素与脑功能关系专题研究的发展历程[5],对开展专题发展过程研究极具启示作用。
2.2 文献著者分布
统计著者发表专题相关文献的数量并进行对比和分析,可以了解该研究领域的主要著者和核心著者,并可以进一步通过了解著者的研究进度确立其在相关领域的重要作用和影响力,通过关注其研究方向和重点,从而了解到其在整个学科发展所起到的引领和带头作用,
2.1 文献年代分布
文献数量的年代分布可以从一个方面说明专题的研究进展程度[4]。文献计量学研究中一般将专题文献的数量按年度序列排序,并采用时间段的方式描述文献数量的变化关系。在相同的时间区域文献量的分布具有差异,能够反映专题研究的发展过程,并划分专题研究的活跃势态,因此,专题研究时间分布区间跨度越大差异就越明显。专题文献量在年代上分布呈现明显差异的,一般可以根据文献量递增的趋势按照三个时间段进行统计。例如第四军医大学教师杨瑞华等对国内微量元素与脑功能关系进行14年文献计量学研究,根据文献量在年代上分布情况,将国内微量元素与脑功能关系概括为起步、活跃、成熟阶段,从文献计量学的角度定量描述了国内微量元素与脑功能关系专题研究的发展历程[5],对开展专题发展过程研究极具启示作用。
2.2 文献著者分布
统计著者发表专题相关文献的数量并进行对比和分析,可以了解该研究领域的主要著者和核心著者,并可以进一步通过了解著者的研究进度确立其在相关领域的重要作用和影响力,通过关注其研究方向和重点,从而了解到其在整个学科发展所起到的引领和带头作用,
对进一步了解专题研究的现状及其未来发展具有重要的意义。
同时,常用文献著者数分布来描述科技论文著者的合作现象。文献著者数分布指单位文献著者数量。它是考察科学智力合作、科学劳动组织的重要指标,在衡量某专业或专题研究能力的诸项指标中,科研队伍集团研究能力是社会科研能力的主要内容[6]。
2.3 文献地区和单位分布
文献地区分布指文献著者从事研究的地区(省、市、自治区)所拥有的文献量分布。文献的地区分布可以反映国内该专题研究工作的分布情况,依据该分布,可以确定进行该专题研究的中心地区及外围地区。
文献单位分布指开展某专题研究的单位所拥有的文献数量,文献在单位分布中呈现集中——分散的势态。按照文献单位分布,能确定从事该专题研究的主要机构。
2.4 文献源分布
文献源分布是指专题文献在不同期刊上的分布情况。文献源分布结果符合科技文献的集中——分散规律,即少部分文献集中在少量刊物中,大部分文献分散在大量刊物中。
文献计量学方法通常可以从文献源分布发现专题研究主题的分布领域,提示专题文献的核心期刊,为相关文献的搜集整理提供可以借鉴的依据。因此,比较专题研究文献源分布的差
同时,常用文献著者数分布来描述科技论文著者的合作现象。文献著者数分布指单位文献著者数量。它是考察科学智力合作、科学劳动组织的重要指标,在衡量某专业或专题研究能力的诸项指标中,科研队伍集团研究能力是社会科研能力的主要内容[6]。
2.3 文献地区和单位分布
文献地区分布指文献著者从事研究的地区(省、市、自治区)所拥有的文献量分布。文献的地区分布可以反映国内该专题研究工作的分布情况,依据该分布,可以确定进行该专题研究的中心地区及外围地区。
文献单位分布指开展某专题研究的单位所拥有的文献数量,文献在单位分布中呈现集中——分散的势态。按照文献单位分布,能确定从事该专题研究的主要机构。
2.4 文献源分布
文献源分布是指专题文献在不同期刊上的分布情况。文献源分布结果符合科技文献的集中——分散规律,即少部分文献集中在少量刊物中,大部分文献分散在大量刊物中。
文献计量学方法通常可以从文献源分布发现专题研究主题的分布领域,提示专题文献的核心期刊,为相关文献的搜集整理提供可以借鉴的依据。因此,比较专题研究文献源分布的差
异性,按照刊载专题文献数量的多少,将文献源期刊确认为该专题研究的核心期刊和相关期刊。
2.5 文献内容分布
文献内容分布是专题文献计量学分析中的主要部分,因为对文献主题内容进行分析可以揭示学术研究发展的基本特点、动向和发展规律[7]。因此要对专题文献的主要内容进行充分分析、综合。当然这已经不属于文献计量学的研究范畴了。
论文内容的年代分布则说明了专题研究的发展方向和研究领域的拓展情况。
2.6 文献引文量分布
引文量分布指单位文献引用相关文献的数量。在文献计量分析中,引文量被用来研究科学论文引证关系中文献被利用的深度和广度,也用来揭示科研工作者吸收文献情报能力的大小[8]。在图书馆学情报学工作实践中,文献计量研究为专题文献分析提供了技术帮助,不断完善的分析方法正在成为科学工作者和图书情报学工作者的有效工具。
文献计量分析技术作为一门新兴学科,是情报学、图书馆学理论研究以及工作在第一线的图书情报人员在长期实践的基础上产生的,显示出强大的生命力。这种不断创新的研究方法,在社会科学领域中的其他学科中,如经济学和社会学等有了更广泛的应用。
2.5 文献内容分布
文献内容分布是专题文献计量学分析中的主要部分,因为对文献主题内容进行分析可以揭示学术研究发展的基本特点、动向和发展规律[7]。因此要对专题文献的主要内容进行充分分析、综合。当然这已经不属于文献计量学的研究范畴了。
论文内容的年代分布则说明了专题研究的发展方向和研究领域的拓展情况。
2.6 文献引文量分布
引文量分布指单位文献引用相关文献的数量。在文献计量分析中,引文量被用来研究科学论文引证关系中文献被利用的深度和广度,也用来揭示科研工作者吸收文献情报能力的大小[8]。在图书馆学情报学工作实践中,文献计量研究为专题文献分析提供了技术帮助,不断完善的分析方法正在成为科学工作者和图书情报学工作者的有效工具。
文献计量分析技术作为一门新兴学科,是情报学、图书馆学理论研究以及工作在第一线的图书情报人员在长期实践的基础上产生的,显示出强大的生命力。这种不断创新的研究方法,在社会科学领域中的其他学科中,如经济学和社会学等有了更广泛的应用。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论