信息检索技术在现代社会的发展与应用
摘 要:在现代社会,全球信息化的风起云涌卷席着世界的每一个角落。随着计算机、数字技术及网络技术在信息领域的广泛应用,各种文献信息的电子化、数字化给传统的信息管理带来了巨大的影响,信息检索技术在现代社会得到飞跃地发展与广泛地应用。
关键词:现代社会;信息检索技术;应用
自20世纪90年代以来,计算机、数字技术及网络技术在信息领域的广泛应用,人类从此进入了一个崭新的高技术的现代社会。现代社会是一个信息化的社会,在技术变革和信息爆炸的时代中,不管是学术研究,工作还是日常生活中,每个个体都面临着丰富繁杂的信息选择,都必须了解信息需求,知道如何及何时借助各种工具进行信息检索、评价和有效利用。人们
对信息的需求越来越大,对信息的传递速度要求越来越快,以及各种文献信息的电子化、数字化给传统的信息管理带来了巨大的影响,使传统的相对集中和规范的文献数据库及其检索系统面临挑战,因此从不同方面促使信息检索技术在现代社会得到飞跃地发展与广泛地应用。本文主要论述了信息检索技术在现代社会的发展与应用。
1、基本概念
1.1、信息:信息就是经过加工后的数据,它对接受者的决策或行为有现实或潜在的价值。通俗地讲,信息就是有用的消息。广义的说,信息就是消息。
1.2、信息检索:信息检索是目前热门的一个领域,其历史已是由来以久,早期,在图书馆领域,就有文献检索,后来,随着计算机的出现,信息技术的飞速发展,便出现了现在的xml技术的主要应用
信息检索。信息检索(Information Retrieval,IR),是对信息项进行表示,存贮,组织和存取。现代信息检索是指信息用户在存在信息需求时的主观能动性,表现在信息检索能力上,信息意识强,信息获取的能力就强。
1.3、信息检索技术:信息检索技术是指利用现代信息检索系统,如联机数据库、光盘数据库和网络数据库检索有关信息而采用的相关技术,主要有布尔检索、词位检索、截词检索和限制检索。信息检索技术能根据用户的查询返回合适的信息,它在一定程度上解决了信息过载的问题。
2、信息检索技术的发展
2.1、信息检索的历史追踪:信息检索起源于图书馆的参考咨询和文摘索引工作,从19世纪
下半叶首先开始发展,至20世纪40年代,索引和检索成已为图书馆独立的工具和用户服务项目。信息检索经历了手工检索、计算机检索到目前网络化、智能化检索等多个发展阶段。
2.2、目前,信息检索已经发展到网络化和智能化的阶段。信息检索的对象从相对封闭、稳定一致、由独立数据库集中管理的信息内容扩展到开放、动态、更新快、分布广泛、管理松散的Web内容;信息检索的用户也由原来的情报专业人员扩展到包括商务人员、管理人员、教师学生、各专业人士等在内的普通大众,他们对信息检索从结果到方式提出了更高、更多样化的要求。适应网络化、智能化以及个性化的需要是目前信息检索技术发展的新趋势。以及互联网规模的急剧增大以及存储系统的规模日益增加推动了现有的信息检索技术的发展。
以下列举了现代社会热门的信息检索技术:
以下列举了现代社会热门的信息检索技术:
◆ 智能检索或知识检索
传统的全文检索技术基于关键词匹配进行检索,往往存在查不全、查不准、检索质量不高的现象,特别是在网络信息时代,利用关键词匹配很难满足人们检索的要求。智能检索利用分词词典、同义词典,同音词典改善检索效果,比如用户查询“计算机”,与“电脑”相关的信息也能检索出来;进一步还可在知识层面或者说概念层面上辅助查询,通过主题词典、上下位词典、相关同级词典,形成一个知识体系或概念网络,给予用户智能知识提示,最终帮助用户获得最佳的检索效果,比如用户可以进一步缩小查询范围至“微机”、“服务器”或扩大查询至“信息技术”或查询相关的“电子技术”、“软件”、“计算机应用”等范畴。另外,智能检索还包括歧义信息和检索处理。
◆ 知识挖掘
目前主要指文本挖掘技术的发展,目的是帮助人们更好的发现、组织、表示信息,提取知识,满足信息检索的高层次需要。 知识挖掘包括摘要、分类(聚类)和相似性检索等方面。
自动摘要就是利用计算机自动地从原始文献中提取文摘。在信息检索中,自动摘要有助于用户快速评价检索结果的相关程度,在信息服务中,自动摘要有助于多种形式的内容分发,
传统的全文检索技术基于关键词匹配进行检索,往往存在查不全、查不准、检索质量不高的现象,特别是在网络信息时代,利用关键词匹配很难满足人们检索的要求。智能检索利用分词词典、同义词典,同音词典改善检索效果,比如用户查询“计算机”,与“电脑”相关的信息也能检索出来;进一步还可在知识层面或者说概念层面上辅助查询,通过主题词典、上下位词典、相关同级词典,形成一个知识体系或概念网络,给予用户智能知识提示,最终帮助用户获得最佳的检索效果,比如用户可以进一步缩小查询范围至“微机”、“服务器”或扩大查询至“信息技术”或查询相关的“电子技术”、“软件”、“计算机应用”等范畴。另外,智能检索还包括歧义信息和检索处理。
◆ 知识挖掘
目前主要指文本挖掘技术的发展,目的是帮助人们更好的发现、组织、表示信息,提取知识,满足信息检索的高层次需要。 知识挖掘包括摘要、分类(聚类)和相似性检索等方面。
自动摘要就是利用计算机自动地从原始文献中提取文摘。在信息检索中,自动摘要有助于用户快速评价检索结果的相关程度,在信息服务中,自动摘要有助于多种形式的内容分发,
如发往PDA、手机等。相似性检索技术基于文档内容特征检索与其相似或相关的文档,是实现用户个性化相关反馈的基础,也可用于去重分析。自动分类可基于统计或规则,经过机器学习形成预定义分类树,再根据文档的内容特征将其归类;自动聚类则是根据文档内容的相关程度进行分组归并。自动分类(聚类)在信息组织、导航方面非常有用。
◆ 异构信息整合检索和全息检索
在信息检索分布化和网络化的趋势下,信息检索系统的开放性和集成性要求越来越高,需要能够检索和整合不同来源和结构的信息,这是异构信息检索技术发展的基点,包括支持各种格式化文件,如TEXT、HTML、XML、RTF、MS Office、PDF、PS2/PS、MARC、ISO2709等处理和检索;支持多语种信息的检索;支持结构化数据、半结构化数据及非结构化数据的统一处理;和关系数据库检索的无缝集成以及其他开放检索接口的集成等。所谓“全息检索”的概念就是支持一切格式和方式的检索,从目前实践来讲,发展到异构信息整合检索的层面,基于自然语言理解的人机交互以及多媒体信息检索整合等方面尚有待取得进一步突破。
另外,从工程实践角度,综合采用内存和外部存储的多级缓存、分布式集和负载均衡技术也是信息检索技术发展的重要方面。
◆ 异构信息整合检索和全息检索
在信息检索分布化和网络化的趋势下,信息检索系统的开放性和集成性要求越来越高,需要能够检索和整合不同来源和结构的信息,这是异构信息检索技术发展的基点,包括支持各种格式化文件,如TEXT、HTML、XML、RTF、MS Office、PDF、PS2/PS、MARC、ISO2709等处理和检索;支持多语种信息的检索;支持结构化数据、半结构化数据及非结构化数据的统一处理;和关系数据库检索的无缝集成以及其他开放检索接口的集成等。所谓“全息检索”的概念就是支持一切格式和方式的检索,从目前实践来讲,发展到异构信息整合检索的层面,基于自然语言理解的人机交互以及多媒体信息检索整合等方面尚有待取得进一步突破。
另外,从工程实践角度,综合采用内存和外部存储的多级缓存、分布式集和负载均衡技术也是信息检索技术发展的重要方面。
3、信息检索技术的应用
信息检索技术有两大应用领域,一个是传统的图书情报检索,如图书馆信息系统,另一个就是互联网信息检索。
随着1946年世界上第一台电子计算机问世,计算机技术逐步走进信息检索领域,并与信息检索理论紧密结合起来;脱机批量情报检索系统、联机实时情报检索系统相继研制成功并商业化,20世纪60年代到80年代,在信息处理技术、通讯技术、计算机和数据库技术的推动下,信息检索在教育、军事和商业等各领域高速发展,得到了广泛的应用。Dialog国际联机情报检索系统是这一时期的信息检索领域的代表,至今仍是世界上最著名的系统之一。信息检索技术逐步向应用需求靠拢,从而真正发展成为一项对整个信息产业举足轻重的基础技术。
当今,信息正向着更加集中和更加分布这两个极端快速发展:一方面出现了很多积聚大量信息,并从信息服务中获利的公司;另一方面,先进的信息发布手段,使每个人都有可能既是信息的接受者,又是信息的发布者,从而使信息的总量以几何级数增长。在这种或者利用信息获得成功,或者被信息湮没的情况下,人们对高速度、高质量的信息检索的需求就变得空前迫切,因而许多信息检索技术应用使我们能在信息的海洋中捞到所需“珍宝”的愿望得实现。
在现代社会,检索技术在不同的领域得到了广泛应用的表现有:基于内容的图像检索技术在农业信息化中的应用,基于Web服务和信息检索技术的信息整合方案的应用,基于WEB页的教育技术资源的检索的应用,网络信息检索技术在造纸工业中的应用,Web Service和信息检索技术在企业信息化中的应用等,以及XML检索技术可广泛应用于科学数据的存储和交换,电子商务,电子政务,数字图书馆以及使用WEB程序的各个领域等。
特别是个性化的信息检索技术,无论是从技术的角度还是应用的角度,改善信息检索与提供信息的质量。例如其关键技术——智能代理Agent。智能代理又称智能体,它是在用户没有明确具体要求的情况下,根据用户需要,代替用户进行各种复杂的工作,如信息查询、筛选及管理,并能推测用户的意图,自主制定、调整和执行工作计划。它使用自动获得的领域模型(如web知识、信息处理、与用户兴趣相关的信息资源、领域组织结构)、用户模型 (如用户背景、兴趣、行为、风格)知识进行信息搜集、索引、过滤(包括兴趣过滤和不良信息过滤),并自动地将用户感兴趣的、对用户有用的信息提交给用户。智能代理具有了不断学习、适应信息和用户兴趣动态变化的能力,从而提供个性化的服务。从用户的角度来看,采用智能代理技术的应用服务系统在不间断地为他们工作,用户只在必要时才需要参与。和传统网络服务的点击—反馈方式比较,这种方式使用户大幅度提高了网络使用的效率。智能代理就是能自动执行用户委托的任务的计算实体,它有着极其广泛的应用,如邮件过滤代理、信息获取代理、桌面自动代理等。
4、总结与讨论
21世纪是知识经济时代。这是人类自农业革命、工业革命以来进行的第三次产业革命。其基本特征是信息的数字化和网络化、经济的全球化。随着Internet的迅猛发展,检索方式必然向着网络检索的方向发展,多种技术的整合和检索手段的智能化将使网络变得更加丰富多彩,信息用户范围将得到空前扩大。科学技术的发展具有连续性和继承性,进行信息检索十用户再创造以及避免重复研究,少走或不走弯路。而且信息检索是研究工作的基础和必要环节,成功的信息检索无疑会节省研究人员的大量时间,使其能用更多的时间和精力进行科学研究。还有,掌握了信息检索的方法便可以无师自通,到一条吸收和利用大量新知识的捷径,把大家引导到更广阔的知识领域中去,对未知世界进行探索。是谓“教人以渔”,才能终身受用无穷。信息检索技术在现代社会的发展与应用在新世纪是人类进步与发展的一个亮点。
参考文献 :
[1] Chuck Boyer/黄玠华译.《IBM知识管理经验谈(二):信息检索技术的发展》. 2003-
[1] Chuck Boyer/黄玠华译.《IBM知识管理经验谈(二):信息检索技术的发展》. 2003-
12-14.
[2] 张宏斌,朱明富,陈德军 . 智能化搜索引擎技术的研究进展,信息与控制.2003,6 .
[2] 张宏斌,朱明富,陈德军 . 智能化搜索引擎技术的研究进展,信息与控制.2003,6 .
[3] 张福泉.《信息检索的黄金时代》. 闽江学院现代教育技术中心 .
[4] 孙建军. 《信息检索技术》.科学出版社.2004年12月.
[5] 贺志刚.现代信息检索.2003-8-1.
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论