基于XML技术的搜索系统的设计与实现
作者:李猛 甘新玲 李永
来源:《中国新技术新产品》2013年第20
        要:为了实现局域网中服务器资源的深度共享与有效检索,主要介绍了基于XML技术的搜索系统的设计与实现过程。系统实现了文本、音频、视频、图片资源的共享,测试表明用户可以通过一台主机即可访问位于局域网中不同服务器上的资源。
        关键词:AJAX;分布式信息检索;RMIdom4j
        中图分类号:TP393 文献标示符:A
        1 系统需求分析
        通过分析得出本系统主要设计目标包括以下六个方面:
        1)系统最终实现多种形式的资源检索,包括文档、音频、视频以及图片。
        2)具备高级检索功能,其中包括按所需词查询,按排除词查询,多词联合查询。
        3)对于用户输入的关键词具备拼音-汉字识别转换功能,例如输入“pingguo”,则搜索结果会按照苹果一词进行检索并显示与之相关的资源。
        4)支持文档预览和流媒体播放功能。用户可以在线浏览文档、播放视频。
使用dom4j解析xml文件        5)后台管理功能。后台管理包括用户管理、服务器管理、资源管理模块。
        6)各服务器上的用户可以对自己提供的资源进行一些基本信息的维护,主要包括资源删除与修改。
        2 系统设计
        2.1设计思想
        局域网内有多台服务器,各服务器之间通过RMI技术进行通信。本系统突破了传统的主从服务器的设计,采用了平等服务器的设计概念。即局域网内的所有主机均为服务器,并且每台服务器均运行维护一个服务器列表。当有新的服务器开启或关闭时,其他服务器会收到相应的注册或注销的指令,以此来维护服务器列表。每台服务器上的资源被索
引到Web容器根目录下的l文件中,本系统通过解析XML文件以获得资源的具体信息。XML解析模块通过采用dom4j技术来实现XML文件的处理,极大提高了搜索的效率。当第一次运行环境时,系统自动检测是否建立全文索引,如果没有系统将自动在后台开辟线程,建立全文索引。全文索引支持docxlspptdocxxlsxpptxtxtwpsdpsrtfpdfziprar共十三种文件格式的全文索引。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。