2019.02
1概述
随着大数据时代的到来,导致信息爆炸,这给人们
工作和生活带来了直接影响。基于大数据环境下的NoSQL 数据库成为了当前互联网中的一部分,NoSQL 数据库借助自身具备的易扩展及高性能等,得到了各个领域的关注和认可。和关系型数据库进行比较,NoSQL 数据库应用频率相对较高。在给数据库应用上,可以提供便利便利条件。基于大数据背景下的NoSQL 数据库查询技术得到了各个领域的关注,下面将进一步阐述和探讨。
2NoSQL 数据库含义
NoSQL 是英文“Not Only SQL”缩写形式,翻译成
中文就是适合应用关系型数据库时就应用关系型数据库,在不适合应用关系型数据库时,可以思考应用其他类型数据库[1]。NoSQL 就是一种非关系型数据库,其数
据在数据库保存方式往往为非关系型的。和传统数据库进行比较,在应用结构化数据方面存在较大差异。原有数据库中表和表之间关联性问题使得其性能陷入瓶颈,NoSQL 数据库借助自身不固定性将这种局限性突破,从而降低数据保存、统计和查询时间性。
3
NoSQL 数据库分析
3.1Redis
Redis 成立于2009年,是key-value 数据库操作较
为简单的一种。Redis 主要是应用C 语言,可以在大部分系统中应用。和其他Key-Value 数据库进行比较,Redis 具有较为灵敏的数据组织,不但可以支持字符串,同时也能支持哈希表等[2]。根据诸多灵活的数据组织,能够让Redis 在各个领域中应用,可以支持更广泛的业务交易中保存需求。3.2Riak
Riak 是一种应用较为广泛的Key-Value 系统,是
由IT 公司研发而成,整体上和Dynamo 存在一定相似性。Riak 具备3点特性,第一点是分布式集;第二点是弹性拓展;第三点是容错性。在应用Riak 时,市场把JavaScript 语言和Erlang 语言当作查询
语言的主要框架,大部分集中各个节点都能被访问,之后从节点中汇集查询记录。如果存在反复查询请求现象,则该过程为重复进行。Riak 也能支持和Solr 索引相同的操作功能,具备了一个能够分析集运行状况的控制模块[3]。3.3HBase
HBase 作为当前公认的一种保存数据库,其发展前
景较为理想,具备诸多特点,例如以列表存数据、水平扩展性等。通过应用HBase ,能够在低价PC 服务器中建立完善的集体系。HBase 主要是在谷歌BigTable 基础上形成的,通常可以和Hadoop 平台结合应用。其分布方式文件系统可以当作保存数据过程中的底层支持系统,可靠性比较强。此外,其借助Zookeeper 实现数据同步,以此提高其应用功能。
4
大数据环境下基于NoSQL 数据库的查询技术
4.1NoSQL 数据库HBase 4.1.1HBase 的访问接口通常情况下,HBase 访问接口方式可以划分以下3种:
(1)Native Java API。其作为一种广泛应用的
访问方式,该访问接口迎合应用在Map-Reduce 模型中,实现大规模数据的核算。
(2)HBase Shell。其作
为一种利用命令的方式进行HBase 处理及控制,是一种能够比较掌握和操作的接口方式。
(3)应用Thrift
作者简介:宋俊苏(1973-),男,硕士,副教授,研究方向:计算机教育教学。收稿日期:2018-11-07
大数据环境下基于NoSQL 数据库的查询技术研究与应用
宋俊苏
(盐城生物工程高等职业技术学校,江苏盐城224051)
要:对NoSQL 数据库含义进行了阐述,从Redis 、Riak 、HBase 3个方面,对NoSQL 数据库进行了分析,并以此为依据,提出了大数据环境下基于NoSQL 数据库的查询技术。关键词:大数据环境;NoSQL ;数据库;查询技术
76
序列化方式的Thrift Gateway。其能够提供诸多语言,适合应用在不同体系结构中,用于HBase表格信息的读取。
4.1.2HBase数据模型
数据模型可以划分为逻辑数据模型及物理数据模型两种。其中,Row Key、Time Stamp以及Column是HBase表格中主要应用的3种记录类型,在这3种类型中,Row Key是HBase中主要标识[4]。Time Stamp则是时间戳,对各个数据操作情况及时间段进行统计,所有数据库update操作都可以利用时间戳的方式进行标识,并且每次update都会形成一种新的版本,但是HBase仅能保存小数版本。用户可以通过获取和某一个时间想靠近的版本,或者一次性获取所有版本。保存数据表格中的各项数据记录都可以由两部分内容建立而成,一个是可以实现排序的主要数据,另一个是由诸多的列组成的数据。单独指派一数据列主要是借助<Column Family>:<label>进行,其中对Column Family含义界定以及修改操作方式和数据库DDL操作存在一定相似之处,但是不用定义就能够直接运用在label。除此之外,Column Family还具备物理保存及读写等功能,可以较为便利的让Column Family数据在物理保存中进行集合,所以该特性在业务设计中应用较为广泛。
4.1.3HBasex存储方式
Hbase系统主要是由单个Master节点及诸多Region server节点建立而成,其中,整个集管理者作为
Mas⁃ter节点,诸多Region server集各自管理界分配对应的Region。Hbase通常需要和ZooKeeper一同应用,其中,ZooKeeper集的目的在于对整个Hbase系统运行情况进行监管,确保集中各个数据都能只有一个Master节点,记录一个Master节点地址数据,并且把Region server节点运行情况传递给Master节点[5]。4.2DQMoH模型总体架构与功能设计
4.2.1数据流管理层
由于数据源类型种类繁多,可以为常规结构化数据,也可以是来源于Web服务器的非结构化数据,各个类型的数据在导入环节中,存在诸多差异内容,同时填入到HBase的方式也会大不相同。因此,重点阐述数据处理层(Data Processing Layer,DPL)。数据处理层自身具备一个简易的程序接口,数据源能够对这些接口进行调节,把数据传入到HBase,数据处理层存在的祖尧差异在于对数据接入方式进行了改变,从而实现了数据导入效率的提高。数据处理层的内部解析如图1所示。
4.2.2存储层
通常情况下,储存层一般是根据组合条件设定对应的索引体系,从而减少网络宽带,截止到目前,二级索引技术对多维查询支持效果并不理想,因此,根据HBase数据库系统需求,设计了能够多为查询的二级索引体系。此外,根据Solr高效检索功能,设计出一种能够实现HBase与Solr充分结合的查询体系。
4.2.3查询层
一般来说,查询层主要由3部分组成,其中包含了查询解析、热点缓存及查询结果优化。针对热点查询,查询结构优化设定了一个智能计算器,C代表具备相同结果的查询数量,提供阙值T,也就是如果查询数量由C更改成阙值T,把查询结果填入到热点缓存中,之后再进行查询时,能够直接在缓存中进行查,提高查询质量和效率[6]。在进行缓存设计时,应该保证设计的合理性,留存更多空间由于查询解析及结果优化。针对热点缓存中出现的新旧数据现象,可以应用LRU机制进行处理。
5结语
基于大数据背景下的NoSQL数据库数据查询技术给数据库今后发展提供了良好条件,在满足大数据时代发展需求的同时,还能实现互联网数据的访问和应用,从而有效地提高了大数据背景下数据查询效率和水平。
参考文献
[1]杨晓雁,甘琳梅.基于Hadoop的NoSQL非关系型
数据库安全研究[J].微型电脑应用,2018,34 (12):43-45.
图1DPL 的内部解析
结构化数据
非数据化结构
DPL
(下转第116页
)
77
2019.02
2019.02
[2]冯德伦.一种以NoSQL 数据库为核心的工业历史数
据存储方案[J].自动化与仪器仪表,2018,(08):
60-63.
[3]沈洋.NoSQL 数据库中的空间大数据分布式存储实
现研究[J].科技风,2018,(23):224.
[4]仝野.基于NoSQL 数据库的系统设计与开发[D].
南京邮电大学,2018.
[5]龚畅.大数据下的NoSQL 数据库技术分析[J].信
息记录材料,2018,19(06):118-119.[6]梁凡.NoSQL 数据库在大数据查询技术中的应用探
析[J].电脑迷,2016,(07):151.
用户。同时,人工智能算法需要对获取的信息进行反复清洗,建立一套具有智能化的图书馆服务平台,就可以做到根据每个读者的兴趣爱好实现自动调取以满足读者需求[4]。
4.2构建读者服务模型
当前,仍有部分图书馆的服务是被动的,无法满足
用户需求。其主要原因就是图书馆没有建立一套读者分析平台,不能从根本上掌握读者的需要,就使得个性化服务只是一句口号,而没有落地生根。基于人工智能的信息服务便是要根据读者的实际需求,在获取用户的实际需求之后构建读者服务模型,全面掌握读者需求,然后对这些行为依据算法为用户构建出关于读者的行为习惯、学习偏好等具体“个性画像[5]”。4.3提升读者服务感受
人工智能与读者需要建立起二者交流的桥梁。虽然
图书馆在人工智能技术出现后服务效率得到了明显改善,但人工智能为读者服务时,人与机器之间相互信赖的问题也应当得到人们关注,如何建立馆员与机器、读者与机器、馆员与读者这三者的互相交叉关系,才是发挥人工智能的根本所在。平时工作中图书馆应提前做好程序预警功能,在机器出现故障时及时处理,以高效的工作状态解决机器与读者和馆员的工作矛盾。读者与馆员应在平时积极交流,时刻站在读者的角度思考业务,这样才能更好地掌握用户需求,在平台建设过程中更好地发挥人工智能的自我学习功能,进一步提升工作质量[6]。
5结语
从未来的发展趋势来看,图书馆与人工智能的牵
手是大势所趋。为了加快这一进程,图书馆馆员要及时转变固有的工作思路,要积极将现有工作与人工智能、互联网技术结合。计算机等新兴技术日新月异,发展速度极为迅速,这就要求每一位馆员要抓紧时代前进的脚步,学懂、弄通新技术和新方法,为读者和用户提供更加高效的服务,为中国的图书馆事业贡献自己的力量。
参考文献
[1]刘柏嵩,豆洪青,杨春艳.从数字化到数据化———
关于“图书馆大脑”的思考[J].数字图书馆论坛,
2018,(3):2-6.
[2]茆意宏.人工智能重塑图书馆[J].大学图书馆学
报,2018,(2):11-17.
[3]唐步龙.人工智能时代的图书馆发展思考[J].图
书与情报,2017,(6):64-69.
[4]勾丹,崔淑贞.智慧图书馆的智慧服务模式及其实
现[J].情报探索,2016,(3):112-115.
[5]张晴.“以人为本”服务理念下的智慧图书馆发展
策略[J].图书情报导刊,2016,(6):15-17.[6]张兴旺.从AlphaGo 看人工智能给图书馆带来的影
响与应用.图书与情报,2017,(3):43-50.图2基于智能过滤的信息服务系统
用户
登录
图书馆服务系统
信息检索
动态资源库
信息推送
信息定制
需求推送
信息筛选
动态调取
信息检索redis是nosql数据库吗
(上接第77页)
116

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。