实验实训报告
院系:信息工程学院
班级
学号:
姓名:孙纪龙
课程:Hbase大数据快速读写实训实验室名称:Educoder
摘要
HBase 是 BigTable 的开源(源码使用 Java 编写)版本。是 Apache Hadoop 的数据库,是建立在 HDFS 之上,被设计用来提供高可靠性、高性能、列存储、可伸缩、多版本的 NoSQL的分布式数据存储系统,实现对大型数据的实时、随机的读写访问。
HBase 依赖于 HDFS 做底层的数据存储,BigTable 依赖 Google GFS 做数据存储
HBase 依赖于 MapReduce 做数据计算,BigTable 依赖 Google MapReduce 做数据计算
HBase 依赖于 ZooKeeper 做服务协调,BigTable 依赖 Google Chubby 做服务协调
与 Hadoop 一样,HBase 目标主要依靠横向扩展,通过不断增加廉价的商用服务器,来增加计算和存储能力。所以,HBase 是一个通过大量廉价机器解决海量数据的高速存储和读取的分布式数据库解决方案
NoSQL = NO SQL
NoSQL = Not Only SQL:会有一些把 NoSQL 数据的原生查询语句封装成 SQL,比如 HBase 就有 Phoenix 工具
关系型数据库和非关系型数据库的典型代表:
NoSQL:HBase, Redis, MongoDB
RDBMS:MySQL, Oracle, SQL Server, DB2
以下5点是HBase这个NoSQL数据库的要点:
①高并发,可扩展,解决海量数据集的随机实时增删改查
② HBase 本质依然是 Key-Value 数据库,查询数据功能很简单,不支持join 等复杂操作(可通过 Hive 支持来实现多表 join 等复杂操作)
③不支持复杂的事务,只支持行级事务
④ HBase 中支持的数据类型:byte[](底层所有数据的存储都是字节数组)
⑤主要用来存储结构化和半结构化的松散数据。
关键字:Hadoop;HBase;Java;MapReduce
目录
第一章HBase的安装与简单操作 (4)
1.1 简介 (4)
1.2实验项目 (4)
1.3 实验过程 (5)
1.3.1 Hbase数据库的安装 (5)
1.3.2 创建表 (7)
1.3.3 添加数据、删除数据、删除表 (8)hbase为什么查询快
1.4实验结果 (9)
第二章HBase 伪分布式环境搭建 (11)
2.1 简介 (11)
2.2 实验项目 (11)
2.3 实验过程 (12)
2.3.1 伪分布式环境搭建 (12)
2.4实验结果 (15)
第三章Phoenix 入门 (17)
3.1 简介 (17)
3.2 实验项目 (17)
3.3 实验过程 (17)
3.3.1  Phoenix 安装 (17)
3.3.2 Phoenix 基础语法 (20)
3.4 实验结果 (22)
第四章HBase高级特性:过滤器(二) (24)
4.1 简介 (24)
4.2 实验项目 (24)
4.3 实验过程 (25)
4.3.1 常用的专用过滤器 (25)
4.3.2 同时使用多种过滤器 (29)
4.3.3 过滤器总结 (33)
4.4 实验结果 (35)
总结 (37)
参考文献 (38)
第一章HBase的安装与简单操作
1.1 简介
HBase是一个非关系型的面向列(column-oriented)的分布式数据库,基于Java语言实现。HBase是Hadoop开源项目的组成部分,如果需要实时地随机访问超大规模数据集,就可以使用HBase这一Hadoop的重要数据库组件。
HBase特别适合存储大规模稀疏数据集,即大规模数据中仅包含很小的有用信息。例如,从20亿条记录中到前50个最大元素。HBase中的表可以直接作为Hadoop计算任务的输入或输出,并可以直接由Java API或REST API访问。
本次实训我们就来安装HBase数据库,并对HBase进行简单的上手使用。
1.2实验项目
第1关:Hbase数据库的安装
第2关:创建表
第3关:添加数据、删除数据、删除表
1.3 实验过程
1.3.1 Hbase数据库的安装
相关知识:在安装HBase之前你需要先安装Hadoop和Zookeeper,如果你还没有安装可以通过这两个实训来学习:Hadoop安装与配置,Zookeeper安装与配置。本次实训的环境已经默认安装好了Hadoop,接下来我们就开始安装配置HBase吧。
HBase安装:HBase的安装也分为三种,单机版、伪分布式、分布式;我们先来安装单机版。
单机版安装:首先我们去下载好HBase的安装包;
接下来,将压缩包解压缩到你想安装的目录(安装包在平台已经下载好了,在/opt目录下,无需你再进行下载,我们统一将HBase解压到/app目录下):mkdir /app
cd /opt
ulimit -f 1000000
tar -zxvf hbase-2.1. -C /app
安装单机版很简单,我们只需要配置JDK的路径即可,我们将JDK的路径配置到conf/下的hbase-env.sh中。
我们先输入echo $JAVA_HOME来复制JAVA_HOME的路径,以方便之后的配置,如下图1.1所示:
图1.1
接着我们编辑`HBase conf`目录下的`hbase-env.sh`文件,将其中的`JAVA_HOME`指向到你`Java`的安装目录,最后保存设置:
vim /app/hbase-2.1.1/conf/hbase-env.sh
如下图1.2所示:

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。