hbase的特性有哪些第5章￿数据存储
目录
1.大数据储存管理
2.数据库存储管理
存储系统维护和管理
l 数据通常采用文件系统或数据库进行存储。
l 在大数据存储方面也有相应的分布式文件系统和分布式数据库。常见的分布式文件系统
•HDFS 常见的分布式数据库•Hive
•HBase
HDFS不适合低时间延迟数据访问的应用
•HDFS是为高数据吞吐量应用优化的,这样就会造成以高时间延迟为代价,所以HDFS不适合低时间延迟数据访问的应用,例如几十毫秒范围。
HDFS不适合多用户写入和任意修改文件
•目前HDFS文件只有一个writer,而且写操作总是写在文件的末尾,造成HDFS不适合多用户写入和任意修改文件。
HDFS不适合大量小文件存储
•NameNode启动时会将文件系统的元数据加载到内存,因此文件系统所能存储的文件总数受限于NameNode内存容量。
•假设每个文件、目录和数据块的存储信息大约占150字节,如果一百万个文件,且每个文
件占一个数据块,那么至少需要300MB的内存空间。如果存储十亿个文件,那么需要的
内存空间将是非常大的,所以HDFS不适合大量小文件存储。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。