HDFS是Hadoop分布式文件系统,Hbase是分布式非关系数据库,是开源的Not-Only-SQL数据库,它运行和数据都是在Hadoop上。HDFS为Hbase提供了高可靠性的底层存储支持。
Hbase为Hadoop框架当中的结构化数据提供存储服务,是面向列的分布式数据库。HDFS和Hbase都可以处理结构、半结构和非结构数据。
Hbase特点
提供灵活的数据模型
使用表状存储,依赖HDFS
提供表状的面向列的数据存储
针对表状数据的随机读写进行优化
使用key-value操作数据
优化了多次读,以及多次写
HDFS特点
为分布式存储提供文件系统
直接使用文件
使用文件系统和处理框架
针对存储大尺寸的文件进行优化
优化一次写入,多次读取的方式
hbase是一个内存数据库,而hdfs是一个存储空间