【大数据基础】HBase特点是什么？_大数据

9条回答

2楼 · 2020-10-15 17:47

HBase是一种构建在HDFS之上的分布式、面向列的存储系统。在需要实时读写、随机访问超大规模数据集时，可以使用HBase。

　　尽管已经有许多数据存储和访问的策略和实现方法，但事实上大多数解决方案，特别是一些关系类型的，在构建时并没有考虑超大规模和分布式的特点。许多商家通过复制和分区的方法来扩充数据库使其突破单个节点的界限，但这些功能通常都是事后增加的，安装和维护都和复杂。同时，也会影响RDBMS的特定功能，例如联接、复杂的查询、触发器、视图和外键约束这些操作在大型的RDBMS上的代价相当高，甚至根本无法实现。

　　HBase从另一个角度处理伸缩性问题。它通过线性方式从下到上增加节点来进行扩展。HBase不是关系型数据库，也不支持SQL，但是它有自己的特长，这是RDBMS不能处理的，HBase巧妙地将大而稀疏的表放在商用的服务器集群上。

乜

3楼 · 2020-10-15 21:50

hbase的特点：高可靠性、高性能、面向列、可伸缩的。

HBase – Hadoop Database，是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统，利用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。

HBase是Apache的Hadoop项目的子项目。HBase不同于一般的关系数据库，它是一个适合于非结构化数据存储的数据库。另一个不同的是HBase基于列的而不是基于行的模式

无需指教

4楼 · 2020-10-16 08:26

与2018年夏季天气同样火爆的就属大数据了，作为一个可以敢和太阳肩并肩的新事物，大数据火爆、受人关注，在各个领域都有实际的应用。如今，无论是企业、商家还是个人对于大数据的关注都丝毫没有降低，那么对于大数据这个新兴高科技产物，你对hbase的了解有多少呢？

首先，我们从概念上了解什么是hbase

HBase其实一个缩写，是Hadoop Database的简称，从问世之初，就为了解决用大量廉价的机器高速存取海量数据、实现数据分布式存储提供可靠的方案。

其次、我们从不同角度来人事hbase

1、从功能上来讲

HBase不折不扣是一个数据库，与我们熟悉的Oracle、MySQL、MSSQL等一样，对外提供数据的存储和读取服务。

2、从应用的角度来说

HBase与一般的数据库又有所区别，HBase本身的存取接口相当简单，不支持复杂的数据存取，更不支持SQL等结构化的查询语言；HBase也没有除了rowkey以外的索引，所有的数据分布和查询都依赖rowkey。所以，HBase在表的设计上会有很严格的要求。

3、从架构上讲

HBase是分布式数据库的典范，这点比较像MongoDB的sharding模式，能根据键值的大小，把数据分布到不同的存储节点上，MongoDB根据configserver来定位数据落在哪个分区上，HBase通过访问Zookeeper来获取-ROOT-表所在地址，通过-ROOT-表得到相应.META.表信息，从而获取数据存储的region位置。

最后，我们来分析一下hbase的特点

1、适合大量插入同时key-value查询，例如可以输入一个key查询一个value，还可以输入一组key查询一组value。

2、瓶颈是硬盘的传输速度，因为有大量的插入操作和读出操作，使用SSD SCSI IDE不同的硬盘效率是不同的。

3、适合数据分析。

4、列式数据库会把相同列的数据都放在一块即列为单位存储。当我们查询某一列的时候只需要调出相应的块即可，这样还可以减少很多I/O。

5、如果数据元素间的相似性很高的话可以进行大幅度的压缩，相似度越高压缩比越大，甚至可以压缩到原来十几分之一、上百分之一。即节约了空间又减少了I/O，从而提高性能。

6、hbase只有主键索引，它使用的是LSM（Log Structure Merge）索引，因为hbase所有的修改都是使用追加方式完成的，从数据流上看按照顺序方式写入与日志写入的方式相同，我们又可以认为数据和日志一体化，这又节约了很多空间。

大数据并非一个单独的概念，其内容相对比较驳杂。Hbase作为大数据中的一个主要内容，在如今的企业发展中扮演者更加重要的角色。数据驱动一切的时代，作为一个大数据行业的从业者你怎能不了解hbase，怎能不掌握hbase呢？