HBase是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统。
适合于存储大表数据(表的规模可以达到数十亿行以及数百万列),并且对大表数据的读、写访问可以达到实时级别。
利用Hadoop HDFS(Hadoop Distributed File System)作为其文件存储系统,提供实时读写的分布式数据库系统。
利用ZooKeeper作为协同服务。

HBase与传统的关系数据库的区别主要体现在以下几个方面:
数据索引:关系数据库通常可以针对不同列构建复杂的多个索引,以提高数据访问性能。HBase只有一个索引——行键,通过巧妙的设计,HBase中的所有访问方法,或者通过行键访问,或者通过行键扫描,从而使得整个系统不会慢下来
数据维护:在关系数据库中,更新操作会用最新的当前值去替换记录中原来的旧值,旧值被覆盖后就不会存在。而在HBase中执行更新操作时,并不会删除数据旧的版本,而是生成一个新的版本,旧有的版本仍然保留
可伸缩性:关系数据库很难实现横向扩展,纵向扩展的空间也比较有限。相反,HBase和BigTable这些分布式数据库就是为了实现灵活的水平扩展而开发的,能够轻易地通过在集群中增加或者减少硬件数量来实现性能的伸缩
2025-03-11T08:14:42.png

第04章 HBase技术原理.pptx

学习视频1 链接: https://pan.baidu.com/s/1O1MOIUQktA1yhCo1pZR8jQ 提取码: q52y

学习视频2 链接: https://pan.baidu.com/s/1Acdx-8QO8Bnkgah0qLCijg 提取码: ww2w

仅有一条评论

  1. 看着还不错,可以多来点

添加新评论