# HBase的概述和安装方法 ## 一、HBase概述 ### 1. 什么是HBase HBase是一个开源的、分布式的、面向列的NoSQL数据库,基于Google BigTable设计思想构建,运行在Hadoop文件系统(HDFS)之上。作为Apache Hadoop生态系统的重要组成部分,它能够提供海量结构化数据的随机实时读写能力。 主要特性包括: - **高可靠性**:通过HDFS的多副本机制保障数据安全 - **高扩展性**:支持PB级数据存储,可线性扩展集群节点 - **强一致性**:所有读写操作都保证原子性 - **自动分片**:表数据自动分区存储在RegionServer上 ### 2. 核心架构 #### 1) 核心组件 - **HMaster**:负责元数据管理和负载均衡 - **RegionServer**:实际数据存储和读写服务节点 - **ZooKeeper**:集群协调服务,维护元信息和故障检测 #### 2) 数据模型 - 采用四维数据模型:`行键(RowKey) + 列族(Column Family) + 列限定符(Qualifier) + 时间戳(Timestamp)` - 支持多版本数据存储,默认保留3个版本 ### 3. 典型应用场景 - 实时查询系统(如用户画像) - 时序数据存储(如IoT设备数据) - 消息类应用(如微信消息记录) - 作为Hadoop生态的数据仓库入口 ## 二、HBase安装方法 ### 1. 环境准备 #### 基础要求 - JDK 1.8+(建议OpenJDK 8) - Hadoop 2.7+(单机模式可不安装) - ZooKeeper 3.4+(HBase内置版本可满足测试需求) - SSH免密登录(分布式部署需要) #### 硬件建议 - 内存:≥8GB(生产环境建议16GB+) - 磁盘:SSD优先,预留足够空间(数据量3倍以上) ### 2. 单机模式安装 #### 步骤1:下载解压 ```bash wget https://archive.apache.org/dist/hbase/2.4.11/hbase-2.4.11-bin.tar.gz tar -zxvf hbase-2.4.11-bin.tar.gz -C /opt/ cd /opt/hbase-2.4.11
编辑~/.bashrc
添加:
export HBASE_HOME=/opt/hbase-2.4.11 export PATH=$PATH:$HBASE_HOME/bin
conf/hbase-env.sh
:export JAVA_HOME=/usr/lib/jvm/java-8-openjdk export HBASE_MANAGES_ZK=true # 使用内置ZooKeeper
conf/hbase-site.xml
:<configuration> <property> <name>hbase.rootdir</name> <value>file:///tmp/hbase-data</value> </property> <property> <name>hbase.zookeeper.property.dataDir</name> <value>/tmp/zookeeper</value> </property> </configuration>
start-hbase.sh hbase shell # 进入交互命令行 > create 'test', 'cf' # 测试建表 > list # 查看表列表
修改hbase-site.xml
:
<property> <name>hbase.cluster.distributed</name> <value>true</value> </property> <property> <name>hbase.rootdir</name> <value>hdfs://localhost:9000/hbase</value> </property>
http://localhost:16010
regionservers
文件添加所有节点主机名hbase-site.xml
:<property> <name>hbase.zookeeper.quorum</name> <value>zk1.example.com,zk2.example.com,zk3.example.com</value> </property> <property> <name>hbase.zookeeper.property.clientPort</name> <value>2181</value> </property>
start-hbase.sh
jps
应出现HMaster/RegionServerlogs/hbase-*-master-*.log
hbase-site.xml
中的hbase.master.port
等配置hdfs dfs -chmod -R 777 /hbase
conf/hbase-env.sh
中的HBASE_HEAPSIZE
注意:生产环境建议使用专业管理工具(如Ambari)进行集群部署和管理,并配置适当的备份策略。 “`
该文档共约1150字,包含HBase的核心概念说明和三种典型安装方式的详细步骤,采用Markdown格式便于维护和阅读。可根据实际环境调整配置参数。
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。