HBase备份容灾常用命令

灾难恢复是个令人神经紧张的话题,但必须面对.HBase虽然是一个分布式的数据库，但是有时候容灾以及数据备份仍然是需要考虑的，而掌握常用的命令正是写这篇文章的意义所在。
本文主要通过案例来讲解CopyTable,Import,Export,Snapshot,希望大家对它们的使用有一个直观的认识。

- 支持时间区间,row区间，改变表名称，改变列族名称，指定是否copy已经被删除的数据等功能
- CopyTable工具采用scan查询，写入新表时采用put和delete API,全是基于hbase的client api进行读写

首先需要新建好备份表，保证columnFamily一致
在另外一个窗口中,进入hbase/bin目录下，执行以下命令(fileTableNew是备份的表,fileTable是原始表)
1
hbase org.apache.hadoop.hbase.mapreduce.CopyTable --new.name=fileTableNew fileTable

1. Export可导出数据到目标集群,然后可在目标集群Import导入数据，Export支持指定开始时间和结束时间，因为可以做增量备份
2. Export导出工具与CopyTable一样是依赖hbase的scan读取数据

1	bin/hbase org.apache.hadoop.hbase.mapreduce.Export <tablename> hdfs://namenode:9000/table_bak <version> <startTime> <endTime>

1	bin/hbase -Dhbase.import.version=0.94 org.apache.hadoop.hbase.mapreduce.Import <tablename> <inputdir>

执行导出语句

1
2
3

#这里存储的路径是存储在hdfs上面的
./hbase org.apache.hadoop.hbase.mapreduce.Export fileTable /usr/local/hbase/fileTable.db

查看导出的表

新建需要导入的表，确保导入之前的表和导入后的表结构一致(相同的列簇)
1
create 'fileTableNew','fileInfo','saveInfo'

执行导入语句

1	./hbase org.apache.hadoop.hbase.mapreduce.Import fileTableNew /usr/local/hbase/fileTable.db

1	snapshot 'myTable','myTableSnapshot-181210'

1	clone_snapshot 'myTableSnapshot-181210', 'myNewTestTable'

1	list_snapshots

1	delete_snapshot 'myTableSnapshot-181210'

1 2	disable 'myTable' restore_snapshot 'myTableSnapshot-181210'