Java教程

Hbase基础语法讲解与案例实战

本文主要是介绍Hbase基础语法讲解与案例实战,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!

# 1、Hbase基础语法

1.1 进入HBase客户端命令操作界面

  • node01执行以下命令,进入HBase的shell客户端

  • 首先配置hbase的环境变量

cd /etc/prpfile

输入:hbase shell

1.2 help 帮助命令

hbase(main):001:0> help

1.3 list 查看有哪些表

  • 查看当前数据库中有哪些表
hbase(main):002:0> list_namespace_tables 'hbase'

1.4 create 创建表

  • 创建user表,包含info、data两个列族
  • 使用create命令
hbase(main):010:0> create 'user', 'info', 'data'

或者

hbase(main):010:0> create 'user1', {NAME => 'info', VERSIONS => '3'},{NAME => 'data'}

1.5 put 插入数据操作

  • 向表中插入数据
  • 使用put命令
向user表中插入信息,row key为rk0001,列族info中添加名为name的列,值为zhangsan
hbase(main):011:0> put 'user', 'rk0001', 'info:name', 'zhangsan'

向user表中插入信息,row key为rk0001,列族info中添加名为gender的列,值为female
hbase(main):012:0> put 'user', 'rk0001', 'info:gender', 'female'

向user表中插入信息,row key为rk0001,列族info中添加名为age的列,值为20
hbase(main):013:0> put 'user', 'rk0001', 'info:age', 20

向user表中插入信息,row key为rk0001,列族data中添加名为pic的列,值为picture
hbase(main):014:0> put 'user', 'rk0001', 'data:pic', 'picture'

1.6 查询数据操作

1.6.1 通过rowkey进行查询

  • 获取user表中row key为rk0001的所有信息(即所有cell的数据)
  • 使用get命令
hbase(main):015:0> get 'user', 'rk0001'

1.6.2 查看rowkey下某个列族的信息

  • 获取user表中row key为rk0001,info列族的所有信息
hbase(main):016:0> get 'user', 'rk0001', 'info'

1.6.3 查看rowkey指定列族指定字段的值

  • 获取user表中row key为rk0001,info列族的name、age列的信息
hbase(main):017:0> get 'user', 'rk0001', 'info:name', 'info:age'

1.6.4 查看rowkey指定多个列族的信息

  • 获取user表中row key为rk0001,info、data列族的信息
hbase(main):018:0> get 'user', 'rk0001', 'info', 'data'

或者你也可以这样写
hbase(main):019:0> get 'user', 'rk0001', {COLUMN => ['info', 'data']}

或者你也可以这样写,也行
hbase(main):020:0> get 'user', 'rk0001', {COLUMN => ['info:name', 'data:pic']}

1.6.5 指定rowkey与列值过滤器查询

  • 获取user表中row key为rk0001,cell的值为zhangsan的信息
hbase(main):030:0> get 'user', 'rk0001', {FILTER => "ValueFilter(=, 'binary:zhangsan')"}

1.6.6 指定rowkey与列名模糊查询

  • 获取user表中row key为rk0001,列标示符中含有a的信息
hbase(main):031:0> get 'user', 'rk0001', {FILTER => "QualifierFilter(=,'substring:a')"}
继续插入一批数据
hbase(main):032:0> put 'user', 'rk0002', 'info:name', 'fanbingbing'
hbase(main):033:0> put 'user', 'rk0002', 'info:gender', 'female'
hbase(main):034:0> put 'user', 'rk0002', 'info:nationality', '中国'
hbase(main):035:0> get 'user', 'rk0002', {FILTER => "ValueFilter(=, 'binary:中国')"}

1.6.7 查询富贵论坛所有行的数据

  • 查询user表中的所有信息
  • 使用scan命令
hbase(main):032:0>  scan 'user'

1.6.8 列族查询

  • 查询user表中列族为info的信息
scan 'user', {COLUMNS => 'info'}

scan 'user', {COLUMNS => 'info', RAW => true, VERSIONS => 5}

scan 'user', {COLUMNS => 'info', RAW => true, VERSIONS => 3}

1.6.9 多列族查询

  • 查询user表中列族为info和data的信息
scan 'user', {COLUMNS => ['info', 'data']}

1.6.10 指定列族与某个列名查询

  • 查询user表中列族为info、列标示符为name的信息
scan 'user', {COLUMNS => 'info:name'}
  • 查询info:name列、data:pic列的数据
scan 'user', {COLUMNS => ['info:name', 'data:pic']}
  • 查询user表中列族为info、列标示符为name的信息,并且版本最新的5个
scan 'user', {COLUMNS => 'info:name', VERSIONS => 5}

1.6.11 指定多个列族与按照数据值模糊查询

  • 查询user表中列族为info和data且列标示符中含有a字符的信息
scan 'user', {COLUMNS => ['info', 'data'], FILTER => "(QualifierFilter(=,'substring:a'))"}

1.6.12 指定rowkey的范围查询

  • 查询user表中列族为info,rk范围是[rk0001, rk0003)的数据
scan 'user', {COLUMNS => 'info', STARTROW => 'rk0001', ENDROW => 'rk0003'}

1.6.13 指定rowkey模糊查询

  • 查询user表中row key以rk字符开头的数据
scan 'user',{FILTER=>"PrefixFilter('rk')"}

1.6.14 指定数据版本的范围查询

  • 查询user表中指定范围的数据(前闭后开)
scan 'user', {TIMERANGE => [1392368783980, 1392380169184]}

1.7 更新数据操作

1.7.1 更新数据值

  • 更新操作同插入操作一模一样,只不过有数据就更新,没数据就添加
  • 使用put命令

1.7.2 更新版本号

  • 将user表的f1列族版本数改为5
hbase(main):050:0> alter 'user', NAME => 'info', VERSIONS => 5

1.8 删除数据以及删除表操作

1.8.1 指定rowkey以及列名进行删除

  • 删除user表row key为rk0001,列标示符为info:name的数据
hbase(main):045:0> delete 'user', 'rk0001', 'info:name'

1.8.2 指定rowkey,列名以及版本号进行删除

  • 删除user表row key为rk0001,列标示符为info:name,timestamp为1392383705316的数据
delete 'user', 'rk0001', 'info:name', 1392383705316

1.8.3 删除一个列族

  • 删除一个列族:
alter 'user', NAME => 'info', METHOD => 'delete' 

或 alter 'user', 'delete' => 'info'

1.8.4 清空表数据

hbase(main):017:0> truncate 'user'

1.8.5 删除表

  • 首先需要先让该表为disable状态,使用命令:
hbase(main):049:0> disable 'user'
  • 然后使用drop命令删除这个表
hbase(main):050:0> drop 'user'

(注意:如果直接drop表,会报错:Drop the named table. Table must first be disabled)

1.9 统计一张表有多少行数据

hbase(main):053:0> count 'user'

.8.5 删除表

  • 首先需要先让该表为disable状态,使用命令:
hbase(main):049:0> disable 'user'
  • 然后使用drop命令删除这个表
hbase(main):050:0> drop 'user'

(注意:如果直接drop表,会报错:Drop the named table. Table must first be disabled)

1.9 统计一张表有多少行数据

hbase(main):053:0> count 'user'
这篇关于Hbase基础语法讲解与案例实战的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!