实验3- 熟悉常用的 HBase 操作

摘要:
石家庄铁道大学信息科学与技术学院实验报告2018年----2019年第一学期题目:熟悉常用的HBase操作课程名称:大型数据库应用技术班级:信1605-2班姓名:XX学号:XXXXXXXX指导教师:XXX一、实验内容与完成情况:实验说明:1、本次实验是第三次上机,属于验证性实验。实验目的:1、理解HBase在Hadoop体系结构中的角色;2、熟练使用HBase操作常用的Shell命令;3、熟悉HBase操作常用的JavaAPI。

石家庄铁道大学信息科学与技术学院

实验报告

2018----2019学期

题目熟悉常用的 HBase 操作

课程名称:大型数据库应用技术

级:1605-2

名: XX学号: XXXXXXXX

指导教师: XXX

一、实验内容与完成情况:(实验具体步骤和实验截图说明)

实验说明:

1本次实验是第三次上机,属于验证性实验。实验报告上交截止日期为2018929上午12点之前。

2实验报告命名为:信1605-1班学号姓名实验三.doc

实验环境:

1操作系统:Linux(建议Ubuntu16.04);

2Hadoop版本:2.7.1

3JDK版本:1.7或以上版本;

4Java IDEEclipse

实验目的:

1理解HBaseHadoop体系结构中的角色;

2熟练使用HBase操作常用的Shell命令;

3熟悉HBase操作常用的Java API

实验步骤:

(一)编程实现以下指定功能,并用Hadoop 提供的HBase Shell 命令完成相同任务:

l列出HBase所有的表的相关信息,例如表名;

l在终端打印出指定的表的所有记录数据;

l向已经创建好的表添加和删除指定的列族或列;

l清空指定的表的所有记录数据;

l统计表的行数。

1.列出HBase所有的表的相关信息,例如表名

HBase ShellList

截图:实验3- 熟悉常用的 HBase 操作第1张

Java API

packagehomework;

importjava.io.IOException;

importorg.apache.hadoop.conf.Configuration;
import org.apache.hadoop.hbase.*;
import org.apache.hadoop.hbase.client.*;

importjava.io.IOException;

public classTest_1 {

    public staticConfiguration configuration;
    public staticConnection connection;
    public staticAdmin admin;
    /*** @paramargs
     */
    //建立连接
    public static voidinit(){
        configuration  =HBaseConfiguration.create();
        configuration.set("hbase.rootdir","hdfs://localhost:9000/hbase");
        try{
            connection =ConnectionFactory.createConnection(configuration);
            admin =connection.getAdmin();
        }catch(IOException e){
            e.printStackTrace();
        }
    }
    //关闭连接
    public static voidclose(){
        try{
            if(admin != null){
                admin.close();
            }
            if(null !=connection){
                connection.close();
            }
        }catch(IOException e){
            e.printStackTrace();
        }
    }
    
    /*** 查看已有表
     * @throwsIOException
     */
    public static void listTables() throwsIOException {
        init();
        HTableDescriptor hTableDescriptors[] =admin.listTables();
        for(HTableDescriptor hTableDescriptor :hTableDescriptors){
            System.out.println(hTableDescriptor.getNameAsString());
        }
        close();
    }
    
    public static voidmain(String[] args) {
        //TODO Auto-generated method stub
        Test_1 t =newTest_1();
        try{
            System.out.println("以下为Hbase 数据库中所存的表信息");
            t.listTables();
        } catch(IOException e) {
            //TODO Auto-generated catch block
e.printStackTrace();
        }
      
    }

}
Hbase shell查看所有表的信息

截图:实验3- 熟悉常用的 HBase 操作第2张

2.在终端打印出指定的表的所有记录数据;

Hbase shell scan 'student'

截图:实验3- 熟悉常用的 HBase 操作第3张

Java API:

packagehomework;

importjava.io.IOException;

importorg.apache.hadoop.conf.Configuration;
import org.apache.hadoop.hbase.*;
import org.apache.hadoop.hbase.client.*;

importjava.io.IOException;
importjava.util.Scanner;


public classTest_2 {

    public staticConfiguration configuration;
    public staticConnection connection;
    public staticAdmin admin;
    /*** @paramargs
     */
    
  //建立连接
    public static voidinit(){
        configuration  =HBaseConfiguration.create();
        configuration.set("hbase.rootdir","hdfs://localhost:9000/hbase");
        try{
            connection =ConnectionFactory.createConnection(configuration);
            admin =connection.getAdmin();
        }catch(IOException e){
            e.printStackTrace();
        }
    }
    //关闭连接
    public static voidclose(){
        try{
            if(admin != null){
                admin.close();
            }
            if(null !=connection){
                connection.close();
            }
        }catch(IOException e){
            e.printStackTrace();
        }
    }
  
    /*** 根据表名查找表信息
     */
    public static void getData(String tableName)throwsIOException{
        init();
        Table table =connection.getTable(TableName.valueOf(tableName));
        Scan scan = newScan();
       ResultScanner scanner =table.getScanner(scan);
        
        for(Result result:scanner)
        {
            showCell((result));
        }
        close();
    }
    
    /*** 格式化输出
     * @paramresult
     */
    public static voidshowCell(Result result){
        Cell[] cells =result.rawCells();
        for(Cell cell:cells){
            System.out.println("RowName(行键):"+new String(CellUtil.cloneRow(cell))+" ");
            System.out.println("Timetamp(时间戳):"+cell.getTimestamp()+" ");
            System.out.println("column Family(列簇):"+new String(CellUtil.cloneFamily(cell))+" ");
            System.out.println("column Name(列名):"+new String(CellUtil.cloneQualifier(cell))+" ");
            System.out.println("value:(值)"+new String(CellUtil.cloneValue(cell))+" ");
            System.out.println();
        }
    }
    
    
    
    public static void main(String[] args) throwsIOException {
        //TODO Auto-generated method stub
        Test_2 t =newTest_2();
        System.out.println("请输入要查看的表名");
        Scanner scan = newScanner(System.in);
        String tableName=scan.nextLine();
        System.out.println("信息如下:");
        t.getData(tableName);

    }

}
查看表记录

截图:

实验3- 熟悉常用的 HBase 操作第4张

③.(向已经创建好的表添加和删除指定的列族或列

Hbase shell(添加列族):put 'student','95003','Sname','wangjinxuan'

截图 :

实验3- 熟悉常用的 HBase 操作第5张

HBase Shell(删除列族)

delete 'student' ,’95003’,’Sname:123’

delete 'student' ,’95003’,’Sname’

student为表名,95003为行键,Sname为列族名,123为列名

(因为hbase中没有删除shell命令直接删除指定行的列族信息(包括其中的列的信息),所以需要先将所有指定行的列族信息的所有信息,然后使用delete一个一个作删除)

截图:

实验3- 熟悉常用的 HBase 操作第6张

实验3- 熟悉常用的 HBase 操作第7张

删除补充

删除整个行记录

Deleteall 'student' ,’95003’

student为表名,95003为行键

Java API

packagehomework;

importjava.io.IOException;
importjava.util.Scanner;

importorg.apache.hadoop.conf.Configuration;
importorg.apache.hadoop.hbase.Cell;
importorg.apache.hadoop.hbase.CellUtil;
importorg.apache.hadoop.hbase.HBaseConfiguration;
importorg.apache.hadoop.hbase.TableName;
importorg.apache.hadoop.hbase.client.Admin;
importorg.apache.hadoop.hbase.client.Connection;
importorg.apache.hadoop.hbase.client.ConnectionFactory;
importorg.apache.hadoop.hbase.client.Delete;
importorg.apache.hadoop.hbase.client.Put;
importorg.apache.hadoop.hbase.client.Result;
importorg.apache.hadoop.hbase.client.ResultScanner;
importorg.apache.hadoop.hbase.client.Scan;
importorg.apache.hadoop.hbase.client.Table;

public classTest_3 {

    public staticConfiguration configuration;
    public staticConnection connection;
    public staticAdmin admin;
      //建立连接
    public static voidinit(){
        configuration  =HBaseConfiguration.create();
        configuration.set("hbase.rootdir","hdfs://localhost:9000/hbase");
        try{
            connection =ConnectionFactory.createConnection(configuration);
            admin =connection.getAdmin();
        }catch(IOException e){
            e.printStackTrace();
        }
    }
    //关闭连接
    public static voidclose(){
        try{
            if(admin != null){
                admin.close();
            }
            if(null !=connection){
                connection.close();
            }
        }catch(IOException e){
            e.printStackTrace();
        }
    }
    
    /*** 向某一行的某一列插入数据
     * @paramtableName 表名
     * @paramrowKey 行键
     * @paramcolFamily 列族名
     * @paramcol 列名(如果其列族下没有子列,此参数可为空)
     * @paramval 值
     * @throwsIOException
     */
    public static void insertRow(String tableName,String rowKey,String colFamily,String col,String val) throwsIOException {
        init();
        Table table =connection.getTable(TableName.valueOf(tableName));
        Put put = newPut(rowKey.getBytes());
        put.addColumn(colFamily.getBytes(), col.getBytes(), val.getBytes());
        table.put(put);
        table.close();
        close();
    } 
    
    /*** 根据表名查找表信息
     */
    public static void getData(String tableName)throwsIOException{
        init();
        Table table =connection.getTable(TableName.valueOf(tableName));
        Scan scan = newScan();
       ResultScanner scanner =table.getScanner(scan);
        
        for(Result result:scanner)
        {
            showCell((result));
        }
        close();
    }
    
    /*** 格式化输出
     * @paramresult
     */
    public static voidshowCell(Result result){
        Cell[] cells =result.rawCells();
        for(Cell cell:cells){
            System.out.println("RowName(行键):"+new String(CellUtil.cloneRow(cell))+" ");
            System.out.println("Timetamp(时间戳):"+cell.getTimestamp()+" ");
            System.out.println("column Family(列簇):"+new String(CellUtil.cloneFamily(cell))+" ");
            System.out.println("column Name(列名):"+new String(CellUtil.cloneQualifier(cell))+" ");
            System.out.println("value:(值)"+new String(CellUtil.cloneValue(cell))+" ");
            System.out.println();
        }
    }
    
    /*** 删除数据
     * @paramtableName 表名
     * @paramrowKey 行键
     * @paramcolFamily 列族名
     * @paramcol 列名
     * @throwsIOException
     */
    public static void deleteRow(String tableName,String rowKey,String colFamily,String col) throwsIOException {
        init();
        Table table =connection.getTable(TableName.valueOf(tableName));
        Delete delete = newDelete(rowKey.getBytes());
       
        boolean flag2 =true;
        while(flag2)
        {
        System.out.println("请输入你的选择 1-删除列族的所有数据  2-指定列的数据");
        Scanner scanner=newScanner(System.in);
        String chooseString =scanner.nextLine();
        switch(chooseString) {
        case "1":
        {
            //删除指定列族的所有数据
delete.addFamily(colFamily.getBytes());
            table.delete(delete);
            table.close();
            close();
            break;
        }
        case "2":
        {
            //删除指定列的数据
delete.addColumn(colFamily.getBytes(), col.getBytes());
            table.delete(delete);
            table.close();
            close();
            break;
        }

        default:
        {
            System.out.println("   你的输入有误 !!!    ");
            table.close();
            close();
            break;
        }
        }
        System.out.println(" 你要继续操作吗? 是-true 否-false ");
        flag2=scanner.nextBoolean();
        }
    }
    
    
    
    
    
    /*** @paramargs
     */
    public static voidmain(String[] args) {
        //TODO Auto-generated method stub
        Test_3 t =newTest_3();
        boolean flag =true;
        while(flag)
        {
        System.out.println("------------向已经创建好的表中添加和删除指定的列簇或列--------------------");
        System.out.println("              请输入您要进行的操作   1- 添加          2-删除                       ");
        Scanner scan = newScanner(System.in);
        String choose1=scan.nextLine();
        switch(choose1) {
        case "1":
        {
            System.out.println("请输入要添加的表名");
            String tableName=scan.nextLine();
            System.out.println("请输入要添加的表的行键");
            String rowKey=scan.nextLine();
            System.out.println("请输入要添加的表的列簇");
            String colFamily=scan.nextLine();
            System.out.println("请输入要添加的表的列名");
            String col=scan.nextLine();
            System.out.println("请输入要添加的值");
            String val=scan.nextLine();
            try{
                t.insertRow(tableName, rowKey, colFamily, col, val);
                System.out.println("插入成功:");
                t.getData(tableName);
            } catch(IOException e) {
                //TODO Auto-generated catch block
e.getMessage();
            }
            break;
        }
         case "2":
         {
                System.out.println("请输入要删除的表名");
                String tableName=scan.nextLine();
                System.out.println("请输入要删除的表的行键");
                String rowKey=scan.nextLine();
                System.out.println("请输入要删除的表的列簇");
                String colFamily=scan.nextLine();
                System.out.println("请输入要删除的表的列名");
                String col=scan.nextLine();
                try{
                    System.out.println("----------------------表的原本信息如下---------------------");
                    t.getData(tableName);
                    System.out.println("____________________________正在执行删除操作........
");
                    t.deleteRow(tableName, rowKey, colFamily, col);
                    System.out.println("____________________________删除成功_______________
");
                    System.out.println("---------------------删除后  表的信息如下---------------------");
                    t.getData(tableName);
                } catch(IOException e) {
                    //TODO Auto-generated catch block
e.getMessage();
                }
            break;
         }
        default:
        {
            System.out.println("   你的操作有误 !!!    ");
            break;
        }
        }
        System.out.println(" 你要继续操作吗? 是-true 否-false ");
        flag=scan.nextBoolean();
        
        }
        System.out.println("   程序已退出!    ");
    }

}
添加和删除指定的列族和列

截图 :实验3- 熟悉常用的 HBase 操作第8张

实验3- 熟悉常用的 HBase 操作第9张

实验3- 熟悉常用的 HBase 操作第10张

实验3- 熟悉常用的 HBase 操作第11张

实验3- 熟悉常用的 HBase 操作第12张

实验3- 熟悉常用的 HBase 操作第13张

实验3- 熟悉常用的 HBase 操作第14张

实验3- 熟悉常用的 HBase 操作第15张

实验3- 熟悉常用的 HBase 操作第16张

备注:

delete 'student’,’95003’,’Sname’仅能删除Sname列下的数据,并不能删除Sname列簇下的别的列名的数据,因为它默认删除删除Sname:空下的数据,作字符串相等,并不是包含。暂时依靠两次删除来删除数据。

④.清空指定的表的所有记录数据

Hbase Shell命令 truncate 'student'

截图 实验3- 熟悉常用的 HBase 操作第17张

Java API

packagehomework;

importjava.io.IOException;
importjava.util.Scanner;

importorg.apache.hadoop.conf.Configuration;
importorg.apache.hadoop.hbase.Cell;
importorg.apache.hadoop.hbase.CellUtil;
importorg.apache.hadoop.hbase.HBaseConfiguration;
importorg.apache.hadoop.hbase.HColumnDescriptor;
importorg.apache.hadoop.hbase.HTableDescriptor;
importorg.apache.hadoop.hbase.TableName;
importorg.apache.hadoop.hbase.client.Admin;
importorg.apache.hadoop.hbase.client.Connection;
importorg.apache.hadoop.hbase.client.ConnectionFactory;
importorg.apache.hadoop.hbase.client.HBaseAdmin;
importorg.apache.hadoop.hbase.client.Result;
importorg.apache.hadoop.hbase.client.ResultScanner;
importorg.apache.hadoop.hbase.client.Scan;
importorg.apache.hadoop.hbase.client.Table;
importorg.apache.hadoop.hbase.util.Bytes;


public classTest_4 {

    public staticConfiguration configuration;
    public staticConnection connection;
    public staticAdmin admin;
    /*** @paramargs
     */
    
  //建立连接
    public static voidinit(){
        configuration  =HBaseConfiguration.create();
        configuration.set("hbase.rootdir","hdfs://localhost:9000/hbase");
        try{
            connection =ConnectionFactory.createConnection(configuration);
            admin =connection.getAdmin();
        }catch(IOException e){
            e.printStackTrace();
        }
    }
    //关闭连接
    public static voidclose(){
        try{
            if(admin != null){
                admin.close();
            }
            if(null !=connection){
                connection.close();
            }
        }catch(IOException e){
            e.printStackTrace();
        }
    }

   
    
    
    
    /*** 清空制定的表的所有记录数据
     * @paramargs
     * @throwsIOException 
     */
    public static void clearRows(String tableName) throwsIOException{
        
        init();
        HBaseAdmin admin1=newHBaseAdmin(configuration);
        HTableDescriptor tDescriptor =admin1.getTableDescriptor(Bytes.toBytes(tableName));//读取了之前表的表名 列簇等信息,然后再进行删除操作。 总思想是先将原表结构保留下来,然后进行删除,再重新依据保存的信息重新创建表。
        TableName tablename=TableName.valueOf(tableName);
        
        //删除表
admin.disableTable(tablename);
        admin.deleteTable(tablename);
        
        //重新建表
admin.createTable(tDescriptor);
        close();

    }   

    
    /*** 根据表名查找表信息
     */
    public static void getData(String tableName)throwsIOException{
        init();
        Table table =connection.getTable(TableName.valueOf(tableName));
        Scan scan = newScan();
       ResultScanner scanner =table.getScanner(scan);
        
        for(Result result:scanner)
        {
            showCell((result));
        }
        close();
    }
    
    /*** 格式化输出
     * @paramresult
     */
    public static voidshowCell(Result result){
        Cell[] cells =result.rawCells();
        for(Cell cell:cells){
            System.out.println("RowName(行键):"+new String(CellUtil.cloneRow(cell))+" ");
            System.out.println("Timetamp(时间戳):"+cell.getTimestamp()+" ");
            System.out.println("column Family(列簇):"+new String(CellUtil.cloneFamily(cell))+" ");
            System.out.println("column Name(列名):"+new String(CellUtil.cloneQualifier(cell))+" ");
            System.out.println("value:(值)"+new String(CellUtil.cloneValue(cell))+" ");
            System.out.println();
        }
    }
    
    public static voidmain(String[] args) {
        //TODO Auto-generated method stub
        Test_4 test_4=newTest_4();
        
        Scanner scan = newScanner(System.in);
        System.out.println("请输入要清空的表名");
        String tableName=scan.nextLine();

        try{
            System.out.println("表原来的信息:");
            test_4.getData(tableName);
            test_4.clearRows(tableName);
            System.out.println("表已清空:");
        } catch(IOException e) {
            //TODO Auto-generated catch block
e.printStackTrace();
        }
    }

}
清空表


截图:

实验3- 熟悉常用的 HBase 操作第18张

统计表的行数。

Hbase shell 命令

命令:count 'student'

截图:

实验3- 熟悉常用的 HBase 操作第19张

Java API

packagehomework;

importjava.io.IOException;
importjava.util.Scanner;

importorg.apache.hadoop.conf.Configuration;
importorg.apache.hadoop.hbase.HBaseConfiguration;
importorg.apache.hadoop.hbase.TableName;
importorg.apache.hadoop.hbase.client.Admin;
importorg.apache.hadoop.hbase.client.Connection;
importorg.apache.hadoop.hbase.client.ConnectionFactory;
importorg.apache.hadoop.hbase.client.Result;
importorg.apache.hadoop.hbase.client.ResultScanner;
importorg.apache.hadoop.hbase.client.Scan;
importorg.apache.hadoop.hbase.client.Table;

public classTest_5 {
    
    public staticConfiguration configuration;
    public staticConnection connection;
    public staticAdmin admin;
    //建立连接
    public static voidinit(){
        configuration  =HBaseConfiguration.create();
        configuration.set("hbase.rootdir","hdfs://localhost:9000/hbase");
        try{
            connection =ConnectionFactory.createConnection(configuration);
            admin =connection.getAdmin();
        }catch(IOException e){
            e.printStackTrace();
        }
    }
    //关闭连接
    public static voidclose(){
        try{
            if(admin != null){
                admin.close();
            }
            if(null !=connection){
                connection.close();
            }
        }catch(IOException e){
            e.printStackTrace();
        }
    }
 
     public static void countRows (String tableName) throwsIOException
     {
         init();
         Table table =connection.getTable(TableName.valueOf(tableName));
         Scan scan = newScan();
         ResultScanner scanner =table.getScanner(scan);
         int num = 0;
         for(Result result = scanner.next();result!=null;result=scanner.next())
         {
             num++;
         }
         System.out.println("行数:"+num);
         scanner.close();
         close();
     }
    
    /*** @paramargs
     * @throwsIOException 
     */
    public static void main(String[] args) throwsIOException {
        //TODO Auto-generated method stub
        Test_5 test_5=newTest_5();
        Scanner scan = newScanner(System.in);
        System.out.println("请输入要统计行数的表名");
        String tableName=scan.nextLine();
        test_5.countRows(tableName);
    }

}
统计表的行数

(二)HBase 数据库操作

(1)现有以下关系型数据库中的表和数据,要求将其转换为适合于HBase存储的表并插入数据:

学生表(Student

学号(S_No)

姓名(S_Name)

性别(S_Sex)

年龄(S_Age)

2015001

Zhangsan

male

23

2015003

Mary

female

22

2015003

Lisi

male

24

课程表Course

课程号(C_No)

课程名(C_Name)

学分(C_Credit)

123001

Math

2.0

123002

Computer Science

5.0

123003

English

3.0

选课表(SC)

学号(SC_Sno)

课程号(SC_Cno)

成绩(SC_Score)

2015001

123001

86

2015001

123003

69

2015002

123002

77

2015002

123003

99

2015003

123001

98

2015003

123002

95

①学生Student表(主键的列名是随机分配的,因此无需创建主键列)

创建表:create 'Student','S_No','S_Name','S_Sex','S_Age'

实验3- 熟悉常用的 HBase 操作第20张

插入数据:

插入shell命令

第一行数据

put 'Student','s001','S_No','2015001' 

put 'Student','s001','S_Name','Zhangsan' 

put 'Student','s001','S_Sex','male' 

put 'Student','s001','S_Age','23' 

第二行数据

put 'Student','s002','S_No','2015002' 

put 'Student','s002','S_Name','Mary' 

put 'Student','s002','S_Sex','female' 

put 'Student','s002','S_Age','22' 

第三行数据

put 'Student','s003','S_No','2015003' 

put 'Student','s003','S_Name','Lisi' 

put 'Student','s003','S_Sex','male' 

put 'Student','s003','S_Age','24' 

实验3- 熟悉常用的 HBase 操作第21张

实验3- 熟悉常用的 HBase 操作第22张

添加数据并查看

实验3- 熟悉常用的 HBase 操作第23张

添加3个学生

② 课程Course表

创建表:create 'Course','C_No','C_Name','C_Credit'

创建Course表

插入shell命令

第一行数据

put 'Course','c001','C_No','123001'

put 'Course','c001','C_Name','Math'

put 'Course','c001','C_Credit','2.0'

第二行数据

put 'Course','c001','C_No','123002'

put 'Course','c001','C_Name','Computer Science'

put 'Course','c001','C_Credit','5.0'

第三行数据

put 'Course','c001','C_No','123003'

put 'Course','c001','C_Name','English'

put 'Course','c001','C_Credit','3.0'

实验3- 熟悉常用的 HBase 操作第24张

添加数据

实验3- 熟悉常用的 HBase 操作第25张

添加三个课程

③选课表

创建表:create 'SC','SC_Sno','SC_Cno','SC_Score'

实验3- 熟悉常用的 HBase 操作第26张

创建表SC

插入数据:

插入shell命令

第一行数据

put 'SC','sc001','SC_Sno','2015001'

put 'SC','sc001','SC_Cno','123001'

put 'SC','sc001','SC_Score','86'

第二行数据

put 'SC','sc002','SC_Sno','2015001'

put 'SC','sc002','SC_Cno','123003'

put 'SC','sc002','SC_Score','69'

第三行数据

put 'SC','sc003','SC_Sno','2015002'

put 'SC','sc003','SC_Cno','123002'

put 'SC','sc003','SC_Score','77'

第四行数据

put 'SC','sc004','SC_Sno','2015002'

put 'SC','sc004','SC_Cno','123003'

put 'SC','sc004','SC_Score','99'

第五行数据

put 'SC','sc005','SC_Sno','2015003'

put 'SC','sc005','SC_Cno','123001'

put 'SC','sc005','SC_Score','98'

第六行数据

put 'SC','sc006','SC_Sno','2015003'

put 'SC','sc006','SC_Cno','123002'

put 'SC','sc006','SC_Score','95'

实验3- 熟悉常用的 HBase 操作第27张

插入数据

实验3- 熟悉常用的 HBase 操作第28张

数据显示

二、按要求编程

1.createTable(String tableName, String[] fields)

创建表,参数 tableName 为表的名称,字符串数组 fields 为存储记录各个字段名称的数组。要求当 HBase 已经存在名为 tableName 的表的时候,先删除原有的表,然后再创建新的表。

2.addRecord(String tableName, String row, String[] fields, String[]values)

向表 tableName、行 row(S_Name 表示)和字符串数组 fields 指定的单元格中添加对应的数据 values。其中,fields 中每个元素如果对应的列族下还有相应的列限定符的话,用“columnFamily:column”表示。例如,同时向“Math”“Computer Science”、“English”三列添加成绩时,字符串数组 fields 为{“Score:Math”, ”Score:Computer Science”, ”Score:English”},数组

values 存储这三门课的成绩。

3.scanColumn(String tableName, Stringcolumn)

浏览表 tableName 某一列的数据,如果某一行记录中该列数据不存在,则返回 null。要求当参数 column 为某一列族名称时,如果底下有若干个列限定符,则要列出每个列限定符代表的列的数据;当参数 column 为某一列具体名称(例如“Score:Math”)时,只需要列出该列的数据。

4.modifyData(String tableName, String row, Stringcolumn)

修改表 tableName,行 row(可以用学生姓名 S_Name 表示,列 column 指定的单元格的数据。

5.deleteRow(String tableName, Stringrow)

删除表 tableName 中 row 指定的行的记录。

方式

代码+截图

Java API 命令

(集成了所有功能)

代码:

packagehomework;

 

importjava.io.BufferedReader;

importjava.io.IOException;

importjava.io.InputStreamReader;

importjava.util.Scanner;

 

importorg.apache.hadoop.conf.Configuration;

importorg.apache.hadoop.hbase.Cell;

importorg.apache.hadoop.hbase.CellUtil;

importorg.apache.hadoop.hbase.HBaseConfiguration;

importorg.apache.hadoop.hbase.HColumnDescriptor;

importorg.apache.hadoop.hbase.HTableDescriptor;

importorg.apache.hadoop.hbase.TableName;

importorg.apache.hadoop.hbase.client.Admin;

importorg.apache.hadoop.hbase.client.Connection;

importorg.apache.hadoop.hbase.client.ConnectionFactory;

importorg.apache.hadoop.hbase.client.Delete;

importorg.apache.hadoop.hbase.client.Put;

importorg.apache.hadoop.hbase.client.Result;

importorg.apache.hadoop.hbase.client.ResultScanner;

importorg.apache.hadoop.hbase.client.Scan;

importorg.apache.hadoop.hbase.client.Table;

importorg.apache.hadoop.hbase.util.Bytes;

 

public classTest_Two {

 

public staticConfiguration configuration;

    public staticConnection connection;

    public staticAdmin admin;

 

 

 //建立连接

    public static voidinit(){

        configuration  =HBaseConfiguration.create();

        configuration.set("hbase.rootdir","hdfs://localhost:9000/hbase");

        try{

            connection =ConnectionFactory.createConnection(configuration);

            admin =connection.getAdmin();

        }catch(IOException e){

            e.printStackTrace();

        }

    }

    //关闭连接

    public static voidclose(){

        try{

            if(admin != null){

                admin.close();

            }

            if(null !=connection){

                connection.close();

            }

        }catch(IOException e){

            e.printStackTrace();

        }

    }

    

    /**
     * 建表。参数tableName为表的名称,字符串数组fields为存储记录各个域名称的数组。

     * 要求当HBase已经存在名为tableName的表时,先删除原有的表,然后再

     * 创建新的表  field:列族

     * @parammyTableName 表名

     * @paramcolFamily 列族名

     * @throwsIOException

     */

    public static void createTable(String tableName,String[] fields) throwsIOException {

 

        init();

        TableName tablename =TableName.valueOf(tableName);

 

        if(admin.tableExists(tablename)){

            System.out.println("表已存在,将执行删除原表,重建新表!");

            admin.disableTable(tablename);

            admin.deleteTable(tablename);//删除原来的表
}

            HTableDescriptor hTableDescriptor = newHTableDescriptor(tableName);

            for(String str:fields){

                HColumnDescriptor hColumnDescriptor = newHColumnDescriptor(str);

                hTableDescriptor.addFamily(hColumnDescriptor);

            }

            admin.createTable(hTableDescriptor);

            System.out.println("表已创建成功");

       

        close();

    }

    

    /**
     * 向表 tableName、行 row(用 S_Name 表示)和字符串数组 fields 指定的单元格中

     * 添加对应的数据 values。

     * 其中,fields 中每个元素如果对应的列族下还有相应的列限定符的话,

     * 用“columnFamily:column”表示。

     * 例如,同时向“Math”、“Computer Science”、“English”三列添加成绩时,

     * 字符串数组 fields 为{“Score:Math”, ”Score:Computer Science”, ”Score:English”},

     * 数组values 存储这三门课的成绩。

     */

    public static void addRecord(String tableName,String rowKey,String []fields,String [] values) throwsIOException {

        init();

        Table table =connection.getTable(TableName.valueOf(tableName));

        for (int i = 0; i < fields.length; i++) {

         Put put = newPut(rowKey.getBytes());

         String [] cols = fields[i].split(":");

         if(cols.length==1)

         {

 

         put.addColumn(cols[0].getBytes(), "".getBytes(), values[i].getBytes());//因为当输入的是单列族,split仅读出一个字符字符串,即cols仅有一个元素
}

         else{

         put.addColumn(cols[0].getBytes(), cols[1].getBytes(), values[i].getBytes());

}

         table.put(put);

}

        table.close();

        close();

    }

 

    /**
     * 根据表名查找表信息

     */

    public static void getData(String tableName)throwsIOException{

        init();

        Table table =connection.getTable(TableName.valueOf(tableName));

        Scan scan = newScan();

       ResultScanner scanner =table.getScanner(scan);

        

        for(Result result:scanner)

        {

        showCell((result));

        }

        close();

    }

    

    /**
     * 格式化输出

     * @paramresult

     */

    public static voidshowCell(Result result){

        Cell[] cells =result.rawCells();

        for(Cell cell:cells){

            System.out.println("RowName(行键):"+new String(CellUtil.cloneRow(cell))+" ");

            System.out.println("Timetamp(时间戳):"+cell.getTimestamp()+" ");

            System.out.println("column Family(列簇):"+new String(CellUtil.cloneFamily(cell))+" ");

            System.out.println("column Name(列名):"+new String(CellUtil.cloneQualifier(cell))+" ");

            System.out.println("value:(值)"+new String(CellUtil.cloneValue(cell))+" ");

            System.out.println();

        }

    }

    /**
     * 浏览表 tableName 某一列的数据,如果某一行记录中该列数据不存在,则返回 null。

     * 要求当参数 column 为某一列族名称时,如果底下有若干个列限定符,则要列出每个列限定符代表的列的数据;

     * 当参数 column 为某一列具体名称(例如“Score:Math”)时,只需要列出该列的数据。

     * @paramtableName

     * @paramcolumn

     * @throwsIOException

     */

    public static void scanColumn (String tableName,String column) throwsIOException

    {

    init();

       Table table =connection.getTable(TableName.valueOf(tableName));

           Scan scan = newScan();

           String [] cols = column.split(":");

 

       if(cols.length==1)

       {

       scan.addFamily(Bytes.toBytes(column));

       }

       else{

      

       scan.addColumn(Bytes.toBytes(cols[0]),Bytes.toBytes(cols[1]));

}

           ResultScanner scanner =table.getScanner(scan);

           for (Result result = scanner.next(); result !=null;result =scanner.next()) {

showCell(result);

}

           table.close();

           close();

    }

    

    

    /**
     * 修改表 tableName,行 row(可以用学生姓名 S_Name 表示),列 column 指定的单元格的数据。

     * @throwsIOException

     */

    public static void modifyData(String tableName,String rowKey,String column,String value) throwsIOException

    {

    

    init();

    Table table =connection.getTable(TableName.valueOf(tableName));

   Put put = newPut(rowKey.getBytes());

  String [] cols = column.split(":");

   if(cols.length==1)

   {

  put.addColumn(column.getBytes(),"".getBytes() , value.getBytes());//qualifier:列族下的列名
}

   else{

  

  put.addColumn(cols[0].getBytes(),cols[1].getBytes() , value.getBytes());//qualifier:列族下的列名
}

   table.put(put);

   table.close();

   close();

    }

    

    

    

    /**
     * 删除表 tableName 中 row 指定的行的记录。

     * @throwsIOException

     */

    public static void deleteRow(String tableName,String rowKey) throwsIOException

    {

    init();

     Table table =connection.getTable(TableName.valueOf(tableName));

   Delete delete = newDelete(rowKey.getBytes());

   

  table.delete(delete);

    table.close();

    close();

      

    }

    

/**
 * @paramargs

 * @throwsIOException

 */

public static void main(String[] args) throwsIOException {

//TODO Auto-generated method stub
Test_Two test_Two = newTest_Two();

    

    boolean flag =true;

while(flag)

{

        System.out.println("------------------------------------------------提供以下功能----------------------------------------------");

System.out.println("                       1- createTable(创建表  ,提供表名、列族名)                                      ");

System.out.println("                       2-addRecord (向已知表名、行键、列簇的表添加值)                       ");

System.out.println("                       3- ScanColumn(浏览表     某一列的数据)                                            ");

System.out.println("                       4- modifyData(修改某表   某行,某一列,指定的单元格的数据)    ");

System.out.println("                       5- deleteRow(删除 某表   某行的记录)                                                 ");

System.out.println("------------------------------------------------------------------------------------------------------------------");

Scanner scan = newScanner(System.in);

String choose1=scan.nextLine();

switch(choose1) {

case "1":

{

System.out.println("请输入要创建的表名");

String tableName=scan.nextLine();

 System.out.println("请输入要创建的表的列族个数");

 int Num=scan.nextInt();

String [] fields = newString[Num];

 System.out.println("请输入要创建的表的列族");

/*Scanner scanner = new Scanner(System.in);     scanner.next 如不是全局,即会记得上一次输出。相同地址读入值时*/

for(int i=0;i< fields.length;i++)

{

/*BufferedReader in = new BufferedReader(new InputStreamReader(System.in));

fields[i] = in.readLine();*/

/*fields[i]=scan.next(); 因为之前没有输入过,所以可以读入新值*/
scan = newScanner(System.in);

    fields[i]=scan.nextLine();

}

System.out.println("正在执行创建表的操作");

        test_Two.createTable(tableName,fields);

break;

}

case "2":

{

System.out.println("请输入要添加数据的表名");

String tableName=scan.nextLine();

System.out.println("请输入要添加数据的表的行键");

String rowKey=scan.nextLine();

 

System.out.println("请输入要添加数据的表的列的个数");

int num =scan.nextInt();

String fields[]=newString[num];

System.out.println("请输入要添加数据的表的列信息 共"+num+"条信息");

for(int i=0;i< fields.length;i++)

{

BufferedReader in3= new BufferedReader(newInputStreamReader(System.in));

fields[i] =in3.readLine();

/*fields[i]=scan.next(); 因为之前没有输入过,所以可以读入新值*/
 

}

System.out.println("请输入要添加的数据信息 共"+num+"条信息");

String values[]=newString[num];

for(int i=0;i< values.length;i++)

{

BufferedReader in2 = new BufferedReader(newInputStreamReader(System.in));

values[i] =in2.readLine();

 

}

System.out.println("原表信息");

test_Two.getData(tableName);

System.out.println("正在执行向表中添加数据的操作........
");

        test_Two.addRecord(tableName, rowKey, fields, values);

        System.out.println("
添加后的表的信息........");

        test_Two.getData(tableName);

break;

}

case "3":

{

System.out.println("请输入要查看数据的表名");

String tableName=scan.nextLine();

System.out.println("请输入要查看数据的列名");

String column=scan.nextLine();

System.out.println("查看的信息如下:........
");

test_Two.scanColumn(tableName, column);

break;

}

case "4":

{

System.out.println("请输入要修改数据的表名");

String tableName=scan.nextLine();

System.out.println("请输入要修改数据的表的行键");

String rowKey=scan.nextLine();

System.out.println("请输入要修改数据的列名");

String column=scan.nextLine();

System.out.println("请输入要修改的数据信息  ");

String value=scan.nextLine();

System.out.println("原表信息如下:........
");

test_Two.getData(tableName);

System.out.println("正在执行向表中修改数据的操作........
");

test_Two.modifyData(tableName, rowKey, column, value);

System.out.println("
修改后的信息如下:........
");

test_Two.getData(tableName);

 

 

break;

}

case "5":

{

System.out.println("请输入要删除指定行的表名");

String tableName=scan.nextLine();

System.out.println("请输入要删除指定行的行键");

String rowKey=scan.nextLine();

System.out.println("原表信息如下:........
");

test_Two.getData(tableName);

System.out.println("正在执行向表中删除数据的操作........
");

test_Two.deleteRow(tableName, rowKey);

System.out.println("
删除后的信息如下:........
");

test_Two.getData(tableName);

break;

}

default:

{

System.out.println("   你的操作有误 !!!    ");

break;

}

}

        System.out.println(" 你要继续操作吗? 是-true 否-false ");

flag=scan.nextBoolean();

}

System.out.println("   程序已退出!    ");

}

 

}

截图1

(CreateTable)

实验3- 熟悉常用的 HBase 操作第29张

创建表&列族

实验3- 熟悉常用的 HBase 操作第30张

查看创建结果

截图2

addRecord(String tableName, String row, String[] fields, String[]values)

实验3- 熟悉常用的 HBase 操作第31张

实验3- 熟悉常用的 HBase 操作第32张

截图3

scanColumn(String tableName, Stringcolumn)

参数 column 为某一列族名称时

实验3- 熟悉常用的 HBase 操作第33张

实验3- 熟悉常用的 HBase 操作第34张

当参数 column 为某一列具体名称

实验3- 熟悉常用的 HBase 操作第35张

截图4

modifyData(String tableName, String row, Stringcolumn)

实验3- 熟悉常用的 HBase 操作第36张

实验3- 熟悉常用的 HBase 操作第37张

实验3- 熟悉常用的 HBase 操作第38张

实验3- 熟悉常用的 HBase 操作第39张

截图5

deleteRow(String tableName, Stringrow)

实验3- 熟悉常用的 HBase 操作第40张

验中出现问题:(说明和截图)

问题1

PleaseHoldException异常Master is initializing

原因

(由于正在操作Hbase时,电脑突然关机,未正常关闭hbase,故导致shell无法正常显示)如下图:

实验3- 熟悉常用的 HBase 操作第41张

解决过程:

先在网上百度了一个教程:

https://blog.csdn.net/liulang12580/article/details/77841699,可能是因为出错原因不同,所以使用教程并不能完全解决问题,还导致出了别的问题详见以下问题。

然后解决以上问题后,又回到了最初的错误。

实验3- 熟悉常用的 HBase 操作第42张

然后找到了和我一样的情况的博客:https://blog.csdn.net/qq_41665356/article/details/80271562

参考它解决了问题。

① 检查文件 :

hdfs fsck / -locations -blocks -files

出现以下结果:

实验3- 熟悉常用的 HBase 操作第43张

图 1

实验3- 熟悉常用的 HBase 操作第44张

图 2(删除一个文件后)

以上黄色的部分表明:

图 1 有2个文件处于打开状态,说明当时正在写文件时断电了,因此需要删除这2个文件,才可正常启动HBase。

图 2 有1个文件处于打开状态,说明当时正在写文件时断电了,因此需要删除这1个文件,才可正常启动HBase。(因为删除了前一个文件的过程没截图,直接从这个文件开始解释。)

② 查看哪些文件正在打开中:

hdfs fsck / -openforwrite

如下图所示:

实验3- 熟悉常用的 HBase 操作第45张

③黄色部分即为打开的文件执行删除文件(删除的文件与你的上一步结果相对应)

Hadoop dfs -rm

/hbase/WALs/zhaoteng-virtualbox,16201,1539096368516/zhaoteng-virtualbox%2C16201%2C1539096368516.meta.1539096385044 

再次检查:

hadoop fsck / -openforwrite

黄色部分没有文件即可。

然后重启hbase即解决问题。

实验3- 熟悉常用的 HBase 操作第46张

建议:

百度纠错时,尽量找与自己出错原因相近的教程解决问题,否则会给自己带来很多麻烦。

问题1.1

Can't get master address from ZooKeeper; znode data == null

实验3- 熟悉常用的 HBase 操作第47张

解决方法

http://www.aboutyun.com/thread-8691-1-1.html

问题1.2

(pid文件在stop-all.sh stop-dfs.sh,stop-yarn.sh脚本,发现原理都是通过一个pid文件来停止集群的。这些进程的pid文件默认都是保存在系统的/tmp目录下面,不存在

实验3- 熟悉常用的 HBase 操作第48张

解决方法

参考教程:

 https://blog.csdn.net/YonJarLuo/article/details/78252637

有时也因为Hbase shell意外终止,会出现以上问题,重启Hbase即可解决。

问题2

create 建表没有传列族的信息

实验3- 熟悉常用的 HBase 操作第49张

解决方法

创建表时至少要有一个列簇。

Create创建时,传1个以上的列族信息

补充内容:HBase常用类介绍。

举例说明

1.HBaseAdmin

关系:org.apache.hadoop.hbase.client.HBaseAdmin

作用:提供接口关系HBase数据库中的表信息

用法:HBaseAdmin admin = new HBaseAdmin(config);

2.HTableDescriptor

关系:org.apache.hadoop.hbase.HTableDescriptor

作用:HTableDescriptor类包含了表的名字以及表的列族信息

用法:HTableDescriptor htd =new HTableDescriptor(tablename);

Htd.addFamily(new HColumnDescriptor(“myFamily”));

详细数据参考:http://mrpengpengda.iteye.com/blog/1832595

个人理解:HBase关于单元格数据的存取

具体过程

1.查看表列(单元格中不同版本(不同时间戳)的数据)

因为Hbase某列的VERSIONS1,就是默认情况下,该列仅会存取一个版本的列数据,当再次插入时,后面的值会覆盖前面的值。使用getscan得到的都是最新的数据。在Hbase中对同一条数据的修改或插入都只是put操作,最终看到的都是最新的数据,其它的数据在不同的version中保存。

如何显示多个版本的值,修改表的列结构,让Hbase表支持3VERSIONS的版本列数据,通过设置列簇的版本个数,即列族下面的列也是同样的版本个数存储。

alter Score2’,{NAME = > course,VERSION=>3}

2. 再次查看表结构:

实验3- 熟悉常用的 HBase 操作第50张

插入三条数据(在同一个单元格)

实验3- 熟悉常用的 HBase 操作第51张

使用get命令来获取这一行的数据,发现只返回了最新的一行数据。

实验3- 熟悉常用的 HBase 操作第52张

获取多行数据的方法:

实验3- 熟悉常用的 HBase 操作第53张

查看列族时情况相同:

实验3- 熟悉常用的 HBase 操作第54张

获取多行数据的方法:

实验3- 熟悉常用的 HBase 操作第55张

三、未解决问题:(列出没有解决的问题)

实验3- 熟悉常用的 HBase 操作第56张

使用以上命令后出现了hbasemain):行数:1 输入exit,无法退出

Ctrl +SHift+Z:停止Hbase shell ,

具体问题并没有搞清楚,猜想是过滤器的某处出问题,后续继续修改。


免责声明:文章转载自《实验3- 熟悉常用的 HBase 操作》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇ajax全局事件ios app名字的多语言支持下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

java框架之mybatis

一、简介 1、基本概念 mybatis 是一个半自动轻量级的一个 orm 框架 将 java 与 sql 分离,解决了 jdbc 的硬编码问题; sql 由开发人员控制,更加方便 sql 的修改调优; 2、入门程序 2.1 原始方法:通过 sqlsession 来操作数据库 建一个全局配置文件(mybatis-config.xml),配置数据源等运行...

【C++ 异常】error: jump to case label [fpermissive]

编译程序时,编译器报错error: jump to case label [-fpermissive] , error: crosses initialization of 'xxxx',对相关内容进行简单的梳理 一、问题代码 int main() { int test = 2; switch(test) { case 1:...

jni中关于dll的装载问题[转]

   通常我们在写大型项目时,也就是集成的项目时,单独用JAVA语言去完成所有的事情往往效果不佳,也不能很好的完成,例如:我们要去调硬件,获取电脑的运行状况等等(如果用JAVA语言实现时,往往耗时),基于此,我们就要寻求一种很好的解决方案,那就是利用别的语言的长处了,如:C++(它在对底层的调用和硬件方面确实够强悍)。如果我们能用C++实现对硬件的所有操作...

MyBatis(四)映射文件 之 参数获取详解#{} 与 ${}

一、#{} 与${} 的取值 相同点: #{}:可以获取map中的值或者pojo对象属性的值; ${}:可以获取map中的值或者pojo对象属性的值; 区别: #{}:是以预编译的形式,将参数设置到sql语句中;PreparedStatement;防止sql注入; ${}:取出的值直接拼装在sql语句中;会有安全问题; 大多情况下,我们去参数的值都应该去使...

ASP.NET Core SignalR (七):考虑设计向后兼容的SignalR API

此为系列文章,对MSDN ASP.NET Core SignalR 的官方文档进行系统学习与翻译。其中或许会添加本人对 ASP.NET Core 的浅显理解。 使用自定义参数对象来确保向后兼容         向SignalR 中心 方法添加参数(要么是服务端方法,要么是客户端方法)是一个重大的变化。这就意味着老的 服务端/客户端在不带有预期个数的参数进行...

.NET MVC JSON JavaScriptSerializer 字符串的长度超过 maxJsonLength 值问题的解决

1 [ArgumentException: 使用 JSON JavaScriptSerializer 序列化或还原序列化期间发生错误。字符串的长度超过在 maxJsonLength 属性上设定的值。 2 参数名称: input] 3 System.Web.Script.Serialization.JavaScriptSerializer.Dese...