Hive的访问接口 | Allen's World

摘要:
配置单元的访问接口| Allen的WorldHive的访问接口配置单元提供三个客户端访问接口:1)HiveCLI。客户端可以直接在命令行模式下操作。让我们尝试以下三种接口访问方法:1.HiveCLI可以通过直接键入hive命令进入CLI模式:[cloud@cloud01lib]$hiveHivehistoryfile=/tmp/cloud/hive_job_log_cloud_201110311056_1009535967.txthive>展台;OK测试移动硬盘时间:3.038秒移动>从testhivedrivertable中选择*;OK所用时间:0.905秒移位>退出[ cloud@cloud01lib]有关更多命令选项,请参阅官方wiki。HiveCli II和HivehwiHivehwi提供了更直观的web界面,使用更方便。1) 启动hiveserver[cloud@cloud01~]$hive--servicehiveserverStartingHiveThriftServer2)创建Java项目Hive0.7.1Test3)设置$hive_ HOME/lib目录中的jar包被添加到项目的构建路径中。4) Hive的表存储在HDFS上,因此需要加载Hadoop的核心jar包。

Hive的访问接口 | Allen's World

Hive的访问接口

Hive提供了三种客户端访问接口:

1)Hive CLI(Hive Command Line,Hive命令行),客户端可以直接在命令行模式下进行操作。

2)hwi(Hive Web Interface,Hive Web接口),Hive提供了更直观的Web界面

3)hiveserver,Hive提供了Thrift服务,Thrift客户端目前支持C++/Java/PHP/Python/Ruby。

下面我们来分别尝试下这三种接口访问方式:

一、Hive CLI

直接键入hive命令即可进入CLI模式:

[cloud@cloud01 lib]$ hive

Hivehistory file=/tmp/cloud/hive_job_log_cloud_201110311056_1009535967.txt

hive>show tables;
OK

testhivedrivertable

Timetaken:3.038seconds

hive>select*fromtesthivedrivertable;
OK

Timetaken:0.905seconds

hive>quit;
[cloud@cloud01 lib]$

更多的命令选项,参见官方wiki,Hive Cli

二、Hive hwi

Hive hwi提供了一个更直观的web界面,使用起来更方便。

1)启动hive hwi

[cloud@cloud01 ~]$ hive --service hwi

11/10/3110:14:11INFO hwi.HWIServer:HWI isstarting up

11/10/3110:14:11INFO mortbay.log:Loggingto org.slf4j.impl.Log4jLoggerAdapter(org.mortbay.log)via org.mortbay.log.Slf4jLog
11/10/3110:14:11INFO mortbay.log:jetty-6.1.14
11/10/3110:14:11INFO mortbay.log:Extractjar:file:/data/cloud/hive-0.7.1/lib/hive-hwi-0.7.1.war!/ to /tmp/Jetty_0_0_0_0_9999_hive.hwi.0.7.1.war__hwi__.hf8ccz/webapp

11/10/3110:14:12INFO mortbay.log:StartedSocketConnector@0.0.0.0:9999

2)通过hwi方式访问Hive

我的Hive部署在10.46.169.101机器上,hive默认hwi端口为9999。我们在浏览器中键入http://10.46.169.101:9999/hwi/就可以访问了。如图:

Hive的访问接口 | Allen's World第1张

更多hwi的信息,访问官方wiki,hwi

三、hiveserver

Hive以Thrift方式作为服务对客户端提供,目前Hive的Thrift绑定了多种语言,C++/Java/PHP/Python/Ruby,可在Hive发行版本的src/service/src目录下找到这些语言的Thrift绑定。Hive还提供了JDBC和ODBC的驱动,大大方面了基于Hive的应用开发。我利用官方的例子对JDBC驱动进行了测试。

1)启动hiveserver

[cloud@cloud01 ~]$ hive --service hiveserver

StartingHiveThriftServer

2)在Eclipse中新建一个Java工程Hive0.7.1Test

3)将$HIVE_HOME/lib目录下的jar包加到工程的buildpath里

4)Hive的表是存储在HDFS上,所以,需要加载Hadoop的核心jar包。我的Hadoop版本是0.20.1。

5)新建一个class,用官方wiki提供的代码,如下:

importjava.sql.SQLException;
importjava.sql.Connection;
importjava.sql.ResultSet;
importjava.sql.Statement;
importjava.sql.DriverManager;
publicclassHiveJdbcClient{
privatestaticStringdriverName ="org.apache.hadoop.hive.jdbc.HiveDriver";
/**

* @param args

* @throws SQLException

*/
publicstaticvoidmain(String[]args)throwsSQLException{
try{
Class.forName(driverName);
}catch(ClassNotFoundExceptione){
// TODO Auto-generated catch block
e.printStackTrace();
System.exit(1);
}
Connectioncon =DriverManager.getConnection(
"jdbc:hive://10.46.169.101:10000/default","","");
Statementstmt =con.createStatement();
StringtableName ="testHiveDriverTable";
stmt.executeQuery("drop table "+tableName);
ResultSetres =stmt.executeQuery("create table "+tableName

+" (key int, value string)");
// show tables
Stringsql ="show tables '"+tableName +"'";
System.out.println("Running: "+sql);
res =stmt.executeQuery(sql);
if(res.next()){
System.out.println(res.getString(1));
}
// describe table
sql ="describe "+tableName;
System.out.println("Running: "+sql);
res =stmt.executeQuery(sql);
while(res.next()){
System.out.println(res.getString(1)+"\t"+res.getString(2));
}
// load data into table
// NOTE: filepath has to be local to the hive server
// NOTE: /tmp/a.txt is a ctrl-A separated file with two fields per line
Stringfilepath ="/tmp/a.txt";
sql ="load data local inpath '"+filepath +"' into table "
+tableName;
System.out.println("Running: "+sql);
res =stmt.executeQuery(sql);
// select * query
sql ="select * from "+tableName;
System.out.println("Running: "+sql);
res =stmt.executeQuery(sql);
while(res.next()){
System.out.println(String.valueOf(res.getInt(1))+"\t"
+res.getString(2));
}
// regular hive query
sql ="select count(1) from "+tableName;
System.out.println("Running: "+sql);
res =stmt.executeQuery(sql);
while(res.next()){
System.out.println(res.getString(1));
}
}
}
6)编译运行,console如下:
<div>2011-10-31 11:21:31,703 WARN [main] conf.Configuration(175): DEPRECATED: hadoop-site.xml found in the classpath. Usage of hadoop-site.xml is deprecated. Instead use core-site.xml, mapred-site.xml and hdfs-site.xml to override properties of core-default.xml, mapred-default.xml and hdfs-default.xml respectively</div><div>Running: show tables 'testHiveDriverTable'</div><div>testhivedrivertable</div><div>Running: describe testHiveDriverTable</div><div>keyint</div><div>valuestring</div><div>Running: load data local inpath '/tmp/a.txt' into table testHiveDriverTable</div><div>Exception in thread "main" java.sql.SQLException: Query returned non-zero code: 10, cause: FAILED: Error in semantic analysis: Line 1:23 Invalid path '/tmp/a.txt': No files matching path file:/tmp/a.txt</div><div>at org.apache.hadoop.hive.jdbc.HiveStatement.executeQuery(HiveStatement.java:192)</div><div>at com.zte.allen.hive.HiveJdbcClient.main(HiveJdbcClient.java:53)</div>
报了一个Exception,是因为加载源是找不到/tmp/a.txt。这个不影响,但可以从hwi里看到已经新建了一个表testhivedrivertable。
更多关于hiveserver的内容,参见官方wikiSetting up Hive Server, 还有这里介绍了各种客户端(cli、Java、PHP、Python、ODBC、Thrift方式等)如何访问Hive。

免责声明:文章转载自《Hive的访问接口 | Allen's World》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇在webapp上使用input:file, 指定capture属性调用默许相机,摄像,录音功能使用Areas分离ASP.NET MVC项目下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

Microsoft SQL Server 2000 的国际化功能(1)

简介 Microsoft? SQL Server? 2000 包括各种支持国际化操作和环境的强大功能。扩展的多种语言功能使 SQL Server 2000 成为一种引人注目的数据库产品和应用程序平台。本文将完整地概述在全球范围内使用这些功能的方法。 除了列出一系列功能外,本文还将解释国际化/多种语言要求会怎样影响项目的各个方面。 什么是...

Vba+access+Excel编程

学习目的是建立简易的管理系统 当前学习路线:excel的宏的简单了解→access数据库的了解→两者的结合 excel的宏的简单了解: 关于宏的使用,大部分文章都提到说Vba很难写,但是可以通过一段现成的代码,修改关键部分来为自己所用,现成代码的获得方式就是录制宏,在其自动生成的代码上添加循环等修改,达到自己想要的效果。 关于宏的录制与代码的修改运行如下:...

利用JDBC连接Oracle数据库(转)

http://blog.csdn.net/wahaha1_/article/details/8512438 JDBC是Sun公司制定的一个可以用Java语言连接数据库的技术。 一、JDBC基础知识 JDBC(JavaDataBaseConnectivity,java数据库连接)是一种用于执行SQL语句的JavaAPI,可以为多种关系数据库提供统一访问...

Hive on Spark 和Hive on mr执行结果不一致原因剖析

一、Hive 执行引擎概述 目前hive执行引擎支持三种,包括mr、spark和Tz;mr是hive最早支持的数据类型,执行速度最慢,但是性能上也是最为稳定的;spark和Tz是后续支持的执行引擎,也是将hive的SQL语句转换为spark可以识别的sparksql语句进行执行。 二、当有空表出现时,spark和mr执行引擎结果不一样问题排查 示例:sel...

hive 之 将excel数据导入hive中 : excel 转 txt

一、需求: 1、客户每月上传固定格式的excel文件到指定目录。每月上传的文件名只有结尾月份不同,如: 10月文件名:  zhongdiangedan202010.xlsx  , 11月文件名: zhongdiangedan202011.xlsx  2、将上传的excel文件导入hive中,在做进一步数据分析。 二、思路:   1、通过python的pan...

Sql Server 常用系统存储过程大全

-- 来源于网络 -- 更详细的介结参考联机帮助文档 xp_cmdshell --*执行DOS各种命令,结果以文本行返回。 xp_fixeddrives --*查询各磁盘/分区可用空间 xp_loginconfig --*报告SQL Server 实例在Windows 上运行时的登录安全配置 xp_logininfo --*返回有关Windows 认证登录...