
        在上一篇hadoop 快速安装的基础上,进行搭建hive。
hive 是建立在 Hadoop 
上的数据仓库基础构架。它提供了一系列的工具,
可以用来进行数据提取转化加载(ETL),这是一种可以存储、
查询和分析存储在 Hadoop 
中的大规模数据的机制。hive 定义了简单的
类SQL 查询语言,称为 QL,它允许熟悉 SQL 的用户查询数据。同时,
这个语言也允许熟悉 
MapReduce 开发者的开发自定义的 mapper 和 
reducer 来处理内建...      
by skybin090804 - Hadoop和大数据技术 - 2011-12-22 08:52:50 阅读(1493) 回复(0)
hive的metadata是存在rdbms数据里面的,那么metadata里面的主要内容是什么? 是类似于Mysql数据库里面的系统库mysql库里面的内容吗,包含数据库的运行信息。 是这样么?有知道的朋友解惑一下。
我新建了一张表poke,load数据是正确的但是select就报错,请问是什么原因呢? java.io.IOException at org.apache.hadoop.mapred.ClientServiceDelegate.invoke(ClientServiceDelegate.java:317) at org.apache.hadoop.mapred.ClientServiceDelegate.getJobStatus(ClientServiceDelegate.java:385) at org.apache.hadoop.mapred.YARNRunner.getJobStatus(YARNRunner.java:482) at org.apache.hadoop.mapreduce.Job$1.run(Job....
      
当使用hadoop成为web日志或生产日志的存储池后,我们可以使用./hive登录到hive shell中
进行查询操作。但为了方便,在查询方面用python进行封装好相应方法进行使用,用java进行我们的统计分析。
使用hive客户端的相关功能只需要将${hive_home}/lib/py路径加入但python的运行环境路径中就行了。
如以下脚本:
#/usr/bin/env python
#-*- coding: utf-8 -*-
import os,sys
...    
本帖最后由 zhaopingzi 于 2013-12-18 14:36 编辑 [code] hive> INSERT OVERWRITE TABLE hbase_table_1 SELECT * FROM pokes WHERE foo=86; Total MapReduce jobs = 1 Launching Job 1 out of 1 Number of reduce tasks is set to 0 since there's no reduce operator java.lang.NullPointerException at java.util.Hashtable.put(Hashtable.java:542) at java.util.Properties.setProperty(Properties.java:...
[code] hive> select * from pokes; OK 1 redtao 3 blacktao 4 fangk Time taken: 9.728 seconds, Fetched: 3 row(s) hive> hive> select * from pokes where foo=3; Total MapReduce jobs = 1 Launching Job 1 out of 1 Number of reduce tasks is set to 0 since there's no reduce operator Starting Job = job_201312091541_0020, Tracking URL = http://mysql3:50030/jobdetails.jsp?jobid=job_20131209154...
我新建了一张表poke,load数据是正确的但是select就报错,请问是什么原因呢? java.io.IOException at org.apache.hadoop.mapred.ClientServiceDelegate.invoke(ClientServiceDelegate.java:317) at org.apache.hadoop.mapred.ClientServiceDelegate.getJobStatus(ClientServiceDelegate.java:385) at org.apache.hadoop.mapred.YARNRunner.getJobStatus(YARNRunner.java:482) at org.apache.hadoop.mapreduce.Job$1.run(Job....
python 如何连接hive呢 我按照网上的帖子: 安装thrift ./bootstrap.sh 下载的是thrift-0.8.0.tar.gz 但是解压后只有setup.py。到底如何安装 如何连接hive,请讲解
      昨天晚上看了一下hive HQL的优化器。这个优化器相比于GCC4、LLVM的优化器而言极其简单,但
结构也非常地清晰。
hive优化器结构
*   总体结构
    总体上讲,hive的优化器是一种基于Pass的优化器,Pass在hive中称为Transform。与此同时,
为了便于每个Transform的编写,hive还提供了一个框架,用于遍历一遍当前DAG图,并在每个节
点上执行规则指定的操作。
  &nbs...    
This page contains details about the hive design and architecture. A brief technical report about hive is available at hive.pdf . 目录 hive Architecture hive Data Model Metastore Motivation Metadata Objects Metastore Architecture Metastore Interface hive Query Language Compiler Optimizer Execution Conclusion Figure 1 hive Architecture Figure 1 shows the major components of hive...