hive 分区表使用的一些注意事项-CFANZ编程社区

hive 外表数据读取：

1、hive非分区普通表：

1）建立外表：

CREATE EXTERNAL TABLE `test_liu`(
  `a` string, 
  `b` string, 
  `c` string)
ROW FORMAT DELIMITED 
  FIELDS TERMINATED BY '\t' 
STORED AS INPUTFORMAT 
  'org.apache.hadoop.mapred.TextInputFormat' 
OUTPUTFORMAT 
  'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat'
LOCATION
  '/data/qytt/test/testhive'

2）上传文件到hdfs目录：

$ hadoop fs -put test1 /data/qytt/test/testhive/

3）查询：

hive> select * from test_liu;

1 2 3

2、hive分区外表：

1）建立外表：

CREATE EXTERNAL TABLE `test_liu`(
  `a` string, 
  `b` string, 
  `c` string)
PARTITIONED BY ( 
  `dt` string)
ROW FORMAT DELIMITED 
  FIELDS TERMINATED BY '\t' 
STORED AS INPUTFORMAT 
  'org.apache.hadoop.mapred.TextInputFormat' 
OUTPUTFORMAT 
  'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat'
LOCATION
  '/data/qytt/test/testhive'

2）上传文件到hdfs目录：

A、创建分区目录

$ hadoop fs -mkdir /data/qytt/test/testhive/dt=1

B、上传文件

$ hadoop fs -put test1 /data/qytt/test/testhive/dt=1

3）查询：

A、必须创建分区，否则查不出数据：

alter table test_liu add partition (dt="1");

hive> show partitions test_liu;

dt=1

B、然后查询：

hive> select * from test_liu;

1 2 3

4）

此时，往/data/qytt/test/testhive/dt=1目录下再建一个空目录，

hadoop fs -mkdir /data/qytt/test/testhive/dt=1/hour=0

然后执行查询会报如下错

Failed with exception java.io.IOException:java.io.IOException: Not a file: hdfs://hadoop-jy-namenode/data/qytt/test/testhive/dt=1/hour=0

3、创建多分区目录：

1)建立外表：

CREATE EXTERNAL TABLE `test_liu`(
  `a` string, 
  `b` string, 
  `c` string)
PARTITIONED BY ( 
  `dt` string,
  `hour` string)
ROW FORMAT DELIMITED 
  FIELDS TERMINATED BY '\t' 
STORED AS INPUTFORMAT 
  'org.apache.hadoop.mapred.TextInputFormat' 
OUTPUTFORMAT 
  'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat'
LOCATION
  '/data/qytt/test/testhive'

2)上传文件到hdfs目录：

A、创建分区目录

$ hadoop fs -mkdir /data/qytt/test/testhive/dt=1

B、创建分区目录

$ hadoop fs -mkdir /data/qytt/test/testhive/dt=1/hour=0

C、上传文件

$ hadoop fs -put test1 /data/qytt/test/testhive/dt=1

3）查询：

A、创建分区：

alter table test_liu add partition (dt="1");

FAILED: SemanticException partition spec {dt=1} doesn't contain all (2) partition columns

添加多分区时，必须同时指定，否则报错。