0
点赞
收藏
分享

微信扫一扫

大数据学习笔记-------------------(19)

第四部分HIVE学习

 该部分,主要对HIV学习笔记进行记录,学习资料翻译自《hive_tutorial》

该部分为10个章节来学习HIVE:

Ø  第19章 HIVE介绍

Ø  第20章 HIVE 安装

Ø  第21章 HIVE 数据类型

Ø  第22章 数据库操作

Ø  第23章 数据表操作

Ø  第24章 分区

Ø  第25章 内置运算符

Ø  第26章 内置函数

Ø  第27章 视图与索引

Ø  第28章 HIVEQL

 

第19章 HIVE介绍

19.1HIVE是什么?

         Hive是一个用于在Hadoop中处理结构化数据的数据仓库基础结构工具。它驻留在Hadoop之上,总结大数据,并使查询和分析变得容易。

         最初Hive由Facebook开发,后来Apache软件基金会并进一步开发为ApacheHive名下的开源软件。它被不同的公司使用。例如,Amazon在Amazon Elastic MapReduce中使用它:

         HIVE不是一个关系型数据库;HIVE也不是为OLTP(线上事务处理)设计的;HIVE也不是一个实时查询、行级更新的语言

19.2HIVE特点

 HIVE特如下:

l  把数据库中的模式和处理过的数据存储进HDFS中

l  为OLAP设计

l  提供查询的SQL类型的语言称之为HIVEQL或HQL

l  熟悉、快速、延展性、可扩展性

19.3HIVE架构

        大数据学习笔记-------------------(19)_HIVE架构     

       此组件图包含不同的单元,下表描述每个单元

大数据学习笔记-------------------(19)_HIVE架构_02

19.5HIVE工作流

下图描述了Hive和Hadoop之间的工作流

  大数据学习笔记-------------------(19)_HIVE架构_03      

下表定义HIVE如何与Hadoop框架交互:

大数据学习笔记-------------------(19)_HIVE与HADOOP的工作流_04


举报

相关推荐

0 条评论