0
点赞
收藏
分享

微信扫一扫

实时即未来,车联网项目之phoenix on hbase 即席查询【四】


文章目录

  • ​​Phoenix的介绍和客户端命令​​
  • ​​构建HBase的二级索引​​
  • ​​原始数据itcast_src构建二级索引​​
  • ​​phoenix 使用场景​​
  • ​​车辆常用字段明细数据 ETL​​
  • ​​车辆明细数据统计​​
  • ​​车辆总数统计​​
  • ​​车辆电量统计​​
  • ​​车辆油耗统计​​
  • ​​车辆速度统计​​
  • ​​车辆数据统计意义分析​​
  • ​​Zeppelin简介​​
  • ​​zeppelin UI介绍​​
  • ​​zeppelin整合mysql​​
  • ​​zeppelin整合hive​​
  • ​​车辆电量、速度数据统计报表​​
  • ​​问题​​

Phoenix的介绍和客户端命令

  • Phoenix的概念
  • Phoenix on HBase 和 Hive on HDFS 的区别
  • Phoenix 客户端命令操作及说明
  • 查看表操作

① TABLE_SCHEMA

② 对应 HBase 的 namespace

  • 创建表的操作

  • 新增数据

  • 查询操作

  • 更新操作

  • 删除操作

构建HBase的二级索引

  • 为什么需要构建二级索引
  • 索引的类型

    概念:
    创建:

查看:

删除:

概念:

创建:

查看:

删除:

概念:

创建:

查看:

删除:

概念:

创建:

查看:

删除:

  • 本地索引和全局索引的比较
  • 索引的优化

原始数据itcast_src构建二级索引

  • 创建 HBase 表对应的 phoenix 表
  • 创建 HBase 表对应的 phoenix 视图

phoenix 使用场景



车辆常用字段明细数据 ETL

  • 常用字段
  • 创建 HBase 车辆指标即席查询表

  • 在 ETL 主任务中添加常用字段落地逻辑
  • srcDataStream.addSink(new VehicleDetailSinkOptimizer(“itcastsrc_vehicle_detail”));
  • 编写核心业务逻辑 实现 RichSinkFunction

private Put setDataSourcePut(ItcastDataObj itcastDataObj) {
//确定rowkey
String rowKey = itcastDataObj.getVin() + StringUtil.reverse(itcastDataObj.getTerminalTimeStamp().toString());
Put put = new Put(Bytes.toBytes(rowKey));
//设置需要写入的列有那些
//这两个列一定不为空,如果为空就不是正常数据了
put.addColumn(Bytes.toBytes(cf), Bytes.toBytes("vin"), Bytes.toBytes(itcastDataObj.getVin()));
put.addColumn(Bytes.toBytes(cf), Bytes.toBytes("terminalTime"), Bytes.toBytes(itcastDataObj.getTerminalTime()));

//电量百分比(currentElectricity)、当前电量(remainPower)、百公里油耗(fuelConsumption100km)、
// 发动机速度(engineSpeed)、车辆速度(vehicleSpeed)
if(itcastDataObj.getCurrentElectricity() != -999999D){
put.addColumn(Bytes.toBytes(cf), Bytes.toBytes("currentElectricity"), Bytes.toBytes(itcastDataObj.getCurrentElectricity()));
}
if(itcastDataObj.getRemainPower() != -999999D){
put.addColumn(Bytes.toBytes(cf), Bytes.toBytes("remainPower"), Bytes.toBytes(itcastDataObj.getRemainPower()));
}
if(StringUtils.isNotEmpty(itcastDataObj.getFuelConsumption100km()) ){
put.addColumn(Bytes.toBytes(cf), Bytes.toBytes("fuelConsumption100km"), Bytes.toBytes(itcastDataObj.getFuelConsumption100km()));
}
if(StringUtils.isNotEmpty(itcastDataObj.getEngineSpeed()) ){
put.addColumn(Bytes.toBytes(cf), Bytes.toBytes("engineSpeed"), Bytes.toBytes(itcastDataObj.getEngineSpeed()));
}
if(itcastDataObj.getVehicleSpeed() != -999999D){
put.addColumn(Bytes.toBytes(cf), Bytes.toBytes("vehicleSpeed"), Bytes.toBytes(itcastDataObj.getVehicleSpeed()));
}
put.addColumn(Bytes.toBytes(cf), Bytes.toBytes("processTime"), Bytes.toBytes(DateUtil.getCurrentDateTime()));

//返回put对象
return put;
}

  • 在 phoenix 中创建车联指标即席查询明细视图

车辆明细数据统计

车辆总数统计

  • 统计车辆明细总数

  • 统计每天在线的车辆总数

车辆电量统计

  • 统计车辆电量百分比

  • 统计当前电量

车辆油耗统计

  • 统计车辆百公里油耗

车辆速度统计

  • 统计车辆发动机速度

  • 统计车辆速度vehicleSpeed,求最大、最小、平均车速

车辆数据统计意义分析

Zeppelin简介

  • zeppelin应用场景
  • zeppelin安装介绍

zeppelin UI介绍

zeppelin整合mysql

zeppelin整合hive

车辆电量、速度数据统计报表

  • 车辆电量统计报表
  • 车辆速度统计报表

问题

  • 如何删除topic并初始化数据

步骤:
1.检查 server.properties 配置文件中 delete.topic.enable=true,三台都要设置重启集群。
2.删除kafka中topic vehicledata
[root@node01 kafka]# bin/kafka-topics.sh --zookeeper node01:2181,node02:2181,node03:2181 --delete --topic vehicledata
# 使用 kafka-tools 客户端删除topic
3.打开 zkCli.sh 删除三组配置
rmr /brokers/topics/vehicledata
rmr /config/topics/vehicledata
rmr /admin/delete_topics/vehicledata
4.如果kafka集群没有关闭,关闭kafka集群
5.清空log.dirs=/export/data/kafka/kafka-logs目录就是kafka集群的数据目录
rm -rf /export/data/kafka/kafka-logs/*
6.重启kafka集群
7.创建topic vehicledata
[root@node01 kafka]# bin/kafka-topics.sh --zookeeper node01:2181 --create --topic vehicledata --partitions 3 --replication-factor 2


举报

相关推荐

0 条评论