xxxx  | 
2020年06月  | 
日期  | 版本  | 修订说明  | 修改人  | 
2020-06-28  | V1.0.0  | 创建文档  | 王昱翔  | 
  |   |   |   | 
  |   |   |   | 
  |   |   |   | 
  |   |   |   | 
  |   |   |   | 
目 录
1. 引言 3
1.1 背景介绍 3
1.2 编写目的 3
1.3 适用范围 3
1.4 角色职责 3
1.5 其他 4
2. 当前环境概述 4
2.1离线数仓收集信息的 4
2.2 关闭收集信息的操作 5
- 引言
 
- 背景介绍xxx项目承接了线上多种实时数据,对主要的指标进了15分钟一次查询,这些统计指标对上层知道运营有重要作用。出版上线至今平台稳定运行,但日益增长的用户数量导致每日数据量不断增长,当前的集群面临严峻的处理能力和稳定性的挑战。
驾驶舱集群自上线(2019.10月份)上线后,承接了离线计算的主要任务,已有表数目接近10000张,单日任务数量接近3万,单表最大数据规模超过8亿+;集群目前处于亚健康状态,现在集群上每周五收集集群信息,占用大量的资源,需要关闭Collect Diagnostic Data Globally。 - 编写目的指导本次CDH平台关闭Collect Diagnostic Data Globally。
 - 适用范围
 
- 甲方leader
 - 运维开发人员
 - 数据开发人员
 
- 角色职责
 
角色  | 职责  | 备注  | 
PD  | 需求提出者,发起需求评审,制定需求优先级,参与系分、测试评审;   | 核心  | 
设计人员  | 细分设计,制定开发计划,参与需求、测试评审  | 核心  | 
运维人员  | 负责发布的执行;负责通知下游关联影响。  | 核心  | 
- 其他其他需要说明的内容。
 
当前环境概述
驾驶舱集群自上线(2019.10月份)上线后,承接了离线计算的主要任务,已有表数目接10000张,单日任务数量接近3万,单表最大数据规模超过8亿+集群目前处于亚健康状态,需要对CDH集群关闭Collect Diagnostic Data Globally,减少资源收集信息时占用大量的资源。
2.1离线数仓收集信息的
离线总共41节点,收集信息的报错情况如下。
 
 
2.2 关闭收集信息的操作
1.进入集群管理---设置
 
2.允许使用情况数据收集对钩打掉,点击保存更改即可。
 
3.关闭自动将诊断数据发送至cloudera关闭,计划的诊断数据收集频率每周改成从不,关闭使用http上载诊断数据
 










