1.1 RHEL7 启动 cgroup 报错
 问题现象
 RHEL7 启动 cgroup 报错 Filed to start cgconfig.service:Unit not found 。
 处理步骤
 步骤 1
 检查以下安装包是否安装,如缺少请安装。
 libcgroup-0.41-8.el7.x86_64.rpm
 libcgroup-tools-0.41-8.el7.x86_64.rpm
 步骤 2
 安装后设置 cgroup 服务开机启动。
 systemctl enable cgconfig.service
 步骤 3
 启动 cgconfig 服务:
 systemctl start cgconfig.service
 1.2 RHEL7 安装 rpm 后, service 命令启动报错
 问题现象
 RHEL7 安装 rpm 后, service 命令启动报错 Unit not found 。
 处理步骤
 步骤 1
 检查 rpm 包是否已经安装。
 步骤 2
 RHEL7 之后的版本 service 需要手动设置。 GBase 8a MPP Cluster FAQ FAQ
 文档版本(2021-04-02) 南大通用数据技术股份有限公司
 11
 systemctl enable XXXX.service
 步骤 3
 正常使用 service 。
 1.3 服务器路由变更无法执行 sql
 问题现象
 服务器路由变更导致集群节点无法接收 sql 任务:某个服务器( ip 为 45 的节点)重
 启后, gcadmin 和数据同步均正常,各 event 均为 0 。但是执行语句时报该节点查询
 返回失败,且该节点的 gnGnode 层 show processlist 显示没有集群层下发的语句进
 来。
 express 日志报错:
 gns_host:10.174.20.32 can't get datasession:Failed to connect to:10.174.18.45,
 Details:last_errno:2003(failed to connect to host)
 原因分析
 通过 route 检查路由列表发现该节点重启后 default 路由变成了非集群 IP 所用的路
 由。
 #route
 Kernel IP routing table
 Destination Gateway Genmask Flags Metric Ref Use Iface
 10.174.18.0 * 255.255.255.0 U
 0 0 0 bond1
 10.174.64.0 *
 255.255.255.0 U
 0 0 0 bond0
 link-local *
 255.255.0.0 U
 1008 0 0 bond0
 link-local *
 255.255.0.0 U 1009 0 0 bond1
 default
 10.174.64.254 0.0.0.0
 UG 0 0 0 bond0
 处理方法
 执行 route del 删除和 route add 新增更换路由得以处理,同时建议系统维护厂商将
 正确路由和网关写入配置文件让其长期有效。
 修改命令:
 route del -net 10.174.64.0 netmask 255.255.255.0 dev bond0
 route del default gw 10.174.64.254
 route add default gw 10.174.18.1
 示例 GBase 8a MPP Cluster FAQ
 #route
 Kernel IP routing table
 Destination Gateway Genmask Flags Metric Ref Use Iface
 10.174.18.0 * 255.255.255.0 U 0
 0 0 bond1
 link-local *
 255.255.0.0 U 1002 0 0 eth0
 link-local *
 255.255.0.0 U 1009 0 0 bond1
 1.0.0.0
 *
 255.0.0.0
 U 0 0 0 eth0
 default
 10.174.18.1 0.0.0.0 UG 0 0 0 bond1
 ————————————————










