RAC misscount-CFANZ编程社区

RAC misscount

提到OCSSD 这个进程是Clusterware最关键的进程，如果这个进程出现异常，会导致系统重启，这个进程提供CSS(Cluster Synchronization Service)服务。 CSS 服务通过多种心跳机制实时监控集群状态，提供脑裂保护等基础集群服务功能。

RAC misscount_oracle

RAC misscount_重启_02

CSS 服务有2种心跳机制：一种是通过私有网络的Network Heartbeat，另一种是通过Voting Disk的Disk Heartbeat.这2种心跳都有最大延时，对于Disk Heartbeat，这个延时叫作IOT (I/O Timeout);对于Network Heartbeat, 这个延时叫MC(Misscount)。这2个参数都以秒为单位，缺省时IOT大于MC，在默认情况下，这2个参数是Oracle 自动判定的，并且不建议调整。

可以通过如下命令来查看参数值：

$crsctl get css disktimeout

$crsctl get css misscount

如：

[root@RAC1 ~]# /u01/app/11.2.0/grid/bin/crsctl get css misscount

CRS-4678: Successful get misscount 30 for Cluster Synchronization Services.

[root@RAC1 ~]# /u01/app/11.2.0/grid/bin/crsctl get css disktimeout

CRS-4678: Successful get disktimeout 200 for Cluster Synchronization Services.

misscount

这个值是用来定义集群网络心跳超时的时间，默认值是30，也就是说，当集群中的一个或者多个节点连续丢失网络心跳超过misscount时间后，集群需要重新配置，某一个或多个节点需要离开集群。当然，对于11GR2版本集群，这个值也就是本地心跳的超时时间，因为本地心跳和网络心跳由相同进程发送的。

（Oracle每⼀秒在向远端节点发送⽹络⼼跳的同时，同⼀进程向cssdagentd代理和cssdmonitor代理发送本地ocssd.bin进程的状态。）

当集群的某一个节点连续一段时间（超过集群misscount）丢失网络心跳后，分析线程决定发起集群重新配置，即发生脑裂，后面通过表决盘来避免脑裂。