0
点赞
收藏
分享

微信扫一扫

RAC misscount

花姐的职场人生 2022-08-17 阅读 53


    提到OCSSD 这个进程是Clusterware最关键的进程,如果这个进程出现异常,会导致系统重启,这个进程提供CSS(Cluster Synchronization Service)服务。 CSS 服务通过多种心跳机制实时监控集群状态,提供脑裂保护等基础集群服务功能。

RAC misscount_oracle

RAC misscount_重启_02

       CSS 服务有2种心跳机制: 一种是通过私有网络的Network Heartbeat,另一种是通过Voting Disk的Disk Heartbeat.这2种心跳都有最大延时,对于Disk Heartbeat, 这个延时叫作IOT (I/O Timeout);对于Network Heartbeat, 这个延时叫MC(Misscount)。 这2个参数都以秒为单位,缺省时IOT大于MC,在默认情况下,这2个参数是Oracle 自动判定的,并且不建议调整。

可以通过如下命令来查看参数值:

$crsctl get css disktimeout

$crsctl get css misscount

如:

[root@RAC1 ~]# /u01/app/11.2.0/grid/bin/crsctl  get css misscount

CRS-4678: Successful get misscount 30 for Cluster Synchronization Services.

[root@RAC1 ~]# /u01/app/11.2.0/grid/bin/crsctl  get css disktimeout

CRS-4678: Successful get disktimeout 200 for Cluster Synchronization Services.

 

misscount

这个值是用来定义集群网络心跳超时的时间,默认值是30,也就是说,当集群中的一个或者多个节点连续丢失网络心跳超过misscount时间后,集群需要重新配置,某一个或多个节点需要离开集群。当然,对于11GR2版本集群,这个值也就是本地心跳的超时时间,因为本地心跳和网络心跳由相同进程发送的。

(Oracle每⼀秒在向远端节点发送⽹络⼼跳的同时,同⼀进程向cssdagentd代理和cssdmonitor代理发送本地ocssd.bin进程的状态。)

当集群的某一个节点连续一段时间(超过集群misscount)丢失网络心跳后,分析线程决定发起集群重新配置,即发生脑裂,后面通过表决盘来避免脑裂。

举报

相关推荐

0 条评论