网络拓扑-节点距离计算
在 HDFS 写数据的过程中,NameNode 会选择距离待上传数据最近距离的 DataNode 接 收数据。
最近的距离怎么计算呢?
节点距离:两个节点到达最近的共同祖先的距离总和。
副本存储节点选择
第一个副本在Client所处的节点上。
one replica on the local machine
第二个副本在另一个机架的随机 一个节点
another replica on a node in a different (remote) rack
第三个副本在第二个副本所在机架的 随机节点
the last on a different node in the same remote rack.