背景

主要监控数据来源

1.阿里云工作台的监控 2.kibana内部的Monitoring

第一次升级

我们从 2核8g 2节点，升级到 2核8g 3节点，性能一点没变。老配置运行了2年以上的时间，基本没有问题。

这次升级,就是因为2节点存在脑裂问题。

这里有2点需要关心:

Q1. 为什么可以2节点可以运行2年多，很少出问题? // TODO 附录1: minimum_master_nodes设定对你的集群的稳定极其重要。设置成1可以保证集群的功能，但是就无法防止集群脑裂了

GET /_cluster/settings
响应如下:
{
  "persistent" : {
    "cluster" : {
      "routing" : {
        "allocation" : {
          "node_concurrent_incoming_recoveries" : "1",
          "node_concurrent_recoveries" : "1",
          "exclude" : {
            "_ip" : ""
          },
          "enable" : "all"
        }
      }
    },
    "search" : {
      "isolator" : {
        "enabled" : "true"
      },
      "max_buckets" : "10000"
    },
    "monitoring" : {
      "collector" : {
        "kmonitor" : {
          "enabled" : "true"
        }
      }
    },
    "discovery" : {
      "zen" : {
        "minimum_master_nodes" : "2" // 这里的配置
      }
    }
  },
  "transient" : {
    "cluster" : {
      "routing" : {
        "allocation" : {
          "node_concurrent_incoming_recoveries" : "1",
          "cluster_concurrent_rebalance" : "6",
          "node_concurrent_recoveries" : "1",
          "exclude" : {
            "_ip" : ""
          }
        }
      }
    },
    "indices" : {
      "recovery" : {
        "max_bytes_per_sec" : "50mb"
      }
    }
  }
}

Q2. 2节点时出问题怎么办的? // TODO

Q3. 为什么又要升级为3节点了? 1.试图加节点来提升性能,升级后基本性能没有提升。// 核心需求 2.防止脑裂。这个不是刚性需求。