控制Elasticsearch的分片分布到不同的机器上

方法一:修改配置文件,设置参数
# vim elasticsearch.yml
cluster.routing.allocation.same_shard.host: true
这个设置是告诉es,将同一shard的primary shard和replica shard分步在不同的主机上(官方文档说按照不同的IP或主机名称来判断是否是同一主机)。这个值,ES默认是false。注意:如果是已经在生产环境使用的ES(每个机器的节点大于1个时),修改完配置重启节点时,可能会导致最后一个节点没有数据(因为最后一个节点在重启的时候,其他节点已经将他这个节点上的数据分配到同一机器上的另外一个节点)。   方法二:设置rack_id
node.rack_id: rack_1
cluster.routing.allocation.awareness.attributes: rack_id
Rack原义是货架,在这里是指机柜。这个rack_id其实可以自己定义, 上面配置的第二行就是如何定义这个名称。这样定义后,分片会被尽量的分片在不同的rack_id上面。如果rack_1和rack_2在不同的机器上,则就能实现将shard分布在不同的机器上的效果。定义这个名称后,如何查看索引是否分布在不同的机器上(第一个命令只记录了node_name,需要用第二个命令查询对应是那台机器):
curl -XGET 'http://127.0.0.1:9250/index_name/_status?pretty=true'
curl -XGET 'http://127.0.0.1:9250/_cluster/nodes?pretty=true'
参考:https://www.elastic.co/guide/en/elasticsearch/reference/current/modules-cluster.html            https://www.elastic.co/guide/en/elasticsearch/reference/2.3/shards-allocation.html#_shard_allocation_settings            https://www.elastic.co/guide/en/elasticsearch/reference/2.3/allocation-awareness.html

0 个评论

要回复文章请先登录注册