详细描述一下 Elasticsearch 索引文档的过程 ?

面试官想了解 ES 的底层原理不再只关注业务层面了

解答

这里的索引文档应该理解为文档写入 ES,创建索引的过程

文档写入包含单文档写入和批量 bulk 写入这里只解释一下单文档写入流程

记住官方文档中的这个图

第一步客户写集群某节点写入数据发送请求。(如果没有指定路由/协调节点

请求的节点扮演路由节点的角色。)第二步节点 1 接受到请求后使用文档_id 来确定文档属于分片 0。请求会被转 

到另外的节点假定节点 3。因此分片 0 的主分片分配到节点 3

第三步节点 3 在主分片上执行写操作如果成功则将请求并行转发到节点 1

和节点 2 的副本分片上等待结果返回所有的副本分片都报告成功节点 3  

向协调节点节点 1)报告成功节点 1 向请求客户端报告写入成功

如果面试官再问第二步中的文档获取分片的过程

回答借助路由算法获取路由算法就是根据路由和文档 id 计算目标的分片 id  

过程

1shard = hash(_routing) % (num_of_primary_shards)

相关推荐