ElasticSearch(十一)-深入分片

1.文本搜索
  倒排索引存储
写入磁盘的倒排索引是不可改变的:
1)不需要锁
2)一旦写入内存,因为不需改变,所以一直在那,有助性能
3)压缩数据,减少IO和内存大小占用
 
2.动态索引??
段是不可改变的,文档不能从旧的段中删除,每个文档被删除只是.del文件中被标记删除,依然可以匹配查询,只是最终返回前被移除结果集中。
更新就是先删除后插入
 
3.近实时搜索
  Refeash 
PUT /my_logs
{
  "settings": {
    "refresh_interval": "1s" <1>
  }
}
refresh_interval可以动态更新.
 
4.持久化变更
  ES增加了事务日志。
ES中进行一次提交并删除事务日志的操作叫做flush,分片每30分钟会进行一次flush操作。
  手动flush
     POST /blogs/_flush
  一般性的重启和关闭一个索引,flush是很有用的。因为此时他需要重放所有事务日志的操作,日志越小恢复越快。
 
5.合并段
自动刷新创建新的段,会导致段的数量暴增。但幸好的是ES自己已经做了合并段的工作,我们一般不用参与。
一般性段越多,查询越慢。
不要在活跃的索引上使用opttimize API,优化命令为阻碍它的工作。

本文出处:http://blog.csdn.net/shan1369678/article/details/51455502
 

你可能感兴趣的:(elasticsearch,elasticsearch,分片)