第八章-分布式搜索引擎-深入ES：聚合、自动补全、拼音词典、DB数据同步、ES集群

数据聚合

帮助我们对海量的数据做统计和分析，结合kibana还可以形成可视化的图形报表

聚合的种类

聚合的字段一定是不分词的，不能是text的

比如说按照酒店数据按照品牌做分组，这个就属于桶的聚合

按照品牌分组后想算算不同品牌的酒店的价格的平均值，或最大最小值怎么样--度量的聚合

算完平均值，想给排序，或者看看不同品牌平均值的最大最小值--这就是对度量结果再次聚合了就是管道了

除了这几种还有很多聚合的种类，这里只学习常用的

总结

聚合就是对索引库的数据做统计、分析、计算

DSL实现聚合

aggs就是聚合的一个函数了

size是分页值，给0，显示的文档数据就是0条了，因为我的目的是看聚合，而不是看文档

聚合里的size如果不指定的话默认是10，就是控制显示的结果，比如说聚合结果又100多种，但是设置了这个size就是只显示前10条数据

三要素：聚合名称、聚合类型、聚合字段

聚合是对桶的聚合，是个数组，将来有很多个桶，默认排序规则是倒序排序，可以自定义排序规则

修改排序规则

这里我们的聚合名称是brandAgg，将来如果想要定义多个聚合，就再加就好了

可以限定文档的范围，只需要添加查询条件，我们加了酒店价格的范围，那么聚合范围也就少了，不用全查

DSL实现Metrics聚合（度量聚合）

聚合的嵌套，我们先对品牌做聚合，然后再他的基础上在对评分做聚合，评分的聚合aggs在第一个aggs里边

聚合的嵌套，在第一个统计聚合的里边加平均值聚合，这样桶里的数据就多了好多

我们再对得出结果的平均值做个排序，看看哪个酒店的评价最高

对桶里的数据做排序，以前是对_count排序，现在是对平均值排序

注意，这种度量聚合嵌套，是在桶里边，定义的名字里边做的度量聚合

RestAPI实现聚合

request.source代表的是最大的json了

brand_agg当初我们用的就是terms类型，所以返回值也就是terms类型，根据聚合名称获取聚合结果

逐层解析json就可以了，我们可以先打印response

@Test
    void aggTest1() throws IOException {
        SearchRequest request = new SearchRequest("hotel");
        request.source().size(0);
        request.source().aggregation(AggregationBuilders.terms("brandAgg").field("brand").size(10));
        SearchResponse response = client.search(request, RequestOptions.DEFAULT);
        // 解析结果
        Aggregations aggregations = response.getAggregations();
        // 根据聚合名称获取聚合结果，本来就terms类型，用terms接收那就
        // 根据brand_agg去获取桶
        Terms terms = aggregations.get("brandAgg");
        // 获取数组桶的内容
        List buckets = terms.getBuckets();
        // 遍历每一个桶位
        for (Terms.Bucket bucket : buckets) {
            String keyAsString = bucket.getKeyAsString();
            System.out.println(keyAsString);
        }
    }

service

实现类

利用command+option+m封装重复代码，使得更优雅

@Override
    public Map> filters() {
        // 查出城市 city， 品牌 brand， 星级 startName
        try {
            SearchRequest request = new SearchRequest("hotel");
            // 针对多个字段做聚合，封装一下，就优雅了
            buildAggregation(request);
            SearchResponse response = client.search(request, RequestOptions.DEFAULT);
            // 解析返回结果信息
            Aggregations aggregations = response.getAggregations();
            return buildResponse(aggregations);
        } catch (IOException e) {
            throw new RuntimeException(e);
        }
    }
    
    private void buildAggregation(SearchRequest request) {
        request.source().aggregation(
                AggregationBuilders.terms("cityAgg").field("city")
        ).aggregation(
                AggregationBuilders.terms("brandAgg").field("brand")
        ).aggregation(
                AggregationBuilders.terms("startNameAgg").field("starName")
        );
    }
    
    private Map> buildResponse(Aggregations aggregations) {
        Map> map = new HashMap<>();
        List brandAggList = getAggByName(aggregations, "brandAgg");
        map.put("品牌", brandAggList);
        List cityAggList = getAggByName(aggregations, "cityAgg");
        map.put("城市", cityAggList);
        List startAggList = getAggByName(aggregations, "startNameAgg");
        map.put("星级", startAggList);
        return map;
    }

    private List getAggByName(Aggregations aggregations, String params) {
        // 分别获取
        Terms cityAgg = aggregations.get(params);
        List buckets = cityAgg.getBuckets();
        List list = new ArrayList<>();
        for (Terms.Bucket bucket : buckets) {
            String keyAsString = bucket.getKeyAsString();
            list.add(keyAsString);
        }
        return list;
    }

利用单元测试注册service 然后就可以调用了，因为没有参数更方便测试，不用postMan就可以

对接前端接口

前端页面向服务端发送请求，查询品牌、城市、星级等字段的聚合结果

修改原来的filters接口，将其添加一个查询query即可，这个query得和之前的查询一样，直接用就可以了

也就是说我们在做聚合的时候是要加一些过滤条件的，去限制聚合的范围，条件就是查询的条件一样的，到时候记得把查询的条件封装出来，复用

@Override
    public Map> filters(RequestParams requestParams) {
        // 查出城市 city， 品牌 brand， 星级 startName
        try {
            SearchRequest request = new SearchRequest("hotel");
            
            request.source().size(0);
            // 添加查询功能
            buildQueryBool(requestParams, request);
            
            
            
            // 针对多个字段做聚合，封装一下，就优雅了
            buildAggregation(request);
            SearchResponse response = client.search(request, RequestOptions.DEFAULT);
            // json 有多个，那就是 jsonArr
            Aggregations aggregations = response.getAggregations();
            return buildResponse(aggregations);
        } catch (IOException e) {
            throw new RuntimeException(e);
        }
    }

自动补全

根据用户输入的部分信息去自动补全或者提示用户真正想要搜索的内容，是搜索的必备功能

拼音分词器

GitHub - medcl/elasticsearch-analysis-pinyin: This Pinyin Analysis plugin is used to do conversion between Chinese characters and Pinyin.

按照拼音分词器分词，我这里装了拼音分词器es起不来，就先不装了

拼音分词器有几个问题，第一，把一句话都形成了拼音，第二把每个字都形成了一个拼音，第三个就是没有汉字只有拼音

自定义分词器

就是说由ik分词器分词完了交给拼音分词器就好了，因为拼音分词器不会分词，我交给你分啥词不就行了

修改拼音分词器的配置。去拼音分词器官网上查看配置，比如如下两个，将其默认值改了即可，只要全拼，不要单个拼的

要不要保留中文，为true，filter就是对分好的词条做进一步处理，比如拼音

下边这个name字段就能用我们的自定义分词器了去分词了

PUT /test
{
  "settings": {
    "analysis": {
      "analyzer": { 
        "my_analyzer": { 
          "tokenizer": "ik_max_word",
          "filter": "py"
        }
      },
      "filter": {
        "py": { 
          "type": "pinyin",
          "keep_full_pinyin": false,
          "keep_joined_full_pinyin": true,
          "keep_original": true,# 要不要保留中文
          "limit_first_letter_length": 16,
          "remove_duplicated_term": true,
          "none_chinese_pinyin_tokenize": false
        }
      }
    }
  },
    mappings{
        properties:{
            "name":{
                "type": "text",
                "nalyzer": "my_analyzer"
             }
        }
    }
}

测试：

插入文档

POST /test/_doc/1
{
  "id": 1,
  "name": "狮子"
}
POST /test/_doc/2
{
  "id": 2,
  "name": "虱子"
}

GET /test/_search
{
  "query": {
    "match": {
      "name": "掉入狮子笼咋办"
    }
  }
}

查看结果发现把同音字的也搜索出来了

那是因为拼音分词器适合在创建倒排索引的时候使用而不是搜索的时候使用

因为在搜索时也用了拼音分词器，那么久都凑所出来了，这不是我们希望的。

搜索的时候如果用户输入的是中文，那么久应该用中文去搜索，用户输入的是拼音，那么才拿拼音去搜索

也就是说创建索引、和搜索的时候要用不同的分词器，给它分开

搜索结果如下，搜索发现成功了

自动补全查询

创建索引库，添加数据，数组的方式为1条，当我搜索S的时候会补全sony，当我们输入W的时候会补全WH_1000XM3，品牌和产品信息

PUT test
{
  "mappings": {
    "properties": {
      "title":{
        "type": "completion"
      }
    }
  }
}
// 示例数据
POST test/_doc
{
  "title": ["Sony", "WH-1000XM3"]
}
POST test/_doc
{
  "title": ["SK-II", "PITERA"]
}
POST test/_doc
{
  "title": ["Nintendo", "switch"]
}

// 自动补全查询
POST /test/_search
{
  "suggest": {
    "title_suggest": { // 七个名字
      "text": "s", // 要输入查询的关键字，就是文档的前缀
      "completion": {
        "field": "title", // 补全字段
        "skip_duplicates": true, // 跳过重复的
        "size": 10 // 获取前10条结果
      }
    }
  }
}

查看酒店数据结构

settings就是用来定义索引库的分词器的

定了了两个自定义分词器，一个是需要分词的加拼音，一个是用来做自动补全的不需要分词，注意需要新添加个一个字段，再这个字段里引用才可以

// 酒店数据索引库
PUT /hotel
{
  "settings": {
    "analysis": {
      "analyzer": {
        "text_anlyzer": {// 需要分词的
          "tokenizer": "ik_max_word",
          "filter": "py"
        },
        "completion_analyzer": { // 自动补全的
          "tokenizer": "keyword",
          "filter": "py"
        }
      },
      "filter": {
        "py": {
          "type": "pinyin",
          "keep_full_pinyin": false,
          "keep_joined_full_pinyin": true,
          "keep_original": true,
          "limit_first_letter_length": 16,
          "remove_duplicated_term": true,
          "none_chinese_pinyin_tokenize": false
        }
      }
    }
  },
  "mappings": {
    "properties": {
      "id":{
        "type": "keyword"
      },
      "name":{
        "type": "text",
        "analyzer": "text_anlyzer",// 创建索引时用这个，可以给分词 分词转拼音
        "search_analyzer": "ik_smart", // 搜索的时候用传统的分词器
        "copy_to": "all"
      },
      "address":{
        "type": "keyword",
        "index": false
      },
      "price":{
        "type": "integer"
      },
      "score":{
        "type": "integer"
      },
      "brand":{
        "type": "keyword",
        "copy_to": "all"
      },
      "city":{
        "type": "keyword"
      },
      "starName":{
        "type": "keyword"
      },
      "business":{
        "type": "keyword",
        "copy_to": "all"
      },
      "location":{
        "type": "geo_point"
      },
      "pic":{
        "type": "keyword",
        "index": false
      },
      "all":{
        "type": "text",
        "analyzer": "text_anlyzer", // 同理，再创建索引时用这个
        "search_analyzer": "ik_smart" // 在搜索时 用这传统的
      },
      "suggestion":{ // 新添加了suggestion这个字段，是用来做自动补全的，不分词直接转拼音
          "type": "completion",
          "analyzer": "completion_analyzer"
      }
    }
  }
}

重新导入批量数据，我们发现suggestion里就有了数据了品牌和商圈的数据

我们发现suggesion里有/这种符号，其实是一个商圈，但是我们只能搜索j出来补全，搜索w是出不来的，我们可以对其切割一下

也就是说bussiness商圈有可能包含多个以斜杠分开的，这种情况给它做个切割，切割完后再扔进去

再次执行批量插入操作，就会发现成功了

查询，就会发现以h开头已经有自动补全了

以上就实现了以拼音自动补全的功能

RestApi实现

运行就会得到前缀是h的补全结果了

 @Test
    void suggestionTest() throws IOException {
        SearchRequest request = new SearchRequest("hotel");
        request.source().suggest(new SuggestBuilder().addSuggestion(
                "mySuggestion",
                SuggestBuilders.completionSuggestion("suggestion")
                .prefix("h")
                .skipDuplicates(true)
                .size(10)
        ));
        SearchResponse response = client.search(request, RequestOptions.DEFAULT);
        Suggest suggest = response.getSuggest();
        // 泛型很长，其实就是CompletionSuggestion这个类型
        // Suggest.Suggestion> f = suggest.getSuggestion("f");
        CompletionSuggestion mySuggestion = suggest.getSuggestion("mySuggestion");
        // 得到结果后，我要去options,是个集合
        List options = mySuggestion.getOptions();
        // 取的text，是个对象，转成对象
        for (CompletionSuggestion.Entry.Option option : options) {
            String text = option.getText().toString();
            System.out.println(text);
        }
    }

实现酒店搜索框自动补全

只需要把测试类那个拿过来，然后把结果放到集合里就可以了

集合直接就可以指定大小，因为我们知道的

输入x 就会发现有自动补全了

我们可以直接用拼音去做搜索，比如xs

就会出现这个结果等

以上我们就实现了拼音搜索和拼音自动补全的相关功能了，当然也可以输入中文也会有自动补全的

数据同步

mysql与ES数据同步问题

数据同步思路分析

第一种方式：demo微服务暴露对外接口，admin服务去调用demo服务，是依次执行的，也就是说写入到数据库后才能去调接口，调接口才能去更新，更新完成了返回，数据耦合，这就是同步调用

原来是写完就结束了，现在是得调用demo的方法，更新ES，就是说我么写入mysql后，还得等待更新es的返回，太耦合了

方案二：异步通知，利用mq的方式

方案三：监听binlog，默认是关闭的，如果开启后，mysql在做些的操作时，都会讲记录记录到binlog里；；利用canal这样的中间件去监听binlog ，一旦binlog发生变化就去通知对应的微服务

因为要开启mysql的binlog对mysql的压力就增加了，并且还要引入新的中间件

实现ES与数据库数据同步

启动项目8099

需要几个队列呢？

增、删、改都是事件，但是增和改都是写操作，有id就改，无就增，可以是一个业务，因此需要两个队列就行，也就是说消息的类型就是两类消息

两个队列，一个监听增、改的消息，一个监听删除的消息

消费者引入rabbitmq依赖，配置yaml

声明我们最好定义成一个常量

可以定义bean，也可以用声明的方式

消息发送者修改代码

@Resource
    private RabbitTemplate rabbitTemplate;
    @PostMapping
    public void saveHotel(@RequestBody Hotel hotel){
        hotelService.save(hotel);
        // 发送消息，指定交换机、key,对象, 这里我们不发整个对象，只发送一个id就行，那边可以查出来
        // 省内存
        rabbitTemplate.convertAndSend(MQConstants.HOTEL_EXCHANGE, MQConstants.HOTEL_INSERT_KEY,  hotel.getId());

    }

    @PutMapping()
    public void updateById(@RequestBody Hotel hotel){
        if (hotel.getId() == null) {
            throw new InvalidParameterException("id不能为空");
        }
        hotelService.updateById(hotel);
        rabbitTemplate.convertAndSend(MQConstants.HOTEL_EXCHANGE, MQConstants.HOTEL_INSERT_KEY,  hotel.getId());
    }

    @DeleteMapping("/{id}")
    public void deleteById(@PathVariable("id") Long id) {
        hotelService.removeById(id);
        rabbitTemplate.convertAndSend(MQConstants.HOTEL_EXCHANGE, MQConstants.HOTEL_DELETE_KEY, id);

    }

demo里新建一个包，mq.HotelListener,声明方法同时指定队列名字

我这里是直接用注解声明的方式了，不用上边这种bean注入的方式，有点麻烦

这消费者多简单，不用单独去写bean了，队列、交换机、key，还有绑定关系就都指定了

消费者代码如下

监听控制台

@Resource
    private IHotelService hotelService;
    /**
     * 新增或修改业务
     * @param id
     * @return
     */
    @RabbitListener(bindings = @QueueBinding(
            value = @Queue(name = MQConstants.HOTEL_INSERT_QUEUE),
            exchange = @Exchange(name = MQConstants.HOTEL_EXCHANGE, type = ExchangeTypes.TOPIC),
            key = MQConstants.HOTEL_INSERT_KEY
    ))
    public String listenerHotelInsertOrUpdate(Long id) {
        hotelService.insertById(id);
    }

    /**
     * 删除业务
     * @param id
     * @return
     */
    @RabbitListener(bindings = @QueueBinding(
            value = @Queue(name = MQConstants.HOTEL_DELETE_QUEUE),
            exchange = @Exchange(name = MQConstants.HOTEL_EXCHANGE, type = ExchangeTypes.TOPIC),
            key = MQConstants.HOTEL_DELETE_KEY
    ))
    public String listenerHotelDelete(Long id) {
        hotelService.deleteByIdHotel(id);
    }

业务层

@Override
    public void insertById(Long id) {
        try {
            Hotel hotel = getById(id);
            HotelDoc hotelDoc = new HotelDoc(hotel);
            IndexRequest request = new IndexRequest("hotel").id(hotelDoc.getId().toString());
            request.source(JSON.toJSONString(hotelDoc), XContentType.JSON);
            client.index(request, RequestOptions.DEFAULT);
        } catch (IOException e) {
            throw new RuntimeException(e);
        }
    }

    @Override
    public void deleteByIdHotel(Long id) {
        try {
            DeleteRequest request = new DeleteRequest("hotel", id.toString());
            client.delete(request, RequestOptions.DEFAULT);
        } catch (IOException e) {
            throw new RuntimeException(e);
        }
    }

酒店管理上修改一个价格，查看rabbitMQ发现确实接收到了，去黑马旅游网查询发现已经改了

由592修改成5920

找到队列并且点进去发现有个三角

删除也是同样的，实现了异步通讯这样一个效果

集群

比如说索引库分成三个片，每个片有一个备份，是交叉备份，比较安全

搭建ES集群

利用docker容器来模拟三台服务器，因为docker容器是相互隔离的嘛，所以是没有问题的

我们会在单机上利用docker容器运行多个es实例来模拟es集群。不过生产环境推荐大家每一台服务节点仅部署一个es的实例。

部署es集群可以直接使用docker-compose来完成，但这要求你的Linux虚拟机至少有4G的内存空间

4.1.创建es集群

首先编写一个docker-compose文件，内容如下：

version: '2.2'
services:
  es01:
    image: elasticsearch:7.12.1
    container_name: es01 --容器的名称
    environment:
      - node.name=es01 -- 节点的名称
      - cluster.name=es-docker-cluster --集群名称一样es就会自动把他们组成一个集群
      - discovery.seed_hosts=es02,es03 --集群的另外两个ip地址，我们用的docker容器，容器内互联
      - cluster.initial_master_nodes=es01,es02,es03--初始化的主节点
      - "ES_JAVA_OPTS=-Xms512m -Xmx512m"--jvm的最小最大内存
    volumes:
      - data01:/usr/share/elasticsearch/data
    ports:
      - 9200:9200
    networks:
      - elastic
  es02:
    image: elasticsearch:7.12.1
    container_name: es02
    environment:
      - node.name=es02
      - cluster.name=es-docker-cluster
      - discovery.seed_hosts=es01,es03
      - cluster.initial_master_nodes=es01,es02,es03
      - "ES_JAVA_OPTS=-Xms512m -Xmx512m"
    volumes:
      - data02:/usr/share/elasticsearch/data
    ports:
      - 9201:9200
    networks:
      - elastic
  es03:
    image: elasticsearch:7.12.1
    container_name: es03
    environment:
      - node.name=es03
      - cluster.name=es-docker-cluster
      - discovery.seed_hosts=es01,es02
      - cluster.initial_master_nodes=es01,es02,es03
      - "ES_JAVA_OPTS=-Xms512m -Xmx512m"
    volumes:
      - data03:/usr/share/elasticsearch/data
    networks:
      - elastic
    ports:
      - 9202:9200
volumes:
  data01:
    driver: local
  data02:
    driver: local
  data03:
    driver: local

networks:
  elastic:
    driver: bridge

es运行需要修改一些linux系统权限，修改/etc/sysctl.conf文件

vi /etc/sysctl.conf

添加下面的内容：

vm.max_map_count=262144

然后执行命令，让配置生效：

sysctl -p

出现这么一行，证明配置生效了

通过docker-compose启动集群：

docker-compose up -d

发现docker容器都启动了

4.2.集群状态监控

kibana可以监控es集群，不过新版本需要依赖es的x-pack 功能，配置比较复杂。

这里推荐使用cerebro来监控es集群状态，官方网址：https://github.com/lmenezes/cerebro

课前资料已经提供了安装包：

解压即可使用，非常方便。

解压好的目录如下：

进入对应的bin目录：

双击其中的cerebro.bat文件即可启动服务。监听的是9000这个端口

访问http://localhost:9000 即可进入管理界面：

输入你的elasticsearch的任意节点的地址和端口，点击connect即可：

比如9200或者9201或者9202

最上边绿色的大条，代表集群处于绿色（健康状态）。每个节点的内存占用情况、磁盘空间、cpu占用情况等；实心的⭐️代表主节点，空心的⭐️代表从节点，以后可以成为主节点。

集群创建完了，将来我们创建索引库的时候，索引库就可以分片，并且放到不同节点上

4.3.创建索引库

1）利用kibana的DevTools创建索引库

在DevTools中输入指令：

创建索引库后要想指定分片信息只需要指定settings，我们之前在settings里配置过拼音分词器，还可以配置分片信息和副本信息，

副本信息就是给每个片加个副本，就是加个备份

PUT /itcast
{
    #就是这个settings
  "settings": {
    "number_of_shards": 3, // 分片数量
    "number_of_replicas": 1 // 副本数量
  },
  "mappings": {
    "properties": {
      // mapping映射定义 ...
    }
  }
}

用集群的创建索引库

点击create创建，索引库名字，几个分片，几个备份

3个片，每个片有一个副本就是2份，所以是3*2 总共是6个片，其中实心的正方形是主分片，虚线框的是副本分片就是拷贝的一份

我们会发下每个分片的备份一定是在不同的机器上，确保了如果有任一一台机器宕机了，那么它的备份依然还在保存着避免出现数据故障

最后一个节点是协调节点，就是路由加负载均衡

事实上不用我们管，es的节点同时具备这四种，但是再实际开发中不能让一个节点干这四种事

比如主节点，管理

数据节点，做存储，对计算机硬件比较高

协调节点，对磁盘没什么要求

不同节点对硬盘要求是不一样的

我们要不同的节点去干不同的事，配置参数给他，node.master。。。就是一个主节点

如下图有三个协调节点，N个数据节点和3个备选主节点

候选主节点，这就是主从的结构，会有一个问题，脑裂

集群脑裂问题

比如说网络故障，不是节点宕机了，是网络问题导致 2 3节点与node1节点连不上了，但是node1和其他部分数据节点还是可以连通的，node2 node3和其他部分节点也是连通的，

node2和node3认为1没了，他们俩个又选出一个主，这就出现了两个主，这样就会导致将来数据crud一部分会和node1，另一部分会和node3，一旦网络恢复，就会出现两边数据不一致的情况

为了避免，(3+1 )/2=2,

一旦有网络问题，node1还想当主，它就只有它自己的1票

而node2和node3选node3，有两票，他就升为大哥了，node1就降级从了

所以节点最好是基数，1,3,5等

我们用的事7.12就不会有这种问题了，默认配置了

集群分布式存储

协调节点是做请求路由的，当一个增删改查请求到协调节点的时候，他会把请求路由到一个数据节点，完成对应的业务操作

尝试插入几条数据，直接模拟请求插入节点是9200主

我在9200插入3条，在9200查到3条数据，很合理吧

结果发现9201和9202都可以查到3条数据，那么问题来了，我到底把数据存到了那个分片节点呢？

用explane可以看见我们的数据到底存到了哪里，如下图id=3的在1号片

我们发现每个片上，刚好都插入了一条数据，我只插入了3条数据，而且我是在9200插入的，为什么呢？

说明协调节点确实是工作了

保存到不同的片上是好的，保证了数据负载均衡

hash运算，hash对一个数字做运算，然后对分片数量做取余运算，比如说我的分片是3

hash运算后对3取余，结果只会是0、1、2，

id在变那么算出的数也就再变，就均衡的负载到了每个分片了

将来查询也是，拿到id，做hash运算，然后取余，然后就去哪个分片上找，就能找到该文档

可是，如果此时有人把分片改了，那么用这个算法就找不到了，

因此：索引库一旦创建，分片数量一定不能改，一改就找不到了

不管是新增还是查询，只要是基于id，那么都是这个算法

分析新增

比如说我们要做新增，3个集群有三个节点

深蓝色的是主分片，每个主分片都需要有副本，浅蓝色的就是副本分片

比如说有个请求，id是1，请求到达了node1，那么这个node1就会充当协调节点的一个角色，它会hash运算得到结果是2，那么他就把请求路由到2号分片，node3一看，哦，请求是来找我的呀，好吧那就我来新增，于是数据就新增到node3分片上了；写完后一看我是主呀，那我就会把数据同步给从分片，从分片一看，哦，从分片在node2（R-2）上呢呀，于是就会把数据同步过去了

这样，主分片和从分片就都保存了该条数据了。他们俩再把相应结果返回给协调分片就是node1，node1一看他们都存好了，就会把响应返回给用户了

增删改操作都是这套流程，只要是根据id操作的

集群分布式查询

不知道id的查法，有两个阶段：

分散和聚集阶段；

有id就是算法查询

但是我们刚刚是用match_all查询的，我不知道id，也不知道要查询的数据在哪个分片上

这种情况下协调节点又是怎么操作的呢？

分散阶段：协调节点会把把请求分发给每一个分片，我没有id没法确定去哪个分片查，那么只去每个分片都查一次咯，每个分片都查完后，结果就会全了，这就是分散阶段

聚集阶段：每个节点查到的数据都会返回给协调节点，协调节点会去汇总他们查到的结果

注意：协调节点可以是主节点的任意一个，也可以单独摘出一个节点作为协调节点，所以用虚线框表示

正是因为有协调节点的存在，我们访问9200有三条结果，就明白为什么了，虽然数据在9201,9200,9202上都有，很公开，你随便访问，因为我有协调

集群故障转移

主节点故障转移

主节点是node1，node2和node3是候选主节点

比如说node1挂了，node2和node3就要选一个主出来，比如说选了node2

node2就要来看看集群的健康状态，分片的状态，因为node1挂了，他发现p-1有主分片，没有副本分片，p-2有主有副本分片，p-0只有副本分片没有主分片

他就发现1号片和0号片是不安全的，因为只有一份了，这是不安全的，这个时候集群的状态就不是健康的了，而是处于危险的边缘。主节点强迫症犯了，忍不了了，于是他就回去看看挂了的节点上边有什么分片，然后就会把这上边的分片迁移到健康的节点里去，从而确保任何一个分片都有两份，一个主一个副本，这样我们的集群就又处于健康的状态了，这就是故障转移

故障转移两个方面：

第一：主节点挂了，再选出一个主节点
第二：如果是数据节点挂了，要把数据节点上的数据做迁移，确保数据的安全

演示一下，如下es01节点是主节点，并且是健康的，也是个数据节点，有0和1的片

模拟-这里手动停止es01节点（模拟不知名情况下es01节点宕机了）

打开控制台，完蛋了，发现"涉黄"了,集群不健康了，条变黄了，0号片和1号片灰了，这两个片没有地方放了

重新选主：发现es03变成主了，下一步就是数据迁移了，稍微等一下会自动迁移，经过等待发现数据迁移成功了，现在每一个片都有两份了，就又变绿了

再次查询发现，啊哈，数据没有丢失，一点问题都没有

经过一段时间，我们把故障修复了，然后重新启动es01

切回控制台等待一下发现，啊哈，es01又回来了，但是它不是老大了，是备选主节点了，主节点又把分片迁移回es01去了，重新做了一份banlance，确保数据是均衡的，一人两个分片，一主一备份，注意是重新分配迁移哈

发送请求，依然没有问题

你可能感兴趣的:(微服务,elasticsearch,大数据,搜索引擎)

前后端分离，Asp.net core webapi 如何配置跨域代码掌控者 C#asp.net core .net core 经验分享 c#
前言可以说，前后端分离已经成为当今信息系统项目开发的主流软件架构模式，微服务的出现，让前后端分离发展更是迅速，大量优秀的前端框架如vue.js、react的出现，也让前后端分离趋势加快。所谓的前后端分离软件架构模式，就是指将前端和后端的开发完全分离，后端负责提供API接口和数据处理，而前端通过各种现代的JavaScript技术如AJAX或者Fetch等，来调用后端提供的API接口获取数据，从而构建
计算机毕业设计选题推荐-基于Python框架项目推荐（中）计算机毕设大佬 Java毕设实战项目 Python毕设实战项目爬虫+大数据毕设实战项目 python 计算机毕业设计 django 计算机毕业设计如何选题 25届计算机毕业设计如何选题计算机毕业设计选题推荐 24届计算机毕设选题推荐
博主介绍：✌十余年IT大项目实战经验、在某机构培训学员上千名、专注于本行业领域✌技术范围：Java实战项目、Python实战项目、微信小程序/安卓实战项目、爬虫+大数据实战项目、Nodejs实战项目、PHP实战项目、.NET实战项目、Golang实战项目。主要内容：系统功能设计、开题报告、任务书、系统功能实现、功能代码讲解、答辩PPT、文档编写、文档修改、文档降重、一对一辅导答辩。获取源码可以联系
面对信息茧房，我们如何破局？听风便是雨_
当我们进入了互联网时代，信息的交互变得无比地便捷，当你需要什么样的信息，只需要在搜索引擎上输入，便可立马查询到你想要的结果，而且现在随着抖音、微博之类的应用APP的出现，我们本应从这些APP中获得更加丰富的知识或者信息，来开阔我们的眼界。但是事实上，我们仿佛没有获得预期的效果，更甚至于陷入更大的怪圈当中——缺乏耐心，不能容忍与自己想法不一样的他人建议，失去了与外界良好沟通的能力以及开拓自己的眼界的
7款Java 微服务框架剑海风云 J2EE Middleware #SpringBoot java 微服务 Springboot Quarkus Micronaut Helidon Chronicle
1.微服务的历史微服务的概念源于21世纪初盛行的面向服务架构(SOA)。然而，“微服务”一词本身直到2012年左右才出现，当时它开始在软件架构活动和软件架构博客上被讨论。微服务的早期先驱包括Netflix、Amazon和eBay等公司。例如，2009年，Netflix开始从单体架构过渡到微服务架构，以更好地处理快速扩展的客户群。其他大公司也纷纷效仿，意识到单体架构模型在处理大规模复杂系统时存在局限
VBA 把Excel表当做一个大数据库来操作码猩 excelVBA专栏 excel 数据库
VBA把Excel表当做一个大数据库来操作SubSqlQueryBJD(strBillNoAsString)DimstrSqlAsStringDimarrCol()AsStringDimstrLineWhereDimarrWhere()AsStringDimstrWhereValAsStringDimstrResultShowRngAsStringDimstrWhereRngAsStringDim
80%的人都知道的——内容营销老泊
我们已经知道内容营销是依靠内容来进行营销，一起看一下内容营销的工作流吧。选题创作投放主要内容营销的选题类型-常青树：用户长时间关心的，比如房价，教育-热点：用户短时间关心的，比如八卦，实事二八原则常青树话题等等选题来源：访谈法：寻找目标用户尽可能一对一进行访谈，用户反馈的问题都可以成为你的选题来源数据法：利用搜索引擎获取内容选题。利用爬虫工具看看人们都比较关心哪些话题来作为选题基于时事的选题数据工
50.复盘变现之路 506小棉袄
1.昨天下载了头条，用搜索引擎找到了如何写文章。注册了一下。这一切其实都好简单，但是自己就是拖着没有做，而且还心安理得。现在在管理别人，于是用自己做到了才能教别人去做到来要求自己发现也不难。2.日更被我捡了起来。后面没有特殊情况，我会一直更下去。放弃一件事很容易，坚持自己喜欢的事也不会太难。3.今天完成了50关的最后一关，接下来就要挑战100关。想看看自己的极限在哪里。具体做法：1.每天早起一小时
淘宝购物攻略,省钱技巧大揭秘! 测评君高省
淘宝买东西省钱的方法有哪些?很早之前就已经开始实行网购返利，但还是有那么一部分人不愿意相信，戒备心的驱使下网购一直都是原价，但用大数据告诉你淘宝一年返利好几亿，就我本人一个月返利都好几百，特别是在双十一那种电商节的时候返利提现上千很容易。首先，为什么会有返利？简单来说淘宝商家为了推广自己的产品，给自己的产品设置了返利和优惠券，这个返利并不是我们购物时页面上看到的，是隐藏的返利，包括优惠券也是隐藏的
Elasticsearch 安装哒哒-blog Elasticsearch elasticsearch jenkins 大数据
下载安装elasticsearch下载链接运行：bin\elasticsearch.bat设置密码：.\bin\elasticsearch-setup-passwordsinteractive这边设置密码遇到一个坑PSG:\elasticsearch-8.8.1>.\bin\elasticsearch-setup-passwordsinteractiveFailedtoauthenticateus
Python基础知识进阶之正则表达式_头歌python正则表达式进阶前端陈萨龙程序员 python 学习面试
最后硬核资料：关注即可领取PPT模板、简历模板、行业经典书籍PDF。技术互助：技术群大佬指点迷津，你的问题可能不是问题，求资源在群里喊一声。面试题库：由技术群里的小伙伴们共同投稿，热乎的大厂面试真题，持续更新中。知识体系：含编程语言、算法、大数据生态圈组件（Mysql、Hive、Spark、Flink）、数据仓库、Python、前端等等。网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是
【计算机毕设-大数据方向】基于Hadoop的电商交易数据分析可视化系统的设计与实现程序员-石头山大数据实战案例大数据 hadoop 毕业设计毕设
博主介绍：✌全平台粉丝5W+,高级大厂开发程序员，博客之星、掘金/知乎/华为云/阿里云等平台优质作者。【源码获取】关注并且私信我【联系方式】最下边感兴趣的可以先收藏起来，同学门有不懂的毕设选题，项目以及论文编写等相关问题都可以和学长沟通，希望帮助更多同学解决问题前言随着电子商务行业的迅猛发展，电商平台积累了海量的数据资源，这些数据不仅包括用户的基本信息、购物记录，还包括用户的浏览行为、评价反馈等多
NLP_jieba中文分词的常用模块 Hiweir · NLP_jieba的使用自然语言处理中文分词人工智能 nlp
1.jieba分词模式（1）精确模式:把句子最精确的切分开,比较适合文本分析.默认精确模式.（2）全模式:把句子中所有可能成词的词都扫描出来,cut_all=True,缺点:速度快,不能解决歧义（3）paddle:利用百度的paddlepaddle深度学习框架.简单来说就是使用百度提供的分词模型.use_paddle=True.（4）搜索引擎模式:在精确模式的基础上,对长词再进行切分,提高召回率,
DevOps -分布式追踪与监控 Flying_Fish_Xuan devops ci/cd 自动化
DevOps中的分布式追踪与监控在当今的DevOps环境中，随着微服务架构和云原生应用的广泛采用，系统复杂性显著增加，传统的监控方式已经无法满足现代分布式系统的需求。为了提高系统可观测性，分布式追踪和监控成为现代DevOps实践中至关重要的工具。通过分布式追踪，开发者可以深入了解跨多个服务和组件的请求流，并通过监控实时捕捉系统的运行状态和性能数据，从而迅速定位和解决问题。本文将深入探讨分布式追踪与
分布式离线计算—Spark—基础介绍测试开发abbey 人工智能—大数据
原文作者：饥渴的小苹果原文地址：【Spark】Spark基础教程目录Spark特点Spark相对于Hadoop的优势Spark生态系统Spark基本概念Spark结构设计Spark各种概念之间的关系Executor的优点Spark运行基本流程Spark运行架构的特点Spark的部署模式Spark三种部署方式Hadoop和Spark的统一部署摘要：Spark是基于内存计算的大数据并行计算框架Spar
【大数据】如何读取多个Excel文件并计算列数据的最大求和值熬夜的王大数据 excel python 开发语言 big data
导语：在数据分析和处理中，我们经常需要从多个Excel文件中提取数据并进行计算。本文将带您通过一个实用的Python教程，学习如何读取D盘目录下特定文件夹内的多个Excel文件，并计算特定列数据的最大求和值。文章目录一、准备工作二、教程步骤1.导入必要的库2.设置文件路径3.获取Excel文件列表4.选择文件5.初始化最大求和值6.指定求和的列索引7.读取Excel文件并计算列求和8.输出结果三、
大数据领域的深度分析——AI是在帮助开发者还是取代他们？阳爱铭大数据与数据中台技术沉淀大数据人工智能后端数据库架构数据库开发 etl工程师 chatgpt
在大数据领域，生成式人工智能（AIGC）的应用正在迅速扩展，改变了数据科学家和开发者的工作方式。本文将从大数据的专业视角，探讨AI工具在这一领域的作用，以及它们是如何帮助开发者而非取代他们的。1.大数据领域的AI工具现状在大数据领域，AI工具已经取得了显著进展，以下是几款主要的AI工具及其功能和实际应用：ApacheSpark+MLlib：ApacheSpark是一个开源的分布式计算系统，广泛用于
Spring Cloud Gateway的使用介绍与随笔阳爱铭 Spring组件专栏 spring
文章目录第一章API网关相关知识介绍前言1API网关相关知识介绍1.1什么是API网关1.2API网关的组成1.2.1路由转发1.2.2过滤器1.3SpringCloud中的网关解决方案1.3.1SpringCloudNetflixZuul1.3.2SpringCloudGateway前言在微服务架构之下，服务被拆的非常零散，降低了耦合度的同时也给服务的统一管理增加了难度。在旧的服务治理体系之下，
python实现模糊逻辑_基于Python的大数据集模糊逻辑 takeiiii python实现模糊逻辑
我的团队一直致力于在两个大数据集上运行模糊逻辑算法。第一个(子集)大约是180K行，包含我们需要在第二个(超集)中匹配的人的姓名、地址和电子邮件。超集包含250万条记录。两者都具有相同的结构，并且数据已经被清理，即地址解析、名称规范化等ContactIDint,FullNamevarchar(150),Addressvarchar(100),Emailvarchar(100)目标是将一行子集中的值
大数据新视界 --大数据大厂之 Spark 性能优化秘籍：从配置到代码实践青云交大数据新视界 Spark 性能优化内存分配并行度存储级别 shuffle 减少算法优化代码实践数据读取广播变量数据倾斜 Spark 数据库
亲爱的朋友们，热烈欢迎你们来到青云交的博客！能与你们在此邂逅，我满心欢喜，深感无比荣幸。在这个瞬息万变的时代，我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而我的博客，正是这样一个温暖美好的所在。在这里，你们不仅能够收获既富有趣味又极为实用的内容知识，还可以毫无拘束地畅所欲言，尽情分享自己独特的见解。我真诚地期待着你们的到来，愿我们能在这片小小的天地里共同成长，共同进步。本博客的精华专栏：Ja
大数据新视界--大数据大厂之MySQL数据库课程设计：MySQL集群架构负载均衡方法选择全攻略（2-2）青云交大数据新视界 Java技术栈 Java性能优化数据库高可用性架构负载均衡业务规模预算限制可扩展性技术团队能力数据安全性系统复杂性行业特点硬件负载均衡器 Nginx HAProxy
亲爱的朋友们，热烈欢迎你们来到青云交的博客！能与你们在此邂逅，我满心欢喜，深感无比荣幸。在这个瞬息万变的时代，我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而我的博客，正是这样一个温暖美好的所在。在这里，你们不仅能够收获既富有趣味又极为实用的内容知识，还可以毫无拘束地畅所欲言，尽情分享自己独特的见解。我真诚地期待着你们的到来，愿我们能在这片小小的天地里共同成长，共同进步。本博客的精华专栏：Ja
大数据新视界 --大数据大厂之Flink强势崛起：大数据新视界的璀璨明珠青云交大数据新视界 Flink 大数据数据类型实时处理流处理框架对比应用场景数据处理大数据新视界数据库
亲爱的朋友们，热烈欢迎你们来到青云交的博客！能与你们在此邂逅，我满心欢喜，深感无比荣幸。在这个瞬息万变的时代，我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而我的博客，正是这样一个温暖美好的所在。在这里，你们不仅能够收获既富有趣味又极为实用的内容知识，还可以毫无拘束地畅所欲言，尽情分享自己独特的见解。我真诚地期待着你们的到来，愿我们能在这片小小的天地里共同成长，共同进步。本博客的精华专栏：Ja
【深入剖析】Kylin架构全景及其组件详解 2401_85763639 kylin 架构大数据
标题：【深入剖析】Kylin架构全景及其组件详解ApacheKylin是一个开源的分布式分析引擎，提供大数据集上的即时分析能力。它通过预计算技术，将数据以多维立方体的形式存储，从而加快查询速度。本文将详细探讨Kylin的架构及其组件，包括数据源、元数据存储、Cube构建、协调节点、查询引擎等关键部分。1.Kylin架构概述Kylin的架构设计为分层结构，每一层负责不同的功能和任务。2.数据源层Ky
Nacos微服务注册地址为内网IP的解决办法 Morgan7
问题描述当Docker中的服务A,向Nacos注册时候,Nacos获取到的是Docker的内部IP,导致另外一个服务B,想通过注册中心调用服务A,由于服务B从nacos注册中心获取到的是服务A内部IP,这样导致两个公网微服务无法互相访问或者部署在阿里云上，微服务获取的是内网ip，注册到Nacos的也是内网ip解决方法spring.cloud.nacos.discovery.ip=本机公网IPspr
Docker启动Elasticsearch(挂载数据、配置文件、插件) 程序员迪迦项目实战 Java elasticsearch docker
Docker启动Elasticsearch拉取镜像dockerpullelasticsearch:7.4.2修改配置文件mkdir-p/mydata/elasticsearch/configmkdir-p/mydata/elasticsearch/data/mkdir-p/mydata/elasticsearch/pluginsecho"http.host:0.0.0.0">>/mydata/el
编程常用命令总结 Yellow0523 Linux BigData 大数据
编程命令大全1.软件环境变量的配置JavaScalaSparkHadoopHive2.大数据软件常用命令Spark基本命令Spark-SQL命令Hive命令HDFS命令YARN命令Zookeeper命令kafka命令Hibench命令MySQL命令3.Linux常用命令Git命令conda命令pip命令查看Linux系统的详细信息查看Linux系统架构(X86还是ARM，两种方法都可)端口号命令L
docker部署elasticsearch 大大陈· elasticsearch docker 大数据
docker部署es1.简单启动2.配置文件3.安装es步骤1.简单启动#"discovery.type=single-node"标识单机启动dockerrun-d--nameelasticsearch-p9200:9200-p9300:9300-e"discovery.type=single-node"elasticsearch:tag#如果没有上面的标识，是集群启动，不这样做会报错#但是这样启
从底层原理上理解ClickHouse 中的稀疏索引 goTsHgo 大数据分布式 Clickhouse 数据库 clickhouse
稀疏索引（SparseIndexes）是ClickHouse中一个重要的加速查询机制。与传统数据库使用的B-Tree或哈希索引不同，ClickHouse的稀疏索引并不是为每一行数据构建索引，而是为数据存储的块或部分数据生成索引。这种索引的核心思想是通过减少需要扫描的数据范围来加速查询，特别适用于大数据量场景。1.基本概念：数据存储与索引在理解稀疏索引之前，首先需要理解ClickHouse的列式存储
Docker安装elasticsearch和kibana viego1999 elasticsearch docker 大数据
1、首先拉取elasticsearch镜像dockerpullelasticsearch:7.9.12、创建docker挂载的目录我这里将docker环境下挂在的目录统一放在了/dockerdata目录下mkdir-p/dockerdata/elasticsearch/configmkdir-p/dockerdata/elasticsearch/datamkdir-p/dockerdata/ela
Docker部署单点es Javaismymorning ES学习笔记 docker elasticsearch
前言该笔记是根据B站上黑马SpringCloud学习总结的一、ES是什么？Elasticsearch是一个分布式、高扩展、高实时的搜索与数据分析引擎。它能很方便的使大量数据具有搜索、分析和探索的能力。充分利用Elasticsearch的水平伸缩性，能使数据在生产环境变得更有价值二、Docker部署ES步骤1.创建网络因为还要部署Kibana，实现es和Kibana关联，创建一个网络Kibana是为
Django：Python高级Web框架详解及参数设置零度° python python django 前端
Django是一个高级的PythonWeb框架，它鼓励快速开发和简洁实用的设计。Django遵循MVC设计模式，提供了一套完整的解决方案，用于构建复杂的、数据库驱动的网站。Django的主要特点自动管理数据库：通过ORM（对象关系映射）自动管理数据库。自动生成站点地图：支持搜索引擎优化（SEO）。用户身份认证：内置用户认证系统。中间件支持：强大的中间件支持，可以处理请求和响应。跨站请求伪造（CSR
github中多个平台共存 jackyrong github
在个人电脑上，如何分别链接比如oschina,github等库呢，一般教程之列的，默认 ssh链接一个托管的而已，下面讲解如何放两个文件 1）设置用户名和邮件地址 $ git config --global user.name "xx" $ git config --global user.email "[email protected]"
ip地址与整数的相互转换(javascript) alxw4616 JavaScript
//IP转成整型 function ip2int(ip){ var num = 0; ip = ip.split("."); num = Number(ip[0]) * 256 * 256 * 256 + Number(ip[1]) * 256 * 256 + Number(ip[2]) * 256 + Number(ip[3]); n
读书笔记-jquey+数据库+css chengxuyuancsdn html jquery oracle
1、grouping ,group by rollup, GROUP BY GROUPING SETS区别 2、$("#totalTable tbody>tr td:nth-child(" + i + ")").css({"width":tdWidth, "margin":"0px", &q
javaSE javaEE javaME == API下载 Array_06 java
oracle下载各种API文档： http://www.oracle.com/technetwork/java/embedded/javame/embed-me/documentation/javame-embedded-apis-2181154.html JavaSE文档： http://docs.oracle.com/javase/8/docs/api/ JavaEE文档： ht
shiro入门学习 cugfy java Web 框架
声明本文只适合初学者，本人也是刚接触而已，经过一段时间的研究小有收获，特来分享下希望和大家互相交流学习。首先配置我们的web.xml代码如下，固定格式，记死就成 <filter> <filter-name>shiroFilter</filter-name> &nbs
Array添加删除方法 357029540 js
刚才做项目前台删除数组的固定下标值时，删除得不是很完整，所以在网上查了下，发现一个不错的方法，也提供给需要的同学。 //给数组添加删除 Array.prototype.del = function(n){
navigation bar 更改颜色张亚雄 IO
今天郁闷了一下午，就因为objective-c默认语言是英文，我写的中文全是一些乱七八糟的样子，到不是乱码，但是，前两个自字是粗体，后两个字正常体，这可郁闷死我了，问了问大牛，人家告诉我说更改一下字体就好啦，比如改成黑体，哇塞，茅塞顿开。翻书看，发现，书上有介绍怎么更改表格中文字字体的，代码如下
unicode转换成中文 adminjun unicode 编码转换
在Java程序中总会出现\u6b22\u8fce\u63d0\u4ea4\u5fae\u535a\u641c\u7d22\u4f7f\u7528\u53cd\u9988\uff0c\u8bf7\u76f4\u63a5这个的字符，这是unicode编码，使用时有时候不会自动转换成中文就需要自己转换了使用下面的方法转换一下即可。 /** * unicode 转换成中文
一站式 Java Web 框架 firefly aijuans Java Web
Firefly是一个高性能一站式Web框架。涵盖了web开发的主要技术栈。包含Template engine、IOC、MVC framework、HTTP Server、Common tools、Log、Json parser等模块。 firefly-2.0_07修复了模版压缩对javascript单行注释的影响，并新增了自定义错误页面功能。更新日志：增加自定义系统错误页面功能
设计模式——单例模式 ayaoxinchao 设计模式
定义 Java中单例模式定义：“一个类有且仅有一个实例，并且自行实例化向整个系统提供。” 分析从定义中可以看出单例的要点有三个：一是某个类只能有一个实例；二是必须自行创建这个实例；三是必须自行向系统提供这个实例。 &nb
Javascript 多浏览器兼容性问题及解决方案 BigBird2012 JavaScript
不论是网站应用还是学习js,大家很注重ie与firefox等浏览器的兼容性问题，毕竟这两中浏览器是占了绝大多数。一、document.formName.item(”itemName”) 问题问题说明：IE下，可以使用 document.formName.item(”itemName”) 或 document.formName.elements ["elementName&quo
JUnit-4.11使用报java.lang.NoClassDefFoundError: org/hamcrest/SelfDescribing错误 bijian1013 junit4.11 单元测试
下载了最新的JUnit版本，是4.11，结果尝试使用发现总是报java.lang.NoClassDefFoundError: org/hamcrest/SelfDescribing这样的错误，上网查了一下，一般的解决方案是，换一个低一点的版本就好了。还有人说，是缺少hamcrest的包。去官网看了一下，如下发现：
[Zookeeper学习笔记之二]Zookeeper部署脚本 bit1129 zookeeper
Zookeeper伪分布式安装脚本(此脚本在一台机器上创建Zookeeper三个进程，即创建具有三个节点的Zookeeper集群。这个脚本和zookeeper的tar包放在同一个目录下，脚本中指定的名字是zookeeper的3.4.6版本，需要根据实际情况修改)： #!/bin/bash #!!!Change the name!!! #The zookeepe
【Spark八十】Spark RDD API二 bit1129 spark
coGroup package spark.examples.rddapi import org.apache.spark.{SparkConf, SparkContext} import org.apache.spark.SparkContext._ object CoGroupTest_05 { def main(args: Array[String]) { v
Linux中编译apache服务器modules文件夹缺少模块(.so)的问题 ronin47 modules
在modules目录中只有httpd.exp，那些so文件呢？我尝试在fedora core 3中安装apache 2. 当我解压了apache 2.0.54后使用configure工具并且加入了 --enable-so 或者 --enable-modules=so (两个我都试过了) 去make并且make install了。我希望在/apache2/modules/目录里有各种模块，
Java基础-克隆 BrokenDreams java基础
Java中怎么拷贝一个对象呢？可以通过调用这个对象类型的构造器构造一个新对象，然后将要拷贝对象的属性设置到新对象里面。Java中也有另一种不通过构造器来拷贝对象的方式，这种方式称为克隆。 Java提供了java.lang.
读《研磨设计模式》-代码笔记-适配器模式-Adapter bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 适配器模式解决的主要问题是，现有的方法接口与客户要求的方法接口不一致 * 可以这样想，我们要写这样一个类（Adapter）: * 1.这个类要符合客户的要求 ---> 那显然要
HDR图像PS教程集锦&心得 cherishLC PS
HDR是指高动态范围的图像，主要原理为提高图像的局部对比度。软件有photomatix和nik hdr efex。一、教程叶明在知乎上的回答： http://www.zhihu.com/question/27418267/answer/37317792 大意是修完后直方图最好是等值直方图，方法是HDR软件调一遍，再结合不透明度和蒙版细调。二、心得 1、去除阴影部分的
maven-3.3.3 mvn archetype 列表 crabdave ArcheType
maven-3.3.3 mvn archetype 列表可以参考最新的：http://repo1.maven.org/maven2/archetype-catalog.xml [INFO] Scanning for projects... [INFO]
linux shell 中文件编码查看及转换方法 daizj shell 中文乱码 vim 文件编码
一、查看文件编码。在打开文件的时候输入:set fileencoding 即可显示文件编码格式。二、文件编码转换 1、在Vim中直接进行转换文件编码,比如将一个文件转换成utf-8格式 &
MySQL--binlog日志恢复数据 dcj3sjt126com binlog
恢复数据的重要命令如下 mysql> flush logs; 默认的日志是mysql-bin.000001，现在刷新了重新开启一个就多了一个mysql-bin.000002
数据库中数据表数据迁移方法 dcj3sjt126com sql
刚开始想想好像挺麻烦的，后来找到一种方法了，就SQL中的 INSERT 语句，不过内容是现从另外的表中查出来的，其实就是 MySQL中INSERT INTO SELECT的使用下面看看如何使用语法：MySQL中INSERT INTO SELECT的使用 1. 语法介绍有三张表a、b、c，现在需要从表b
Java反转字符串 dyy_gusi java 反转字符串
前几天看见一篇文章，说使用Java能用几种方式反转一个字符串。首先要明白什么叫反转字符串，就是将一个字符串到过来啦，比如"倒过来念的是小狗"反转过来就是”狗小是的念来过倒“。接下来就把自己能想到的所有方式记录下来了。 1、第一个念头就是直接使用String类的反转方法，对不起，这样是不行的，因为Stri
UI设计中我们为什么需要设计动效 gcq511120594 UI linux
随着国际大品牌苹果和谷歌的引领，最近越来越多的国内公司开始关注动效设计了，越来越多的团队已经意识到动效在产品用户体验中的重要性了，更多的UI设计师们也开始投身动效设计领域。但是说到底，我们到底为什么需要动效设计？或者说我们到底需要什么样的动效？做动效设计也有段时间了，于是尝试用一些案例，从产品本身出发来说说我所思考的动效设计。一、加强体验舒适度嗯，就是让用户更加爽更加爽的用
JBOSS服务部署端口冲突问题 HogwartsRow java 应用服务器 jboss server EJB3
服务端口冲突问题的解决方法，一般修改如下三个文件中的部分端口就可以了。 1、jboss5/server/default/conf/bindingservice.beans/META-INF/bindings-jboss-beans.xml 2、./server/default/deploy/jbossweb.sar/server.xml 3、.
第三章 Redis/SSDB+Twemproxy安装与使用 jinnianshilongnian ssdb reids twemproxy
目前对于互联网公司不使用Redis的很少，Redis不仅仅可以作为key-value缓存，而且提供了丰富的数据结果如set、list、map等，可以实现很多复杂的功能；但是Redis本身主要用作内存缓存，不适合做持久化存储，因此目前有如SSDB、ARDB等，还有如京东的JIMDB，它们都支持Redis协议，可以支持Redis客户端直接访问；而这些持久化存储大多数使用了如LevelDB、RocksD
ZooKeeper原理及使用 liyonghui160com
ZooKeeper是Hadoop Ecosystem中非常重要的组件，它的主要功能是为分布式系统提供一致性协调(Coordination)服务，与之对应的Google的类似服务叫Chubby。今天这篇文章分为三个部分来介绍ZooKeeper，第一部分介绍ZooKeeper的基本原理，第二部分介绍ZooKeeper
程序员解决问题的60个策略 pda158 框架工作单元测试
根本的指导方针 1. 首先写代码的时候最好不要有缺陷。最好的修复方法就是让 bug 胎死腹中。良好的单元测试强制数据库约束使用输入验证框架避免未实现的“else”条件在应用到主程序之前知道如何在孤立的情况下使用日志 2. print 语句。往往额外输出个一两行将有助于隔离问题。 3. 切换至详细的日志记录。详细的日
Create the Google Play Account sillycat Google
Create the Google Play Account Having a Google account, pay 25$, then you get your google developer account. References: http://developer.android.com/distribute/googleplay/start.html https://p
JSP三大指令 vikingwei jsp
JSP三大指令一个jsp页面中，可以有0~N个指令的定义！ 1. page --> 最复杂：<%@page language="java" info="xxx"...%> * pageEncoding和contentType： > pageEncoding：它