宇毅

ElasticSearch IK中文分词使用详解

一、前言

对于ES IK分词插件在中文检索中非常常用，本人也使用了挺久的。但知识细节一直很碎片化，一直没有做详细的整理。过一段时间用的话，也是依然各种找资料，也因此会降低开发效率。所以在有空的时候好好整理下相关资料。也希望本文对使用 ElasticSearch 和 IK分词插件的开发者有所帮助。希望能少走点弯路。

本文包括前言、IK分词介绍、分词效果对比、自定义词典使用、索引设置和字段设置（Python 创建索引并导入数据）、查询测试（Python 查询）、结论等七个部分。

二、IK分词介绍

IK分词器插件的安装、测试、自定义词典的使用可直接参考。github上的资料：https://github.com/medcl/elasticsearch-analysis-ik
这里注意三点：
1. 注意ElasticSearch和IK插件版本的对应。
2. 在ElasticSearch的配置文件config/elasticsearch.yml中的最后一行添加参数 index.analysis.analyzer.default.type: ik，则设置所有索引的默认分词器为ik分词(也可以不这么做，通过设置mapping来使用ik分词)。
3. 强调下IK分词器的两种分词模式。

ik_max_word: 会将文本做最细粒度的拆分，比如会将"中华人民共和国国歌"拆分为"中华人民共和国,中华人民,中华,华人,人民共和国,人民,人,民,共和国,共和,和,国国,国歌"，会穷尽各种可能的组合；

ik_smart: 会做最粗粒度的拆分，比如会将"中华人民共和国国歌"拆分为"中华人民共和国,国歌"。

验证 IK 安装成功，并测试两种分词模式：

http://localhost:9200/_analyze/?analyzer=ik_smart&text=中华人民共和国国歌

http://localhost:9200/_analyze/?analyzer=ik_max_word&text=中华人民共和国国歌

三、分词效果对比

基于github上给的资料

1 创建2个索引ik_test和 ik_test_1

curl -XPUT http://localhost:9200/ik_test
curl -XPUT http://localhost:9200/ik_test_1

2 对 ik_test 索引设置mapping

curl -XPOST http://localhost:9200/ik_test/fulltext/_mapping -d'
{
    "fulltext": {
        "_all": {
            "analyzer": "ik_max_word",
            "search_analyzer": "ik_max_word",
            "term_vector": "no",
            "store": "false"
        },
        "properties": {
            "content": {
                "type": "string",
                "store": "no",
                "term_vector": "with_positions_offsets",
                "analyzer": "ik_max_word",
                "search_analyzer": "ik_max_word",
                "include_in_all": "true",
                "boost": 8
            }
        }
    }

3 对两个索引插入数据

curl -XPOST http://localhost:9200/ik_test/fulltext/1 -d'
{"content":"美国留给伊拉克的是个烂摊子吗"}
'
curl -XPOST http://localhost:9200/ik_test/fulltext/2 -d'
{"content":"公安部：各地校车将享最高路权"}
'
curl -XPOST http://localhost:9200/ik_test/fulltext/3 -d'
{"content":"中韩渔警冲突调查：韩警平均每天扣1艘中国渔船"}
'
curl -XPOST http://localhost:9200/ik_test/fulltext/4 -d'
{"content":"中国驻洛杉矶领事馆遭亚裔男子枪击 嫌犯已自首"}
'

curl -XPOST http://localhost:9200/ik_test_1/fulltext/1 -d'
{"content":"美国留给伊拉克的是个烂摊子吗"}
'
curl -XPOST http://localhost:9200/ik_test_1/fulltext/2 -d'
{"content":"公安部：各地校车将享最高路权"}
'
curl -XPOST http://localhost:9200/ik_test_1/fulltext/3 -d'
{"content":"中韩渔警冲突调查：韩警平均每天扣1艘中国渔船"}
'
curl -XPOST http://localhost:9200/ik_test_1/fulltext/4 -d'
{"content":"中国驻洛杉矶领事馆遭亚裔男子枪击 嫌犯已自首"}
'

4 对两个索引分别搜索

curl -XPOST http://localhost:9200/ik_test/fulltext/_search?pretty  -d'{
    "query" : { "match" : { "content" : "洛杉矶领事馆" }},
    "highlight" : {
        "pre_tags" : ["", ""],
        "post_tags" : ["", ""],
        "fields" : {
            "content" : {}
        }
    }
}'

结果如下：

curl -XPOST http://localhost:9200/ik_test_1/fulltext/_search?pretty  -d'{
    "query" : { "match" : { "content" : "洛杉矶领事馆" }},
    "highlight" : {
        "pre_tags" : ["", ""],
        "post_tags" : ["", ""],
        "fields" : {
            "content" : {}
        }
    }
}'

结果如下：

四、自定义词典使用

自定义词典使用，按照github上的说明配置词典。在 custom/mydict.dic 文件中增加 “洛杉矶领事馆” 一词，然后重启ES。自定义词典使用参考：https://github.com/medcl/elasticsearch-analysis-ik
使用如下搜索：

curl -XPOST http://localhost:9200/ik_test/fulltext/_search?pretty  -d'{
    "query" : { "match" : { "content" : "洛杉矶领事馆" }},
    "highlight" : {
        "pre_tags" : ["", ""],
        "post_tags" : ["", ""],
        "fields" : {
            "content" : {}
        }
    }
}'

结果如下：

从结果可见，貌似自定义词典没有起作用。是的、、、这里困扰我很久的，一直以为这功能有问题。后多次测试后发现，继续插入数据的话，对以后的数据是能正确分词的。

在修改自定义词典之后，插入第5条数据，content字段和第4条数据是一样的。

curl -XPOST http://localhost:9200/ik_test/fulltext/5 -d'
{"content":"中国驻洛杉矶领事馆遭亚裔男子枪击 嫌犯已自首"}'

然后继续用上述的query 进行搜索。

结果查到 _id =4 和 _id =5 的两条数据，其中 _id =5 就是我们想要的结果，_id =4 按理来说确实是我们想要的结果。但是结果结果却把”洛杉矶领事馆” 切成了两个词语。

猜测和 ES中存储以及match 搜索方式有关。
“洛杉矶领事馆” 一词在 _id = 4的文档中存为：“洛杉矶”、“领事馆”、“洛”、“杉”、“矶”、“领事”、“馆” 等7个词语。
“洛杉矶领事馆” 一词在 _id = 5的文档中存为：“洛杉矶领事馆”、“洛杉矶”、“领事馆”、“洛”、“杉”、“矶”、“领事”、“馆” 等8个词语。

分词结果如下：

http://localhost:9200/_analyze/?analyzer=ik_max_word&text=洛杉矶领事馆

还有这里如果用 term 方式进行搜索。

curl -XPOST http://localhost:9200/ik_test/fulltext/_search?pretty  -d'{
    "query" : { "term" : { "content" : "洛杉矶领事馆" }},
    "highlight" : {
        "pre_tags" : ["", ""],
        "post_tags" : ["", ""],
        "fields" : {
            "content" : {}
        }
    }
}'

结果只搜到了_id =5的文档。因此，这里验证了我的两个猜测：

match 和 term 的搜索方式不同。参考：http://www.cnblogs.com/yjf512/p/4897294.html
ES底层存储有关：不然的话用term搜索，应该把 _id =4 和_id=5全部搜索出来，这里之所以 _id=4没有搜出来是因为 _id=4 的底层在ES中的存储不包含“洛杉矶领事馆” 这整体一词。

五、索引设置和字段设置

这里主要是mapping得设置，可以使用IK给的 mapping 格式：

{
    "fulltext": {
        "_all": {
            "analyzer": "ik_max_word",
            "search_analyzer": "ik_max_word",
            "term_vector": "no",
            "store": "false"
        },
        "properties": {
            "content": {
                "type": "string",
                "store": "no",
                "term_vector": "with_positions_offsets",
                "analyzer": "ik_max_word",
                "search_analyzer": "ik_max_word",
                "include_in_all": "true",
                "boost": 8
            }
        }
    }
}

以上参数不详细说明，可参考：https://www.elastic.co/guide/en/elasticsearch/reference/current/mapping-params.html
关于_all字段的介绍，可参考：http://blog.csdn.net/jiao_fuyou/article/details/49800969
我使用的mapping和插入数据代码如下，这里设置不使用 _all字段搜索：

# -*- coding: utf-8 -*-

import elasticsearch


class ElasticSearchClient(object):
    @staticmethod
    def get_es_servers():
        es_servers = [{
            "host": "localhost",
            "port": "9200"
        }]
        es_client = elasticsearch.Elasticsearch(hosts=es_servers)
        return es_client


class LoadElasticSearch(object):
    def __init__(self):
        self.index = "hz"
        self.doc_type = "text"
        self.es_client = ElasticSearchClient.get_es_servers()
        self.set_mapping()

    def set_mapping(self):
        """
        设置mapping
        """
        chinese_field_config = {
            "type": "string",
            "store": "no",
            "term_vector": "with_positions_offsets",
            "analyzer": "ik_max_word",
            "search_analyzer": "ik_max_word",
            "include_in_all": "true",
            "boost": 8
        }

        mapping = {
            self.doc_type: {
                "_all": {"enabled": False},

                "properties": {
                    "document_id": {
                        "type": "integer"
                    },
                    "content": chinese_field_config
                }
            }
        }

        if not self.es_client.indices.exists(index=self.index):
            # 创建Index和mapping
            self.es_client.indices.create(index=self.index, ignore=400)
            self.es_client.indices.put_mapping(index=self.index, doc_type=self.doc_type, body=mapping)

    def add_date(self, row_obj):
        """
        单条插入ES
        """
        _id = row_obj.get("_id", 1)
        row_obj.pop("_id")
        self.es_client.index(index=self.index, doc_type=self.doc_type, body=row_obj, id=_id)


if __name__ == '__main__':

    content_ls = [
        u"美国留给伊拉克的是个烂摊子吗",
        u"公安部：各地校车将享最高路权",
        u"中韩渔警冲突调查：韩警平均每天扣1艘中国渔船",
        u"中国驻洛杉矶领事馆遭亚裔男子枪击 嫌犯已自首"
    ]

    load_es = LoadElasticSearch()
    # 插入单条数据测试
    for index, content in enumerate(content_ls):
        write_obj = {
            "_id": index,
            "document_id": index,
            "content": content
        }
        load_es.add_date(write_obj)

六、查询测试

# -*- coding: utf-8 -*-

import elasticsearch


class ElasticSearchClient(object):
    @staticmethod
    def get_es_servers():
        es_servers = [{
            "host": "localhost",
            "port": "9200"
        }]
        es_client = elasticsearch.Elasticsearch(hosts=es_servers)
        return es_client


class SearchData(object):
    index = 'hz'
    doc_type = 'text'

    @classmethod
    def search(cls, field, query, search_offset, search_size):
        # 设置查询条件
        es_search_options = cls.set_search_optional(field, query)
        # 发起检索。
        es_result = cls.get_search_result(es_search_options, search_offset, search_size)
        # 对每个结果, 进行封装。得到最终结果
        final_result = cls.get_highlight_result_list(es_result, field)
        return final_result

    @classmethod
    def get_highlight_result_list(cls, es_result, field):
        result_items = es_result['hits']['hits']
        final_result = []
        for item in result_items:
            item['_source'][field] = item['highlight'][field][0]
            final_result.append(item['_source'])
        return final_result

    @classmethod
    def get_search_result(cls, es_search_options, search_offset, search_size):
        es_result = ElasticSearchClient.get_es_servers().search(
            index=cls.index,
            doc_type=cls.doc_type,
            body=es_search_options,
            from_=search_offset,
            size=search_size
        )
        return es_result

    @classmethod
    def set_search_optional(cls, field, query):
        es_search_options = {
            "query": {
                "match": {
                    field: {
                        "query": query,
                        "slop": 10
                    }
                }
            },
            "highlight": {
                "fields": {
                    "*": {
                        "require_field_match": True,
                    }
                }
            }
        }
        return es_search_options


if __name__ == '__main__':
    final_results = SearchData().search("content", "中国", 0, 30)
    for obj in final_results:
        for k, v in obj.items():
            print k, ":", v
        print "======="

输出结果：

七、结论

到此为止，ik分词相关的操作，都已经介绍完了。其他还有可能会使用到的功能就是基于IK的中文同义词处理的。参考这篇文章：http://blog.csdn.net/xsdxs/article/details/52806499 即可。

文中也实现了，搜索相关的功能。不过更加详细的内容，此文先不介绍了，下篇文章会对ElasticSearch 的搜索进行讲解和实现。

感谢阅读！

elasticsearch添加kerberos认证完整操作流程鸡蛋可好吃了 elasticsearch jenkins 大数据 java
kerberos认证的教程网上有很多，但是es的真的找遍全网都很少有详细的教程！我苦读官网，到处搜罗零碎信息，才终于完成es的kerberos认证。文章目录一、elasticsearch升级白金版1.下载对应版本源码，修改相关类2.编译后替换jar包中的class文件3.更新license二、搭建kerberos服务1.安装kerberos服务端2.安装kerberos客户端3.服务端配置文件kd
集群部署Elasticsearch+Logstash+Kibana+Filebeat+Kafka+Zookeeper YH746 日志分析系统 linux
目录引言一、安装Zookeeper步骤1、准备阶段（全部节点操作，以node1为例）（1）关闭防火墙和系统安全机制（全部节点操作，以node1为例）（2）同步时钟源（全部节点操作，以node1为例）（3）JDK的安装（全部节点操作，以node1为例）（4）配置hosts（全部节点操作，以node1为例）2、安装Zookeeper软件包（全部节点操作，以node1为例）3、修改配置文件（全部节点操作
Java | 基于Kerberos认证对接华为云Elasticsearch yinbp bboss elastic java 华为云 elasticsearch bboss
可以通过华为官方提供的Java客户端，来实现基于Kerberos认证访问和操作华为云Elasticsearch；亦可以使用更加通用的开源ElasticsearchJava客户端bboss，来实现基于Kerberos认证访问和操作华为云Elasticsearch。本文介绍使用bboss实现基于Kerberos认证访问和操作华为云Elasticsearch的方法。1.bboss介绍bboss是一个高性
elfk+zookeeper+kafka数据流 AustinCien zookeeper kafka elk
申请7台部署elfk+zookeeper+kafka数据流：filebeat(每台app)------>【logstash(2)+kafka(3)】------->logstash(1)------->【elasticsearch(3)+kibana(1)】
【Elasticsearch】动态计算字段的几种方式 risc123456 Elasticsearch elasticsearch
在Elasticsearch中，动态计算字段可以通过以下几种方法实现：1.动态映射（DynamicMapping）动态映射允许Elasticsearch在索引文档时自动检测并添加新字段及其数据类型。虽然动态映射主要用于自动处理新字段，但也可以通过动态模板（DynamicTemplates）来控制新字段的映射规则，从而实现一定程度的动态计算字段的功能。示例：```jsonPUT/my_index{"
Elasticsearch——动态映射 java编程小帅 Elasticsearch elasticsearch 大数据 es java 搜索引擎
目录Dynamicfieldmappingsdatedetection(日期检测)Disablingdatedetection(禁用日期检测)Customizingdetecteddateformats(自定义检测到的日期格式)Numericdetection(数字检测)Dynamictemplates验证动态模板在动态模板映射运行时字段Elasticsearch最重要的功能之一就是它会尽量避开我
Elasticsearch：使用 runtime fields 探索你的数据小贤编程手记 elasticsearch 大数据
考虑要提取字段的大量日志数据。为数据建立索引非常耗时，并且会占用大量磁盘空间，而你只想探索数据结构而无需预先提交schema。你知道你的日志数据包含你要提取的特定字段。在这种情况下，我们要关注@timestamp和消息字段。通过使用运行时字段（runtimefields），你可以定义脚本来计算这些字段在搜索时的值。定义索引字段作为起点你可以从一个简单的示例开始，将@timestamp和messag
Elasticsearch：深入理解 Runtime Fields 和 Elastic 的 Schema on Read 实现代码指四方 elasticsearch jenkins 大数据
Elasticsearch：深入理解RuntimeFields和Elastic的SchemaonRead实现在本文中，我们将探讨Elasticsearch中的RuntimeFields和Elastic的SchemaonRead实现。RuntimeFields允许我们在查询时动态地创建字段，而不需要在索引创建时指定字段映射。这为我们提供了更大的灵活性，并且适用于那些需要根据查询需求动态添加字段的场景
【Elasticsearch】script_fields 和 runtime_fields的区别 risc123456 Elasticsearch elasticsearch
`script_fields`和`runtime_fields`都是Elasticsearch中用于动态计算字段值的功能，但它们在实现方式、应用场景和性能表现上存在显著区别。以下是两者的详细对比：1.定义和应用场景•`script_fields`：•定义：通过Painless脚本在查询阶段动态计算字段值。•应用场景：主要用于在查询结果中添加额外的计算字段，这些字段不会影响查询的执行逻辑。•示例：计
Elasticsearch补充(3) --Linux集群安装ES erainm 大数据学习 elasticsearch
1安装Elasticsearch1.1创建普通用户ES不能使用root用户来启动，必须使用普通用户来安装启动。这里我们创建一个普通用户以及定义一些常规目录用于存放我们的数据文件以及安装包等。创建一个es专门的用户（必须）使用root用户在三台机器执行以下命令useradderainmpasswderainm注：这里我创建的是我的用户，第二个passwd用户名后会设置自己的密码1.2为普通用户era
deepseek部署：ELK + Filebeat + Zookeeper + Kafka AustinCien deepseek elk zookeeper kafka
##1.概述本文档旨在指导如何在7台机器上部署ELK（Elasticsearch,Logstash,Kibana）堆栈、Filebeat、Zookeeper和Kafka。该部署方案适用于日志收集、处理和可视化场景。##2.环境准备###2.1机器分配|机器编号|主机名|IP地址|部署组件|----------|--------------|--------------|--------------
Elasticsearch性能优化实战指南_index 2401_87378872 elasticsearch 性能优化 jenkins
curl-XPUT"localhost:9200/twitter"-H'Content-Type:application/json'-d'{"settings":{"index":{"sort.field":"date","sort.order":"desc"}},"mappings":{"properties":{"date":{"type":"date"}}}}目的：indexsorting是
ElasticSearch 数据老化清理之Curator 思快奇 java elasticsearch linux 大数据分布式
前言随着接入ELK日志分析平台的系统增加，每日海量的日志数据使得磁盘空间越发紧张，从而ES的日志清理也成了一个常规操作。而ES官方也提供了一个很好用的工具——curator来实现这个事情。抽空也部署了一个，以供阅知。Curator简介据官方介绍，curator最早被称为clearESindices.py的python脚本，它的唯一功能就是删除索引清理数据，而后重命名为logstash_index_
【ES一】SpringBoot2.x+ES8.11.1（windows环境）整合 zcccc_ elasticsearch 搜索引擎 spring boot
一、两种整合方式目前有两种最常用的整合方式，一种是ElasticSearch官方提供的JavaHighLevelRestClient，一种是Spring提供的spring-boot-starter-data-elasticsearch方式：1.spring-boot-starter-data-elasticsearch方式由Spring提供，是Spring在ES官方接口基础之上的二次封装，使用简单
Elasticsearch 相关面试题一切顺势而行 elasticsearch
1.Elasticsearch基础Elasticsearch是什么？Elasticsearch是一个分布式搜索引擎，基于Lucene实现。Mapping是什么？ES中有哪些数据类型？Mapping：定义字段的类型和属性。数据类型：text、keyword、integer、float等。2.什么是全文检索？全文检索是一种基于文本内容的检索方式。3.ES支持哪些类型的查询？全文查询：match、que
MySQL 和 Elasticsearch 之间的数据同步解决方案工程师 mysql elasticsearch android
MySQL和Elasticsearch之间的数据同步是常见的需求，通常用于将结构化数据从关系型数据库同步到Elasticsearch以实现高效的全文搜索、聚合分析和实时查询。以下是几种常用的同步方案及其实现方法：1.应用层双写（双写模式）原理在业务代码中同时向MySQL和Elasticsearch写入数据，保证两者数据一致。实现步骤在写入MySQL的事务中，同步或异步写入Elasticsearch
Nginx + ElasticSearch + Kibana结合周天祥 ElasticSearch 大数据
Nginx+ElasticSearch+Kibana结合操作系统软件下载安装编译工具及库文件安装PCRE安装NginxElasticSearch配置Kibana配置Nginx配置启动Nginx对人工智能感兴趣点下面链接现在人工智能非常火爆，很多朋友都想学，但是一般的教程都是为博硕生准备的，太难看懂了。最近发现了一个非常适合小白入门的教程，不仅通俗易懂而且还很风趣幽默。所以忍不住分享一下给大家。点这
nginx 反向代理 ElasticSearch es 布丁萨玛 nginx elasticsearch 运维
本文讲述如何使用nginx代理kibana1、更改kibana.yml文件添加前缀2、nginx添加配置location/kibana/{proxy_passhttp://127.0.0.1:5601/;rewrite^/elk/(.*)$/$1break;proxy_set_headerX-Real-IP$remote_addr;proxy_set_headerHost$host:$server
ElasticSearch-head 谷歌浏览器安装插件夜古诚 ELK elasticsearch
1.windows解压安装包elasticsearch-head-master.zip2.移动解压后的文件夹到你需要的目录3.crx目录下的文件es-head.crx改为es-head.zip然后解压到当前目录4.谷歌浏览器中添加插件5.选择解压的elasticsearch-headcrx文件夹成功...
Nginx代理ElasticSearch 神奇的海马体 #Nginx #ElasticSearch nginx elasticsearch 运维
1、将ES的账号:密码通过Base64加密假设账号密码如下：账号：elastic密码：[email protected]'elastic:[email protected]'|base64ZWxhc3RpYzplbGFzdGljQGh1YXl1bndvcmxkLmNvbQ==2、在Nginx配置中传递认证信息location/es/{proxy_passhttp
精选 ES（elasticsearch）添加、修改、查询、删除详细使用语法代码讲故事架构师成长之路 ELK 中间件 elasticsearch ES 使用查询语法
精选ES（elasticsearch）添加、修改、查询、删除详细使用语法。elasticsearch是一个分布式、RESTful风格的数据搜索和分析引擎。es使用简单，支持集群，适用于海量数据的存储、搜索与分析，应用十分广泛。Elastic有一条完整的产品线：Elasticsearch、Kibana、Logstash等，前面说的三个就是大家常说的ELK技术栈。案例一1、根据用户ID、是否隐藏、帖子
ElasticSearch 基本查询语法 2401_89693619 elasticsearch 大数据搜索引擎
{“aggregations”:{“mid”:{“aggregations”:{“terminal”:{“terms”:{“field”:“terminal”,“size”:0}}},“terms”:{“field”:“mid”,“size”:“1”}}},“from”:0,“query”:{“bool”:{“must”:[{“match_all”:{}}]}},“size”:0}去重Distin
Elasticsearch（ES）基础查询语法的使用 m0_74825108 面试学习路线阿里巴巴 elasticsearch django python
1.MatchQuery(全文检索查询)用于执行全文检索，适合搜索文本字段。{“query”:{“match”:{“field”:“value”}}}match_phrase：精确匹配短语，适合用于短语搜索。{“query”:{“match_phrase”:{“field”:“text”}}}2.TermQuery(精确匹配查询)用于对某个字段的精确值进行查询，常用于不分词的字段（如ID、标签、关
黑马es数据同步mq解决方案 Gungnirss elasticsearch 大数据搜索引擎 rabbitmq
方式一:同步调用优点:实现简单，粗暴缺点:业务耦合度高方式二:异步通知优点:低耦含，实现难度一般缺点:依赖mq的可靠性方式三:监听binlog优点:完全解除服务间耦合缺点:开启binlog增加数据库负担、实现复杂度高利用MQ实现mysql与elasticsearch数据同步利用课前资料提供的hotel-admin项目作为酒店管理的微服务。当酒店数据发生增、删、改时，要求对elasticsearch
Elasticsearch系列-安装部署 m0_67393039 java java 后端
Elasticsearch系列-安装部署准备安装错误准备1.服务器创建es用户useraddespasswdes2.elasticsearch部署环境JDK3.安装包可以去elastic官网下载相应版本文件。我这里安装版本的是7.12.0。Linux版本：//centos下若没有安装curlyuminstallcurl//进入es用户目录执行下载curl-L-Ohttps://artifacts.
Elasticsearch索引设计与分片策略深度优化-手记一起学开源数据库运维 elasticsearch 大数据搜索引擎全文检索
一、索引设计的黄金法则（从踩坑到精通的必经之路）1.字段类型显式声明原则动态映射是新手最易踩的坑，某金融平台曾因金额字段被自动识别为text类型，导致聚合查询时触发OOM。正确做法应显式声明核心字段：PUT/financial_transactions{"mappings":{"dynamic":false,//关闭动态映射"properties":{"txn_id":{"type":"keywo
Elasticsearch安装与应用伟大无须多言 jenkins 运维
ElasticsearchElasticsearch是一个分布式搜索和分析引擎，具有高扩展性和高可用性。它由Elastic公司提供，是ElasticStack（ELKStack）的核心技术之一，ELKStack包括Elasticsearch、Kibana和Logstash等组件。本文将详细介绍Elasticsearch的安装使用、分片机制以及其它相关功能。一、Elasticsearch的安装Ela
jmeter 与大数据生态圈中的服务进行集成小赖同学啊 jmeter专栏 jmeter 大数据
以下为你详细介绍JMeter与大数据生态圈中几种常见服务（HadoopHDFS、Spark、Kafka、Elasticsearch）集成的方法：与HadoopHDFS集成实现思路HDFS是Hadoop的分布式文件系统，JMeter可模拟客户端对HDFS进行文件读写操作，通常借助HDFS的JavaAPI编写自定义JMeter采样器。步骤添加依赖：将Hadoop的客户端JAR包添加到JMeter的li
在线教育系统设计方案翱翔-蓝天 java
在线教育系统设计方案1.系统概述本系统是一个现代化的在线教育平台，采用前后端分离架构，提供课程管理、用户管理、视频点播、直播互动等功能。2.技术栈选型2.1后端技术栈核心框架：SpringBoot3.x数据库：MySQL8.x持久层框架：MyBatisPlus缓存：Redis消息队列：RabbitMQ搜索引擎：Elasticsearch文件存储：阿里云OSS视频点播：阿里云视频点播服务2.2前端技
掌握 ElasticSearch 组合查询：Bool Query 详解与实践全端工程师 elasticsearch elasticsearch jenkins 大数据
掌握ElasticSearch组合查询：BoolQuery详解与实践一、引言(Introduction)二、Bool查询基础2.1什么是Bool查询？2.2Bool查询的四种子句2.3语法结构三、Bool查询的四种子句详解与示例3.1`must`子句3.2`filter`子句3.3`should`子句3.4`must_not`子句四、`minimum_should_match`参数4.1什么是`m
js动画html标签（持续更新中） 843977358 html js 动画 media opacity
1.jQuery 效果 - animate() 方法改变 "div" 元素的高度： $(".btn1").click(function(){ $("#box").animate({height:"300px
springMVC学习笔记 caoyong springMVC
1、搭建开发环境 a>、添加jar文件，在ioc所需jar包的基础上添加spring-web.jar,spring-webmvc.jar b>、在web.xml中配置前端控制器 <servlet> &nbs
POI中设置Excel单元格格式 107x poi style 列宽合并单元格自动换行
引用：http://apps.hi.baidu.com/share/detail/17249059 POI中可能会用到一些需要设置EXCEL单元格格式的操作小结：先获取工作薄对象: HSSFWorkbook wb = new HSSFWorkbook(); HSSFSheet sheet = wb.createSheet(); HSSFCellStyle setBorder = wb.
jquery 获取A href 触发js方法的this参数无效的情况一炮送你回车库 jquery
html如下： <td class=\"bord-r-n bord-l-n c-333\"> <a class=\"table-icon edit\" onclick=\"editTrValues(this);\">修改</a> </td>" j
md5 3213213333332132 MD5
import java.security.MessageDigest; import java.security.NoSuchAlgorithmException; public class MDFive { public static void main(String[] args) { String md5Str = "cq
完全卸载干净Oracle11g sophia天雪 orale数据库卸载干净清理注册表
完全卸载干净Oracle11g A、存在OUI卸载工具的情况下：第一步：停用所有Oracle相关的已启动的服务；第二步：找到OUI卸载工具：在“开始”菜单中找到“oracle_OraDb11g_home”文件夹中 &
apache 的access.log 日志文件太大如何解决 darkranger apache
CustomLog logs/access.log common 此写法导致日志数据一致自增变大。直接注释上面的语法 #CustomLog logs/access.log common 增加： CustomLog "|bin/rotatelogs.exe -l logs/access-%Y-%m-d.log
Hadoop单机模式环境搭建关键步骤 aijuans 分布式
Hadoop环境需要sshd服务一直开启，故，在服务器上需要按照ssh服务，以Ubuntu Linux为例，按照ssh服务如下： sudo apt-get install ssh sudo apt-get install rsync 编辑HADOOP_HOME/conf/hadoop-env.sh文件，将JAVA_HOME设置为Java
PL/SQL DEVELOPER 使用的一些技巧 atongyeye java sql
1 记住密码这是个有争议的功能，因为记住密码会给带来数据安全的问题。但假如是开发用的库，密码甚至可以和用户名相同，每次输入密码实在没什么意义，可以考虑让PLSQL Developer记住密码。位置：Tools菜单－－Preferences－－Oracle－－Logon HIstory－－Store with password 2 特殊Copy 在SQL Window
PHP：在对象上动态添加一个新的方法 bardo 方法动态添加闭包
有关在一个对象上动态添加方法，如果你来自Ruby语言或您熟悉这门语言，你已经知道它是什么...... Ruby提供给你一种方式来获得一个instancied对象，并给这个对象添加一个额外的方法。好！不说Ruby了，让我们来谈谈PHP PHP未提供一个“标准的方式”做这样的事情，这也是没有核心的一部分... 但无论如何，它并没有说我们不能做这样
ThreadLocal与线程安全 bijian1013 java java多线程 threadLocal
首先来看一下线程安全问题产生的两个前提条件： 1.数据共享，多个线程访问同样的数据。 2.共享数据是可变的，多个线程对访问的共享数据作出了修改。实例：定义一个共享数据： public static int a = 0;
Tomcat 架包冲突解决征客丶 tomcat Web
环境： Tomcat 7.0.6 win7 x64 错误表象：【我的冲突的架包是：catalina.jar 与 tomcat-catalina-7.0.61.jar 冲突，不知道其他架包冲突时是不是也报这个错误】严重: End event threw exception java.lang.NoSuchMethodException: org.apache.catalina.dep
【Scala三】分析Spark源代码总结的Scala语法一 bit1129 scala
Scala语法 1. classOf运算符 Scala中的classOf[T]是一个class对象，等价于Java的T.class,比如classOf[TextInputFormat]等价于TextInputFormat.class 2. 方法默认值 defaultMinPartitions就是一个默认值，类似C++的方法默认值
java 线程池管理机制 BlueSkator java线程池管理机制
编辑 Add Tools jdk线程池一、引言第一：降低资源消耗。通过重复利用已创建的线程降低线程创建和销毁造成的消耗。第二：提高响应速度。当任务到达时，任务可以不需要等到线程创建就能立即执行。第三：提高线程的可管理性。线程是稀缺资源，如果无限制的创建，不仅会消耗系统资源，还会降低系统的稳定性，使用线程池可以进行统一的分配，调优和监控。
关于hql中使用本地sql函数的问题（问-答） BreakingBad HQL 存储函数
转自于：http://www.iteye.com/problems/23775 问：我在开发过程中，使用hql进行查询（mysql5）使用到了mysql自带的函数find_in_set()这个函数作为匹配字符串的来讲效率非常好，但是我直接把它写在hql语句里面（from ForumMemberInfo fm,ForumArea fa where find_in_set(fm.userId,f
读《研磨设计模式》-代码笔记-迭代器模式-Iterator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.Arrays; import java.util.List; /** * Iterator模式提供一种方法顺序访问一个聚合对象中各个元素，而又不暴露该对象内部表示 * * 个人觉得，为了不暴露该
常用SQL chenjunt3 oracle sql C++c C#
--NC建库 CREATE TABLESPACE NNC_DATA01 DATAFILE 'E:\oracle\product\10.2.0\oradata\orcl\nnc_data01.dbf' SIZE 500M AUTOEXTEND ON NEXT 50M EXTENT MANAGEMENT LOCAL UNIFORM SIZE 256K ; CREATE TABLESPA
数学是科学技术的语言 comsci 工作活动领域模型
从小学到大学都在学习数学，从小学开始了解数字的概念和背诵九九表到大学学习复变函数和离散数学，看起来好像掌握了这些数学知识，但是在工作中却很少真正用到这些知识，为什么？最近在研究一种开源软件-CARROT2的源代码的时候，又一次感觉到数学在计算机技术中的不可动摇的基础作用，CARROT2是一种用于自动语言分类（聚类）的工具性软件，用JAVA语言编写，它
Linux系统手动安装rzsz 软件包 daizj linux sz rz
1、下载软件 rzsz-3.34.tar.gz。登录linux，用命令 wget http://freeware.sgi.com/source/rzsz/rzsz-3.48.tar.gz下载。 2、解压 tar zxvf rzsz-3.34.tar.gz 3、安装 cd rzsz-3.34 ; make posix 。注意：这个软件安装与常规的GNU软件不
读源码之:ArrayBlockingQueue dieslrae java
ArrayBlockingQueue是concurrent包提供的一个线程安全的队列,由一个数组来保存队列元素.通过 takeIndex和 putIndex来分别记录出队列和入队列的下标,以保证在出队列时不进行元素移动. //在出队列或者入队列的时候对takeIndex或者putIndex进行累加,如果已经到了数组末尾就又从0开始,保证数
C语言学习九枚举的定义和应用 dcj3sjt126com c
枚举的定义 # include <stdio.h> enum WeekDay { MonDay, TuesDay, WednesDay, ThursDay, FriDay, SaturDay, SunDay }; int main(void) { //int day; //day定义成int类型不合适 enum WeekDay day = Wedne
Vagrant 三种网络配置详解 dcj3sjt126com vagrant
Forwarded port Private network Public network Vagrant 中一共有三种网络配置，下面我们将会详解三种网络配置各自优缺点。端口映射(Forwarded port)，顾名思义是指把宿主计算机的端口映射到虚拟机的某一个端口上，访问宿主计算机端口时，请求实际是被转发到虚拟机上指定端口的。Vagrantfile中设定语法为： c
16.性能优化-完结 frank1234 性能优化
性能调优是一个宏大的工程，需要从宏观架构(比如拆分，冗余，读写分离，集群，缓存等)，软件设计（比如多线程并行化，选择合适的数据结构），数据库设计层面（合理的表设计，汇总表，索引，分区，拆分，冗余等）以及微观（软件的配置，SQL语句的编写，操作系统配置等）根据软件的应用场景做综合的考虑和权衡，并经验实际测试验证才能达到最优。性能水很深，笔者经验尚浅，赶脚也就了解了点皮毛而已，我觉得
Word Search hcx2013 search
Given a 2D board and a word, find if the word exists in the grid. The word can be constructed from letters of sequentially adjacent cell, where "adjacent" cells are those horizontally or ve
Spring4新特性——Web开发的增强 jinnianshilongnian spring spring mvc spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
CentOS安装配置tengine并设置开机启动 liuxingguome centos
yum install gcc-c++ yum install pcre pcre-devel yum install zlib zlib-devel yum install openssl openssl-devel Ubuntu上可以这样安装 sudo aptitude install libdmalloc-dev libcurl4-opens
第14章工具函数（上） onestopweb 函数
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Xelsius 2008 and SAP BW at a glance blueoxygen BO Xelsius
Xelsius提供了丰富多样的数据连接方式，其中为SAP BW专属提供的是BICS。那么Xelsius的各种连接的优缺点比较以及Xelsius是如何直接连接到BEx Query的呢？以下Wiki文章应该提供了全面的概览。 http://wiki.sdn.sap.com/wiki/display/BOBJ/Xcelsius+2008+and+SAP+NetWeaver+BW+Co
oracle表空间相关 tongsh6 oracle
在oracle数据库中，一个用户对应一个表空间，当表空间不足时，可以采用增加表空间的数据文件容量，也可以增加数据文件，方法有如下几种： 1.给表空间增加数据文件 ALTER TABLESPACE "表空间的名字" ADD DATAFILE '表空间的数据文件路径' SIZE 50M; &nb
.Net framework4.0安装失败 yangjuanjava .net windows
上午的.net framework 4.0，各种失败，查了好多答案，各种不靠谱，最后终于找到答案了和Windows Update有关系，给目录名重命名一下再次安装，即安装成功了！下载地址：http://www.microsoft.com/en-us/download/details.aspx?id=17113 方法： 1.运行cmd，输入net stop WuAuServ 2.点击开