cloudera首席用户

Spring Data Elasticsearch学习笔记

1． Java语言全文检索技术简介
什么是lucene？

Lucene是一套 “全文检索” 编程API ，基于Lucene对数据建立索引，进行查询。
很多框架对lucene进行了封装。

什么是ElasticSearch ?

现在企业开发中，更常用是的solr搜索服务器和ElasticSearch搜索服务器 
如果大家使用过 Apache Lucene 或 Apache Solr，就会知道它们的使用体验非常有趣。尤其在你需要扩展基于 Lucene 或 Solr 的解决方案时，你就会了解 Elasticsearch 项目背后的动机。Elasticsearch（构建于 Lucene 之上）在一个容易管理的包中提供了高性能的全文搜索功能，支持开箱即用地集群化扩展。你可以通过标准的 REST API 或从特定于编程语言的客户端库与 Elasticsearch 进行交互。
本教程将展示 Elasticsearch 的实际工作原理。首先了解命令行访问该 REST API 来了解它的基本信息。然后设置一个本地 Elasticsearch 服务器，并使用Java 应用程序与它交互。

2． ElasticSearch 安装配置使用入门
对于 Java 示例，还需要安装 Eclipse 和 Apache Maven。如果你的系统上还没有它们，请下载和安装它们。

官网： https://www.elastic.co/products/elasticsearch

Window系统下载zip版本，linux系统下载tar版本

下载后的页面

bin 存放elasticSearch 运行命令 
config 存放配置文件
lib 存放elasticSearch运行依赖jar包 
modules 存放elasticSearch 模块
plugins 存放插件

运行elasticSearch/bin/elasticsearch.bat 文件
配置JAVA_HOME环境变量

访问 http://127.0.0.1:9200

安装elasticSearch成功
将Elasticsearch注册到windows的服务上，不用每次启动Elasticsearch

安装：install
启动：start
停止：stop
卸载：remove
管理：manager
配置：查找jdk的绝对路径

3． ElasticSearch 插件安装 es head
es head：

elasticsearch-head插件
插件安装方法：
方案一：联网的情况下，可以使用plugin命令。
1.elasticsearch/bin/plugin.bat -install mobz/elasticsearch-head
2.运行es
3.打开http://localhost:9200/_plugin/head/
方案二：可以直接在git上下载源码到本地运行。
在地址栏输入es服务器的ip地址和端口，点connect就可以连接到集群。下面是连接后的视图。这是主界面，在这里可以看到es集群的基本信息（如：节点情况，索引情况）

【方案一】：联网下载
%elasticsearch%/bin/plugin.bat install mobz/elasticsearch-head

下载插件：

访问 http://localhost:9200/_plugin/head/

【方案二】：下载解压
1、插件下载地址
https://github.com/mobz/elasticsearch-head
2、安装方法：
将下载下的zip文件，解压缩到plugins/head目录下
目录路径如下：elasticsearch-2.4.0/plugins/head/

3、启动es bin/elasticsearch
4、访问集群
浏览器地址栏输入http://localhost:9200/_plugin/head/
5、显示结果如下图

4． ElasticSearch 基本操作入门
推荐书籍：
《Elasticsearch服务器开发（第2版）.pdf 》
《Elasticsearch权威指南（中文版）.pdf》

全文检索：针对文本中每个词，创建词条建立索引，进行搜索。
倒排索引：
也常被称为反向索引、置入档案或反向档案，是一种索引方法，被用来存储在全文搜索下某个单词在一个文档或者一组文档中的存储位置的映射。它是文档检索系统中最常用的数据结构。通过倒排索引，可以根据单词快速获取包含这个单词的文档列表。倒排索引主要由两个部分组成：“单词词典”和“倒排文件”。
倒排列表：
倒排列表用来记录有哪些文档包含了某个单词。一般在文档集合里会有很多文档包含某个单词，每个文档会记录文档编号（DocID），单词在这个文档中出现的次数（TF）及单词在文档中哪些位置出现过等信息，这样与一个文档相关的信息被称做倒排索引项（Posting），包含这个单词的一系列倒排索引项形成了列表结构，这就是某个单词对应的倒排列表。

ElasticSearch 操作服务器上的数据，通过 Rest API 操作数据

Elasticsearch可以作为一个独立的单个搜索服务器。不过，为了能够处理大型数据集，实现容错和高可用性，Elasticsearch可以运行在许多互相合作的服务器上。这些服务器称为集群（cluster），形成集群的每个服务器称为节点（node）。

如果操作Elasticsearch上数据，访问提供Rest API的URL地址，传递json数据给服务器

4.1． ElasticSearch 基础数据架构的主要概念

索引对象（blob）： 存储数据的表结构 ，任何搜索数据，存放在索引对象上 。
映射（mapping）： 数据如何存放到索引对象上，需要有一个映射配置， 包括：数据类型、是否存储、是否分词 … 等。
文档（document）： 一条数据记录， 存在索引对象上 
文档类型（type）： 一个索引对象 存放多种类型数据，数据用文档类型进行标识

【后续编程】：
第一步：建立索引对象
第二步：建立映射
第三步：存储数据【文档】
第四步：指定文档类型进行搜索数据【文档】
4.2． Elasticsearch与Mysql对比
Elasticsearch 集群可以包含多个索引（Index），每个索引可以包含多个类型（Type），每个类型可以包含多个文档（Document），每个文档可以包含多个字段（Field）。以下是 MySQL 和 Elasticsearch 的术语类比图，帮助理解：

就像使用 MySQL 必须指定 Database 一样，要使用 Elasticsearch 首先需要创建 Index：
client.indices.create({index : ‘blog’});
这样就创建了一个名为 blog的 Index。Type 不用单独创建，在创建 Mapping 时指定就可以。Mapping 用来定义 Document 中每个字段的类型，即所使用的 analyzer、是否索引等属性，非常关键等。创建 Mapping 的代码示例如下：
client.indices.putMapping({
index : ‘blog’,
type : ‘article’,
body : {
article: {
properties: {
id: {
type: ‘string’,
analyzer: ‘ik’,
search_analyzer: ‘ik’,
},
title: {
type: ‘string’,
analyzer: ‘ik’,
search_analyzer: ‘ik’,
},
content: {
type: ‘string’,
analyzer: ‘ik’,
search_analyzer: ‘ik’,
}
}
}
}
});

5． CURL命令操作执行REST命令
要理解本教程的所有示例，需要在你的系统上安装 Elasticsearch。下载针对你的平台的最新 Elastic Search 程序包。将该包解压到一个方便的位置。
在 Windows 上，运行elastic-search-dir/bin/elasticsearch.bat
5.1． Windows安装CURL
第一步：工具下载：
　　在官网处下载工具包：http://curl.haxx.se/download.html

下载后：

为了方便运行，不出现中文路径。

第二步：安装
【使用方式一】：在curl.exe目录中使用
　　解压下载后的压缩文件，通过cmd命令进入到curl.exe所在的目录。
　　进入到该目录后，执行curl --help测试：

【使用方式二】：放置在system32中
　　解压下载好的文件，拷贝curl.exe文件到C:\Windows\System32
然后就可以在DOS窗口中任意位置，使用curl命令了。

【使用方式三】：配置环境变量（推荐）
　　在系统高级环境变量中，配置
　　CURL_HOME ----- “你的curl目录位置”
　　path ---- 末尾添加 “;%CURL_HOME%;”
　　这样与上面方式二的效果相同。

可以对 Elasticsearch 发出 CURL 请求，这样很容易从命令行 shell 体验该框架。

Elasticsearch 是无模式的，这意味着它可以接受你提供的任何命令，并处理它以供以后查询。Elasticsearch 中的所有内容都被存储为文档，所以你的第一个练习是存储一个包含博客的文档。首先创建一个索引，它是你的所有文档类型的容器 — 类似于 MySQL 等关系数据库中的数据库。然后，将一个文档插入该索引中，以便可以查询该文档的数据。
5.2．创建一个索引
Elasticsearch 命令的一般格式是：REST VERBHOST:9200/index/doc-type— 其中 REST VERB 是 PUT、GET 或DELETE。（使用 curlL -X 动词前缀来明确指定 HTTP 方法。）
要创建一个索引，可在你的 shell 中运行以下命令：
curl -XPUT “http://localhost:9200/blog01/”

尽管 Elasticsearch 是无模式的，但它在幕后使用了 Lucene，后者使用了模式。不过 Elasticsearch 为你隐藏了这种复杂性。实际上，你可以将 Elasticsearch 文档类型简单地视为子索引或表名称。但是，如果你愿意，可以指定一个模式，所以你可以将它视为一种模式可选的数据存储。
【查看】

5.3．插入一个文档
要在 /blog01 索引下创建一个类型，可插入一个文档。
要将包含 “Deck the Halls” 的文档插入索引中，可运行以下命令（将该命令和本教程的其他 CURL 命令都键入到一行中）：
curl -XPUT “http://localhost:9200/blog01/article/1” -d “{”"“id”"": “”“1"”", “”“title”"": “”“Whatiselasticsearch”""}"

前面的命令使用 PUT 动词将一个文档添加到 /article文档类型，并为该文档分配 ID 为1。URL 路径显示为index/doctype/ID（索引/文档类型/ID）。

5.4．查看文档
要查看该文档，可使用简单的 GET 命令：
curl -XGET “http://localhost:9200/blog01/article/1”

Elasticsearch 使用你之前 PUT 进索引中的 JSON 内容作为响应：
5.5．更新文档
如果你认识到title字段写错了，并想将它更改为 Whatislucene 怎么办？可运行以下命令来更新文档：
curl -XPUT “http://localhost:9200/blog01/article/1” -d “{”"“id”"": “”“1"”", “”“title”"": “”“Whatislucene”""}"

因为此命令使用了相同的唯一 ID为1，所以该文档会被更新。
5.6．搜索文档
是时候运行一次基本查询了，此查询比你运行来查找 “Get the Halls” 文档的简单 GET 要复杂一些。文档 URL 有一个内置的 _search 端点用于此用途。在标题中找到所有包含单词 lucene 的数据：
curl -XGET “http://localhost:9200/blog01/article/_search?q=title:‘Whatislucene’”

参数表示一个查询。
5.7．检查搜索返回对象
上图中给出了 Elasticsearch 从前面的查询返回的数据。
在结果中，Elasticsearch 提供了多个 JSON 对象。第一个对象包含请求的元数据：看看该请求花了多少毫秒 (took) 和它是否超时 (timed_out)。_shards 字段需要考虑 Elasticsearch 是一个集群化服务的事实。甚至在这个单节点本地部署中，Elasticsearch 也在逻辑上被集群化为分片。在往后看可以观察到 hits 对象包含：
• total 字段，它会告诉你获得了多少个结果
• max_score，用于全文搜索
• 实际结果
实际结果包含 fields 属性，因为你将 fields 参数添加到了查询中。否则，结果中会包含 source，而且包含完整的匹配文档。_index、_type 和 _id 分别表示索引、文档类型、ID；_score 指的是全文搜索命中长度。这 4 个字段始终会在结果中返回。
5.8．删除文档
暂时不要删除该文档，知道如何删除它就行了：
curl -XDELETE “http://localhost:9200/blog01/article/1”

5.9．删除索引
暂时不要删除该文档，知道如何删除它就行了：
curl -XDELETE “http://localhost:9200/blog01”

6．使用Java操作客户端（入门）
Elasticsearch 的 Java 客户端非常强大；它可以建立一个嵌入式实例并在必要时运行管理任务。
运行一个 Java 应用程序和 Elasticsearch 时，有两种操作模式可供使用。该应用程序可在 Elasticsearch 集群中扮演更加主动或更加被动的角色。在更加主动的情况下（称为 Node Client），应用程序实例将从集群接收请求，确定哪个节点应处理该请求，就像正常节点所做的一样。（应用程序甚至可以托管索引和处理请求。）另一种模式称为 Transport Client，它将所有请求都转发到另一个 Elasticsearch 节点，由后者来确定最终目标。

6.1．新建文档（自动创建索引和映射）
1、需要新建 maven项目

2、基于maven的pom 导入坐标依赖

org.elasticsearch
elasticsearch
2.4.0

junit
junit
4.12

ElasticSearch2.4.0 依赖 lucene5.5.2 版本

当直接在ElasticSearch 建立文档对象时，如果索引不存在的，默认会自动创建，映射采用默认方式

 ElasticSearch 服务默认端口 9300
 Web 管理平台端口 9200
获取 Transport Client调用
对于演示应用程序，（通过 App.java 中执行的初始化）选择 Transport Client，并保持 Elasticsearch 执行最低级别的处理：
这里注意：如果连接到一个 Elasticsearch 集群，构建器可以接受多个地址。（在本课程中，你只有一个 localhost 节点。）连接到端口 9300，而不是像之前在 REST API 的 CURL 中一样连接到 9200。Java 客户端将会使用这个特殊端口，使用端口 9200将不起作用。
使用org.elasticsearch.client.Client连接服务器。所以任何操作都需要用上，我们把它的创建放置到@Before中，操作最后别忘记执行client.close()方法关闭。
private Client client;
/** 获取client */
@Before
public void getClient() throws Exception {
client = TransportClient.builder().build()
.addTransportAddress(new InetSocketTransportAddress(InetAddress.getByName(“127.0.0.1”), 9300));
}

3、建立文档，自动创建索引
方式一：拼装json的字符串。
@Test
public void createIndexNoMapping() {
String json = “{” +
““id”:“1”,” +
““title”:“基于Lucene的搜索服务器”,” +
““content”:“它提供了一个分布式多用户能力的全文搜索引擎，基于RESTful web接口”” +
“}”;
IndexResponse indexResponse = this.client.prepareIndex(“blog”, “article”, “1”).setSource(json).execute().actionGet();
// 结果获取
String index = indexResponse.getIndex();
String type = indexResponse.getType();
String id = indexResponse.getId();
long version = indexResponse.getVersion();
boolean created = indexResponse.isCreated();
System.out.println(index + " : " + type + ": " + id + ": " + version + ": " + created);
// 关闭连接
client.close();
}

方式二：使用Map集合
// ElasticSearch 测试程序
public class ElasticSearchTest {

/**创建索引、类型、文档*/
@Test
public void createIndexNoMapping1() {
	Map json = new HashMap();
	json.put("id", "2");
	json.put("title", "基于Lucene的搜索服务器");
	json.put("content", "它提供了一个分布式多用户能力的全文搜索引擎，基于RESTful web接口");
	IndexResponse indexResponse = this.client.prepareIndex("blog", "article", "2").setSource(json).execute().actionGet();
	// 结果获取
	String index = indexResponse.getIndex();
	String type = indexResponse.getType();
	String id = indexResponse.getId();
	long version = indexResponse.getVersion();
	boolean created = indexResponse.isCreated();
	System.out.println(index + " : " + type + ": " + id + ": " + version + ": " + created);
	// 关闭连接
	client.close();
}

方式三：使用es的帮助类，创建json对象
@Test
public void createIndexNoMapping2() throws Exception{
// 使用es的帮助类，创建一个json方式的对象
/**
* 描述json 数据
* {id:xxx, title:xxx, content:xxx}
*/
XContentBuilder sourceBuilder = XContentFactory.jsonBuilder()
.startObject()
.field(“id”, 3)
.field(“title”, “ElasticSearch是一个基于Lucene的搜索服务器”)
.field(“content”,
“它提供了一个分布式多用户能力的全文搜索引擎，基于RESTful web接口。Elasticsearch是用Java开发的，并作为Apache许可条款下的开放源码发布，是当前流行的企业级搜索引擎。设计用于云计算中，能够达到实时搜索，稳定，可靠，快速，安装使用方便。”)
.endObject();
// 创建索引
IndexResponse indexResponse = client.prepareIndex(“blog”, “article”, “3”).setSource(sourceBuilder).get();
// 结果获取
String index = indexResponse.getIndex();
String type = indexResponse.getType();
String id = indexResponse.getId();
long version = indexResponse.getVersion();
boolean created = indexResponse.isCreated();
System.out.println(index + " : " + type + ": " + id + ": " + version + ": " + created);
// 关闭连接
client.close();
}
}

没有映射创建，自动创建索引和映射
名称为blog

自动创建索引映射

文档数据（type 文档类型）

6.2．搜索文档数据（单个索引）
使用GetResponse查询
/**
* get API 获取指定文档信息
*/
@Test
public void testGetData() throws Exception {
Client client = TransportClient.builder().build()
.addTransportAddress(new InetSocketTransportAddress(InetAddress.getByName(“127.0.0.1”), 9300));
GetResponse response = client.prepareGet(“blog”, “article”, “1”)
.setOperationThreaded(false) // 线程安全
.get();
System.out.println(response.getSourceAsString());
// 关闭连接
client.close();
}
6.3．搜索文档数据（多个索引）

/**
* 测试multi get
* 搜索
* 从不同的index, type, 和id中获取
*/
@Test
public void testMultiGet() {
MultiGetResponse multiGetResponse = client.prepareMultiGet()
.add(“blog”, “article”, “1”)
.add(“blog”, “article”, “2”, “3”, “4”)
.add(“blog”, “article”, “2”)
.get();

    for (MultiGetItemResponse itemResponse : multiGetResponse) {
        GetResponse response = itemResponse.getResponse();
        if (response.isExists()) {
            String sourceAsString = response.getSourceAsString();
            System.out.println(sourceAsString);
        }
    }
    client.close();
}

6.4．更新文档数据
【更新方式一】
/**
* 测试更新 update API 使用 updateRequest 对象
*/
@Test
public void testUpdate() throws Exception {
UpdateRequest updateRequest = new UpdateRequest();
updateRequest.index(“blog”);
updateRequest.type(“article”);
updateRequest.id(“1”);
updateRequest.doc(XContentFactory.jsonBuilder().startObject()
// 对没有的字段添加, 对已有的字段替换
.field(“title”, “ElasticSearch是一个基于Lucene的搜索服务器”)
.field(“content”,
“它提供了一个分布式多用户能力的全文搜索引擎，基于RESTful web接口。Elasticsearch是用Java开发的，并作为Apache许可条款下的开放源码发布，是当前流行的企业级搜索引擎。设计用于云计算中，能够达到实时搜索，稳定，可靠，快速，安装使用方便。”)
.field(“createDate”, “2018-10-11”).endObject());
UpdateResponse response = client.update(updateRequest).get();

	// 打印
	String index = response.getIndex();
	String type = response.getType();
	String id = response.getId();
	long version = response.getVersion();
	System.out.println(index + " : " + type + ": " + id + ": " + version);
	// 关闭连接
	client.close();
}

【更新方式二】

/**
 * 测试更新 update API 使用 updateRequest 对象
 */
@Test
public void testUpdate2() throws Exception {
	// 使用updateRequest对象及documents进行更新
	UpdateResponse response = client
			.update(new UpdateRequest("blog", "article", "1").doc(XContentFactory.jsonBuilder().startObject()
					.field("title", "什么是Elasticsearch，ElasticSearch是一个基于Lucene的搜索服务器").endObject()))
			.get();
	// 打印
	String index = response.getIndex();
	String type = response.getType();
	String id = response.getId();
	long version = response.getVersion();
	System.out.println(index + " : " + type + ": " + id + ": " + version);
	// 关闭连接
	client.close();
}

【更新方式三】
/**
* 测试upsert方法
*/
@Test
public void testUpsert() throws Exception {
// 设置查询条件, 查找不到则添加
IndexRequest indexRequest = new IndexRequest(“blog”, “article”, “1”)
.source(XContentFactory.jsonBuilder()
.startObject()
.field(“title”, “搜索服务器”)
.field(“content”,
“它提供了一个分布式多用户能力的全文搜索引擎，基于RESTful web接口。Elasticsearch是用Java开发的，并作为Apache许可条款下的开放源码发布，是当前流行的企业级搜索引擎。设计用于云计算中，能够达到实时搜索，稳定，可靠，快速，安装使用方便。”)
.endObject());
// 设置更新, 查找到更新下面的设置
UpdateRequest upsert = new UpdateRequest(“blog”, “article”, “1”)
.doc(XContentFactory.jsonBuilder()
.startObject()
.field(“user”, “李四”)
.endObject())
.upsert(indexRequest);

    client.update(upsert).get();
    client.close();
}

6.5．删除文档数据
/**
* 测试 delete
*/
@Test
public void testDelete() {
DeleteResponse response = client.prepareDelete(“blog”, “article”, “1”)
.get();
String index = response.getIndex();
String type = response.getType();
String id = response.getId();
long version = response.getVersion();
System.out.println(index + " : " + type + ": " + id + ": " + version);
client.close();
}

7．条件查询QueryBuilder
到目前为止，我们使用了REST API和简单查询以及GET请求来搜索数据。更改索引时，无论想执行的操作是更改映射还是文档索引化，都要用REST API向Elasticsearch发送JSON结构的数据。类似地，如果想发送的不是一个简单的查询，仍然把它封装为JSON结构并发送给Elasticsearch。这就是所谓的查询DSL。从更宏观的角度看，Elasticsearch支持两种类型的查询：基本查询和复合查询。
基本查询，如词条查询用于查询实际数据。
第二种查询为复合查询，如布尔查询，可以合并多个查询。
查询数据主要依赖QueryBuilder对象，可以通过QueryBuilders获取各种查询：（基于lucene）
boolQuery() 布尔查询，可以用来组合多个查询条件
fuzzyQuery() 模糊查询
matchAllQuery() 查询所有数据
regexpQuery() 正则表达式查询
termQuery() 词条查询
wildcardQuery() 通配符查询
使用SearchResponse获取，支持各种查询：
/**
* 搜索在elasticSearch中创建的文档对象
/
@Test
public void testSearch() throws Exception {
// 搜索数据
// get()方法 === execute().actionGet()
// SearchResponse searchResponse = client.prepareSearch(“blob1”)
// .setTypes(“article”).setQuery(QueryBuilders.matchAllQuery()).get();
/*
* 1、ElasticSearch提供QueryBuileders.queryStringQuery(搜索内容)
* 查询方法，对所有字段进行分词查询
/
// SearchResponse searchResponse = client.prepareSearch(“blog”).setTypes(“article”)
// .setQuery(QueryBuilders.queryStringQuery(“全面”))
// .get();
/*
* 2、只想查询content里包含全文，使用QueryBuilders.wildcardQuery模糊查询任意字符串 ?任意单个字符
/
// SearchResponse searchResponse = client.prepareSearch(“blog”).setTypes(“article”)
// .setQuery(QueryBuilders.wildcardQuery(“content”, “全文”)).get();
/ 3、查询content词条为“搜索” 内容，使用TermQuery */
SearchResponse searchResponse = client.prepareSearch(“blog”)
.setTypes(“article”)
.setQuery(QueryBuilders.termQuery(“content”, “全文”)).get();
SearchHits hits = searchResponse.getHits(); // 获取命中次数，查询结果有多少对象
System.out.println(“查询结果有：” + hits.getTotalHits() + “条”);
Iterator iterator = hits.iterator();
while (iterator.hasNext()) {
SearchHit searchHit = iterator.next(); // 每个查询对象
System.out.println(searchHit.getSourceAsString()); // 获取字符串格式打印
System.out.println(“id:” + searchHit.getSource().get(“id”));
System.out.println(“title:” + searchHit.getSource().get(“title”));
System.out.println(“content:” + searchHit.getSource().get(“content”));
for (Iterator ite = searchHit.iterator(); ite.hasNext()? {
SearchHitField next = ite.next();
System.out.println(next.getValues());
}
}
// 关闭连接
client.close();
}
8．各种查询对象Query的使用
ElasticSearch 支持所有Lucene查询，并对其进行简化封装
WildcardQuery 通配符查询
TermQuery 词条查询
FuzzyQuery 相似度查询（模糊查询）
BooleanQuery 布尔查询

1、ElasticSearch提供QueryBuileders.queryStringQuery(搜索内容) 查询方法，对所有字段进行分词查询
SearchResponse searchResponse = client.prepareSearch(“blog”)
.setTypes(“article”)
.setQuery(QueryBuilders.queryStringQuery(“全文”)).get();
2、只想查询content里包含全文，使用QueryBuilders.wildcardQuery通配符查询 *任意字符串 ?任意单个字符
SearchResponse searchResponse = client.prepareSearch(“blog”)
.setTypes(“article”)
.setQuery(QueryBuilders.wildcardQuery(“content”, “全文”)).get();
发现查询不到！！！！，涉及词条查询理解，说明没有词条包含“全文”
3、查询content词条为“搜索” 内容，使用QueryBuilders.termQuery进行词条查询
SearchResponse searchResponse = client.prepareSearch(“blog”)
.setTypes(“article”)
.setQuery(QueryBuilders.termQuery(“content”, “全文”)).get();
发现查询不到！！！，说明没有搜索“全文”这个词条
这是为什么呢？
词条：就是将文本内容存入搜索服务器，搜索服务器进行分词之后的内容。
例如：“ElasticSearch是一个基于Lucene的搜索服务器”
分词（好的）： ElasticSearch、是、一个、基于、Lucene、搜索、服务、服务器
默认单字分词（差的）： ElasticSearch、是、一、个、基、于、搜、索
使用QueryBuileders.queryStringQuery(搜索内容)，搜索“全面” 也能够查询到，这是为什么呢？看图：

9． IK分词器和ElasticSearch集成使用
ElasticSearch 默认采用分词器，单个字分词，效果很差
搜索【IK Analyzer 3.0】
http://www.oschina.net/news/2660

下载 https://github.com/medcl/elasticsearch-analysis-ik/tree/2.x

1、下载开源项目

2、打包ik分词器
mvn clean 清空

mvn package 打包

生成：
这里不用执行，需要联网下载，而且很慢，我们使用现成的即可。

3、在%es%/plugins目录里新建analysis-ik目录，将elasticsearch-analysis-ik-1.10.4解压，
将解压后将所有文件拷贝到 %es%/plugins/analysis-ik下

在linux的es集群下安装ik：
bin/plugin install file:///export/software/elasticsearch-analysis-ik-1.10.4.zip
注意：每个节点都需要安装
此时的每个节点都需要配置一份自己的扩展字典吗？不用！

我们可以给它配置远程扩展字典：

既然是远程词典，那么就要是一个可访问的链接，可以是一个页面，也可以是一个txt的文档，但要保证输出的内容是 utf-8 的格式，hotWords.php 的内容：
$s = <<<‘EOF’
蓝瘦
千锋互联
不明觉厉
EOF;
header(‘Last-Modified: ‘.gmdate(‘D, d M Y H:i:s’, time()).’ GMT’, true, 200);
header(‘ETag: “5816f349-19”’);
echo $s;
ik 接收两个返回的头部属性 Last-Modified 和 ETag，只要其中一个有变化，就会触发更新，ik 会每分钟获取一次
重启 Elasticsearch
注意：如果设置的链接是一个页面，需要部署服务器，关于部署服务器可以是Apache或Tomcat等。
4、在%es%/config下, 配置elasticsearch.yml （切记，在配置前一定要加空格！！！）
index.analysis.analyzer.ik.type: “ik”
放置到最后
名称命名为。后续用到分词器的时候，使用ik这个名词。
5、重启es

发现ik分词器被加载

6、访问
http://localhost:9200/_analyze?analyzer=ik&pretty=true&text=我是中国人

其中，
“我”是一个词，
“是”是停用词，
“中国人”可以分为“中国人”、“中国”、“国人”。
【出现异常】：

别导错包：

10． ElasticSearch 常用编程操作
在ElasticSearch没有索引情况下，插入文档，默认创建索引和索引映射（但是无法使用ik分词器）
要想使用IK分词器，需要重新创建索引。
10.1．索引相关操作
创建索引
// 创建索引
client.admin().indices().prepareCreate(“blog2”).get();

默认创建好索引，mappings为空
删除索引
// 删除索引
client.admin().indices().prepareDelete(“blog2”).get();
【代码】
@Test
// 索引/删除操作
public void createIndex() throws IOException {
// 创建索引
//client.admin().indices().prepareCreate(“blog2”).get();

	// 删除索引
	client.admin().indices().prepareDelete("blog2").get();

	// 关闭连接
	client.close();
}

10.2．映射相关操作

创建映射
PutMappingRequest mapping = Requests.putMappingRequest(“blog2”).type(“article”).source(builder);
client.admin().indices().putMapping(mapping).get();
【代码】
@Test
// 映射操作
public void createMapping() throws Exception {
// 创建索引
// client.admin().indices().prepareCreate(“blog03”).execute().actionGet();
// 添加映射
/**
* 格式： “mappings” : { “article” : { “dynamic” : “false”, “properties” :
* { “id” : { “type” : “string” }, “content” : { “type” : “string” },
* “author” : { “type” : “string” } } } }
*/
XContentBuilder builder = XContentFactory.jsonBuilder()
.startObject()
.startObject(“article”)
.startObject(“properties”)
.startObject(“id”).field(“type”, “integer”).field(“store”, “yes”).endObject()
.startObject(“title”).field(“type”, “string”).field(“store”, “yes”).field(“analyzer”, “ik”).endObject()
.startObject(“content”).field(“type”, “string”).field(“store”, “yes”).field(“analyzer”, “ik”).endObject()
.endObject()
.endObject()
.endObject();

	PutMappingRequest mapping = Requests.putMappingRequest("blog2").type("article").source(builder);
	client.admin().indices().putMapping(mapping).get();

	// 关闭连接
	client.close();
}

查看：http://localhost:9200/_plugin/head/

10.3．文档相关操作
建立文档数据（XContentBuilder）
1、回顾：直接在XContentBuilder中构建json数据，建立文档。
// 描述json 数据
/*
* {id:xxx, title:xxx, content:xxx}
/
XContentBuilder builder = XContentFactory.jsonBuilder()
.startObject()
.field(“id”, 1)
.field(“title”, “ElasticSearch是一个基于Lucene的搜索服务器”)
.field(“content”,
“它提供了一个分布式多用户能力的全文搜索引擎，基于RESTful web接口。Elasticsearch是用Java开发的，并作为Apache许可条款下的开放源码发布，是当前流行的企业级搜索引擎。设计用于云计算中，能够达到实时搜索，稳定，可靠，快速，安装使用方便。”)
.endObject();
// 建立文档对象
/*
* 参数一blog1：表示索引对象
* 参数二article：类型
* 参数三1：建立id
*/
client.prepareIndex(“blog2”, “article”, “1”).setSource(builder).get();
建立文档数据（Jackson）
对一个已经存在对象，转换为json ，建立文档
创建包，com.qf.elasticsearch.domain
public class Article {

private Integer id;
private String title;
private String content;

}
问题：如何将Article对象，转换为json数据 ---- Jackson 转换开发包
Jackson 是一个 Java 用来处理 JSON 格式数据的类库，性能非常好。
Jackson可以轻松的将Java对象转换成json对象和xml文档，同样也可以将json、xml转换成Java对象。Jackson库于2012.10.8号发布了最新的2.1版。
Jackson源码目前托管于GitHub，地址：https://github.com/FasterXML/
Jackson 2.x介绍
Jackson 2.x版提供了三个JAR包供下载：

Core库：streaming parser/generator，即流式的解析器和生成器。
下载：
http://repo1.maven.org/maven2/com/fasterxml/jackson/core/jackson-core/2.1.0/jackson-core-2.1.0.jar
Databind库：ObjectMapper, Json Tree Model，即对象映射器，JSON树模型。
下载：
http://repo1.maven.org/maven2/com/fasterxml/jackson/core/jackson-databind/2.1.0/jackson-databind-2.1.0.jar
Annotations库：databinding annotations，即带注释的数据绑定包。
下载：
http://repo1.maven.org/maven2/com/fasterxml/jackson/core/jackson-annotations/2.1.0/jackson-annotations-2.1.0.jar

从Jackson 2.0起，
核心组件包括：jackson-annotations、jackson-core、jackson-databind。
数据格式模块包括：Smile、CSV、XML、YAML。

引入jackson
1.x 版本

org.codehaus.jackson
jackson-core-asl
1.9.13

org.codehaus.jackson
jackson-mapper-asl
1.9.13

2.x 版本

com.fasterxml.jackson.core jackson-core 2.8.1 com.fasterxml.jackson.core jackson-databind 2.8.1 com.fasterxml.jackson.core jackson-annotations 2.8.1  【建立文档代码】： @Test // 文档相关操作 public void demo6() throws IOException, InterruptedException, ExecutionException { // 创建连接搜索服务器对象 Client client = TransportClient .builder() .build() .addTransportAddress( new InetSocketTransportAddress(InetAddress .getByName("127.0.0.1"), 9300)); // 描述json 数据 /* * {id:xxx, title:xxx, content:xxx} */ Article article = new Article(); article.setId(2); article.setTitle("搜索工作其实很快乐"); article.setContent("我们希望我们的搜索解决方案要快，我们希望有一个零配置和一个完全免费的搜索模式，我们希望能够简单地使用JSON通过HTTP的索引数据，我们希望我们的搜索服务器始终可用，我们希望能够一台开始并扩展到数百，我们要实时搜索，我们要简单的多租户，我们希望建立一个云的解决方案。Elasticsearch旨在解决所有这些问题和更多的问题。");

	ObjectMapper objectMapper = new ObjectMapper();

	// 建立文档
	client.prepareIndex("blog2", "article", article.getId().toString())
	 		.setSource(objectMapper.writeValueAsString(article)).get();
	// 关闭连接
	client.close();
}

测试完成搜索：

 【修改文档代码】
方式一：使用prepareUpdate、prepareIndex都可以
client.prepareUpdate(“blog2”, “article”, article.getId().toString())
.setDoc(objectMapper.writeValueAsString(article)).get();
方式二：直接使用update
client.update(new UpdateRequest(“blog2”, “article”, article.getId().toString())
.doc(objectMapper.writeValueAsString(article))).get();

 删除文档
方式一： prepareDelete
client.prepareDelete(“blog2”, “article”,
article.getId().toString()).get();

方式二：直接使用delete
client.delete(new DeleteRequest(“blog2”, “article”,
article.getId().toString())).get();
【http://localhost:9200/_plugin/head：查询结果】：

【搜索代码】
@Test
// 搜索在elasticSearch中创建文档对象
public void testSearchQuery() throws IOException {
// 创建连接搜索服务器对象
Client client = TransportClient.builder().build()
.addTransportAddress(new InetSocketTransportAddress(InetAddress.getByName(“127.0.0.1”), 9300));
// 搜索数据
// get() === execute().actionGet()
// SearchResponse searchResponse = client.prepareSearch(“blog2”)
// .setTypes(“article”).setQuery(QueryBuilders.matchAllQuery())
// .get();
/**
* 1、ElasticSearch提供QueryBuileders.queryStringQuery(搜索内容)
* 查询方法，对所有字段进行分词查询
/
// SearchResponse searchResponse = client.prepareSearch(“blog2”)
// .setTypes(“article”)
// .setQuery(QueryBuilders.queryStringQuery(“全面”)).get();
/*
* 2、只想查询content里包含全文，使用QueryBuilders.wildcardQuery模糊查询 *任意字符串 ?任意单个字符
*/
// SearchResponse searchResponse = client.prepareSearch(“blog2”)
// .setTypes(“article”)
// .setQuery(QueryBuilders.wildcardQuery(“content”, “搜索”)).get();
// /**3、查询content词条为“搜索” 内容，使用TermQuery */
SearchResponse searchResponse = client.prepareSearch(“blog2”).setTypes(“article”)
.setQuery(QueryBuilders.termQuery(“content”, “搜索”)).get();
SearchHits hits = searchResponse.getHits(); // 获取命中次数，查询结果有多少对象
System.out.println(“查询结果有：” + hits.getTotalHits() + “条”);
Iterator iterator = hits.iterator();
while (iterator.hasNext()) {
SearchHit searchHit = iterator.next(); // 每个查询对象
System.out.println(searchHit.getSourceAsString()); // 获取字符串格式打印
System.out.println(“id:” + searchHit.getSource().get(“id”));
System.out.println(“title:” + searchHit.getSource().get(“title”));
System.out.println(“content:” + searchHit.getSource().get(“content”));
}
// 关闭连接
client.close();
}
10.4． IK分词器，自定义词库
如果修改文档，content字段添加“不明觉厉”
Article article = new Article();
article.setId(2);
article.setTitle(“搜索工作其实很快乐”);
article.setContent(
“不明觉厉希望能够简单地使用JSON通过HTTP的索引数据，我们希望我们的搜索服务器始终可用，我们希望能够一台开始并扩展到数百，我们要实时搜索，我们要简单的多租户，我们希望建立一个云的解决方案。Elasticsearch旨在解决所有这些问题和更多的问题。”);

	ObjectMapper objectMapper = new ObjectMapper();
	System.out.println(objectMapper.writeValueAsString(article));

	// 修改文档
	client.prepareUpdate("blog2", "article", article.getId().toString())
	 .setDoc(objectMapper.writeValueAsString(article)).get();

使用词条查询进行搜索
SearchResponse searchResponse = client.prepareSearch(“blog2”).setTypes(“article”)
.setQuery(QueryBuilders.termQuery(“content”, “不明觉厉”)).get();
SearchHits hits = searchResponse.getHits(); // 获取命中次数，查询结果有多少对象
System.out.println(“查询结果有：” + hits.getTotalHits() + “条”);
发现没有搜索到数据，其实“不明觉厉”使用IK中文分词器的时候，进行单字分词了。

如何自定义词库呢？

修改IKAnalyzer.cfg.xml

打开custom文件夹，mydict.dic，编辑文件

重新启动es。

重新修改文档，再次搜索，可以查询到结果。
10.5．各种查询
查询所有
matchAllQuery()匹配所有文件
match_all查询是Elasticsearch中最简单的查询之一。它使我们能够匹配索引中的所有文件。
SearchResponse searchResponse = client.prepareSearch(“blog2”)
.setTypes(“article”).setQuery(QueryBuilders.matchAllQuery())
.get();

	SearchHits hits = searchResponse.getHits(); // 获取命中次数，查询结果有多少对象

解析查询字符串
相比其他可用的查询，query_string查询支持全部的Apache Lucene查询语法
针对多字段的query_string查询
SearchResponse searchResponse = client.prepareSearch(“blog2”).setTypes(“article”)
.setQuery(QueryBuilders.queryStringQuery(“全面”)).get();
SearchHits hits = searchResponse.getHits(); // 获取命中次数，查询结果有多少对象

通配符查询（wildcardQuery）
匹配多个字符，?匹配1个字符
注意：避免开始, 会检索大量内容造成效率缓慢

SearchResponse searchResponse = client.prepareSearch(“blog2”).setTypes(“article”)
.setQuery(QueryBuilders.wildcardQuery(“content”, “elas*c?”)).get();
SearchHits hits = searchResponse.getHits(); // 获取命中次数，查询结果有多少对象
词条查询（termQuery）
词条查询是Elasticsearch中的一个简单查询。它仅匹配在给定字段中含有该词条的文档，而
且是确切的、未经分析的词条
termQuery(“key”, obj) 完全匹配
termsQuery(“key”, obj1, obj2…) 一次匹配多个值，只要有一个值是正确的，就可以查询出数据
// SearchResponse searchResponse = client.prepareSearch(“blog2”).setTypes(“article”)
// .setQuery(QueryBuilders.termQuery(“content”, “搜索”)).get();
SearchResponse searchResponse = client.prepareSearch(“blog2”).setTypes(“article”)
.setQuery(QueryBuilders.termsQuery(“content”, “搜索”,“全文”)).get();
SearchHits hits = searchResponse.getHits(); // 获取命中次数，查询结果有多少对象

字段匹配查询
matchQuery(“key”, Obj) 单个匹配, field不支持通配符, 前缀具高级特性
match查询把query参数中的值拿出来，加以分析，然后构建相应的查询。使用match查询时，Elasticsearch将对一个字段选择合适的分析器，所以可以确定，传给match查询的词条将被建立索引时相同的分析器处理。
multiMatchQuery(“text”, “field1”, “field2”…); 匹配多个字段, field有通配符查询功能
// SearchResponse searchResponse = client.prepareSearch(“blog2”).setTypes(“article”)
// .setQuery(QueryBuilders.matchQuery(“content”, “搜索”)).get();
SearchResponse searchResponse = client.prepareSearch(“blog2”).setTypes(“article”)
.setQuery(QueryBuilders.multiMatchQuery(“搜索”, “title”,“content”)).get();
SearchHits hits = searchResponse.getHits(); // 获取命中次数，查询结果有多少对象
只查询ID（标识符查询）
标识符查询是一个简单的查询，仅用提供的标识符来过滤返回的文档。此查询针对内部的
_uid字段运行，所以它不需要启用_id字段
SearchResponse searchResponse = client.prepareSearch(“blog2”).setTypes(“article”)
.setQuery(QueryBuilders.idsQuery().ids(“1”)).get();
SearchHits hits = searchResponse.getHits(); // 获取命中次数，查询结果有多少对象

相似度查询
fuzzy查询是模糊查询中的第三种类型，它基于编辑距离算法来匹配文档
SearchResponse searchResponse = client.prepareSearch(“blog2”).setTypes(“article”)
.setQuery(QueryBuilders.fuzzyQuery(“content”, “elasticsearxx”)).get();
SearchHits hits = searchResponse.getHits(); // 获取命中次数，查询结果有多少对象

范围查询
范围查询使我们能够找到在某一字段值在某个范围里的文档，字段可以是数值型，也可以是
基于字符串的
SearchResponse searchResponse = client.prepareSearch(“blog2”).setTypes(“article”)
.setQuery(QueryBuilders.rangeQuery(“content”).from(“我们”).to(“解决方案”).includeLower(true).includeUpper(true)).get();
SearchHits hits = searchResponse.getHits(); // 获取命中次数，查询结果有多少对象

includeLower(true)：包含上界
IncludeUpper(true)：包含下界

跨度查询
下面代码表示，从首字母开始，查询content字段=问题的数据，问题前面的词为300个，可以测试30看是否能查询出数据。
SearchResponse searchResponse = client.prepareSearch(“blog2”).setTypes(“article”)
.setQuery(QueryBuilders.spanFirstQuery(QueryBuilders.spanTermQuery(“content”, “问题”), 300)).get();
SearchHits hits = searchResponse.getHits(); // 获取命中次数，查询结果有多少对象

组合查询（复杂查询）
must(QueryBuilders) : AND
mustNot(QueryBuilders): NOT
should(QueryBuilders):OR

在定义json：放置到Elasticsearch的插件中
{
“query” : {
“bool” : {
“must” : {
“term” : {
“title” : “elasticsearch”
}
},
“should” : {
“range” : {
“id” : {
“from” : 1,
“to” : 2
}
}
}
}
}
}

SearchResponse searchResponse = client.prepareSearch(“blog2”).setTypes(“article”)
.setQuery(QueryBuilders.boolQuery().must(QueryBuilders.termQuery(“title”, “搜索”)).must(QueryBuilders.wildcardQuery(“content”, “elastic*ch”))).get();
SearchHits hits = searchResponse.getHits(); // 获取命中次数，查询结果有多少对象

排序查询
SearchResponse searchResponse = client.prepareSearch(“blog2”).setTypes(“article”)
.setQuery(QueryBuilders.matchAllQuery())
.addSort(“id”, SortOrder.DESC).get();
SearchHits hits = searchResponse.getHits(); // 获取命中次数，查询结果有多少对象

10.6．查询文档分页操作
1、批量向数据表插入100条记录。
@Test
// 批量查询100条记录
public void createDocument100() throws Exception {
// 创建连接搜索服务器对象
Client client = TransportClient
.builder()
.build()
.addTransportAddress(
new InetSocketTransportAddress(InetAddress
.getByName(“127.0.0.1”), 9300));

	ObjectMapper objectMapper = new ObjectMapper();

	for (int i = 1; i <= 100; i++) {
		// 描述json 数据
		Article article = new Article();
		article.setId(i);
		article.setTitle(i + "搜索工作其实很快乐");
		article.setContent(i
				+ "我们希望我们的搜索解决方案要快，我们希望有一个零配置和一个完全免费的搜索模式，我们希望能够简单地使用JSON通过HTTP的索引数据，我们希望我们的搜索服务器始终可用，我们希望能够一台开始并扩展到数百，我们要实时搜索，我们要简单的多租户，我们希望建立一个云的解决方案。Elasticsearch旨在解决所有这些问题和更多的问题。");

		// 建立文档
		client.prepareIndex("blog2", "article", article.getId().toString())
				.setSource(objectMapper.writeValueAsString(article)).get();
	}
	// 关闭连接
	client.close();
}

2、分页查询
查询所有的方法
searchRequestBuilder 的 setFrom【从0开始】和 setSize【查询多少条记录】方法实现
@Test
// 分页搜索
public void testPage() throws Exception {
// 创建连接搜索服务器对象
Client client = TransportClient
.builder()
.build()
.addTransportAddress(
new InetSocketTransportAddress(InetAddress
.getByName(“127.0.0.1”), 9300));
// 搜索数据
// get() === execute().actionGet()
SearchRequestBuilder searchRequestBuilder = client.prepareSearch(“blog2”).setTypes(“article”)
.setQuery(QueryBuilders.matchAllQuery());//默认每页10条记录

	// 查询第2页数据，每页20条
    //setFrom()：从第几条开始检索，默认是0。
    //setSize():每页最多显示的记录数。
	searchRequestBuilder.setFrom(20).setSize(20);

	SearchResponse searchResponse = searchRequestBuilder.get();
	printSearchResponse(searchResponse);

	// 关闭连接
	client.close();
}

10.7．查询结果高亮显示
在百度搜索elasticsearch，可以是文字高亮。

查看页面源码分析

【代码】
@Test
// 高亮查询结果处理搜索
public void testHighLight() throws IOException {
// 创建连接搜索服务器对象
Client client = TransportClient
.builder()
.build()
.addTransportAddress(
new InetSocketTransportAddress(InetAddress
.getByName(“127.0.0.1”), 9300));

	ObjectMapper objectMapper = new ObjectMapper();

	// 搜索数据
	SearchRequestBuilder searchRequestBuilder = client
			.prepareSearch("blog2").setTypes("article")
			.setQuery(QueryBuilders.termQuery("content", "搜索"));

1、配置应用高亮

	// 高亮定义
	searchRequestBuilder.addHighlightedField("content"); // 对content字段进行高亮
	searchRequestBuilder.setHighlighterPreTags(""); // 前置元素
	searchRequestBuilder.setHighlighterPostTags("");// 后置元素
	// 设置摘要大小
	searchRequestBuilder.setHighlighterFragmentSize(10);

	SearchResponse searchResponse = searchRequestBuilder.get();

	SearchHits hits = searchResponse.getHits(); // 获取命中次数，查询结果有多少对象
	System.out.println("查询结果有：" + hits.getTotalHits() + "条");
	Iterator iterator = hits.iterator();
	while (iterator.hasNext()) {
		SearchHit searchHit = iterator.next(); // 每个查询对象

2、对结果的高亮片段做拼接处理，替换原有内容

		// 将高亮处理后内容，替换原有内容 （原有内容，可能会出现显示不全 ）
		Map highlightFields = searchHit.getHighlightFields();
		HighlightField contentField = highlightFields.get("content");

		// 获取到原有内容中 每个高亮显示 集中位置 fragment 就是高亮片段
		Text[] fragments = contentField.fragments();
		String content = "";
		for (Text text : fragments) {
			content += text;
		}
		// 将查询结果转换为对象
		Article article = objectMapper.readValue(
				searchHit.getSourceAsString(), Article.class);

		// 用高亮后内容，替换原有内容
		// 如果值等于空，说明没有高亮的结果
		if(content!=null && !"".equals(content)){
			// 用高亮后内容，替换原有内容
			article.setContent(content);				
		}

		System.out.println(article);
	}

	// 关闭连接
	client.close();
}

最后，我们已经快速掌握了如何从命令行和在 Java 应用程序中使用 Elasticsearch。现在已经熟悉了索引、查询、高亮显示和多字段搜索等功能。那么还有一些功能值得我们关注。

11．得分（加权）
随着应用程序的增长，提高搜索质量的需求也进一步增大。我们把它叫做搜索体验。我们需要知道什么对用户更重要，关注用户如何使用搜索功能。这导致不同的结论，例如，有些文档比其他的更重要，或特定查询需强调一个字段而弱化其他字段。这就是可以用到加权的地方。

在Query和Field中可以设置加权
创建3条数据，通过加权影响我们的数据结果和得分
11.1．在Query的查询中定义加权
【创建数据】
1：Article中添加一个属性
public class Article {

private Integer id;
private String title;
private String content;
private String comment;

}
2：重新创建索引和映射，创建文档
/*创建索引/
@Test
public void testCreateIndex_boost() throws Exception{
// 创建索引
client.admin().indices().prepareCreate(“blog1”).get();
//关闭
client.close();
}

/**
 * 创建映射
 */
@Test
public void testCreateIndexMapping_boost() throws Exception{
	//构建json的数据格式，创建映射
	XContentBuilder mappingBuilder = XContentFactory.jsonBuilder()
			.startObject()
				.startObject("article")
					.startObject("properties")
						.startObject("id")
							.field("type","integer").field("store", "yes")
						.endObject()
						.startObject("title")
							.field("type","string").field("store", "yes").field("analyzer","ik")
						.endObject()
						.startObject("content")
							.field("type","string").field("store", "yes").field("analyzer","ik")
						.endObject()
						.startObject("comment")
							.field("type","string").field("store", "yes").field("analyzer","ik")
						.endObject()
					.endObject()
				.endObject()
			.endObject();
	PutMappingRequest request = Requests.putMappingRequest("blog1")
			.type("article")
			.source(mappingBuilder);
	client.admin().indices().putMapping(request).get();
	//关闭
	client.close();
}


/**创建文档*/
@Test
public void createDocument_boost() throws Exception{
	
	Article article = new Article();

// article.setId(1);
// article.setTitle(“搜索引擎服务器”); // 有搜索
// article.setContent(“基于restful的数据风格”); // 无搜索
// article.setComment(“我们学习Elasticsearch搜索引擎服务器”);// 有搜索

	article.setId(2);
	article.setTitle("什么是Elasticsearch"); // 无搜索
	article.setContent("Elasticsearch搜索引擎服务器"); // 有搜索
	article.setComment("Elasticsearch封装了lucene");// 无搜索
	
	ObjectMapper objectMapper = new ObjectMapper();
	String source = objectMapper.writeValueAsString(article);
	System.out.println("source:"+source);
	
	IndexResponse indexResponse = client.prepareIndex("blog1", "article", article.getId().toString()).setSource(source).get();
	// 获取响应的信息
	System.out.println("索引名称："+indexResponse.getIndex());
	System.out.println("文档类型："+indexResponse.getType());
	System.out.println("ID："+indexResponse.getId());
	System.out.println("版本："+indexResponse.getVersion());
	System.out.println("是否创建成功："+indexResponse.isCreated());
	client.close();
}

【测试】
@Test
public void testQueryString_boost() throws Exception{
SearchResponse searchResponse = client.prepareSearch(“blog1”).setTypes(“article”)
.setQuery(QueryBuilders.queryStringQuery(“搜索”).field(“content^{10").field("title}5”).field(“comment”))
.get();
SearchHits hits = searchResponse.getHits();//获取数据的结果集对象，获取命中次数
// 显示数据
this.searchValue(hits);
//关闭
client.close();
}

@Test
public void testBoolQuery_boost() throws Exception{
	SearchResponse searchResponse = client.prepareSearch("blog1").setTypes("article")
			.setQuery(QueryBuilders.boolQuery().should(QueryBuilders.termQuery("title", "搜索").boost(5f))
					.should(QueryBuilders.termQuery("content", "搜索").boost(10f)))
			.get();
	SearchHits hits = searchResponse.getHits();//获取数据的结果集对象，获取命中次数
	// 显示数据
	this.searchValue(hits);
	//关闭
	client.close();
}

【显示结果】
// 显示查询的结果数据
private void searchValue(SearchHits hits) {
System.out.println(“查询的结果数量有”+hits.getTotalHits()+“条”);
System.out.println(“结果中最高分：”+hits.getMaxScore());
// 遍历每条数据
Iterator iterator = hits.iterator();
while(iterator.hasNext()){
SearchHit searchHit = iterator.next();
System.out.println(“所有的数据JSON的数据格式：”+searchHit.getSourceAsString());
System.out.println(“每条得分：”+searchHit.getScore());
// 获取每个字段的数据
System.out.println(“id:”+searchHit.getSource().get(“id”));
System.out.println(“title:”+searchHit.getSource().get(“title”));
System.out.println(“content:”+searchHit.getSource().get(“content”));
System.out.println("**********************************************");
for(Iterator ite = searchHit.iterator();ite.hasNext()?{
SearchHitField next = ite.next();
System.out.println(next.getValues());
}
}
}
11.2．在Field字段的映射中定义加权

可以在映射中添加：

等同于：

12．过滤器
我们已经介绍了如何使用不同的条件和查询来构建查询并搜索数据。我们还熟知了评分，它告诉我们在给定的查询中，哪些文档更重要以及查询文本如何影响排序。然而，有时我们可能要在不影响最后分数的情况下，选择索引中的某个子集，这就要使用过滤器。
如果可以，应该尽可能使用过滤器。过滤器不影响评分，而得分计算让搜索变得复杂，而且需要CPU资源。另一方面，过滤是一种相对简单的操作。由于过滤应用在整个索引的内容上，过滤的结果独立于找到的文档，也独立于文档之间的关系。过滤器很容易被缓存，从而进一步提高过滤查询的整体性能。

12.1．范围过滤器
/*范围过滤器/
@Test
public void testRangeQuery() throws Exception{
SearchResponse searchResponse = client.prepareSearch(“blog”).setTypes(“article”)
.setPostFilter(QueryBuilders.rangeQuery(“id”).from(1).to(2))
.get();
SearchHits hits = searchResponse.getHits();//获取数据的结果集对象，获取命中次数
// 显示数据
this.searchValue(hits);
//关闭
client.close();
}
12.2．布尔过滤器

/**bool过滤器*/
@Test
public void testFilter() throws Exception{
	SearchResponse searchResponse = client.prepareSearch("blog").setTypes("article")
			.setPostFilter(QueryBuilders.boolQuery().must(QueryBuilders.termQuery("title", "搜索"))
					.must(QueryBuilders.termQuery("content", "搜索")))
			.get();
	SearchHits hits = searchResponse.getHits();//获取数据的结果集对象，获取命中次数
	// 显示数据
	this.searchValue(hits);
	//关闭
	client.close();
}

添加缓存：
过滤器的缓存
关于过滤器最后要提到的是缓存。缓存加速了使用过滤器的查询，代价是第一次执行过滤器时的内存成本和查询时间。因此，缓存的最佳选择是那些可以重复使用的过滤器，例如，经常会使用并包括参数值的那些。

在范围过滤器中添加缓存
/*范围过滤器/
@Test
public void testRangeQuery() throws Exception{
SearchResponse searchResponse = client.prepareSearch(“blog”).setTypes(“article”)
.setPostFilter(QueryBuilders.rangeQuery(“id”).from(1).to(2))
.setRequestCache(true)//放置到缓存
.get();

	SearchHits hits = searchResponse.getHits();//获取数据的结果集对象，获取命中次数
	// 显示数据
	this.searchValue(hits);
	//关闭
	client.close();
}

你可能感兴趣的:(ElasticSearch)

Elasticsearch搜索引擎存储：从原理到实践的全景解析 Python×CATIA工业智造搜索引擎 elasticsearch 大数据
引言在大数据时代，数据规模呈指数级增长，传统数据库的模糊查询、实时分析能力逐渐成为瓶颈。Elasticsearch（简称ES）凭借其分布式架构、实时搜索和灵活的数据分析能力，成为企业级搜索与存储的核心引擎。截至2025年，ES在全球日志分析、电商搜索、实时监控等场景的市场占有率超过60%。本文将从存储架构、核心技术、应用场景及优化策略四个维度，深入解析Elasticsearch的设计哲学与实践价值
Elasticsearch混合搜索深度解析（下）：执行机制与完整流程 GeminiJM ES学习笔记 elasticsearch jenkins 大数据
引言在上篇中，我们发现了KNN结果通过SubSearch机制被保留的关键事实。本篇将继续深入分析混合搜索的执行机制，揭示完整的处理流程，并解答之前的所有疑惑。深入源码分析1.SubSearch的执行机制1.1KnnScoreDocQueryBuilder的实现KNN结果被转换为KnnScoreDocQueryBuilder，这个类负责在查询阶段重新执行KNN搜索：//server/src/main
SkyWalking + Logstash全链路追踪系统详细实施方案 @淡定 skywalking
SkyWalking+Logstash全链路追踪系统详细实施方案一、系统架构与数据流向核心流程：数据采集：SkyWalkingAgent埋点收集调用链路数据日志增强：应用程序通过MDC注入TraceID日志收集：Logstash采集应用日志并发送至Elasticsearch数据存储：SkyWalking指标数据与日志数据分别存储可视化分析：SkyWalkingUI展示链路追踪，Kibana分析日志
自建ELK vs 云商日志服务：成本对比分析亲爱的非洲野猪 elk
在当今数据驱动的时代，日志管理已成为企业IT基础设施中不可或缺的一部分。面对日益增长的日志数据，许多团队都在纠结：是自建ELK（Elasticsearch、Logstash、Kibana）堆栈，还是直接使用云服务商提供的日志服务？本文将从成本角度对这两种方案进行详细对比分析。自建ELK方案成本分析1.硬件/基础设施成本服务器成本：至少需要3个节点（生产环境推荐）实现高可用中等规模部署：3台16核6
【spring boot】三种日志系统对比：ELK、Loki+Grafana、Docker API ladymorgana 日常工作总结 spring boot elk grafana
文章目录**方案1：使用ELK（Elasticsearch+Logstash+Kibana）****适用场景****搭建步骤****1.修改SpringBoot日志输出****2.创建DockerCompose文件****3.配置Logstash****4.启动服务****方案2：使用Loki+Grafana****适用场景****搭建步骤****1.修改SpringBoot日志驱动****2.配
Semantic text 就是那么强大，还附带一包（ BBQ ）薯片！配有可配置的分块设置和索引选项。 Elastic 中国社区官方博客 Elasticsearch AI 大数据 elasticsearch 搜索引擎全文检索人工智能 ai 图搜索
作者：来自ElasticKathleenDeRusso语义文本搜索现在可以自定义，支持可配置的分块设置和索引选项，用于自定义向量量化，使semantic_text在专业用例中更强大。Elasticsearch拥有大量新功能，帮助你为你的用例构建最佳搜索解决方案。深入查看我们的示例笔记本以了解更多信息，开始免费云试用，或者立即在本地机器上体验Elastic。随着Elasticsearch8.18和9
Elasticsearch 高可用实战：架构设计与场景化解决方案辣呼呼的哈哈 Elasticsearch 入门到精通 elasticsearch wpf 大数据全文检索搜索引擎 restful java
Elasticsearch高可用实战：架构设计与场景化解决方案本文深入探讨Elasticsearch在高并发、大数据量场景下的高可用架构设计，结合电商搜索、日志分析等真实案例，提供可落地的技术方案与Java实现。一、高可用架构设计原则1.分布式架构核心要素客户端负载均衡层协调节点数据节点-分片1数据节点-分片2数据节点-分片3副本分片副本分片副本分片2.高可用黄金法则冗余设计：至少3节点集群+1副
Elasticsearch RESTful API入门：基础搜索与查询DSL 辣呼呼的哈哈 Elasticsearch 入门到精通 elasticsearch restful 大数据搜索引擎全文检索 spring boot
ElasticsearchRESTfulAPI入门：基础搜索与查询DSL本文为Elasticsearch初学者详细解析RESTfulAPI的核心操作与查询DSL语法，包含大量实战示例及最佳实践。一、Elasticsearch与RESTfulAPI简介Elasticsearch（ES）作为分布式搜索分析引擎，其RESTfulAPI是与集群交互的核心方式。通过HTTP协议实现：✅索引文档的CRUD操作
Elasticsearch入门（二）：document数据格式、简单的es restful api m0_50134014 Elasticsearch elasticsearch java
目录一、document数据格式1.1面向文档的搜索分析引擎1.1.1对象数据存储到数据库中1.1.2对象数据存储到ES中二、电商网站商品管理案例背景介绍2.1简单的集群管理2.1.1快速检查集群的健康状况:`GET/_cat/health?v`2.1.2快速查看集群中有哪些索引:`GET/_cat/indices?v`2.1.3创建索引：`PUT/test_index?pretty`2.1.4删
Elasticsearch RESTful API入门：全文搜索实战（Java版）辣呼呼的哈哈 Elasticsearch 入门到精通 elasticsearch restful java 大数据搜索引擎全文检索
ElasticsearchRESTfulAPI入门：全文搜索实战（Java版）本文结合Java客户端API，深入讲解Elasticsearch全文搜索的实现。包含10+个实战示例及对应的Java代码，涵盖match、multi_match、高亮显示等核心功能。一、环境准备1.添加Maven依赖org.elasticsearch.clientelasticsearch-rest-high-level
【Elasticsearch】function_score risc123456 Elasticsearch elasticsearch
如果你希望在Elasticsearch查询中降低某些特定`id`的文档评分，可以通过`function_score`查询结合`script_score`函数来实现。`script_score`允许你使用自定义脚本对文档的评分进行调整。以下是一个示例，展示如何降低某些特定`id`的文档评分：示例场景假设我们有一个索引`my_index`，其中包含一些文档，每个文档都有一个`id`字段。我们希望降低某
Elasticsearch RESTful API入门：索引的增删改查完全指南辣呼呼的哈哈 Elasticsearch 入门到精通 elasticsearch restful 大数据 java 架构搜索引擎全文检索
ElasticsearchRESTfulAPI入门：索引的增删改查完全指南本文专为Java开发初学者设计，将手把手教你掌握Elasticsearch索引的核心操作一、环境准备与基本概念1.1安装Elasticsearch（Windows版） 1.访问官网下载ZIP包 2.解压后进入bin目录，双击elasticsearch.bat启动 3.验证安装：浏览器访问http://localhost
Docker快速单点部署Elasticsearch ❀͜͡傀儡师 docker elasticsearch
x86架构dockerpullregistry.cn-hangzhou.aliyuncs.com/qiluo-images/elasticsearch:8.17.4arm架构dockerpullregistry.cn-hangzhou.aliyuncs.com/qiluo-images/linux_arm64_elasticsearch:8.17.43、elasticsearch安装mkdir-p
ES 压缩包安装思静鱼 #elasticsearch elasticsearch 大数据
以下是Elasticsearch(ES)通过.tar.gz压缩包安装的详细步骤（适用于Linux/macOS系统）：1.准备工作1.1检查系统依赖Java环境：ES需要JDK，推荐OpenJDK11/17（ES7.x/8.x兼容版本）。java-version#检查是否已安装如果未安装，使用以下命令安装（以Ubuntu为例）：sudoaptupdatesudoaptinstallopenjdk-1
云原生时代的日志管理：ELK、Loki、Fluentd 如何选型？
一、引言在微服务和Kubernetes普及的今天，传统的日志管理方式已经难以应对高并发、分布式架构带来的挑战。随着容器化应用数量激增，日志数据量呈指数级增长，如何高效地收集、存储、查询和分析日志，成为每个团队必须面对的问题。在这样的背景下，ELK（Elasticsearch+Logstash+Kibana）、Loki和Fluentd成为当前主流的日志解决方案。它们各有特色，适用于不同规模和技术栈的
自动化运维工程师实操面试题
以下是针对Ansible、Zabbix、ElasticsearchLogstashKibana（ELK）设计的2道综合实操题，难度适中且结合实际应用场景：实操题1：Ansible自动化部署Zabbix监控平台并集成ELK日志分析题目背景某企业需要通过Ansible自动化部署Zabbix监控服务器（含Agent）、Elasticsearch、Logstash、Kibana（ELK）日志分析系统，并实
怎么安装自定义分词器思静鱼 #elasticsearch es
安装自定义分词器的完整步骤在Elasticsearch中安装自定义分词器，通常需要修改索引配置或开发插件。以下是详细方法：一、基于配置实现自定义分词器（无需插件）适用于通过组合Elasticsearch内置的CharacterFilters、Tokenizers和TokenFilters实现的分词器。1.定义分词规则在创建索引时，通过settings.analysis配置自定义分词器：PUT/my
【容器】优质文章分享
文章目录加速器Docker教程安装坑volumn网络配置踩坑其他dockerfiledocker-compose手册教程网络坑docker使用dockermysqldockermongoredisdocker-rabbitmqnginxtomcatnacoszookeeperelasticsearch加速器现在docker镜像站真的不好找了。阿里什么的加速目前只能给阿里自己的容器用了。且用且珍惜D
【Elasticsearch】自定义评分检索 G皮T #Elastic elasticsearch 大数据自定义评分查询检索 _score 搜索引擎
自定义评分检索1.自定义评分2.为什么需要自定义评分3.搜索结果相关度4.影响相关度评分的查询子句5.控制相关度评分的方法5.1FunctionScoreQuery5.1.1基础查询部分5.1.2评分函数部分（functions数组）第一个函数：品牌加权第二个函数：销量因子第三个函数：时间衰减5.1.3评分组合方式score_modeboost_mode5.1.4整体效果5.2使用Boosting
Elasticsearch：什么是搜索相关性？ Elastic 中国社区官方博客 Elasticsearch Elastic elasticsearch 大数据搜索引擎人工智能全文检索
搜索相关性定义搜索相关性衡量的是搜索引擎返回的搜索结果与用户查询和意图之间的匹配程度。搜索结果的质量取决于显示的信息与用户预期之间的契合度。提升搜索相关性和性能需要进行语言分析、排序算法优化以及考虑上下文因素。这些因素可能包括用户行为分析、位置信息、热门程度和搜索历史等。搜索相关性是客户体验中的关键因素，通过合理平衡，搜索体验可以同时满足企业和用户的需求。了解为什么相关性对搜索引擎至关重要，以及如
Elasticsearch MacJerry elasticsearch 大数据搜索引擎
学习目标[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-BGW4RqWM-1635414988340)(es.assets/Snipaste_2020-07-06_13-03-45.png)]Elasticsearch简介与安装什么是Elasticsearch？ElasticSearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎，基
C#.NET NLog 详解 c#.net
简介NLog是.NET平台上最流行的开源日志框架之一，特色是灵活的配置、丰富的输出目标（Target），以及高性能的异步写入能力。适用场景：从控制台、文件、数据库、网络到ElasticSearch、Seq、AzureTableStorage等各种日志收集后端。支持文件、数据库（SQL/NoSQL）、控制台、邮件、Elasticsearch等50+内置目标，并可通过插件扩展原生兼容JSON格式，可输
Elasticsearch 启动失败？从日志分析到最终解决（磁盘空间不足案例） Leaton Lee elasticsearch 大数据搜索引擎
问题背景最近在本地运行一个SpringBoot项目时，突然遇到Elasticsearch(ES)连接超时的问题：org.springframework.beans.factory.UnsatisfiedDependencyException:Errorcreatingbeanwithname'awardController':Unsatisfieddependencyexpressedthroug
Elasticsearch：基本概念、索引结构与优缺点分析 Leaton Lee elasticsearch 大数据搜索引擎
一、Elasticsearch基本概念Elasticsearch是一个基于Lucene构建的开源、分布式、RESTful搜索引擎，专为云计算环境设计，能够实现近乎实时的数据搜索和分析功能。核心概念解析文档(Document)Elasticsearch中的基本数据单元，使用JSON格式表示每个文档有唯一ID和类型示例：一条产品信息、一篇博客文章或一个客户记录索引(Index)文档的集合，类似于关系数
Elasticsearch 查询统计 A 字段全部为空的 B 字段（qbit）
前言本文对Elasticsearch7.17适用问题是有两个字符串字段app_id和owner，怎么查询app_id全部为空字符串的owner有哪些？查询DSL语句{"size":0,"aggs":{"owners":{"terms":{"field":"owner",//取决于owner字段的基数"size":10000},"aggs":{"non_empty_app_id_docs":{"fi
【123揭秘】Elasticsearch内部数据结构大起底：行存、列存与倒排索引，你选对了吗？墨瑾轩 Java乐园 elasticsearch 数据结构 jenkins
关注墨瑾轩，带你探索编程的奥秘！超萌技术攻略，轻松晋级编程高手技术宝库已备好，就等你来挖掘订阅墨瑾轩，智趣学习不孤单即刻启航，编程之旅更有趣第一部分：理解基本概念——构建知识的基础首先，我们需要了解一些基础概念，这对于理解Elasticsearch如何处理和存储数据至关重要。1.1行存储vs列存储行存储：适用于频繁写入和读取整行数据的场景。例如，在关系型数据库中，每一行代表一条记录，所有列的数据都
ElasticSearch中的分片是什么? java1234_小锋 java elasticsearch 大数据搜索引擎
大家好，我是锋哥。今天分享关于【ElasticSearch中的分片是什么?】面试题。希望对大家有帮助；ElasticSearch中的分片是什么?超硬核AI学习资料，现在永久免费了！在Elasticsearch中，分片（Shard）是将数据拆分成更小的部分，允许在分布式环境中并行处理和存储数据的机制。它是Elasticsearch在水平扩展时用于管理大量数据的关键概念。主要概念：主分片（Primar
spring-ai-alibaba 1.0.0.2 学习（十二）——聊天记忆扩展包
学习spring-ai时提到过，spring-ai除了内置的InMemoryChatMemoryRepository，还提供jdbc、cassandra、neo4j三个扩展包。而spring-ai-alibaba则提供了jdbc、redis、elasticsearch三个扩展包。两者都提供了jdbc扩展包，有什么区别呢？spring-aijdbc和spring-ai-alibabajdbc对比sp
基于Elasticsearch的短视频平台个性化推荐系统设计与实现亲爱的非洲野猪 elasticsearch 音视频推荐算法
在当今内容爆炸的时代，个性化推荐系统已成为短视频平台的核心竞争力之一。本文将详细介绍如何利用Elasticsearch（ES）构建一个高效、可扩展的短视频个性化推荐系统。一、系统架构概述我们的推荐系统将采用混合推荐策略，结合协同过滤、内容相似度和热度推荐等多种方法。Elasticsearch作为核心搜索引擎和数据存储，将承担以下职责：用户画像存储与查询视频内容索引与检索实时行为日志分析推荐结果计算
Docker三分钟部署ElasticSearch平替MeiliSearch轻量级搜索引擎
‍个人主页：阿木木AEcru(更多精彩内容可进入主页观看)系列专栏：《Docker容器化部署系列》《Java每日面筋》每一次技术突破，都是对自我能力的挑战和超越。目录一、什么是MeiliSearch？二、对比ElasticSearch有什么好处？三、使用场景有哪些？四、docker部署MeiliSearch4.1创建数据持久化文件夹4.2拉取镜像4.3运行容器五、访问测试5.1访问5.2下载测试文
数据采集高并发的架构应用 3golden .net
问题的出发点：最近公司为了发展需要，要扩大对用户的信息采集，每个用户的采集量估计约2W。如果用户量增加的话，将会大量照成采集量成3W倍的增长，但是又要满足日常业务需要，特别是指令要及时得到响应的频率次数远大于预期。 &n
不停止 MySQL 服务增加从库的两种方式 brotherlamp linux linux视频 linux资料 linux教程 linux自学
现在生产环境MySQL数据库是一主一从，由于业务量访问不断增大，故再增加一台从库。前提是不能影响线上业务使用，也就是说不能重启MySQL服务，为了避免出现其他情况，选择在网站访问量低峰期时间段操作。一般在线增加从库有两种方式，一种是通过mysqldump备份主库，恢复到从库，mysqldump是逻辑备份，数据量大时，备份速度会很慢，锁表的时间也会很长。另一种是通过xtrabacku
Quartz——SimpleTrigger触发器 eksliang SimpleTrigger TriggerUtils quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208166 一.概述 SimpleTrigger触发器，当且仅需触发一次或者以固定时间间隔周期触发执行；二.SimpleTrigger的构造函数 SimpleTrigger(String name, String group)：通过该构造函数指定Trigger所属组和名称； Simpl
Informatica应用（1） 18289753290 sql workflow lookup 组件 Informatica
1.如果要在workflow中调用shell脚本有一个command组件，在里面设置shell的路径；调度wf可以右键出现schedule，现在用的是HP的tidal调度wf的执行。 2.designer里面的router类似于SSIS中的broadcast（多播组件）;Reset_Workflow_Var：参数重置（比如说我这个参数初始是1在workflow跑得过程中变成了3我要在结束时还要
python 获取图片验证码中文字酷的飞上天空 python
根据现成的开源项目 http://code.google.com/p/pytesser/改写在window上用easy_install安装不上看了下源码发现代码很少于是就想自己改写一下添加支持网络图片的直接解析 #coding:utf-8 #import sys #reload(sys) #sys.s
AJAX 永夜-极光 Ajax
1.AJAX功能:动态更新页面,减少流量消耗,减轻服务器负担 2.代码结构: <html> <head> <script type="text/javascript"> function loadXMLDoc() { .... AJAX script goes here ...
创业OR读研随便小屋创业
现在研一，有种想创业的想法，不知道该不该去实施。因为对于的我情况这两者是矛盾的，可能就是鱼与熊掌不能兼得。研一的生活刚刚过去两个月，我们学校主要的是
需求做得好与坏直接关系着程序员生活质量 aijuans IT 生活
这个故事还得从去年换工作的事情说起，由于自己不太喜欢第一家公司的环境我选择了换一份工作。去年九月份我入职现在的这家公司，专门从事金融业内软件的开发。十一月份我们整个项目组前往北京做现场开发，从此苦逼的日子开始了。系统背景：五月份就有同事前往甲方了解需求一直到6月份，后续几个月也完
如何定义和区分高级软件开发工程师 aoyouzi
在软件开发领域，高级开发工程师通常是指那些编写代码超过 3 年的人。这些人可能会被放到领导的位置，但经常会产生非常糟糕的结果。Matt Briggs 是一名高级开发工程师兼 Scrum 管理员。他认为，单纯使用年限来划分开发人员存在问题，两个同样具有 10 年开发经验的开发人员可能大不相同。近日，他发表了一篇博文，根据开发者所能发挥的作用划分软件开发工程师的成长阶段。　　初
Servlet的请求与响应百合不是茶 servlet get提交 java处理post提交
Servlet是tomcat中的一个重要组成,也是负责客户端和服务端的中介 1,Http的请求方式(get ,post); 客户端的请求一般都会都是Servlet来接受的,在接收之前怎么来确定是那种方式提交的,以及如何反馈,Servlet中有相应的方法, http的get方式 servlet就是都doGet(
web.xml配置详解之listener bijian1013 java web.xml listener
一.定义 <listener> <listen-class>com.myapp.MyListener</listen-class> </listener> 二.作用该元素用来注册一个监听器类。可以收到事件什么时候发生以及用什么作为响
Web页面性能优化（yahoo技术） Bill_chen JavaScript Ajax Web css Yahoo
1.尽可能的减少HTTP请求数 content 2.使用CDN server 3.添加Expires头(或者 Cache-control) server 4.Gzip 组件 server 5.把CSS样式放在页面的上方。 css 6.将脚本放在底部(包括内联的) javascript 7.避免在CSS中使用Expressions css 8.将javascript和css独立成外部文
【MongoDB学习笔记八】MongoDB游标、分页查询、查询结果排序 bit1129 mongodb
游标游标，简单的说就是一个查询结果的指针。游标作为数据库的一个对象，使用它是包括声明打开循环抓去一定数目的文档直到结果集中的所有文档已经抓取完关闭游标游标的基本用法，类似于JDBC的ResultSet(hasNext判断是否抓去完,next移动游标到下一条文档)，在获取一个文档集时，可以提供一个类似JDBC的FetchSize
ORA-12514 TNS 监听程序当前无法识别连接描述符中请求服务的解决方法白糖_ ORA-12514
今天通过Oracle SQL*Plus连接远端服务器的时候提示“监听程序当前无法识别连接描述符中请求服务”，遂在网上找到了解决方案： ①打开Oracle服务器安装目录\NETWORK\ADMIN\listener.ora文件，你会看到如下信息： # listener.ora Network Configuration File: D:\database\Oracle\net
Eclipse 问题 A resource exists with a different case bozch eclipse
在使用Eclipse进行开发的时候，出现了如下的问题： Description Resource Path Location TypeThe project was not built due to "A resource exists with a different case: '/SeenTaoImp_zhV2/bin/seentao'.&
编程之美-小飞的电梯调度算法 bylijinnan 编程之美
public class AptElevator { /** * 编程之美小飞电梯调度算法 * 在繁忙的时间，每次电梯从一层往上走时，我们只允许电梯停在其中的某一层。 * 所有乘客都从一楼上电梯，到达某层楼后，电梯听下来，所有乘客再从这里爬楼梯到自己的目的层。 * 在一楼时，每个乘客选择自己的目的层，电梯则自动计算出应停的楼层。 * 问：电梯停在哪
SQL注入相关概念 chenbowen00 sql Web 安全
SQL Injection：就是通过把SQL命令插入到Web表单递交或输入域名或页面请求的查询字符串，最终达到欺骗服务器执行恶意的SQL命令。具体来说，它是利用现有应用程序，将（恶意）的SQL命令注入到后台数据库引擎执行的能力，它可以通过在Web表单中输入（恶意）SQL语句得到一个存在安全漏洞的网站上的数据库，而不是按照设计者意图去执行SQL语句。首先让我们了解什么时候可能发生SQ
[光与电]光子信号战防御原理 comsci 原理
无论是在战场上,还是在后方,敌人都有可能用光子信号对人体进行控制和攻击,那么采取什么样的防御方法,最简单,最有效呢? 我们这里有几个山寨的办法,可能有些作用,大家如果有兴趣可以去实验一下根据光
oracle 11g新特性:Pending Statistics daizj oracle dbms_stats
oracle 11g新特性:Pending Statistics 转从11g开始，表与索引的统计信息收集完毕后，可以选择收集的统信息立即发布，也可以选择使新收集的统计信息处于pending状态，待确定处于pending状态的统计信息是安全的，再使处于pending状态的统计信息发布，这样就会避免一些因为收集统计信息立即发布而导致SQL执行计划走错的灾难。在 11g 之前的版本中，D
快速理解RequireJs dengkane jquery requirejs
RequireJs已经流行很久了，我们在项目中也打算使用它。它提供了以下功能：声明不同js文件之间的依赖可以按需、并行、延时载入js库可以让我们的代码以模块化的方式组织初看起来并不复杂。在html中引入requirejs 在HTML中，添加这样的 <script> 标签： <script src="/path/to
C语言学习四流程控制if条件选择、for循环和强制类型转换 dcj3sjt126com c
# include <stdio.h> int main(void) { int i, j; scanf("%d %d", &i, &j); if (i > j) printf("i大于j\n"); else printf("i小于j\n"); retu
dictionary的使用要注意 dcj3sjt126com IO
NSDictionary *dict = [NSDictionary dictionaryWithObjectsAndKeys: user.user_id , @"id", user.username , @"username",
Android 中的资源访问(Resource) finally_m xml android String drawable color
简单的说，Android中的资源是指非代码部分。例如，在我们的Android程序中要使用一些图片来设置界面，要使用一些音频文件来设置铃声，要使用一些动画来显示特效，要使用一些字符串来显示提示信息。那么，这些图片、音频、动画和字符串等叫做Android中的资源文件。在Eclipse创建的工程中，我们可以看到res和assets两个文件夹，是用来保存资源文件的，在assets中保存的一般是原生
Spring使用Cache、整合Ehcache 234390216 spring cache ehcache @Cacheable
Spring使用Cache 从3.1开始，Spring引入了对Cache的支持。其使用方法和原理都类似于Spring对事务管理的支持。Spring Cache是作用在方法上的，其核心思想是这样的：当我们在调用一个缓存方法时会把该方法参数和返回结果作为一个键值对存放在缓存中，等到下次利用同样的
当druid遇上oracle blob(clob) jackyrong oracle
http://blog.csdn.net/renfufei/article/details/44887371 众所周知，Oracle有很多坑, 所以才有了去IOE。在使用Druid做数据库连接池后，其实偶尔也会碰到小坑，这就是使用开源项目所必须去填平的。【如果使用不开源的产品，那就不是坑，而是陷阱了，你都不知道怎么去填坑】用Druid连接池，通过JDBC往Oracle数据库的
easyui datagrid pagination获得分页页码、总页数等信息 ldzyz007
var grid = $('#datagrid'); var options = grid.datagrid('getPager').data("pagination").options; var curr = options.pageNumber; var total = options.total; var max =
浅析awk里的数组 nigelzeng 二维数组 array 数组 awk
awk绝对是文本处理中的神器，它本身也是一门编程语言，还有许多功能本人没有使用到。这篇文章就单单针对awk里的数组来进行讨论，如何利用数组来帮助完成文本分析。有这么一组数据： abcd,91#31#2012-12-31 11:24:00 case_a,136#19#2012-12-31 11:24:00 case_a,136#23#2012-12-31 1
搭建 CentOS 6 服务器(6) - TigerVNC rensanning centos
安装GNOME桌面环境 # yum groupinstall "X Window System" "Desktop" 安装TigerVNC # yum -y install tigervnc-server tigervnc 启动VNC服务 # /etc/init.d/vncserver restart # vncser
Spring 数据库连接整理 tomcat_oracle spring bean jdbc
1、数据库连接jdbc.properties配置详解　　jdbc.url=jdbc:hsqldb:hsql://localhost/xdb 　　jdbc.username=sa 　　jdbc.password= 　　jdbc.driver=不同的数据库厂商驱动，此处不一一列举　　接下来，详细配置代码如下：　　 Spring连接池
Dom4J解析使用xpath java.lang.NoClassDefFoundError: org/jaxen/JaxenException异常 xp9802
用Dom4J解析xml,以前没注意,今天使用dom4j包解析xml时在xpath使用处报错异常栈：java.lang.NoClassDefFoundError: org/jaxen/JaxenException异常导入包 jaxen-1.1-beta-6.jar 解决; &nb