Elasticsearch基础总结与Spring Boot整合

一、概述

Elasticsearch,基于lucene,隐藏复杂性,提供简单易用的restful api接口、java api接口(还有其他语言的api接口)。

Elasticsearch是一个实时分布式搜索和分析引擎。它用于全文搜索、结构化搜索、分析。
全文检索:将非结构化数据中的一部分信息提取出来,重新组织,使其变得有一定结构,然后对此有一定结构的数据进行搜索,从而达到搜索相对较快的目的。

结构化检索:我想搜索商品分类为电子商品都有哪些,select * from products where category_id=‘电子’

数据分析:电商网站,最近一周电子类商品销量排名前10的商家有哪些;新闻网站,最近1个月访问量排名前3的新闻版块是哪些等等。
使用场景:
1)维基百科,类似百度百科,全文检索,高亮,搜索推荐。
2)The Guardian(国外新闻网站),类似搜狐新闻,用户行为日志(点击,浏览,收藏,评论)+ 社交网络数据(对某某新闻的相关看法),数据分析。
3)Stack Overflow(国外的程序异常讨论论坛),IT问题,程序的报错,提交上去,有人会跟你讨论和回答
4)GitHub(开源代码管理),搜索上千亿行代码。
5)国内:站内搜索(电商,招聘,门户,等等),IT系统搜索(OA,CRM,ERP,等等),数据分析(ES热门的一个使用场景)

核心概念:
Index(索引-数据库)
Type(类型-表)
Document(文档-行)
Field(字段-列)
mapping(映射-约束)

ES是如何存取数据的,又是如何检索数据的呢?
1)存放数据时:
类型分为索引区和数据区。
a、索引对象(blog):存储数据的表结构 ,任何搜索数据,存放在索引对象上 。
b、映射(mapping):数据如何存放到索引对象上,需要有一个映射配置, 包括:数据类型、是否存储、是否分词等。
c、文档(document):一条数据记录,存在索引对象上
d、文档类型(type):一个索引对象,存放多种类型数据,数据用文档类型进行标识
2)搜索
由于不是由记录来确定属性值,而是由属性值来确定记录的位置,因而称为倒排索引(inverted index),ES就是利用倒排索引,先搜索索引区域,查找到对应的docID,通过docID去数据区域查找数据。

二、安装配置

1、下载:

https://www.elastic.co/cn/products/elasticsearch
官网:快速入门,开箱即用,底层需要进行大量操作,例如分片、副本、集群发现,但是您无需考虑这些操作即可开始使用。由于 Elasticsearch 定义了合理的默认值,并且无需前期的模式定义,因此能够让您在开始时一切从简,并随着您的发展进一步微调。

推荐下载图形化插件:

elasticsearch-head-master.zip

2、Elasticsearch提供了各个操纵系统下的安装版本,并且提供了Docker安装的方式。

2.1 Docker
拉取镜像:

docker pull docker.elastic.co/elasticsearch/elasticsearch:6.6.1

启动:

docker run -p 9200:9200 -p 9300:9300 -e "discovery.type=single-node" docker.elastic.co/elasticsearch/elasticsearch:6.6.1

例如我的启动:

docker run -e ES_JAVA_OPTS="-Xms256m -Xmx256m" -d -p 9200:9200 -p 9300:9300 --name ES01 5acf0e8da90b

2.2 安装Elasticsearch(单节点Linux环境)
最好安装图形界面化插件:elasticsearch-head-master.zip,因为这是node.js编写的,所以需要Nodejs的环境(node-v6.9.2-linux-x64.tar.gz)

1)解压elasticsearch-5.2.2.tar.gz到/opt/module目录下

[xxx@hadoop102 software]$ tar -zxvf elasticsearch-5.2.2.tar.gz -C /opt/module/

2)在/opt/module/elasticsearch-5.2.2路径下创建data和logs文件夹

[xxx@hadoop102 elasticsearch-5.2.2]$ mkdir data
[xxx@hadoop102 elasticsearch-5.2.2]$ mkdir logs

3)修改配置文件/opt/module/elasticsearch-5.2.2/config/elasticsearch.yml

[xxx@hadoop102 config]$ pwd
/opt/module/elasticsearch-5.2.2/config
[xxx@hadoop102 config]$ vi elasticsearch.yml
# ---------------------------------- Cluster -----------------------------------
# 只要和其他服务器上的名字相同,就默认为集群,java操作时也会用此名字
cluster.name: my-application
# ------------------------------------ Node ------------------------------------
node.name: node-102
# ----------------------------------- Paths ------------------------------------
path.data: /opt/module/elasticsearch-5.2.2/data
path.logs: /opt/module/elasticsearch-5.2.2/logs
# ----------------------------------- Memory -----------------------------------
# 这两个必须要设置,否则启动报错
bootstrap.memory_lock: false
bootstrap.system_call_filter: false
# ---------------------------------- Network -----------------------------------
network.host: 192.168.1.102 
# --------------------------------- Discovery ----------------------------------
discovery.zen.ping.unicast.hosts: ["hadoop102"]

(1)cluster.name
如果要配置集群需要两个节点上的elasticsearch配置的cluster.name相同,都启动可以自动组成集群,这里如果不改cluster.name则默认是cluster.name=my-application,
(2)nodename随意取但是集群内的各节点不能相同
(3)修改后的每行前面不能有空格,修改后的“:”后面必须有一个空格

4)配置linux系统环境(参考:http://blog.csdn.net/satiling/article/details/59697916)
(1)切换到root用户,编辑limits.conf 添加类似如下内容
[root@hadoop102 elasticsearch-5.2.2]# vi /etc/security/limits.conf
添加如下内容:

  • soft nofile 65536
  • hard nofile 131072
  • soft nproc 2048
  • hard nproc 4096
    (2)切换到root用户,进入limits.d目录下修改配置文件。
    [root@hadoop102 elasticsearch-5.2.2]# vi /etc/security/limits.d/90-nproc.conf
    修改如下内容:
  • soft nproc 1024
    #修改为
  • soft nproc 2048
    (3)切换到root用户修改配置sysctl.conf
    [root@hadoop102 elasticsearch-5.2.2]# vi /etc/sysctl.conf
    添加下面配置:
    vm.max_map_count=655360
    并执行命令:
    [root@hadoop102 elasticsearch-5.2.2]# sysctl -p
    然后,重新启动elasticsearch,即可启动成功。

2.3 Elasticsearch head插件安装(许多坑,需要注意的点很多)

1)下载插件
https://github.com/mobz/elasticsearch-head
elasticsearch-head-master.zip

2)nodejs官网下载安装包
https://nodejs.org/dist/
node-v6.9.2-linux-x64.tar.xz

3)将elasticsearch-head-master.zip和node-v6.9.2-linux-x64.tar.xz都导入到linux的/opt/software目录。

4)安装nodejs
[xxx@hadoop102 software]$ tar -zxvf node-v6.9.2-linux-x64.tar.gz -C /opt/module/
5)配置nodejs环境变量
[root@hadoop102 software]# vi /etc/profile
export NODE_HOME=/opt/module/node-v6.9.2-linux-x64
export PATH= P A T H : PATH: PATH:NODE_HOME/bin
[root@hadoop102 software]# source /etc/profile
6)查看node和npm版本
[root@hadoop102 software]# node -v
v6.9.2
[root@hadoop102 software]# npm -v
3.10.9
7)解压head插件到/opt/module目录下
[xxx@hadoop102 software]$ unzip elasticsearch-head-master.zip -d /opt/module/
8)查看当前head插件目录下有无node_modules/grunt目录:
没有:执行命令创建:
[xxx@hadoop102 elasticsearch-head-master]$ npm install grunt --save
9)安装head插件:
[xxx@hadoop102 elasticsearch-head-master]$ npm install -g cnpm --registry=https://registry.npm.taobao.org
10)安装grunt:
[xxx@hadoop102 elasticsearch-head-master]$ npm install -g grunt-cli
11)编辑Gruntfile.js
[xxx@hadoop102 elasticsearch-head-master]$ vim Gruntfile.js
文件93行添加hostname:‘0.0.0.0’
options: {
hostname:‘0.0.0.0’,
port: 9100,
base: ‘.’,
keepalive: true
}
12)检查head根目录下是否存在base文件夹
没有:将 _site下的base文件夹及其内容复制到head根目录下
[xxx@hadoop102 elasticsearch-head-master]$ mkdir base
[xxx@hadoop102 _site]$ cp base/* …/base/
13)启动grunt server:
[xxx@hadoop102 elasticsearch-head-master]$ grunt server -d
Running “connect:server” (connect) task
[D] Task source: /opt/module/elasticsearch-head-master/node_modules/grunt-contrib-connect/tasks/connect.js
Waiting forever…
Started connect web server on http://localhost:9100

如果提示grunt的模块没有安装:
Local Npm module “grunt-contrib-clean” not found. Is it installed?
Local Npm module “grunt-contrib-concat” not found. Is it installed?
Local Npm module “grunt-contrib-watch” not found. Is it installed?
Local Npm module “grunt-contrib-connect” not found. Is it installed?
Local Npm module “grunt-contrib-copy” not found. Is it installed?
Local Npm module “grunt-contrib-jasmine” not found. Is it installed?
Warning: Task “connect:server” not found. Use –force to continue.
执行以下命令:
npm install grunt-contrib-clean -registry=https://registry.npm.taobao.org
npm install grunt-contrib-concat -registry=https://registry.npm.taobao.org
npm install grunt-contrib-watch -registry=https://registry.npm.taobao.org
npm install grunt-contrib-connect -registry=https://registry.npm.taobao.org
npm install grunt-contrib-copy -registry=https://registry.npm.taobao.org
npm install grunt-contrib-jasmine -registry=https://registry.npm.taobao.org
最后一个模块可能安装不成功,但是不影响使用。
14)浏览器访问head插件:
http://ES-01:9100

15)启动集群插件后发现集群未连接
在/opt/module/elasticsearch-5.2.2/config路径下修改配置文件elasticsearch.yml,在文件末尾增加
[XXX@hadoop102 config]$ pwd
/opt/module/elasticsearch-5.2.2/config
[XXX@hadoop102 config]$ vi elasticsearch.yml

http.cors.enabled: true
http.cors.allow-origin: “*”
再重新启动elasticsearch。

16)关闭插件服务
ctrl+c
[XXX@hadoop102 elasticsearch-head-master]$ netstat -lntp | grep 9100
tcp 0 0 192.168.1.102:9100 0.0.0.0:* LISTEN 6070/grunt

三、Java API调用

Elasticsearch的Java客户端非常强大;它可以建立一个嵌入式实例并在必要时运行管理任务。
运行一个Java应用程序和Elasticsearch时,有两种操作模式可供使用。该应用程序可在Elasticsearch集群中扮演更加主动或更加被动的角色。在更加主动的情况下(称为Node Client),应用程序实例将从集群接收请求,确定哪个节点应处理该请求,就像正常节点所做的一样。(应用程序甚至可以托管索引和处理请求。)另一种模式称为Transport Client,它将所有请求都转发到另一个Elasticsearch节点,由后者来确定最终目标。

3.1 API基本操作(Eclipse)

新建Maven工程:


		
			junit
			junit
			3.8.1
			test
		
		
			org.elasticsearch
			elasticsearch
			5.2.2
		

		
			org.elasticsearch.client
			transport
			5.2.2
		

		
			org.apache.logging.log4j
			log4j-core
			2.9.0
		
	

一定要注意导入的版本与实际连接的ElasticSearch是否匹配,否则会报错!

3.2 获取Transport Client

ElasticSearch服务默认端口9300。Web管理平台端口9200

获取连接客户端:

private TransportClient client;
	@Before
	public void getClient() throws Exception {

		// 1 设置连接的集群名称
		Settings settings = Settings.builder().put("cluster.name", "my-application").build();

		// 2 连接集群
		client = new PreBuiltTransportClient(settings);
		client.addTransportAddress(new InetSocketTransportAddress(InetAddress.getByName("ES01"), 9300));

		// 3 打印集群名称
		System.out.println(client.toString());
	}

3.3 操作索引

创建索引:

	@Test
	public void createIndex_blog(){
		// 1 创建索引
		client.admin().indices().prepareCreate("news").get();
		
		// 2 关闭连接
		client.close();
	}

删除索引:

	@Test
	public void deleteIndex(){
		// 1 删除索引
		client.admin().indices().prepareDelete("blog2").get();
		
		// 2 关闭连接
		client.close();
	}

3.4 新建文档:有三种常用的方式——Json String 、Map方式、ES构建器

注意:当直接在ElasticSearch建立文档对象时,如果索引不存在的,默认会自动创建,映射采用默认方式。

Json String方式:

	@Test
	public void createIndexByJson() throws UnknownHostException {

		// 1 文档数据准备
		String json = "{" + "\"id\":\"1\"," + "\"title\":\"你好!\","
				+ "\"content\":\"进入ES的世界了!\"" + "}";

		// 2 创建文档
		IndexResponse indexResponse = client.prepareIndex("blog", "article", "1").setSource(json).execute().actionGet();

		// 3 打印返回的结果
		System.out.println("index:" + indexResponse.getIndex());
		System.out.println("type:" + indexResponse.getType());
		System.out.println("id:" + indexResponse.getId());
		System.out.println("version:" + indexResponse.getVersion());
		System.out.println("result:" + indexResponse.getResult());

		// 4 关闭连接
		client.close();
	}

Map方式:

@Test
	public void createIndexByMap() {

		// 1 文档数据准备
		Map json = new HashMap();
		json.put("id", "2");
		json.put("title", "底层调用了Lucene");
		json.put("content", "这是一个基于RESTful web接口的框架");

		// 2 创建文档
		IndexResponse indexResponse = client.prepareIndex("blog", "article", "2").setSource(json).execute().actionGet();

		// 3 打印返回的结果
		System.out.println("index:" + indexResponse.getIndex());
		System.out.println("type:" + indexResponse.getType());
		System.out.println("id:" + indexResponse.getId());
		System.out.println("version:" + indexResponse.getVersion());
		System.out.println("result:" + indexResponse.getResult());

		// 4 关闭连接
		client.close();
	}

ES构建器:

@Test
	public void createIndex() throws Exception {

		// 1 通过es自带的帮助类,构建json数据
		XContentBuilder builder = XContentFactory.jsonBuilder().startObject().field("id", 3)
				.field("title", "基于Lucene的搜索服务器").field("content", "它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口。")
				.endObject();

		// 2 创建文档
		IndexResponse indexResponse = client.prepareIndex("blog", "article", "3").setSource(builder).get();

		// 3 打印返回的结果
		System.out.println("index:" + indexResponse.getIndex());
		System.out.println("type:" + indexResponse.getType());
		System.out.println("id:" + indexResponse.getId());
		System.out.println("version:" + indexResponse.getVersion());
		System.out.println("result:" + indexResponse.getResult());

		// 4 关闭连接
		client.close();
	}

3.5 搜索文档
	@Test	// 单个索引
	public void getData() throws Exception {
		
		// 1 查询文档
		GetResponse response = client.prepareGet("blog", "article", "1").get();
		
		// 2 打印搜索的结果
		System.out.println(response.getSourceAsString());
		
		// 3 关闭连接
		client.close();
	}

@Test	// 多个索引
	public void getMultiData() {
		
		// 1 查询多个文档
		MultiGetResponse response = client.prepareMultiGet().add("blog", "article", "1").add("blog", "article", "2", "3")
				.add("blog", "article", "2").get();
		
		// 2 遍历返回的结果
		for(MultiGetItemResponse itemResponse:response){
			GetResponse getResponse = itemResponse.getResponse();
			
			// 如果获取到查询结果
			if (getResponse.isExists()) {
				String sourceAsString = getResponse.getSourceAsString();
				System.out.println(sourceAsString);
			}
		}
		
		// 3 关闭资源
		client.close();
	}

3.6 更新文档数据——update、upsert

update

@Test
	public void updateData() throws Throwable {

		// 1 创建更新数据的请求对象
		UpdateRequest updateRequest = new UpdateRequest();
		updateRequest.index("blog");
		updateRequest.type("article");
		updateRequest.id("3");

		updateRequest.doc(XContentFactory.jsonBuilder().startObject()
				// 对没有的字段添加, 对已有的字段替换
				.field("title", "基于Lucene的搜索服务器")
				.field("content",
						"它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口。大数据前景无限")
				.field("createDate", "2017-8-22").endObject());

		// 2 获取更新后的值
		UpdateResponse indexResponse = client.update(updateRequest).get();
		
		// 3 打印返回的结果
		System.out.println("index:" + indexResponse.getIndex());
		System.out.println("type:" + indexResponse.getType());
		System.out.println("id:" + indexResponse.getId());
		System.out.println("version:" + indexResponse.getVersion());
		System.out.println("create:" + indexResponse.getResult());

		// 4 关闭连接
		client.close();
	}

upsert

@Test
	public void testUpsert() throws Exception {

		// 设置查询条件, 查找不到则添加
		IndexRequest indexRequest = new IndexRequest("blog", "article", "5")
				.source(XContentFactory.jsonBuilder().startObject().field("title", "搜索服务器").field("content","它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口。Elasticsearch是用Java开发的,并作为Apache许可条款下的开放源码发布,是当前流行的企业级搜索引擎。设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。").endObject());
		
		// 设置更新, 查找到更新下面的设置
		UpdateRequest upsert = new UpdateRequest("blog", "article", "5")
				.doc(XContentFactory.jsonBuilder().startObject().field("user", "李四").endObject()).upsert(indexRequest);

		client.update(upsert).get();
		client.close();
	}

3.7 删除文档数据(prepareDelete)
	@Test
	public void deleteData() {
		
		// 1 删除文档数据
		DeleteResponse indexResponse = client.prepareDelete("blog", "article", "5").get();

		// 2 打印返回的结果
		System.out.println("index:" + indexResponse.getIndex());
		System.out.println("type:" + indexResponse.getType());
		System.out.println("id:" + indexResponse.getId());
		System.out.println("version:" + indexResponse.getVersion());
		System.out.println("found:" + indexResponse.getResult());

		// 3 关闭连接
		client.close();
	}

3.8 条件查询:查询所有、对所有字段分词查询、通配符查询、词条查询、模糊查询。

查询所有

@Test
	public void matchAllQuery() {
		
		// 1 执行查询
		SearchResponse searchResponse = client.prepareSearch("blog").setTypes("article")
				.setQuery(QueryBuilders.matchAllQuery()).get();

		// 2 打印查询结果
		SearchHits hits = searchResponse.getHits(); // 获取命中次数,查询结果有多少对象
		System.out.println("查询结果有:" + hits.getTotalHits() + "条");

		Iterator iterator = hits.iterator();

		while (iterator.hasNext()) {
			SearchHit searchHit = iterator.next(); // 每个查询对象

			System.out.println(searchHit.getSourceAsString()); // 获取字符串格式打印
		}

		// 3 关闭连接
		client.close();
	}

对所有字段分词查询

@Test
	public void query() {
		// 1 条件查询
		SearchResponse searchResponse = client.prepareSearch("blog").setTypes("article")
				.setQuery(QueryBuilders.queryStringQuery("全文")).get();

		// 2 打印查询结果
		SearchHits hits = searchResponse.getHits(); // 获取命中次数,查询结果有多少对象
		System.out.println("查询结果有:" + hits.getTotalHits() + "条");
		
		Iterator iterator = hits.iterator();
		
		while (iterator.hasNext()) {
			SearchHit searchHit = iterator.next(); // 每个查询对象
			
			System.out.println(searchHit.getSourceAsString()); // 获取字符串格式打印
		}
		
		// 3 关闭连接
		client.close();
	}

通配符查询(wildcardQuery)
*:表示多个字符(任意的字符)
?:表示单个字符

@Test
	public void wildcardQuery() {

		// 1 通配符查询
		SearchResponse searchResponse = client.prepareSearch("blog").setTypes("article")
				.setQuery(QueryBuilders.wildcardQuery("content", "*全*")).get();

		// 2 打印查询结果
		SearchHits hits = searchResponse.getHits(); // 获取命中次数,查询结果有多少对象
		System.out.println("查询结果有:" + hits.getTotalHits() + "条");

		Iterator iterator = hits.iterator();

		while (iterator.hasNext()) {
			SearchHit searchHit = iterator.next(); // 每个查询对象

			System.out.println(searchHit.getSourceAsString()); // 获取字符串格式打印
		}

		// 3 关闭连接
		client.close();
	}

词条查询(TermQuery)

@Test
	public void termQuery() {
		
		// 1 第一field查询
		SearchResponse searchResponse = client.prepareSearch("blog").setTypes("article")
				.setQuery(QueryBuilders.termQuery("content", "全")).get();
		
		// 2 打印查询结果
		SearchHits hits = searchResponse.getHits(); // 获取命中次数,查询结果有多少对象
		System.out.println("查询结果有:" + hits.getTotalHits() + "条");

		Iterator iterator = hits.iterator();

		while (iterator.hasNext()) {
			SearchHit searchHit = iterator.next(); // 每个查询对象

			System.out.println(searchHit.getSourceAsString()); // 获取字符串格式打印
		}

		// 3 关闭连接
		client.close();
	}

模糊查询(fuzzy)

@Test
	public void fuzzy() {
		
		// 1 模糊查询
		SearchResponse searchResponse = client.prepareSearch("blog").setTypes("article")
				.setQuery(QueryBuilders.fuzzyQuery("title", "lucene")).get();
		
		// 2 打印查询结果
		SearchHits hits = searchResponse.getHits(); // 获取命中次数,查询结果有多少对象
		System.out.println("查询结果有:" + hits.getTotalHits() + "条");

		Iterator iterator = hits.iterator();

		while (iterator.hasNext()) {
			SearchHit searchHit = iterator.next(); // 每个查询对象

			System.out.println(searchHit.getSourceAsString()); // 获取字符串格式打印
		}

		// 3 关闭连接
		client.close();
	}

3.9 映射相关操作
@Test
	public void createMapping() throws Exception {
		
		// 1设置mapping
		XContentBuilder builder = XContentFactory.jsonBuilder()
				.startObject()
					.startObject("article")
						.startObject("properties")
							.startObject("id1")
								.field("type", "string")
								.field("store", "yes")
							.endObject()
							.startObject("title2")
								.field("type", "string")
								.field("store", "no")
							.endObject()
							.startObject("content")
								.field("type", "string")
								.field("store", "yes")
							.endObject()
						.endObject()
					.endObject()
				.endObject();

		// 2 添加mapping
		PutMappingRequest mapping = Requests.putMappingRequest("blog4").type("article").source(builder);
		
		client.admin().indices().putMapping(mapping).get();
		
		// 3 关闭资源
		client.close();
	}

四、ElasticSearch与Spring Boot整合

SpringBoot默认支持两种技术来和ES交互:

1)Jest(默认是不生效的,如果想让其生效,必须导入jest的工具包:import io.searchbox.client.JestClient;)

2)SpringData ElasticSearch

  • 类ElasticsearchAutoConfiguration,自动帮我们配置了客户端类Client,在这里面需要配置节点信息clusterNodes和clusterName。
  • 类ElasticsearchDataAutoConfiguration,自动帮我们配置了让我们来操作ES的ElasticsearchTemplate。
  • 编写一个ElasticsearchRepository的子接口来操作ES

Elasticsearch基础总结与Spring Boot整合_第1张图片

4.1 利用Jest操作ElasticSearch

在pom中移除spring-boot-starter-data-elasticsearch

在pom中导入jest的依赖

访问http://172.22.34.28:9200/时的返回信息中有响应的版本信息,如下:
后来我又搭建了一台ElasticSearch Server,用的版本比较新:5.6.12.

{
  "name" : "725ijsI",
  "cluster_name" : "elasticsearch",
  "cluster_uuid" : "IwPHG-JtT6Wd7SXCE1L96g",
  "version" : {
    "number" : "5.6.12",
    "build_hash" : "cfe3d9f",
    "build_date" : "2018-09-10T20:12:43.732Z",
    "build_snapshot" : false,
    "lucene_version" : "6.6.1"
  },
  "tagline" : "You Know, for Search"
}

我们看到是5.6.12版本,所以,在引入依赖时也要用相应大版本号的:



   io.searchbox
   jest
   5.3.4

我的测试程序:

@Autowired
JestClient jestClient;

// 给ES中索引(保存)一个文档
@Test
public void testSaveToES() throws IOException {
   Article article = new Article(001, "胡秀韬","Good News","今天看了一部好电影。");
   // 新建构建器
   Index.Builder builder = new Index.Builder(article);
   // 指定索引(保存)到的地方
   builder.index("mytest");
   // 指定保存的类型
   builder.type("news");
   // 指定保存的id,因为article对象中有ID,此处可以省略
   builder.id(String.valueOf(article.getId()));
   // 将信息设置好之后,进行构建
   Index index = builder.build();
   // 上面的index就构建了一个索引功能
   // 利用jestClient开始执行
   jestClient.execute(index);
}

执行后可在页面上查看是否成功:
Elasticsearch基础总结与Spring Boot整合_第2张图片
测试搜索:

// 测试搜索
@Test
public void searchES() {
   // Elasticsearch提供丰富且灵活的查询语言叫做DSL查询(Query DSL),
   // 它允许你构建更加复杂、强大的查询。
   // DSL(Domain Specific Language特定领域语言)以JSON请求体的形式出现
   // 定义查询表达式
   String json = "{\n" +
         "\"query\" : {\n" +
         "\"match\" : {\n" +
         "\"content\" : \"电影\"\n" +
         "}\n" +
         "}\n" +
         "}";
   // 创建构建器
   Search.Builder builder = new Search.Builder(json);
   // 指定在哪个索引下搜索
   builder.addIndex("mytest");
   // 指定在哪个类型下搜索
   builder.addType("news");
   // 构建搜索操作功能
   Search search = builder.build();
   // 利用jestClient执行
   try {
      SearchResult result = jestClient.execute(search);
      // result中可以拿到许多信息
      System.out.println(result.getJsonString());
   } catch (IOException e) {
      e.printStackTrace();
   }
}

控制台输出:

{
	"took": 165,
	"timed_out": false,
	"_shards": {
		"total": 5,
		"successful": 5,
		"skipped": 0,
		"failed": 0
	},
	"hits": {
		"total": 1,
		"max_score": 0.5446649,
		"hits": [{
			"_index": "mytest",
			"_type": "news",
			"_id": "1",
			"_score": 0.5446649,
			"_source": {
				"id": 1,
				"author": "胡秀韬",
				"title": "Good News",
				"content": "今天看了一部好电影。"
			}
		}]
	}
}
2、引入spring-boot-starter-data-elasticsearch

   org.springframework.boot
   spring-boot-starter-data-elasticsearch

关于版本问题:

https://spring.io/projects/spring-data官网中查看:Community modules模块下的Spring Data Elasticsearch - Spring Data module for Elasticsearch.打开Spring Data Elasticsearch连接后,打开"Learn"后,再打开最新版本的Reference Doc,从中找到Project Metadata:

Version Control - https://github.com/spring-projects/spring-data-elasticsearch

Elasticsearch基础总结与Spring Boot整合_第3张图片
一般更换ES的版本。(本例使用2.4.6)
Elasticsearch基础总结与Spring Boot整合_第4张图片
在application.properties中配置:

spring.data.elasticsearch.cluster-name=elasticsearch
spring.data.elasticsearch.cluster-nodes=172.22.34.28:9301

https://github.com/spring-projects/spring-data-elasticsearch该页面中也有相应的使用方法:有两种:编写一个ElasticsearchRepository和使用ElasticsearchTemplate。

第一种方法:ElasticsearchRepository

定义Book实体:

// 一定要注明索引和type
@Document(indexName = "mytest", type = "book")
public class Book {
    private Integer id;
    private String bookName;
    private String author;
  	// constructor
  	// Getter Setter方法
}

自定义repository接口,并继承ElasticsearchRepository

public interface BookRepository extends ElasticsearchRepository {
    // 支持自定义方法
    // 具体使用和更多的使用方法参照:https://docs.spring.io/spring-data/elasticsearch/docs/3.1.3.RELEASE/api/
    public List findByBookNameLike(String bookName);
}

Elasticsearch基础总结与Spring Boot整合_第5张图片

@Test
public void testElasticsearchRepository() {
   Book book = new Book(001, "《红楼梦》", "曹雪芹");
   // 保存
   bookRepository.index(book);
   // 模糊查询
   List result = bookRepository.findByBookNameLike("红");
   for (Book book1 : result) {
      System.out.println(book1);
   }
}

你可能感兴趣的:(搜索引擎)