陈震_

最新版ES8的client API操作 Elasticsearch Java API client 8.0

作者：ChenZhen

本人不常看网站消息，有问题通过下面的方式联系：

邮箱：[email protected]

vx: ChenZhen_7

我的个人博客地址：https://www.chenzhen.space/

版权：本文为博主的原创文章，本文版权归作者所有，转载请附上原文出处链接及本声明。

如果对你有帮助，请给一个小小的star⭐

Elasticsearch Java client 8.0

Elasticsearch：使用最新的 Elasticsearch Java client 8.0 来创建索引并搜索
开始
安装
简单操作
- 创建索引
- 判断索引是否存在并创建索引（构建器写法与lambda写法）
- 查询索引
- 查询全部索引
- 删除索引
- 插入文档
- **使用原始 JSON 数据**
- **批量请求：多个文档**
- 查询文档
- 修改文档
- 删除文档
命名空间
构建 API 对象
- 1.构建器模式
- 2.lambda 表达式
复杂查询
- 搜索查询
- bool查询
- 嵌套搜索查询
- 拼接查询条件
- term查询
- terms查询
- match_phrase查询
- multi_match查询
- fuzzy查询
- range查询
- 高亮查询
- 排序和分页
- 聚合
- 分组查询
- 过滤器
参考文章与推荐阅读

Elasticsearch：使用最新的 Elasticsearch Java client 8.0 来创建索引并搜索

我们在学习ES客户端时，一直使用的都是Java High Level Rest Client，在浏览官网时，发现官方给出的警告是：Java REST 客户端已被弃用，取而代之的是 Java API client 客户端，ES 8.x 新版本中，Type 概念被弃用，所以新版 JavaAPI 也相应做出了改变，使用更加简便。ES 官方从 7.15 起开始建议使用新的 JavaAPI

如何使用最新的 Elasticsearch Java client 8.0 来创建索引并进行搜索。最新的 Elasticsearch Java client API 和之前的不同。在es7的一些教程中，经常使用 High Level API 来进行操作。但在官方文档中，已经显示为 deprecated。

Java API Client
官网为啥又推出一个新的客户端接口呢，这是为了统一管理，官网给出的回应是：将来只对这个客户端进行维护改进，这也接口会更加的清晰明了，可读性更高，更易于上手，更简单！代码看着更加简洁了！

无论是ElasticsearchTemplate类还是ElasticsearchRepository接口，都是对ES常用的简单功能进行封装，在实际使用时，复杂的查询语法还是依赖ElasticsearchClient和原生的API封装；

更详细内容参考官网API文档：https://www.elastic.co/guide/en/elasticsearch/client/java-api-client/current/package-structure.html

开始

本文将指导您完成 Java 客户端的安装过程，向您展示如何实例化客户端，以及如何使用它执行基本的 Elasticsearch 操作。

安装

在项目的 pom.xml 中，添加以下存储库定义和依赖项：


<project>
  <dependencies>

    <dependency>
      <groupId>co.elastic.clientsgroupId>
      <artifactId>elasticsearch-javaartifactId>
      <version>8.10.4version>
    dependency>

    <dependency>
      <groupId>com.fasterxml.jackson.coregroupId>
      <artifactId>jackson-databindartifactId>
      <version>2.12.3version>
    dependency>

  dependencies>
project>

你可以使用API密钥和Elasticsearch端点来连接到Elastic 。

RestClient这个类主要是用作于与服务端IP以及端口的配置，在其的builder()方法可以设置登陆权限的账号密码、连接时长等等。总而言之就是服务端配置。
RestClientTransport 这是Jackson映射器创建传输。建立客户端与服务端之间的连接传输数据。这是在创建ElasticsearchClient需要的参数，而创建RestClientTransport就需要上面创建的RestClient。
ElasticsearchClient 这个就是Elasticsearch的客户端。调用Elasticsearch语法所用到的类，其就需要传入上面介绍的RestClientTransport。


// URL和API密钥
String serverUrl = "https://localhost:9200";
String apiKey = "VnVhQ2ZHY0JDZGJrU...";

// 创建低级别客户端
RestClient restClient = RestClient
    .builder(HttpHost.create(serverUrl))
    .setDefaultHeaders(new Header[]{
        new BasicHeader("Authorization", "ApiKey " + apiKey)
    })
    .build();

// 使用Jackson映射器创建传输
ElasticsearchTransport transport = new RestClientTransport(
    restClient, new JacksonJsonpMapper());

// 然后创建API客户端
ElasticsearchClient client = new ElasticsearchClient(transport);

得到API客户端对象client ，你就可以进行Elasticsearch的基本操作，以下是一些最基本的操作。

简单操作

创建索引

下面的代码片段显示了如何使用 indices 命名空间客户端创建索引（lambda 语法在下面进行了说明):

// 创建索引products

client.indices().create(c -> c.index("products"));

判断索引是否存在并创建索引（构建器写法与lambda写法）

lambda写法：

           // 获取【索引客户端对象】
		ElasticsearchIndicesClient indexClient = client.indices();

		boolean flag = indexClient.exists(req -> req.index(iName)).value();
		//CreateIndexResponse createIndexResponse = null;
		boolean result = false;
		if (flag) {
			// 目标索引已存在
			log.info("索引【" + iName + "】已存在！");
		} else {
			// 不存在
			result = indexClient.create(req -> req.index(iName)).acknowledged();	
			if (result) {
				log.info("索引【" + iName + "】创建成功！");
			} else {
				log.info("索引【" + iName + "】创建失败！");
			}
		}

构建器写法

   // 获取【索引客户端对象】
	ElasticsearchIndicesClient indexClient = client.indices();
	//1、构建【存在请求对象】
	ExistsRequest existsRequest = new ExistsRequest.Builder().index(indexName).build();
	//2、判断目标索引是否存在
	boolean flag = indexClient.exists(existsRequest).value();
	
	if (flag) {
			// 目标索引已存在
			log.info("索引【" + iName + "】已存在！");
	} else {
		//1. 获取【创建索引请求对象】
		CreateIndexRequest createIndexRequest = new CreateIndexRequest.Builder().index(indexName).build();
		//2. 创建索引，得到【创建索引响应对象】
		CreateIndexResponse createIndexResponse = indexClient.create(createIndexRequest);
		createIndexResponse = indexClient.create(req -> req.index(indexName));
		//System.out.println("创建索引响应对象：" + createIndexResponse);
		boolean result= indexName.acknowledged();
		if (result) {
				log.info("索引【" + indexName + "】创建成功！");
		} else {
				log.info("索引【" + indexName + "】创建失败！");
		}
	}

可以看到构建器写法在简洁度上完全不如lambda表达式，接下来所有例子均只采用lambda写法

查询索引

	Map<String, IndexState> result  = client.indices().get(req -> req.index("indexName")).result();

查询全部索引

	Set<String> all = client.indices().get(req -> req.index("*")).result().keySet();

删除索引

	Boolean isDelete = client.indices().delete(req -> req.index("indexName")).acknowledged();
	if(isDelete ) {
        log.info("删除索引成功");
    } else {
        log.info("删除索引失败");
    }

插入文档

生成请求的最直接方法是使用流畅的 DSL。在下面的示例中，我们使用产品的 SKU 作为索引中的文档标识符，在产品索引中为products描述编制索引。product对象将使用 Elasticsearch 客户端上配置的对象映射器映射到 JSON。

	Product product = new Product("bk-1", "City bike", 123.0);
	
	IndexResponse response = client.index(i -> i
	    .index("products")
	    .id(product.getSku())
	    .document(product)
	);

	logger.info("Indexed with version " + response.version());

还可以将使用 DSL 创建的对象分配给变量。Java API 客户端类有一个静态of() 方法，它使用 DSL 语法创建一个对象。

	Product product = new Product("bk-1", "City bike", 123.0);
	
	IndexRequest<Product> request = IndexRequest.of(i -> i
	    .index("products")
	    .id(product.getSku())
	    .document(product)
	);
	
	IndexResponse response = client.index(request);

	logger.info("Indexed with version " + response.version());

使用原始 JSON 数据

当您要索引的数据来自外部源时，对于半结构化数据，必须创建域对象可能会很麻烦或完全不可能。

您可以使用 withJson() 为任意源的数据编制索引。使用此方法将读取源并将其用于索引请求的document属性。

	Reader input = new StringReader(
	    "{'@timestamp': '2022-04-08T13:55:32Z', 'level': 'warn', 'message': 'Some log message'}"
	    .replace('\'', '"'));
	
	IndexRequest<JsonData> request = IndexRequest.of(i -> i
	    .index("logs")
	    .withJson(input)
	);
	
	IndexResponse response = client.index(request);
	
	logger.info("Indexed with version " + response.version());

批量请求：多个文档

批量请求允许在一个请求中发送多个与文档相关的操作到 Elasticsearch。当你有多个文档需要导入时，这比分别发送每个文档的请求更有效率。

一个批量请求可以包含多种类型的操作：

创建一个文档，在确保它不存在后进行索引
索引一个文档，如果需要则创建它，如果已经存在则替换它
更新一个已经存在的文档，可以使用脚本或部分文档
删除一个文档

一个批量请求包含一系列操作，每个操作都是一种类型，有几个变种。为了创建这个请求，最方便的方法是使用主请求的构建器对象以及每个操作的流畅式 DSL。

下面的示例展示了如何索引一个应用程序对象列表。

	List<Product> products = fetchProducts();
	
	BulkRequest.Builder br = new BulkRequest.Builder();
	
	for (Product product : products) {
	    br.operations(op -> op           
	        .index(idx -> idx            
	            .index("products")       
	            .id(product.getSku())
	            .document(product)
	        )
	    );
	}
	
	BulkResponse result = client.bulk(br.build());
	
	// Log errors, if any
	if (result.errors()) {
	    logger.error("Bulk had errors");
	    for (BulkResponseItem item: result.items()) {
	        if (item.error() != null) {
	            logger.error(item.error().reason());
	        }
	    }
	}

批量的脚本操作：

for (ProductDTO productDTO : Optional.ofNullable(productResult.getData()).orElse(Collections.emptyList())) {

				Map<String, JsonData> params = new HashMap<>(16);
				params.put("buys", JsonData.of(productDTO.getBuys()));
				params.put("views", JsonData.of(productDTO.getViews()));
				params.put("comments", JsonData.of(productDTO.getComments()));


				br.operations(op -> op
						.update(u -> u
								.id(String.valueOf(productDTO.getId()))
								.index(searchProperties.getProductIndexName())
								.action(a -> a
										.script(s -> s
												.inline(i -> i
														.source("ctx._source.buys = params.buys;" +
																"ctx._source.views = params.views;" +
																"ctx._source.comments = params.comments;")
														.params(params))))

						)
				);
			}

查询文档

Elasticsearch主要用于搜索，但你也可以直接访问文档，通过id 。

下面的示例从"products"索引中读取id "bk-1"的文档。

get请求有两个参数：

第一个参数是实际请求，使用DSL构建
第二个参数是我们希望将文档的JSON映射到的类。

	GetResponse<Product> response = client.get(g -> g
	    .index("products")
	    .id("bk-1"),
	    Product.class
	);
	
	if (response.found()) {
	    Product product = response.source();
	    logger.info("产品名称 " + product.getName());
	} else {
	    logger.info("未找到产品");
	}

这个get请求包括索引名称和标识符。

目标类，在这里是Product。

如果你的索引包含半结构化数据，或者如果你没有对象的定义，你也可以将文档作为原始JSON数据来读取。

原始JSON数据只是另一个类，你可以将其用作get请求的结果类型。在下面的示例中，我们使用了Jackson的ObjectNode。我们也可以使用任何可以由与ElasticsearchClient关联的JSON映射器反序列化的JSON表示。

GetResponse<ObjectNode> response = client.get(g -> g
    .index("products")
    .id("bk-1"),
    ObjectNode.class
);

if (response.found()) {
    ObjectNode json = response.source();
    String name = json.get("name").asText();
    logger.info("产品名称 " + name);
} else {
    logger.info("未找到产品");
}

1.目标类是一个原始的JSON对象。

修改文档


UpdateResponse updateResponse = client.update(u -> u
                        .doc(textBook)
                        .id(id),
                TextBook.class

删除文档

DeleteResponse deleteResponse = client.delete(d -> d
                .index(index)
                .id(id)
        );

命名空间

在REST API文档中，数量众多API是按照特性(feature)来分组的，如下图：

在ES的Java库Java API Client中，上图中的各种feature被称为namespace

在ES的Java库Java API Client中，与REST API对应的的类和接口都在统一的包名co.elastic.clients.elasticsearch之下，然后再通过下一级package进行分类，这个分类与上图的feature相对应。例如索引相关的，在REST API中的feature是Index APIs，那么在Java API Client中，完整的package就是co.elastic.clients.elasticsearch.indices，这里面有索引操作所需的请求、响应、服务等各种类.

每一个namespace（也就是REST API中的feature），都有自己的client，例如索引相关的操作都有索引专用的client类负责，client.indices()返回的是ElasticsearchIndicesClient对象，这是索引操作专用的实例

ElasticsearchClient client = ......

client.indices().create(c -> c.index("products"));

展开上述代码的indices()方法，看看其内部实现，如下所示，每次调用indices方法，都会创建一个ElasticsearchIndicesClient对象，对于其他namespace，例如ingest、license亦是如此，都会创建新的实例

每个namespace都有自己的client，但也有例外，就是search和document，它们的代码不在search或者document这样的package下面，而是在core下面，而且可以直接通过ElasticsearchClient来操作，如下：

插入一条文档：

Product product = new Product("bk-1", "City bike", 123.0);
	
	IndexResponse response = client.index(i -> i
	    .index("products")
	    .id(product.getSku())
	    .document(product)
	);

	logger.info("Indexed with version " + response.version());

构建 API 对象

1.构建器模式

ElasticsearchClient client = ......

CreateIndexResponse createResponse = client.indices().create(
    new CreateIndexRequest.Builder()
        .index("my-index")
        .aliases("foo",
            new Alias.Builder().isWriteIndex(true).build()
        )
        .build()
);

2.lambda 表达式

虽然这效果很好，但必须实例化构建器类并调用 build() 方法有点冗长。因此，Java API 客户端中的每个属性设置器也接受一个 lambda 表达式，该表达式将新创建的构建器作为参数，并返回填充的构建器。上面的片段也可以写成：

ElasticsearchClient client = ......

CreateIndexResponse createResponse = client.indices()
    .create(createIndexBuilder -> createIndexBuilder
        .index("my-index")
        .aliases("foo", aliasBuilder -> aliasBuilder
            .isWriteIndex(true)
        )
    );

这种方法允许更简洁的代码，并且还避免了导入类（甚至记住它们的名称），因为类型是从方法参数签名推断出来的。建议大家这样去写，非常简洁快速，后面的各种操作我也会用这种方式来书写。

生成器 lambda 对于复杂的嵌套查询（如下所示）特别有用

{
  "query": {
    "intervals": {
      "field": "my_text",
      "all_of": [
        {
          "ordered": true,
          "intervals": [
            {
              "match": {
                "query": "my favorite food",
                "max_gaps": 0,
                "ordered": true
              }
            }
          ]
        },
        {
          "any_of": {
            "intervals": [
              {
                "match": {
                  "query": "hot water"
                }
              },
              {
                "match": {
                  "query": "cold porridge"
                }
              }
            ]
          }
        }
      ]
    }
  }
}

对应的代码如下：

SearchResponse<SomeApplicationData> results = client
    .search(b0 -> b0
        .query(b1 -> b1
            .intervals(b2 -> b2
                .field("my_text")
                .allOf(b3 -> b3
                    .ordered(true)
                    .intervals(b4 -> b4
                        .match(b5 -> b5
                            .query("my favorite food")
                            .maxGaps(0)
                            .ordered(true)
                        )
                    )
                    .intervals(b4 -> b4
                        .anyOf(b5 -> b5
                            .intervals(b6 -> b6
                                .match(b7 -> b7
                                    .query("hot water")
                                )
                            )
                            .intervals(b6 -> b6
                                .match(b7 -> b7
                                    .query("cold porridge")
                                )
                            )
                        )
                    )
                )
            )
        ),
    SomeApplicationData.class 
);

复杂查询

搜索查询

有许多类型的搜索查询可以组合使用。我们将从简单的文本匹配查询开始，在products索引中搜索自行车。我们在这里选择匹配查询（全文搜索）

搜索结果具有hits属性，其中包含与查询匹配的文档以及有关索引中存在的匹配项总数的信息。
总值带有一个关系，该关系指示总值是精确的（eq — 相等）还是近似的（gte — 大于或等于）。
每个返回的文档都附带其相关性分数以及有关其在索引中的位置的其他信息。

String searchText = "自行车";

SearchResponse<Product> response = client.search(s -> s
    .index("products") 
    .query(q -> q      
        .match(t -> t   
            .field("name")  
            .query(searchText)
        )
    ),
    Product.class      
);

TotalHits total = response.hits().total();//total可以获取结果的总数
boolean isExactResult = total.relation() == TotalHitsRelation.Eq;

if (isExactResult) {
    logger.info("找到 " + total.value() + " 个结果");
} else {
    logger.info("找到超过 " + total.value() + " 个结果");
}


List<Hit<Product>> hits = response.hits().hits();
for (Hit<Product> hit: hits) {
    Product product = hit.source();
    logger.info("找到产品 " + product.getSku() + "，得分 " + hit.score());
}

与获取操作类似，您可以使用相应的目标类而不是 Product（如 JSON-P 的 JsonValue 或 Jackson 的 ObjectNode）将匹配查询的文档作为原始 JSON 获取.

bool查询

@SpringBootTest
@Slf4j
public class ESTest {
 
    @Resource
    ElasticsearchClient client;
 
    String index = "textbook";
 
    @Test
    public void grepTextBook() throws IOException {
        SearchResponse<TextBook> boolSearch = client.search(s -> s
                        .index(index)
                        .query(q -> q
                                .bool(b -> b
                                        .must(m -> m
                                                .term(t -> t
                                                        .field("author")
                                                        .value("老坛")
                                                )
                                        )
                                        .should(sh -> sh
                                                .match(t -> t
                                                        .field("bookName")
                                                        .query("老坛")
                                                )
                                        )
 
                                )
                        ),
                TextBook.class);
        for (Hit<TextBook> hit: boolSearch.hits().hits()) {
            TextBook pd = hit.source();
            System.out.println(pd);
        }
    }
}

对应了ES的bool查询，它等价的ES语法就是：

GET textbook/_search
{
    "query":{
        "bool":{
            "should":{
                "match":{
                    "bookName":"老坛"
                }
            },
            "must":{
                "term":{
                    "author":"老坛"
                }
            }
        }
    }
}

嵌套搜索查询

在下面的示例中，我们将搜索最高价格为 200 的自行车。

Java API 客户端Query类有一个静态of() 方法，它使用 DSL 语法创建一个对象。

String searchText = "自行车";
double maxPrice = 200.0;

// 根据产品名称搜索
Query byName = MatchQuery.of(m -> m
    .field("name")
    .query(searchText)
)._toQuery();

// 根据最高价格搜索
Query byMaxPrice = RangeQuery.of(r -> r
    .field("price")
    .gte(JsonData.of(maxPrice))
)._toQuery();

// 组合产品名称和价格查询来搜索产品索引
SearchResponse<Product> response = client.search(s -> s
    .index("products")
    .query(q -> q
        .bool(b -> b
            .must(byName)
            .must(byMaxPrice)
        )
    ),
    Product.class
);

List<Hit<Product>> hits = response.hits().hits();
for (Hit<Product> hit : hits) {
    Product product = hit.source();
    logger.info("找到产品 " + product.getSku() + "，得分 " + hit.score());
}

在大量并发频繁执行各种namespace操作时，会创建大量client对象，这样会影响系统性能吗？

官方说这是轻量级对象(very lightweight)，所以，理论上可以放心创建，不必担心其对系统造成的压力

同时，这段代码的目的是为了实现逻辑功能，代码的可读性和维护性通常比微小的内存浪费更重要。如果通过将这段逻辑放在条件块内，来避免不使用的 boolQueryBuilder，可能会使代码更复杂和难以阅读。

拼接查询条件

可以选择性的拼接条件，我们先创建一个SearchRequest.Builder请求对象构建器，然后拼接条件。

		// 1. 创建查询构建器
		co.elastic.clients.elasticsearch.core.SearchRequest.Builder searchBuilder = 
		new co.elastic.clients.elasticsearch.core.SearchRequest.Builder();
		//设置索引名称
		searchBuilder
				.index(searchProperties.getProductIndexName());

		if (StrUtil.isBlank(request.getKey())) {
		
			Query query = Query.of(q -> q
				.bool(b -> b
						.must(m -> m.matchAll(m1 -> m1))));
		} else {
		
			Query query = Query.of(q -> q
					.bool(b1 -> b1
								.should(s -> s
										.matchPhrase(m1 -> m1
												.field("productName").query(request.getKey()).boost(3f)))
								.should(s1 -> s1
										.matchPhrase(m2 -> m2
												.field("shopName").query(request.getKey())))
								.should(s2 -> s2
										.matchPhrase(m3 -> m3
												.field("brandName").query(request.getKey())))
								));
		//根据条件拼接不同query
		searchBuilder
				.query(query);
		//查询			
		co.elastic.clients.elasticsearch.core.SearchRequest searchRequest = searchBuilder.build();		
		SearchResponse<ProductDocument> response  = client.search(searchRequest, ProductDocument.class);

term查询

@SpringBootTest
@Slf4j
public class ESTest {
 
    @Resource
    ElasticsearchClient client;
 
    String index = "textbook";
 
    @Test
    public void grepTextBook() throws IOException {
        SearchResponse<TextBook> termSearch = client.search(s -> s
                        .index(index)
                        .query(q -> q
                                .term(t -> t
                                        .field("bookName")
                                        .value("老坛")
                                )
                        ),
                TextBook.class);
        for (Hit<TextBook> hit: termSearch.hits().hits()) {
            TextBook pd = hit.source();
            System.out.println(pd);
        }
    }
}

对应了ES的term查询，它等价的ES语法就是：

GET textbook/_search
{
  "query": {
    "term": {
      "bookName":"老坛"
    }
  }
}

terms查询

		List<Long> skuIds = new ArrayList<>();
		skuIds.add(1L);
		skuIds.add(2L);
		skuIds.add(3L);
		
		// 创建 "skuIds" 条件tems查询
		TermsQuery bySkuIds = TermsQuery.of(t -> t
				.field("skuIds")
				.terms(t2 -> t2
						.value(skuIds.stream().map(FieldValue::of).collect(Collectors.toList())))
		);
		//查询命令
		SearchResponse<ActivityDocument> search  = client.search(s -> s
						.index("activity")
						.query(q -> q
								.terms(bySkuIds)
						)
				, ActivityDocument.class);

对应了ES的terms查询，它等价的ES语法就是：

{
			"query": {
			"terms": {
				"skuIds ": [1,2,3]
			}
		}
}

match_phrase查询

@SpringBootTest
@Slf4j
public class ESTest {
 
    @Resource
    ElasticsearchClient client;
 
    String index = "textbook";
 
    @Test
    public void grepTextBook() throws IOException {
        SearchResponse<TextBook> matchPhraseSearch = client.search(s -> s
                        .index(index)
                        .query(q -> q
                                .matchPhrase(m -> m
                                        .field("bookName")
                                        .query("老坛")
                                )
                        ),
                TextBook.class);
        for (Hit<TextBook> hit: matchPhraseSearch.hits().hits()) {
            TextBook pd = hit.source();
            System.out.println(pd);
        }
    }
}

对应了ES的match_phrase查询，它等价的ES语法就是：

GET textbook/_search
{
  "query": {
    "match_phrase": {
      "bookName":"老坛"
    }
  }
}

multi_match查询

@SpringBootTest
@Slf4j
public class ESTest {
 
    @Resource
    ElasticsearchClient client;
 
    String index = "textbook";
 
    @Test
    public void grepTextBook() throws IOException {
        SearchResponse<TextBook> multiMatchSearch = client.search(s -> s
                        .index(index)
                        .query(q -> q
                                .multiMatch(m -> m
                                        .query("老坛")
                                        .fields("author", "bookName")
                                )
                        ),
                TextBook.class);
        for (Hit<TextBook> hit: multiMatchSearch.hits().hits()) {
            TextBook pd = hit.source();
            System.out.println(pd);
        }
    }
}

对应了ES的multi_match查询，它等价的ES语法就是：

GET textbook/_search
{
	"query": {
		"multi_match": {
			"query": "老坛",
			"fields": ["author","bookName"]
		}
	}
}

fuzzy查询

@SpringBootTest
@Slf4j
public class ESTest {
 
    @Resource
    ElasticsearchClient client;
 
    String index = "textbook";
 
    @Test
    public void grepTextBook() throws IOException {
        SearchResponse<TextBook> fuzzySearch = client.search(s -> s
                        .index(index)
                        .query(q -> q
                                .fuzzy(f -> f
                                        .field("bookName")
                                        .fuzziness("2")
                                        .value("老坛")
                                )
                        ),
                TextBook.class);
        for (Hit<TextBook> hit: fuzzySearch.hits().hits()) {
            TextBook pd = hit.source();
            System.out.println(pd);
        }
    }
}

对应了ES的fuzzy查询，它等价的ES语法就是：

GET textbook/_search
{
  "query": {
    "fuzzy": {
      "bookName":{
        "value":"老坛",
        "fuzziness":2
      }
    }
  }
}

range查询

@SpringBootTest
@Slf4j
public class ESTest {
 
    @Resource
    ElasticsearchClient client;
 
    String index = "textbook";
 
    @Test
    public void grepTextBook() throws IOException {
        SearchResponse<TextBook> rangeSearch = client.search(s -> s
                        .index(index)
                        .query(q -> q
                                .range(r -> r
                                        .field("bookName")
                                        .gt(JsonData.of(20))
                                        .lt(JsonData.of(20))
                                )
                        ),
                TextBook.class);
        for (Hit<TextBook> hit: rangeSearch.hits().hits()) {
            TextBook pd = hit.source();
            System.out.println(pd);
        }
    }
}

对应了ES的range查询，它等价的ES语法就是：

GET textbook/_search
{ 
  "query": {
    "range": { 
      "bookName": { 
          "gt":20, 
          "lt":30 
      } 
    }
  } 
}

高亮查询

实现很简单，请注意，我们定义 HighlightField 即hf，即我们要突出显示的字段。

在这个 HighlightField 中，我们还定义了参数，包括numberOfFragments和fragmentSize。

参数可以设置在highlight的下一级，此时为全局设置（如下面的fragmentSize(50)和numberOfFragments(5)），也可以设置在字段的下一级，此时为字段设置。单个字段的设置优先级高于全局设置。

var response = client.search(s -> s
				.index("product")
				.query(q -> q.multiMatch(m -> m.fields(List.of("title", "description")).query("Aliens and predator")))
				.highlight(h -> h
						.type(HighlighterType.Unified)
						.fields("title",hf -> hf
								.numberOfFragments(0))
						.fields("description",hf -> hf
								.numberOfFragments(4).fragmentSize(50))
						.fragmentSize(50)
						.numberOfFragments(5)
				)
		, Movie.class);

上面的写法等同于：

Map<String, HighlightField> map = new HashMap<>();
map.put("title", HighlightField.of(hf -> hf.numberOfFragments(0)));
map.put("description", HighlightField.of(hf -> hf.numberOfFragments(4).fragmentSize(50)));

Highlight highlight = Highlight.of(
    h -> h.type(HighlighterType.Unified)
        .fields(map)
        .fragmentSize(50)
        .numberOfFragments(5)
);

var response = client.search(s -> s
		.index("idx_movies")
        .query(q -> q.multiMatch(m -> m.fields(List.of("title", "description")).query("Aliens and predator")))
        .highlight(highlight)
    , Movie.class);

排序和分页

排序和分页直接像ES的语法一样，体现在和query的平级即可。这里已match为例进行介绍。

@SpringBootTest
@Slf4j
public class ESTest {
 
    @Resource
    ElasticsearchClient client;
 
    String index = "textbook";
 
    @Test
    public void grepTextBook() throws IOException {
        SearchResponse<TextBook> matchSearch = client.search(s -> s
                        .index(index)
                        .query(q -> q
                                .match(t -> t
                                        .field("bookName")
                                        .query("老坛")
                                )
                        )
                        .from(1)
                        .size(100)
                        .sort(so -> so // 排序操作项
                                .field(f -> f // 排序字段规则
                                        .field("num")
                                        .order(SortOrder.Desc)
                                )
                        ),
                TextBook.class);
        for (Hit<TextBook> hit: matchSearch.hits().hits()) {
            TextBook pd = hit.source();
            System.out.println(pd);
        }
    }
}

这是一个根据num字段进行降序排序的查询，按页容量为100对数据进行分页，取第二页数据。

它等价的ES语法就是：

GET textbook/_search
{
    "query":{
        "match":{
            "bookName":"老坛"
        }
    },
    "from":1,
    "size":100,
    "sort":{
        "num":{
            "order":"desc"
        }
    }
}

聚合

这个示例是一种用于分析的聚合操作，我们不需要使用匹配的文档。用于分析的搜索请求通常的一般模式是将结果大小设置为0，将搜索结果的目标类设置为 Void。

如果同样的聚合用于显示产品和价格直方图作为钻取细分，我们会将大小设置为非零值，并使用 Product 作为目标类来处理结果。

String searchText = "自行车";

Query query = MatchQuery.of(m -> m
    .field("name")
    .query(searchText)
)._toQuery();

SearchResponse<Void> response = client.search(b -> b
    .index("products")
    .size(0) // 将匹配文档数量设置为零，因为我们只关心价格直方图
    .query(query) // 设置用于过滤要执行聚合的产品的查询
    .aggregations("price-histogram", a -> a
        .histogram(h -> h
            .field("price")
            .interval(50.0)
        )
    ),
    Void.class
);

在上面的代码中，我们首先创建了一个用于产品名称匹配的查询，然后执行了一个搜索请求，其中包含了一个名为 “price-histogram” 的聚合操作，用于创建价格直方图。我们将结果大小设置为零，因为我们只关心聚合结果，不需要匹配的文档。

响应包含了每个请求中的聚合结果。

List<HistogramBucket> buckets = response.aggregations()
    .get("price-histogram")
    .histogram()
    .buckets().array();

for (HistogramBucket bucket : buckets) {
    logger.info("有 " + bucket.docCount() +
        "辆自行车的价格低于 " + bucket.key());
}

获取 “price-histogram” 聚合的结果。

将其转换为直方图变体的结果。这必须与聚合定义保持一致。

桶可以表示为数组或映射。这里将其转换为数组变体（默认选项）。

另一个例子

        // Creating aggregations
        SearchResponse<Void> search3 = client.search( b-> b
                .index("products")
                .size(0)
                .aggregations("price-histo", a -> a
                        .histogram(h -> h
                                .field("price")
                                .interval(20.0)
                        )
                ),
                Void.class
        );
 
        long firstBucketCount = search3.aggregations()
                .get("price-histo")
                .histogram()
                .buckets().array()
                .get(0)
                .docCount();
 
        System.out.println("doc count: " + firstBucketCount);
    }

上面的 aggregation 相当于如下的请求：

GET products/_search
{
  "size": 0,
  "aggs": {
    "price-histo": {
      "histogram": {
        "field": "price",
        "interval": 20
      }
    }
  }
}

我们的 Java 代码的输出结果为：

doc count: 2

上面的聚合，我们可以甚至直接使用 JSON 结构的字符串来进行操作：

        String aggstr = "\n" +
           " { \n" +
           "   \"size\": 0, \n" +
           "   \"aggs\": { \n" +
           "     \"price-histo\": {  \n" +
           "       \"histogram\": { \n" +
           "         \"field\": \"price\", \n" +
           "         \"interval\": 20 \n" +
           "       } \n" +
           "     } \n" +
           "   } \n" +
           " } ";
 
        System.out.println("agg is: " + aggstr  );
 
        InputStream agg = new ByteArrayInputStream(aggstr.getBytes());
        SearchResponse<Void> searchAgg = client
                .search(b -> b
                        .index("products")
                        .withJson(agg),
                        Void.class
                );
 
        firstBucketCount = searchAgg.aggregations()
                .get("price-histo")
                .histogram()
                .buckets().array()
                .get(0)
                .docCount();
 
        System.out.println("doc count: " + firstBucketCount);

上面代码显示的结果和之上的结果是一样的：

分组查询

Elasticsearch Java API Client客户端中的分组查询，也是属于聚合查询的一部分，所以同样使用aggregations方法，并使用terms方法来代表分组查询，field传入需要分组的字段，最后通过响应中的aggregations参数来获取，这里需要根据数据的类型来获取最后的分组结果，我这里因为统计的是数字类型，所以调用lterms()使用LongTermsAggregate来获取结果，同理：如果是String类型则调用sterms()使用StringTermsAggregate，最后打印出docCount属性即可。

SearchResponse<Test> response11 = client.search(s -> s
                .index("newapi")
                .size(100)
                .aggregations("ageGroup", a -> a
                        .terms(t -> t
                                .field("age")
                        )
                )
        , Test.class);
        
System.out.println(response11.took());
System.out.println(response11.hits().total().value());

response11.hits().hits().forEach(e -> {
    System.out.println(e.source().toString());
});

Aggregate aggregate = response11.aggregations().get("ageGroup");
LongTermsAggregate lterms = aggregate.lterms();
Buckets<LongTermsBucket> buckets = lterms.buckets();

for (LongTermsBucket b : buckets.array()) {
    System.out.println(b.key() + " : " + b.docCount());
}

过滤器

SourceConfig 提供对包含和排除字段的访问权限。

		SearchResponse<ActivityDocument> search  = client.search(s -> s
						.query(query)
						.source(s1 -> s1
								.filter(v -> v
										.includes("type", "allProdsFlag", "price", "discount", "marketingType", "marketingCalType", "number", "name", "shopId", "pic", "startTime", "endTime", "skuIds", "activityId")
										.excludes(null)
								)
						)
				, ActivityDocument.class);

或者使用of来构建


		SourceConfig sourceConfig = SourceConfig.of(s -> s
				.filter(v -> v
						.includes("type", "allProdsFlag", "price", "discount", "marketingType", "marketingCalType", "number", "name", "shopId", "pic", "startTime", "endTime", "skuIds", "activityId")
						.excludes(null)
				)
		);

		SearchResponse<ActivityDocument> search  = client.search(s -> s
						.query(query)
						.source(sourceConfig)
				, ActivityDocument.class);

参考文章与推荐阅读

https://www.google.com/

https://www.elastic.co/guide/en/elasticsearch/client/java-api-client/current/getting-started-java.html#_indexing_documents

java与es8实战之三：Java API Client有关的知识点串讲

https://juejin.cn/post/7080726607043756045

https://medium.com/search?q=java+api+client

你可能感兴趣的:(elasticsearch,java,学习,笔记,搜索引擎)

华为OD机试 2025B卷 - 士兵过河 (C++ & Python & JAVA & JS & GO) 无限码力华为OD机试真题刷题笔记华为od 华为OD机考2025A卷华为OD2025B卷华为OD机试2025B卷华为OD机考2025B卷
士兵过河2025B卷目录点击查看：华为OD机试2025B卷真题题库目录｜机考题库+算法考点详解华为OD2025B卷200分题型题目描述一支N个士兵的军队正在趁夜色逃亡，途中遇到一条湍急的大河。敌军在T的时长后到达河面，没到过对岸的士兵都会被消灭。现在军队只找到了1只小船，这船最多能同时坐上2个士兵。当1个士兵划船过河，用时为a[i]；0<=i
Spring MVC 架构详解 Java廖志伟 Java场景面试宝典 Spring MVC Web Application Development MVC Architecture
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
AI技术正在深度重构全球产业格局，其影响已超越工具属性，演变为推动行业变革的核心引擎。
一、AI如何重塑AI的工作与行业（AI助手领域）能力升级理解与生成：基于LLM（大语言模型），AI能处理开放式问题、撰写报告、翻译代码，替代部分人类知识工作。个性化交互：通过用户历史对话分析，提供定制化建议（如学习计划、投资策略）。多模态扩展：结合图像/语音识别（如GPT-4V），实现图文分析、医学影像解读等跨模态任务。行业变革客服行业：AI客服处理70%+常规咨询（如阿里小蜜），人力转向复杂问题
如何在 Linux 上使用 cURL 下载文件？| cURL 命令详解 vvw& 开源项目推荐 Linux 技术文章 linux 运维服务器 ubuntu 开源 curl wget
简介如果你正在寻找快速答案，那么curl-O命令可让你使用curl命令行实用程序下载文件。当然，关于使用curl下载文件，除了-O参数之外，还有很多东西需要学习。我们将展示如何使用curl在Linux上下载文件，并提供多个curl下载命令的示例，你可以使用这些命令来满足不同的要求。如果你不熟悉curl，我们建议你通读本文。如果你熟悉curl但只需要快速回顾一下，请随意跳转到特定部分。什么是curl
【论文笔记ing】Pointerformer: Deep Reinforced Multi-Pointer Transformer for the Traveling Salesman Problem Booksort online笔记论文论文阅读 transformer 深度学习
论文中使用一个PointerFormer模型编码器部分：可逆残差模型堆叠解码器部分：指针网络自回归对于一次任务而言，推理阶段：编码器部分：一次解码器部分：循环N次，直至任务结束在训练阶段，使用强化学习，对于一个N个节点的TSP实例，算法中会以不同的起点，跑N次，得到N个轨迹，以满足TSP的对称特性，表示这都是属于一个TSP问题的（真实）解然后会计算这样表示归一化奖励，得到一个advantage,然
【论文笔记】GaussianFusion: Gaussian-Based Multi-Sensor Fusion for End-to-End Autonomous Driving
原文链接：https://arxiv.org/abs/2506.00034v1简介：现有的多传感器融合方法多使用基于注意力的拉直(flatten)融合或通过几何变换的BEV融合，但前者可解释性差，后者计算开销大（如下图(a)(b)所示）。本文提出GaussianFusion（下图(c)），一种基于高斯的多传感器融合框架，用于端到端自动驾驶。使用直观而紧凑的高斯表达，聚合不同传感器的信息。具体来说，
MySQL窗口函数学习小菜0-o mysql 学习 java
视频链接基本语法窗口限定一个范围，它可以理解为满足某些条件的记录集合，窗口函数也就是在窗口范围内执行的函数。基本语法窗口函数有over关键字，指定函数执行的范围，可分为三部分:分组子句(partitionby)，排序子句(orderby)，窗口子句(rows)over(partitionbyorderbyrowsbetweenand)窗口函数适用于在不破坏原有表结构的基础上，新增一列窗口的确定分组
大模型——什么是 Vibe Coding？从零开始学习 AI 辅助编程不二人生大模型学习人工智能大模型辅助编程
大模型——什么是VibeCoding？从零开始学习AI辅助编程VibeCoding：代码消失，直觉驱动的软件开发新浪潮？生成式人工智能的指数级增长正不断重塑各个行业，软件开发领域也不例外。大约在2025年初，一股源自美国硅谷的新思潮开始引起关注：开发者似乎可以借助AI工具，在几乎不直接编写代码的情况下构建产品。这种依赖直觉、跳脱传统编码苦役的开发方式，被赋予了一个颇具时代感的名字——VibeCod
仓颉编程语言：从入门到精通
为啥要瞅瞅仓颉这玩意儿？有一说一，现在的编程语言多得跟米一样，对吧？那一门新语言想火，没点绝活儿肯定不行。仓颉（Cangjie）这哥们儿，是华为搞出来的新玩意儿，静态编译的，主打的就是一个现代化、性能炸裂、安全感满满，而且天生就会搞并发。就凭这几点，已经有不少大佬开始关注了。这篇博客呢，就是你的“老司机”指南，带你把仓颉这车开得明明白白。不管你是刚上路的小白，还是开惯了Rust、Go、Java、N
【无标题】Python ---Day2 复合类型之序列类型、映射类型和集合类型的学习！！！
系列文章目录文章目录系列文章目录前言一、复合类型初识1.1列表类型1.1.1列表创建1.1.2列表运算1.1.3列表访问1.1.3.1索引1.1.3.2反向索引1.1.3.3切片1.1.4列表操作1.1.4.1添加数据1.1.4.2修改数据1.1.4.3删除数据1.2元组类型1.2.1元组创建1.2.2元组操作1.2.2.2查看元组1.2.2.3解包技能1.2.3元组运算1.2.4元组不可变二、映
脑电分析入门指南：信号处理、特征提取与机器学习 Ao000000 信号处理机器学习人工智能
脑电分析入门指南一、为什么要研究脑电1.课题目标（解决什么问题）2.输入与输出二、脑电分析的整体流程三、每一步详解1.数据采集2.预处理3.特征提取4.特征选择/降维5.分类与识别四、研究过程中遇到的挑战与解决方法五、学习感受一、为什么要研究脑电1.课题目标（解决什么问题）本课题旨在通过对脑电（EEG）的采集与分析，提取有用的神经信息，实现对某类脑状或行为的识别/预测/评估。例如：情绪识别、疾病诊
java组件化设计_构建之路—谈谈组件化后端构建和实现
前言这一篇文章，准备了很久，构思了很久，草稿了很久。从个人编程至今，历经了C，C++，Java，到现如今的NodeJS。也后端到前端，再回到后端。更从学校里的学生信息管理系统到大型商业系统构建，是的，我曾一直以为编程也就是如此了，由瀑布模型，敏捷开发，设计模式等等组成的软件工程大致就是如此了。相信可能很多人也会有和我类似的想法，是否也都曾迷茫过？幸运的是，伴随着对前端的接触和深入，云雾散开。前端组
【动手学深度学习】4.10 实战Kaggle比赛：预测房价 XiaoJ1234567 《动手学深度学习》深度学习人工智能
目录4.10实战Kaggle比赛：预测房价1）数据预处理2）模型定义与训练3）模型评估与预测4）模型训练与预测提交5）示例超参数（可调）4.10实战Kaggle比赛：预测房价数据来源：Kaggle房价预测比赛.1）数据预处理读取数据importpandasaspdtrain_data=pd.read_csv('../data/kaggle_house_pred_train.csv')test_da
【机器学习-08】参数调优宝典：网格搜索与贝叶斯搜索等攻略云天徽上机器学习机器学习人工智能
博主简介：曾任某智慧城市类企业算法总监，目前在美国市场的物流公司从事高级算法工程师一职，深耕人工智能领域，精通python数据挖掘、可视化、机器学习等，发表过AI相关的专利并多次在AI类比赛中获奖。CSDN人工智能领域的优质创作者，提供AI相关的技术咨询、项目开发和个性化解决方案等服务，如有需要请站内私信或者联系任意文章底部的的VX名片（ID：xf982831907）博主粉丝群介绍：①群内初中生、
KTO（Kahneman-Tversky Optimization）技术详解与工程实现 DK_Allen 大模型深度学习 pytorch 人工智能 KTO
KTO（Kahneman-TverskyOptimization）技术详解与工程实现一、KTO核心思想KTO是基于行为经济学前景理论（ProspectTheory）的偏好优化方法，突破传统偏好学习需要成对数据的限制，仅需单样本绝对标注（好/坏）即可优化模型。其创新性在于：损失函数设计：将人类对"收益"和"损失"的非对称心理反应量化数据效率：无需构建偏好对（y_w>y_l），直接利用松散标注二、KT
NLP-D7-李宏毅机器学习---X-Attention&&GAN&BERT&GPT 甄小胖机器学习自然语言处理机器学习 bert
—0521今天4:30就起床了！真的是迫不及待想看新的课程！！！昨天做人脸识别系统的demo查资料的时候，发现一个北理的大四做cv的同学，差距好大！！！我也要努力呀！！不是比较，只是别人可以做到这个程度，我也一定可以！！！要向他学习！！！开始看课程啦！-----0753看完了各种attention，由于attention自己计算的限制，当N很大的时候会产生计算速度问题，从各种不同角度（人工知识输入
如何安装JavaFX dingdingfish Java Java JavaFX
JavaFX的官方网站在这里，从JDK11开始，javaFX未包含在JDK中。安装过程如下：安装JDK，本例为JDK11，下载地址。下载JavaFX11，下载地址。安装JavaFX11首先找到当前SDK的路径->/usr/java/jdk-11.0.4：#whichjavac/bin/javac#ls-ljavaclrwxrwxrwx.1rootroot23Aug1911:09javac->/et
PostgreSQL 16 Administration Cookbook 读书笔记：第1章 First Steps
本章为PostgreSQL简介及如何用psql和pgAdminGUI连接PostgreSQL。1.PostgreSQL16简介开源，低TCO，30多年持续开发，符合SQL:2023标准，高度可扩展，多模。1.1PostgreSQL有何不同？PostgreSQL的功能集与Oracle或SQLServer的相似度比与MySQL更高。PostgreSQL知名用户包括苹果、巴斯夫、基因泰克、Heroku、
大型语言模型中的提示工程系统综述：技术与应用 AI专题精讲 Paper阅读语言模型人工智能自然语言处理
摘要提示工程已成为扩展大型语言模型（LLMs）和视觉语言模型（VLMs）能力的不可或缺的技术。这种方法利用任务特定的指令（称为prompt），在不修改核心模型参数的情况下增强模型效能。与更新模型参数不同，prompt仅通过给定指令即可引出所需的模型行为，从而实现预训练模型在下游任务中的无缝集成。prompt可以是提供上下文以引导模型的自然语言指令，也可以是激活相关知识的学习向量表示。这一新兴领域已
JavaSE的集合（Collection） pkhlll java
集合主要分为两大系列：Collection和MapCollection：Collection的子接口有Set、List、QueueCollection是层次结构的根接口，是所有单列集合的父接口，在Collection中定义了单列集合(List和Set)的通用的一些方法：1、添加元素（1）add(Eobj)：添加元素对象到当前集合中（2）addAll(Collectionother)：添加other
排序的艺术：Spring Data JPA 如何玩转关联实体排序 (. 运算符的奥秘) ✨ 小丁学Java Spring Data JPA jpa
这次我们来深入探讨SpringDataJPA分页排序中一个非常实用但又容易混淆的技巧：如何优雅地对关联实体（或嵌套属性）进行排序。排序的艺术：SpringDataJPA如何玩转关联实体排序(.运算符的奥秘)你好，我是坚持哥！在构建Web应用时，分页查询是家常便饭。SpringDataJPA(JavaPersistenceAPI)提供了强大的Pageable接口，让分页和排序变得异常简单。但当你的排
【2025B卷专题】华为OD机试2025B卷统一考试题库清单，时间紧张就刷这个
专栏导读本专栏收录于《华为OD机试（JAVA）真题（B卷+A卷+C卷+D卷+E卷）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新，全天CSDN在线答疑。2025年5月12日，华为官方已经将华为OD机试（A卷）切换为B卷。目前正在考的是B卷，按照华
【全网首发】华为OD机试 2025B卷机考真题库清单（全真题库）含考点说明哪吒搬砖工逆袭Java架构师华为od java 2025B卷华为OD机试
专栏导读本专栏收录于《华为OD机试（JAVA）真题（E卷+D卷+A卷+B卷+C卷）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新，全天CSDN在线答疑。2025年5月12日，华为官方已经将华为OD机试（A卷）切换为B卷。目前正在考的是B卷，按照华
【2025B卷首发】华为OD机试真题+全流程解析+备考攻略+经验分享+Java最佳实现
专栏导读本专栏收录于《华为OD机试（JAVA）真题（E卷+D卷+A卷+B卷+C卷）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新，全天CSDN在线答疑。2025年5月12日，华为官方已经将华为OD机试（A卷）切换为B卷。目前正在考的是B卷，按照华
[C语言初阶]指针初阶
目录一、指针是什么？二、指针与指针类型三、野指针及其避免方法3.1什么是野指针？3.2野指针产生的原因：3.3如何避免野指针？四、指针运算4.1应用：实现strlen函数五、指针与数组六、二级指针七、指针数组指针是C语言的灵魂所在，也是许多初学者感到困惑的概念。本文将带你系统学习指针的基础知识，从指针的本质到指针运算，再到指针与数组的关系，最后介绍二级指针和指针数组的概念。通过本文的学习，你将建立
PyTorch 在 Python 自然语言处理中的运用 Python编程之道 Python编程之道 python pytorch 自然语言处理 ai
PyTorch在Python自然语言处理中的运用关键词：PyTorch，Python，自然语言处理，深度学习，文本分类，情感分析摘要：本文全面探讨了PyTorch在Python自然语言处理（NLP）领域的运用。首先介绍了相关背景知识，包括目的范围、预期读者等内容。接着详细阐述了核心概念，如词嵌入、循环神经网络等，并给出了相应的原理示意图和流程图。深入讲解了核心算法原理，结合Python代码进行详细
java 同步redis到mysql_Yii2 redis同步数据到mysql 兰艳知己 java 同步redis到mysql
将redis数据写入mysql中：本次案例讲解将如何将商城中商品浏览次数通过缓存记录并写入mysql中具体的redis安装过程暂且就省略了.....一、安装redis插件|配置rediscomposerrequireyiisoft/yii2-redis找到common的config文件，在components下加入redis配置参数'redis'=>['class'=>'yii\redis\Con
linux环境下tomcat安装 M.za linux tomcat 运维服务器
Tomcat一、什么是Tomcat？1.1、Tomcat介绍Tomcat又叫ApacheTomcat最早是sun公司开发的，1999年捐献给apache基金会，隶属于雅加达项目，现在已经独立成一个顶级项目，因为tomcat技术先进，性能稳定，又是一个开源的web应用服务器，所以很多企业都在使用，很多Java开发者也在使用，开发调试jsp的首选，被更多企业用于Java容器。Tomcat官网：http
蓝牙协议栈低功耗之安全管理协议层(SMP) 写代码的无赖的猴子 BLE低功耗蓝牙协议栈网络信息与通信物联网
逻辑链路控制和适配协议层L2CAPSMP层阶段一阶段二Legacyparing安全连接交换公匙鉴权阶段1鉴权阶段2阶段三LElegacypairing：LESecureConnections交叉密匙特性配对PDU类型Hello，我是无赖的猴子，一个蓝牙爱好者，分享蓝牙相关的知识，关注我，学习蓝牙：蓝牙文章链接直达：1.profile层（待更新）2.属性协议层(ATT)（待更新）3.安全管理协议层(
在实训云平台上配置云主机酒城译痴无心剑 Spark基础学习笔记（2）实训云云主机远程连接
文章目录零、学习目标一、实训云升级二、实训云登录（一）登录实训云（二）切换界面语言（三）规划云主机实例三、创建网络三、创建路由器四、连接子网五、创建虚拟网卡六、管理安全组规则七、创建云主机（一）云主机规划（二）创建ied云主机（三）创建其它云主机八、本机利用FinalShell连接虚拟机（一）连接ied云主机（二）连接其它云主机九、配置云主机（一）配置ied云主机1、查看IP地址2、配置主机名3、
java杨辉三角 3213213333332132 java基础
package com.algorithm; /** * @Description 杨辉三角 * @author FuJianyong * 2015-1-22上午10:10:59 */ public class YangHui { public static void main(String[] args) { //初始化二维数组长度 int[][] y
《大话重构》之大布局的辛酸历史白糖_ 重构
《大话重构》中提到“大布局你伤不起”，如果企图重构一个陈旧的大型系统是有非常大的风险，重构不是想象中那么简单。我目前所在公司正好对产品做了一次“大布局重构”，下面我就分享这个“大布局”项目经验给大家。背景公司专注于企业级管理产品软件，企业有大中小之分，在2000年初公司用JSP/Servlet开发了一套针对中
电驴链接在线视频播放源码 dubinwei 源码电驴播放器视频 ed2k
本项目是个搜索电驴（ed2k）链接的应用,借助于磁力视频播放器（官网： http://loveandroid.duapp.com/ 开放平台），可以实现在线播放视频，也可以用迅雷或者其他下载工具下载。项目源码： http://git.oschina.net/svo/Emule,动态更新。也可从附件中下载。项目源码依赖于两个库项目，库项目一链接： http://git.oschina.
Javascript中函数的toString()方法周凡杨 JavaScript js toString function object
简述 The toString() method returns a string representing the source code of the function. 简译之，Javascript的toString()方法返回一个代表函数源代码的字符串。句法 function.
struts处理自定义异常 g21121 struts
很多时候我们会用到自定义异常来表示特定的错误情况，自定义异常比较简单，只要分清是运行时异常还是非运行时异常即可，运行时异常不需要捕获，继承自RuntimeException，是由容器自己抛出，例如空指针异常。非运行时异常继承自Exception，在抛出后需要捕获，例如文件未找到异常。此处我们用的是非运行时异常，首先定义一个异常LoginException: /** * 类描述：登录相
Linux中find常见用法示例 510888780 linux
Linux中find常见用法示例 ·find path -option [ -print ] [ -exec -ok command ] {} \; find命令的参数；
SpringMVC的各种参数绑定方式 Harry642 springMVC 绑定表单
1. 基本数据类型(以int为例，其他类似)： Controller代码： @RequestMapping("saysth.do") public void test(int count) { } 表单代码： <form action="saysth.do" method="post&q
Java 获取Oracle ROWID aijuans java oracle
A ROWID is an identification tag unique for each row of an Oracle Database table. The ROWID can be thought of as a virtual column, containing the ID for each row. The oracle.sql.ROWID class i
java获取方法的参数名 antlove java jdk parameter method reflect
reflect.ClassInformationUtil.java package reflect; import javassist.ClassPool; import javassist.CtClass; import javassist.CtMethod; import javassist.Modifier; import javassist.bytecode.CodeAtt
JAVA正则表达式匹配查找替换提取操作百合不是茶 java 正则表达式替换提取查找
正则表达式的查找;主要是用到String类中的split(); String str; str.split();方法中传入按照什么规则截取,返回一个String数组常见的截取规则: str.split("\\.")按照.来截取 str.
Java中equals()与hashCode()方法详解 bijian1013 java set equals()hashCode()
一.equals()方法详解 equals()方法在object类中定义如下： public boolean equals(Object obj) { return (this == obj); } 很明显是对两个对象的地址值进行的比较（即比较引用是否相同）。但是我们知道，String 、Math、I
精通Oracle10编程SQL(4)使用SQL语句 bijian1013 oracle 数据库 plsql
--工资级别表 create table SALGRADE ( GRADE NUMBER(10), LOSAL NUMBER(10,2), HISAL NUMBER(10,2) ) insert into SALGRADE values(1,0,100); insert into SALGRADE values(2,100,200); inser
【Nginx二】Nginx作为静态文件HTTP服务器 bit1129 HTTP服务器
Nginx作为静态文件HTTP服务器在本地系统中创建/data/www目录，存放html文件(包括index.html) 创建/data/images目录，存放imags图片在主配置文件中添加http指令 http { server { listen 80; server_name
kafka获得最新partition offset blackproof kafka partition offset 最新
kafka获得partition下标，需要用到kafka的simpleconsumer import java.util.ArrayList; import java.util.Collections; import java.util.Date; import java.util.HashMap; import java.util.List; import java.
centos 7安装docker两种方式 ronin47
第一种是采用yum 方式 yum install -y docker
java-60-在O(1)时间删除链表结点 bylijinnan java
public class DeleteNode_O1_Time { /** * Q 60 在O(1)时间删除链表结点 * 给定链表的头指针和一个结点指针(!!)，在O(1)时间删除该结点 * * Assume the list is: * head->...->nodeToDelete->mNode->nNode->..
nginx利用proxy_cache来缓存文件 cfyme cache
user zhangy users; worker_processes 10; error_log /var/vlogs/nginx_error.log crit; pid /var/vlogs/nginx.pid; #Specifies the value for ma
[JWFD开源工作流]JWFD嵌入式语法分析器负号的使用问题 comsci 嵌入式
假如我们需要用JWFD的语法分析模块定义一个带负号的方程式，直接在方程式之前添加负号是不正确的，而必须这样做： string str01 = "a=3.14;b=2.71;c=0;c-((a*a)+(b*b))" 定义一个0整数c,然后用这个整数c去
如何集成支付宝官方文档 dai_lm android
官方文档下载地址 https://b.alipay.com/order/productDetail.htm?productId=2012120700377310&tabId=4#ps-tabinfo-hash 集成的必要条件 1. 需要有自己的Server接收支付宝的消息 2. 需要先制作app，然后提交支付宝审核，通过后才能集成调试的时候估计会真的扣款，请注意
应该在什么时候使用Hadoop datamachine hadoop
原帖地址：http://blog.chinaunix.net/uid-301743-id-3925358.html 存档，某些观点与我不谋而合，过度技术化不可取，且hadoop并非万能。 --------------------------------------------万能的分割线-------------------------------- 有人问我，“你在大数据和Hado
在GridView中对于有外键的字段使用关联模型进行搜索和排序 dcj3sjt126com yii
在GridView中使用关联模型进行搜索和排序首先我们有两个模型它们直接有关联: class Author extends CActiveRecord { ... } class Post extends CActiveRecord { ... function relations() { return array( '
使用NSString 的格式化大全 dcj3sjt126com Objective-C
格式定义The format specifiers supported by the NSString formatting methods and CFString formatting functions follow the IEEE printf specification; the specifiers are summarized in Table 1. Note that you c
使用activeX插件对象object滚动有重影蕃薯耀 activeX插件滚动有重影
使用activeX插件对象object滚动有重影 <object style="width:0;" id="abc" classid="CLSID:D3E3970F-2927-9680-BBB4-5D0889909DF6" codebase="activex/OAX339.CAB#
SpringMVC4零配置 hanqunfeng springmvc4
基于Servlet3.0规范和SpringMVC4注解式配置方式，实现零xml配置，弄了个小demo，供交流讨论。项目说明如下： 1.db.sql是项目中用到的表，数据库使用的是oracle11g 2.该项目使用mvn进行管理，私服为自搭建nexus,项目只用到一个第三方 jar，就是oracle的驱动； 3.默认项目为零配置启动，如果需要更改启动方式，请
《开源框架那点事儿16》：缓存相关代码的演变 j2eetop 开源框架
问题引入上次我参与某个大型项目的优化工作，由于系统要求有比较高的TPS，因此就免不了要使用缓冲。该项目中用的缓冲比较多，有MemCache，有Redis，有的还需要提供二级缓冲，也就是说应用服务器这层也可以设置一些缓冲。当然去看相关实现代代码的时候，大致是下面的样子。 [java] view plain copy print ? public vo
AngularJS浅析 kvhur JavaScript
概念 AngularJS is a structural framework for dynamic web apps. 了解更多详情请见原文链接：http://www.gbtags.com/gb/share/5726.htm Directive 扩展html，给html添加声明语句，以便实现自己的需求。对于页面中html元素以ng为前缀的属性名称，ng是angular的命名空间
架构师之jdk的bug排查(一)---------------split的点号陷阱 nannan408 split
1.前言. jdk1.6的lang包的split方法是有bug的,它不能有效识别A.b.c这种类型,导致截取长度始终是0.而对于其他字符,则无此问题.不知道官方有没有修复这个bug. 2.代码 String[] paths = "object.object2.prop11".split("'"); System.ou
如何对10亿数据量级的mongoDB作高效的全表扫描 quentinXXZ mongodb
本文链接: http://quentinXXZ.iteye.com/blog/2149440 一、正常情况下，不应该有这种需求首先，大家应该有个概念，标题中的这个问题，在大多情况下是一个伪命题，不应该被提出来。要知道，对于一般较大数据量的数据库，全表查询，这种操作一般情况下是不应该出现的，在做正常查询的时候，如果是范围查询，你至少应该要加上limit。说一下，
C语言算法之水仙花数 qiufeihu c 算法
/** * 水仙花数 */ #include <stdio.h> #define N 10 int main() { int x,y,z; for(x=1;x<=N;x++) for(y=0;y<=N;y++) for(z=0;z<=N;z++) if(x*100+y*10+z == x*x*x
JSP指令 wyzuomumu jsp
jsp指令的一般语法格式： <%@ 指令名属性 =”值 ” %> 常用的三种指令： page,include,taglib page指令语法形式： <%@ page 属性 1=”值 1” 属性 2=”值 2”%> include指令语法形式： <%@include file=”relative url”%> (jsp可以通过 include