本文介绍了如何使用Java High level API 完成dense_vector类型向量的写入,内容包含了单个文档的索引和批量文档的索引。
PUT caster_vector1
{
"settings": {
"number_of_replicas": 0,
"number_of_shards": 2
},
"mappings": {
"properties": {
"my_vector": {
"type": "dense_vector",
"dims": 2
},
"my_text": {
"type": "text"
}
}
}
}
package com.example.elasticsearchdemo;
import org.apache.http.HttpHost;
import org.elasticsearch.action.index.IndexRequest;
import org.elasticsearch.action.index.IndexResponse;
import org.elasticsearch.client.RequestOptions;
import org.elasticsearch.client.RestClient;
import org.elasticsearch.client.RestHighLevelClient;
import java.io.IOException;
import java.util.HashMap;
import java.util.Map;
public class IndexDoc {
public static void main(String[] args) throws IOException {
// 创建一个RestHighLevelClient对象
RestHighLevelClient client = new RestHighLevelClient(
RestClient.builder(new HttpHost("192.168.209.3", 9200, "http")));
// 定义索引名称和类型名称
String indexName = "caster_vector1";
String typeName = "_doc";
// 定义文档数据
Map<String, Object> document = new HashMap<>();
document.put("my_text", "text8 window");
document.put("my_vector", new double[]{1, -1});
// 创建IndexRequest对象并设置索引名称、类型名称和文档数据
IndexRequest indexRequest = new IndexRequest(indexName, typeName).source(document);
// 执行索引操作
try {
IndexResponse indexResponse = client.index(indexRequest, RequestOptions.DEFAULT);
System.out.println(indexResponse.toString());
} catch (IOException e) {
e.printStackTrace();
}
// 关闭RestHighLevelClient对象
client.close();
}
}
在这个案例中,我们首先创建了一个RestHighLevelClient对象,并定义了索引名称和类型名称。然后,我们定义了文档数据,并使用Map对象来保存键值对。
接着,我们创建了一个IndexRequest对象,并通过它设置了索引名称、类型名称和文档数据。
最后,我们执行了索引操作,并输出了响应结果。如果索引成功,将会输出类似如下的信息:
IndexResponse[index=caster_vector1,type=_doc,id=hM43cYgBJNRf0nv1W09p,version=1,result=created,seqNo=6,primaryTerm=1,shards={"total":1,"successful":1,"failed":0}]
package com.example.elasticsearchdemo;
import org.apache.http.HttpHost;
import org.elasticsearch.action.bulk.BulkItemResponse;
import org.elasticsearch.action.bulk.BulkRequest;
import org.elasticsearch.action.bulk.BulkResponse;
import org.elasticsearch.action.index.IndexRequest;
import org.elasticsearch.action.index.IndexResponse;
import org.elasticsearch.client.RequestOptions;
import org.elasticsearch.client.RestClient;
import org.elasticsearch.client.RestHighLevelClient;
import java.io.IOException;
import java.util.ArrayList;
import java.util.HashMap;
import java.util.List;
import java.util.Map;
public class BatchIndexDoc {
public static void main(String[] args) throws IOException {
// 创建一个RestHighLevelClient对象
RestHighLevelClient client = new RestHighLevelClient(
RestClient.builder(new HttpHost("192.168.209.3", 9200, "http")));
// 定义索引名称和类型名称
String indexName = "caster_vector1";
String typeName = "_doc";
// 创建BulkRequest对象
BulkRequest bulkRequest = new BulkRequest();
// 定义要插入的文档数据
List<Map<String, Object>> documents = new ArrayList<>();
Map<String, Object> document1 = new HashMap<>();
document1.put("my_text","text8 window");
document1.put("my_vector", new double[]{1, -1});
documents.add(document1);
Map<String, Object> document2 = new HashMap<>();
document2.put("my_text","another text");
document2.put("my_vector", new double[]{-1, 1});
documents.add(document2);
// 循环遍历文档数据,将每个文档添加到BulkRequest对象中
for (Map<String, Object> document : documents) {
IndexRequest indexRequest = new IndexRequest(indexName, typeName).source(document);
bulkRequest.add(indexRequest);
}
// 执行批量索引操作
try {
BulkResponse bulkResponse = client.bulk(bulkRequest, RequestOptions.DEFAULT);
if (bulkResponse.hasFailures()) {
for (BulkItemResponse item : bulkResponse.getItems()) {
if (item.isFailed()) {
System.out.println(item.getFailureMessage());
}
}
} else {
System.out.println("All documents have been indexed.");
}
} catch (IOException e) {
e.printStackTrace();
}
// 关闭RestHighLevelClient对象
client.close();
}
}
在这个案例中,我们首先创建了一个RestHighLevelClient对象,并定义了索引名称和类型名称。然后,我们定义了要插入的文档数据,并使用List
接着,我们创建了一个BulkRequest对象,并循环遍历文档数据,将每个文档添加到BulkRequest对象中。我们执行了批量索引操作,并处理了响应结果。如果有索引失败的文档,我们将输出其错误信息,否则输出所有文档均已索引成功的信息。
最后,我们关闭了RestHighLevelClient对象。