zzc1684

Java搜索工具——Lucene实例总结(一)

参考网页：http://footman265.iteye.com/blog/849744

搞了一天半，终于利用lucene工具Demo完了我想要的功能，这其中包括为数据库建立增量索引、从索引文件根据id删除索引、单字段查询功能、多字段查询功能、多条件查询功能以及查询结果关键字高亮显示的功能。今天晚些的时候把这些功能进行了整理。看样子一时半会还下不了班，就把Demo的结果一一列举下来吧。。。

理论参考：http://lianj-lee.iteye.com/category/69005?show_full=true

Lucene3.0对数据库建立索引：http://269181927.iteye.com/blog/789779

1. 所需要的文件(见附件)

依赖包：

lucene-core-2.4.0.jar lucene工具包

lucene-highlighter-2.4.0.jar 高亮显示工具包

IKAnalyzer2.0.2OBF.jar 分词工具(支持字典分词)

mysql-connector-java-5.0.3-bin 链接mysql驱动

数据表：

pd_ugc.sql(所在数据库为lucenetest)

类文件：

在附件index.rar和test.rar，解压后放入java工程中的src下即可

2. 为数据库建立增量索引

参考网页：http://www.blogjava.net/laoding/articles/279230.html

Java代码

package index;
//--------------------- Change Logs----------------------
// <p>@author zhiqiang.zhang Initial Created at 2010-12-23<p>
//-------------------------------------------------------
import java.io.BufferedReader;
import java.io.File;
import java.io.FileReader;
import java.io.FileWriter;
import java.io.IOException;
import java.io.PrintWriter;
import java.sql.Connection;
import java.sql.DriverManager;
import java.sql.ResultSet;
import java.sql.Statement;
import java.util.Date;
import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apache.lucene.document.Document;
import org.apache.lucene.document.Field;
import org.apache.lucene.index.IndexWriter;
//增量索引
/*
* 实现思路:首次查询数据库表所有记录，对每条记录建立索引，并将最后一条记录的id存储到storeId.txt文件中
* 当新插入一条记录时，再建立索引时不必再对所有数据重新建一遍索引，
* 可根据存放在storeId.txt文件中的id查出新插入的数据，只对新增的数据新建索引，并把新增的索引追加到原来的索引文件中
* */
public class IncrementIndex {
public static void main(String[] args) {
try {
IncrementIndex index = new IncrementIndex();
String path = "E:\\workspace2\\Test\\lucene_test\\poiIdext";//索引文件的存放路径
String storeIdPath = "E:\\workspace2\\Test\\lucene_test\\storeId.txt";//存储ID的路径
String storeId = "";
Date date1 = new Date();
storeId = index.getStoreId(storeIdPath);
ResultSet rs = index.getResult(storeId);
System.out.println("开始建立索引。。。。");
index.indexBuilding(path, storeIdPath, rs);
Date date2 = new Date();
System.out.println("耗时："+(date2.getTime()-date1.getTime())+"ms");
storeId = index.getStoreId(storeIdPath);
System.out.println(storeId);//打印出这次存储起来的ID
} catch (Exception e) {
e.printStackTrace();
}
}
public static void buildIndex(String indexFile, String storeIdFile) {
try {
String path = indexFile;//索引文件的存放路径
String storeIdPath = storeIdFile;//存储ID的路径
String storeId = "";
storeId = getStoreId(storeIdPath);
ResultSet rs = getResult(storeId);
indexBuilding(path, storeIdPath, rs);
storeId = getStoreId(storeIdPath);
System.out.println(storeId);//打印出这次存储起来的ID
} catch (Exception e) {
e.printStackTrace();
}
}
public static ResultSet getResult(String storeId) throws Exception {
Class.forName("com.mysql.jdbc.Driver").newInstance();
String url = "jdbc:mysql://localhost:3306/lucenetest";
String userName = "root";
String password = "****";
Connection conn = DriverManager.getConnection(url, userName, password);
Statement stmt = conn.createStatement();
String sql = "select * from pd_ugc";
ResultSet rs = stmt.executeQuery(sql + " where id > '" + storeId + "'order by id");
return rs;
}
public static boolean indexBuilding(String path, String storeIdPath, ResultSet rs) {
try {
Analyzer luceneAnalyzer = new StandardAnalyzer();
// 取得存储起来的ID，以判定是增量索引还是重新索引
boolean isEmpty = true;
try {
File file = new File(storeIdPath);
if (!file.exists()) {
file.createNewFile();
}
FileReader fr = new FileReader(storeIdPath);
BufferedReader br = new BufferedReader(fr);
if (br.readLine() != null) {
isEmpty = false;
}
br.close();
fr.close();
} catch (IOException e) {
e.printStackTrace();
}
//isEmpty=false表示增量索引
IndexWriter writer = new IndexWriter(path, luceneAnalyzer, isEmpty);
String storeId = "";
boolean indexFlag = false;
String id;
String name;
String address;
String citycode;
while (rs.next()) {
id = rs.getInt("id") + "";
name = rs.getString("name");
address = rs.getString("address");
citycode = rs.getString("citycode");
writer.addDocument(Document(id, name, address, citycode));
storeId = id;//将拿到的id给storeId，这种拿法不合理，这里为了方便
indexFlag = true;
}
writer.optimize();
writer.close();
if (indexFlag) {
// 将最后一个的ID存到磁盘文件中
writeStoreId(storeIdPath, storeId);
}
return true;
} catch (Exception e) {
e.printStackTrace();
System.out.println("出错了" + e.getClass() + "\n 错误信息为: " + e.getMessage());
return false;
}
}
public static Document Document(String id, String name, String address, String citycode) {
Document doc = new Document();
doc.add(new Field("id", id, Field.Store.YES, Field.Index.TOKENIZED));
doc.add(new Field("name", name, Field.Store.YES, Field.Index.TOKENIZED));//查询字段
doc.add(new Field("address", address, Field.Store.YES, Field.Index.TOKENIZED));
doc.add(new Field("citycode", citycode, Field.Store.YES, Field.Index.TOKENIZED));//查询字段
return doc;
}
// 取得存储在磁盘中的ID
public static String getStoreId(String path) {
String storeId = "";
try {
File file = new File(path);
if (!file.exists()) {
file.createNewFile();
}
FileReader fr = new FileReader(path);
BufferedReader br = new BufferedReader(fr);
storeId = br.readLine();
if (storeId == null || storeId == "") storeId = "0";
br.close();
fr.close();
} catch (Exception e) {
e.printStackTrace();
}
return storeId;
}
// 将ID写入到磁盘文件中
public static boolean writeStoreId(String path, String storeId) {
boolean b = false;
try {
File file = new File(path);
if (!file.exists()) {
file.createNewFile();
}
FileWriter fw = new FileWriter(path);
PrintWriter out = new PrintWriter(fw);
out.write(storeId);
out.close();
fw.close();
b = true;
} catch (IOException e) {
e.printStackTrace();
}
return b;
}
}

3. 索引操作

Java代码

package index;
import java.io.IOException;
import java.io.Reader;
import java.io.StringReader;
import java.util.ArrayList;
import java.util.Date;
import java.util.List;
import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.analysis.StopFilter;
import org.apache.lucene.analysis.Token;
import org.apache.lucene.analysis.TokenStream;
import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apache.lucene.document.Document;
import org.apache.lucene.index.CorruptIndexException;
import org.apache.lucene.index.IndexReader;
import org.apache.lucene.index.Term;
import org.apache.lucene.queryParser.MultiFieldQueryParser;
import org.apache.lucene.queryParser.ParseException;
import org.apache.lucene.queryParser.QueryParser;
import org.apache.lucene.search.BooleanClause;
import org.apache.lucene.search.BooleanQuery;
import org.apache.lucene.search.Hits;
import org.apache.lucene.search.IndexSearcher;
import org.apache.lucene.search.Query;
import org.apache.lucene.search.ScoreDoc;
import org.apache.lucene.search.TopDocCollector;
import org.apache.lucene.search.highlight.Highlighter;
import org.apache.lucene.search.highlight.QueryScorer;
import org.apache.lucene.search.highlight.SimpleFragmenter;
import org.apache.lucene.search.highlight.SimpleHTMLFormatter;
import org.mira.lucene.analysis.IK_CAnalyzer;
public class IndexUtils {
//0. 创建增量索引
public static void buildIndex(String indexFile, String storeIdFile) {
IncrementIndex.buildIndex(indexFile, storeIdFile);
}
//1. 单字段查询
@SuppressWarnings("deprecation")
public static List<IndexResult> queryByOneKey(IndexSearcher indexSearcher, String field,
String key) {
try {
Date date1 = new Date();
QueryParser queryParser = new QueryParser(field, new StandardAnalyzer());
Query query = queryParser.parse(key);
Hits hits = indexSearcher.search(query);
Date date2 = new Date();
System.out.println("耗时：" + (date2.getTime() - date1.getTime()) + "ms");
List<IndexResult> list = new ArrayList<IndexResult>();
for (int i = 0; i < hits.length(); i++) {
list.add(getIndexResult(hits.doc(i)));
}
return list;
} catch (ParseException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}
return null;
}
//2. 多条件查询。这里实现的是and操作
//注：要查询的字段必须是index的
//即doc.add(new Field("pid", rs.getString("pid"), Field.Store.YES,Field.Index.TOKENIZED));
@SuppressWarnings("deprecation")
public static List<IndexResult> queryByMultiKeys(IndexSearcher indexSearcher, String[] fields,
String[] keys) {
try {
BooleanQuery m_BooleanQuery = new BooleanQuery();
if (keys != null && keys.length > 0) {
for (int i = 0; i < keys.length; i++) {
QueryParser queryParser = new QueryParser(fields[i], new StandardAnalyzer());
Query query = queryParser.parse(keys[i]);
m_BooleanQuery.add(query, BooleanClause.Occur.MUST);//and操作
}
Hits hits = indexSearcher.search(m_BooleanQuery);
List<IndexResult> list = new ArrayList<IndexResult>();
for (int i = 0; i < hits.length(); i++) {
list.add(getIndexResult(hits.doc(i)));
}
return list;
}
} catch (ParseException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}
return null;
}
//3.高亮显示实现了单条件查询
//可改造为多条件查询
public static List<IndexResult> highlight(IndexSearcher indexSearcher, String key) {
try {
QueryParser queryParser = new QueryParser("name", new StandardAnalyzer());
Query query = queryParser.parse(key);
TopDocCollector collector = new TopDocCollector(800);
indexSearcher.search(query, collector);
ScoreDoc[] hits = collector.topDocs().scoreDocs;
Highlighter highlighter = null;
SimpleHTMLFormatter simpleHTMLFormatter = new SimpleHTMLFormatter("<font color='red'>",
"</font>");
highlighter = new Highlighter(simpleHTMLFormatter, new QueryScorer(query));
highlighter.setTextFragmenter(new SimpleFragmenter(200));
List<IndexResult> list = new ArrayList<IndexResult>();
Document doc;
for (int i = 0; i < hits.length; i++) {
//System.out.println(hits[i].score);
doc = indexSearcher.doc(hits[i].doc);
TokenStream tokenStream = new StandardAnalyzer().tokenStream("name",
new StringReader(doc.get("name")));
IndexResult ir = getIndexResult(doc);
ir.setName(highlighter.getBestFragment(tokenStream, doc.get("name")));
list.add(ir);
}
return list;
} catch (ParseException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}
return null;
}
//4. 多字段查询
@SuppressWarnings("deprecation")
public static List<IndexResult> queryByMultiFileds(IndexSearcher indexSearcher,
String[] fields, String key) {
try {
MultiFieldQueryParser mfq = new MultiFieldQueryParser(fields, new StandardAnalyzer());
Query query = mfq.parse(key);
Hits hits = indexSearcher.search(query);
List<IndexResult> list = new ArrayList<IndexResult>();
for (int i = 0; i < hits.length(); i++) {
list.add(getIndexResult(hits.doc(i)));
}
return list;
} catch (ParseException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}
return null;
}
//5. 删除索引
public static void deleteIndex(String indexFile, String id) throws CorruptIndexException,
IOException {
IndexReader indexReader = IndexReader.open(indexFile);
indexReader.deleteDocuments(new Term("id", id));
indexReader.close();
}
//6. 一元分词
@SuppressWarnings("deprecation")
public static String Standard_Analyzer(String str) {
Analyzer analyzer = new StandardAnalyzer();
Reader r = new StringReader(str);
StopFilter sf = (StopFilter) analyzer.tokenStream("", r);
System.out.println("=====StandardAnalyzer====");
System.out.println("分析方法：默认没有词只有字（一元分词）");
Token t;
String results = "";
try {
while ((t = sf.next()) != null) {
System.out.println(t.termText());
results = results + " " + t.termText();
}
} catch (IOException e) {
e.printStackTrace();
}
return results;
}
//7. 字典分词
@SuppressWarnings("deprecation")
public static String ik_CAnalyzer(String str) {
Analyzer analyzer = new IK_CAnalyzer();
Reader r = new StringReader(str);
TokenStream ts = (TokenStream) analyzer.tokenStream("", r);
System.out.println("=====IK_CAnalyzer====");
System.out.println("分析方法:字典分词,正反双向搜索");
Token t;
String results = "";
try {
while ((t = ts.next()) != null) {
System.out.println(t.termText());
results = results + " " + t.termText();
}
} catch (IOException e) {
e.printStackTrace();
}
return results;
}
//在结果中搜索
public static void queryFromResults() {
}
//组装对象
public static IndexResult getIndexResult(Document doc) {
IndexResult ir = new IndexResult();
ir.setId(doc.get("id"));
ir.setName(doc.get("name"));
ir.setAddress(doc.get("address"));
ir.setCitycode(doc.get("citycode"));
return ir;
}
}

查询索引结果对象：IndexResult

Java代码

package index;
public class IndexResult {
private String id;
private String name;
private String address;
private String citycode;
public String getId() {
return id;
}
public void setId(String id) {
this.id = id;
}
public String getName() {
return name;
}
public void setName(String name) {
this.name = name;
}
public String getAddress() {
return address;
}
public void setAddress(String address) {
this.address = address;
}
public String getCitycode() {
return citycode;
}
public void setCitycode(String citycode) {
this.citycode = citycode;
}
}

4. 测试类

Java代码

package test;
/**
* $Id$
* Copyright 2009-2010 Oak Pacific Interactive. All rights reserved.
*/
import index.IndexResult;
import index.IndexUtils;
import java.util.Date;
import java.util.List;
import org.apache.lucene.search.IndexSearcher;
public class Test {
//存放索引文件
private static String indexFile = "E:\\workspace2\\Test\\lucene_test\\poiIdext";
//存放id
private static String storeIdFile = "E:\\workspace2\\Test\\lucene_test\\storeId.txt";
public static void main(String[] args) throws Exception {
//0. 创建增量索引
IndexUtils.buildIndex(indexFile, storeIdFile);
IndexSearcher indexSearcher = new IndexSearcher(indexFile);
String key = IndexUtils.ik_CAnalyzer("静安中心");
//1.单字段查询
Date date1 = new Date();
List<IndexResult> list = IndexUtils.queryByOneKey(indexSearcher, "name", key);
Date date2 = new Date();
System.out.println("耗时：" + (date2.getTime() - date1.getTime()) + "ms\n" + list.size()
+ "条=======================================单字段查询");
//printResults(list);
//2.多条件查询
String[] fields = { "name", "citycode" };
String[] keys = { IndexUtils.ik_CAnalyzer("静安中心"), "0000" };
date1 = new Date();
list = IndexUtils.queryByMultiKeys(indexSearcher, fields, keys);
date2 = new Date();
System.out.println("耗时：" + (date2.getTime() - date1.getTime()) + "ms\n" + list.size()
+ "条\n===============================多条件查询");
printResults(list);
//3.高亮显示单字段查询
System.out.println("\n\n");
date1 = new Date();
list = IndexUtils.highlight(indexSearcher, key);
date2 = new Date();
System.out.println("耗时：" + (date2.getTime() - date1.getTime()) + "ms\n" + list.size()
+ "条\n======================================高亮显示");
// printResults(list);
//4. 多字段查询
date1 = new Date();
list = IndexUtils.queryByMultiFileds(indexSearcher, fields, key);
date2 = new Date();
System.out.println("耗时：" + (date2.getTime() - date1.getTime()) + "ms\n" + list.size()
+ "条\n=====================================多字段查询");
// printResults(list);
//5. 删除索引中的字段根据id进行删除
IndexUtils.deleteIndex(indexFile, "123");
}
//打印结果
public static void printResults(List<IndexResult> list) {
if (list != null && list.size() > 0) {
for (int i = 0; i < list.size(); i++) {
System.out.println(list.get(i).getId() + "," + list.get(i).getName() + ","
+ list.get(i).getAddress() + "," + list.get(i).getCitycode()+"--->"+i);
}
}
}
}

5. 其它

全文索引：

目前的情况是，搜索hello,"hello world"、"hi hello, how are you"但"worldhello"显示不出来

默认情况下，QueryParser不支持通配符打头的查询（如，*ook）。不过在Lucene 2.1版本以后，他们可以通过调用QueryParser.setAllowLeadingWildcard( true )的 方法打开这一功能。注意，这是一个开销很大的操作：它需要扫描索引中全部记号的列表，来寻找匹配这个模式的词。(译注：高效支持这种后缀查询的办法是，建立反序的记号表，Lucene没有实现这一模式。)http://www.codechina.org/faq/show/42/

支持空格分词搜索："厕所 26 沈阳" 这是三个词

不支持：“厕所沈阳”这是一个词

Lucene能实现“在搜索结果中搜索”的功能么，也就是说第二个搜索仅在第一个搜索结果中进行？

http://www.codechina.org/faq/show/63/

可以。主要有两种做法：

使用QueryFilter把第一个查询当作一个过滤器处理。（你可以在Lucene的邮件列表里面搜索 QueryFilter， Doug Cutting（Lucene的最初作者）反对这种做法。）
用BooleanQuery把前后两个查询结合起来，前一个查询使用 required选项。

我们推荐使用BooleanQuery的方法。

============

// 创建标准文本分析器，标准的是可以支持的中文的

Analyzer luceneAnalyzer = new StandardAnalyzer();

indexWriter = new IndexWriter(indexDir, luceneAnalyzer, true);

// 可以说是创建一个新的写入工具

// 第一个参数是要索引建立在哪个目录里

// 第二个参数是新建一个文本分析器,这里用的是标准的大家也可以自己写一个

// 第三个参数如果是true，在建立索引之前先将c: \\index目录清空

poi_data_ugc搜索中，索引放在内存里还是磁盘上？？？？

针对于lucene使用和优化

http://hi.baidu.com/lewutian/blog/item/48a86d03de58b984d43f7c1b.html

ucene入门实例(1):索引文本文件

http://www.java3z.com/cwbwebhome/article/article5/51021.html

冒泡排序及其优化方式
一、基本概念冒泡排序(BubbleSort)是一种简单的比较排序算法，它重复地遍历要排序的数列，一次比较两个元素，如果它们的顺序错误就把它们交换过来。核心思想：通过相邻元素的比较和交换，将较大的元素逐渐"浮"到数列的末端二、基础实现基础冒泡排序算法Java实现publicclassBubbleSort{publicstaticvoidbubbleSort(int[]arr){//外层循环控制排序轮
odoo17 警示： selection attribute will be ignored as the field is related 信息化未来数据库
在Odoo17中，当使用related字段时，直接在fields.Selection中指定选择列表会被忽略（因为选择项会从关联字段继承）。wtd_fuwlx=fields.Selection('服务类型',related='wtd_id.fuwlx',store=True)遇到了一个警告，提示在Odoo17中，由于字段是关联字段（relatedfield），所以selection属性将被忽略。在O
Redis 数据持久化方式详解 zru_9602 数据库 redis 数据库缓存
Redis数据持久化方式详解1.引言Redis是一个高性能的键值存储系统，广泛应用于缓存、消息队列、实时分析等领域。默认情况下，Redis使用内存来存储数据，这使得它能够提供极低的延迟和高吞吐量。然而，由于数据是驻留在内存中的，一旦服务器发生故障（如断电或崩溃），所有的数据都将丢失。为了应对这种情况，Redis提供了多种数据持久化方式，确保数据能够在系统故障时得到保存，并在重启后恢复。本教程将详细
怎么看GPU好坏，有哪些关键指标，显卡性能参数全解析芥子沫 GPU 显卡 GPU-Z
电脑显卡性能如何评估？本文推荐使用gpu-z软件，它能全面展现显卡各项参数，帮助您判断显卡优劣。一、显卡核心参数解析1）在GPU-Z主界面顶端，会显示显卡的具体型号（Name）如“NVIDIAGeForceRTX4090”。型号不仅代表身份，还暗示定位：数字越大通常越高端，例如RTX4090就强于RTX4070。而“架构”则是显卡的“底层设计蓝图”。以英伟达为例，RTX40系列采用AdaLovel
破局并发困境：Python 协程 async/await 深度解析与实战指南清水白石008 python Python题库 python 开发语言
破局并发困境：Python协程async/await深度解析与实战指南一、写在前面：为什么我们仍在为并发编程头疼？在构建高性能的网络服务、实时数据处理系统、自动化调度工具时，你可能遇到过这些困境：多线程写起来麻烦，线程之间切换的开销不容忽视；多进程占用大量内存，IPC（进程间通信）复杂又笨重；I/O密集型任务跑得慢，CPU明明闲着却像在等月亮升起。正因为如此，Python在3.5之后正式引入了as
设计模式之外观模式缘来是庄设计模式外观模式 java
目录定义结构适用场景使用示例定义外观模式（FacadePattern）‌是一种结构型设计模式，它提供了一个统一的接口，用来访问子系统中的一组接口。外观模式定义了一个高层接口，这个接口使得子系统更容易使用。结构适用场景1）为复杂的子系统提供简单入口2）统一管理系统中存在的多个复杂的子系统3）解耦客户端与多个子系统之间的依赖关系4）分层系统中，作为层与层之间的通信接口5）为遗留系统提供新的简化接口使用
Redisson使用示例
1，引入依赖（百度搜索即可）2，配置yamlspring:redis:##redis单机环境配置host:127.0.0.1#host:10.192.33.144port:6379#port:20051#password:123456password:''#database:1database:0ssl:false##redis集群环境配置#cluster:#nodes:127.0.0.1:700
深入理解Python协程：async def、async for、await、yield详解
前言在现代编程中，异步编程已成为提高程序效率和性能的重要方式。Python作为一种流行的编程语言，自然也提供了强大的异步编程支持。本文将详细介绍Python中的协程，以及asyncdef、asyncfor、await和yield等关键字的使用。协程简介协程是一种比传统函数更高级的控制结构。它们在一个过程中暂停，然后在另一个地方恢复执行。协程可以在程序的多个点之间切换，从而实现并发执行，而无需多线程
为什么stm32串口发送数据没有反应_学习笔记之STM32 USART串口应用 weixin_39851008 图片通过串口发送
一、USART简介通用同步异步收发器(USART)提供了一种灵活的方法与使用工业标准NRZ异步串行数据格式的外部设备之间进行全双工数据交换。USART利用分数波特率发生器提供宽范围的波特率选择。（文章下方有USART串口视频资料）STM32的串口资源相当丰富的，功能也相当强劲。STM32F103ZET6最多可提供5路串口，有分数波特率发生器，支持同步单向通信和半双工单线通信，支持LIN(局部互连网
python图像识别哪些库_利用ImageAI库只需几行python代码实现目标检测 weixin_39667398 python图像识别哪些库
什么是目标检测目标检测关注图像中特定的物体目标，需要同时解决解决定位(localization)+识别(Recognition)。相比分类，检测给出的是对图片前景和背景的理解，我们需要从背景中分离出感兴趣的目标，并确定这一目标的描述(类别和位置)，因此检测模型的输出是一个列表，列表的每一项使用一个数组给出检出目标的类别和位置(常用矩形检测框的坐标表示)。通俗的说，ObjectDetection的目
Redis精通之路：起源、应用、高级特性一网打尽！奔跑吧邓邓子项目实战 redis 数据库缓存
目录一、Redis简介1、Redis起源与发展（1）Redis的起源（2）Redis的发展（3）Redis的优势2、Redis特点（1）支持多种数据结构（2）高性能（3）持久化机制（4）高可用性（5）灵活的过期策略（6）支持事务管理（7）支持管道技术（8）监控和故障排查3、Redis应用场景（1）缓存（2）消息队列（3）排行榜（4）社交网络（5）实时分析（6）地理信息存储（7）分布式锁二、Redi
从 MDM 到 Data Fabric：下一代数据架构如何释放 AI 潜能大卫的 AI 办公摸鱼手册人工智能与主数据元数据专栏 fabric 架构人工智能
从MDM到DataFabric：下一代数据架构如何释放AI潜能——传统治理与新兴架构的范式变革与协同进化引言：AI规模化落地的数据困境在人工智能技术快速发展的今天，企业对AI的期望已从“单点实验”转向“规模化落地”。然而，Gartner数据显示，仅有20%的AI项目能够真正实现工业化部署，其核心瓶颈在于数据质量、实时性和治理复杂性。传统主数据管理（MDM）虽能解决基础数据标准化问题，但在应对多源异
实训项目记录 | 7.3 敲代码娶不了六花 spring cloud mybatis spring boot java maven intellij idea
7.3.10:14在发送邮件类SendMess添加自动获取ip和端口方法//获取服务器地址（本机IP+端口）privateStringgetServerAddress()throwsException{if(cachedIpAddr!=null)returncachedIpAddr;//已经算过直接用Stringip=null;//遍历所有网卡，找到一个非回环、非虚拟机、非docker的有效IPE
玩转Docker | 使用Docker部署Qwerty Learner英语单词学习网站心随_风动玩转Docker docker 学习 eureka
玩转Docker|使用Docker部署QwertyLearner英语单词学习网站前言一、QwertyLearner简介QwertyLearner简介主要特点二、系统要求环境要求环境检查Docker版本检查检查操作系统版本三、部署QwertyLearner服务下载QwertyLearner镜像编辑部署文件创建容器检查容器状态检查服务端口安全设置四、访问QwertyLearner服务访问QwertyL
锁查询及处理瀚高PG实验室数据库 postgresql 瀚高数据库
文章目录环境症状问题原因解决方案环境系统平台：N/A版本：6.0症状数据库锁表后，对锁住的表无法进行改动，严重时会影响业务正常运转。问题原因多个会话在同一时间段对相同的数据做了改动，且第一个会话没有立即释放。解决方案1、创建测试表highgo=#select*fromhgjob_test033;id|name|timestart|count----+-------+----------------
普通Attention，FlashAttention和FlashAttention2的比较 ALGORITHM LOL 深度学习人工智能
FlashAttention、普通Attention和FlashAttention2的比较一、普通Attention的实现与问题普通Attention实现#标准注意力计算defstandard_attention(Q,K,V,mask=None):#计算注意力分数scores=torch.matmul(Q,K.transpose(-2,-1))/math.sqrt(d_k)#应用掩码ifmaski
DeepSpeed zero1，zero2，zero3和FSDP区别详解 ALGORITHM LOL python 分布式
1.基本概念DeepSpeedZeROZeRO是由MicrosoftDeepSpeed团队开发的一种内存优化技术，旨在通过分片模型状态来训练超大模型，减少每个GPU的内存占用，同时避免传统模型并行（如张量并行或流水线并行）所需的代码修改。ZeRO分为三个阶段（Stage1、Stage2、Stage3），每阶段逐步增加分片的范围，从而进一步降低内存需求。FSDP(FullyShardedDataPa
python异步方法async love_521_ python 后端
一篇简单demo带你走进asyncimportasyncioimporttimeimportrequestsasyncdefntest2(i):r=awaitother_ntest(i)#等待other_ntest执行完成print(f"ntest2:{i}:{r}")asyncdefother_ntest(i):r=requests.get(i)print(f"other_ntest:{i}")
数据编织趋势探秘
今天跟大家聊聊数据编织（DataFabric）的概念Gartner在2022年重要战略技术趋势中重点提到数据编织（DataFabric）这个概念，本质上是在谈怎么实现“数据找人而不是人找数据”的愿景为什么DataFabric将会成为一种趋势，为什么越来越多的企业将在未来采用这样的方式进行部署？1、在传统IT时代，无论是早年的“数据仓库”还是近几年的“数据湖”和“大数据”时代，其实数据利用都是集中式
【EXCEL_VBA_基础知识】02 使用IF进行逻辑判断南工说焊接软件应用 excel
课程来源：王佩丰老师的《王佩丰学VBA视频教程》，如有侵权，请联系删除！相信大家在平时使用EXCEL时，经常会使用到IF函数进行判断。那么，IF函数在VBA是怎么写呢？让我们跟随王佩丰老师课程，一起一探究竟！另外，从王佩丰老师的课程中，还掌握了一个小技巧：当我们不知道一段代码如何编写时，可以通过录制宏的方式来查看功能实现的代码！目录1.0小知识点1.0.1Range("单元格或区域位置")：代表取
如何实现强磁环境下小井斜段的高精度测量？ ericco123 科技制造 MEMS 陀螺仪惯性技术
在套管井、强磁地层等复杂工况中，普通测井工具因磁干扰导致方位角测量失灵。针对此技术局限，采用基于地球自转角速度感应的陀螺定向方案成为必然选择。新一代MEMS定向短节通过融合三轴MEMS陀螺仪与三轴MEMS加速度计捷联惯性测量技术，在随机振动工况下实现方位角、井斜角及工具面角的动态跟踪测量，为随钻测量场景提供关键技术支撑。1.小井斜方位测量优化•在1°-5°井斜段维持方位角与工具面角的高精度输出能力
创建Django项目小叶萝 Openlayers开发 django sqlite 数据库
我这里利用conda+Pycharm创建Django项目1、打开condaPrompt激活python的conda环境（创建了多个环境可以考虑切换一下python环境）condaactivatebase2、安装DjangocondainstallDjango查看安装成功了没有？django-admin--help出现常用的命令：checkcompilemessagescreatecachetabl
posman-4.7.0 - API调试利器
posman-4.7.0-API调试利器posman-4.7.0-Crx4Chrome.com.rar项目地址:https://gitcode.com/open-source-toolkit/5f470资源简介欢迎使用Postman4.7.0版本，这款被誉为后台API开发神器的工具，是每个开发者必备的调试利器。无论你是进行GET、POST、PUT、DELETE等HTTP请求，还是需要对各种API接
小学期前端三件套学习（更新中）
第一阶段HTML基础结构页面标题页面内容常用内容标签文本类标签•~：标题（h1每个页面建议只用一次）•：段落•：行内文本容器•：加粗强调•：斜体强调媒体类标签•：图片（alt属性必须写）•：音频•：视频下拉框请选择选项1选项2选项3国家：--请选择--中国美国列表标签项目第一项超链接与锚点外部链接跳转到章节邮件链接表格![[Pastedimage20250628100803.png]]源码.tab
Postman：软件工程 API 调试的得力助手软件工程实践软件工程最佳实践 AI软件构建大数据系统架构 postman 软件工程 lua ai
Postman：软件工程API调试的得力助手关键词：Postman、API调试、RESTfulAPI、自动化测试、接口开发、API文档、协作开发摘要：Postman作为一款强大的API开发与测试工具，已经成为现代软件工程中不可或缺的利器。本文将深入探讨Postman的核心功能、工作原理及其在API开发生命周期中的应用。从基础的HTTP请求发送到高级的自动化测试和Mock服务，我们将通过详细的示例和
浅谈数据管理架构 Data Fabric（数据编织）及其关键特征、落地应用 Aloudata Data Fabric 多源异构数据集成数据管理
伴随着企业从数字化转型迈向更先进的数智化运营新阶段，对看数、用数的依赖越来越强，但数据的海量增长给数据管理带来一系列难题，如数据类型和加工链路日益复杂，数据存储和计算引擎更加分散，数据需求响应与数据质量、数据安全风险难以兼顾，数据流通过程中的合规性冲突，以及混合多云环境下的“数据孤岛”等。简言之，进入数智化时代，企业数据管理正变得异常复杂和艰难，传统的数据管理架构往往依赖于单一、物理集中的数据仓库
论“人工智能生命体”站在那个高度？
第一部分：人工智能生命体人工智能生命体，提及的是《人工智能生命体新启点》一书，原文附后，本文中以本书代表。《人工智能生命体新启点》一书，是在现今科学技术发展，从人工智能、智能体、具身智能等大环境下，形成的一种全新理念的理论指导，以此发展出具有自我意识的人工智能生命体，拥有现代科技并以生命体的形式出现，具备类人类般的思想活动，更好的体现与融入人类的社会环境；具有自我意识的智能生命体就如人类的拥有大脑
Linux集群管理实战：5个必知的核心技术与工具操作系统内核探秘操作系统内核揭秘 OS linux 网络运维 ai
Linux集群管理实战：5个必知的核心技术与工具关键词：Linux集群、负载均衡、高可用性、分布式计算、集群监控、自动化部署、资源调度摘要：本文将深入探讨Linux集群管理的5个核心技术领域，包括负载均衡、高可用性、分布式计算、集群监控和自动化部署。通过实际案例和代码示例，我们将一步步解析这些技术的原理、实现方式以及在实际生产环境中的应用场景，帮助读者掌握构建和管理高效Linux集群的关键技能。背
操作系统一致性模型全解析：强一致性 vs 最终一致性操作系统内核探秘网络 ai
操作系统一致性模型全解析：强一致性vs最终一致性关键词：操作系统、一致性模型、强一致性、最终一致性、数据同步摘要：本文深入探讨了操作系统中的一致性模型，重点解析了强一致性和最终一致性这两种常见的模型。通过生动形象的比喻和实际案例，详细介绍了这两种一致性模型的概念、原理、适用场景以及它们之间的区别。同时，还给出了相关的代码示例，帮助读者更好地理解和应用这两种一致性模型。希望读者通过本文能够对操作系统
操作系统日志最佳实践：从收集到分析的完整解决方案操作系统内核探秘操作系统内核揭秘 OS 网络 unity 游戏引擎 ai
操作系统日志最佳实践：从收集到分析的完整解决方案关键词：操作系统日志、日志收集、日志分析、ELKStack、Syslog、日志管理、安全审计摘要：本文将深入探讨操作系统日志管理的完整生命周期，从日志收集、传输、存储到分析和可视化。我们将介绍现代日志管理的最佳实践，包括工具选择、架构设计和性能优化策略，帮助读者构建高效可靠的日志管理系统。背景介绍目的和范围本文旨在为系统管理员、DevOps工程师和安
桌面上有多个球在同时运动，怎么实现球之间不交叉，即碰撞？换个号韩国红果果 html 小球碰撞
稍微想了一下，然后解决了很多bug，最后终于把它实现了。其实原理很简单。在每改变一个小球的x y坐标后，遍历整个在dom树中的其他小球，看一下它们与当前小球的距离是否小于球半径的两倍？若小于说明下一次绘制该小球（设为a）前要把他的方向变为原来相反方向（与a要碰撞的小球设为b），即假如当前小球的距离小于球半径的两倍的话，马上改变当前小球方向。那么下一次绘制也是先绘制b，再绘制a，由于a的方向已经改变
《高性能HTML5》读后整理的Web性能优化内容白糖_ html5
读后感先说说《高性能HTML5》这本书的读后感吧，个人觉得这本书前两章跟书的标题完全搭不上关系，或者说只能算是讲解了“高性能”这三个字，HTML5完全不见踪影。个人觉得作者应该首先把HTML5的大菜拿出来讲一讲，再去分析性能优化的内容，这样才会有吸引力。因为只是在线试读，没有机会看后面的内容，所以不胡乱评价了。
[JShop]Spring MVC的RequestContextHolder使用误区 dinguangx jeeshop 商城系统 jshop 电商系统
在spring mvc中，为了随时都能取到当前请求的request对象，可以通过RequestContextHolder的静态方法getRequestAttributes()获取Request相关的变量，如request, response等。在jshop中，对RequestContextHolder的
算法之时间复杂度周凡杨 java 算法时间复杂度效率
在计算机科学中，算法的时间复杂度是一个函数，它定量描述了该算法的运行时间。这是一个关于代表算法输入值的字符串的长度的函数。时间复杂度常用大O符号表述，不包括这个函数的低阶项和首项系数。使用这种方式时，时间复杂度可被称为是渐近的，它考察当输入值大小趋近无穷时的情况。这样用大写O()来体现算法时间复杂度的记法，
Java事务处理 g21121 java
一、什么是Java事务通常的观念认为，事务仅与数据库相关。事务必须服从ISO/IEC所制定的ACID原则。ACID是原子性（atomicity）、一致性（consistency）、隔离性（isolation）和持久性（durability）的缩写。事务的原子性表示事务执行过程中的任何失败都将导致事务所做的任何修改失效。一致性表示当事务执行失败时，所有被该事务影响的数据都应该恢复到事务执行前的状
Linux awk命令详解 510888780 linux
一. AWK 说明 awk是一种编程语言，用于在linux/unix下对文本和数据进行处理。数据可以来自标准输入、一个或多个文件，或其它命令的输出。它支持用户自定义函数和动态正则表达式等先进功能，是linux/unix下的一个强大编程工具。它在命令行中使用，但更多是作为脚本来使用。 awk的处理文本和数据的方式：它逐行扫描文件，从第一行到
android permission 布衣凌宇 Permission
<uses-permission android:name="android.permission.ACCESS_CHECKIN_PROPERTIES" ></uses-permission>允许读写访问"properties"表在checkin数据库中，改值可以修改上传 <uses-permission android:na
Oracle和谷歌Java Android官司将推迟 aijuans java oracle
北京时间 10 月 7 日，据国外媒体报道，Oracle 和谷歌之间一场等待已久的官司可能会推迟至 10 月 17 日以后进行，这场官司的内容是 Android 操作系统所谓的 Java 专利权之争。本案法官 William Alsup 称根据专利权专家 Florian Mueller 的预测，谷歌 Oracle 案很可能会被推迟。　　该案中的第二波辩护被安排在 10 月 17 日出庭，从目前看来
linux shell 常用命令 antlove linux shell command
grep [options] [regex] [files] /var/root # grep -n "o" * hello.c:1:/* This C source can be compiled with:
Java解析XML配置数据库连接(DOM技术连接 SAX技术连接) 百合不是茶 sax技术 Java解析xml文档 dom技术 XML配置数据库连接
XML配置数据库文件的连接其实是个很简单的问题,为什么到现在才写出来主要是昨天在网上看了别人写的,然后一直陷入其中,最后发现不能自拔所以今天决定自己完成 ,,,,现将代码与思路贴出来供大家一起学习 XML配置数据库的连接主要技术点的博客; JDBC编程 : JDBC连接数据库 DOM解析XML: DOM解析XML文件 SA
underscore.js 学习（二） bijian1013 JavaScript underscore
Array Functions 所有数组函数对参数对象一样适用。1.first _.first(array, [n]) 别名: head, take 返回array的第一个元素，设置了参数n，就
plSql介绍 bijian1013 oracle 数据库 plsql
/* * PL/SQL 程序设计学习笔记 * 学习plSql介绍.pdf * 时间：2010-10-05 */ --创建DEPT表 create table DEPT ( DEPTNO NUMBER(10), DNAME NVARCHAR2(255), LOC NVARCHAR2(255) ) delete dept; select
【Nginx一】Nginx安装与总体介绍 bit1129 nginx
启动、停止、重新加载Nginx nginx 启动Nginx服务器，不需要任何参数u nginx -s stop 快速(强制)关系Nginx服务器 nginx -s quit 优雅的关闭Nginx服务器 nginx -s reload 重新加载Nginx服务器的配置文件 nginx -s reopen 重新打开Nginx日志文件
spring mvc开发中浏览器兼容的奇怪问题 bitray jquery Ajax springMVC 浏览器上传文件
最近个人开发一个小的OA项目,属于复习阶段.使用的技术主要是spring mvc作为前端框架,mybatis作为数据库持久化技术.前台使用jquery和一些jquery的插件. 在开发到中间阶段时候发现自己好像忽略了一个小问题,整个项目一直在firefox下测试,没有在IE下测试,不确定是否会出现兼容问题.由于jquer
Lua的io库函数列表 ronin47 lua io
1、io表调用方式：使用io表，io.open将返回指定文件的描述，并且所有的操作将围绕这个文件描述　　io表同样提供三种预定义的文件描述io.stdin,io.stdout,io.stderr 　　2、文件句柄直接调用方式,即使用file:XXX()函数方式进行操作,其中file为io.open()返回的文件句柄　　多数I/O函数调用失败时返回nil加错误信息,有些函数成功时返回nil
java-26-左旋转字符串 bylijinnan java
public class LeftRotateString { /** * Q 26 左旋转字符串 * 题目：定义字符串的左旋转操作：把字符串前面的若干个字符移动到字符串的尾部。 * 如把字符串abcdef左旋转2位得到字符串cdefab。 * 请实现字符串左旋转的函数。要求时间对长度为n的字符串操作的复杂度为O(n)，辅助内存为O(1)。 */ pu
《vi中的替换艺术》-linux命令五分钟系列之十一 cfyme linux命令
vi方面的内容不知道分类到哪里好，就放到《Linux命令五分钟系列》里吧！今天编程，关于栈的一个小例子，其间我需要把”S.”替换为”S->”(替换不包括双引号)。其实这个不难，不过我觉得应该总结一下vi里的替换技术了，以备以后查阅。 1 所有替换方案都要在冒号“:”状态下书写。 2 如果想将abc替换为xyz，那么就这样 :s/abc/xyz/ 不过要特别
[轨道与计算]新的并行计算架构 comsci 并行计算
我在进行流程引擎循环反馈试验的过程中，发现一个有趣的事情。。。如果我们在流程图的每个节点中嵌入一个双向循环代码段，而整个流程中又充满着很多并行路由，每个并行路由中又包含着一些并行节点，那么当整个流程图开始循环反馈过程的时候，这个流程图的运行过程是否变成一个并行计算的架构呢？
重复执行某段代码 dai_lm android
用handler就可以了 private Handler handler = new Handler(); private Runnable runnable = new Runnable() { public void run() { update(); handler.postDelayed(this, 5000); } }; 开始计时 h
Java实现堆栈（list实现） datageek 数据结构——堆栈
public interface IStack<T> { //元素出栈，并返回出栈元素 public T pop(); //元素入栈 public void push(T element); //获取栈顶元素 public T peek(); //判断栈是否为空 public boolean isEmpty
四大备份MySql数据库方法及可能遇到的问题 dcj3sjt126com DB backup
一：通过备份王等软件进行备份前台进不去？用备份王等软件进行备份是大多老站长的选择，这种方法方便快捷，只要上传备份软件到空间一步步操作就可以，但是许多刚接触备份王软件的客用户来说还原后会出现一个问题：因为新老空间数据库用户名和密码不统一，网站文件打包过来后因没有修改连接文件，还原数据库是好了，可是前台会提示数据库连接错误，网站从而出现打不开的情况。解决方法：学会修改网站配置文件，大多是由co
github做webhooks：[1]钩子触发是否成功测试 dcj3sjt126com github git webhook
转自: http://jingyan.baidu.com/article/5d6edee228c88899ebdeec47.html github和svn一样有钩子的功能，而且更加强大。例如我做的是最常见的push操作触发的钩子操作，则每次更新之后的钩子操作记录都会在github的控制板可以看到！工具/原料 github 方法/步骤
">的作用" target="_blank">JSP中的作用蕃薯耀
JSP中<base href="<%=basePath%>">的作用 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>
linux下SAMBA服务安装与配置 hanqunfeng linux
局域网使用的文件共享服务。一.安装包： rpm -qa | grep samba samba-3.6.9-151.el6.x86_64 samba-common-3.6.9-151.el6.x86_64 samba-winbind-3.6.9-151.el6.x86_64 samba-client-3.6.9-151.el6.x86_64 samba-winbind-clients
guava cache IXHONG cache
缓存，在我们日常开发中是必不可少的一种解决性能问题的方法。简单的说，cache 就是为了提升系统性能而开辟的一块内存空间。　　缓存的主要作用是暂时在内存中保存业务系统的数据处理结果，并且等待下次访问使用。在日常开发的很多场合，由于受限于硬盘IO的性能或者我们自身业务系统的数据处理和获取可能非常费时，当我们发现我们的系统这个数据请求量很大的时候，频繁的IO和频繁的逻辑处理会导致硬盘和CPU资源的
Query的开始--全局变量,noconflict和兼容各种js的初始化方法 kvhur JavaScript jquery css
这个是整个jQuery代码的开始，里面包含了对不同环境的js进行的处理，例如普通环境，Nodejs，和requiredJs的处理方法。还有jQuery生成$, jQuery全局变量的代码和noConflict代码详解完整资源： http://www.gbtags.com/gb/share/5640.htm jQuery 源码： (
美国人的福利和中国人的储蓄 nannan408
今天看了篇文章，震动很大，说的是美国的福利。美国医院的无偿入院真的是个好措施。小小的改善，对于社会是大大的信心。小孩，税费等，政府不收反补，真的体现了人文主义。美国这么高的社会保障会不会使人变懒？答案是否定的。正因为政府解决了后顾之忧，人们才得以倾尽精力去做一些有创造力，更造福社会的事情，这竟成了美国社会思想、人
N阶行列式计算(JAVA) qiuwanchi N阶行列式计算
package gaodai; import java.util.List; /** * N阶行列式计算 * @author 邱万迟 * */ public class DeterminantCalculation { public DeterminantCalculation(List<List<Double>> determina
C语言算法之打渔晒网问题 qiufeihu c 算法
如果一个渔夫从2011年1月1日开始每三天打一次渔，两天晒一次网，编程实现当输入2011年1月1日以后任意一天，输出该渔夫是在打渔还是在晒网。代码如下： #include <stdio.h> int leap(int a) /*自定义函数leap()用来指定输入的年份是否为闰年*/ { if((a%4 == 0 && a%100 != 0
XML中DOCTYPE字段的解析 wyzuomumu xml
DTD声明始终以!DOCTYPE开头,空一格后跟着文档根元素的名称,如果是内部DTD,则再空一格出现[],在中括号中是文档类型定义的内容. 而对于外部DTD,则又分为私有DTD与公共DTD,私有DTD使用SYSTEM表示,接着是外部DTD的URL. 而公共DTD则使用PUBLIC,接着是DTD公共名称,接着是DTD的URL. 私有DTD <!DOCTYPErootSYST

Java搜索工具——Lucene实例总结(一)

Lucene能实现“在搜索结果中搜索”的功能么，也就是说第二个搜索仅在第一个搜索结果中进行？

你可能感兴趣的:(Java搜索工具——Lucene实例总结(一))