quzishen

[lucene]使用lucene建立网站搜索服务

lucene是一个全文检索引擎（非分布式），使用java编写并且可以很方便的嵌入到各种系统中以实现全文检索功能，其通过对字符串进行分词，然后针对分词结果分别建立索引，存入内存或者磁盘，以提供搜索服务，这个功能用起来就像是一个单机版的google，模糊匹配的结果会被展示给用户。应用lucene较为出名的就包括了eclipse的帮助系统。

很多时候搜索这个概念会含糊不清，通常意义上对于一个网站的搜索功能是针对于从数据库中捞取数据并通过freemarker或者velocity渲染模板后展示出来，然后搜索的另一个含义，是针对于文件系统而言，将文件的内容进行搜索并读取文件展示出来。那么对于lucene而言，显然更大的用于之地在于后者，虽然前者的功能也是能够实现。
我们可以想象google的服务器不断的定时dump全球Internet的网页，然后放入自己的存储区域，通过检索评级等一系列的复杂算法，建立针对于关键字的索引，当用户输入关键字进行查询的时候，她会根据建立的索引以及评级等信息进行相似度的判断并展现出查询结果。当然具体的过程会远远比这个复杂。这里要说的是建立搜索的这个概念，从简单的数据库查询的思想出脱离出来，建立一个全文检索的概念。

索引可以理解成现实中书籍的目录，通过这个目录可以很快的定位到具体的页数，拿到想要的结果。这个和数据库的索引是一样的功能，都是为了提高效率，然后数据库却无法实现一个高效的模糊匹配，通常而言的%like%语句，是一条一条的数据比对类似于书籍的翻页过程，这样的效率是极其低下而且对于数据库系统而言是很大的性能耗费，尤其是当有多个关键字的时候，多个%like%的查询条件足以让DBA疯掉。

所以对于模糊匹配的查询而言，高效而准确是一个关键的因素。而lucene的优势就是通过对文本进行分词，通过分词得到一系列的关键字以用于建立索引，同时使用自己默认的socre相关度算法进行排序，通常而言如果对于搜索结果有自己特殊的排序要求，可以在使用lucene建立索引之前，先将数据排好序，可以防止lucene默认的排序之外再次进行排序操作。

对于原理性的知识，可以参看网络上的一些文章，google一下看到很多写的都不错，个人不是很擅长写这种原理性的东西，所以下面做一个小实验，来熟悉一下具体的lucene step by step

我们的需求是针对于一个网站的帮助系统开发一个搜索功能，用户输入自己希望搜索的问题或者关键字，我们通过lucene进行搜索并展示结果给用户。

就是这样简单的一个需求，假设我们的帮助系统的文档是存放在数据库中的，这个数据量在百这个级别，很小的一个数据量。我们先模拟一个小数据量来实现这个功能，如果数据量是百万级那需要进行分布式的索引建立和搜索，那将涉及到其他额外的很多条件和问题解决方案。

我们希望通过这个系统的开发，不但能解决当前的帮助系统的问题，还可以一定程度上解决一些数据量较小的其他搜索问题，所以是势必需要我们去开发一个通用的中间件，并且通过一定的控制手段来注入特定的业务。

要建立索引，我们需要知道面对的数据对象是谁？哪张表？在哪些字段上建立索引？这几个是关键因素，当然还包括了索引文件存放位置等小问题暂且掠过。这几个关键的因素我们需要注入到我们开发的中间件中，通过配置注入的方式隔离具体的业务代码交织。

怎么做呢？如何去从数据库中获取数据并建立索引呢？索引文件以多大的频率更新？

看看代码：

package com.normandy.position.common; import java.io.IOException; import java.util.ArrayList; import java.util.Arrays; import java.util.Collection; import java.util.HashMap; import java.util.Iterator; import java.util.List; import java.util.Map; import org.apache.commons.lang.StringUtils; import org.apache.log4j.Logger; import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis.cjk.CJKAnalyzer; import org.apache.lucene.document.Document; import org.apache.lucene.document.Field; import org.apache.lucene.index.CorruptIndexException; import org.apache.lucene.index.IndexReader; import org.apache.lucene.index.IndexReader.FieldOption; import org.apache.lucene.index.IndexWriter; import org.apache.lucene.index.Term; import org.apache.lucene.queryParser.ParseException; import org.apache.lucene.queryParser.QueryParser; import org.apache.lucene.search.Hits; import org.apache.lucene.search.IndexSearcher; import org.apache.lucene.search.Query; import org.apache.lucene.store.LockObtainFailedException; import org.springframework.jdbc.core.JdbcTemplate; /** * 使用lucene进行搜索服务 * <p> * 适用于数据量不大的单机搜索服务，对于数据量较大的搜索，建议使用分布式搜索 * </p> * * @author quzishen * @version 1.0 */ public class LuceneSearcher implements Runnable { protected final Logger logger = Logger.getLogger(LuceneSearcher.class); /** ~~~ 类名 */ private String className; /** ~~~ 需要建立索引的域列表字符串，以“,”隔开 */ private String fieldsStr; /** ~~~ 默认的索引存放目录 */ private String defaultIndexDir = "c:/index/"; /** ~~~ 配置中需要索引字段的默认分隔符 */ private static final String DEFAULT_KEY_FIELD_SPLIT = ","; /** ~~~ 默认的标记符名称，如果fieldsStr中含有主键，则使用主键名称*/ private static final String DEFAULT_ID = "id"; /** ~~~ 是否每次重新建立索引 */ private boolean IS_REBUILD_INDEX = true; /** ~~~ 默认的建立索引的最大数目 */ private int DEFAULT_MAX_INDEX_NUMS = Integer.MAX_VALUE; /** ~~~ 特别针对于匿名内部类提供的操作jdbc模板 */ private JdbcTemplate jdbcTemplate; /** * 建立索引，初始化操作 * * @throws RuntimeException */ public void initIndex() throws RuntimeException { if (StringUtils.isBlank(fieldsStr) || StringUtils.isBlank(className)) { throw new RuntimeException("can not build the index by null value of field and className."); } long beginTime = System.currentTimeMillis(); if (logger.isInfoEnabled()) { logger.info("begin to build the lucene index..."); } Analyzer analyzer = new CJKAnalyzer(); try { // 获取需要建立索引的域 List<String> fieldList = getKeyWordsList(); IndexWriter indexWriter = new IndexWriter(defaultIndexDir, analyzer, IS_REBUILD_INDEX); // 控制写入一个新的segment前在内存中保存的最大的document数目 indexWriter.setMaxBufferedDocs(500); // 控制多个segment合并的频率 indexWriter.setMaxMergeDocs(100); buildIndex(fieldList,indexWriter); indexWriter.optimize(); indexWriter.close(); long endTime = System.currentTimeMillis(); if (logger.isInfoEnabled()) { logger.info("end to build the lucene index...,use time :" + (endTime - beginTime) + "ms."); } } catch (IOException e) { logger.error("create index failed!check the authentation!", e); throw new RuntimeException("create index failed!check the authentation!", e); } catch (ClassNotFoundException e) { logger.error("class not found : " + className, e); throw new RuntimeException("class not found : " + className, e); } } /** * 重新建立索引 */ public void run() { if(logger.isDebugEnabled()){ logger.debug("rebuild the index for lucene start..."); } long begin = System.currentTimeMillis(); removeAllIndex(); initIndex(); long end = System.currentTimeMillis(); if(logger.isDebugEnabled()){ logger.debug("rebuild the index for lucene end..."+(end - begin)+"ms."); } } /** * 重新建立索引 * @throws RuntimeException */ public void refreshIndex() throws RuntimeException { new Thread(this).start(); } /** * 删除所有的索引，将根据主键一次性全部删除 * @throws RuntimeException */ @SuppressWarnings("unchecked") public void removeAllIndex() throws RuntimeException { try { // reader IndexReader indexReader = IndexReader.open(defaultIndexDir); Analyzer analyzer = new CJKAnalyzer(); IndexWriter indexWriter = new IndexWriter(defaultIndexDir,analyzer); // 获取所有的索引名称集合 Collection<String> indexs = indexReader.getFieldNames(FieldOption.INDEXED); // 检查是否包含主键 String keyName = getKeyName(); if(!indexs.contains(keyName)){ return; } // 遍历并删除 int maxDocNum = indexReader.maxDoc(); for(int k = 0;k < maxDocNum ;k++){ Document document = indexReader.document(k); String value = document.get(keyName); Term term = new Term(keyName,value); indexWriter.deleteDocuments(term); if(logger.isDebugEnabled()){ logger.debug("delete the index of ["+keyName+","+value+"]"); } logger.error("delete the index of ["+keyName+","+value+"]"); } indexWriter.optimize(); indexWriter.close(); indexReader.flush(); indexReader.close(); } catch (CorruptIndexException e) { logger.error("create index failed!", e); throw new RuntimeException("create index failed!",e); } catch (LockObtainFailedException e) { logger.error("create index failed!", e); throw new RuntimeException("create index failed!",e); } catch (IOException e) { logger.error("create index failed!check the authentation!", e); throw new RuntimeException("create index failed!",e); } catch (ClassNotFoundException e) { logger.error("class not found!", e); throw new RuntimeException("create index failed!",e); } } /** * 从数据库中取出数据，建立索引用于全文检索 * @param fieldList 建立索引的字段列表 * @param indexWriter * @throws RuntimeException */ @SuppressWarnings("unchecked") private void buildIndex(List<String> fieldList,IndexWriter indexWriter) throws RuntimeException{ try{ // 获取类型 Class<? extends Object> objectClass = Class.forName(className); // 匿名内部类 AbstractBaseDAO abstractBaseDAO = new AbstractBaseDAO() { }; abstractBaseDAO.setJdbcTemplate(jdbcTemplate); // 获取第一页 Paginal<? extends Object> paginal = abstractBaseDAO.queryFieldsListForPaging(objectClass, null, fieldList, 1, 1000); // 修正分页总数，如果搜索结果总数超过最大值，则使用最大值 int totalCount = paginal.getTotalCount(); totalCount = totalCount > DEFAULT_MAX_INDEX_NUMS ? DEFAULT_MAX_INDEX_NUMS : totalCount; paginal.setTotalCount(totalCount); // 需要分页的数目 int pageNum = paginal.getPageNum(); // 循环从数据库分页读取数据 for (int i = 0; i < pageNum; i++) { // 查询结果列表 List<? extends Object> resultList = paginal.getResultList(); Iterator<? extends Object> resultIndex = resultList.iterator(); while (resultIndex.hasNext()) { // 每一个新建document，防止field重名覆盖 Document document = new Document(); Object object = resultIndex.next(); Iterator<String> fieldIndex = fieldList.iterator(); while (fieldIndex.hasNext()) { // 获取需要分页的域 String field = fieldIndex.next(); // 过滤空白 if (StringUtils.isBlank(field)) { continue; } // 获取值 Object value = ((Map<String, Object>) object).get(field); // 写入doc document.add(new Field(field, value.toString(), Field.Store.YES, Field.Index.TOKENIZED)); } // 写入索引文件 indexWriter.addDocument(document); }//while }//for } catch (CorruptIndexException e) { logger.error("create index failed!", e); throw new RuntimeException("create index failed!",e); } catch (LockObtainFailedException e) { logger.error("create index failed!", e); throw new RuntimeException("create index failed!",e); } catch (IOException e) { logger.error("create index failed!check the authentation!", e); throw new RuntimeException("create index failed!",e); } catch (ClassNotFoundException e) { logger.error("class not found!", e); throw new RuntimeException("create index failed!",e); } } /** * 查询服务 * @param keywords 查询字 * @return */ public List<Map<String,String>> search(String keywords){ //~~~ return value List<Map<String,String>> result = new ArrayList<Map<String,String>>(); try { // 搜索执行器 IndexSearcher indexSearcher = new IndexSearcher(defaultIndexDir); // 分词器 Analyzer analyzer = new CJKAnalyzer(); // 关键字列表 List<String> keyWordsList = getKeyWordsList(); for(String indexName : keyWordsList){ QueryParser queryParser = new QueryParser(indexName,analyzer); Query query = queryParser.parse(keywords); Hits hits = indexSearcher.search(query); if(logger.isDebugEnabled()){ logger.debug("search result count:"+hits.length()); } for(int i=0;i<hits.length();i++){ Document document = hits.doc(i); Map<String,String> resultMap = new HashMap<String,String>(); for(String field : keyWordsList){ if(StringUtils.isBlank(field)){ continue; } String value = document.get(field); resultMap.put(field, value); } result.add(resultMap); } } } catch (CorruptIndexException e) { logger.error("create index failed!", e); throw new RuntimeException("create index failed!",e); } catch (LockObtainFailedException e) { logger.error("create index failed!", e); throw new RuntimeException("create index failed!",e); } catch (IOException e) { logger.error("create index failed!check the authentation!", e); throw new RuntimeException("create index failed!",e); } catch (ClassNotFoundException e) { logger.error("class not found!", e); throw new RuntimeException("create index failed!",e); } catch (ParseException e) { logger.error("parse keyword exception!", e); throw new RuntimeException("parse keyword exception!",e); } return result; } /** * 获取配置的主键名称 */ @SuppressWarnings({ "rawtypes", "unchecked" }) private String getKeyName() throws ClassNotFoundException{ Class objectClass = Class.forName(className); Table table = (Table) objectClass.getAnnotation(Table.class); String keyName = table.keyField(); return StringUtils.isBlank(keyName)? DEFAULT_ID : keyName.toLowerCase(); } /** * 根据配置的关键字串获取关键字列表，自动补全主键 */ private List<String> getKeyWordsList() throws ClassNotFoundException{ // 获取需要建立索引的域 String[] fields = StringUtils.split(fieldsStr.toLowerCase(), DEFAULT_KEY_FIELD_SPLIT); // 转换成列表形式 List<String> fieldList = Arrays.asList(fields); // 如果配置的索引字段串不包含主键，则手动添加主键，也就是主键必须创建索引用于标示doc String keyName = getKeyName(); if(!fieldList.contains(keyName)){ fieldList.add(keyName); } return fieldList; } // ~~~~~~~~~~~~~~~~~~~~~getter && setter ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~***// public void setClassName(String className) { this.className = className; } public void setFieldsStr(String fieldsStr) { this.fieldsStr = fieldsStr; } public void setJdbcTemplate(JdbcTemplate jdbcTemplate) { this.jdbcTemplate = jdbcTemplate; } public void setDefaultIndexDir(String defaultIndexDir) { this.defaultIndexDir = defaultIndexDir; } }

这个是我们的中间件，提供的是索引建立、索引更新和搜索服务，其中有几个变量如className指明了要针对哪个Do对象所对应的表来建立全文检索，fieldsStr指明了需要建立索引的字段，以逗号分开，其他的参数也都很简单。

我们需要根据配置的字段去查询数据库已完成索引的建立工作，那么如何获取呢？我们说过不希望通过显示的业务代码来完成，所以这里使用了前段时间开发的一个jdbcTemplate的封装抽象类，其中的查询字段列表的方法来得到特定字段值的列表，为了不显示的使用业务DAO，我们使用了一个匿名内部类来完成。具体的过程可以参见前面的文章。其中与之有所不同的是，在删除索引的时候，我们需要有一个类似于记录ID的标志位来标记唯一约束，以防止误删的情况，这里由于数据来自于数据库，所以很自然的我们选择使用数据库记录ID，如果用户配置的索引串中没有配置ID,那我们将通过注解的方式自动获取其配置在DO类中的ID名称，如果注解中也没配置，那么将使用默认的名称“id”。

看看我们的注解：

package com.normandy.position.common; import java.lang.annotation.Documented; import java.lang.annotation.ElementType; import java.lang.annotation.Retention; import java.lang.annotation.RetentionPolicy; import java.lang.annotation.Target; /** * 针对于数据库表的配置的注解 * * 工程名称：NormandyPosition * 类型名称：Table * 概要： * <p> 目前主要用于配置数据库表名，主键名 </p> * 创建时间：2010-7-28 上午10:40:42 * 创建人：quzishen * 最后修改时间：2010-7-28 上午10:40:42 * 最后修改内容： * @version 1.0 */ @Documented @Retention(RetentionPolicy.RUNTIME) @Target(ElementType.TYPE) public @interface Table { /**~~~~ 表名*/ String tableName() default("table"); /**~~~~ 主键名称*/ String keyField() default("id"); }

看看用法：

package com.normandy.position.domain; import java.io.Serializable; import java.util.Date; import com.normandy.position.common.Table; @Table(tableName = "NOR_QUICK_NEWS",keyField="id") public class NorQuickNews implements Serializable { private static final long serialVersionUID = -4777096683339361256L; private long id; private String prop1; private String prop2; private String prop3; private String prop4; private String prop5; private String prop6; private String prop7; private String prop8; private String prop9; private String name; private Date gmt_Create; public long getId() { return id; } public void setId(long id) { this.id = id; } public String getProp1() { return prop1; } public void setProp1(String prop1) { this.prop1 = prop1; } public String getProp2() { return prop2; } public void setProp2(String prop2) { this.prop2 = prop2; } public String getProp3() { return prop3; } public void setProp3(String prop3) { this.prop3 = prop3; } public String getProp4() { return prop4; } public void setProp4(String prop4) { this.prop4 = prop4; } public String getProp5() { return prop5; } public void setProp5(String prop5) { this.prop5 = prop5; } public String getProp6() { return prop6; } public void setProp6(String prop6) { this.prop6 = prop6; } public String getProp7() { return prop7; } public void setProp7(String prop7) { this.prop7 = prop7; } public String getProp8() { return prop8; } public void setProp8(String prop8) { this.prop8 = prop8; } public String getProp9() { return prop9; } public void setProp9(String prop9) { this.prop9 = prop9; } public String getName() { return name; } public void setName(String name) { this.name = name; } public Date getGmt_Create() { return gmt_Create; } public void setGmt_Create(Date gmt_Create) { this.gmt_Create = gmt_Create; } }

配置文件中，我们添加相关的配置：

<bean id="luceneSearcher" class="com.normandy.position.common.LuceneSearcher" depends-on="jdbcTemplate"> <property name="defaultIndexDir"> <value>${lucene.index.dir}</value> </property> <property name="className" value="com.normandy.position.domain.NorQuickNews" /> <property name="fieldsStr" value="id,prop1,prop2" /> </bean>

为了完成自动刷新，我们添加配置任务：

<bean id="timetaskScheduler" class="org.springframework.scheduling.quartz.SchedulerFactoryBean"> <property name="triggers"> <list> <ref local="luceneTrigger" /> </list> </property> <property name="autoStartup"> <value>true</value> </property> <property name="schedulerName"> <value>timetaskScheduler</value> </property> </bean> <bean id="luceneTrigger" class="org.springframework.scheduling.quartz.CronTriggerBean"> <property name="jobDetail"> <bean class="org.springframework.scheduling.quartz.MethodInvokingJobDetailFactoryBean"> <property name="targetObject" ref="luceneSearcher" /> <property name="targetMethod" value="refreshIndex" /> </bean> </property> <property name="cronExpression" value="0 */15 * * * ?" /> </bean>

这样就完成了开发工作。系统启动先建立索引，然后每隔15分钟将刷新一次索引。自动刷新我们的策略是删除所有的索引，重新建立索引，这个特别针对于数据量较小的操作，如果数据量稍微大一些，不推荐采用这种方式，我们需要进行一个自动识别的工作，只刷新变更过的记录，而不要过多的开销系统来重新全部重建。这里由于数据量较小，所以为了方便，我们直接删除所有索引重新建立。在后续的工作中，我们将重点研究如何精准刷新。

看看单元测试代码：

package com.normandy.positiontest; import java.util.List; import java.util.Map; import junit.framework.TestCase; import org.springframework.context.ApplicationContext; import org.springframework.context.support.ClassPathXmlApplicationContext; import org.springframework.jdbc.core.JdbcTemplate; import com.normandy.position.common.LuceneSearcher; public class LuceneSearcherTest extends TestCase { private LuceneSearcher luceneSearcher; private JdbcTemplate jdbcTemplate; @Override protected void setUp() throws Exception { super.setUp(); ApplicationContext applicationContext = new ClassPathXmlApplicationContext( "com/normandy/positiontest/applicationContext.xml"); luceneSearcher = (LuceneSearcher) applicationContext .getBean("luceneSearcher"); jdbcTemplate = (JdbcTemplate)applicationContext.getBean("jdbcTemplate"); luceneSearcher.setJdbcTemplate(jdbcTemplate); } public void testInit(){ luceneSearcher.initIndex(); } public void testRemoveAllIndex(){ luceneSearcher.removeAllIndex(); } public void testRefreshIndex(){ luceneSearcher.refreshIndex(); } public void testSearch(){ List<Map<String,String>> list = luceneSearcher.search("prop1"); System.out.println(list.size()); } }

万里长征只走了第一步，剩下的事情还有很多，这个只是最简单的一个例子，万事开头难，在熟练应用的基础上进行二次开发或者源码分析将是接下来的主要工作思路。

QQ群采集助手，精准引流必备神器 2401_87347160 其他经验分享
功能概述微信群查找与筛选工具是一款专为微信用户设计的辅助工具，它通过关键词搜索功能，帮助用户快速找到相关的微信群，并提供筛选是否需要验证的群组的功能。主要功能关键词搜索：用户可以输入关键词，工具将自动查找包含该关键词的微信群。筛选功能：工具提供筛选机制，用户可以选择是否只显示需要验证或不需要验证的群组。精准引流：通过上述功能，用户可以更精准地找到目标群组，进行有效的引流操作。3.设备需求该工具可以
element实现动态路由+面包屑软件技术NINI vue案例 vue.js 前端
el-breadcrumb是ElementUI组件库中的一个面包屑导航组件，它用于显示当前页面的路径，帮助用户快速理解和导航到应用的各个部分。在Vue.js项目中，如果你已经安装了ElementUI，就可以很方便地使用el-breadcrumb组件。以下是一个基本的使用示例：安装ElementUI（如果你还没有安装的话）:你可以通过npm或yarn来安装ElementUI。bash复制代码npmi
C语言宏函数南林yan C语言 c语言
一、什么是宏函数？通过宏定义的函数是宏函数。如下，编译器在预处理阶段会将Add(x,y)替换为((x)*(y))#defineAdd(x,y)((x)*(y))#defineAdd(x,y)((x)*(y))intmain(){inta=10;intb=20;intd=10;intc=Add(a+d,b)*2;cout<
C语言如何定义宏函数？小九格物 c语言
在C语言中，宏函数是通过预处理器定义的，它在编译之前替换代码中的宏调用。宏函数可以模拟函数的行为，但它们不是真正的函数，因为它们在编译时不会进行类型检查，也不会分配存储空间。宏函数的定义通常使用#define指令，后面跟着宏的名称和参数列表，以及宏展开后的代码。宏函数的定义方式：1.基本宏函数：这是最简单的宏函数形式，它直接定义一个表达式。#defineSQUARE(x)((x)*(x))2.带参
微服务下功能权限与数据权限的设计与实现 nbsaas-boot 微服务 java 架构
在微服务架构下，系统的功能权限和数据权限控制显得尤为重要。随着系统规模的扩大和微服务数量的增加，如何保证不同用户和服务之间的访问权限准确、细粒度地控制，成为设计安全策略的关键。本文将讨论如何在微服务体系中设计和实现功能权限与数据权限控制。1.功能权限与数据权限的定义功能权限：指用户或系统角色对特定功能的访问权限。通常是某个用户角色能否执行某个操作，比如查看订单、创建订单、修改用户资料等。数据权限：
理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
c++ 的iostream 和 c++的stdio的区别和联系黄卷青灯77 c++算法开发语言 iostream stdio
在C++中，iostream和C语言的stdio.h都是用于处理输入输出的库，但它们在设计、用法和功能上有许多不同。以下是两者的区别和联系：区别1.编程风格iostream（C++风格）：C++标准库中的输入输出流类库，支持面向对象的输入输出操作。典型用法是cin（输入）和cout（输出），使用>操作符来处理数据。更加类型安全，支持用户自定义类型的输入输出。#includeintmain(){in
Long类型前后端数据不一致 igotyback 前端
响应给前端的数据浏览器控制台中response中看到的Long类型的数据是正常的到前端数据不一致前后端数据类型不匹配是一个常见问题，尤其是当后端使用Java的Long类型（64位）与前端JavaScript的Number类型（最大安全整数为2^53-1，即16位）进行数据交互时，很容易出现精度丢失的问题。这是因为JavaScript中的Number类型无法安全地表示超过16位的整数。为了解决这个问
swagger访问路径 igotyback swagger
Swagger2.x版本访问地址：http://{ip}:{port}/{context-path}/swagger-ui.html{ip}是你的服务器IP地址。{port}是你的应用服务端口，通常为8080。{context-path}是你的应用上下文路径，如果应用部署在根路径下，则为空。Swagger3.x版本对于Swagger3.x版本（也称为OpenAPI3）访问地址：http://{ip
消息中间件有哪些常见类型 xmh-sxh-1314 java
消息中间件根据其设计理念和用途，可以大致分为以下几种常见类型：点对点消息队列（Point-to-PointMessagingQueues）：在这种模型中，消息被发送到特定的队列中，消费者从队列中取出并处理消息。队列中的消息只能被一个消费者消费，消费后即被删除。常见的实现包括IBM的MQSeries、RabbitMQ的部分使用场景等。适用于任务分发、负载均衡等场景。发布/订阅消息模型（Pub/Sub
html 中如何使用 uniapp 的部分方法某公司摸鱼前端 html uni-app 前端
示例代码：Documentconsole.log(window);效果展示：好了，现在就可以uni.使用相关的方法了
ArcGIS栅格计算器常见公式（赋值、0和空值的转换、补充栅格空值）研学随笔 arcgis 经验分享
我们在使用ArcGIS时通常经常用到栅格计算器，今天主要给大家介绍我日常中经常用到的几个公式，供大家参考学习。将特定值（-9999）赋值为0，例如-9999.Con("raster"==-9999,0,"raster")2.给空值赋予特定的值（如0）Con(IsNull("raster"),0,"raster")3.将特定的栅格值(如1)赋值为空值，其他保留原值SetNull("raster"==
高级编程--XML+socket练习题 masa010 java 开发语言
1.北京华北2114.8万人上海华东2,500万人广州华南1292.68万人成都华西1417万人（1）使用dom4j将信息存入xml中（2）读取信息，并打印控制台（3）添加一个city节点与子节点（4）使用socketTCP协议编写服务端与客户端，客户端输入城市ID，服务器响应相应城市信息（5）使用socketTCP协议编写服务端与客户端，客户端要求用户输入city对象，服务端接收并使用dom4j
水平垂直居中的几种方法（总结） LJ小番茄 CSS_玄学语言 html javascript 前端 css css3
1.使用flexbox的justify-content和align-items.parent{display:flex;justify-content:center;/*水平居中*/align-items:center;/*垂直居中*/height:100vh;/*需要指定高度*/}2.使用grid的place-items:center.parent{display:grid;place-item
【一起学Rust | 设计模式】习惯语法——使用借用类型作为参数、格式化拼接字符串、构造函数广龙宇一起学Rust #Rust设计模式 rust 设计模式开发语言
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、使用借用类型作为参数二、格式化拼接字符串三、使用构造函数总结前言Rust不是传统的面向对象编程语言，它的所有特性，使其独一无二。因此，学习特定于Rust的设计模式是必要的。本系列文章为作者学习《Rust设计模式》的学习笔记以及自己的见解。因此，本系列文章的结构也与此书的结构相同（后续可能会调成结构），基本上分为三个部分
Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
C#中使用split分割字符串互联网打工人no1 c#
1、用字符串分隔：usingSystem.Text.RegularExpressions;stringstr="aaajsbbbjsccc";string[]sArray=Regex.Split(str,"js",RegexOptions.IgnoreCase);foreach(stringiinsArray)Response.Write(i.ToString()+"");输出结果：aaabbbc
网易严选官方旗舰店，优质商品，卓越服务高省_飞智666600
网易严选官方旗舰店是网易旗下的一家电商平台，以提供优质商品和卓越服务而闻名。作为一名SEO优化师，我将为您详细介绍网易严选官方旗舰店，并重点强调其特点和优势。大家好！我是高省APP最大团队&联合创始人飞智导师。相较于其他返利app，高省APP的佣金更高，模式更好，最重要的是，终端用户不会流失！高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个自用省钱佣金高，分享推广赚钱多的平台，百度有几
Python中os.environ基本介绍及使用方法鹤冲天Pro #Python python 服务器开发语言
文章目录python中os.environos.environ简介os.environ进行环境变量的增删改查python中os.environ的使用详解1.简介2.key字段详解2.1常见key字段3.os.environ.get()用法4.环境变量的增删改查和判断是否存在4.1新增环境变量4.2更新环境变量4.3获取环境变量4.4删除环境变量4.5判断环境变量是否存在python中os.envi
腾讯云技术深度探索：构建高效云原生微服务架构我的运维人生云原生架构腾讯云运维开发技术共享
腾讯云技术深度探索：构建高效云原生微服务架构在当今快速发展的技术环境中，云原生技术已成为企业数字化转型的关键驱动力。腾讯云作为行业领先的云服务提供商，不断推出创新的产品和技术，助力企业构建高效、可扩展的云原生微服务架构。本文将深入探讨腾讯云在微服务领域的最新进展，并通过一个实际案例展示如何在腾讯云平台上构建云原生应用。腾讯云微服务架构概览腾讯云微服务架构基于云原生理念，旨在帮助企业快速实现应用的容
Python教程：一文了解使用Python处理XPath 旦莫 Python进阶 python 开发语言
目录1.环境准备1.1安装lxml1.2验证安装2.XPath基础2.1什么是XPath？2.2XPath语法2.3示例XML文档3.使用lxml解析XML3.1解析XML文档3.2查看解析结果4.XPath查询4.1基本路径查询4.2使用属性查询4.3查询多个节点5.XPath的高级用法5.1使用逻辑运算符5.2使用函数6.实战案例6.1从网页抓取数据6.1.1安装Requests库6.1.2代
Google earth studio 简介陟彼高冈yu 旅游
GoogleEarthStudio是一个基于Web的动画工具，专为创作使用GoogleEarth数据的动画和视频而设计。它利用了GoogleEarth强大的三维地图和卫星影像数据库，使用户能够轻松地创建逼真的地球动画、航拍视频和动态地图可视化。网址为https://www.google.com/earth/studio/。GoogleEarthStudio是一个基于Web的动画工具，专为创作使用G
linux中sdl的使用教程,sdl使用入门 Melissa Corvinus linux中sdl的使用教程
本文通过一个简单示例讲解SDL的基本使用流程。示例中展示一个窗口，窗口里面有个随机颜色快随机移动。当我们鼠标点击关闭按钮时间窗口关闭。基本步骤如下：1.初始化SDL并创建一个窗口。SDL_Init()初始化SDL_CreateWindow()创建窗口2.纹理渲染存储RGB和存储纹理的区别：比如一个从左到右由红色渐变到蓝色的矩形，用存储RGB的话就需要把矩形中每个点的具体颜色值存储下来；而纹理只是一
LLM 词汇表落难Coder LLMs NLP 大语言模型大模型 llama 人工智能
Contextwindow“上下文窗口”是指语言模型在生成新文本时能够回溯和参考的文本量。这不同于语言模型训练时所使用的大量数据集，而是代表了模型的“工作记忆”。较大的上下文窗口可以让模型理解和响应更复杂和更长的提示，而较小的上下文窗口可能会限制模型处理较长提示或在长时间对话中保持连贯性的能力。Fine-tuning微调是使用额外的数据进一步训练预训练语言模型的过程。这使得模型开始表示和模仿微调数
PHP环境搭建详细教程好看资源平台前端 php
PHP是一个流行的服务器端脚本语言，广泛用于Web开发。为了使PHP能够在本地或服务器上运行，我们需要搭建一个合适的PHP环境。本教程将结合最新资料，介绍在不同操作系统上搭建PHP开发环境的多种方法，包括Windows、macOS和Linux系统的安装步骤，以及本地和Docker环境的配置。1.PHP环境搭建概述PHP环境的搭建主要分为以下几类：集成开发环境：例如XAMPP、WAMP、MAMP，这
下载github patch到本地小米人er 我的博客 git patch
以下是几种从GitHub上下载以.patch结尾的补丁文件的方法：通过浏览器直接下载打开包含该.patch文件的GitHub仓库。在仓库的文件列表中找到对应的.patch文件。点击该文件，浏览器会显示文件的内容，在页面的右上角通常会有一个“Raw”按钮，点击它可以获取原始文件内容。然后在浏览器中使用快捷键（如Ctrl+S或者Command+S）将原始文件保存到本地，选择保存的文件名并确保后缀为.p
使用 FinalShell 进行远程连接（ssh 远程连接 Linux 服务器）编程经验分享开发工具服务器 ssh linux
目录前言基本使用教程新建远程连接连接主机自定义命令路由追踪前言后端开发，必然需要和服务器打交道，部署应用，排查问题，查看运行日志等等。一般服务器都是集中部署在机房中，也有一些直接是云服务器，总而言之，程序员不可能直接和服务器直接操作，一般都是通过ssh连接来登录服务器。刚接触远程连接时，使用的是XSHELL来远程连接服务器，连接上就能够操作远程服务器了，但是仅用XSHELL并没有上传下载文件的功能
直返最高等级与直返APP：无需邀请码的返利新体验古楼
随着互联网的普及和电商的兴起，直返模式逐渐成为一种流行的商业模式。在这种模式下，消费者通过购买产品或服务，获得一定的返利，并可以分享给更多的人。其中，直返最高等级和直返APP是直返模式中的重要概念和工具。本文将详细介绍直返最高等级的概念、直返APP的使用以及与邀请码的关系。【高省】APP（高佣金领导者）是一个自用省钱佣金高，分享推广赚钱多的平台，百度有几百万篇报道，运行三年，稳定可靠。高省APP，
SQL Server_查询某一数据库中的所有表的内容 qq_42772833 SQL Server 数据库 sqlserver
1.查看所有表的表名要列出CrabFarmDB数据库中的所有表（名），可以使用以下SQL语句：USECrabFarmDB;--切换到目标数据库GOSELECTTABLE_NAMEFROMINFORMATION_SCHEMA.TABLESWHERETABLE_TYPE='BASETABLE';对这段SQL脚本的解释：SELECTTABLE_NAME：这个语句的作用是从查询结果中选择TABLE_NAM
四章-32-点要素的聚合彩云飘过
本文基于腾讯课堂老胡的课《跟我学Openlayers--基础实例详解》做的学习笔记，使用的openlayers5.3.xapi。源码见1032.html，对应的官网示例https://openlayers.org/en/latest/examples/cluster.htmlhttps://openlayers.org/en/latest/examples/earthquake-clusters.
web前段跨域nginx代理配置刘正强 nginx cms Web
nginx代理配置可参考server部分 server { listen 80; server_name localhost;
spring学习笔记 caoyong spring
一、概述 a>、核心技术 : IOC与AOP b>、开发为什么需要面向接口而不是实现接口降低一个组件与整个系统的藕合程度，当该组件不满足系统需求时，可以很容易的将该组件从系统中替换掉，而不会对整个系统产生大的影响 c>、面向接口编口编程的难点在于如何对接口进行初始化,(使用工厂设计模式)
Eclipse打开workspace提示工作空间不可用 0624chenhong eclipse
做项目的时候，难免会用到整个团队的代码，或者上一任同事创建的workspace， 1.电脑切换账号后，Eclipse打开时，会提示Eclipse对应的目录锁定，无法访问，根据提示，找到对应目录，G:\eclipse\configuration\org.eclipse.osgi\.manager，其中文件.fileTableLock提示被锁定。解决办法，删掉.fileTableLock文件，重
Javascript 面向对面写法的必要性？一炮送你回车库 JavaScript
现在Javascript面向对象的方式来写页面很流行，什么纯javascript的mvc框架都出来了：ember 这是javascript层的mvc框架哦,不是j2ee的mvc框架我想说的是，javascript本来就不是一门面向对象的语言，用它写出来的面向对象的程序，本身就有些别扭，很多人提到js的面向对象首先提的是：复用性。那么我请问你写的js里有多少是可以复用的，用fu
js array对象的迭代方法换个号韩国红果果 array
1.forEach 该方法接受一个函数作为参数，对数组中的每个元素使用该函数 return 语句失效 function square(num) { print(num, num * num); } var nums = [1,2,3,4,5,6,7,8,9,10]; nums.forEach(square); 2.every 该方法接受一个返回值为布尔类型
对Hibernate缓存机制的理解归来朝歌 session 一级缓存对象持久化
在hibernate中session一级缓存机制中，有这么一种情况：问题描述：我需要new一个对象，对它的几个字段赋值，但是有一些属性并没有进行赋值，然后调用 session.save()方法，在提交事务后，会出现这样的情况： 1：在数据库中有默认属性的字段的值为空 2：既然是持久化对象，为什么在最后对象拿不到默认属性的值？通过调试后解决方案如下：对于问题一，如你在数据库里设置了
WebService调用错误合集 darkranger webservice
Java.Lang.NoClassDefFoundError: Org/Apache/Commons/Discovery/Tools/DiscoverSingleton 调用接口出错，一个简单的WebService import org.apache.axis.client.Call;import org.apache.axis.client.Service; 首先必不可
JSP和Servlet的中文乱码处理 aijuans Java Web
JSP和Servlet的中文乱码处理前几天学习了JSP和Servlet中有关中文乱码的一些问题，写成了博客，今天进行更新一下。应该是可以解决日常的乱码问题了。现在作以下总结希望对需要的人有所帮助。我也是刚学，所以有不足之处希望谅解。一、表单提交时出现乱码：在进行表单提交的时候，经常提交一些中文，自然就避免不了出现中文乱码的情况，对于表单来说有两种提交方式：get和post提交方式。所以
面试经典六问 atongyeye 工作面试
题记：因为我不善沟通，所以在面试中经常碰壁，看了网上太多面试宝典，基本上不太靠谱。只好自己总结，并试着根据最近工作情况完成个人答案。以备不时之需。以下是人事了解应聘者情况的最典型的六个问题： 1 简单自我介绍关于这个问题，主要为了弄清两件事，一是了解应聘者的背景，二是应聘者将这些背景信息组织成合适语言的能力。我的回答：(针对技术面试回答，如果是人事面试，可以就掌
contentResolver.query()参数详解百合不是茶 android query()详解
收藏csdn的博客,介绍的比较详细,新手值得一看 1.获取联系人姓名一个简单的例子，这个函数获取设备上所有的联系人ID和联系人NAME。 [java] view plain copy public void fetchAllContacts() {
ora-00054:resource busy and acquire with nowait specified解决方法 bijian1013 oracle 数据库 kill nowait
当某个数据库用户在数据库中插入、更新、删除一个表的数据，或者增加一个表的主键时或者表的索引时，常常会出现ora-00054:resource busy and acquire with nowait specified这样的错误。主要是因为有事务正在执行（或者事务已经被锁），所有导致执行不成功。 1.下面的语句
web 开发乱码征客丶 spring Web
以下前端都是 utf-8 字符集编码一、后台接收 1.1、 get 请求乱码 get 请求中，请求参数在请求头中；乱码解决方法： a、通过在web 服务器中配置编码格式：tomcat 中，在 Connector 中添加URIEncoding="UTF-8"； 1.2、post 请求乱码 post 请求中，请求参数分两部份， 1.2.1、url？参数，
【Spark十六】： Spark SQL第二部分数据源和注册表的几种方式 bit1129 spark
Spark SQL数据源和表的Schema case class apply schema parquet json JSON数据源准备源数据 {"name":"Jack", "age": 12, "addr":{"city":"beijing&
JVM学习之:调优总结 -Xms -Xmx -Xmn -Xss BlueSkator -Xss -Xmn -Xms -Xmx
堆大小设置JVM 中最大堆大小有三方面限制：相关操作系统的数据模型（32-bt还是64-bit）限制；系统的可用虚拟内存限制；系统的可用物理内存限制。32位系统下，一般限制在1.5G~2G；64为操作系统对内存无限制。我在Windows Server 2003 系统，3.5G物理内存，JDK5.0下测试，最大可设置为1478m。典型设置： java -Xmx355
jqGrid 各种参数详解(转帖) BreakingBad jqGrid
jqGrid 各种参数详解分类：源代码分享个人随笔请勿参考解决开发问题 2012-05-09 20:29 84282人阅读评论(22) 收藏举报 jquery 服务器 parameters function ajax string
读《研磨设计模式》-代码笔记-代理模式-Proxy bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.lang.reflect.InvocationHandler; import java.lang.reflect.Method; import java.lang.reflect.Proxy; /* * 下面
应用升级iOS8中遇到的一些问题 chenhbc ios8 升级iOS8
1、很奇怪的问题，登录界面，有一个判断，如果不存在某个值，则跳转到设置界面，ios8之前的系统都可以正常跳转，iOS8中代码已经执行到下一个界面了，但界面并没有跳转过去，而且这个值如果设置过的话，也是可以正常跳转过去的，这个问题纠结了两天多，之前的判断我是在 -(void)viewWillAppear:(BOOL)animated 中写的，最终的解决办法是把判断写在 -(void
工作流与自组织的关系？ comsci 设计模式工作
目前的工作流系统中的节点及其相互之间的连接是事先根据管理的实际需要而绘制好的，这种固定的模式在实际的运用中会受到很多限制，特别是节点之间的依存关系是固定的，节点的处理不考虑到流程整体的运行情况，细节和整体间的关系是脱节的，那么我们提出一个新的观点，一个流程是否可以通过节点的自组织运动来自动生成呢？这种流程有什么实际意义呢？这里有篇论文，摘要是：“针对网格中的服务
Oracle11.2新特性之INSERT提示IGNORE_ROW_ON_DUPKEY_INDEX daizj oracle
insert提示IGNORE_ROW_ON_DUPKEY_INDEX 转自：http://space.itpub.net/18922393/viewspace-752123 在 insert into tablea ...select * from tableb中，如果存在唯一约束，会导致整个insert操作失败。使用IGNORE_ROW_ON_DUPKEY_INDEX提示，会忽略唯一
二叉树:堆 dieslrae 二叉树
这里说的堆其实是一个完全二叉树,每个节点都不小于自己的子节点,不要跟jvm的堆搞混了.由于是完全二叉树,可以用数组来构建.用数组构建树的规则很简单: 一个节点的父节点下标为: (当前下标 - 1)/2 一个节点的左节点下标为: 当前下标 * 2 + 1 &
C语言学习八结构体 dcj3sjt126com c
为什么需要结构体，看代码 # include <stdio.h> struct Student //定义一个学生类型，里面有age, score, sex, 然后可以定义这个类型的变量 { int age; float score; char sex; } int main(void) { struct Student st = {80, 66.6,
centos安装golang dcj3sjt126com centos
#在国内镜像下载二进制包 wget -c http://www.golangtc.com/static/go/go1.4.1.linux-amd64.tar.gz tar -C /usr/local -xzf go1.4.1.linux-amd64.tar.gz #把golang的bin目录加入全局环境变量 cat >>/etc/profile<
10.性能优化-监控-MySQL慢查询 frank1234 性能优化 MySQL慢查询
1.记录慢查询配置 show variables where variable_name like 'slow%' ; --查看默认日志路径查询结果：--不用的机器可能不同 slow_query_log_file=/var/lib/mysql/centos-slow.log 修改mysqld配置文件：/usr /my.cnf[一般在/etc/my.cnf，本机在/user/my.cn
Java父类取得子类类名 happyqing java this 父类子类类名
在继承关系中，不管父类还是子类，这些类里面的this都代表了最终new出来的那个类的实例对象，所以在父类中你可以用this获取到子类的信息！ package com.urthinker.module.test; import org.junit.Test; abstract class BaseDao<T> { public void
Spring3.2新注解@ControllerAdvice jinnianshilongnian @Controller
@ControllerAdvice，是spring3.2提供的新注解，从名字上可以看出大体意思是控制器增强。让我们先看看@ControllerAdvice的实现： @Target(ElementType.TYPE) @Retention(RetentionPolicy.RUNTIME) @Documented @Component public @interface Co
Java spring mvc多数据源配置 liuxihope spring
转自：http://www.itpub.net/thread-1906608-1-1.html 1、首先配置两个数据库 <bean id="dataSourceA" class="org.apache.commons.dbcp.BasicDataSource" destroy-method="close&quo
第12章 Ajax（下） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
BW / Universe Mappings blueoxygen BO
BW Element OLAP Universe Element Cube Dimension Class Charateristic A class with dimension and detail objects (Detail objects for key and desription) Hi
Java开发熟手该当心的11个错误 tomcat_oracle java 多线程工作单元测试
#1、不在属性文件或XML文件中外化配置属性。比如，没有把批处理使用的线程数设置成可在属性文件中配置。你的批处理程序无论在DEV环境中，还是UAT（用户验收测试）环境中，都可以顺畅无阻地运行，但是一旦部署在PROD 上，把它作为多线程程序处理更大的数据集时，就会抛出IOException，原因可能是JDBC驱动版本不同，也可能是#2中讨论的问题。如果线程数目可以在属性文件中配置，那么使它成为
推行国产操作系统的优劣 yananay windows linux 国产操作系统
最近刮起了一股风，就是去“国外货”。从应用程序开始，到基础的系统，数据库，现在已经刮到操作系统了。原因就是“棱镜计划”，使我们终于认识到了国外货的危害，开始重视起了信息安全。操作系统是计算机的灵魂。既然是灵魂，为了信息安全，那我们就自然要使用和推行国货。可是，一味地推行，是否就一定正确呢？先说说信息安全。其实从很早以来大家就在讨论信息安全。很多年以前，就据传某世界级的网络设备制造商生产的交

[lucene]使用lucene建立网站搜索服务

你可能感兴趣的:([lucene]使用lucene建立网站搜索服务)