yangzongzhuan

【Lucene4.8教程之二】索引

一、基础内容

0、官方文档说明

（1）org.apache.lucene.index provides two primary classes: IndexWriter, which creates and adds documents to indices; and IndexReader, which accesses the data in the index.

（2）涉及的两个主要包有：

org.apache.lucene.index:Code to maintain and access indices.
org.apache.lucene.document:Thelogical representation of a Document for indexing and searching.

1、创建一个索引时，涉及的重要类有以下几个：

（1）IndexWriter：索引过程中的核心组件，用于创建新索引或者打开已有索引，以及向索引中添加、删除、更新被索引文档的信息。

（2）Document：代表一些域(field)的集合。

（3）Field及其子类：一个域，如文档创建时间，作者，内容等。

（4）Analyzer：分析器。

（5）Directory：可用于描述Lucene索引的存放位置。

2、索引文档的基本步骤如下：

（1）创建索引库IndexWriter
（2）根据文件创建文档Document
（3）向索引库中写入文档内容

基本程序如下：

[java]  view plain copy   
     
    
 package org.jediael.search.index;  
   
 import java.io.File;  
 import java.io.FileReader;  
 import java.io.IOException;  
   
 import org.apache.lucene.analysis.standard.StandardAnalyzer;  
 import org.apache.lucene.document.Document;  
 import org.apache.lucene.document.Field;  
 import org.apache.lucene.document.LongField;  
 import org.apache.lucene.document.StringField;  
 import org.apache.lucene.document.TextField;  
 import org.apache.lucene.index.IndexWriter;  
 import org.apache.lucene.index.IndexWriterConfig;  
 import org.apache.lucene.store.Directory;  
 import org.apache.lucene.store.FSDirectory;  
 import org.apache.lucene.util.Version;  
 import org.jediael.util.LoadProperties;  
   
 // 1、创建索引库IndexWriter  
 // 2、根据文件创建文档Document  
 // 3、向索引库中写入文档内容  
   
 public class IndexFiles {  
       
     private IndexWriter writer = null;  
   
     public void indexAllFileinDirectory(String indexPath, String docsPath)  
             throws IOException {  
         // 获取放置待索引文件的位置，若传入参数为空，则读取search.properties中设置的默认值。  
         if (docsPath == null) {  
             docsPath = LoadProperties.getProperties("docsDir");  
         }  
         final File docDir = new File(docsPath);  
         if (!docDir.exists() || !docDir.canRead()) {  
             System.out  
                     .println("Document directory '"  
                             + docDir.getAbsolutePath()  
                             + "' does not exist or is not readable, please check the path");  
             System.exit(1);  
         }  
   
         // 获取放置索引文件的位置，若传入参数为空，则读取search.properties中设置的默认值。  
         if (indexPath == null) {  
             indexPath = LoadProperties.getProperties("indexDir");  
         }  
         final File indexDir = new File(indexPath);  
         if (!indexDir.exists() || !indexDir.canRead()) {  
             System.out  
                     .println("Document directory '"  
                             + indexDir.getAbsolutePath()  
                             + "' does not exist or is not readable, please check the path");  
             System.exit(1);  
         }  
   
           
         try {  
             // 1、创建索引库IndexWriter  
             if(writer == null){  
                 initialIndexWriter(indexDir);  
             }  
             index(writer, docDir);  
         } catch (IOException e) {  
             e.printStackTrace();  
         } finally{  
             writer.close();  
         }  
     }  
   
     //使用了最简单的单例模式，用于返回一个唯一的IndexWirter，注意此处非线程安全，需要进一步优化。  
     private void initialIndexWriter(File indexDir) throws IOException {  
   
         Directory returnIndexDir = FSDirectory.open(indexDir);  
         IndexWriterConfig iwc = new IndexWriterConfig(Version.LUCENE_48,new StandardAnalyzer(Version.LUCENE_48));  
         writer = new IndexWriter(returnIndexDir, iwc);  
   
     }  
   
     private void index(IndexWriter writer, File filetoIndex) throws IOException {  
   
         if (filetoIndex.isDirectory()) {  
             String[] files = filetoIndex.list();  
             if (files != null) {  
                 for (int i = 0; i < files.length; i++) {  
                     index(writer, new File(filetoIndex, files[i]));  
                 }  
             }  
         } else {  
             // 2、根据文件创建文档Document，考虑一下能否不用每次创建Document对象  
             Document doc = new Document();  
             Field pathField = new StringField("path", filetoIndex.getPath(),  
                     Field.Store.YES);  
             doc.add(pathField);  
             doc.add(new LongField("modified", filetoIndex.lastModified(),  
                     Field.Store.YES));  
             doc.add(new StringField("title",filetoIndex.getName(),Field.Store.YES));  
             doc.add(new TextField("contents", new FileReader(filetoIndex)));  
             //System.out.println("Indexing " + filetoIndex.getName());  
   
             // 3、向索引库中写入文档内容  
             writer.addDocument(doc);  
         }  
     }  
 }  

一些说明：

（1）使用了最简单的单例模式，用于返回一个唯一的IndexWirter，注意此处非线程安全，需要进一步优化。

（2）注意IndexWriter，IndexReader等均需要耗费较大的资源用于创建实例，因此如非必要，使用单例模式创建一个实例后。

3、索引、Document、Filed之间的关系

简而言之，多个Filed组成一个Document，多个Document组成一个索引。

它们之间通过以下方法相互调用：

[java]  view plain copy   
     
    
 Document doc = new Document();  
 Field pathField = new StringField("path", filetoIndex.getPath(),Field.Store.YES);  
 doc.add(pathField);  
   
 writer.addDocument(doc);  

二、关于Field

（一）创建一个域（field）的基本方法

1、在Lucene4.x前，使用以下方式创建一个Field：

[java]  view plain copy   
      
     
 Field field = new Field("filename", f.getName(),  Field.Store.YES, Field.Index.NOT_ANALYZED);  
 Field field = new Field("contents", new FileReader(f));  
 Field field = new Field("fullpath", f.getCanonicalPath(), Field.Store.YES, Field.Index.NOT_ANALYZED)  

Filed的四个参数分别代表：

域的名称

域的值

是否保存

是否分析，对于文件名称，url，文件路径等内容，不需要对其进行分析。

2、在Lucene4后，定义了大量的Field的实现类型，根据需要，直接使用其中一个，不再使用笼统的Field来直接创建域。

Direct Known Subclasses:

BinaryDocValuesField, DoubleField, FloatField, IntField, LongField, NumericDocValuesField, SortedDocValuesField, SortedSetDocValuesField, StoredField, StringField, TextField

例如，对于上述三个Filed，可相应的改为：

[java]  view plain copy   
      
     
 <pre name="code" class="java">Field field = new StringField("path", filetoIndex.getPath(),Field.Store.YES);  
 Field field = new LongField("modified", filetoIndex.lastModified(),Field.Store.NO);  
 Field field = new TextField("contents", new FileReader(filetoIndex));  

在4.x以后，StringField即为NOT_ANALYZED的（即不对域的内容进行分割分析），而textField是ANALYZED的，因此，创建Field对象时，无需再指定此属性。见http://stackoverflow.com/questions/19042587/how-to-prevent-a-field-from-not-analyzing-in-lucene

即每一个Field的子类均具有默认的是否INDEXED与ANALYZED属性，不再需要显式指定。

官方文档：

StringField: A field that is indexed but not tokenized: the entire String value is indexed as a single token. For example this might be used for a 'country' field or an 'id' field, or any field that you intend to use for sorting or access through the field cache

TextField: A field that is indexed and tokenized,without term vectors. For example this would be used on a 'body' field, that contains the bulk of a document's text.

（二）有关于Field的一些选项

1、Field.Store.Yes/No

在创建一个Field的时候，需要传入一个参数，用于指定内容是否需要存储到索引中。这些被存储的内容可以在搜索结果中返回，呈现给用户。

二者最直观的差异在于：使用document.get("fileName")时，是否可以返回内容。

比如，一个文件的标题通常都是Field.Store.Yes，因为其内容一般需要呈现给用户，文件的作者、摘要等信息也一样。

但一个文件的内容可能就没必要保存了，一方面是文件内容太大，另一方面是没必要在索引中保存其信息，因为可以引导用户进入原有文件即可。

2、加权

可以对Filed及Document进行加权。注意加权是影响返回结果顺序的一个因素，但也仅仅是一个因素，它和其它因素一起构成了Lucene的排序算法。

（三）对富文本（非纯文本）的索引

上述的对正文的索引语句：

[java]  view plain copy   
      
 Field field = new TextField("contents", new FileReader(filetoIndex));

只对纯文本有效。对于word，excel，pdf等富文本，FileReader读取到的内容只是一些乱码，并不能形成有效的索引。

若需要对此类文本进行索引，需要使用Tika等工具先将其正文内容提取出来，然后再进行索引。
http://stackoverflow.com/questions/16640292/lucene-4-2-0-index-pdf

Lucene doesn't handle files at all, really. That demo handles plain text files, but core Lucene doesn't. FileStreamReader is a Java standard stream reader, and for your purposes, it will only handle plain text. This works on the Unix philosophy. Lucene indexes content. Tika extracts content from rich documents. I've added links to a couple of examples using Tika, one with Lucene directly, the other using Solr (which you might want to consider as well).

一个简单示例如下：

首先使用Tika提取word中的正文，再使用TextField索引文字。

[java]  view plain copy   
      
 doc.add(new TextField("contents", TikaBasicUtil.extractContent(filetoIndex),Field.Store.NO));

注意此处不能使用StringField，因为StringField限制了字符串的大小不能超过32766，否则会报异常IllegalArgumentException: Document contains at least one immense term in field="contents" (whose UTF8 encoding is longer than the max length 32766)*/

使用Tika索引富文本的简单示例如下：

注意，此示例不仅可以索引word，还可以索引pdf,excel等。

[java]  view plain copy   
      
     
 package org.jediael.util;  
   
 import java.io.File;  
 import java.io.FileInputStream;  
 import java.io.FileNotFoundException;  
 import java.io.IOException;  
 import java.io.InputStream;  
   
 import org.apache.tika.exception.TikaException;  
 import org.apache.tika.metadata.Metadata;  
 import org.apache.tika.parser.AutoDetectParser;  
 import org.apache.tika.parser.ParseContext;  
 import org.apache.tika.parser.Parser;  
 import org.apache.tika.sax.BodyContentHandler;  
 import org.xml.sax.ContentHandler;  
 import org.xml.sax.SAXException;  
   
 public class TikaBasicUtil {  
       
     public static String extractContent(File f) {  
         //1、创建一个parser  
         Parser parser = new AutoDetectParser();  
         InputStream is = null;  
         try {  
             Metadata metadata = new Metadata();  
             metadata.set(Metadata.RESOURCE_NAME_KEY, f.getName());  
             is = new FileInputStream(f);  
             ContentHandler handler = new BodyContentHandler();  
             ParseContext context = new ParseContext();  
             context.set(Parser.class,parser);  
               
             //2、执行parser的parse()方法。  
             parser.parse(is,handler, metadata,context);  
                   
             String returnString = handler.toString();  
               
             System.out.println(returnString.length());  
             return returnString;  
         } catch (FileNotFoundException e) {  
             e.printStackTrace();  
         } catch (IOException e) {  
             e.printStackTrace();  
         } catch (SAXException e) {  
             e.printStackTrace();  
         } catch (TikaException e) {  
             e.printStackTrace();  
         }finally {  
             try {  
                 if(is!=null) is.close();  
             } catch (IOException e) {  
                 e.printStackTrace();  
             }  
         }  
         return "No Contents";  
     }  
 }  

三、关于Document

FSDocument RAMDocument

四、关于IndexWriter

1、创建一个IndexWriter

[java]  view plain copy   
      
     
 Directory returnIndexDir = FSDirectory.open(indexDir);  
 IndexWriterConfig iwc = new IndexWriterConfig(Version.LUCENE_48,new StandardAnalyzer(Version.LUCENE_48));  
 iwc.setOpenMode(IndexWriterConfig.OpenMode.CREATE);  
 writer = new IndexWriter(returnIndexDir, iwc);  
 System.out.println(writer.getConfig().getOpenMode()+"");  
 System.out.println(iwc.getOpenMode());  

创建一个IndexWriter时，需要2个参数，一个是Directory对象，用于指定所创建的索引写到哪个地方；另一个是IndexWriterConfig对象，用于指定writer的配置。

2、IndexWriterConfig

（1）继承关系

java.lang.Object
- org.apache.lucene.index.LiveIndexWriterConfig
- - org.apache.lucene.index.IndexWriterConfig

All Implemented Interfaces:

Cloneable

（2） Holds all the configuration that is used to create an IndexWriter . Once IndexWriter has been created with this object, changes to this object will not affect the IndexWriter instance.

（3）IndexWriterConfig.OpenMode：指明了打开索引目录的方式，有以下三种：

APPEND:Opens an existing index. 若原来存在索引，则将本次索引的内容追加进来。不管文档是否与原来是否重复，因此若2次索引的文档相同，则返回结果数则为原来的2倍。

CREATE:Creates a new index or overwrites an existing one. 若原来存在索引，则先将其删除，再创建新的索引

CREATE_OR_APPEND【默认值】:Creates a new index if one does not exist, otherwise it opens the index and documents will be appended.

3、索引的优化

索引过程中，会将索引结果存放至多个索引文件中，这样会回收索引的效率，但在搜索时，需要将多个索引文件中的返回结果进行合并处理，因此效率较低。

为了加快搜索结果的返回，可以将索引进行优化。

[java]  view plain copy   
      
     
 writer.addDocument(doc);  
 writer.forceMerge(2);  

索引的优化是将索引结果文件归为一个或者有限的多个，它加大的索引过程中的消耗，减少了搜索时的消耗。

五、关于Analyzer

此处主要关于和索引期间相关的analyzer，关于analyzer更详细的内容请参见 http://blog.csdn.net/jediael_lu/article/details/33303499 【Lucene4.8教程之四】分析

在创建IndexWriter时，需要指定分析器，如：

[java]  view plain copy   
      
     
 IndexWriterConfig iwc = new IndexWriterConfig(Version.LUCENE_48,new StandardAnalyzer(Version.LUCENE_48));  
 writer = new IndexWriter(IndexDir, iwc);  

便在每次向writer中添加文档时，可以针对该文档指定一个分析器，如

[java]  view plain copy   
      
 writer.addDocument(doc, new SimpleAnalyzer(Version.LUCENE_48));

六、关于Directory

Python 数据分析：numpy，抽提，基本索引。听故事学知识点怎么这么容易？好开心啊没烦恼 numpy python 数据分析 numpy 开发语言数据挖掘人工智能机器学习
目录1示例代码2欢迎纠错3免费爬虫------以下关于Markdown编辑器新的改变功能快捷键合理的创建标题，有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能，丰富你的文章UML图表FLowchart流程图导出与导
Python 数据分析：pandas 的 DataFrame，抽行、抽列、抽行列。df[] / df.loc[] / df.iloc[]，位置索引 / 标签索引，切片 / 不切片好开心啊没烦恼 Python数据分析 python 数据分析 pandas 开发语言数据挖掘
目录1预备知识：Series1.1生成1.2抽提（1）单条（2）多条不连（3）多条连1.3取值2正文：DataFrame2.1生成df2.2抽提2.2.1抽列（1）单列df[]df.loc[]df.iloc[]（2）多列不连df[]df.loc[]df.iloc[]（3）多列连df[]←不存在这种抽提法！df.loc[]df.iloc[]2.2.2抽行（1）单行df[]df.loc[]df.ilo
转全角半角(C#，VB.NET) chinaherolts2008 vb.net教程 c#开发语言 vb.net教程
vb.net教程https://www.xin3721.com/eschool/vbnetxin3721///////转全角的函数(SBCcase)//////任意字符串///全角字符串//////全角空格为12288，半角空格为32///其他字符半角(33-126)与全角(65281-65374)的对应关系是：均相差65248///publicstringToSBC(stringinput){/
小程序领域开发语言的基础教程小程序开发2020 小程序开发语言 ai
小程序领域开发语言的基础教程：从0到1轻松入门关键词：小程序开发、WXML、WXSS、JavaScript、双线程模型、生命周期、组件化摘要：本文是针对小程序开发语言的零基础入门指南，通过生活类比、代码示例和实战案例，详细讲解小程序核心开发语言（WXML/WXSS/JavaScript）的原理、协作方式及实际应用。无论你是前端新手还是想转行小程序开发的小白，都能通过本文掌握小程序开发的“三板斧”，
LOGO SEO优化码哥DFS 前端 html css
1.logo里面首先放一个h1标签，目的是为了提权，告诉搜索引擎，这个地方很重要。2.h1里面再放一个链接，可以返回首页的，把logo的背景图片给链接即可。3.为了搜索引擎收录我们，我们链接里面要放文字(网站名称)，但是文字不要显示出来。方法1:text-indent移到盒子外面(text-indent:-9999px),然后overflow:hidden。方法2:直接给font-size:0;就
在新设备上部署Git：完整教程与常见问题分析马里马里奥- git git容易见的一些问题
在现代软件开发中，Git是必不可少的版本控制工具。无论是个人项目还是团队协作，在新设备上快速部署Git都能提高效率。本博客将提供一份结构清晰的教程，指导你如何在新设备上完成Git部署，并分析部署过程中可能遇到的常见问题。教程基于标准实践，适用于Windows、macOS和Linux系统。让我们一步步来！1.引言Git是一个分布式版本控制系统，用于跟踪代码变更、协作开发。在新设备上部署Git包括安装
KITTI数据集可视化实用教程及源码解析国营窝窝乡蛮大人
本文还有配套的精品资源，点击获取简介：本文详细介绍如何使用源码实现KITTI数据集的可视化，强调数据集可视化在计算机视觉领域的关键作用。重点介绍如何加载、处理和融合KITTI数据集中的图像和激光雷达数据，并通过可视化手段分析结果，包括图像点云投影、坐标转换、颜色映射等技术。读者将通过学习源码深入理解数据结构、文件格式，并定制化工具以满足特定项目需求。1.计算机视觉数据集可视化的重要性在计算机视觉领
C++泛型编程2 - 类模板
C++类模板全面教程类模板是C++中强大且灵活的特性，它允许我们创建可适用于多种数据类型的类。下面我将从基础到高级，系统性地介绍类模板。一、类模板基本概念1.1什么是类模板类模板是一种允许我们使用不同类型创建类的蓝图。就像函数模板可以生成针对不同类型参数的函数一样，类模板可以生成针对不同类型参数的类。1.2为什么需要类模板假设你需要一个可以存储任何类型数据的栈，不使用模板就需要为每种类型分别创建类
documents4j 使用教程惠悦颖
documents4j使用教程documents4jdocuments4jisaJavalibraryforconvertingdocumentsintoanotherdocumentformat项目地址:https://gitcode.com/gh_mirrors/do/documents4j1.项目介绍documents4j是一个Java库，用于将文档转换为另一种文档格式。它通过委托给任何能够
Nacos适配GaussDB超详细部署流程，通过二进制包、以及 Docker 打通用镜像包部署保姆级教程 Mr.L-OAM linux系统运维 gaussdb docker 经验分享
1部署openGauss官方文档下载https://support.huaweicloud.com/download_gaussdb/index.html社区地址安装包下载本文主要是以部署轻量级为主要教程，系统为openEuler，ip:192.168.1.151.1系统环境准备操作系统选择系统AARCH64X86-64openEuler√√CentOS7×√Docker√√1.2软硬件安装环境版
【TVM 教程】PAPI 入门
ApacheTVM是一个深度的深度学习编译框架，适用于CPU、GPU和各种机器学习加速芯片。更多TVM中文文档可访问→https://tvm.hyper.ai/性能应用程序编程接口（PerformanceApplicationProgrammingInterface，简称PAPI）是一个可在各种平台上提供性能计数器的库。在指定的运行期间，性能计数器提供处理器行为的准确底层信息，包含简单的指标，如总
Python爬虫实战：研究difflib库相关技术 ylfhpy 爬虫项目实战 python 爬虫 easyui 开发语言前端 difflib
1.引言1.1研究背景与意义在信息爆炸的数字时代，互联网每天产生海量文本内容。据统计，全球新闻网站日均发布文章超过300万篇，社交媒体平台产生的文本信息量更以亿级单位增长。这种信息过载带来了内容同质化、抄袭剽窃等问题，给新闻媒体行业、学术研究领域和搜索引擎优化等带来了挑战。文本相似度分析作为自然语言处理的重要分支，能够有效识别内容间的相似程度，具有重要的应用价值：新闻媒体行业：通过检测新闻抄袭和重
HarmonyOS NEXT仓颉开发语言实现画板案例营养师老鲜 harmonyos 开发语言华为
合集-仓颉教程(29)1.详解鸿蒙仓颉开发语言中的日志打印问题05-212.鸿蒙仓颉开发语言实战教程：实现商城应用首页05-223.鸿蒙仓颉开发语言实战教程：页面跳转和传参05-254.鸿蒙仓颉语言开发教程：页面和组件的生命周期05-285.鸿蒙仓颉语言开发实战教程：购物车页面06-036.鸿蒙仓颉语言开发实战教程：商城登录页06-047.鸿蒙仓颉语言开发实战教程：商城搜索页06-058.鸿蒙仓颉
鸿蒙Next仓颉语言开发实战教程：店铺详情页杨凌晨 harmonyos 华为
合集-仓颉教程(27)1.详解鸿蒙仓颉开发语言中的日志打印问题05-212.鸿蒙仓颉开发语言实战教程：实现商城应用首页05-223.鸿蒙仓颉开发语言实战教程：页面跳转和传参05-254.鸿蒙仓颉语言开发教程：页面和组件的生命周期05-285.鸿蒙仓颉语言开发实战教程：购物车页面06-036.鸿蒙仓颉语言开发实战教程：商城登录页06-047.鸿蒙仓颉语言开发实战教程：商城搜索页06-058.鸿蒙仓颉
HarmonyOS NEXT仓颉开发语言实战案例：动态广场 SSA丝社APP harmonyos 开发语言华为
合集-仓颉教程(29)1.详解鸿蒙仓颉开发语言中的日志打印问题05-212.鸿蒙仓颉开发语言实战教程：实现商城应用首页05-223.鸿蒙仓颉开发语言实战教程：页面跳转和传参05-254.鸿蒙仓颉语言开发教程：页面和组件的生命周期05-285.鸿蒙仓颉语言开发实战教程：购物车页面06-036.鸿蒙仓颉语言开发实战教程：商城登录页06-047.鸿蒙仓颉语言开发实战教程：商城搜索页06-058.鸿蒙仓颉
Docker 安装Immich教程 Roc-xb Docker docker 容器运维
Immich是一个开源的自托管照片和视频管理平台，专为帮助用户存储、管理、和分享个人媒体库而设计。Immich的目标是提供一个类似GooglePhotos的替代方案，但不依赖于第三方服务，用户可以完全控制自己的数据。本章教程，记录如何用Docker部署安装Immich，使用的操作系统的Ubuntu，已安装好了Docker。一、前期准备工作1、创建目录mkdir./immich-app&&cd./i
python系列教程246——多态人工智能AI技术 python系列教程 python 开发语言
朋友们，如需转载请标明出处：https://blog.csdn.net/jiangjunshow声明：在人工智能技术教学期间，不少学生向我提一些python相关的问题，所以为了让同学们掌握更多扩展知识更好地理解AI技术，我让助理负责分享这套python系列教程，希望能帮到大家！由于这套python教程不是由我所写（有时候有空也会参与编写），所以不如我的人工智能教程风趣幽默，学起来比较枯燥；但它的知
ES6 新特性从入门到精通：100 + 代码示例带你轻松掌握（附图解教程）北泽别胡说新手保护期从0到1学前端 javascript 前端开发语言 es6
本文针对JavaScript新手系统讲解ES6核心语法，涵盖变量声明、箭头函数、解构赋值、类与继承、Promise等核心模块。通过150+行带注释代码，结合「传统写法对比」和「新手避坑指南」，帮助读者3小时掌握ES6关键特性，快速应用于项目开发。一、ES6入门：为什么必须学习ES6？1.1ES6的革命性升级代码简洁性：箭头函数、模板字符串等语法减少冗余代码逻辑清晰性：class类、模块化语法让代码
autobank渗流分析计算教程_高土石坝坡稳定性分析 Oliverzzzhang
原标题：基于滑弧动力有限元耦合法的高土石坝坝坡稳定性分析摘要:为研究高土石坝坝坡的稳定性，以某水电站高土石坝坝坡为例，采用条分法与有限元法耦合的计算方法进行分析，选取3个典型断面，对其设计工况和校核工况下的上下游断面的安全系数进行计算。计算结果表明:(1)下游坝坡最小安全系数比上游大，设计工况安全系数比校核工况安全系数大;(2)3个断面在各工况下取得最小值的时刻近似，符合坝坡稳定的计算规律;(3)
Kyle的天机学堂学习笔记 Z2475269074 学习笔记
本文将展示一个小白从0->1完成项目的全部历练已经心得PS:要求做到真正的自我思考而不是对着教程敲代码，并借用AI进行辅佐与思考DAY1Maven子工程会继承父工程所有依赖有三套生命周期，互不干扰且同一生命周期内执行命令会以此完成之前的命令1.clean2.default(compile,test，package,install)3.site(deploy)对象DTO数据传输对象，用于服务端与客户
构建私有视觉搜索应用：多模态大模型的应用实例 2301_80727036 自然语言处理
在当今的科技时代，视觉搜索功能已经不再是新鲜事物，许多智能手机用户都可以通过自然语言搜索照片。随着开源多模态大型语言模型（Multi-modalLLMs）的兴起，我们现在可以为自己构建这种视觉搜索应用，用于管理自己的私人照片收藏。本教程将向您展示如何通过代码示例，使用开源多模态LLM构建私有视觉搜索和问答系统。技术背景介绍多模态大模型结合了文本和图像处理能力，使得我们可以开发更智能的应用程序。通过
Kyle的算法记录 Z2475269074 算法
本文将展示一个小白从0->1完成算法的全部历练已经心得PS:要求做到真正的自我思考而不是对着教程敲代码，并借用AI进行辅佐与思考LinkedListLinkedList里的add和remove，都是索引/索引+值进行操作//在链表头部插入元素0lst.addFirst(0);//在链表尾部插入元素6lst.addLast(6);队列QueueQueueq=newLinkedList();//向栈顶
奶油绿风格户外风景人像自拍Lr调色教程，手机滤镜PS+Lightroom预设下载！调了个寂寞电影预设 lr调色摄影后期人像预设 lr预设 Lightroom预设
调色介绍奶油绿风格户外风景人像自拍摄影Lr调色，是在AdobeLightroom软件中，针对户外风景里的人像自拍照进行后期调色处理。这种调色旨在打造出以奶油绿色为主导色调，使画面呈现出清新、柔和、温馨质感的视觉风格，让照片如同奶油般丝滑且富有治愈感，从而提升照片整体美感与独特氛围。预设信息调色风格：电影风格预设适合类型：人像，自拍，户外，风光，模特，封面照等预设格式：XMP+DNG手机滤镜资源编号
基于SpringBoot律师事务所案件管理系统的设计与实现一点教程 Java项目 spring boot 后端 java spring 律师事务所案件管理系统
博主主页：一点教程博主简介：专注Java技术领域和毕业设计项目实战、Java微信小程序、安卓等技术开发，远程调试部署、代码讲解、文档指导、ppt制作等技术指导。主要内容：毕业设计，SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Python、Nodejs、小程序、安卓app、大数据等设计与开发感兴趣的可以先收藏起来，还有大家在毕设选题，项目以及论文编写等相关问题都可以和博主沟通，希
R语言入门课| 05 一文掌握R语言常见数据类型 Biomamba生信基地 r语言信息可视化开发语言生信医药
视频教程大家可以先做一做R语言基础小测验，看看自己是否需要跟我们5.5h入门R语言的课程。先上教程视频，B站同步播出：https://www.bilibili.com/video/BV1miNVeWEkw完整视频回放和答疑服务可见：5.5h入门R语言本节课程视频：（点击此处查看）"R语言入门课"是我们认为生信小白入门不得不听的一个课程，我们也为这个课程准备了许多干货。R语言的精髓便是数据处理，在本
Python+Vue计算机毕业设计智慧养老院管理系统egn81（源码+程序+LW+部署）心心毕设程序源码 python vue.js 课程设计
该项目含有源码、文档、程序、数据库、配套开发软件、软件安装教程项目运行环境配置：Python3.7.7+Django+Mysql5.7+piplist+HBuilderX（Vscode也行）+Vue+Pychram社区版。项目技术：Django+Vue+Python+Mysql等等组成，B/S模式等等。环境需要1.运行环境：最好是安装Python3.7.7，我们在这个平台上运行的。其他版本理论上也
【LeetCode】串联所有单词的子串 java 手写从前Code LeetCode刷题 leetcode 算法哈希表
给定一个字符串s和一些长度相同的单词words。找出s中恰好可以由words中所有单词串联形成的子串的起始位置。注意子串要与words中的单词完全匹配，中间不能有其他字符，但不需要考虑words中单词串联的顺序。示例1：输入：s="barfoothefoobarman",words=["foo","bar"]输出：[0,9]解释：从索引0和9开始的子串分别是"barfoo"和"foobar"。输出
玩转传奇搭建，怎样用手里的云服务器搭建一款战神传奇手游技术教程，实现完全联网，实现多人同玩，10分钟学会架设游戏，云服务器或轻量云皆可搭建，快叫上朋友一起挂机砍怪吧！ qq_502428990 服务器游戏运维
这段时间不知怎么的，忽然有些怀念过往，想起十几年前和兄弟们网吧通宵砍传奇的场景，于时自己找了一些传奇代码，用云服务器搭建了一款传奇，怀念一下青春岁月！配置要求：最低2核4G,普通云服务器或轻量云皆可。系统要求：windows2008或者windows2012版64位。首先把服务器硬盘分出一个D盘来，云服务器默认没有D盘，需要从C盘分出一部分做D盘，当然你也可以购买，然后挂载上去。开始架设：第一步：
假如你从现在开始学习软件测试，需要多久才能学会呢？ AIZHINAN 学习
首先，不要去网上找那些零零碎碎的教程，很难学懂！你可以根据这个学习大纲定计划只要3-6个月就可以掌握软件测试，升职涨薪不在话下：1.基础阶段：先搞懂测试理论、用例设计，会用Jira写Bug；2.中级阶段：学SQL查数据、Linux看日志，Postman测接口，再用Selenium玩自动化；3.进阶阶段：搭Pytest框架、用JMeter压测，安全测试搞BurpSuite；4.扩展技能：Python
关于自动化测试 AIZHINAN log4j
B站讲的最好的自动化测试教程，工具+框架附项目实战一套速通，零基础完全轻松掌握！自动化测试课程、web/app/接口概述常见的三类自动化测试有：单元测试，集成测试以及功能测试。单元测试单元测试是一个白盒测试，一般是针对一个方法单元进行的测试，单元测试要求运行快，编写简单。所以一般单元测试有这么一些特质：不连接数据库不访问磁盘文件不访问远程网络能够在很短时间内运行完毕（比如三秒内）集成测试集成测试可
jQuery 跨域访问的三种方式 No 'Access-Control-Allow-Origin' header is present on the reque qiaolevip 每天进步一点点学习永无止境跨域众观千象
XMLHttpRequest cannot load http://v.xxx.com. No 'Access-Control-Allow-Origin' header is present on the requested resource. Origin 'http://localhost:63342' is therefore not allowed access. test.html:1
mysql 分区查询优化 annan211 java 分区优化 mysql
分区查询优化引入分区可以给查询带来一定的优势，但同时也会引入一些bug. 分区最大的优点就是优化器可以根据分区函数来过滤掉一些分区，通过分区过滤可以让查询扫描更少的数据。所以，对于访问分区表来说，很重要的一点是要在where 条件中带入分区，让优化器过滤掉无需访问的分区。可以通过查看explain执行计划，是否携带 partitions
MYSQL存储过程中使用游标 chicony Mysql存储过程
DELIMITER $$ DROP PROCEDURE IF EXISTS getUserInfo $$ CREATE PROCEDURE getUserInfo(in date_day datetime)-- -- 实例-- 存储过程名为：getUserInfo-- 参数为：date_day日期格式:2008-03-08-- BEGINdecla
mysql 和 sqlite 区别 Array_06 sqlite
转载： http://www.cnblogs.com/ygm900/p/3460663.html mysql 和 sqlite 区别 SQLITE是单机数据库。功能简约，小型化，追求最大磁盘效率 MYSQL是完善的服务器数据库。功能全面，综合化，追求最大并发效率 MYSQL、Sybase、Oracle等这些都是试用于服务器数据量大功能多需要安装，例如网站访问量比较大的。而sq
pinyin4j使用 oloz pinyin4j
首先需要pinyin4j的jar包支持；jar包已上传至附件内方法一:把汉字转换为拼音；例如：编程转换后则为biancheng /** * 将汉字转换为全拼 * @param src 你的需要转换的汉字 * @param isUPPERCASE 是否转换为大写的拼音； true:转换为大写；fal
微博发送私信随意而生微博
在前面文章中说了如和获取登陆时候所需要的cookie，现在只要拿到最后登陆所需要的cookie，然后抓包分析一下微博私信发送界面 http://weibo.com/message/history?uid=****&name=**** 可以发现其发送提交的Post请求和其中的数据，让后用程序模拟发送POST请求中的数据，带着cookie发送到私信的接入口，就可以实现发私信的功能了。
jsp 香水浓 jsp
JSP初始化容器载入JSP文件后，它会在为请求提供任何服务前调用jspInit()方法。如果您需要执行自定义的JSP初始化任务，复写jspInit()方法就行了 JSP执行这一阶段描述了JSP生命周期中一切与请求相关的交互行为，直到被销毁。当JSP网页完成初始化后
在 Windows 上安装 SVN Subversion 服务端 AdyZhang SVN
在 Windows 上安装 SVN Subversion 服务端2009-09-16高宏伟哈尔滨市道里区通达街291号最佳阅读效果请访问原地址：http://blog.donews.com/dukejoe/archive/2009/09/16/1560917.aspx 现在的Subversion已经足够稳定，而且已经进入了它的黄金时段。我们看到大量的项目都在使
android开发中如何使用 alertDialog从listView中删除数据？ aijuans android
我现在使用listView展示了很多的配置信息，我现在想在点击其中一条的时候填出 alertDialog,点击确认后就删除该条数据，（ ArrayAdapter ，ArrayList，listView 全部删除），我知道在下面的onItemLongClick 方法中参数 arg2 是选中的序号，但是我不知道如何继续处理下去 1 2 3
jdk-6u26-linux-x64.bin 安装 baalwolf linux
1.上传安装文件(jdk-6u26-linux-x64.bin) 2.修改权限 [root@localhost ~]# ls -l /usr/local/jdk-6u26-linux-x64.bin 3.执行安装文件 [root@localhost ~]# cd /usr/local [root@localhost local]# ./jdk-6u26-linux-x64.bin&nbs
MongoDB经典面试题集锦 BigBird2012 mongodb
1.什么是NoSQL数据库？NoSQL和RDBMS有什么区别？在哪些情况下使用和不使用NoSQL数据库？ NoSQL是非关系型数据库，NoSQL = Not Only SQL。关系型数据库采用的结构化的数据，NoSQL采用的是键值对的方式存储数据。在处理非结构化/半结构化的大数据时；在水平方向上进行扩展时；随时应对动态增加的数据项时可以优先考虑使用NoSQL数据库。在考虑数据库的成熟
JavaScript异步编程Promise模式的6个特性 bijian1013 JavaScript Promise
Promise是一个非常有价值的构造器，能够帮助你避免使用镶套匿名方法，而使用更具有可读性的方式组装异步代码。这里我们将介绍6个最简单的特性。在我们开始正式介绍之前，我们想看看Javascript Promise的样子： var p = new Promise(function(r
[Zookeeper学习笔记之八]Zookeeper源代码分析之Zookeeper.ZKWatchManager bit1129 zookeeper
ClientWatchManager接口 //接口的唯一方法materialize用于确定那些Watcher需要被通知 //确定Watcher需要三方面的因素1.事件状态 2.事件类型 3.znode的path public interface ClientWatchManager { /** * Return a set of watchers that should
【Scala十五】Scala核心九：隐式转换之二 bit1129 scala
隐式转换存在的必要性，在Java Swing中，按钮点击事件的处理，转换为Scala的的写法如下： val button = new JButton button.addActionListener( new ActionListener { def actionPerformed(event: ActionEvent) {
Android JSON数据的解析与封装小Demo ronin47
转自：http://www.open-open.com/lib/view/open1420529336406.html package com.example.jsondemo; import org.json.JSONArray; import org.json.JSONException; import org.json.JSONObject; impor
[设计]字体创意设计方法谈 brotherlamp UI ui自学 ui视频 ui教程 ui资料
从古至今，文字在我们的生活中是必不可少的事物，我们不能想象没有文字的世界将会是怎样。在平面设计中，UI设计师在文字上所花的心思和功夫最多，因为文字能直观地表达UI设计师所的意念。在文字上的创造设计，直接反映出平面作品的主题。如设计一幅戴尔笔记本电脑的广告海报，假设海报上没有出现“戴尔”两个文字，即使放上所有戴尔笔记本电脑的图片都不能让人们得知这些电脑是什么品牌。只要写上“戴尔笔
单调队列-用一个长度为k的窗在整数数列上移动，求窗里面所包含的数的最大值 bylijinnan java 算法面试题
import java.util.LinkedList; /* 单调队列滑动窗口单调队列是这样的一个队列：队列里面的元素是有序的，是递增或者递减题目：给定一个长度为N的整数数列a(i),i=0,1,...,N-1和窗长度k. 要求：f(i) = max{a(i-k+1),a(i-k+2),..., a(i)},i = 0,1,...,N-1 问题的另一种描述就
struts2处理一个form多个submit chiangfai struts2
web应用中，为完成不同工作，一个jsp的form标签可能有多个submit。如下代码： <s:form action="submit" method="post" namespace="/my"> <s:textfield name="msg" label="叙述：">
shell查找上个月，陷阱及野路子 chenchao051 shell
date -d "-1 month" +%F 以上这段代码，假如在2012/10/31执行，结果并不会出现你预计的9月份，而是会出现八月份，原因是10月份有31天，9月份30天，所以-1 month在10月份看来要减去31天，所以直接到了8月31日这天，这不靠谱。野路子解决：假设当天日期大于15号
mysql导出数据中文乱码问题 daizj mysql 中文乱码导数据
解决mysql导入导出数据乱码问题方法：１、进入mysql，通过如下命令查看数据库编码方式： mysql> show variables like 'character_set_%'; +--------------------------+----------------------------------------+ | Variable_name&nbs
SAE部署Smarty出现：Uncaught exception 'SmartyException' with message 'unable to write dcj3sjt126com PHP smarty sae
对于SAE出现的问题：Uncaught exception 'SmartyException' with message 'unable to write file...。官方给出了详细的FAQ：http://sae.sina.com.cn/?m=faqs&catId=11#show_213 解决方案为： 01 $path
《教父》系列台词 dcj3sjt126com
Your love is also your weak point. 你的所爱同时也是你的弱点。 If anything in this life is certain, if history has taught us anything, it is that you can kill anyone. 不顾家的人永远不可能成为一个真正的男人。 &
mongodb安装与使用 dyy_gusi mongo
一.MongoDB安装和启动,widndows和linux基本相同 1.下载数据库, linux:mongodb-linux-x86_64-ubuntu1404-3.0.3.tgz 2.解压文件,并且放置到合适的位置 tar -vxf mongodb-linux-x86_64-ubun
Git排除目录 geeksun git
在Git的版本控制中，可能有些文件是不需要加入控制的，那我们在提交代码时就需要忽略这些文件，下面讲讲应该怎么给Git配置一些忽略规则。有三种方法可以忽略掉这些文件，这三种方法都能达到目的，只不过适用情景不一样。 1. 针对单一工程排除文件这种方式会让这个工程的所有修改者在克隆代码的同时，也能克隆到过滤规则，而不用自己再写一份，这就能保证所有修改者应用的都是同一
Ubuntu 创建开机自启动脚本的方法 hongtoushizi ubuntu
转载自： http://rongjih.blog.163.com/blog/static/33574461201111504843245/ Ubuntu 创建开机自启动脚本的步骤如下： 1) 将你的启动脚本复制到 /etc/init.d目录下以下假设你的脚本文件名为 test。 2) 设置脚本文件的权限 $ sudo chmod 755
第八章流量复制/AB测试/协程 jinnianshilongnian nginx lua coroutine
流量复制在实际开发中经常涉及到项目的升级，而该升级不能简单的上线就完事了，需要验证该升级是否兼容老的上线，因此可能需要并行运行两个项目一段时间进行数据比对和校验，待没问题后再进行上线。这其实就需要进行流量复制，把流量复制到其他服务器上，一种方式是使用如tcpcopy引流；另外我们还可以使用nginx的HttpLuaModule模块中的ngx.location.capture_multi进行并发
电商系统商品表设计 lkl
DROP TABLE IF EXISTS `category`; -- 类目表 /*!40101 SET @saved_cs_client = @@character_set_client */; /*!40101 SET character_set_client = utf8 */; CREATE TABLE `category` ( `id` int(11) NOT NUL
修改phpMyAdmin导入SQL文件的大小限制 pda158 sql mysql
　用phpMyAdmin导入mysql数据库时，我的10M的数据库不能导入，提示mysql数据库最大只能导入2M。　　 phpMyAdmin数据库导入出错：　　You probably tried to upload too large file. Please refer to documentation for ways to workaround this limit.
Tomcat性能调优方案 Sobfist apache jvm tomcat 应用服务器
一、操作系统调优对于操作系统优化来说，是尽可能的增大可使用的内存容量、提高CPU的频率，保证文件系统的读写速率等。经过压力测试验证，在并发连接很多的情况下，CPU的处理能力越强，系统运行速度越快。。【适用场景】任何项目。二、Java虚拟机调优应该选择SUN的JVM，在满足项目需要的前提下，尽量选用版本较高的JVM，一般来说高版本产品在速度和效率上比低版本会有改进。 J
SQLServer学习笔记 vipbooks 数据结构 xml
1、create database school 创建数据库school 2、drop database school 删除数据库school 3、use school 连接到school数据库，使其成为当前数据库 4、create table class(classID int primary key identity not null) 创建一个名为class的表，其有一

【Lucene4.8教程之二】索引

你可能感兴趣的:(【Lucene4.8教程之二】索引)