cenlyz

使用solr 检索word文档

I. Solr

Solr简介

Solr是Apache的顶级开源项目，使用java开发，基于Lucene的全文检索服务器。 Solr比Lucene提供了更多的查询语句，而且它可扩展、可配置，同时它对Lucene的性能进行了优化。

Solr的全文检索流程

索引流程： Solr客户端（浏览器、java程序）可以向Solr服务端发送POST请求，请求内容是包含Field等信息的一个xml文档，通过该文档，Solr实现对索引的维护（增删改）。
搜索流程： Solr客户端（浏览器、java程序）可以向Solr服务端发送GET请求，Solr服务器返回一个xml文档。

Solr同样没有视图渲染的功能。

与Lucence区别

Lucene是一个全文检索引擎工具包，它只是一个jar包，不能独立运行，对外提供服务。

Solr是一个全文检索服务器，它可以单独运行在servlet容器，可以单独对外提供搜索和索引功能。Solr比Lucene在开发全文检索功能时，更快捷、更方便。

II. Solr安装配置

环境依赖

Solr7.4.0：http://archive.apache.org/dist/lucene/solr/
Lucence7.4.0：http://archive.apache.org/dist/lucene/java/
MySQL5
Tomcat8.5

Solr目录结构

这里选择的是Windows平台的软件包，Solr7.4.0解压目录如下：

bin：包括一些使用Solr的重要脚本

solr和solr.cmd：分别用于Linux和Windows系统，根据所选参数不同而控制Solr的启动和停止
	post：提供了一个用于发布内容的命令行接口工具。支持导入JSON，XML和CSV，也可以导入HTML，PDF，Microsoft Office格式（如MS Word），纯文本等等。
	solr.in.sh和solr.in.cmd：分别用于Linux和Windows系统的属性文件
	install_solr_services.sh：用于Linux系统将Solr作为服务安装


contrib：包含一些solr的一些插件或扩展 
analysis-extras： 包含一些文本分析组件及其依赖
	clustering：包含一个用于集群搜索结果的引擎
	dataimporthandler：把数据从数据库或其它数据源导入到solr
	extraction：整合了Apache Tika，Tika是用于解析一些富文本(诸如Word，PDF)的框架
	langid：检测将要索引的数据的语言
	map-reduce：包含一些工具用于Solr和Hadoop Map Reduce协同工作
	morphlines-core：包含Kite Morphlines，它用于构建、改变基于Hadoop进行ETL（extract、transfer、load）的流式处理程序
	uima：包含用于整合Apache UIMA（文本元数据提取的框架）类库
	velocity：包含基于Velocity模板的简单的搜索UI框架

dist：包含主要的Solr的jar文件
docs：文档
example：包含一些展示solr功能的例子 
exampledocs：这是一系列简单的CSV，XML和JSON文件，可以bin/post在首次使用Solr时使用
	example-DIH：此目录包含一些DataImport Handler（DIH）示例，可帮助您开始在数据库，电子邮件服务器甚至Atom订阅源中导入结构化内容。每个示例将索引不同的数据集
	files：该files目录为您可能在本地存储的文档（例如Word或PDF）提供基本的搜索UI
	films：该films目录包含一组关于电影的强大数据，包括三种格式：CSV，XML和JSON

licenses：包含所有的solr所用到的第三方库的许可证
server：solr应用程序的核心，包含了运行Solr实例而安装好的Jetty servlet容器。 
contexts：这个文件包含了solr Web应用程序的Jetty Web应用的部署的配置文件
	etc：主要就是一些Jetty的配置文件和示例SSL密钥库
	lib：Jetty和其他第三方的jar包
	logs：Solr的日志文件
	resources：Jetty-logging和log4j的属性配置文件
	solr：新建的core或Collection的默认保存目录，里面必须要包含solr.xml文件
	configsets：包含solr的配置文件
	solr-webapp：包含solr服务器使用的文件；不要在此目录中编辑文件(solr不是JavaWeb应用程序)

Solr的启动和关闭

启动：cmd进入bin目录后

solr start

启动完成即可访问：http://localhost:8983/solr/

关闭Solr需要指定端口：

solr stop -p 8983

创建Solr Core

两种方法：

通过dos命令创建，进入bin目录，输入：solr create -c corename



使用该命令会在/server/solr下就会出现新的文件夹corename（就是新创建的core）。



直接在/server/solr下创建新文件夹，自定义文件夹名称作为新的core。将/server/solr/configsets/_default目录下的conf文件夹，然后拷贝一份至自定义文件夹目录。



打开Solr面板，按照图中指示操作则可以添加新创建的collection2的Solr Core。

III. Solr面板

基础面板

Dashboard

仪表盘，显示了该Solr实例开始启动运行的时间、版本、系统资源、jvm等信息。



Logging

Solr运行日志信息。


Cloud

Cloud即SolrCloud，即Solr云（集群），当使用Solr Cloud模式运行时会显示此菜单。


Core Admin

Solr Core的管理界面，在这里可以添加SolrCore实例。


Java Properties

Solr在JVM 运行环境中的属性信息，包括类路径、文件编码、jvm内存设置等信息。


Tread Dump

显示Solr Server中当前活跃线程信息，同时也可以跟踪线程运行栈信息。


Core Selector

选择一个SolrCore进行详细操作。

Core Selector

Analysis

通过Analysis界面可以测试索引分析器和搜索分析器的执行情况。在Solr中，分析器是绑定在域的类型中的。



Dataimport

可以定义数据导入处理器，从关系数据库将数据导入到Solr索引库中。默认没有配置，需要手工配置。


Documents

通过/update表示更新索引，Solr默认根据id（唯一约束）域来更新Document的内容，如果根据id值搜索不到id域则会执行添加操作，如果找到则更新。

通过此菜单可以创建索引、更新索引、删除索引等操作。




Query

通过/select执行搜索索引，必须指定“q”查询条件方可搜索。

IV. Solr的基本使用

在新建的slor core的conf文件夹里，存在重要的配置文件。

managed-schema：主要定义了索引数据类型，索引字段等信息。旧版的schema.xml文件。
solrconfig.xml：主要定义了Solr的一些处理规则，包括索引数据的存放位置，更新，删除，查询的一些规则配置。

V. managed-schema

field

"id" type="string" indexed="true" stored="true" required="true" multiValued="false" />

Field节点指定建立索引和查询数据的字段。

name：指定域的名称
type：指定域的类型
indexed：是否索引
stored：是否存储
required：是否必须
multiValued：是否多值，比如商品信息中，一个商品有多张图片，一个Field想存储多个值的话，必须将multiValued设置为true

dynamicField

"*_i"  type="pint" indexed="true"  stored="true"/>

dynamicField 表示动态字段，可以动态定义一个字段，只要符合规则的字段都可以。

name：指定动态域的命名规则，*_i只要以_i结尾的字段都满足这个定义。
type：指定域的类型
indexed：是否索引
stored：是否存储

uniqueKey

<uniqueKey>iduniqueKey>

指定唯一键。其中的id是在Field标签中已经定义好的域名，而且该域要设置为required为true。一个managed-schema文件中必须有且仅有一个唯一键。

copyField

source="cat" dest="_text_"/>

通过copyField，可以把一个字段的值复制到另一个字段中，也可以把多个字段的值同时复制到另一个字段中，这样搜索的时候都可以根据一个字段来进行搜索。

source：要复制的源Field域的域名
dest：目标Field域的域名
由dest指的的目标Field域，必须设置multiValued为true。

fieldType

"text_general" class="solr.TextField" positionIncrementGap="100">
    "index">
        class="solr.StandardTokenizerFactory"/>
        class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" />
        class="solr.LowerCaseFilterFactory"/>
    
    "query">
        class="solr.StandardTokenizerFactory"/>
        class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" />
        class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true"/>
        class="solr.LowerCaseFilterFactory"/>

fieldType节点主要用来定义域的类型。

name：指定域类型的名称
class：指定该域类型对应的solr的类型
analyzer：指定分析器
type：index、query，分别指定搜索和索引时的分析器
tokenizer：指定分词器
filter：指定过滤器
positionIncrementGap：可选属性，定义在同一个文档中此类型数据的空白间隔，避免短语匹配错误

VI. solrconfig.xml

datadir

<dataDir>${solr.data.dir:}dataDir>

每个SolrCore都有自己的索引文件目录，默认在SolrCore目录下的data中。

luceneMatchVersion

<luceneMatchVersion>7.4.0luceneMatchVersion>

表示solr底层使用的是Lucene7.4.0版本

lib

"${solr.install.dir:../../../..}/contrib/extraction/lib" regex=".*\.jar" />

表示Solr引用包的位置，当dir对应的目录不存在时候，会忽略此属性。

solr.install.dir：表示solrcore的安装目录。

requestHandler

"/query" class="solr.SearchHandler">
    <lst name="defaults">
        <str name="echoParams">explicitstr>
        <str name="wt">jsonstr>
        <str name="indent">truestr>
    lst>
</requestHandler>

requestHandler请求处理器，定义了索引和搜索的访问方式。通过/update维护索引，可以完成索引的添加、修改、删除操作；通过/select搜索索引。

设置搜索参数完成搜索，搜索参数也可以设置一些默认值，如下

directoryFactory

"DirectoryFactory"
                    class="${solr.directoryFactory:solr.NRTCachingDirectoryFactory}"/>

定义索引的存储方案，共有以下存储方案：

solr.StandardDirectoryFactory——这是一个基于文件系统存储目录的工厂，它会试图选择最好的实现基于你当前的操作系统和Java虚拟机版本。
solr.SimpleFSDirectoryFactory——适用于小型应用程序，不支持大数据和多线程。
solr.NIOFSDirectoryFactory——适用于多线程环境，但是不适用在windows平台（很慢），是因为JVM还存在bug。
solr.MMapDirectoryFactory——这个是solr3.1到4.0版本在linux64位系统下默认的实现。它是通过使用虚拟内存和内核特性调用mmap去访问存储在磁盘中的索引文件。它允许lucene或solr直接访问I/O缓存。如果不需要近实时搜索功能，使用此工厂是个不错的方案。
solr.NRTCachingDirectoryFactory——此工厂设计目的是存储部分索引在内存中，从而加快了近实时搜索的速度。
solr.RAMDirectoryFactory——这是一个内存存储方案，不能持久化存储，在系统重启或服务器crash时数据会丢失。且不支持索引复制。

VII. Solr发布至Tomcat

从Solr5.0.0版本开始，Solr不提供可供直接发布的war包，需要我们自己重新整合。

在将Solr发布至Tomcat之前，我们需要了解solrhome和solrcore的概念。

solrhome：solrhome是solr服务运行的主目录，一个solrhome目录里面包含多个solrcore目录；
solrcore：solrcore目录里面了一个solr实例运行时所需要的配置文件和数据文件，每一个solrcore都可以单独对外提供搜索和索引服务，多个solrcore之间没有关系；

下面进行将Solr发布到Tomcat8.5。

拷贝工程文件夹

将 solr-7.1.0\server\solr-webapp 下的webapp复制到 tomcat\webapps，并改名为solr；



定义我们的solr_home，这里定义在D:\Apache\apache-tomcat-8.5.11\solr_home位置；




将 solr-7.1.0 下的contrib和dist文件夹复制到指定的solrhome目录下；




将 solr-7.1.0\server\solr下的文件复制到solrhome目录下。

复制相关的jar包

将\server\lib\ext中所有的.jar文件复制到tomcat\webapps\solr\WEB-INF\lib中；



将\server\lib下的metrics-*.jar复制到tomcat\webapps\solr-7.1.0\WEB-INF\lib中；




将\server\lib下的gmetric4j-1.0.7.jar复制到tomcat\webapps\solr-7.1.0\WEB-INF\lib中；

修改web.xml文件

配置solrhome；



修改授权信息：找到标签，位置在文件最后，将的内容注释掉，大概意思就是开放solr权限。

日志配置

在tomcat\webapps\solr\WEB-INF目录下新建目录classes ，并将\server\resources下的log4j2.xml复制到新建的classes文件夹中；



修改tomcat的bin目录下catalina.bat脚本，增加solr.log.dir系统变量，指定solr日志记录存放地址。

启动测试

启动Tomcat，访问http://localhost:8080/solr/index.html

VIII. 连接MySQL

利用slor core的Dataimport面板可以将数据库中指定的sql语句的结果导入到solr索引库中。

选定Core

可以重新定义一个新的Core，也可以选择现有的core（这里选择collection1，并改名为tb_item）

在solrcore的conf目录下，有一个solrconfig.xml的配置文件，该配置文件用于配置solrcore的运行信息；
修改lib标签设置的路径；

导入依赖包

将mysql-connector-java-x.x.x.jar拷贝到…\solr_home\contrib\db下；



查看…\solr_home\dist下有没有 solr-dataimporthandler-7.4.0.jar，如果没有则去下载的代码拷贝一份；




在solrconfig.xml中配置jar包的lib标签；

<!-- 配置dataimport和mysql -->

 
  <lib dir=" $KaTeX parse error: Can't use function '\.' in math mode at position 112: …ljs-string">".*\̲.̲jar"$  /&g…{solr.install.dir:…}/dist/" regex=“solr-dataimporthandler-7.4.0.jar” /> 
  

 
  配置连接信息 
   
    找到选定的Core(tb_item)下的solrconfig.xml文件，在solrconfig.xml中，添加一个dataimport的requestHandler；
 


在solrconfig.xml同一位置下创建data-config.xml 文件；

对应的数据库商品表为：



  
   
  配置Field域 
  tb_item的表结构： 
   
  在选定的Core(tb_item)的conf下，打开managed-schema文件，在其中定义Field域。Field域的name属性需要和data-config.xml 的一致。 
  

<field name="id" type="string" indexed="true" stored="true" required="true" multiValued="false" />

<field name="title" type="string" indexed="true" stored="true" />

<field name="sellPoint" type="string" indexed="true" stored="true" />

<field name="barcode" type="string" indexed="true" stored="true" />

<field name="image" type="string" indexed="false" stored="true" />

<field name="price" type="string" indexed="false" stored="true" />

<field name="cid" type="string" indexed="false" stored="true" />

<field name="num" type="string" indexed="false" stored="true" />

<field name="status" type="string" indexed="false" stored="true" />

<field name="created" type="string" indexed="false" stored="true" />

<field name="updated" type="string" indexed="false" stored="true" />


<field name="tb_item_keywords" type="string" indexed="true" stored="true" multiValued="true" />


<copyField source="title" dest="tb_item_keywords" />
<copyField source="sellPoint" dest="tb_item_keywords" /> 
  启动测试 
   
    重启Tomcat，打开Solr的Dataimport面板；
 


选择entity，点击Execute执行。



  
   
  IX. 中文分词 
  找到Solr7自带的中文分词器，solr_home\contrib\analysis-extras\lucene-libs下的lucene-analyzers-smartcn-7.4.0.jar。 
   
  配置solrconfig.xml中配置jar包的lib标签： 
   
  在managed-shchema添加中文分词的FieldType： 
  
<fieldType name="cn_text" class="solr.TextField" positionIncrementGap="100">
    <analyzer type="index">
        <tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>
    analyzer>
    <analyzer type="query">
        <tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>
    analyzer>
fieldType> 
  修改商品名称、卖点以及目标域的Type为新定义的cn_text： 
  
<field name="title" type="cn_text" indexed="true" stored="true" />

<field name="sellPoint" type="cn_text" indexed="true" stored="true" />

<field name="tb_item_keywords" type="cn_text" indexed="true" stored="true" multiValued="true" /> 
  删除之前导入的索引： 
  *:*  
   
  重启solr服务，导入数据。利用Query面板，查询sellPoint:卖点，得到155条结果表明分词成功。 
   
  X. SolrJ客户端 
  SolrJ简介 
  Solrj就是Solr服务器的java客户端，提供索引和搜索的请求方法。SolrJ通常嵌入在业务系统中，通过solrJ的API接口操作Solr服务。 
  搭建工程 
  拷贝Jar包，共有三处： 
   
   
  添加/修改索引 
  在solr中，索引库中都会存在一个唯一键。如果一个Document的id存在，则执行修改操作，如果不存在，则执行添加操作。 
  @Test
public void insertOrUpdateIndex() throws IOException, SolrServerException {
    // solr服务的url，tb_item是前面创建的solr core
    String url = "http://localhost:8080/solr/tb_item";
    // 创建HttpSolrClient
    HttpSolrClient client = new HttpSolrClient.Builder(url)
        .withConnectionTimeout(5000)
        .withSocketTimeout(5000)
        .build();

    // 创建Document对象
    SolrInputDocument document = new SolrInputDocument();
    document.addField("id", "1111");
    document.addField("title", "Solr入门");
    document.addField("sellPoint", "Solr版本差异也太大了");

    client.add(document);

    client.commit();
} 
  查询插入结果： 
   
  修改titile为Solr进阶，再次运行代码，查询结果： 
   
  删除索引 
   
    根据指定ID来删除
 @Test
 
 
  
 
  public void deleteIndex() throws IOException, SolrServerException {
 String url = “http://localhost:8080/solr/tb_item”;
 HttpSolrClient client = new HttpSolrClient.Builder(url)
 .withConnectionTimeout(5000)
 .withSocketTimeout(5000)
 .build();
 client.deleteById(“1111”);
 client.commit();
 }
 
  
   
   
 根据条件删除 
   
 // 根据条件删除
 client.deleteByQuery(“id:1111”);
 // 全部删除
 client.deleteByQuery(":");
 
 简单查询
 @Test
    public void simpleSearch() throws IOException, SolrServerException {
        String url = "http://localhost:8080/solr/tb_item";
        HttpSolrClient client = new HttpSolrClient.Builder(url)
                .withConnectionTimeout(5000)
                .withSocketTimeout(5000)
                .build();
        // 创建SolrQuery
        SolrQuery query = new SolrQuery();
        // 输入查询条件
        query.setQuery("sellPoint:手机");
        // 执行查询并返回结果
        QueryResponse response = client.query(query);
        // 获取匹配的所有结果
        SolrDocumentList list = response.getResults();
        // 匹配结果总数
        long count = list.getNumFound();
        System.out.println("总结果数：" + count);

        for (SolrDocument document : list) {
            System.out.println(document.get("id"));
            System.out.println(document.get("title"));
            System.out.println(document.get("sellPoint"));
            System.out.println(document.get("num"));
            System.out.println(document.get("created"));
            System.out.println(document.get("updated"));
            System.out.println("================");
        }

    }
 
 条件查询 
     
     q - 查询关键字，必须的，如果查询所有使用*:*。请求的q是字符串； 
     fq - (filter query)过虑查询，在q查询符合结果中同时是fq查询符合的。例如：请求fq是一个数组（多个值）； 
     sort - 排序； 
     start - 分页显示使用，开始记录下标，从0开始； 
     rows - 指定返回结果最多有多少条记录，配合start来实现分页； 
     fl - 指定返回那些字段内容，用逗号或空格分隔多个 ； 
     df-指定一个搜索Field； 
     wt - (writer type)指定输出格式，可以有 xml, json, php, phps； 
     hl 是否高亮，设置高亮Field，设置格式前缀和后缀。 
     facet 查询分组的数量（可与查询同步执行） 
     group 查询每个分组前几条的数据 
    
 
 SolrJ实现复杂条件查询：
 @Test
public void complexSearch() throws IOException, SolrServerException {
    String url = "http://localhost:8080/solr/tb_item";
    HttpSolrClient client = new HttpSolrClient.Builder(url)
        .withConnectionTimeout(5000)
        .withSocketTimeout(5000)
        .build();
    SolrQuery query = new SolrQuery();
    // 输入查询条件
    query.setQuery("title:手机 AND sellPoint:移动");
    // 设置过滤条件
    query.setFilterQueries("id:[1000000 TO 1200000]");
    // 设置排序
    query.addSort("id", SolrQuery.ORDER.desc);
    // 设置分页信息（使用默认的）
    query.setStart(2);
    query.setRows(2);
    // 设置显示的Field的域集合(两种方式二选一)
    // query.setFields(new String[]{"id", "title", "sellPoint", "price", "status" });
    query.setFields("id,title,sellPoint,price,status");
    // 设置默认域
    // query.set("df", "product_keywords");
    // 设置高亮信息
    query.setHighlight(true);
    query.addHighlightField("title");
    query.setHighlightSimplePre("");
    query.setHighlightSimplePost("");

    // 执行查询并返回结果
    QueryResponse response = client.query(query);
    // 获取匹配的所有结果
    SolrDocumentList list = response.getResults();
    // 匹配结果总数
    long count = list.getNumFound();
    System.out.println("总结果数：" + count);

    // 获取高亮显示信息
    Map>> highlighting = response.getHighlighting();
    for (SolrDocument document : list) {
        System.out.println(document.get("id"));
        List list2 = highlighting.get(document.get("id")).get("title");
        if (list2 != null)
            System.out.println("高亮显示的商品名称：" + list2.get(0));
        else {
            System.out.println(document.get("title"));
        }

    }
}
 
 group
 solrQuery.setParam(GroupParams.GROUP,true);
solrQuery.setParam(GroupParams.GROUP_FIELD,"id");
// 设置每个quality对应的
solrQuery.setParam(GroupParams.GROUP_LIMIT,"1");

GroupResponse groupResponse =queryResponse.getGroupResponse();
if(groupResponse !=null) {
     List groupList =groupResponse.getValues();
     for(GroupCommand groupCommand : groupList){
          List groups =groupCommand.getValues();
          for(Group group : groups) {
            System.out.println(group.getGroupValue()+"\t"+group.getResult().getNumFound());
          }
     }
}
 facet
 //查询分组数量
solrQuery.setFacet(true);
solrQuery.setFacetLimit(100);
solrQuery.setFacetMissing(false);
solrQuery.addFacetField("id");

List<FacetField.Count> counts;
List<FacetField> facetFieldList = queryResponse.getFacetFields();
for (FacetField facetField : facetFieldList) {
    System.out.println(facetField.getName()+"\t"+facetField.getValueCount());
    counts = facetField.getValues();
    if (counts != null) {
        for (FacetField.Count count : counts) {
             System.out.println(count.getName()+" "+count.getCount());
         }
    }
}

如何自定义R语言函数？参数中的省略号`...`有什么用？「已注销」 python 编程语言 java 人工智能 c++
学习R未必要学习很多工具包，有时候根据自己的理解去自定义函数也是一个不错的选择。本篇推文主要介绍两方面的内容：在R语言中自定义函数的一般方法；函数参数中...的作用。在看函数的帮助文档时会发现许多函数的参数中都有...符号，它是表示被省略的参数吗？如果是，作者为什么会省略它？如果不是，那又表示什么含义呢？不久前，学堂君分享了自己编写的计算空间可达性的函数，详见推文：两步移动搜索法（2SFCA）计算
C# OPC UA 客户端开发实战：与PLC的数据交互仰望尾迹云
本文还有配套的精品资源，点击获取简介：本压缩包提供了一个利用C#与OPCUA和KepServerEX实现与PLC数据交互的项目案例。介绍了OPCUA协议的工业通信标准、KepServerEX的使用、C#在工业自动化中的应用、OPCUA客户端API的基本功能，以及相关的DLL文件和工具，旨在简化OPCUA客户端的开发流程，帮助开发者快速创建能够与PLC进行数据交互的C#应用程序。1.OPCUA（OP
MavenHelper插件：解决IntelliJ IDEA中Maven依赖冲突的利器
本文还有配套的精品资源，点击获取简介：MavenHelper是一款专门针对IntelliJIDEA设计的Maven插件，旨在帮助开发者快速识别和解决Maven项目中的依赖冲突问题。该插件能生成项目的依赖树，标记版本冲突的依赖项，并提供建议解决方案和可视化界面来管理依赖。此外，它还包括一键升级或降级依赖、清理Maven缓存和自定义配置功能，以确保与团队规范的一致性。通过使用MavenHelper，开
如何解决ubuntu 中DNS无法修改导致无法联网的问题 BTU_YC linux ubuntu ubuntu linux 服务器
写在前面：在刚开始遇到这个问题的时候，在网上搜了很多资料，都无法解决DNS总是无法修改，一些文章中提到过，直接修改的/etc/resolv.conf，之后确实能够通过pingwww.baidu.com的方式解决，但是当重启电脑的时候，网络有无法使用了。之前的方法就不提了，直接介绍一下我这解决的方法吧如何解决：先使用这个命令进入编辑页面vim/etc/systemd/resolved.conf输入命
ViP-LLaVA: 使大型多模态模型理解任意视觉提示 AI专题精讲 Paper阅读多模态人工智能 AI
摘要现有的大型视觉-语言多模态模型主要关注整体图像理解，但在实现区域特定的理解方面仍存在显著差距。目前，使用文本坐标或空间编码的方法通常无法为视觉提示提供用户友好的接口。为了解决这个问题，我们提出了一种新颖的多模态模型，能够解码任意（自由形式）视觉提示。这使得用户可以通过自然提示（如“红色边框”或“指向箭头”）直观地标记图像并与模型互动。我们的简单设计直接将视觉标记叠加在RGB图像上，避免了复杂的
openai-agents记忆持久化（neo4j） ZHOU_CAMP oi_agents agent中的记忆模块 neo4j python 开发语言
目录环境安装模型配置Memory配置测试环境安装mem0ai[graph]安装uvpipinstall"mem0ai[graph]"docker启动neo4j数据库dockerrun\-p7474:7474-p7687:7687\-eNEO4J_AUTH=neo4j/password\neo4j:5模型配置fromdotenvimportload_dotenvimportosfromopenaii
Aider：27.6K Star！这个终端AI编程神器能用语音改代码，自动生成Git记录并提交，接入DeepSeek斩获编程基准最高分蚝油菜花每日 AI 项目与应用实例 AI编程 git 人工智能开源
❤️如果你也关注AI的发展现状，且对AI应用开发感兴趣，我会每日分享大模型与AI领域的开源项目和应用，提供运行实例和实用教程，帮助你快速上手AI技术！AI在线答疑->智能检索历史文章和开源项目->尽在微信公众号->搜一搜：蚝油菜花⌨️“每个CLI爱好者都该试试的AI编程革命：对着终端说话自动生成Gitcommit是怎样的体验？”大家好，我是蚝油菜花。如果你也经历过——在vim里卡了半小时，只为给函
使用AutoKeras2.0的AutoModel进行结构化数据回归预测
1、FirstofAll:ReadTheFuckingSourceCodeimportautokerasasakimportnumpyasnpfromsklearn.model_selectionimporttrain_test_splitfromsklearn.metricsimportmean_squared_error#生成数据集np.random.seed(42)x=np.random.r
【软件系统架构】系列四：设备驱动与板级支持包（BSP） 34号树洞自学软件系统架构系统架构 php 开发语言
目录1.设备驱动是什么？核心功能：关键特性2.板级支持包是什么？核心组成与功能：关键特性3.系统启动流程中的协作4.设备驱动与BSP的关系与区别5.重要性6.开发实践总结核心目标：让操作系统/应用程序能够透明地、高效地使用硬件资源。1.设备驱动是什么？设备驱动是一段软件代码（通常是内核模块或在某些RTOS中作为任务）。它的核心职责是充当特定硬件设备与操作系统内核或应用程序之间的翻译官和控制器。它直
IDEA依赖冲突分析神器—Maven Helper
IDEA依赖冲突分析神器—MavenHelperMavenHelper是一款专为IntelliJIDEA设计的插件，它极大地简化了Maven项目中依赖冲突的分析和解决过程。以下是对MavenHelper的详细介绍及其使用方法：一、MavenHelper简介MavenHelper插件提供了一个直观的图形界面，帮助开发者查看和管理Maven项目的依赖关系。它特别擅长于展示和识别依赖冲突，使开发者能够迅
2025年渗透测试面试题总结-2025年HW(护网面试) 31（题目+回答）独行soc 2025年护网面试职场和发展安全 linux 护网渗透测试
安全领域各种资源，学习文档，以及工具分享、前沿信息分享、POC、EXP分享。不定期分享各种好玩的项目及好用的工具，欢迎关注。目录2025年HW(护网面试)311.自我介绍2.渗透测试流程（五阶段模型）3.技术栈与开发经历4.自动化挖洞实践5.信息搜集方法论6.深度漏洞挖掘案例8.SQL注入实战技巧9.AWVS扫描与防御10.CSRFvsSSRF核心差异11.SSRF正则绕过技术12.虚拟主机识别原
MongoDB + Voyage AI 详解：重塑数据库与AI的协同范式 csdn_tom_168 NoSQL 数据库 mongodb 人工智能 AI
MongoDB+VoyageAI详解：重塑数据库与AI的协同范式2025年2月，MongoDB官方宣布收购VoyageAI，这一举措标志着数据库与人工智能技术的深度融合迈入新阶段。通过整合VoyageAI的先进AI检索与嵌入模型能力，MongoDB旨在重新定义AI时代的数据库架构，为企业构建智能应用提供端到端的数据基础设施。一、收购背景与技术战略1.行业趋势驱动AI数据挑战：随着生成式AI与大语言
Java 中 Maven 依赖冲突的解决策略 Java大师兄学大数据AI应用开发 AI实战 AI人工智能与大数据应用开发 java maven 网络 ai
Java中Maven依赖冲突的解决策略关键词：Java、Maven、依赖冲突、解决策略、依赖分析摘要：在Java开发中，Maven作为强大的项目管理和构建工具，极大地提高了开发效率。然而，依赖冲突是使用Maven时常见且棘手的问题，它可能导致项目编译失败、运行时出现异常等情况。本文将深入探讨Maven依赖冲突的产生原因、表现形式，并详细介绍多种有效的解决策略。通过实际案例和代码分析，帮助开发者更好
DeepSeek在智能教育评估中的应用：试题检索 AIGC应用创新大全 AI大模型与大数据技术 AI人工智能与大数据应用开发 MCP&Agent 云算力网络 easyui 前端 javascript ai
DeepSeek在智能教育评估中的应用：试题检索关键词：DeepSeek、智能教育、试题检索、自然语言处理、知识图谱、个性化学习、评估系统摘要：本文探讨了DeepSeek大模型在智能教育评估系统中的试题检索应用。我们将深入分析如何利用先进的自然语言处理技术和知识图谱构建高效的试题检索系统，实现个性化学习路径推荐和精准评估。文章将从核心概念、技术原理到实际应用场景，全面解析这一创新教育技术解决方案。
报错Cannot read properties of undefined (reading ‘catch‘) 我在北京coding Vue3 前端 vue.js javascript 前端
在vue项目开发中，使用vue-pdf插件报错：TypeError:Cannotreadpropertiesofundefined(reading‘catch‘)解决方案1、安装指定版本[email protected]@4.2.02、修改源码pdfjsWrapper.js在node_modules里找到vue-pdf文件夹，打开pdfjsWrapper.js文件，
RESTful API 安装使用教程小奇JAVA面试安装使用教程 restful 后端
一、RESTfulAPI简介REST（RepresentationalStateTransfer）是一种基于Web的架构风格，RESTfulAPI是使用HTTP协议并遵循REST原则设计的API接口。其核心思想是：使用标准HTTP方法（GET、POST、PUT、DELETE）对资源进行操作。RESTfulAPI通常用于构建前后端分离、微服务架构等系统，具备易理解、易扩展、易维护等优点。二、常用技术
两步移动搜索法（2SFCA）python 我在北京coding python python 开发语言
实现两步移动搜索法（Two-StepFloatingCatchmentAreaMethod,2SFCA）是一种广泛应用于地理信息系统（GIS）领域的方法，用于评估设施的空间可达性。以下是基于Python和GeoPandas的一种实现方式。准备工作为了实现2SFCA方法，需要准备以下数据集：供给点：表示服务提供方的位置及其服务能力。需求点：表示潜在使用者的位置及其需求量。距离矩阵：描述供给点与需求点
Java、python中高级开发工程师岗位框架要求统计爱吃土豆的马铃薯ㅤㅤㅤㅤㅤㅤㅤㅤㅤ java python 开发语言
一、主流框架使用频率框架/技术出现频率说明SpringBoot89%几乎成为Java后端开发的标配，用于快速构建微服务和独立应用。SpringCloud76%微服务架构必备，提供服务发现、配置管理、网关等核心组件。MyBatis/MyBatis-Plus72%最流行的ORM框架，MyBatis-Plus进一步简化开发。Spring68%基础框架，中高级岗位要求深入理解IoC、AOP原理。Hiber
MapReduce数据处理过程2万字保姆级教程大模型大数据攻城狮 mapreduce 大数据 yarn cdh hadoop 大数据面试 shuffle
目录1.MapReduce的核心思想：分而治之的艺术2.HadoopMapReduce的架构：从宏观到微观3.WordCount实例：从代码到执行的完整旅程4.源码剖析：Job.submit的魔法5.Map任务的执行：从分片到键值对6.Shuffle阶段：MapReduce的幕后英雄7.Reduce任务的执行：从数据聚合到最终输出8.Combiner的魔法：提前聚合的性能利器9.Partition
超轻量级中文OCR项目使用教程甄墨疆
超轻量级中文OCR项目使用教程chineseocr_lite超轻量级中文ocr，支持竖排文字识别,支持ncnn、mnn、tnn推理(dbnet(1.8M)+crnn(2.5M)+anglenet(378KB))总模型仅4.7M项目地址:https://gitcode.com/gh_mirrors/ch/chineseocr_lite1.项目介绍本项目是一个超轻量级的中文OCR（OpticalCha
【HarmonyOS】鸿蒙应用开发Text控件常见错误
【HarmonyOS】鸿蒙应用开发Text控件常见错误一、前言Text文本控件，是我们应用开发中最为基本和常见使用的控件之一。很多人觉得对于控件的使用已经非常熟悉，一个文本控件，能有什么使用错误呢？其实不然，今天本文，就对于Text常用会导致问题的点进行阐述。二、Text设置字体大小是否可用于百分号？对于初学者最常见的问题之一，就是使用Text的fontSize属性设置字体大小时，传入百分比字符串
【TVM 教程】如何处理 TVM 报错
ApacheTVM是一个深度的深度学习编译框架，适用于CPU、GPU和各种机器学习加速芯片。更多TVM中文文档可访问→https://tvm.hyper.ai/运行TVM时，可能会遇到如下报错：---------------------------------------------------------------AnerroroccurredduringtheexecutionofTVM.F
nginx使用printf打印输出鱼虾一整碗 nginx
在配置文件nginx.conf中加入daemonoff;master_processoff;然后kill掉nginx进程，再启动即可。完！
Python函数 python知识
1文档字符串函数定义下的第一个字符串是文档字符串，用于解释函数。可以通过help(function_name)或function_name.__doc__来查看。2函数返回单个返回值：return一个值无返回值：函数执行完毕没有return语句，或者return后面没有值，会隐式地返回None返回多个值：实际上是返回一个包含所有值的元组(tuple)3参数函数声明：使用def关键字来创建函数默认参
QA - RAG智能问答系统中的文档切片与实现原理 ai开发
引言在现代企业知识管理系统中，智能问答系统正发挥着越来越重要的作用。GC-QA-RAG系统作为葡萄城技术栈中的重要组成部分，其核心功能是通过对文档内容进行智能切片和向量化存储，实现对技术文档的高效检索和问答。本文将深入剖析该系统的文档切片原理，包括短文档和长文档的不同处理策略，以及如何将这些技术应用于实际场景中。正文1.原始方案及其局限性最初的GC-QA-RAG系统采用了一种直观的方法：将整个文档
【限时干货】Calibre智能分类，轻松突破内网限制畅享电子书库比头发还脆弱服务器 tcp/ip linux
文章目录前言1.网络书库软件下载安装2.网络书库服务器设置3.内网穿透工具设置4.公网使用kindle访问内网私人书库前言本研究旨在构建一套运行于微软操作系统环境下的独立电子图书管理体系，核心目标是建立可远程操作的资源访问机制。该架构采用高可用性设计，在第三方阅读平台服务中断时仍能保障数字内容传输的稳定性。系统创新性地融合了两大核心技术组件：通过Calibre开源软件实现文献分类算法与格式转换功能
Python-selenium爬取藏在歌词里 python selenium 开发语言
selenium前言使用python的requests模块还是存在很大的局限性，例如：只发一次请求；针对ajax动态加载的网页则无法获取数据等等问题。特此，本章节将通过selenium模拟浏览器来完成更高级的爬虫抓取任务。什么是seleniumSelenium是一个用于自动化Web应用程序测试的开源工具集。它提供了一组API和工具，可以与多种编程语言一起使用，如Java、Python、C#等，用于
python --飞浆离线ocr使用/paddleocr
依赖#python==3.7.3paddleocr==2.7.0.2paddlepaddle==2.5.2loguru==0.7.3frompaddleocrimportPaddleOCRimportcv2importnumpyasnpif__name__=='__main__':OCR=PaddleOCR(use_doc_orientation_classify=False,#检测文档方向use
React中高级开发工程师岗位要求统计爱吃土豆的马铃薯ㅤㅤㅤㅤㅤㅤㅤㅤㅤ react.js 前端前端框架
React中高级开发工程师岗位要求统计一、核心技能要求技能/框架出现频率具体要求ReactHooks85%熟练使用useState、useEffect、自定义Hooks，理解闭包陷阱和依赖数组原理。状态管理78%Redux（含Toolkit）、MobX、Recoil等，要求理解单向数据流和异步处理。函数式组件72%完全使用函数式组件开发，避免class组件。TypeScript68%项目级Type
跨平台ZeroMQ：在Rust中使用zmq库的完整指南涵树_fx 架构设计 Rust 实战 rust 开发语言后端
“消息就像神经元间的电信号，而ZeroMQ就是那个让系统思考的神经网络”——某个深夜调试zmq的程序员当你需要轻量级、高性能的进程间通信时，ZeroMQ就像代码世界里的瑞士军刀。今天我们一起探索如何在Rust生态中使用这把利器，感受它如何在不同操作系统间架起通信的桥梁。安装ZeroMQ：三大操作系统的通关秘籍Linux(Debian/Ubuntu)sudoaptupdatesudoaptinsta
多线程编程之卫生间周凡杨 java 并发卫生间线程厕所
如大家所知，火车上车厢的卫生间很小，每次只能容纳一个人，一个车厢只有一个卫生间，这个卫生间会被多个人同时使用，在实际使用时，当一个人进入卫生间时则会把卫生间锁上，等出来时打开门，下一个人进去把门锁上，如果有一个人在卫生间内部则别人的人发现门是锁的则只能在外面等待。问题分析：首先问题中有两个实体，一个是人，一个是厕所，所以设计程序时就可以设计两个类。人是多数的，厕所只有一个（暂且模拟的是一个车厢）。
How to Install GUI to Centos Minimal sunjing linux Install Desktop GUI
http://www.namhuy.net/475/how-to-install-gui-to-centos-minimal.html I have centos 6.3 minimal running as web server. I’m looking to install gui to my server to vnc to my server. You can insta
Shell 函数 daizj shell 函数
Shell 函数 linux shell 可以用户定义函数，然后在shell脚本中可以随便调用。 shell中函数的定义格式如下： [function] funname [()]{ action; [return int;] } 说明： 1、可以带function fun() 定义，也可以直接fun() 定义,不带任何参数。 2、参数返回
Linux服务器新手操作之一周凡杨 Linux 简单操作
1.whoami 当一个用户登录Linux系统之后，也许他想知道自己是发哪个用户登录的。此时可以使用whoami命令。 [ecuser@HA5-DZ05 ~]$ whoami e
浅谈Socket通信（一）朱辉辉33 socket
在java中ServerSocket用于服务器端，用来监听端口。通过服务器监听，客户端发送请求，双方建立链接后才能通信。当服务器和客户端建立链接后，两边都会产生一个Socket实例，我们可以通过操作Socket来建立通信。首先我建立一个ServerSocket对象。当然要导入java.net.ServerSocket包 ServerSock
关于框架的简单认识西蜀石兰框架
入职两个月多，依然是一个不会写代码的小白，每天的工作就是看代码，写wiki。前端接触CSS、HTML、JS等语言，一直在用的CS模型，自然免不了数据库的链接及使用，真心涉及框架，项目中用到的BootStrap算一个吧，哦，JQuery只能算半个框架吧，我更觉得它是另外一种语言。后台一直是纯Java代码，涉及的框架是Quzrtz和log4j。都说学前端的要知道三大框架，目前node.
You have an error in your SQL syntax; check the manual that corresponds to your 林鹤霄
You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'option,changed_ids ) values('0ac91f167f754c8cbac00e9e3dc372
MySQL5.6的my.ini配置 aigo mysql
注意：以下配置的服务器硬件是：8核16G内存 [client] port=3306 [mysql] default-character-set=utf8 [mysqld] port=3306 basedir=D:/mysql-5.6.21-win
mysql 全文模糊查找便捷解决方案 alxw4616 mysql
mysql 全文模糊查找便捷解决方案 2013/6/14 by 半仙 [email protected] 目的: 项目需求实现模糊查找. 原则: 查询不能超过 1秒. 问题: 目标表中有超过1千万条记录. 使用like '%str%' 进行模糊查询无法达到性能需求. 解决方案: 使用mysql全文索引. 1.全文索引 : MySQL支持全文索引和搜索功能。MySQL中的全文索
自定义数据结构链表(单项 ,双向,环形) 百合不是茶单项链表双向链表
链表与动态数组的实现方式差不多, 数组适合快速删除某个元素链表则可以快速的保存数组并且可以是不连续的单项链表;数据从第一个指向最后一个实现代码: //定义动态链表 clas
threadLocal实例 bijian1013 java thread java多线程 threadLocal
实例1： package com.bijian.thread; public class MyThread extends Thread { private static ThreadLocal tl = new ThreadLocal() { protected synchronized Object initialValue() { return new Inte
activemq安全设置—设置admin的用户名和密码 bijian1013 java activemq
ActiveMQ使用的是jetty服务器, 打开conf/jetty.xml文件，找到 <bean id="adminSecurityConstraint" class="org.eclipse.jetty.util.security.Constraint"> <p
【Java范型一】Java范型详解之范型集合和自定义范型类 bit1129 java
本文详细介绍Java的范型，写一篇关于范型的博客原因有两个，前几天要写个范型方法(返回值根据传入的类型而定)，竟然想了半天，最后还是从网上找了个范型方法的写法；再者，前一段时间在看Gson, Gson这个JSON包的精华就在于对范型的优雅简单的处理，看它的源代码就比较迷糊，只其然不知其所以然。所以，还是花点时间系统的整理总结下范型吧。范型内容范型集合类范型类
【HBase十二】HFile存储的是一个列族的数据 bit1129 hbase
在HBase中，每个HFile存储的是一个表中一个列族的数据，也就是说，当一个表中有多个列簇时，针对每个列簇插入数据，最后产生的数据是多个HFile，每个对应一个列族，通过如下操作验证 1. 建立一个有两个列族的表 create 'members','colfam1','colfam2' 2. 在members表中的colfam1中插入50*5
Nginx 官方一个配置实例 ronin47 nginx 配置实例
user www www; worker_processes 5; error_log logs/error.log; pid logs/nginx.pid; worker_rlimit_nofile 8192; events { worker_connections 4096;} http { include conf/mim
java-15.输入一颗二元查找树，将该树转换为它的镜像，即在转换后的二元查找树中，左子树的结点都大于右子树的结点。用递归和循环 bylijinnan java
//use recursion public static void mirrorHelp1(Node node){ if(node==null)return; swapChild(node); mirrorHelp1(node.getLeft()); mirrorHelp1(node.getRight()); } //use no recursion bu
返回null还是empty bylijinnan java apache spring 编程
第一个问题，函数是应当返回null还是长度为0的数组（或集合）？第二个问题，函数输入参数不当时，是异常还是返回null？先看第一个问题有两个约定我觉得应当遵守： 1.返回零长度的数组或集合而不是null（详见《Effective Java》）理由就是，如果返回empty，就可以少了很多not-null判断： List<Person> list
[科技与项目]工作流厂商的战略机遇期 comsci 工作流
在新的战略平衡形成之前，这里有一个短暂的战略机遇期，只有大概最短6年，最长14年的时间，这段时间就好像我们森林里面的小动物，在秋天中，必须抓紧一切时间存储坚果一样，否则无法熬过漫长的冬季。。。。在微软，甲骨文，谷歌，IBM,SONY
过度设计-举例 cuityang 过度设计
过度设计，需要更多设计时间和测试成本，如无必要，还是尽量简洁一些好。未来的事情，比如访问量，比如数据库的容量，比如是否需要改成分布式都是无法预料的再举一个例子，对闰年的判断逻辑：　　1、 if($Year%4==0) return True; else return Fasle; 　　2、if ( ($Year%4==0 &am
java进阶，《Java性能优化权威指南》试读 darkblue086 java性能优化
记得当年随意读了微软出版社的.NET 2.0应用程序调试，才发现调试器如此强大，应用程序开发调试其实真的简单了很多，不仅仅是因为里面介绍了很多调试器工具的使用，更是因为里面寻找问题并重现问题的思想让我震撼，时隔多年，Java已经如日中天，成为许多大型企业应用的首选，而今天，这本《Java性能优化权威指南》让我再次找到了这种感觉，从不经意的开发过程让我刮目相看，原来性能调优不是简单地看看热点在哪里，
网络学习笔记初识OSI七层模型与TCP协议 dcj3sjt126com 学习笔记
协议：在计算机网络中通信各方面所达成的、共同遵守和执行的一系列约定　　计算机网络的体系结构：计算机网络的层次结构和各层协议的集合。　　两类服务：　　面向连接的服务通信双方在通信之前先建立某种状态，并在通信过程中维持这种状态的变化，同时为服务对象预先分配一定的资源。这种服务叫做面向连接的服务。　　面向无连接的服务通信双方在通信前后不建立和维持状态，不为服务对象
mac中用命令行运行mysql dcj3sjt126com mysql linux mac
参考这篇博客：http://www.cnblogs.com/macro-cheng/archive/2011/10/25/mysql-001.html 感觉workbench不好用（有点先入为主了）。 1，安装mysql 在mysql的官方网站下载 mysql 5.5.23 http://www.mysql.com/downloads/mysql/，根据我的机器的配置情况选择了64
MongDB查询（1）——基本查询[五] eksliang mongodb mongodb 查询 mongodb find
MongDB查询转载请出自出处：http://eksliang.iteye.com/blog/2174452 一、find简介 MongoDB中使用find来进行查询。 API:如下 function ( query , fields , limit , skip, batchSize, options ){.....} 参数含义： query:查询参数 fie
base64，加密解密经融加密，对接 y806839048 经融加密对接
String data0 = new String(Base64.encode(bo.getPaymentResult().getBytes(("GBK")))); String data1 = new String(Base64.decode(data0.toCharArray()),"GBK"); // 注意编码格式，注意用于加密，解密的要是同
JavaWeb之JSP概述 ihuning javaweb
什么是JSP？为什么使用JSP？ JSP表示Java Server Page，即嵌有Java代码的HTML页面。使用JSP是因为在HTML中嵌入Java代码比在Java代码中拼接字符串更容易、更方便和更高效。 JSP起源在很多动态网页中，绝大部分内容都是固定不变的，只有局部内容需要动态产生和改变。如果使用Servl
apple watch 指南啸笑天 apple
1. 文档 WatchKit Programming Guide（中译在线版 By @CocoaChina）译文译者原文概览 - 开始为 Apple Watch 进行开发 @星夜暮晨 Overview - Developing for Apple Watch 概览 - 配置 Xcode 项目 - Overview - Configuring Yo
java经典的基础题目 macroli java 编程
1.列举出 10个JAVA语言的优势 a:免费，开源，跨平台(平台独立性)，简单易用，功能完善，面向对象，健壮性，多线程，结构中立，企业应用的成熟平台, 无线应用 2.列举出JAVA中10个面向对象编程的术语 a:包，类，接口，对象，属性，方法，构造器，继承，封装，多态，抽象，范型 3.列举出JAVA中6个比较常用的包 Java.lang;java.util;java.io;java.sql;ja
你所不知道神奇的js replace正则表达式 qiaolevip 每天进步一点点学习永无止境纵观千象 regex
var v = 'C9CFBAA3CAD0'; console.log(v); var arr = v.split(''); for (var i = 0; i < arr.length; i ++) { if (i % 2 == 0) arr[i] = '%' + arr[i]; } console.log(arr.join('')); console.log(v.r
[一起学Hive]之十五-分析Hive表和分区的统计信息(Statistics) superlxw1234 hive hive分析表 hive统计信息 hive Statistics
关键字：Hive统计信息、分析Hive表、Hive Statistics 类似于Oracle的分析表，Hive中也提供了分析表和分区的功能，通过自动和手动分析Hive表，将Hive表的一些统计信息存储到元数据中。表和分区的统计信息主要包括：行数、文件数、原始数据大小、所占存储大小、最后一次操作时间等； 14.1 新表的统计信息对于一个新创建
Spring Boot 1.2.5 发布 wiselyman spring boot
Spring Boot 1.2.5已在7月2日发布，现在可以从spring的maven库和maven中心库下载。这个版本是一个维护的发布版，主要是一些修复以及将Spring的依赖提升至4.1.7(包含重要的安全修复)。官方建议所有的Spring Boot用户升级这个版本。项目首页 | 源

使用solr 检索word文档

I. Solr

Solr简介

与Lucence区别

II. Solr安装配置

环境依赖

Solr目录结构

Solr的启动和关闭

创建Solr Core

III. Solr面板

基础面板

Core Selector

IV. Solr的基本使用

V. managed-schema

field

dynamicField

uniqueKey

copyField

fieldType

VI. solrconfig.xml

datadir

luceneMatchVersion

lib

requestHandler

directoryFactory

VII. Solr发布至Tomcat

拷贝工程文件夹

复制相关的jar包

修改web.xml文件

日志配置

启动测试

VIII. 连接MySQL

选定Core

导入依赖包

配置连接信息

配置Field域

启动测试

IX. 中文分词

X. SolrJ客户端

SolrJ简介

搭建工程

添加/修改索引

删除索引

简单查询

条件查询

你可能感兴趣的:(搜索引擎,使用solr检索word文档)