梦朝思夕

第六章 Lucene扩展

6.1 Tika

package com.mzsx.tika;
 
import java.io.File;
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.IOException;
import java.io.InputStream;
 
import org.apache.tika.Tika;
import org.apache.tika.exception.TikaException;
import org.apache.tika.metadata.Metadata;
import org.apache.tika.parser.AutoDetectParser;
import org.apache.tika.parser.ParseContext;
import org.apache.tika.parser.Parser;
import org.apache.tika.sax.BodyContentHandler;
import org.xml.sax.ContentHandler;
import org.xml.sax.SAXException;
 
public class TikaOpera {
  publicString tikaTool(File f) throws IOException, TikaException {
    Tikatika = new Tika();
   Metadata metadata = new Metadata();
   metadata.set(Metadata.AUTHOR, "空号");
   metadata.set(Metadata.RESOURCE_NAME_KEY, f.getName());
    Stringstr = tika.parseToString(new FileInputStream(f), metadata);
    for(String name : metadata.names()) {
      System.out.println(name + ":" + metadata.get(name));
    }
    returnstr;
  }
 
  publicString fileToTxt(File f) {
    Parserparser = new AutoDetectParser();
   InputStream is = null;
    try {
      Metadata metadata = new Metadata();
      metadata.set(Metadata.AUTHOR, "空号");
      metadata.set(Metadata.RESOURCE_NAME_KEY, f.getName());
       is =new FileInputStream(f);
      ContentHandler handler = new BodyContentHandler();
      ParseContext context = new ParseContext();
      context.set(Parser.class, parser);
      parser.parse(is, handler, metadata, context);
       for(String name : metadata.names()) {
        System.out.println(name + ":" + metadata.get(name));
       }
      return handler.toString();
    } catch(FileNotFoundException e) {
      e.printStackTrace();
    } catch(IOException e) {
      e.printStackTrace();
    } catch(SAXException e) {
      e.printStackTrace();
    } catch(TikaException e) {
      e.printStackTrace();
    }finally {
       try{
         if(is != null)
          is.close();
       }catch (IOException e) {
        e.printStackTrace();
       }
    }
    returnnull;
  }
}

//测试代码

package com.mzsx.test;
 
import java.io.File;
import java.io.IOException;
 
import org.apache.tika.exception.TikaException;
import org.junit.Test;
 
import com.mzsx.tika.TikaOpera;
 
public class TikaOperaTest {
  @Test
  publicvoid testTika01() {
   TikaOpera iu = new TikaOpera();
    System.out.println(iu.fileToTxt(newFile("d:/Java学习手记.pdf")));
  }
  
  @Test
  publicvoid testToka02() throws IOException, TikaException {
   TikaOpera iu = new TikaOpera();
   System.out.println(iu.tikaTool(new File("d:/Java学习手记.pdf")));
  }
}

6.2 高亮显示

package com.mzsx.highlighter;
 
import java.io.File;
import java.io.IOException;
import java.io.StringReader;
 
import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.document.Document;
importorg.apache.lucene.index.CorruptIndexException;
importorg.apache.lucene.queryParser.MultiFieldQueryParser;
importorg.apache.lucene.queryParser.ParseException;
import org.apache.lucene.queryParser.QueryParser;
import org.apache.lucene.search.IndexSearcher;
import org.apache.lucene.search.Query;
import org.apache.lucene.search.ScoreDoc;
import org.apache.lucene.search.TopDocs;
importorg.apache.lucene.search.highlight.Formatter;
importorg.apache.lucene.search.highlight.Fragmenter;
importorg.apache.lucene.search.highlight.Highlighter;
import org.apache.lucene.search.highlight.InvalidTokenOffsetsException;
importorg.apache.lucene.search.highlight.QueryScorer;
importorg.apache.lucene.search.highlight.SimpleHTMLFormatter;
importorg.apache.lucene.search.highlight.SimpleSpanFragmenter;
import org.apache.lucene.search.similar.MoreLikeThis;
importorg.apache.lucene.search.vectorhighlight.FastVectorHighlighter;
importorg.apache.lucene.search.vectorhighlight.FieldQuery;
import org.apache.lucene.util.Version;
 
import com.chenlb.mmseg4j.analysis.MMSegAnalyzer;
import com.mzsx.index.IndexReaderContext;
import com.mzsx.write.DirectoryConext;
 
public class HighlighterOpera {
  privatestatic MMSegAnalyzer analyzer=new MMSegAnalyzer(newFile("D:\\luceneIndex\\dic"));
  publicvoid simpleLighter(){
    try {
      String txt = "我爱北京天安门，天安门上彩旗飞,伟大领袖毛主席，指引我们向前进，向前进！！！\n想起身离开东京法律思考的机会那个上的讲话那伟大的个圣诞。那是肯定激发了深刻的机会拉萨宽带计费了那个傻大姐华纳公司的机会节贺卡就是对话框那是国天安门际  北京电话卡开始觉啊北京得人们大会堂  北京！！！！";
       //查询
      Query query = new QueryParser(Version.LUCENE_35, "f",analyzer).parse("北京伟大");
       //高亮的查询评分
      QueryScorer scorer = new QueryScorer(query);
       //高亮的分段
      Fragmenter fragment = new SimpleSpanFragmenter(scorer);
       //高亮的格式
      Formatter formatter = new SimpleHTMLFormatter("<spanstyle='color:red'>", "</span>");
       //设置高亮
      Highlighter highlighter = new Highlighter(formatter,scorer);
       //设置高亮段
      highlighter.setTextFragmenter(fragment);
      String str = highlighter.getBestFragment(analyzer, "f", txt);
      System.out.println(str);
    } catch(IOException e) {
      e.printStackTrace();
    } catch(InvalidTokenOffsetsException e) {
      e.printStackTrace();
    } catch(ParseException e) {
      e.printStackTrace();
    }
  }
  
  publicvoid searcherByHighlighter(String name) {
    try {
      IndexSearcher searcher = newIndexSearcher(IndexReaderContext.getIndexReader(DirectoryConext.getDirectory("D:/luceneIndex/index")));
      //QueryParser parser = newQueryParser(Version.LUCENE_35,"title",a);
      MultiFieldQueryParser parser = newMultiFieldQueryParser(Version.LUCENE_35, newString[]{"filename","contents"}, analyzer);
      Query query = parser.parse(name);
      TopDocs tds = searcher.search(query, 20);
      MoreLikeThis mlt = new MoreLikeThis(searcher.getIndexReader());
      mlt.setFieldNames(newString[]{"filename","contents"});
      mlt.setMinDocFreq(1);
      mlt.setMinTermFreq(1);
      System.out.println("总共："+tds.totalHits);
      for(ScoreDoc sd:tds.scoreDocs) {
         Document doc = searcher.doc(sd.doc);
        String title = doc.get("filename");
        title = lighterStr(analyzer, query, title, "filename");
        System.out.println(title);
        String contents = doc.get("contents");
        contents = lighterStr(analyzer, query, contents, "contents");
        System.out.println(contents);
        System.out.println("**************************************************************************************************");
        Query moreLike = mlt.like(sd.doc);
        TopDocs stds = searcher.search(moreLike, 10);
        for(ScoreDoc ssd:stds.scoreDocs) {
          Document d = searcher.doc(ssd.doc);
          System.out.println(d.get("filename"));
         }
       }
       searcher.close();
    } catch(CorruptIndexException e) {
      e.printStackTrace();
    } catch(IOException e) {
      e.printStackTrace();
    } catch(ParseException e) {
      e.printStackTrace();
    } catch(InvalidTokenOffsetsException e) {
       e.printStackTrace();
    }
  }
  
  publicvoid searcherByFastHighlighter(String name) {
    try {
      FastVectorHighlighter fvh = new FastVectorHighlighter(false,false);
      IndexSearcher searcher = newIndexSearcher(IndexReaderContext.getIndexReader(DirectoryConext.getDirectory("D:/luceneIndex/index")));
      //QueryParser parser = newQueryParser(Version.LUCENE_35,"title",a);
      MultiFieldQueryParser parser = newMultiFieldQueryParser(Version.LUCENE_35, newString[]{"filename","contents"}, analyzer);
      Query query = parser.parse(name);
      FieldQuery fq = fvh.getFieldQuery(query);
      TopDocs tds = searcher.search(query, 20);
      for(ScoreDoc sd:tds.scoreDocs) {
        String highTitle = fvh.getBestFragment(fq, searcher.getIndexReader(),sd.doc, "filename", 100);
        System.out.println(highTitle);
        System.out.println("-------------------------");
        String highContent = fvh.getBestFragment(fq,  searcher.getIndexReader(), sd.doc,"contents",100);
        System.out.println(highContent);
        System.out.println("**********************************************************************");
       }
      searcher.close();
    } catch(CorruptIndexException e) {
       //TODO Auto-generated catch block
      e.printStackTrace();
    } catch(IOException e) {
       //TODO Auto-generated catch block
      e.printStackTrace();
    } catch(ParseException e) {
       //TODO Auto-generated catch block
      e.printStackTrace();
    } 
  }
  
  privateString lighterStr(Analyzer a,Query query,String txt,String fieldname) throwsIOException, InvalidTokenOffsetsException {
    Stringstr =  null;
   QueryScorer scorer = new QueryScorer(query);
    Fragmenterfragmenter = new SimpleSpanFragmenter(scorer);
   Formatter fmt = new SimpleHTMLFormatter("<b>","</b>");
   Highlighter lighter = new Highlighter(fmt, scorer);
   lighter.setTextFragmenter(fragmenter);
    str =lighter.getBestFragments(a.tokenStream(fieldname,new StringReader(txt)),txt, 3,"......\n");
   if(str==null)return txt;
    returnstr;
  }
  
}

//测试代码

package com.mzsx.test;
 
import org.junit.Test;
 
import com.mzsx.highlighter.HighlighterOpera;
 
public class HighlighterTest {
  @Test
  publicvoid simpleLighter(){
   HighlighterOpera   opera=newHighlighterOpera();
   opera.simpleLighter();
    
  }
  
  @Test
  publicvoid searcherByHighlighter(){
   HighlighterOpera   opera=newHighlighterOpera();
   opera.searcherByHighlighter("台");
  }
  
  @Test
  publicvoid searcherByFastHighlighter(){
   HighlighterOpera   opera=newHighlighterOpera();
   opera.searcherByFastHighlighter("台");
  }
}

6.3 SOLR

1.让solr和tomcat整合

（1）、将solr中的example中的solr拷贝到要作为服务器的位置

（2）、将相应的solr的web程序也拷贝出来

（3）、修改solr-->home文件夹中的solrconfig.xml设置data的路径：

D:\luceneIndex\solr\home\conf\solrconfig.xml

<dataDir>${solr.data.dir:
D:\luceneIndex\solr\home\data
}</dataDir>

（4）、设置相应的tomcat的context

C:\apache-tomcat-6.0.18\conf\server.xml

<Context path="/solr"docBase="D:\luceneIndex\solr\server\solr" debug="0"crossContext="true">
</Context>

（5）、为context设置相应的环境变量，说明solr的主目录的地址

<Context path="/solr"docBase="D:\luceneIndex\solr\server\solr" debug="0" crossContext="true">
      <Environmentname="solr/home" type="java.lang.String"value="D:\luceneIndex\solr\home" override="true"/>
</Context>

（6）、取消VelocityResponseWriter这种输出格式

<!--<queryResponseWritername="velocity" class="solr.VelocityResponseWriter" enable="${solr.velocity.enabled:true}"/>-->

（7）、加入中文分词

solr.data.dir:D:\luceneIndex\solr\home\data中的conf\schema.xml中的

（7.1）、将中文分词的包拷贝到server的lib中

D:\luceneIndex\solr\server\solr\WEB-INF\lib

（7.2）、将中文分词添加到FieldType中

D:\luceneIndex\solr\home\conf\schema.xml

<!--MMSeg中文分词器-->
   <fieldType name="textComplex"class="solr.TextField" >
     <analyzer>
       <tokenizerclass="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory"mode="complex" dicPath="D:/luceneIndex/dic"/>
     </analyzer>
   </fieldType>
      <fieldTypename="textMaxWord" class="solr.TextField" >
     <analyzer>
       <tokenizerclass="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory"mode="max-word" dicPath="D:/luceneIndex/dic"/>
     </analyzer>
   </fieldType>
      <fieldTypename="textSimple" class="solr.TextField" >
     <analyzer>
       <tokenizerclass="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory"mode="simple" dicPath="D:/luceneIndex/dic"/>
     </analyzer>
   </fieldType>

2.solrJ的使用

(1).创建SolrServer

private final static String URL ="http://localhost:8080/solr";
      privateCommonsHttpSolrServer server = null;
      
      @Before
      publicvoid init() {
           try{
                 server= new CommonsHttpSolrServer(URL);
           }catch (MalformedURLException e) {
                 e.printStackTrace();
           }
      }

3.solr添加文档

配置D:\luceneIndex\solr\home\conf\schema.xml：

<defaultSearchField>msg_all</defaultSearchField>
<field name="msg_title"type="textComplex" indexed="true"stored="true"/>
<field name="msg_content"type="textComplex" indexed="true"stored="true"/>
<field name="msg_all"type="textComplex" indexed="true" stored="false"multiValued="true"/>
<copyField source="msg_title"dest="msg_all"/>
<copyField source="msg_content"dest="msg_all"/>

@Test
      publicvoid test01() {
           try{
                 SolrInputDocumentdoc = new SolrInputDocument();
                 //id是唯一的主键，当多次添加的时候，最后添加的相同id的域会覆盖前面的域
                 doc.addField("id","1");
                 doc.addField("msg_title","这是我的第一个solrj的程序");
                 doc.addField("msg_content","我的solrj的程序究竟能不能跑得起来呢？");
                 server.add(doc);
                 server.commit();
           }catch (MalformedURLException e) {
                 e.printStackTrace();
           }catch (SolrServerException e) {
                 e.printStackTrace();
           }catch (IOException e) {
                 e.printStackTrace();
           }
      }

@Test
      publicvoid test02() {
           try{
                 List<SolrInputDocument>docs = new ArrayList<SolrInputDocument>();
                 SolrInputDocumentdoc = new SolrInputDocument();
                 doc.addField("id","2");
                 doc.addField("msg_title","很好！solr可以工作了");
                 doc.addField("msg_content","slor总算可以正式工作了");
                 docs.add(doc);
                 doc= new SolrInputDocument();
                 doc.addField("id","3");
                 doc.addField("msg_title","测试一下solr的添加");
                 doc.addField("msg_content","看看能不能添加一个列表信息");
                 docs.add(doc);
                 server.add(docs);
                 server.commit();
           }catch (SolrServerException e) {
                 e.printStackTrace();
           }catch (IOException e) {
                 e.printStackTrace();
           }
      }

@Test
      publicvoid test03() {
           try{
                 List<Message>msgs = new ArrayList<Message>();
                 msgs.add(newMessage("4","基于java bean的添加",
                             new String[]{"通过java bean完成添加","javabean的添加附件"}));
                 msgs.add(newMessage("5","基于java bean的列表数据的添加",
                             new String[]{"测试如何通过一个对象完成添加","通过对象完成添加的附件"}));
                 server.addBeans(msgs);
                 server.commit();
           }catch (SolrServerException e) {
                 e.printStackTrace();
           }catch (IOException e) {
                 e.printStackTrace();
           }
      }

4.solr的查询

@Test
      publicvoid test04() {
           try{
                 //定义查询字符串
                 SolrQueryquery = new SolrQuery("*");
                 query.setStart(0);
                 query.setRows(3);
                 QueryResponseresp = server.query(query);
                 //查询出来的结果都保存在SolrDocumentList中
                 SolrDocumentListsdl = resp.getResults();
                 System.out.println(sdl.getNumFound());
                 for(SolrDocumentsd:sdl) {
//                    System.out.println(sd);
                      System.out.println(sd.getFieldValue("msg_title")+","+sd.getFieldValue("msg_content"));
                 }
           }catch (SolrServerException e) {
                 e.printStackTrace();
           }
      }

 @Test
      publicvoid test05() {
           try{
                 SolrQueryquery = new SolrQuery("*");
                 query.setStart(0);
                 query.setRows(3);
                 QueryResponseresp = server.query(query);
                 //可以直接查询相应的bean对象，但是不是很常用
                 List<Message>list = resp.getBeans(Message.class);
                 System.out.println(list.size());
                 for(Messagemsg:list) {
                      System.out.println(msg.getTitle());
                 }
           }catch (SolrServerException e) {
                 e.printStackTrace();
           }
      }

5.高亮查询

@Test
      publicvoid test06() {
           try{
                 SolrQueryquery = new SolrQuery("测试");
                 query.setHighlight(true).setHighlightSimplePre("<spanclass='highligter'>")
                                             .setHighlightSimplePost("</span>")
                                             .setStart(0).setRows(5);
                 query.setParam("hl.fl","msg_title,msg_content");
                 QueryResponseresp = server.query(query);
                 //查询出来的结果都保存在SolrDocumentList中
                 SolrDocumentListsdl = resp.getResults();
                 System.out.println(sdl.getNumFound());
                 for(SolrDocumentsd:sdl) {
                      Stringid = (String)sd.getFieldValue("id");
                      System.out.println(resp.getHighlighting().get(id).get("msg_content"));
                 }
           }catch (SolrServerException e) {
                 e.printStackTrace();
           }
      }

腾讯云技术深度探索：构建高效云原生微服务架构我的运维人生云原生架构腾讯云运维开发技术共享
腾讯云技术深度探索：构建高效云原生微服务架构在当今快速发展的技术环境中，云原生技术已成为企业数字化转型的关键驱动力。腾讯云作为行业领先的云服务提供商，不断推出创新的产品和技术，助力企业构建高效、可扩展的云原生微服务架构。本文将深入探讨腾讯云在微服务领域的最新进展，并通过一个实际案例展示如何在腾讯云平台上构建云原生应用。腾讯云微服务架构概览腾讯云微服务架构基于云原生理念，旨在帮助企业快速实现应用的容
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
Java面试题精选：消息队列(二) 芒果不是芒 Java面试题精选 java kafka
一、Kafka的特性1.消息持久化：消息存储在磁盘，所以消息不会丢失2.高吞吐量：可以轻松实现单机百万级别的并发3.扩展性：扩展性强，还是动态扩展4.多客户端支持：支持多种语言（Java、C、C++、GO、）5.KafkaStreams（一个天生的流处理）:在双十一或者销售大屏就会用到这种流处理。使用KafkaStreams可以快速的把销售额统计出来6.安全机制：Kafka进行生产或者消费的时候会
Kafka是如何保证数据的安全性、可靠性和分区的喜欢猪猪 kafka 分布式
Kafka作为一个高性能、可扩展的分布式流处理平台，通过多种机制来确保数据的安全性、可靠性和分区的有效管理。以下是关于Kafka如何保证数据安全性、可靠性和分区的详细解析：一、数据安全性SSL/TLS加密：Kafka支持SSL/TLS协议，通过配置SSL证书和密钥来加密数据传输，确保数据在传输过程中不会被窃取或篡改。这一机制有效防止了中间人攻击，保护了数据的安全性。SASL认证：Kafka支持多种
Armv8.3 体系结构扩展--原文版代码改变世界ctw ARM-TEE-Android armv8 嵌入式 arm架构安全架构芯片 Trustzone Secureboot
快速链接:.ARMv8/ARMv9架构入门到精通-[目录]付费专栏-付费课程【购买须知】:个人博客笔记导读目录(全部)TheArmv8.3architectureextensionTheArmv8.3architectureextensionisanextensiontoArmv8.2.Itaddsmandatoryandoptionalarchitecturalfeatures.Somefeat
《 C++ 修炼全景指南：九》打破编程瓶颈！掌握二叉搜索树的高效实现与技巧 Lenyiin C++修炼全景指南技术指南 c++算法 stl
摘要本文详细探讨了二叉搜索树（BinarySearchTree,BST）的核心概念和技术细节，包括插入、查找、删除、遍历等基本操作，并结合实际代码演示了如何实现这些功能。文章深入分析了二叉搜索树的性能优势及其时间复杂度，同时介绍了前驱、后继的查找方法等高级功能。通过自定义实现的二叉搜索树类，读者能够掌握其实际应用，此外，文章还建议进一步扩展为平衡树（如AVL树、红黑树）以优化极端情况下的性能退化。
一台适合普通办公使用的电脑推荐thinkpadE475 sam_1c14
图片发自App图片发自App缺点是内存只有4G。胜在便宜。14寸，很轻薄。给老婆买的。应该不能用来编程，会很慢的，真要用可以自己加根内存条，最大扩展到32G。图片发自App
《 C++ 修炼全景指南：四》揭秘 C++ List 容器背后的实现原理，带你构建自己的双向链表 Lenyiin 技术指南 C++修炼全景指南 c++list 链表 stl
本篇博客，我们将详细讲解如何从头实现一个功能齐全且强大的C++List容器，并深入到各个细节。这篇博客将包括每一步的代码实现、解释以及扩展功能的探讨，目标是让初学者也能轻松理解。一、简介1.1、背景介绍在C++中，std::list是一个基于双向链表的容器，允许高效的插入和删除操作，适用于频繁插入和删除操作的场景。与动态数组不同，list允许常数时间内的插入和删除操作，支持双向遍历。这篇文章将详细
设计模式之建造者模式(通俗易懂--代码辅助理解【Java版】） ok!ko 设计模式设计模式建造者模式 java
文章目录设计模式概述1、建造者模式2、建造者模式使用场景3、优点4、缺点5、主要角色6、代码示例：1）实现要求2）UML图3)实现步骤：1）创建一个表示食物条目和食物包装的接口2）创建实现Packing接口的实体类3）创建实现Item接口的抽象类，该类提供了默认的功能4）创建扩展了Burger和ColdDrink的实体类5）创建一个Meal类，带有上面定义的Item对象6）创建一个MealBuil
程序员架构师主要是做什么_程序员架构师：职责、技能与挑战绿色小猪
免费备考资料（2024年11月软考）：历年试题+视频课合集+电子讲义点击领取>>>免费刷题：2024年11月软考备考刷题点此进入>>>程序员架构师的角色定位在软件开发领域，程序员架构师是一个至关重要的角色。他们不仅需要深入理解业务需求，还要将其转化为技术上的解决方案。程序员架构师是项目中的技术领航者，负责制定和维护软件系统的整体架构，确保系统的可扩展性、可维护性和性能。他们的工作涉及从概念化到实现
python中文版软件下载-Python中文版编程大乐趣
python中文版是一种面向对象的解释型计算机程序设计语言。python中文版官网面向对象编程，拥有高效的高级数据结构和简单而有效的方法，其优雅的语法、动态类型、以及天然的解释能力，让它成为理想的语言。软件功能强大，简单易学，可以帮助用户快速编写代码，而且代码运行速度非常快，几乎可以支持所有的操作系统，实用性真的超高的。python中文版软件介绍：python中文版的解释器及其扩展标准库的源码和编
《Mesh 组网和 AC+AP 组网的优缺点》 jiyiwangluokeji 网络工程网络
Mesh组网和AC+AP组网的优缺点。Mesh组网的优点：1.部署灵活：节点之间可以通过无线方式连接，新增节点比较方便，无需事先规划布线。2.自我修复和优化：如果某个节点出现故障，网络可以自动重新路由数据，保证网络的稳定性。3.覆盖范围广：可以通过添加节点轻松扩展覆盖区域。4.设备选型多样：市面上有多种不同品牌和型号的Mesh路由器可供选择。Mesh组网的缺点：1.无线回程可能存在性能瓶颈：如果节
探索Zebra4J：构建高效企业级Web应用的微服务框架叶准鑫Natalie
探索Zebra4J：构建高效企业级Web应用的微服务框架ZebraZebra4J/Zebra4Js基于SpringBoot的JavaWeb/Nodejs框架项目地址:https://gitcode.com/gh_mirrors/zebra/Zebra项目介绍在当今快速发展的技术环境中，构建高效、可扩展的企业级Web应用是每个开发团队的追求。Zebra4J作为一款基于SpringBoot的全新微服务
Hadoop 傲雪凌霜，松柏长青后端大数据 hadoop 大数据分布式
ApacheHadoop是一个开源的分布式计算框架，主要用于处理海量数据集。它具有高度的可扩展性、容错性和高效的分布式存储与计算能力。Hadoop核心由四个主要模块组成，分别是HDFS（分布式文件系统）、MapReduce（分布式计算框架）、YARN（资源管理）和HadoopCommon（公共工具和库）。1.HDFS（HadoopDistributedFileSystem）HDFS是Hadoop生
Nginx的使用场景：构建高效、可扩展的Web架构张某布响丸辣 nginx 前端架构
Nginx，作为当今最流行的Web服务器和反向代理软件之一，凭借其高性能、稳定性和灵活性，在众多Web项目中扮演着核心角色。无论是个人博客、中小型网站，还是大型企业级应用，Nginx都能提供强大的支持。本文将探讨Nginx的几个主要使用场景，帮助读者理解如何在实际项目中充分利用Nginx的优势。1.静态文件服务对于包含大量静态文件（如HTML、CSS、JavaScript、图片等）的网站，Ngin
svg图片兼容性和用法优缺点独行侠_ef93
svg图片的使用方法第一次来认认真真的研究了下svg图片，之前只是在网上见过，但都是一晃而过也没当回事，最近网站改版看到同事有用到svg格式的图片，想想自己干了几年的重构也没用过，这些细节的知识是应该好好研究研究了。暂时还没研究得完全透切，先记下目前为止所看到的吧不然又给忘了。svg可缩放矢量图形（ScalableVectorGraphics），顾名思义就是任意改变其大小也不会变形，是基于可扩展标
如何区分Python中数据类型可变还是不可变秸秆混凝烧结工程师
关键字改变元素值，内存地址发生改变，被称为数据内型不可变如string，元组，存储数据类型单一，不能同时存在两个数据类型，新增元素后，表容量，元素个数，元素存储区ID改变，典型的内置元素一体存储法；改变元素值，但是内存地址不改变就是可变数据内型，如list，存储元素可以不同，删除，新增，插入，表序列不改变，扩展表容量时，对象地址ID不变，属于顺序表的，分离式存储结构，外置元素法，python中不可
Java集合类框架源码分析之 RoleList源码解析【6】 yunzhonghefei Java集合类源码分析 RoleList源码解析
该类继承于ArrayList，针对Role进行了一些扩展。其他方法和ArrayList中基本相同，源码不做针对性分析：看一下类简介：/***代表了一个roles的列表，作为方法setRoles()的参数，去创建一个关联关系，并且尝试在同一个关系中设置多个角色。*ARoleListrepresentsalistofroles(Roleobjects).Itisusedas*parameterwhen
rabbitmq 楚楚ccc Java系列 rabbitmq 分布式
1.消息服务概述、rabbitmq核心概念消息服务概述：大多数应用中，可通过消息服务中间件来提升系统异步通信，扩展解耦能力两个重要概念：消息代理(messagebroker)和目的地(destination)。当消息发送者者发出消息后，将由消息代理接管，消息代理保证将消息传递至目的地两种形式的目的地：队列(queue):点对点的消息通信(point-to-point)主题(topic):发布(pu
（k8s）Kubernetes 从0到1容器编排之旅道不贱卖，法不轻传 kubernets kubernetes 容器云原生
一、引言在当今数字化的浪潮中，Kubernetes如同一艘强大的航船，引领着容器化应用的部署与管理。它以其卓越的灵活性、可扩展性和可靠性，成为众多企业和开发者的首选。然而，要真正发挥Kubernetes的强大威力，仅仅掌握基本操作是远远不够的。本文将带你深入探索Kubernetes使用过程中的奇技妙法，为你开启一段优雅的容器编排之旅。二、高级资源管理之精妙艺术1.资源配额与限制：雕琢资源之美•Ku
python数据分析知识点大全编程零零七 python数据分析 python 开发语言 python数据分析数据分析知识点大全 python数据分析知识点 python教程 python基础
Python数据分析知识点大全可以归纳为以下几个主要方面：一、基础概念与目的数据分析定义：数据分析是指用适当的统计分析方法对收集来的大量数据进行分析，提取有用信息和形成结论，对数据加以详细研究和概括总结的过程。其目的在于从数据中挖掘规律、验证猜想、进行预测。Python在数据分析中的优势：Python因其易学性、快速开发、丰富的扩展库（如NumPy、Pandas等）和成熟的框架，成为数据分析领域的
10- 【JavaWeb】Tomcat、Servlet基础 weixin_44329069 JavaWeb tomcat servlet java
1.MacOS配置Tomcat服务器教程MacOS配置Tomcat服务器教程2.Servlet基础1.创建ServletServlet是一个扩展服务器功能的Java类，主要用于处理HTTP请求。以下是一个简单的Servlet示例：importjava.io.IOException;importjavax.servlet.ServletException;importjavax.servlet.an
面试常见题之Spring Cloud 拾光编程 java面试面试 spring cloud 职场和发展
在Java软件工程师的面试中，关于SpringCloud的题目旨在考察候选人对微服务架构的理解、SpringCloud各组件的掌握程度、以及如何在实际项目中应用这些技术来构建可扩展、可靠和高效的服务。本文将概括性地列出20个关于SpringCloud的面试题目，并为每个题目提供一个简要的回答框架或关键点，以便你根据需要进行扩展。1.SpringCloud是什么？它解决了什么问题？回答框架：Spri
Flume：大规模日志收集与数据传输的利器傲雪凌霜，松柏长青后端大数据 flume 大数据
Flume：大规模日志收集与数据传输的利器在大数据时代，随着各类应用的不断增长，产生了海量的日志和数据。这些数据不仅对业务的健康监控至关重要，还可以通过深入分析，帮助企业做出更好的决策。那么，如何高效地收集、传输和存储这些海量数据，成为了一项重要的挑战。今天我们将深入探讨ApacheFlume，它是如何帮助我们应对这些挑战的。一、Flume概述ApacheFlume是一个分布式、可靠、可扩展的日志
linux 操作系统下的compress命令介绍和使用案例 lisanmengmeng linux 命令工具 linux 运维服务器
linux操作系统下的compress命令介绍和使用案例compress命令是Linux系统中用于文件压缩的一个工具，主要使用Lempel-Ziv-Welch(LZW)算法进行数据压缩。压缩后，文件的扩展名将变为“.Z”。虽然compress命令在历史上有其重要性，但在现代Linux系统中，它已经被更高效的压缩工具如gzip和bzip2所取代使用方法基本语法bashcompress[选项][文件名
6.Java面向对象第六章抽象类和接口懒洋洋大魔王 Java面像对象 java 开发语言
5.Java面向对象抽象类和接口文章目录5.Java面向对象抽象类和接口一、1.抽象类VS普通类2.抽象方法VS普通方法3.抽象类与抽象方法的使用二、接口1.必须知道的接口特性2.定义接口3.接口使用三、抽象类vs接口相同点不同点多用组合，少用继承针对接口编程针对扩展开放，针对改变关闭多用组合，少用继承针对接口编程针对扩展开放，针对改变关闭一、1.抽象类VS普通类抽象类不能被实例化但可以创建一个引
一文搞懂应用架构的3个核心概念公众号-架构师汤师爷后端架构设计 Java SaaS
如果你是一名业务开发，你可能要说，我整天就是做CRUD（增删改查），哪里需要了解什么应用架构设计？经常有人说，程序员35岁之后很容易陷入瓶颈，被行业淘汰，我觉得原因其实就在此。有些朋友在写代码的时候，可能没有太多考虑非功能性的需求、扩展性，只是完成功能，觉得能用就好。做事情的时候，也没有长远的规划，只是把眼前的事情做好就满足了。我面试过很多大龄候选人，他们的简历长达十几页，项目经历有几十个。然而，
架构评审的自动化与人工智能: 如何提高效率光剑书架上的书架构自动化人工智能运维
1.背景介绍架构评审是软件开发过程中的一个关键环节，它旨在确保软件架构的质量、可维护性和可扩展性。传统的架构评审通常是由人工进行，需要大量的时间和精力。随着大数据技术和人工智能的发展，自动化和人工智能技术已经开始应用于架构评审，从而提高评审的效率和准确性。在本文中，我们将讨论如何通过自动化和人工智能技术来提高架构评审的效率。我们将从以下几个方面进行讨论：背景介绍核心概念与联系核心算法原理和具体操作
深入了解树莓派5：性能与功能的全面升级像风一样自由2020 树莓派 ubuntu
深入了解树莓派5：性能与功能的全面升级引言2023年，树莓派基金会正式发布了备受期待的树莓派5（RaspberryPi5）。作为树莓派系列的最新一代产品，树莓派5在处理性能、连接性和功能扩展方面都有了显著的提升，为开发者、教育者和科技爱好者带来了更强大的工具。本文将详细介绍树莓派5的特性、规格和应用场景。一、产品概述树莓派5是基于ARM架构的单板计算机，延续了树莓派系列低成本、高性能的设计理念。它
oracle数据库安装和配置详细讲解程序员小羊！运维数据库 oracle
大家好，我是程序员小羊！前言：Oracle数据库是全球广泛使用的关系型数据库管理系统(RDBMS)，提供高性能、可靠性、安全性和可扩展性，广泛应用于企业关键任务系统。下面详细介绍如何在CentOS系统上安装和配置Oracle数据库。1.前提条件1.1硬件要求内存：最小1GB，推荐2GB以上。硬盘：至少10GB的可用空间，视具体应用需求而定。1.2软件要求操作系统：CentOS7或CentOS8（确
jvm调优总结（从基本概念到深度优化） oloz java jvm jdk 虚拟机应用服务器
JVM参数详解：http://www.cnblogs.com/redcreen/archive/2011/05/04/2037057.html Java虚拟机中，数据类型可以分为两类：基本类型和引用类型。基本类型的变量保存原始值，即：他代表的值就是数值本身；而引用类型的变量保存引用值。“引用值”代表了某个对象的引用，而不是对象本身，对象本身存放在这个引用值所表示的地址的位置。
【Scala十六】Scala核心十：柯里化函数 bit1129 scala
本篇文章重点说明什么是函数柯里化，这个语法现象的背后动机是什么，有什么样的应用场景，以及与部分应用函数(Partial Applied Function)之间的联系 1. 什么是柯里化函数 A way to write functions with multiple parameter lists. For instance def f(x: Int)(y: Int) is a
HashMap dalan_123 java
HashMap在java中对很多人来说都是熟的；基于hash表的map接口的非同步实现。允许使用null和null键；同时不能保证元素的顺序；也就是从来都不保证其中的元素的顺序恒久不变。 1、数据结构在java中，最基本的数据结构无外乎：数组和引用（指针），所有的数据结构都可以用这两个来构造，HashMap也不例外，归根到底HashMap就是一个链表散列的数据
Java Swing如何实时刷新JTextArea，以显示刚才加append的内容周凡杨 java 更新 swing JTextArea
在代码中执行完textArea.append("message")后，如果你想让这个更新立刻显示在界面上而不是等swing的主线程返回后刷新，我们一般会在该语句后调用textArea.invalidate()和textArea.repaint()。问题是这个方法并不能有任何效果，textArea的内容没有任何变化，这或许是swing的一个bug，有一个笨拙的办法可以实现
servlet或struts的Action处理ajax请求 g21121 servlet
其实处理ajax的请求非常简单，直接看代码就行了： //如果用的是struts //HttpServletResponse response = ServletActionContext.getResponse(); // 设置输出为文字流 response.setContentType("text/plain"); // 设置字符集 res
FineReport的公式编辑框的语法简介老A不折腾 finereport 公式总结
FINEREPORT用到公式的地方非常多，单元格（以=开头的便被解析为公式），条件显示，数据字典，报表填报属性值定义，图表标题，轴定义，页眉页脚，甚至单元格的其他属性中的鼠标悬浮提示内容都可以写公式。简单的说下自己感觉的公式要注意的几个地方： 1.if语句语法刚接触感觉比较奇怪，if(条件式子,值1,值2)，if可以嵌套，if(条件式子1，值1，if(条件式子2，值2，值3)
linux mysql 数据库乱码的解决办法墙头上一根草 linux mysql 数据库乱码
linux 上mysql数据库区分大小写的配置 lower_case_table_names=1 1-不区分大小写 0-区分大小写修改/etc/my.cnf 具体的修改内容如下: [client] default-character-set=utf8 [mysqld] datadir=/var/lib/mysql socket=/va
我的spring学习笔记6-ApplicationContext实例化的参数兼容思想 aijuans Spring 3
ApplicationContext能读取多个Bean定义文件，方法是： ApplicationContext appContext = new ClassPathXmlApplicationContext（ new String[]｛“bean-config1.xml”，“bean-config2.xml”，“bean-config3.xml”，“bean-config4.xml
mysql 基准测试之sysbench annan211 基准测试 mysql基准测试 MySQL测试 sysbench
1 执行如下命令，安装sysbench-0.5： tar xzvf sysbench-0.5.tar.gz cd sysbench-0.5 chmod +x autogen.sh ./autogen.sh ./configure --with-mysql --with-mysql-includes=/usr/local/mysql
sql的复杂查询使用案列与技巧百合不是茶 oracle sql 函数数据分页合并查询
本片博客使用的数据库表是oracle中的scott用户表; ------------------- 自然连接查询查询 smith 的上司(两种方法) &
深入学习Thread类 bijian1013 java thread 多线程 java多线程
一．线程的名字下面来看一下Thread类的name属性，它的类型是String。它其实就是线程的名字。在Thread类中，有String getName()和void setName(String)两个方法用来设置和获取这个属性的值。同时，Thr
JSON串转换成Map以及如何转换到对应的数据类型 bijian1013 java fastjson net.sf.json
在实际开发中，难免会碰到JSON串转换成Map的情况，下面来看看这方面的实例。另外，由于fastjson只支持JDK1.5及以上版本，因此在JDK1.4的项目中可以采用net.sf.json来处理。一.fastjson实例 JsonUtil.java package com.study; impor
【RPC框架HttpInvoker一】HttpInvoker：Spring自带RPC框架 bit1129 spring
HttpInvoker是Spring原生的RPC调用框架，HttpInvoker同Burlap和Hessian一样，提供了一致的服务Exporter以及客户端的服务代理工厂Bean，这篇文章主要是复制粘贴了Hessian与Spring集成一文，【RPC框架Hessian四】Hessian与Spring集成在【RPC框架Hessian二】Hessian 对象序列化和反序列化一文中
【Mahout二】基于Mahout CBayes算法的20newsgroup的脚本分析 bit1129 Mahout
#!/bin/bash # # Licensed to the Apache Software Foundation (ASF) under one or more # contributor license agreements. See the NOTICE file distributed with # this work for additional information re
nginx三种获取用户真实ip的方法 ronin47
随着nginx的迅速崛起，越来越多公司将apache更换成nginx. 同时也越来越多人使用nginx作为负载均衡, 并且代理前面可能还加上了CDN加速，但是随之也遇到一个问题：nginx如何获取用户的真实IP地址,如果后端是apache,请跳转到<apache获取用户真实IP地址>，如果是后端真实服务器是nginx，那么继续往下看。实例环境：用户IP 120.22.11.11
java-判断二叉树是不是平衡 bylijinnan java
参考了 http://zhedahht.blog.163.com/blog/static/25411174201142733927831/ 但是用java来实现有一个问题。由于Java无法像C那样“传递参数的地址，函数返回时能得到参数的值”，唯有新建一个辅助类：AuxClass import ljn.help.*; public class BalancedBTree {
BeanUtils.copyProperties VS PropertyUtils.copyProperties 诸葛不亮 PropertyUtils BeanUtils
BeanUtils.copyProperties VS PropertyUtils.copyProperties 作为两个bean属性copy的工具类，他们被广泛使用，同时也很容易误用，给人造成困然；比如：昨天发现同事在使用BeanUtils.copyProperties copy有integer类型属性的bean时，没有考虑到会将null转换为0，而后面的业
[金融与信息安全]最简单的数据结构最安全 comsci 数据结构
现在最流行的数据库的数据存储文件都具有复杂的文件头格式，用操作系统的记事本软件是无法正常浏览的，这样的情况会有什么问题呢？从信息安全的角度来看，如果我们数据库系统仅仅把这种格式的数据文件做异地备份，如果相同版本的所有数据库管理系统都同时被攻击，那么
vi区段删除 Cwind linux vi 区段删除
区段删除是编辑和分析一些冗长的配置文件或日志文件时比较常用的操作。简记下vi区段删除要点备忘。 vi概述引文中并未将末行模式单独列为一种模式。单不单列并不重要，能区分命令模式与末行模式即可。 vi区段删除步骤： 1. 在末行模式下使用:set nu显示行号非必须，随光标移动vi右下角也会显示行号，能够正确找到并记录删除开始行
清除tomcat缓存的方法总结 dashuaifu tomcat 缓存
用tomcat容器，大家可能会发现这样的问题，修改jsp文件后，但用IE打开依然是以前的Jsp的页面。出现这种现象的原因主要是tomcat缓存的原因。解决办法如下: 在jsp文件头加上 <meta http-equiv="Expires" content="0"> <meta http-equiv="kiben&qu
不要盲目的在项目中使用LESS CSS dcj3sjt126com Web less
　如果你还不知道LESS CSS是什么东西，可以看一下这篇文章，是我一朋友写给新人看的《CSS——LESS》　　不可否认，LESS CSS是个强大的工具，它弥补了css没有变量、无法运算等一些“先天缺陷”，但它似乎给我一种错觉，就是为了功能而实现功能。　　比如它的引用功能 ? .rounded_corners{
[入门]更上一层楼 dcj3sjt126com PHP yii2
更上一层楼通篇阅读完整个“入门”部分，你就完成了一个完整 Yii 应用的创建。在此过程中你学到了如何实现一些常用功能，例如通过 HTML 表单从用户那获取数据，从数据库中获取数据并以分页形式显示。你还学到了如何通过 Gii 去自动生成代码。使用 Gii 生成代码把 Web 开发中多数繁杂的过程转化为仅仅填写几个表单就行。本章将介绍一些有助于更好使用 Yii 的资源：
Apache HttpClient使用详解 eksliang httpclient http协议
Http协议的重要性相信不用我多说了，HttpClient相比传统JDK自带的URLConnection，增加了易用性和灵活性（具体区别，日后我们再讨论），它不仅是客户端发送Http请求变得容易，而且也方便了开发人员测试接口（基于Http协议的），即提高了开发的效率，也方便提高代码的健壮性。因此熟练掌握HttpClient是很重要的必修内容，掌握HttpClient后，相信对于Http协议的了解会
zxing二维码扫描功能 gundumw100 android zxing
经常要用到二维码扫描功能现给出示例代码 import com.google.zxing.WriterException; import com.zxing.activity.CaptureActivity; import com.zxing.encoding.EncodingHandler; import android.app.Activity; import an
纯HTML+CSS带说明的黄色导航菜单 ini html Web html5 css hovertree
HoverTree带说明的CSS菜单:纯HTML+CSS结构链接带说明的黄色导航在线体验效果：http://hovertree.com/texiao/css/1.htm代码如下,保存到HTML文件可以看到效果： <!DOCTYPE html > <html > <head> <title>HoverTree
fastjson初始化对性能的影响 kane_xie fastjson 序列化
之前在项目中序列化是用thrift，性能一般，而且需要用编译器生成新的类，在序列化和反序列化的时候感觉很繁琐，因此想转到json阵营。对比了jackson，gson等框架之后，决定用fastjson，为什么呢，因为看名字感觉很快。。。网上的说法： fastjson 是一个性能很好的 Java 语言实现的 JSON 解析器和生成器，来自阿里巴巴的工程师开发。
基于Mybatis封装的增删改查实现通用自动化sql mengqingyu DAO
1.基于map或javaBean的增删改查可实现不写dao接口和实现类以及xml，有效的提高开发速度。 2.支持自定义注解包括主键生成、列重复验证、列名、表名等 3.支持批量插入、批量更新、批量删除 <bean id="dynamicSqlSessionTemplate" class="com.mqy.mybatis.support.Dynamic
js控制input输入框的方法封装(数字，中文，字母，浮点数等) qifeifei javascript js
在项目开发的时候，经常有一些输入框，控制输入的格式，而不是等输入好了再去检查格式，格式错了就报错，体验不好。 /** 数字，中文，字母,浮点数(+/-/.) 类型输入限制，只要在input标签上加上 jInput="number,chinese,alphabet,floating" 备注：floating属性只能单独用*/ funct
java 计时器应用 tangqi609567707 java timer
mport java.util.TimerTask; import java.util.Calendar; public class MyTask extends TimerTask { private static final int
erlang输出调用栈信息 wudixiaotie erlang
在erlang otp的开发中，如果调用第三方的应用，会有有些错误会不打印栈信息，因为有可能第三方应用会catch然后输出自己的错误信息，所以对排查bug有很大的阻碍，这样就要求我们自己打印调用的栈信息。用这个函数：erlang:process_display (self (), backtrace).需要注意这个函数只会输出到标准错误输出。也可以用这个函数：erlang:get_s

第六章 Lucene扩展

6.1 Tika

6.2 高亮显示

6.3 SOLR

你可能感兴趣的:(Solr,Lucene,扩展)