zfsn

用Lucene实现摘要的高亮点

注明:该类主要是符合本人项目的需求,内容摘要的高亮点实现没这么复杂,此类中不仅仅包含了内容的高亮点实现,还包含了获取xml内容和html纯文本的提取。注意一点的是在对内容进行高亮度化的过程中，其实也就是进行全文检索的过程，所以对文本内容进行分词是必不可少的。否则将无法找到文本中对应的关键词。详细请看类的实现

/*  
 * @(#)SummaryHighlighter.java  
 * Copyright(c)  
 */  
package com.chengyi.util;   
  
import java.io.BufferedReader;   
import java.io.ByteArrayInputStream;   
import java.io.File;   
import java.io.FileInputStream;   
import java.io.FileNotFoundException;   
import java.io.IOException;   
import java.io.InputStreamReader;   
import java.io.Reader;   
import java.io.StringReader;   
  
import javax.swing.ListCellRenderer;   
import javax.xml.parsers.DocumentBuilder;   
import javax.xml.parsers.DocumentBuilderFactory;   
import javax.xml.parsers.ParserConfigurationException;   
  
import org.apache.lucene.analysis.Analyzer;   
import org.apache.lucene.analysis.SimpleAnalyzer;   
import org.apache.lucene.analysis.TokenStream;   
import org.apache.lucene.analysis.cw.Segmenter;   
import org.apache.lucene.analysis.cw.SegmenterUtils;   
import org.apache.lucene.queryParser.QueryParser;   
import org.apache.lucene.search.Query;   
import org.apache.lucene.search.highlight.Highlighter;   
import org.apache.lucene.search.highlight.QueryScorer;   
import org.apache.lucene.search.highlight.SimpleHTMLFormatter;   
import org.htmlparser.util.ParserException;   
import org.w3c.dom.CDATASection;   
import org.w3c.dom.Element;   
import org.w3c.dom.Node;   
import org.w3c.dom.NodeList;   
import org.w3c.dom.Text;   
  
/**  
 * 用lucene实现搜索结果的高亮度  
 *   
 * @version 1.0 2009.02.03  
 * @author zhx  
 *   
 */  
public class SummaryHighlighter {   
  
    /** 高亮度内容属性,只是有标识作用,没有具体意义*/  
    private static String CONTENT = "content";   
  
    /**  
     * 实现内容摘要的高亮点  
     * 此方法传入的xmlContent内容是一个xml文本（格式见测试文件2.txt),我们需根据该xml的结构进行    
     * 分析,并提取该xml中的文本,特殊的是从xml中提取出来的文本又是html格式，所以又得做第二次提取，  
     * 才能获取到纯文本   
     *         
     * @param content  
     *            需高亮度内容  
     * @param keyWord  
     *            高亮度关键字  
     * @return 高亮度摘要  
     */  
    public static String getHighlighterSummary(String xmlContent, String keyWord) {   
        // TODO Auto-generated method stub   
        String hightContent = "";   
        String segmenterContent = "";   
        String htmlContent = "";   
        String content = "";   
        // 获取html内容   
        htmlContent = SummaryHighlighter.getHtmlContentFromXML(xmlContent);   
        // 从html中提取纯文本   
        content = SummaryHighlighter.getTextFromHtml(htmlContent);   
        //System.out.println("提取到的纯文本:" + content);   
        // 对内容进行分词   
        segmenterContent = SummaryHighlighter.segmentString(content);   
        // Analyzer analyzer = new CWordAnalyzer();   
        Analyzer analyzer = new SimpleAnalyzer();   
        QueryParser queryParser = new QueryParser(CONTENT, analyzer);   
        // 设置相似度   
        queryParser.setFuzzyMinSim(0.9f);   
        try {   
            //分析关键词   
            Query query = queryParser.parse(segmentString(keyWord));   
            // Term term=new Term(CONTENT,keyWord);   
            // Query query = new TermQuery(term);   
            QueryScorer scorer = new QueryScorer(query);   
            Highlighter highlighter = new Highlighter(new SimpleHTMLFormatter(   
                    "<font color=\"#cc0033\">", "</font>"), scorer);   
            Reader reader = new StringReader(segmenterContent);   
            TokenStream tokenStream = analyzer.tokenStream(CONTENT, reader);   
            //获取高亮点后的内容   
            hightContent = highlighter.getBestFragments(tokenStream,   
                    segmenterContent, 0, "...");   
            //去除内容中的空格   
            hightContent = hightContent.replace(" ", "").replace(   
                    "<fontcolor=\"#cc0033\">", "<font color=\"#cc0033\">");   
            //System.out.println(hightContent);   
        } catch (IOException e) {   
            // TODO Auto-generated catch block   
            e.printStackTrace();   
        } catch (org.apache.lucene.queryParser.ParseException e) {   
            // TODO Auto-generated catch block   
            e.printStackTrace();   
        }   
        return hightContent;   
    }   
  
    /**  
     * 分词处理  
     *   
     * @param in  
     *            处理内容  
     * @return 分词后的内容  
     */  
    public static String segmentString(String in) {   
        String ret = null;   
        Segmenter mainsegmenter;   
        try {   
            mainsegmenter = SegmenterUtils.getSegmenter(System   
                    .getProperty("java.io.tmpdir")   
                    + "/zword.obj");   
            StringBuffer buffer = null;   
            if (mainsegmenter != null) {   
                BufferedReader bin = new BufferedReader(new StringReader(in));   
                buffer = new StringBuffer();   
                String dataline;   
                String processed;   
                try {   
                    while ((dataline = bin.readLine()) != null) {   
                        processed = mainsegmenter.segmentLine(dataline, " ");   
                        buffer.append(processed).append("\n");   
                    }   
                } catch (IOException ioe) {   
                    // ignored   
                } finally {   
                    try {   
                        bin.close();   
                    } catch (Exception e) {   
                    }   
                }   
            } else {   
            }   
            if (buffer != null) {   
                ret = buffer.toString();   
            }   
        } catch (ClassCastException e1) {   
            // TODO Auto-generated catch block   
            e1.printStackTrace();   
        } catch (FileNotFoundException e1) {   
            // TODO Auto-generated catch block   
            e1.printStackTrace();   
        } catch (IOException e1) {   
            // TODO Auto-generated catch block   
            e1.printStackTrace();   
        } catch (ClassNotFoundException e1) {   
            // TODO Auto-generated catch block   
            e1.printStackTrace();   
        }   
  
        // System.out.println(buffer.toString());   
        return ret;   
    }   
  
    /**  
     * 读取一个文件到字符串里.  
     *   
     * @param sFileName  
     *            文件名  
     * @param sEncode  
     *            String  
     * @return 文件内容  
     */  
    public static String readTextFile(String sFileName, String sEncode) {   
        StringBuffer sbStr = new StringBuffer();   
  
        try {   
            File ff = new File(sFileName);   
            InputStreamReader read = new InputStreamReader(new FileInputStream(   
                    ff), sEncode);   
            BufferedReader ins = new BufferedReader(read);   
  
            String dataLine = "";   
            while (null != (dataLine = ins.readLine())) {   
                sbStr.append(dataLine);   
                // sbStr.append("\r\n");   
            }   
  
            ins.close();   
        } catch (Exception e) {   
            e.printStackTrace();   
        }   
        //System.out.println("读入的文章内容:" + sbStr.toString());   
        return sbStr.toString();   
    }   
  
    /**  
     * 从xml中获取内容，此方法对应测试文件2.txt的节点结构，目的是获取<![cdata[.....]]>中的内容  
     *   
     * @param xmlContent  
     *            xml内容  
     * @return 提取出来的内容  
     */  
    public static String getHtmlContentFromXML(String xmlContent) {   
        xmlContent = xmlContent.replaceAll("UTF-8", "GBK");   
        String content = "";   
        DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();   
        DocumentBuilder builder;   
        try {   
            builder = factory.newDocumentBuilder();   
            org.w3c.dom.Document doc = builder.parse(new ByteArrayInputStream(   
                    xmlContent.getBytes()));   
            // normalize text representation   
            doc.getDocumentElement().normalize();   
            NodeList listOfContents = doc   
                    .getElementsByTagName("static-content");   
            int totalContents = listOfContents.getLength();   
            // System.out.println("Total no of people : " + totalContents);   
            for (int s = 0; s < listOfContents.getLength(); s++) {   
                Node contentNode = listOfContents.item(s);   
                NodeList listOfCdata = contentNode.getChildNodes();   
                int totalCdata = listOfCdata.getLength();   
                for (int i = 0; i < totalCdata; i++) {   
                    Node cdataNode = listOfCdata.item(i);   
                    if (cdataNode.getNodeType() == Node.CDATA_SECTION_NODE) {   
                        CDATASection cdataSection = (CDATASection) cdataNode;   
                        content = cdataSection.getWholeText();   
                        // System.out.print(content);   
                    }   
                    /*  
                     * if (node1.getNodeType() == Node.TEXT_NODE) { n++; String  
                     * type = node1.getNodeName(); System.out.println("第" + n +  
                     * "个是" + type + "节点,内容:"); Text textNode = (Text) node1;  
                     * String content = textNode.getWholeText();  
                     * System.out.print(content); }  
                     */  
                }// end of if clause   
            }// end of for loop with s var   
  
        } catch (ParserConfigurationException e) {   
            // TODO Auto-generated catch block   
            e.printStackTrace();   
        } catch (org.xml.sax.SAXException e) {   
            // TODO Auto-generated catch block   
            e.printStackTrace();   
        } catch (IOException e) {   
            // TODO Auto-generated catch block   
            e.printStackTrace();   
        }   
  
        return content;   
  
    }   
  
    /**  
     * 提取html中的纯文本内容  
     *   
     * @param htmlContent html内容  
     * @return 纯文本内容  
     */  
    public static String getTextFromHtml(String htmlContent) {   
        boolean bContent = true;   
        StringBuffer sBuffer = new StringBuffer(8096 * 2);   
        char[] cBuffer = htmlContent.toCharArray();   
        int nCount = cBuffer.length;   
        for (int i = 0; i < nCount; i++) {   
            if (bContent == false) {   
                if (cBuffer[i] == '>')   
                    bContent = true;   
                else  
                    continue;   
            } else {   
                if (cBuffer[i] == '<') {   
                    bContent = false;   
                    continue;   
                } else if (cBuffer[i] == '\n' || cBuffer[i] == ' '  
                        || cBuffer[i] == ' ' || cBuffer[i] == ' ') {   
                    continue;   
                } else if (cBuffer[i] == '&' && cBuffer[i + 1] == 'n'  
                        && cBuffer[i + 2] == 'b' && cBuffer[i + 3] == 's'  
                        && cBuffer[i + 4] == 'p' && cBuffer[i + 5] == ';') {   
                    i = i + 5;   
                    continue;   
                }   
  
                sBuffer.append(cBuffer[i]);   
            }   
        }   
        return sBuffer.toString();   
    }   
       
  
  
    /**  
     * test  
     *   
     * @param args  
     */  
    public static void main(String[] args) {   
        // TODO Auto-generated method stub   
        String content = SummaryHighlighter.readTextFile("d:/2.txt", "gbk");   
        String keyWord = "中国";   
        SummaryHighlighter.getHighlighterSummary(content, keyWord);   
  
    }   
  
  
}

测试文件2.txt的内容:
<?xml version='1.0' encoding='UTF-8'?>
<root available-locales="en_US," default-locale="en_US">
<static-content language-id="en_US">
<![CDATA[<p>        凡中国产业集群网在<a href="http://www.csic99.com">www.csic99.com</a>运作的网站明确标示由中国产业集群合作伙伴运营的中国产业集群该城市网页及该城市的相关页面，均由中国产业集群的合作伙伴按照中国产业集群授权书及中国产业集群网的用户协议、使用规则等规定，在其所获得授权范围与授权期限内予以运营中国产业集群在此申明会积极帮助您，以支持您合法权益得到保障。 <br />      因中国产业集群合作伙伴在其被授权范围与期限内，按照法律法规规定及中国产业集群网的相关规定，所作之行为，如果您认为损害到了您的合法权益，您可以按照中国产业集群网约定的办法予以解决；中国产业集群合作伙伴在其被授权范围以外或违反法律法规规定及违反中国产业集群网的规定，所作之行为（包括网上及非网上行为）而使您（任何中国产业集群网用户或任何第三方）受到的任何损失，或与一名或多名用户发生争议，就上述损失和/或争议产生或在任何方面与上述损失和/或争议有关的每一种类和性质的已知或未知、可疑或非可疑、披露或未披露的索赔、要求和损害，特此申明如下：鉴于中国产业集群合作伙伴之授权范围自其被授权之日起，已在本网站显著位置予以公开，中国产业集群网的用户协议及相关规定与免责申明等也在本网站显著位置予以，且中国产业集群仅作为网上分发信息的渠道，而并非信息的发布方，同时，中国产业集群没有事先审核用户上传的内容，也没有事后参与用户之间的实际联络之义务，故对于因为中国产业集群合作伙伴在其被授权范围以外或违反法律法规规定及中国产业集群网的相关规定，所作之行为（包括网上及非网上行为）而使您受到任何损失，或与一名或多名用户发生争议，就上述损失和/或争议产生或在任何方面与上述损失和/或争议有关的每一种类和性质的已知或未知、可疑或非可疑、披露或未披露的索赔、要求和损害，特此申明免除中国产业集群（和中国产业集群的高级职员、董事、代理人、关联公司、母公司、子公司和雇员）的任何责任。 <br />请您仔细阅读相关授权文书，本网站用户协议及相关规定与免责申明等，以避免不必要的损失。                                                                                                                                                                                                                                                         中国产业集群网</p>]]>
</static-content>
</root>

高级编程--XML+socket练习题 masa010 java 开发语言
1.北京华北2114.8万人上海华东2,500万人广州华南1292.68万人成都华西1417万人（1）使用dom4j将信息存入xml中（2）读取信息，并打印控制台（3）添加一个city节点与子节点（4）使用socketTCP协议编写服务端与客户端，客户端输入城市ID，服务器响应相应城市信息（5）使用socketTCP协议编写服务端与客户端，客户端要求用户输入city对象，服务端接收并使用dom4j
Python教程：一文了解使用Python处理XPath 旦莫 Python进阶 python 开发语言
目录1.环境准备1.1安装lxml1.2验证安装2.XPath基础2.1什么是XPath？2.2XPath语法2.3示例XML文档3.使用lxml解析XML3.1解析XML文档3.2查看解析结果4.XPath查询4.1基本路径查询4.2使用属性查询4.3查询多个节点5.XPath的高级用法5.1使用逻辑运算符5.2使用函数6.实战案例6.1从网页抓取数据6.1.1安装Requests库6.1.2代
【目标检测数据集】卡车数据集1073张VOC+YOLO格式熬夜写代码的平头哥∰ 目标检测 YOLO 人工智能
数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：1073标注数量(xml文件个数)：1073标注数量(txt文件个数)：1073标注类别数：1标注类别名称:["truck"]每个类别标注的框数：truck框数=1120总框数：1120使用标注工具：labelImg标注
钢筋长度超限检测检数据集VOC+YOLO格式215张1类别 futureflsl 数据集 YOLO 深度学习机器学习
数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：215标注数量(xml文件个数)：215标注数量(txt文件个数)：215标注类别数：1标注类别名称:["iron"]每个类别标注的框数：iron框数=215总框数：215使用标注工具：labelImg标注规则：对类别进
SpringBlade dict-biz/list 接口 SQL 注入漏洞文章永久免费只为良心 oracle 数据库
SpringBladedict-biz/list接口SQL注入漏洞POC:构造请求包查看返回包你的网址/api/blade-system/dict-biz/list?updatexml(1,concat(0x7e,md5(1),0x7e),1)=1漏洞概述在SpringBlade框架中，如果dict-biz/list接口的后台处理逻辑没有正确地对用户输入进行过滤或参数化查询（PreparedSta
spring如何整合druid连接池？惜.己 spring spring junit 数据库 java idea 后端 xml
目录spring整合druid连接池1.新建maven项目2.新建mavenModule3.导入相关依赖4.配置log4j2.xml5.配置druid.xml1)xml中如何引入properties2)下面是配置文件6.准备jdbc.propertiesJDBC配置项解释7.配置druid8.测试spring整合druid连接池1.新建maven项目打开IDE（比如IntelliJIDEA,Ecl
Java：爬虫框架 dingcho Java java 爬虫
一、ApacheNutch2【参考地址】Nutch是一个开源Java实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。包括全文搜索和Web爬虫。Nutch致力于让每个人能很容易,同时花费很少就可以配置世界一流的Web搜索引擎.为了完成这一宏伟的目标,Nutch必须能够做到:每个月取几十亿网页为这些网页维护一个索引对索引文件进行每秒上千次的搜索提供高质量的搜索结果简单来说Nutch支持分
JAVA·一个简单的登录窗口 MortalTom java 开发语言学习
文章目录概要整体架构流程技术名词解释技术细节资源概要JavaSwing是Java基础类库的一部分，主要用于开发图形用户界面（GUI）程序整体架构流程新建项目，导入sql.jar包（链接放在了文末），编译项目并运行技术名词解释一、特点丰富的组件提供了多种可视化组件，如按钮（JButton）、文本框（JTextField）、标签（JLabel）、下拉列表（JComboBox）等，可以满足不同的界面设计
遥感影像的切片处理 sand&wich 计算机视觉 python 图像处理
在遥感影像分析中，经常需要将大尺寸的影像切分成小片段，以便于进行详细的分析和处理。这种方法特别适用于机器学习和图像处理任务，如对象检测、图像分类等。以下是如何使用Python和OpenCV库来实现这一过程，同时确保每个影像片段保留正确的地理信息。准备环境首先，确保安装了必要的Python库，包括numpy、opencv-python和xml.etree.ElementTree。这些库将用于图像处理
最简单将静态网页挂载到服务器上(不用nginx) 全能全知者服务器 nginx 运维前端 html 笔记
最简单将静态网页挂载到服务器上(不用nginx)如果随便弄个静态网页挂在服务器都要用nignx就太麻烦了，所以直接使用Apache来搭建一些简单前端静态网页会相对方便很多检查Web服务器服务状态：sudosystemctlstatushttpd#ApacheWeb服务器如果发现没有安装web服务器：安装Apache：sudoyuminstallhttpd启动Apache：sudosystemctl
使用由 Python 编写的 lxml 实现高性能 XML 解析 hunyxv python 笔记 python xml
转载自：文章lxml简介Python从来不出现XML库短缺的情况。从2.0版本开始，它就附带了xml.dom.minidom和相关的pulldom以及SimpleAPIforXML(SAX)模块。从2.4开始，它附带了流行的ElementTreeAPI。此外，很多第三方库可以提供更高级别的或更具有python风格的接口。尽管任何XML库都足够处理简单的DocumentObjectModel(DOM
浅谈MapReduce Android路上的人 Hadoop 分布式计算 mapreduce 分布式框架 hadoop
从今天开始，本人将会开始对另一项技术的学习，就是当下炙手可热的Hadoop分布式就算技术。目前国内外的诸多公司因为业务发展的需要，都纷纷用了此平台。国内的比如BAT啦，国外的在这方面走的更加的前面，就不一一列举了。但是Hadoop作为Apache的一个开源项目，在下面有非常多的子项目，比如HDFS，HBase,Hive，Pig,等等，要先彻底学习整个Hadoop，仅仅凭借一个的力量，是远远不够的。
[数据集][目标检测]汽车头部尾部检测数据集VOC+YOLO格式5319张3类别 FL1623863129 数据集目标检测汽车 YOLO
数据集制作单位：未来自主研究中心(FIRC)版权单位：未来自主研究中心(FIRC)版权声明：数据集仅仅供个人使用，不得在未授权情况下挂淘宝、咸鱼等交易网站公开售卖,由此引发的法律责任需自行承担数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：5319标注数量(xml文件
swing窗体打jar包后找不到图片的问题 zoyation java jar swing classloader image eclipse java
今天打jar包遇到一个怪问题:打成jar包后双击运行没反应cmd运行有反应但出现下列问题Causedby:java.lang.ExceptionInInitializerErroratcom.zou.ui.MyDialog.init(MyDialog.java:92)atcom.zou.ui.MyDialog.(MyDialog.java:45)atcom.zou.ui.LoginDialog.(
idea使用自定义checkstyle.xml配置文件 Gemkey
1.下载插件image.png2.插件安装完后,找到设置中的checkstyle,点击"+",新增自定义规则image.png3.输入描述信息,点击Browse找到对应的文件image.pngimage.png4.可以把active勾上,则使用默认校验规则,点击OK,则可以开始使用自定义规则检测单个文件了image.png
Hadoop 傲雪凌霜，松柏长青后端大数据 hadoop 大数据分布式
ApacheHadoop是一个开源的分布式计算框架，主要用于处理海量数据集。它具有高度的可扩展性、容错性和高效的分布式存储与计算能力。Hadoop核心由四个主要模块组成，分别是HDFS（分布式文件系统）、MapReduce（分布式计算框架）、YARN（资源管理）和HadoopCommon（公共工具和库）。1.HDFS（HadoopDistributedFileSystem）HDFS是Hadoop生
Python精选200Tips：121-125 AnFany Python200+Tips python 开发语言
Spendyourtimeonself-improvement121Requests-简化的HTTP请求处理发送GET请求发送POST请求发送PUT请求发送DELETE请求会话管理处理超时文件上传122BeautifulSoup-网页解析和抓取解析HTML和XML文档查找单个标签查找多个标签使用CSS选择器查找标签提取文本修改文档内容删除标签处理XML文档123Scrapy-强大的网络爬虫框架示例
maven-assembly-plugin 打包实例带着二娃去遛弯
1.先在pom.xml文件中添加assembly打包插件org.apache.maven.pluginsmaven-assembly-plugin2.6assembly/assembly.xmlmake-assemblypackagesingle说明:1.需要修改的可能就是descriptors标签下面的打包配置文件目录,指定assembly.xml的路径.2.可以添加多个打包配置文件,进行多种形
小程序通过js控制页面字体颜色属性祈澈菇凉
需求：当电量少于百分之20的时候，显示电量的字体显示为红色。1：在wxml里面设置属性batStyle：style="{{item.batStyle}}"电量:{{item.battery}}%2：当复合逻辑条件的时候，在js里面carList[i].batStyle="color:red";success:function(res){constcarList=res.data.list;for(
Kafka详细解析与应用分析芊言芊语 kafka 分布式
Kafka是一个开源的分布式事件流平台（EventStreamingPlatform），由LinkedIn公司最初采用Scala语言开发，并基于ZooKeeper协调管理。如今，Kafka已经被Apache基金会纳入其项目体系，广泛应用于大数据实时处理领域。Kafka凭借其高吞吐量、持久化、分布式和可靠性的特点，成为构建实时流数据管道和流处理应用程序的重要工具。Kafka架构Kafka的架构主要由
ajax的同源策略 Spring_Bear
问题之前帮忙做的广告机器人数据提交的部分，利用ajax的XMLHTTPRequest提交到服务器的时候总是报错，错误类型是不同源。想到浏览器中的同源策略，明白了问题的原因。同源策略简单的说，就是浏览器不允许两个不同源的域名之间交换信息，那么这里就有两个问题。一是，什么信息不允许交换；二是，怎样算不同源。阮一峰的这篇博客浏览器同源政策及其规避方法其实已经介绍得比较清楚。引用一下，第一个问题：目前，如
java的四个层级结构活跃家族 JAVA
java的四个层级结构首先，最底层的就是dto层，dto层就是所谓的model，dto中定义的是实体类，也就是.class文件，该文件中包含实体类的属性和对应属性的get、set方法；其次，是dao层（dao层的文件习惯以*Mapper命名），dao层会调用dto层，dao层中会定义实际使用到的方法，比如增删改查。一般在dao层下还会有个叫做sqlmap的包，该包下有xml文件，文件内容正是根据之
【Python爬虫】百度百科词条内容 PokiFighting 数据处理 python 爬虫开发语言
词条内容我这里随便选取了一个链接，用的是FBI的词条importurllib.requestimporturllib.parsefromlxmlimportetreedefquery(url):headers={'user-agent':'Mozilla/5.0(WindowsNT6.1;Win64;x64)AppleWebKit/537.36(KHTML,likeGecko)Chrome/80.
java 技术架构相关文档圣心 java 架构开发语言
在Java中，有许多不同的技术和架构，这里我将列举一些常见的Java技术和架构，并提供一些相关的文档资源。SpringFrameworkSpring是一个开源的Java/JavaEE全功能框架，以Apache许可证形式发布，提供了一种实现企业级应用的方法。官方文档：SpringFrameworkSpringBootSpringBoot是Spring的一个子项目，旨在简化创建生产级的Spring应用
5-【JavaWeb】JUnit 单元测试及JUL 日志系统 weixin_44329069 JavaWeb junit 单元测试
1.使用JUnit进行单元测试JUnit是Java中非常流行的单元测试框架，MyBatis与JUnit可以很好地结合，来测试持久层代码的正确性。1.1添加JUnit依赖在使用JUnit之前，需要在pom.xml中引入JUnit依赖。junitjunit4.13.2test1.2单元测试基本结构假设我们要测试UserMapper中的getUserById方法，测试代码如下：importorg.apa
Apache Shiro安全框架(2)-用户认证 heyrian Java shiro
身份认证在shiro中用户需要提供用户的principals（身份）和credentials（证明）来证明该用户属于当前系统用户。常见的认证方式即用户名/密码。在解释身份认证之前，我们先来看看shiro中的Subject和Realm,这是身份认证的两个关键的概念。Subjectsubject代表当前用户，内部主要维护当前用户信息。shiro中所有的subject都交给SecurityManager
Apache HBase基础（基本概述，物理架构，逻辑架构，数据管理，架构特点，HBase Shell） May--J--Oldhu HBase HBase shell hbase物理架构 hbase逻辑架构 hbase
NoSQL综述及ApacheHBase基础一.HBase1.HBase概述2.HBase发展历史3.HBase应用场景3.1增量数据-时间序列数据3.2信息交换-消息传递3.3内容服务-Web后端应用程序3.4HBase应用场景示例4.ApacheHBase生态圈5.HBase物理架构5.1HMaster5.2RegionServer5.3Region和Table6.HBase逻辑架构-Row7.
Flume：大规模日志收集与数据传输的利器傲雪凌霜，松柏长青后端大数据 flume 大数据
Flume：大规模日志收集与数据传输的利器在大数据时代，随着各类应用的不断增长，产生了海量的日志和数据。这些数据不仅对业务的健康监控至关重要，还可以通过深入分析，帮助企业做出更好的决策。那么，如何高效地收集、传输和存储这些海量数据，成为了一项重要的挑战。今天我们将深入探讨ApacheFlume，它是如何帮助我们应对这些挑战的。一、Flume概述ApacheFlume是一个分布式、可靠、可扩展的日志
MyBatis系统学习（一）——项目结构及其含义 OEC小胖胖 MyBatis mybatis 学习 web 后端
1.MyBatis简介MyBatis是一款优秀的持久层框架，它通过SQL映射的方式实现Java对数据库操作的映射，既保留了SQL语句的灵活性，也简化了代码的编写。在一个MyBatis项目中，核心部分主要有：配置文件（mybatis-config.xml）映射文件（Mapper.xml）实体类（Entity/POJO）接口类（Mapper接口）MyBatis会话工厂（SqlSessionFactor
spring整合hibernate最基础的方式木木ainiks hibernate spring java
1创建文件，可以创建web文件目录2导入jar包，需要导全，我就是jar没导全，后面怎么运行都不对3配置applicationContext.xml<beanid="sessionFactory"
关于旗正规则引擎下载页面需要弹窗保存到本地目录的问题何必如此 jsp 超链接文件下载窗口
生成下载页面是需要选择“录入提交页面”，生成之后默认的下载页面<a>标签超链接为：<a href="<%=root_stimage%>stimage/image.jsp?filename=<%=strfile234%>&attachname=<%=java.net.URLEncoder.encode(file234filesourc
【Spark九十八】Standalone Cluster Mode下的资源调度源代码分析 bit1129 cluster
在分析源代码之前，首先对Standalone Cluster Mode的资源调度有一个基本的认识：首先，运行一个Application需要Driver进程和一组Executor进程。在Standalone Cluster Mode下，Driver和Executor都是在Master的监护下给Worker发消息创建(Driver进程和Executor进程都需要分配内存和CPU，这就需要Maste
linux上独立安装部署spark daizj linux 安装 spark 1.4 部署
下面讲一下linux上安装spark，以 Standalone Mode 安装 1）首先安装JDK 下载JDK：jdk-7u79-linux-x64.tar.gz ，版本是1.7以上都行，解压 tar -zxvf jdk-7u79-linux-x64.tar.gz 然后配置 ~/.bashrc&nb
Java 字节码之解析一周凡杨 java 字节码 javap
一： Java 字节代码的组织形式类文件 { OxCAFEBABE ，小版本号，大版本号，常量池大小，常量池数组，访问控制标记，当前类信息，父类信息，实现的接口个数，实现的接口信息数组，域个数，域信息数组，方法个数，方法信息数组，属性个数，属性信息数组 } &nbs
java各种小工具代码 g21121 java
1.数组转换成List import java.util.Arrays; Arrays.asList(Object[] obj); 2.判断一个String型是否有值 import org.springframework.util.StringUtils; if (StringUtils.hasText(str)) 3.判断一个List是否有值 import org.spring
加快FineReport报表设计的几个心得体会老A不折腾 finereport
一、从远程服务器大批量取数进行表样设计时，最好按“列顺序”取一个“空的SQL语句”，这样可提高设计速度。否则每次设计时模板均要从远程读取数据，速度相当慢！！二、找一个富文本编辑软件（如NOTEPAD+）编辑SQL语句，这样会很好地检查语法。有时候带参数较多检查语法复杂时，结合FineReport中生成的日志，再找一个第三方数据库访问软件（如PL/SQL）进行数据检索，可以很快定位语法错误。
mysql linux启动与停止墙头上一根草
如何启动/停止/重启MySQL一、启动方式1、使用 service 启动：service mysqld start2、使用 mysqld 脚本启动：/etc/inint.d/mysqld start3、使用 safe_mysqld 启动：safe_mysqld&二、停止1、使用 service 启动：service mysqld stop2、使用 mysqld 脚本启动：/etc/inin
Spring中事务管理浅谈 aijuans spring 事务管理
Spring中事务管理浅谈 By Tony Jiang@2012-1-20 Spring中对事务的声明式管理拿一个XML举例 [html] view plain copy print ? <?xml version="1.0" encoding="UTF-8"?>&nb
php中隐形字符65279（utf-8的BOM头）问题 alxw4616
php中隐形字符65279（utf-8的BOM头）问题今天遇到一个问题. php输出JSON 前端在解析时发生问题:parsererror. 调试: 1.仔细对比字符串发现字符串拼写正确.怀疑是非打印字符的问题. 2.逐一将字符串还原为unicode编码. 发现在字符串头的位置出现了一个 65279的非打印字符.
调用对象是否需要传递对象(初学者一定要注意这个问题) 百合不是茶对象的传递与调用技巧
类和对象的简单的复习,在做项目的过程中有时候不知道怎样来调用类创建的对象,简单的几个类可以看清楚,一般在项目中创建十几个类往往就不知道怎么来看为了以后能够看清楚,现在来回顾一下类和对象的创建,对象的调用和传递(前面写过一篇) 类和对象的基础概念: JAVA中万事万物都是类类有字段(属性),方法,嵌套类和嵌套接
JDK1.5 AtomicLong实例 bijian1013 java thread java多线程 AtomicLong
JDK1.5 AtomicLong实例类 AtomicLong 可以用原子方式更新的 long 值。有关原子变量属性的描述，请参阅 java.util.concurrent.atomic 包规范。AtomicLong 可用在应用程序中（如以原子方式增加的序列号），并且不能用于替换 Long。但是，此类确实扩展了 Number，允许那些处理基于数字类的工具和实用工具进行统一访问。
自定义的RPC的Java实现 bijian1013 java rpc
网上看到纯java实现的RPC，很不错。 RPC的全名Remote Process Call，即远程过程调用。使用RPC，可以像使用本地的程序一样使用远程服务器上的程序。下面是一个简单的RPC 调用实例，从中可以看到RPC如何
【RPC框架Hessian一】Hessian RPC Hello World bit1129 Hello world
什么是Hessian The Hessian binary web service protocol makes web services usable without requiring a large framework, and without learning yet another alphabet soup of protocols. Because it is a binary p
【Spark九十五】Spark Shell操作Spark SQL bit1129 shell
在Spark Shell上，通过创建HiveContext可以直接进行Hive操作 1. 操作Hive中已存在的表 [hadoop@hadoop bin]$ ./spark-shell Spark assembly has been built with Hive, including Datanucleus jars on classpath Welcom
F5　往header加入客户端的ip ronin47
when HTTP_RESPONSE {if {[HTTP::is_redirect]}{ HTTP::header replace Location [string map {:port/ /} [HTTP::header value Location]]HTTP::header replace Lo
java-61-在数组中，数字减去它右边(注意是右边)的数字得到一个数对之差. 求所有数对之差的最大值。例如在数组{2, 4, 1, 16, 7, 5, bylijinnan java
思路来自： http://zhedahht.blog.163.com/blog/static/2541117420116135376632/ 写了个java版的 public class GreatestLeftRightDiff { /** * Q61.在数组中，数字减去它右边(注意是右边)的数字得到一个数对之差。 * 求所有数对之差的最大值。例如在数组
mongoDB 索引开窍的石头 mongoDB索引
在这一节中我们讲讲在mongo中如何创建索引得到当前查询的索引信息 db.user.find(_id:12).explain(); cursor: basicCoursor 指的是没有索引 &
[硬件和系统]迎峰度夏 comsci 系统
从这几天的气温来看，今年夏天的高温天气可能会维持在一个比较长的时间内所以，从现在开始准备渡过炎热的夏天。。。。每间房屋要有一个落地电风扇，一个空调(空调的功率和房间的面积有密切的关系) 坐的，躺的地方要有凉垫，床上要有凉席电脑的机箱
基于ThinkPHP开发的公司官网 cuiyadll 行业系统
后端基于ThinkPHP，前端基于jQuery和BootstrapCo.MZ 企业系统轻量级企业网站管理系统运行环境:PHP5.3+, MySQL5.0 系统预览系统下载：http://www.tecmz.com 预览地址：http://co.tecmz.com 各种设备自适应响应式的网站设计能够对用户产生友好度，并且对于
Transaction and redelivery in JMS (JMS的事务和失败消息重发机制) darrenzhu jms 事务承认 MQ acknowledge
JMS Message Delivery Reliability and Acknowledgement Patterns http://wso2.com/library/articles/2013/01/jms-message-delivery-reliability-acknowledgement-patterns/ Transaction and redelivery in
Centos添加硬盘完全教程 dcj3sjt126com linux centos hardware
Linux的硬盘识别: sda 表示第1块SCSI硬盘 hda 表示第1块IDE硬盘 scd0 表示第1个USB光驱一般使用“fdisk -l”命
yii2 restful web服务路由 dcj3sjt126com PHP yii2
路由随着资源和控制器类准备，您可以使用URL如 http://localhost/index.php?r=user/create访问资源，类似于你可以用正常的Web应用程序做法。在实践中，你通常要用美观的URL并采取有优势的HTTP动词。例如，请求POST /users意味着访问user/create动作。这可以很容易地通过配置urlManager应用程序组件来完成如下所示
MongoDB查询(4)——游标和分页[八] eksliang mongodb MongoDB游标 MongoDB深分页
转载请出自出处：http://eksliang.iteye.com/blog/2177567 一、游标数据库使用游标返回find的执行结果。客户端对游标的实现通常能够对最终结果进行有效控制，从shell中定义一个游标非常简单，就是将查询结果分配给一个变量（用var声明的变量就是局部变量），便创建了一个游标，如下所示： > var
Activity的四种启动模式和onNewIntent() gundumw100 android
Android中Activity启动模式详解　　在Android中每个界面都是一个Activity，切换界面操作其实是多个不同Activity之间的实例化操作。在Android中Activity的启动模式决定了Activity的启动运行方式。　　Android总Activity的启动模式分为四种： Activity启动模式设置： <acti
攻城狮送女友的CSS3生日蛋糕 ini html Web html5 css css3
在线预览：http://keleyi.com/keleyi/phtml/html5/29.htm 代码如下： <!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <title>攻城狮送女友的CSS3生日蛋糕-柯乐义<
读源码学Servlet（1）GenericServlet 源码分析 jzinfo tomcat Web servlet 网络应用网络协议
Servlet API的核心就是javax.servlet.Servlet接口，所有的Servlet 类（抽象的或者自己写的）都必须实现这个接口。在Servlet接口中定义了5个方法，其中有3个方法是由Servlet 容器在Servlet的生命周期的不同阶段来调用的特定方法。先看javax.servlet.servlet接口源码： package
JAVA进阶：VO(DTO)与PO(DAO)之间的转换 snoopy7713 java VO Hibernate po
PO即 Persistence Object　　VO即 Value Object 　VO和PO的主要区别在于：　　VO是独立的Java Object。　　PO是由Hibernate纳入其实体容器（Entity Map）的对象，它代表了与数据库中某条记录对应的Hibernate实体，PO的变化在事务提交时将反应到实际数据库中。　实际上，这个VO被用作Data Transfer
mongodb group by date 聚合查询日期统计每天数据（信息量） qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
/* 1 */ { "_id" : ObjectId("557ac1e2153c43c320393d9d"), "msgType" : "text", "sendTime" : ISODate("2015-06-12T11:26:26.000Z")
java之18天常用的类(一) Luob. Math Date System Runtime Rundom
System类 import java.util.Properties; /** * System: * out:标准输出,默认是控制台 * in:标准输入,默认是键盘 * * 描述系统的一些信息 * 获取系统的属性信息:Properties getProperties(); * * * */ public class Sy
maven wuai maven
1、安装maven：解压缩、添加M2_HOME、添加环境变量path 2、创建maven_home文件夹，创建项目mvn_ch01,在其下面建立src、pom.xml，在src下面简历main、test、main下面建立java文件夹 3、编写类，在java文件夹下面依照类的包逐层创建文件夹，将此类放入最后一级文件夹 4、进入mvn_ch01 4.1、mvn compile ,执行后会在

用Lucene实现摘要的高亮点

你可能感兴趣的:(apache,xml,swing,Lucene,全文检索)