张包峰

基于Lucene的图书全文搜索引擎

Baofeng Zhang@zju

转载请注明出处：http://blog.csdn.net/zbf8441372

背景介绍

这是一个关于图书的多侧面，多粒度的搜索引擎。仿照“读秀”(http://www.duxiu.com/)那样的搜索方式和搜索结果呈现方式，可以根据书的一些基本属性进行关键字搜索，展现的时候还附加进行了搜索结果的统计，也可以看到相关的全文信息。多侧面，多粒度的搜索和展示都是为了给用户更好的体验，方便用户的各种搜索需求和阅读需求。

这个搜索引擎是我前段时间开发的，前后台都是由我一个人开发完成的，没有采用框架或者任何现成代码。现在也只是个可以看的demo，很多地方还需要很大的改善。下面我会介绍下采用的技术，数据的说明，功能说明和设计，开发过程中遇到的难点问题以及他的不足和改进。

主要技术

前台：采用的是html + css + javascript（包括jquery库）

后台：主要采用的是JSP和Struts2（Spring还没有使用），还有Ajax（jquery来实现）

搜索：采用lucene包完成索引的建立和查询，暂时用的是很老的2.0版本

切词：切词工具是je切词器，可能比较老，切词效果一般

数据说明

元数据

数据是1万多本的工程类图书（中途分类法中N字母及以后的那些类的图书）。每本书是一个文件夹，里面的txt目录内的所有.ok文件是OCR扫描得到的每一页的书的全文内容。

meta目录下的dc.xml文件里是书的基本信息和属性（书名，作者，id，出版时间等），Catalog.xml文件里是书的每一章及每一节的标题和页码信息。

索引

现在索引的大小是1G多。meta目录里的两个xml我都解析出来存在索引里，并对需要的部分进行切词（如书名要切词，出版时间就不切词，直接存在索引里）。txt目录下的是书的全文内容，我对所有的.ok进行读取并切词建立索引，但是文本本身不存索引，为了避免索引过大。在“设计实现”部分我会再具体说明索引的设计。

功能说明

现在的搜索都是精确匹配的搜索，即切词器切的是什么词，我就只能搜到完全一样的词，没有模糊匹配之类的搜索。而且只限于中文搜索，英文没有进行切词，不能进行搜索。

书名搜索

输入关键字，得到书名中带有该关键字的图书，在中间显示，现在的搜索结果是全部展示的，也可以设置只显示前10条。其实对搜索来说是一样的，总是返回所有符合的书的，所以这样对速度没有拖累。

作者搜索

输入作者全名，得到该作者的书。这个搜索不太好用，没有实现好，因为xml里的元数据的作者就很杂乱。

内容搜索

这是基于全文的检索。和之前不同的地方在于。在本书目录的部分出现了一些文字，这些文字是本书含有这个关键字的页里的第一个页里的内容。我好像截取了从关键字开始的后200个字，所以有的书没有显示出来，是因为之后可能没有200个字了，这个地方我处理的不是很好。

左栏多了一个“相关数目列表”，点击之后可以看到这本书里含有这个关键字的每一页的全文内容。并且也是有加亮的，也只是显示了前几百个字。

目录搜索

能检索到每本书中的所有章节目录里含有该搜索关键字的目录全文信息，显示在每本书下面。

左栏统计

左侧是对分类，出版时间，作者，出版社的统计。只显示top 5。

右栏结果

右侧是百度里前五条搜索结果。（直接爬了过来）

其他

当“出版时间”的统计结果多于五条时，可以通过“展开”，“收起”动态选择查看全部或者前五条。

对于返回的记录总数和搜索时间，可以在搜索框下面看到。

其他还有分类浏览的功能，

是按照中图分类法来做的。只是这部分实现的不是很好，而且涉及到数据库，就不展示了，这里贴张图。会列出一级分类，二级分类，三级分类以及某一分类下的符合的图书。

设计实现

我尽量把设计实现介绍地简单，到位，因为过多的表述可能没有必要。

索引建立

索引的建立是边解析文件系统里的相应文件，边建立的。代码主要在index.writer的package内。Lucene建立索引方便，使用IndexWriter类并addCocument，会自动帮我建立倒排索引，并且按照他自己的方式建立一些特定文件存在我指定的索引文件夹下。

/*中文切词器可以选择别的*/

IndexWriter writer = new IndexWriter(this.indexDir, new MMAnalyzer(), true);

下面介绍索引的设计。Lucene里有documemt类，document类里可以add很多field。可以把Document理解为数据库的table，field是每个table的一行行属性。在搜索的时候，是按照某个field的名字去搜索他的value，并且返回所有含有这样的field的document的。所以我在建索引的时候，一本书当作一个document，书的作者，名字，等等信息都是这个document里的field，我可以在field里具体设置name, value, store_or_not,index_or_not。具体如下：

这是对“书”这个document建立的field。如对“title”，即书名这个field，我进行了切词，并且存储了内容，但是对“date”，即出版日期这个field，我没有进行切词，原因是用户不需要对时间进行搜索，只需要把这个属性完整保留下来，存进索引就可以。而且这些属性的内容都不多，全部存进索引有利于我在搜索的时候，直接通过document得到所有field的全文内容，被前台获取并展现。

对于目录，我建立了另外的document。每一本书的每一章的每一节，我都建立一个document，document里包含了书的id和page的id，以及目录catalog的全文内容，只有目录全文是要切词的，其他的只要直接存内容。目的是通过目录内容得到相应的书，然后再次搜索bookid得到书的其他属性。因为我不知道一本书有多少目录，就不知道我该设置多少的field，所以采取这样的方式，可以当作bookID这个field相当于是两个document的外键。

对于全文，也是和目录一样，单独给每一本书的每一页书建立一个document，理由也是因为我不知道每本书有多少页，所以不能一起建立在书的document内，需要用bookid来关联起来。和目录有区别的是，由于全文内容比较多，所以我只选择建立索引，不存储全文内容。这样的后果就是，我可以搜索得到哪本书，哪一页有这个词，但是我不能从索引文件里得到这页书里的所有文本内容，所以我记录下okfilename，去我的文件系统里读取这个.ok文件，而不是把全文存在索引里，把索引变得很大。

搜索

搜索主要通过Term类和Query类组成查询请求，用IndexSearcher类去搜索，最后得到Hits类，里面包含了所有含有关键字的document，让我可以一一遍历和取值（从索引中取）。

IndexSearcher is = new IndexSearcher(this.path);

    Term t = new Term(searchType, searchKey);

    Query q = new TermQuery(t);

    Hits hits = is.search(q);  

    if (hits.length() == 0) {

       System.out.println("nobook~~~~~~~~~~~~~~");

    } else {

       for (int i = 0; i < hits.length(); i ++) {
           Documentdoc = hits.doc(i);
           //…
        }

    }

针对不同类型的搜索，我在index.search package下的getBook.java内，设计了searchWithoutContent(String,String)，searchWithContent(String)和searchCatalog (String)三个类，分别对应非全文内容的搜索（如作者，标题，主题词的搜索），全文内容的搜索和目录的搜索。这三种搜索其实分别对应了我之前的索引的建立里三种document（书，page内容和目录内容）。区别在于，像searchWithoutContent和searchCatalog两个函数其实都需要通过得到的document里的bookid再用searchWithoutContent去搜索得到这本book的别的信息，进行了二次搜索（保证这点的可实现性在于我上面的索引设计，这么设计的原因是我不知道一本书有多少目录和书页，所以不能包含在一个document里解决所有问题，需要用bookid充当关联）。

这样对于Struts的action，只要new getBook这个类，调用相应的搜索函数就可以满足前台的搜索请求。

结果展现

由于在搜索结果的中间栏显示的是书的基本信息，所以以上的三个关键搜索函数返回都是ArrayList。BookAttributes是每本书的实例类（在book.entity的package内），里面包含了书的基本信息和getter，setter函数。返回所有满足条件（包含搜索关键字的field的document）书的list，让前台获取searchAciton的结果集里的

publicListbooklist =new ArrayList();

通过struts的遍历展现在页面上。

关键代码如下:

<%

    int i = 0;

    pageContext.setAttribute("ba",request.getAttribute("booklist"));

    List ba = new ArrayList(); 

%>




 
     
    
  


     
     

        
          
              
                    ${BookAttributes.title}
              
              
             
          
     
作者:${BookAttributes.creator}  


分类:${BookAttributes.CRC}  


ISBN:${BookAttributes.ISBN}  


出版日期:${BookAttributes.date}  


本书目录：


${BookAttributes.content}



主题词:${BookAttributes.subject}  
 
 分类: 

<%

    // 通过循环变量i和request，从action读取list，用java处理成正确的url。struts标签没办法做双重循环，也取不了list内的类的某个变量

   //…

 %>

>${BookAttributes.firstCat}->>${BookAttributes.secondCat}->
>${BookAttributes.thirdCat}

左侧统计

左侧是对搜索得到的书的分类，作者，出版日期等的统计，采用Ajax的异步调用方式，给addupAction来完成。实质上是对搜索关键字再进行一次搜索，而没有通过request传参的方式把searchAction里的booklist直接传给addupAction，因为lucene做一次搜索还是很快的。我是通过

$(document).ready(function(){

   $("#booksearch").click(show());

}

的方式触发Ajax的统计Action的。$("#booksearch")对应的就是页面上“中文搜索”这个submit的button。而show()这个js函数中，通过Jquery包装过了的Ajax

$.getJSON(url, function(data,stat){}, “json”);

获取前台表单里的参数值传给action，

sk = $("#searchkey").val();
type = $("#js2").val();
url= "ShowAddup?sk=" + sk + "&type=" + type;

并在回调函数中通过js变量得到action里的参数通过DOM模型改变特定id标签的内容在页面上显示。这部分代码都写在了search.jsp内。

统计结果是通过tool package内的处理类处理之后返回一个字符串的list在页面上遍历输出实现的。

而对于当统计结果多于五条时的“展开”“收起”功能是通过jquery来实现的，展开的时候将全部list都遍历，收起的时候只显示前五条遍历结果。

// 显示更多
    $("#more").click(function(){
        for (var i = yearlist.length-listnum-1; i >= 0; i --)
        {
             $("#yearadd").append("" + yearlist[i] + "" );
        }
       $("#yearadd").show();
    });

 // 再隐藏
    $("#hide").click(function(){
        $("#yearadd").hide("slow");
});

右侧结果

右侧的结果是将搜索框内的输入放到百度内搜索，抓取了前五条百度的原搜索内容进行呈现的。和左侧的实现方式是一样，也是用了Ajax异步的方式，对应的是baiduAction。两个返回类型是json的action在struts.xml里配置的时候如下：

百度搜索的抓取在url.fetch的package下的GetBaidu.java类内，用URL类构建url，获取百度搜索结果的html内容，对in.readLine()的内容进行判断，得到前五条符合要求的搜索结果。

this.source= "http://www.baidu.com/s?tn=monline_5_dg&f=8&rsv_bp=1&rsv_spt=3&wd=" + this.strKey;
URL url = new URL(this.source);
BufferedReader in = new
BufferedReader(new InputStreamReader(url.openStream()));
// …

全文内容

在搜索“内容”的时候，在得到的结果中，可以点击左侧的书的标题，展示书中含有搜索关键字的每一页的全文内容。这也是用ajax异步实现，对应的是allpagesAction。每次

先通过document.getElementById("pagecontent").innerHTML=" ";清空内容，再添加内容$("#pagecontent").append(…);。

具体的搜索类是index.search包下的BookContentSearch类。是去文件系统中读取特定.ok文件的内容。

 
if (doc.getField("bookid").stringValue().equals(bookid)) {
       okfilename = doc.getField("okfilename").stringValue();
       String tmp = loadFileToString(new File("E:\\06_1000" + "\\" +
                     bookid + "\\txt\\txt\\" + okfilename));

       contentsmap.put(okfilename, tmp);
    }

加亮处理

通过yit(document.body, k);这个加亮js函数，在需要的地方调用这个函数，k是传入的需要加亮的关键字。我在异步返回的各个回调函数中都会使用这个加亮函数。下面是第一次页面展现的时候也使用了加亮。

 window.onload = function(){
      var k=document.getElementById("searchkey").value;
      yit(document.body, k);
}

技术难点

这里简单说明下我在开发过程中遇到的和解决的主要技术关键点。

主要的难点还是在struts的灵活运用上，因为这也是我第一次使用struts，边学边用。我自己也在博客的一篇文章里（http://blog.csdn.net/zbf8441372/article/details/7602329）总结了开发经验。主要是Java对象, Js对象, Action内的对象在同一个jsp页面内到底能怎样互通的问题。

Ø struts的标签，和jsp页面内js代码，java代码的结合和灵活使用

我现在理解，struts的标签的实现，实质上应该也是servlet中request的setter函数（action里配置）读取到jsp上来的，但是struts标签无法赋给js变量，无法赋给<% %>内的java变量，只能这样赋：

他永远只是个setter方法，当你的值是一个对象，比如一个List时，你这样赋的结果，就是一个list.toString()的值，对象的属性不能获取，对象在标签下就死掉了。所以当我需要在递归下，同时遍历两个action的list时，我通过

pageContext.setAttribute("ba",request.getAttribute("booklist"));

将某个其中一个list额外先取到pageContext内，然后同时在外部初始一个计数器，在内我的计数器也是一次次增加，可以实现两个list的同时遍历。

Ø jquery的一些使用

Jquery的ajax方法有四个：

$.get( url [, data] [, callback] )

$.post(url,[data],[callback],[type])

$.getJSON(url,[data],[callback])

$.ajax(options)

使用ajax，通过json形式包装的时候，struts的action在配置文件中的配置需要改变，包括两个地方，extends="json-default"，<resulttype="json">result>

灵活使用jquery，对DOM模型进行操作，对标签内容进行添改删藏，并可以设置简单的动画。这些也都是边学边用。

Ø 索引的设计

建立索引和搜索索引并不困难，lucene都进行了很好的封装。但是索引的设计需要考虑。如前面所说的，我的设计是基于全文，目录和普通搜索三块内容，设计了三种ducoment。在搜索的时候会出现三种document之间的互相关联，二次搜索，form表单的同步执行和异步返回，让每种类型的搜索分别对应一个action，不同的action以同步或者异步的形式返回在前台页面上，避免在呈现中间栏结果的时候，由于统计结果和百度搜索而延长了搜索时间。

缺点不足

代码

后台代码还是比较乱的，package的层次也分得不清晰，没有进行过重构和优化。

搜索性能

索引由于超过了一个G，搜索结果变慢很多。无论从lucene版本，代码重构方面还是索引设计方面都需要改进以减少搜索时间，提高用户体验。

界面

搜索结果的展现还需要改进，有些地方不太舒服，用户体验可能会不好。界面也没有进行过美工，最多达到了层次清晰，结构简洁。左右侧异步请求，明显延迟的时候没有一个load之类的提醒用户等待。

总结和未来工作

代码

提高lucene版本（新的版本性能方面会有不同），重构代码，合理使用ajax和struts，提高速度。

功能

分页功能还没有完成。有些统计数据的链接还没有完成。分类浏览还需要完善。

索引

1. 将索引分开建立，减小每份索引大小。图书原信息存一份索引，图书全文的索引存在另一份，图书目录的索引也存在另一份。这样将原本的一整个索引分需求和搜索类型的不同分开建立，减小索引大小，提高搜索速度。

2. 分布式索引。以后打算建立分布式索引，一个query转发多台服务器，多台机器搜索结果进行合并。还可以结合Hadoop的HDFS文件系统，HBase或者别的NoSQL把图书的全文txt内容合理存储，提高数据的读取速度。

3. IndexSearcher池。虽然lucene的IndexSearcher，IndexWriter，IndexReader这些类都是线程安全的，但是open,close的过程中还是造成了比较大的开销。所以除了数据库需要DBpool之外，这些lucene的关键类也需要池来维护，减少不必要开销。

4. 其他很多关于搜索引擎的性能优化和代码，运行环境参数调优。我打算将这个搜索引擎不断完善和深入，其实现在处于打通了一些技术问题，真正的性能还没有开始着手，只是畅想以后要做的是一个分布式的搜索。

你可能感兴趣的:(Lucene,Struts2,搜索引擎,lucene,struts,action,iterator,jquery)

Day17笔记-高阶函数 ~在杰难逃~ Python 笔记 python 开发语言 pycharm 数据分析
高阶函数【重点掌握】函数的本质：函数是一个变量，函数名是一个变量名，一个函数可以作为另一个函数的参数或返回值使用如果A函数作为B函数的参数，B函数调用完成之后，会得到一个结果，则B函数被称为高阶函数常用的高阶函数：map(),reduce(),filter(),sorted()1.map()map(func,iterable)，返回值是一个iterator【容器，迭代器】func:函数iterab
Java：爬虫框架 dingcho Java java 爬虫
一、ApacheNutch2【参考地址】Nutch是一个开源Java实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。包括全文搜索和Web爬虫。Nutch致力于让每个人能很容易,同时花费很少就可以配置世界一流的Web搜索引擎.为了完成这一宏伟的目标,Nutch必须能够做到:每个月取几十亿网页为这些网页维护一个索引对索引文件进行每秒上千次的搜索提供高质量的搜索结果简单来说Nutch支持分
Python实现TIFF 文件转换为 PNG 和 JPG 格式 sand&wich python 开发语言
在日常的图像处理工作中，可能会遇到需要将TIFF格式的图像转换为其他格式的情况，例如PNG和JPG。下面，本文将介绍如何使用Python和GDAL库实现这一功能。准备工作在开始之前，请确保已经安装了必要的库：GDAL（GeospatialDataAbstractionLibrary）可以使用以下命令安装GDAL：pipinstallgdal代码实现以下是一个将TIFF文件转换为PNG文件的示例代码
ChatGPT 高效学习套路揭秘：让知识获取事半功倍的秘诀 kkai人工智能 chatgpt 人工智能学习媒体 ai
最近这段时间，AI热潮因ChatGPT的火爆再次掀起。如今，网上大部分内容都在调侃AI，但很少有人探讨如何正经使用ChatGPT做事情。作为一名靠搜索引擎和GitHub自学编程的开发者，第一次和ChatGPT深度交流后，我就确信：ChatGPT能够极大提高程序员学习新技术的效率。使用ChatGPT一个月后，我越发感受到它的颠覆性。因此，我想从工作和学习的角度，分享它的优势及我的一些使用技巧，而非娱
Python 推导式(Comprehensions) 戒灵
1,列表推导式num=[1,2,-5,10,-7,5,7,-1]filtered_and_squared=[x**2forxinnumifx>0]print(filtered_and_squared)迭代器(iterator)遍历输入序列num的每个成员x断言式判断每个成员是否大于零如果成员大于零，则被交给输出表达式，平方之后成为输出列表的成员。列表推导式被封装在一个列表中，所以很明显它能够立即生
ElasticSearch查询超过10000条（1000页）时出现Result window is too large的问题王月亮17
问题当ES数据量较大，使用分页查询超过10000条（1000页）时，出现如下错误：Cannotexecutejestaction,responsecode:500,error:{"root_cause":[{"type":"query_phase_execution_exception","reason":"Resultwindowistoolarge,from+sizemustbelesstha
PCIe进阶之TL：Memory, I/O, and Configuration Request Rules & TPH Rules 芯芯之火，可以燎原 PCIe进阶 PCIe进阶硬件工程信息与通信
1Memory,I/O,andConfigurationRequestRules下述规则适用于Memory请求、IO请求和配置请求。除了公共的header字段外，所有Memory请求、IO请求和配置请求还包括以下字段：（1）RequesterID[15:0]和Tag[9:0]，组成了TransactionID。（2）LastDWBE[3:0]和1stDWBE[3:0]字段。对于TH字段置1的Mem
python中的迭代器有什么用 hakesashou python基础知识 python 开发语言
什么是Python迭代器？迭代器（Iterator）：迭代器可以看作是一个特殊的对象，每次调用该对象时会返回自身的下一个元素，从实现上来看，一个迭代器对象必须是定义了__iter__()方法和next()方法的对象。1、Python的Iterator对象表示的是一个数据流，可以把这个数据流看做是一个有序序列，但我们却不能提前知道序列的长度，所以Iterator的计算是惰性的，只有在需要返回下一个数
网站推广爬虫 Bearjumpingcandy 爬虫
网站推广爬虫是一种用于升网站曝光度和推广效果的工具。它通过自动化地访问和收集网站信息，从而实现对目标网站的广告、关键词、排名等数据进行分析和优化。以下是网站推广爬虫的一些介绍：数据收集：网站推广爬虫可以自动访问目标网站，并收集相关的数据，如网站流量、关键词排名、竞争对手信息等。这些数据可以帮助网站推广人员了解网站的现状和竞争环境，从而制定相应的推广策略。关键词优化：通过分析搜索引擎的关键词排名情况
2019-03-31 梨筱草
图片发自AppIfyouwanttochangesomething,startwithbabysteps.Takeasmallaction-anyaction-andgrowfromthere.如果你想要做出改变，就从第一步开始。做出一点小的行动，任何一种行动都行，然后就从这里开始。Ifyouwanttochangesomething,startwithbabysteps.Takeasmallac
C# 开发教程-入门基础天马3798 教程系列整理 c#开发语言
1.C#简介、环境，程序结构2.C#基本语法，变量，控制局域，数据类型，类型转换3.C#数组、循环，Linq4.C#类，封装，方法5.C#枚举、字符串6.C#面相对象，继承，封装，多态7.C#特性、属性、反射、索引器8.C#委托，事件，集合，泛型9.C#匿名方法10.C#多线程更多：JQuery开发教程入门基础Vue开发基础入门教程Vue开发高级学习教程
复盘赵建庄
行动后反思，AAR（AfterActionReview），是知识管理的一种工具，起源于美国陆军的作战方法，强调在每次行动后进行及时反思、总结和改进。《复盘》一书其实就是这种方法的具体应用，名字不同，然而实质相同。相比AAR这样的说法，复盘更简洁，容易被国人接受，而且，书中给出了非常详细的步骤，有较强的指导意义和实战性，AAR的六步法，说的比较简单，有人可以悟，结合实际业务演变出各种变化，大多数人可
Three.js AnimationUtils 和 AnimationObjectGroup 灵魂清零 three 前端 web3 javascript
AnimationObjectGroup接收共享动画状态的一组对象。在使用手册的“下一步”章节中，“动画系统”一文对three.js动画系统中的不同元素作出了概述用法:将本来要作为根对象传入构造器或者动画混合器(AnimationMixer)的clipAction方法中的对象加入组中，并将这个组对象作为根对象传递。注意，这个类的实例作为混合器中的一个对象，因此，必须对组内的单个对象做缓存控制。限制
SpringBoot整合ES搜索引擎实现网站热搜词及热度计算码踏云端 springboot Elasticsearch spring boot elasticsearch 后端热搜词热度计算 java
博主简介：历代文学网（PC端可以访问：https://literature.sinhy.com/#/literature?__c=1000，移动端可微信小程序搜索“历代文学”）总架构师，15年工作经验，精通Java编程，高并发设计，Springboot和微服务，熟悉Linux，ESXI虚拟化以及云原生Docker和K8s，热衷于探索科技的边界，并将理论知识转化为实际应用。保持对新技术的好奇心，乐于
PCIe进阶之TL：Common Packet Header Fields & TLPs with Data Payloads Rules 芯芯之火，可以燎原 PCIe进阶 PCIe进阶硬件工程信息与通信
1TransactionLayerProtocol-PacketDefinitionTLP有四种事务类型：Memory、I/O、Configuration和Messages，两种地址格式：32bit和64bit。构成TLP时，所有标记为Reserved的字段（有时缩写为R）都必须全为0。接收者Rx必须忽略此字段中的值，PCIeSwitch必须对其进行原封不动的转发。请注意，对于某些字段，既有指定值
系统设计DDIA之Chapter 7 Transactions 之防止丢失更新暴躁老哥在线刷题 SystemDesign 数据库系统设计大数据系统架构 DDIA
防止丢失更新涉及处理多个事务并发写入时发生的各种冲突类型。虽然“读已提交”和“快照隔离”等隔离级别管理与读取相关的冲突，但防止丢失更新需要额外的措施来处理写写冲突。丢失更新问题：当两个事务同时读取一个值，对其进行修改，然后将修改后的值写回时，会发生这种问题。一个修改可能会覆盖或“破坏”另一个修改，导致更新丢失。例子包括递增计数器、更新复杂文档，或多个用户同时编辑相同内容。防止丢失更新的解决方案：原
大数据真实面试题---SQL The博宇大数据面试题——SQL 大数据 mysql sql 数据库 big data
视频号数据分析组外包招聘笔试题时间限时45分钟完成。题目根据3张表表结构，写出具体求解的SQL代码（搞笑品类定义：视频分类或者视频创建者分类为“搞笑”）1、表创建语句：createtablet_user_video_action_d(dsint,user_idstring,video_idstring,action_typeint,`timestamp`bigint)rowformatdelimi
SAP B1 无对象表或者没有含自动增量的对象，如何通过SBO_SP控制哲讯智能科技运维科技 erp
SAPB1中无对象或者没有含自动增量的对象表，在SBO_SP_TransactionNotification中object_type规则：-3+Tab键+@表名例如：创建无对象表IPS_OITM，则object_type值为：[-3@IPS_OITM]特别注意：如果用的是没有含自动增量的对象表，必须要在Name字段中输入值才会触发SBO控制的存储过程相关产品1.SAPBusinessOne是一套投
html 删除事件,html 事件的添加和删除列蒂齐亚 html 删除事件
jQuery在jQuery1.7版本中bind()unbind(),live()die(),on()off(),delegate()下面我们给li元素添加事件bind()旧版写法:事件不能适用脚本创建的新元素live()旧版写法:适用脚本创建的新元素写法，但性能极不好on()新版写法，事件不能适用脚本创建的新元素(接收多个函数绑定)这三种方法都是基于要给添加事件的元素本身。$("ulli").bi
Java的迭代器接口 shymoy java 开发语言
文章目录是什么iterator内部方法iterabe内部方法如何实现是什么iteratorIterator是java中用于遍历集合中元素的一个接口，提供了一种通用方法来遍历集合中的元素。内部方法booleanhasNext()：检查是否还有下一个元素。如果有，返回true，否则返回false。Tnext()：返回集合中的下一个元素。voidremove()：从集合中移除最后一次调用next()返回
SIP ACK method modem协议笔记 IMS 5G 网络智能手机
SIPACK同样在RFC3261中定义。ACK仅仅用于对INVITErequest的response的回复，例如在通话结束时，MO要断开连接，此时就会生成一条BYE消息。BYE不会经过代理，而是直接路由到MT。MT通过200(OK)响应确认收到BYE，然后就会终止该session和BYEtransaction，此时就不会有ACK发送。在构造的ACKrequest时，ACK必须包含Call-ID、F
动态生成的html元素绑定click事件 .NET跨平台 Jquery及其组件 html jquery
第一篇博客，开启技术博客的生涯，欢迎大家批评指教（坚信妹子也可以做好程序猿）今天想说帮公司做项目的时候遇到的一个小问题，动态添加html元素以后再去事件监听出问题。在实际开发中会遇到要给动态生成的html元素绑定触发事件的情况。就是上面的一张表格要动态实现添加行，然后序列号还要随着增加，当删除的时候序列号依旧是按顺序排列。刚开始使用jQuery的on方法来解决，但是发现一个问题会出现事件绑定很多次
渗透测试的了解锅盖'awa' 网络安全小白之路安全性测试安全
文章目录概述一、渗透测试分类1.黑盒测试／外部测试2.白盒测试／内部测试3.灰盒测试／组合测试二、渗透测试-目标分类1、主机操作系统渗透2、数据库系统渗透3、应用系统渗透4、网络设备渗透三、渗透测试过程（七个阶段）1.前期交互阶段（Pre-EngagementInteraction）2.情报搜集阶段（InformationGathering）3.威胁建模阶段（ThreatModeling）4.漏洞
【网络安全】漏洞挖掘：php代码审计秋说网络安全 php web安全漏洞挖掘
未经许可，不得转载。文章目录正文正文在应用程序中，通过一个JavaScript注释发现了一个备份ZIP文件。解压后，获取了应用程序的代码，其中包含如下代码片段：代码首先检查变量$action是否等于'convert'，如果是，则继续执行。随后对传入的变量$data使用trim()函数去除两端空白字符，并使用eval()函数执行$data的内容。显然，代码对$data没有进行任何过滤或验证，因此可以
2019.1.6 root_restart
1.新版研学行程公众号推送及页面改动，以后继续尝试无logo版行程单方便转发，附带一篇研学政策解读2.百家号，头条号，搜狐号注册认证及审核，后续每天会在上面更新以往研学活动，增加搜索引擎中山大研学和雨滴教育的关联3.与鹿老师探讨研究方便代理的新宣传模式
rsync exited with code 255.Load key “...“: invalid format Permission denied, please try again. 沧州刺史后端服务器运维 github actions linux ssh
在配置githubactions自动部署前端项目到服务器上时，登录服务器使用的是秘钥登录。出现报错：[general]GITHUB_WORKSPACE:/home/runner/work/clogin-frontend/clogin-frontend[SSH]Creating/home/runner/.sshdirin/home/runner/work/clogin-frontend/clogin
前端页面实现table可拖动改变列宽牧码人 js jQuery js 表格拖动 css colResizable
此处实现页面的table表格可以自由拖动列宽，拖动时表格内文字不换行，超出部分以...代替，实现步骤如下：1.首先引入jQuery和colResizable的js文件，colResizable支持表格拖动改变列宽，但基于jQuery，（1）colResizable可以去：http://www.bacubacu.com/colresizable/#rangeSlider下载（2）引入文件：2.编写j
只有一个诚字最重要（3.22）胡同学的读书笔记
1人们会认为谷歌是搜索引擎。而事实上，谷歌是第一个以机器为主导的搜索引擎，这个分类在谷歌之前是不存在的，而你必须要认识到谷歌的这个秘密才能判断它与其他公司的不同之处。2如果我目前在一个公司，当大家不知道未来的路怎么走，过去的路也已经彻底放弃了，我会先把事实摆在所有人面前，然后让大家讨论，在争论的过程中产生一个纲领性的共识，让每个部门在大的纲领下去寻求一种变化，不再以增长和竞争为纲，而是转移到产品和
FloatActionButton 使用 yuzhiyi_宇
FloatActionButton(简称FAB)是负责显示界面基本操作的圆形按钮，其提供的最好是高频率的操作。使用FloatActionButton继承自ImageView，具备ImageView的全部属性。xml布局代码属性作用android:srcFAB中显示的图标app:layout_anchor设置FAB的锚点，即以该控件为参考app:layout_anchorGravityFAB相对锚点
写出渗透测试信息收集详细流程卿酌南烛_b805
一、扫描域名漏洞：域名漏洞扫描工具有AWVS、APPSCAN、Netspark、WebInspect、Nmap、Nessus、天镜、明鉴、WVSS、RSAS等。二、子域名探测：1、dns域传送漏洞2、搜索引擎查找（通过Google、bing、搜索c段）3、通过ssl证书查询网站：https://myssl.com/ssl.html和https://www.chinassl.net/ssltools
对于规范和实现，你会混淆吗？ yangshangchuan HotSpot
昨晚和朋友聊天，喝了点咖啡，由于我经常喝茶，很长时间没喝咖啡了，所以失眠了，于是起床读JVM规范，读完后在朋友圈发了一条信息： JVM Run-Time Data Areas：The Java Virtual Machine defines various run-time data areas that are used during execution of a program. So
android 网络百合不是茶网络
android的网络编程和java的一样没什么好分析的都是一些死的照着写就可以了,所以记录下来方便查找 , 服务器使用的是TomCat 服务器代码; servlet的使用需要在xml中注册 package servlet; import java.io.IOException; import java.util.Arr
[读书笔记]读法拉第传 comsci 读书笔记
1831年的时候,一年可以赚到1000英镑的人..应该很少的... 要成为一个科学家,没有足够的资金支持,很多实验都无法完成但是当钱赚够了以后....就不能够一直在商业和市场中徘徊......
随机数的产生沐刃青蛟随机数
c++中阐述随机数的方法有两种：一是产生假随机数（不管操作多少次，所产生的数都不会改变）这类随机数是使用了默认的种子值产生的，所以每次都是一样的。 //默认种子 for (int i = 0; i < 5; i++) { cout<<
PHP检测函数所在的文件名 IT独行者 PHP 函数
很简单的功能，用到PHP中的反射机制，具体使用的是ReflectionFunction类，可以获取指定函数所在PHP脚本中的具体位置。创建引用脚本。代码： [php] view plain copy // Filename: functions.php <?php&nbs
银行各系统功能简介文强chu 金融
银行各系统功能简介　业务系统核心业务系统业务功能包括：总账管理、卡系统管理、客户信息管理、额度控管、存款、贷款、资金业务、国际结算、支付结算、对外接口等清分清算系统以清算日期为准，将账务类交易、非账务类交易的手续费、代理费、网络服务费等相关费用，按费用类型计算应收、应付金额，经过清算人员确认后上送核心系统完成结算的过程国际结算系
Python学习1(pip django 安装以及第一个project) 小桔子 python django pip
最近开始学习python,要安装个pip的工具。听说这个工具很强大，安装了它，在安装第三方工具的话so easy!然后也下载了，按照别人给的教程开始安装，奶奶的怎么也安装不上！第一步：官方下载pip-1.5.6.tar.gz, https://pypi.python.org/pypi/pip easy! 第二部：解压这个压缩文件，会看到一个setup.p
php 数组 aichenglong PHP 排序数组循环多维数组
1 php中的创建数组 $product = array('tires','oil','spark');//array()实际上是语言结构而不是函数 2 如果需要创建一个升序的排列的数字保存在一个数组中，可以使用range()函数来自动创建数组 $numbers=range(1,10)//1 2 3 4 5 6 7 8 9 10 $numbers=range(1,10,
安装python2.7 AILIKES python
安装python2.7 1、下载可从 http://www.python.org/进行下载#wget https://www.python.org/ftp/python/2.7.10/Python-2.7.10.tgz 2、复制解压 #mkdir -p /opt/usr/python #cp /opt/soft/Python-2
java异常的处理探讨百合不是茶 JAVA异常
//java异常 /* 1，了解java 中的异常处理机制，有三种操作 a,声明异常 b,抛出异常 c,捕获异常 2，学会使用try-catch-finally来处理异常 3，学会如何声明异常和抛出异常 4，学会创建自己的异常 */ //2，学会使用try-catch-finally来处理异常
getElementsByName实例 bijian1013 element
实例1： <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/x
探索JUnit4扩展：Runner bijian1013 java 单元测试 JUnit
参加敏捷培训时，教练提到Junit4的Runner和Rule，于是特上网查一下，发现很多都讲的太理论，或者是举的例子实在是太牵强。多搜索了几下，搜索到两篇我觉得写的非常好的文章。文章地址：http://www.blogjava.net/jiangshachina/archive/20
[MongoDB学习笔记二]MongoDB副本集 bit1129 mongodb
1. 副本集的特性 1)一台主服务器(Primary),多台从服务器(Secondary) 2)Primary挂了之后，从服务器自动完成从它们之中选举一台服务器作为主服务器，继续工作，这就解决了单点故障，因此，在这种情况下，MongoDB集群能够继续工作 3)挂了的主服务器恢复到集群中只能以Secondary服务器的角色加入进来 2
【Spark八十一】Hive in the spark assembly bit1129 assembly
Spark SQL supports most commonly used features of HiveQL. However, different HiveQL statements are executed in different manners: 1. DDL statements (e.g. CREATE TABLE, DROP TABLE, etc.)
Nginx问题定位之监控进程异常退出 ronin47
nginx在运行过程中是否稳定，是否有异常退出过？这里总结几项平时会用到的小技巧。 1. 在error.log中查看是否有signal项，如果有，看看signal是多少。比如，这是一个异常退出的情况： $grep signal error.log 2012/12/24 16:39:56 [alert] 13661#0: worker process 13666 exited on s
No grammar constraints (DTD or XML schema).....两种解决方法 byalias xml
方法一：常用方法关闭XML验证工具栏：windows => preferences => xml => xml files => validation => Indicate when no grammar is specified:选择Ignore即可。方法二：（个人推荐）添加内容如下 <?xml version=
Netty源码学习-DefaultChannelPipeline bylijinnan netty
package com.ljn.channel; /** * ChannelPipeline采用的是Intercepting Filter 模式 * 但由于用到两个双向链表和内部类，这个模式看起来不是那么明显，需要仔细查看调用过程才发现 * * 下面对ChannelPipeline作一个模拟，只模拟关键代码： */ public class Pipeline {
MYSQL数据库常用备份及恢复语句 chicony mysql
备份MySQL数据库的命令，可以加选不同的参数选项来实现不同格式的要求。 mysqldump -h主机 -u用户名 -p密码数据库名 > 文件备份MySQL数据库为带删除表的格式，能够让该备份覆盖已有数据库而不需要手动删除原有数据库。 mysqldump -–add-drop-table -uusername -ppassword databasename > ba
小白谈谈云计算--基于Google三大论文 CrazyMizzz Google 云计算 GFS
之前在没有接触到云计算之前，只是对云计算有一点点模糊的概念，觉得这是一个很高大上的东西，似乎离我们大一的还很远。后来有机会上了一节云计算的普及课程吧，并且在之前的一周里拜读了谷歌三大论文。不敢说理解，至少囫囵吞枣啃下了一大堆看不明白的理论。现在就简单聊聊我对于云计算的了解。我先说说GFS &n
hadoop 平衡空间设置方法 daizj hadoop balancer
在hdfs-site.xml中增加设置balance的带宽，默认只有1M： <property> <name>dfs.balance.bandwidthPerSec</name> <value>10485760</value> <description&g
Eclipse程序员要掌握的常用快捷键 dcj3sjt126com 编程
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可以那么勤奋，每天都孜孜不倦得
Android学习之路 dcj3sjt126com Android学习
转自：http://blog.csdn.net/ryantang03/article/details/6901459 以前有J2EE基础，接触JAVA也有两三年的时间了，上手Android并不困难，思维上稍微转变一下就可以很快适应。以前做的都是WEB项目，现今体验移动终端项目，让我越来越觉得移动互联网应用是未来的主宰。下面说说我学习Android的感受，我学Android首先是看MARS的视
java 遍历Map的四种方法 eksliang java HashMap java 遍历Map的四种方法
转载请出自出处： http://eksliang.iteye.com/blog/2059996 package com.ickes; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Map.Entry; /** * 遍历Map的四种方式
【精典】数据库相关相关 gengzg 数据库
package C3P0; import java.sql.Connection; import java.sql.SQLException; import java.beans.PropertyVetoException; import com.mchange.v2.c3p0.ComboPooledDataSource; public class DBPool{
自动补全 huyana_town 自动补全
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"><html xmlns="http://www.w3.org/1999/xhtml&quo
jquery在线预览PDF文件，打开PDF文件天梯梦 jquery
最主要的是使用到了一个jquery的插件jquery.media.js，使用这个插件就很容易实现了。核心代码 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.
ViewPager刷新单个页面的方法 lovelease android viewpager tag 刷新
使用ViewPager做滑动切换图片的效果时，如果图片是从网络下载的，那么再子线程中下载完图片时我们会使用handler通知UI线程，然后UI线程就可以调用mViewPager.getAdapter().notifyDataSetChanged()进行页面的刷新，但是viewpager不同于listview，你会发现单纯的调用notifyDataSetChanged()并不能刷新页面
利用按位取反（~）从复合枚举值里清除枚举值草料场 enum
以 C# 中的 System.Drawing.FontStyle 为例。如果需要同时有多种效果，如：“粗体”和“下划线”的效果，可以用按位或（|） FontStyle style = FontStyle.Bold | FontStyle.Underline; 如果需要去除 style 里的某一种效果，
Linux系统新手学习的11点建议刘星宇编程工作 linux 脚本
　　随着Linux应用的扩展许多朋友开始接触Linux，根据学习Windwos的经验往往有一些茫然的感觉：不知从何处开始学起。这里介绍学习Linux的一些建议。　　一、从基础开始：常常有些朋友在Linux论坛问一些问题，不过，其中大多数的问题都是很基础的。例如：为什么我使用一个命令的时候，系统告诉我找不到该目录，我要如何限制使用者的权限等问题，这些问题其实都不是很难的，只要了解了 Linu
hibernate dao层应用之HibernateDaoSupport二次封装 wangzhezichuan DAO Hibernate
/** * 方法描述:sql语句查询返回List<Class> * 方法备注: Class 只能是自定义类 * @param calzz * @param sql * @return * 创建人：王川 * 创建时间：Jul