- PostgreSQL | 生成UUID 报错:HINT: No function matches the given name and argument types
慌途L
PostgreSQLpostgresqluuiduuid_generategen_random_uuid
在PG数据库上新建表结构:CREATETABLE"public"."t_test"("guid"uuidNOTNULLDEFAULTuuid_generate_v4(),"data"jsonb,"create_time"timestamptz(6)DEFAULTnow(),CONSTRAINT"test_pkey"PRIMARYKEY("guid"));报错:ERROR:functionuuid_
- LeetCode_sql_day18(1841.联赛信息统计)
Darling_00
sqlleetcodesql算法
描述表:Teams+----------------+---------+|ColumnName|Type|+----------------+---------+|team_id|int||team_name|varchar|+----------------+---------+team_id是该表主键.每一行都包含了一个参加联赛的队伍信息.表:Matches+----------------
- 小丁的ScalersTalk第五轮新概念朗读持续力训练Day125-20200224
丁丁水天
1.练习材料Lesson21DanielMendozaBoxingmatcheswereverypopularinEnglandtwohundredyearsago.Inthosedays,boxersfoughtwithbarefistsforprizemoney.Becauseofthis,theywereknownas'prizefighters'.However,boxingwasvery
- [leetcode] 408. Valid Word Abbreviation 解题报告
小榕流光
leetcodestringleetcodestring
题目链接:https://leetcode.com/problems/valid-word-abbreviation/Givenanon-emptystringsandanabbreviationabbr,returnwhetherthestringmatcheswiththegivenabbreviation.Astringsuchas
- 【centos7】中完全卸载Python3
小涂的知识库
Pythoncentos7系统python开发语言
如何在centos7中完全卸载Python3?逻辑很简单,具体的操作代码,记录下来。卸载Python3的三步骤1、卸载python3rpm-qa|greppython3|xargsrpm-ev--allmatches--nodeps2、删除所有残余文件whereispython3|xargsrm-frv3、查看现有安装的python,验证是否删除干净whereispython
- 正则表达式
·云扬·
Java正则表达式
文章目录1正则表达式基本介绍2正则表达式语法2.1元字符-转义号\\\2.2元字符-字符匹配符2.3元字符-选择匹配符2.4元字符-限定符2.5元字符-定位符2.6分组3正则表达式三个常用类3.1Pattern类的Matches方法3.2Matcher类的常用方法4分组、捕获、反向引用5String类中使用正则表达式5.1替换功能5.2判断功能5.3分割功能6正则表达式使用案例6.1验证电子邮箱格
- chrome extension 普通网页与插件直接通信
森叶
extensionchrome前端javascript
与跨扩展消息传递类似,您的扩展可以接收和响应来自常规网页的消息。要使用此功能,您必须首先在manifest.json中指定要与哪些网站进行通信。例如:"externally_connectable":{"matches":["https://*.example.com/*"]}这会将消息传递API公开给与您指定的URL模式匹配的任何页面。URL模式必须至少包含一个二级域-即,禁止使用“*”、“*.
- 关于candump 命令中 filter 过滤的解释
sunfanup
linux开发cc++linux网络
Filters:CommaseparatedfilterscanbespecifiedforeachgivenCANinterface::(matcheswhen&mask==can_id&mask)~(matcheswhen&mask!=can_id&mask)#(seterrorframefilter,seeinclude/linux/can/error.h)[j|J](jointhegive
- 上岸算法 I LeetCode Weekly Contest 219解题报告
上岸算法
No.1比赛中的配对次数解题思路模拟过程即可,较简单。代码展示classSolution{publicintnumberOfMatches(intn){intres=0;while(n>1){res+=n/2;n=(n+1)/2;}returnres;}}No.2十-二进制数的最少数目解题思路取决于最大的数字是多少。代码展示classSolution{publicintminPartitions(
- 正则表达式之PHP篇match,match_all
xiaoshuode
php+前端php正则表达式match
preg_match($pattern,$subject,[array&match])preg_match_all($pattern,$subject,array&matches)pregmatch只匹配一次,返回值0或1;pregmatchall匹配多次,有多少次匹配到多少次返回匹配到的次数;$pattern正则表达式;$subject所要匹配的字符串或数组;//preg_match,preg_
- autojs通过正则表达式获取带有数字的text内容
weixin_40938312
正则表达式前端
视频连接视频连接参考参考varc=textMatches(/\d+/).findOne()console.log("当前金币"+c.text())//获取当前金币UiSelector.textMatches(reg)reg{string}|{Regex}要满足的正则表达式。为当前选择器附加控件"text需要满足正则表达式reg"的条件。有关正则表达式,可以查看正则表达式-菜鸟教程。需要注意的是,如
- 2020-01-08 Powershell 正则匹配
黒渋茴米唐
$AliasName="Zhao,Janice(KDC/HR)";$matches=[System.Text.RegularExpressions.Regex]::Matches($AliasName,"(\w+)\,\s(\w+)\s");$first=$matches[0].Groups[2].Value;$last=$matches[0].Groups[1].Value;表达式的括号是代表匹
- uva508 莫尔斯电码(Morse Mismatches)
谭树杰的博客
成长日志uva
首先我理解错了题意,在这篇文章找到了UVa508MorseMismatches(莫尔斯电码)这题的意思是给定一些莫尔斯编码,给定一些已知字典,给定一些编码,求解这些编码的对应原文,如果可以精确匹配,则直接输出原单词,如果有多个可精确匹配的结果,则输出匹配结果里字典序最小的单词(紫书上说输出任意一个,这是错误的)并在末位加上“!”;如果无法精确匹配,则可以在编码的末尾增加或删除一些字符后匹配单词(增
- 1073 Scientific Notation(20 分)
W杂货铺W
Scientificnotationisthewaythatscientistseasilyhandleverylargenumbersorverysmallnumbers.Thenotationmatchestheregularexpression[+-][1-9].[0-9]+E[+-][0-9]+whichmeansthattheintegerportionhasexactlyonedigi
- 408. Valid Word Abbreviation
zshouyi
LeetCodeStringLeetCodeStringValidWordAbbreviat
Givenanon-emptystringsandanabbreviationabbr,returnwhetherthestringmatcheswiththegivenabbreviation.Astringsuchas"word"containsonlythefollowingvalidabbreviations:["word","1ord","w1rd","wo1d","wor1","2rd
- [LeetCode] 408. Valid Word Abbreviation
weixin_33817333
ProblemGivenanon-emptystringsandanabbreviationabbr,returnwhetherthestringmatcheswiththegivenabbreviation.Astringsuchas"word"containsonlythefollowingvalidabbreviations:["word","1ord","w1rd","wo1d","wor
- 正则记录
从此用心
//正则只包括数字,空格,中横线Regexreg=newRegex("^[\\s\\d-]+$");booleanmatches=reg.matches(meetingNo);
- 2018-07-10swift4与swift 3.3 语法重拾(二)
幸福晓杰2016
函数与闭包//用函数做返回值funcmakeIncrementer()->((Int)->Int){funcaddOne(number:Int)->Int{return1+number}returnaddOne}varincrement=makeIncrementer()increment(7)//用函数做参数funchasAnyMatches(list:[Int],condition:(Int)
- SpringBoot:自动配置报告
ChinaDragonDreamer
#SpringBootspringboot后端java
自动配置报告demo:点击查看LearnSpringBoot03AutoConfig点击查看更多的SpringBoot教程一、application.properties代码#开启springbootdebug模式#自动配置报告#Positivematches:自动配置类启用了(自动配置类匹配上了),例如:AopAutoConfigurationmatched:#Negativematches:自
- 2024年美国大学生数学建模竞赛(美赛)C题思路
Python风控模型与数据分析
数学建模数学建模
建议大家去搜一下网球比赛规则、记分规则看看•Developamodelthatcapturestheflowofplayaspointsoccurandapplyittooneormoreofthematches.Yourmodelshouldidentifywhichplayerisperformingbetteratagiventimeinthematch,aswellashowmuchbet
- linux卸载Python3
伊澈
一、卸载Python31、rpm-qa|greppython3|xargsrpm-ev--allmatches--nodeps#卸载pyhton32、whereispython3|xargsrm-frv#删除所有残余文件3、whereispython#查看现有安装的python
- C#中的正则表达式
万里归来少年心
C#c#正则表达式定位匹配
正则表达式是一种匹配文本的模式。常用函数IsMatch判断字符串是否与正则表达式匹配Match返回字符串中符合正则表达式的第一个匹配项Matches返回字符串中符合正则表达式的所有匹配项Replaces将字符串中符合正则表达式的字符串替换为另一个字符串Split使用正则表达式匹配的位置,将字符串拆分成字符串数组定位元字符^匹配必须出现在字符串开头或者行的开头$匹配必须出现在字符串结尾或者行的结尾s
- 【C#进阶三】C#正则表达式的使用及常用案例(Regex.IsMatch、Regex.Match,match.NextMatch、Regex.Matches、Regex.Replace等)(实践篇)
智能建造小硕
C#进阶笔记正则表达式c#开发语言
文章目录1.匹配正则表达式模式:Regex.IsMatch2.提取单个匹配项或第一个匹配项:Regex.Match(),match.NextMatch()3.提取所有匹配项Regex.Matches(),返回一个MatchCollection4.替换匹配的子字符串:Regex.Replace5.将单个字符串拆分成一个字符串数组Regex.Split6.Group集合7.其它案例C#进阶笔记系列上一
- Java正则表达式之Pattern和Matcher
似霰
Javajava正则表达式开发语言
目录前言一、Pattern和Matcher的简单使用二、Pattern详解2.1Pattern常用方法2.1.1compile(Stringregex)2.1.2matches(Stringregex,CharSequenceinput)2.1.3split(CharSequenceinput)2.1.4pattern()2.1.5matcher(CharSequenceinput)三、Match
- C#用正则表达式Regex.Matches 方法检查字符串中重复出现的词
wenchm
正则表达式
目录一、Regex.Matches方法1.重载二、Matches(String,String,RegexOptions,TimeSpan)1.定义2.示例三、Matches(String,String,RegexOptions)1.定义2.示例3.示例:用正则表达式检查字符串中重复出现的词四、Matches(String,Int32)1.定义2.示例五、Matches(String)六、Match
- opencv中match与KnnMatch返回值解释
冯邵封
matchknnmatch暴力匹配match返回值Knnmatch返回值
match与KnnMatch返回值解释:之前一直不明白match与knnmatch的返回值到底是什么,查阅了一些资料才理解。其实二者都是返回的DMatch类型的数据结构。先说一下.match():bf=cv.BFMatcher_create()matches=bf.match(des1,des2)formatcheinmatches:print(matche)输出为:那么这个这个DMatch数据结
- 匹配字符串小工具
波雅_汉库克
C++知识c++
函数作用就是匹配字符串是否是源字符串相似的字符串参数,strPrimary是模板字符串,strMatches是需要匹配的字符串.例如:strPrimary字符串是MMAPLFA字样,strMatches字符串是MAP_FAMB035,需要匹配的字符串和模板字符串有5个字母像匹配,分别是MAP和FA而且这几个字符相对位置也是一样的.函数返回5.intStringMatches(conststd::s
- Unity3D正则表达式的使用
心疼你的一切
Unity工具正则表达式数据库unity游戏引擎c#
系列文章目录unity工具文章目录系列文章目录前言一、匹配正整数的使用方法1-1、代码如下1-2、结果如下二、匹配大写字母2-1、代码如下1-2、结果如下三、Regex类3-1、Match()3-2、Matches()3-3、IsMatch()四、定义正则表达式4-1、转义字符4-2、字符类4-3、定位点4-4、限定符五、常用的正则表达式5-1、校验数字的表达式5-2、校验字符的表达式5-3、校验
- 解决keil编译错误 error: L6236E: No section matches selector - no section to be FIRST/LA处理方法
含痕连柔
STM32stm32
当keil编译出现sct(7):error:L6236E:Nosectionmatchesselector-nosectiontobeFIRST/LA是由于没有加启动文件,双击左边工程框的文件夹,添加Startup开头的.s文件即可。(以stm32f429为例)这个问题是因为CUBEMX工程在中文目录下,全部切换到英文就没有个这个问题了,有趣的是,还自动生成了启动文件在项目目录内,但就是不在kei
- no matches for kind “IPPool“ in version “projectcalico.org/v3“
kiss fire --hui
kuberneteskindlinux服务器
查看apiVersionkubectlapi-versions|grepcalico查看kindkubectlapi-resources-owide|grepcalico|grepIPPool在yaml里把apiVersion换掉既可,我这里是crd.projectcalico.org/v1
- apache 安装linux windows
墙头上一根草
apacheinuxwindows
linux安装Apache 有两种方式一种是手动安装通过二进制的文件进行安装,另外一种就是通过yum 安装,此中安装方式,需要物理机联网。以下分别介绍两种的安装方式
通过二进制文件安装Apache需要的软件有apr,apr-util,pcre
1,安装 apr 下载地址:htt
- fill_parent、wrap_content和match_parent的区别
Cb123456
match_parentfill_parent
fill_parent、wrap_content和match_parent的区别:
1)fill_parent
设置一个构件的布局为fill_parent将强制性地使构件扩展,以填充布局单元内尽可能多的空间。这跟Windows控件的dockstyle属性大体一致。设置一个顶部布局或控件为fill_parent将强制性让它布满整个屏幕。
2) wrap_conte
- 网页自适应设计
天子之骄
htmlcss响应式设计页面自适应
网页自适应设计
网页对浏览器窗口的自适应支持变得越来越重要了。自适应响应设计更是异常火爆。再加上移动端的崛起,更是如日中天。以前为了适应不同屏幕分布率和浏览器窗口的扩大和缩小,需要设计几套css样式,用js脚本判断窗口大小,选择加载。结构臃肿,加载负担较大。现笔者经过一定时间的学习,有所心得,故分享于此,加强交流,共同进步。同时希望对大家有所
- [sql server] 分组取最大最小常用sql
一炮送你回车库
SQL Server
--分组取最大最小常用sql--测试环境if OBJECT_ID('tb') is not null drop table tb;gocreate table tb( col1 int, col2 int, Fcount int)insert into tbselect 11,20,1 union allselect 11,22,1 union allselect 1
- ImageIO写图片输出到硬盘
3213213333332132
javaimage
package awt;
import java.awt.Color;
import java.awt.Font;
import java.awt.Graphics;
import java.awt.image.BufferedImage;
import java.io.File;
import java.io.IOException;
import javax.imagei
- 自己的String动态数组
宝剑锋梅花香
java动态数组数组
数组还是好说,学过一两门编程语言的就知道,需要注意的是数组声明时需要把大小给它定下来,比如声明一个字符串类型的数组:String str[]=new String[10]; 但是问题就来了,每次都是大小确定的数组,我需要数组大小不固定随时变化怎么办呢? 动态数组就这样应运而生,龙哥给我们讲的是自己用代码写动态数组,并非用的ArrayList 看看字符
- pinyin4j工具类
darkranger
.net
pinyin4j工具类Java工具类 2010-04-24 00:47:00 阅读69 评论0 字号:大中小
引入pinyin4j-2.5.0.jar包:
pinyin4j是一个功能强悍的汉语拼音工具包,主要是从汉语获取各种格式和需求的拼音,功能强悍,下面看看如何使用pinyin4j。
本人以前用AscII编码提取工具,效果不理想,现在用pinyin4j简单实现了一个。功能还不是很完美,
- StarUML学习笔记----基本概念
aijuans
UML建模
介绍StarUML的基本概念,这些都是有效运用StarUML?所需要的。包括对模型、视图、图、项目、单元、方法、框架、模型块及其差异以及UML轮廓。
模型、视与图(Model, View and Diagram)
&
- Activiti最终总结
avords
Activiti id 工作流
1、流程定义ID:ProcessDefinitionId,当定义一个流程就会产生。
2、流程实例ID:ProcessInstanceId,当开始一个具体的流程时就会产生,也就是不同的流程实例ID可能有相同的流程定义ID。
3、TaskId,每一个userTask都会有一个Id这个是存在于流程实例上的。
4、TaskDefinitionKey和(ActivityImpl activityId
- 从省市区多重级联想到的,react和jquery的差别
bee1314
jqueryUIreact
在我们的前端项目里经常会用到级联的select,比如省市区这样。通常这种级联大多是动态的。比如先加载了省,点击省加载市,点击市加载区。然后数据通常ajax返回。如果没有数据则说明到了叶子节点。 针对这种场景,如果我们使用jquery来实现,要考虑很多的问题,数据部分,以及大量的dom操作。比如这个页面上显示了某个区,这时候我切换省,要把市重新初始化数据,然后区域的部分要从页面
- Eclipse快捷键大全
bijian1013
javaeclipse快捷键
Ctrl+1 快速修复(最经典的快捷键,就不用多说了)Ctrl+D: 删除当前行 Ctrl+Alt+↓ 复制当前行到下一行(复制增加)Ctrl+Alt+↑ 复制当前行到上一行(复制增加)Alt+↓ 当前行和下面一行交互位置(特别实用,可以省去先剪切,再粘贴了)Alt+↑ 当前行和上面一行交互位置(同上)Alt+← 前一个编辑的页面Alt+→ 下一个编辑的页面(当然是针对上面那条来说了)Alt+En
- js 笔记 函数
征客丶
JavaScript
一、函数的使用
1.1、定义函数变量
var vName = funcation(params){
}
1.2、函数的调用
函数变量的调用: vName(params);
函数定义时自发调用:(function(params){})(params);
1.3、函数中变量赋值
var a = 'a';
var ff
- 【Scala四】分析Spark源代码总结的Scala语法二
bit1129
scala
1. Some操作
在下面的代码中,使用了Some操作:if (self.partitioner == Some(partitioner)),那么Some(partitioner)表示什么含义?首先partitioner是方法combineByKey传入的变量,
Some的文档说明:
/** Class `Some[A]` represents existin
- java 匿名内部类
BlueSkator
java匿名内部类
组合优先于继承
Java的匿名类,就是提供了一个快捷方便的手段,令继承关系可以方便地变成组合关系
继承只有一个时候才能用,当你要求子类的实例可以替代父类实例的位置时才可以用继承。
在Java中内部类主要分为成员内部类、局部内部类、匿名内部类、静态内部类。
内部类不是很好理解,但说白了其实也就是一个类中还包含着另外一个类如同一个人是由大脑、肢体、器官等身体结果组成,而内部类相
- 盗版win装在MAC有害发热,苹果的东西不值得买,win应该不用
ljy325
游戏applewindowsXPOS
Mac mini 型号: MC270CH-A RMB:5,688
Apple 对windows的产品支持不好,有以下问题:
1.装完了xp,发现机身很热虽然没有运行任何程序!貌似显卡跑游戏发热一样,按照那样的发热量,那部机子损耗很大,使用寿命受到严重的影响!
2.反观安装了Mac os的展示机,发热量很小,运行了1天温度也没有那么高
&nbs
- 读《研磨设计模式》-代码笔记-生成器模式-Builder
bylijinnan
java设计模式
声明: 本文只为方便我个人查阅和理解,详细的分析以及源代码请移步 原作者的博客http://chjavach.iteye.com/
/**
* 生成器模式的意图在于将一个复杂的构建与其表示相分离,使得同样的构建过程可以创建不同的表示(GoF)
* 个人理解:
* 构建一个复杂的对象,对于创建者(Builder)来说,一是要有数据来源(rawData),二是要返回构
- JIRA与SVN插件安装
chenyu19891124
SVNjira
JIRA安装好后提交代码并要显示在JIRA上,这得需要用SVN的插件才能看见开发人员提交的代码。
1.下载svn与jira插件安装包,解压后在安装包(atlassian-jira-subversion-plugin-0.10.1)
2.解压出来的包里下的lib文件夹下的jar拷贝到(C:\Program Files\Atlassian\JIRA 4.3.4\atlassian-jira\WEB
- 常用数学思想方法
comsci
工作
对于搞工程和技术的朋友来讲,在工作中常常遇到一些实际问题,而采用常规的思维方式无法很好的解决这些问题,那么这个时候我们就需要用数学语言和数学工具,而使用数学工具的前提却是用数学思想的方法来描述问题。。下面转帖几种常用的数学思想方法,仅供学习和参考
函数思想
把某一数学问题用函数表示出来,并且利用函数探究这个问题的一般规律。这是最基本、最常用的数学方法
- pl/sql集合类型
daizj
oracle集合typepl/sql
--集合类型
/*
单行单列的数据,使用标量变量
单行多列数据,使用记录
单列多行数据,使用集合(。。。)
*集合:类似于数组也就是。pl/sql集合类型包括索引表(pl/sql table)、嵌套表(Nested Table)、变长数组(VARRAY)等
*/
/*
--集合方法
&n
- [Ofbiz]ofbiz初用
dinguangx
电商ofbiz
从github下载最新的ofbiz(截止2015-7-13),从源码进行ofbiz的试用
1. 加载测试库
ofbiz内置derby,通过下面的命令初始化测试库
./ant load-demo (与load-seed有一些区别)
2. 启动内置tomcat
./ant start
或
./startofbiz.sh
或
java -jar ofbiz.jar
&
- 结构体中最后一个元素是长度为0的数组
dcj3sjt126com
cgcc
在Linux源代码中,有很多的结构体最后都定义了一个元素个数为0个的数组,如/usr/include/linux/if_pppox.h中有这样一个结构体: struct pppoe_tag { __u16 tag_type; __u16 tag_len; &n
- Linux cp 实现强行覆盖
dcj3sjt126com
linux
发现在Fedora 10 /ubutun 里面用cp -fr src dest,即使加了-f也是不能强行覆盖的,这时怎么回事的呢?一两个文件还好说,就输几个yes吧,但是要是n多文件怎么办,那还不输死人呢?下面提供三种解决办法。 方法一
我们输入alias命令,看看系统给cp起了一个什么别名。
[root@localhost ~]# aliasalias cp=’cp -i’a
- Memcached(一)、HelloWorld
frank1234
memcached
一、简介
高性能的架构离不开缓存,分布式缓存中的佼佼者当属memcached,它通过客户端将不同的key hash到不同的memcached服务器中,而获取的时候也到相同的服务器中获取,由于不需要做集群同步,也就省去了集群间同步的开销和延迟,所以它相对于ehcache等缓存来说能更好的支持分布式应用,具有更强的横向伸缩能力。
二、客户端
选择一个memcached客户端,我这里用的是memc
- Search in Rotated Sorted Array II
hcx2013
search
Follow up for "Search in Rotated Sorted Array":What if duplicates are allowed?
Would this affect the run-time complexity? How and why?
Write a function to determine if a given ta
- Spring4新特性——更好的Java泛型操作API
jinnianshilongnian
spring4generic type
Spring4新特性——泛型限定式依赖注入
Spring4新特性——核心容器的其他改进
Spring4新特性——Web开发的增强
Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC
Spring4新特性——Groovy Bean定义DSL
Spring4新特性——更好的Java泛型操作API
Spring4新
- CentOS安装JDK
liuxingguome
centos
1、行卸载原来的:
[root@localhost opt]# rpm -qa | grep java
tzdata-java-2014g-1.el6.noarch
java-1.7.0-openjdk-1.7.0.65-2.5.1.2.el6_5.x86_64
java-1.6.0-openjdk-1.6.0.0-11.1.13.4.el6.x86_64
[root@localhost
- 二分搜索专题2-在有序二维数组中搜索一个元素
OpenMind
二维数组算法二分搜索
1,设二维数组p的每行每列都按照下标递增的顺序递增。
用数学语言描述如下:p满足
(1),对任意的x1,x2,y,如果x1<x2,则p(x1,y)<p(x2,y);
(2),对任意的x,y1,y2, 如果y1<y2,则p(x,y1)<p(x,y2);
2,问题:
给定满足1的数组p和一个整数k,求是否存在x0,y0使得p(x0,y0)=k?
3,算法分析:
(
- java 随机数 Math与Random
SaraWon
javaMathRandom
今天需要在程序中产生随机数,知道有两种方法可以使用,但是使用Math和Random的区别还不是特别清楚,看到一篇文章是关于的,觉得写的还挺不错的,原文地址是
http://www.oschina.net/question/157182_45274?sort=default&p=1#answers
产生1到10之间的随机数的两种实现方式:
//Math
Math.roun
- oracle创建表空间
tugn
oracle
create temporary tablespace TXSJ_TEMP
tempfile 'E:\Oracle\oradata\TXSJ_TEMP.dbf'
size 32m
autoextend on
next 32m maxsize 2048m
extent m
- 使用Java8实现自己的个性化搜索引擎
yangshangchuan
javasuperword搜索引擎java8全文检索
需要对249本软件著作实现句子级别全文检索,这些著作均为PDF文件,不使用现有的框架如lucene,自己实现的方法如下:
1、从PDF文件中提取文本,这里的重点是如何最大可能地还原文本。提取之后的文本,一个句子一行保存为文本文件。
2、将所有文本文件合并为一个单一的文本文件,这样,每一个句子就有一个唯一行号。
3、对每一行文本进行分词,建立倒排表,倒排表的格式为:词=包含该词的总行数N=行号