- 2018-06-17
二白啊
越勤奋,机会越多,而且越可能抓住机会。就算天上掉馅饼,也要起得早。成功没有侥幸,运气来自于勤奋。浅薄的人相信运气,而成功的首要秘诀是勤奋。
- 2018-06-17
小不点_7585
千言万语,只言片语,沉默不语,其实都是最真最深的爱,千言万语是心在倾诉,只言片语是心在安宁,沉默不语是心在聆听,不管天涯还是咫尺,不管现在还是未来,风风雨雨坎坎坷坷,都不会忘记,都不会放弃,因为有些人是注定的情缘,是难解的爱恋,说好的一辈子,就永远不分离,爱的路当然会有曲折会有酸苦,只要真心不变痴情不移,走过沧海桑田,生命就会拥抱花好月圆,爱情就会海枯石烂。图片发自App图片发自App
- 2018-06-17
金缘逸书2017
平水韵:七阳(平)《担当》瘠土萌芽喜见光,历经坎坷苦甘尝。擎天繁叶遮风雨,立地枯根育栋梁!为父亲节而写:挺起胸膛,勇于担当,父爱如山,后辈敬仰!
- 2018-06-17
L次第花开
罗书萍焦点网络四期周口项城坚持分享第467天2018.06.17周日形塑是指,“就发言者方才所讲的内容,加以描述、说明、阐述,转移之,或者予以特征化、归纳之”,即形塑为咨询师针对当事人的说话内容,选择性的去谈论或发表意见。形塑是sfBT咨询师另一个可选择的回应,形塑常接在“所以、你的意思是指”、“你刚才讲的意思是”、“换句话说”等词语后。形塑的反应并不是一般自然的沟通反应,而是一个想要去推动或触发
- 2018-06-17
情思心语_32a0
日志第3天,今天是6月17日,农历五月初四。今天对我来说是一个非常非常幸运的日子,因为我在朋友圈里看到销售女神徐鹤宁的演讲视频,我关注了她,试的加她微信,没想到她加了我,还主动和我聊天,最后竟然同意收我做她的学生。我激动的无法用语言形容。老师说,她的学生必须做冠军,不许做第二名,老师,我一定拼命做冠军。
- 2018-06-17
行百里者半九十
抬头看了下地铁开到哪了,不得不感叹,才刷了几条新闻,却又快到换乘的站了。一晃而过,我还没反应过来,就猝不及防的要到了。可是!我还想等等的,想慢一些。还在等待着,想缓缓在开始,可惜时间不会停歇,不会等。逝者如斯夫,不舍昼夜。还是得按自己的时间。
- 2018-06-17
华德文化传媒
图片发自App通书大全》上说:“本年二十四山墓龙变运,某山运为年、月纳音所克即是年、月克某山。只有新建宅舍、新立坟茔才这样用,其他拆修、竖造、不动地基以及旧坟附葬者都不用它。”比如甲子年纳音属金,本年水、土山墓运戊辰属木,受年纳音的克制即是本年克甲寅、辰、巽、戌、坎、辛、申八水山、丑、癸、坤、庚、未五土山。甲子年丙寅、丁卵、甲戌、乙亥月纳音属火,本年金山墓运乙丑属金,受月纳音之克即是正、二、九、十
- 2018-06-17
上品设计赵秋红禹竹易理丹心
1,晨间日记第二篇读后感上篇的时候看了,拾起了好多年的习惯,相当于舒缓自己的情绪,更为理智的去处理自己的情绪,去公平合理的去处理各种关系,使自己更善待他人学会了分解目标,不在好高骛远,把目标一个个的分解的更小,这样更利于是想,当实现的时候,小小的喜悦感会让人更为精进,更幸福当目标分解了,更容易实现,当任务没有完成的时候,也可以随时调整,不在因为没有完成而形成焦虑感。看看自己每天的日记,特别便于梳理
- 2018-06-17
心想荣
亲爱的你可知我是多么的爱你时常发呆去想起想起我们在一起所有的甜蜜,幸福和所有给你的委屈我想要今后的你是最幸福的那个我的一切都是你的什么都可以给你感谢你感谢天意感谢这一切美好际遇让我遇见你不放手不放弃攥紧你的手拉你在怀里要珍惜珍爱珍贵的你你是我梦里梦外的唯一图片发自App我爱你哦我们在一起幸福常伴左右要每天都要开心心呐我的小可爱在我的心怀嘿嘿图片发自App图片发自App图片发自App
- 2018-06-17
二白啊
不要去喜欢一个不喜欢自己的人想要看清事实,就需要一-些疼痛你必须明白,要走的人你留不住装睡的人你叫不醒不爱你的人你感动不了
- 2018-06-17
二白啊
就是你放在这个同一时间段去看待这件事情,我们的付出的努力应该是一个持续的,不能是此一时,彼一时。你应该把它放的更长远一点,当你当下过不去的时候,你要学会用未来的眼光跟现在的你对话。
- 2018-06-17
e124a242d15f
读书会+父亲节的日子,天气炎热,家人们依旧相聚。感叹这份为孩子的心,因为大家都真诚而显得格外珍惜。后来临时去了大学城广美看作品展。亲爱的宝贝开心就好。留下几行字记住这一刻的美好就好。
- 2018-06-17
魏晋凯
今日体验,这两天标准化有点下降,之前指定的一些流程和制度有些淡忘。核心,好的流程和标准一定要继续保持。
- 2018-06-17周检视
河水hyp
刚摸索用。六月还没有计划,每天都感觉好忙,本周简单表述如下:早上打卡时间:5.10前4次,5.10分_5.20以前1次,最迟的一次是5.41分。走路情况:2万步以上4次,最多的28069步,最少的20804步,1万步_2万步之间3次,最多的19012步,最少的15854步。回老家陪老母亲2次,累计时间2天。
- 2018-06-17 startSystemServer
七点水Plus
MethodAndArgsCaller类既是一个异常类又是一个线程,异常处理代码中直接调用了这个线程的run方法,并执行了传入的com.android.server.SystemServer类的main方法。invokeStaticMain方法抛出异常的目的是执行com.android.server.SystemServer类的main方法,通过这种方式,可以直接从调用栈中跳出,并返回到Zygot
- 2018-06-17
爱心客站
养生和医院的二十点区别:1养生研究健康,医院研究疾病;2养生的目标是看不到疾病,医院的任务1是看看你的疾病;3养生以研究健康为前提条件,医院以研究疾病的特性和表现为前提;4养生研究如何保持健康,医院研究如何消除病症的折磨;5养生研究如何才能够不得病,医院研究如何去掉已经有的病;6养生的专业是生病之前的控制过程,医院的专业是生病之后的处理过程;7养生善用病前控制的措施调理,医院主要用病后处理的方法治
- 2018-06-17
岁月静好_87e9
岁月是个撕书人,把故事章节塞入每一扇窗户,开几朵微笑的,流几滴泪的,浮世如倒影。——简媜《浮舟》
- 2018-06-17
凤221
《父亲节》您是一个守旧的人,最喜欢过传统的节日,尤其是春节,一家老小聚在一起,是您最开心的时候。我们有时候给您过个父亲节,您嘴上嘟囔着我们乱花钱,其实是希望我们多回去陪陪你们。可恨自己老是用各种理由什么孩子星期天补课,什么厂里事多……您和老妈每次想我的时候,都能听到电话里没有挂断的那头您和老妈说:快了她一会儿就到……而且每次到家的时候,您雷打不动的坐在大门下迎着我们。今天父亲节,我知道您一直都在,
- 2018-06-17
孟傑萨霸
1.付出不亚于任何人的努力2.要谦虚,不要骄傲3.要每天反省4.活着,就要感谢5.积善行,思利他6.不要有感性的烦恼今日分享:明天是端午佳节,今天开始陆续收到亲友的祝福信息,以前我收到这样的祝福信息一般是不一一回复的,觉得发信息的人也是一个形式而已。但是,这次节日去用心感受到了对方在发信息背后的那份情义,哪怕一条信息很容易,但背后却是真实的挂念与情义,我应该感谢这份情义。
- 2018-06-17
汪玲玲Wellin
2018-06-17姓名:汪玲玲日期:2018年6月17日名称:宁波万尚进出口有限公司组别:六项精进403期谦虚二组【日精进打卡第7天】【知~学习】诵读《六项精进通篇》1遍,累计6遍;诵读《经营十二条》通篇1遍,累计16遍;诵读《大学》3遍,累计18遍。【行~实践】一、修身:对自己早上去公园锻炼身体二、齐家:去看母亲,三、建功:1,2,【省~觉悟】{积善}:今日行O善,累计:5善。尚简公益捐款第5
- 2018-06-17
血仍未冷啊
亲爱的自己鼓起勇气走进食堂。拿了碗筷开始吃饭。有些忐忑。没人管我,我们的担心多余了。你克服畏难情绪走出一部。干得好。
- 2018-06-17
微微胖的闪电妹
本是九重天上掌管仙花的仙娥,无忧无虑。一次下凡历劫,却瞧上了文弱书呆子,度过了短暂的一世年华。而今再入仙班,这如往常热烈盛开的仙花,却显得这般寂聊。是九重天上掌管仙花的仙娥,无忧无虑。一次下凡历劫,却瞧上了文弱书呆子,度过了短暂的一世年华。而今再入仙班,这如往常热烈盛开的仙花,却显得这般寂聊。
- 李艳 焦点解决初级十期 洛阳 坚持分享第6天,2018-06-17
ycgaly
刚刚结束一天忙碌的工作和生活,刚躺到床上,突然想起竟然忘了写分享,不管是否清零,我依然要坚持把这一天的最后一项任务完成。虽然现在我还没有达到把坚持写分享作为一种乐趣,但是我相信我能坚持写下去✊
- 2018-06-17
小城蜉蝣
又雨雨在尘里激起点点爱意天送它来它传达天意或许天地本是情侣所以曾在一起盘古把它们劈散十万八千里情用雨来系十万的遥远改不了爱的真切天是“老天爷”地是“大地母亲”他们已是夫妻几亿年的长久爱已锤炼得真切这真切在我们这里镌刻进灵魂里伴我们老去
- 2018-06-17
茶舍花开
我的咖啡时间总有斯美塔那河水流过音乐相伴天涯我的咖啡时间云儿难遮早霞露水嘀嗒盆景榆树叶下我的咖啡时间蝈蝈叽叽喳喳玉鸟鸣唱喜欢与伊对话我的咖啡时间辞别少年韶华书页翻过快板慢板四海是家……——6.17晨
- 笔试刷题-百度2018-06-17
Dodo159753
题目描述:/**度度熊想去商场买一顶帽子,商场里有N顶帽子,有些帽子的价格可能相同。度度熊想买一顶价格第三便宜的帽子,问第三便宜的帽子价格是多少?输入描述:首先输入一个正整数N(N#include#includeusingnamespacestd;intmain(){intfirst=INT_MAX,second=INT_MAX,third=INT_MAX;intN;scanf("%d",&N);
- 2018-06-17
华德文化传媒
图片发自App天父卦从乾卦转而起,从上到中再到下,又回复到中再回复到上,按照顺序循环变化。乾卦的上爻变为兑卦,为贪狼。兑卦的中爻变为震卦,为巨门。震卦的下爻变为坤卦,为禄存。坤卦的中爻变为坎卦,为文曲。坎卦的上爻变为巽卦,为廉贞。巽卦的中爻变为艮卦,为武曲。艮卦的下爻变为离,为破军。离卦的中爻循环回复变为乾卦,为辅弼。这种变卦方法便是旁起旁止。
- 2018-06-17
肖博涵xbh
今天,妈妈让我练速读。我嘴上说着:“我马上就去。”但是心里却是那么的不情愿。我打开了电脑,找到了速读音乐。嘟着嘴,打开了音乐。“雷泽高效速读训练开始,请按要求做好……”我不情愿的开始做了起来。本来我就不愿意做,趁妈妈不注意,就开始玩儿了起来。我手上拿着书我脚下玩着足球,特别high。怕妈妈看到,于是下意识的眼睛向门口瞄,突然,我看见了妈妈板着脸在那里,冷冷的盯着我。双手紧紧的握住,微微的颤抖着。顿
- 2018-06-17
京心达_周莎
2018.6.17今日体验:今天中午去二店三店去收账,完事打算回去的时候问张秀宝可不可以送我回去,本来就是看他不忙,结果他说有事,自己去玩手机了。最后只能拜托王绎龙给送过去。
- 2018-06-17
燕子飞呀
小豆豆一直对任何事物都保持有新鲜感,所以她一直在不停地探索、思考。孩子保持对事物的好奇心很重要,我们做家长的一定保护好孩子的这种好奇心,这样孩子才能不断地去探索世界,去发现新的事物,才能对社会做出更大的贡献。
- apache 安装linux windows
墙头上一根草
apacheinuxwindows
linux安装Apache 有两种方式一种是手动安装通过二进制的文件进行安装,另外一种就是通过yum 安装,此中安装方式,需要物理机联网。以下分别介绍两种的安装方式
通过二进制文件安装Apache需要的软件有apr,apr-util,pcre
1,安装 apr 下载地址:htt
- fill_parent、wrap_content和match_parent的区别
Cb123456
match_parentfill_parent
fill_parent、wrap_content和match_parent的区别:
1)fill_parent
设置一个构件的布局为fill_parent将强制性地使构件扩展,以填充布局单元内尽可能多的空间。这跟Windows控件的dockstyle属性大体一致。设置一个顶部布局或控件为fill_parent将强制性让它布满整个屏幕。
2) wrap_conte
- 网页自适应设计
天子之骄
htmlcss响应式设计页面自适应
网页自适应设计
网页对浏览器窗口的自适应支持变得越来越重要了。自适应响应设计更是异常火爆。再加上移动端的崛起,更是如日中天。以前为了适应不同屏幕分布率和浏览器窗口的扩大和缩小,需要设计几套css样式,用js脚本判断窗口大小,选择加载。结构臃肿,加载负担较大。现笔者经过一定时间的学习,有所心得,故分享于此,加强交流,共同进步。同时希望对大家有所
- [sql server] 分组取最大最小常用sql
一炮送你回车库
SQL Server
--分组取最大最小常用sql--测试环境if OBJECT_ID('tb') is not null drop table tb;gocreate table tb( col1 int, col2 int, Fcount int)insert into tbselect 11,20,1 union allselect 11,22,1 union allselect 1
- ImageIO写图片输出到硬盘
3213213333332132
javaimage
package awt;
import java.awt.Color;
import java.awt.Font;
import java.awt.Graphics;
import java.awt.image.BufferedImage;
import java.io.File;
import java.io.IOException;
import javax.imagei
- 自己的String动态数组
宝剑锋梅花香
java动态数组数组
数组还是好说,学过一两门编程语言的就知道,需要注意的是数组声明时需要把大小给它定下来,比如声明一个字符串类型的数组:String str[]=new String[10]; 但是问题就来了,每次都是大小确定的数组,我需要数组大小不固定随时变化怎么办呢? 动态数组就这样应运而生,龙哥给我们讲的是自己用代码写动态数组,并非用的ArrayList 看看字符
- pinyin4j工具类
darkranger
.net
pinyin4j工具类Java工具类 2010-04-24 00:47:00 阅读69 评论0 字号:大中小
引入pinyin4j-2.5.0.jar包:
pinyin4j是一个功能强悍的汉语拼音工具包,主要是从汉语获取各种格式和需求的拼音,功能强悍,下面看看如何使用pinyin4j。
本人以前用AscII编码提取工具,效果不理想,现在用pinyin4j简单实现了一个。功能还不是很完美,
- StarUML学习笔记----基本概念
aijuans
UML建模
介绍StarUML的基本概念,这些都是有效运用StarUML?所需要的。包括对模型、视图、图、项目、单元、方法、框架、模型块及其差异以及UML轮廓。
模型、视与图(Model, View and Diagram)
&
- Activiti最终总结
avords
Activiti id 工作流
1、流程定义ID:ProcessDefinitionId,当定义一个流程就会产生。
2、流程实例ID:ProcessInstanceId,当开始一个具体的流程时就会产生,也就是不同的流程实例ID可能有相同的流程定义ID。
3、TaskId,每一个userTask都会有一个Id这个是存在于流程实例上的。
4、TaskDefinitionKey和(ActivityImpl activityId
- 从省市区多重级联想到的,react和jquery的差别
bee1314
jqueryUIreact
在我们的前端项目里经常会用到级联的select,比如省市区这样。通常这种级联大多是动态的。比如先加载了省,点击省加载市,点击市加载区。然后数据通常ajax返回。如果没有数据则说明到了叶子节点。 针对这种场景,如果我们使用jquery来实现,要考虑很多的问题,数据部分,以及大量的dom操作。比如这个页面上显示了某个区,这时候我切换省,要把市重新初始化数据,然后区域的部分要从页面
- Eclipse快捷键大全
bijian1013
javaeclipse快捷键
Ctrl+1 快速修复(最经典的快捷键,就不用多说了)Ctrl+D: 删除当前行 Ctrl+Alt+↓ 复制当前行到下一行(复制增加)Ctrl+Alt+↑ 复制当前行到上一行(复制增加)Alt+↓ 当前行和下面一行交互位置(特别实用,可以省去先剪切,再粘贴了)Alt+↑ 当前行和上面一行交互位置(同上)Alt+← 前一个编辑的页面Alt+→ 下一个编辑的页面(当然是针对上面那条来说了)Alt+En
- js 笔记 函数
征客丶
JavaScript
一、函数的使用
1.1、定义函数变量
var vName = funcation(params){
}
1.2、函数的调用
函数变量的调用: vName(params);
函数定义时自发调用:(function(params){})(params);
1.3、函数中变量赋值
var a = 'a';
var ff
- 【Scala四】分析Spark源代码总结的Scala语法二
bit1129
scala
1. Some操作
在下面的代码中,使用了Some操作:if (self.partitioner == Some(partitioner)),那么Some(partitioner)表示什么含义?首先partitioner是方法combineByKey传入的变量,
Some的文档说明:
/** Class `Some[A]` represents existin
- java 匿名内部类
BlueSkator
java匿名内部类
组合优先于继承
Java的匿名类,就是提供了一个快捷方便的手段,令继承关系可以方便地变成组合关系
继承只有一个时候才能用,当你要求子类的实例可以替代父类实例的位置时才可以用继承。
在Java中内部类主要分为成员内部类、局部内部类、匿名内部类、静态内部类。
内部类不是很好理解,但说白了其实也就是一个类中还包含着另外一个类如同一个人是由大脑、肢体、器官等身体结果组成,而内部类相
- 盗版win装在MAC有害发热,苹果的东西不值得买,win应该不用
ljy325
游戏applewindowsXPOS
Mac mini 型号: MC270CH-A RMB:5,688
Apple 对windows的产品支持不好,有以下问题:
1.装完了xp,发现机身很热虽然没有运行任何程序!貌似显卡跑游戏发热一样,按照那样的发热量,那部机子损耗很大,使用寿命受到严重的影响!
2.反观安装了Mac os的展示机,发热量很小,运行了1天温度也没有那么高
&nbs
- 读《研磨设计模式》-代码笔记-生成器模式-Builder
bylijinnan
java设计模式
声明: 本文只为方便我个人查阅和理解,详细的分析以及源代码请移步 原作者的博客http://chjavach.iteye.com/
/**
* 生成器模式的意图在于将一个复杂的构建与其表示相分离,使得同样的构建过程可以创建不同的表示(GoF)
* 个人理解:
* 构建一个复杂的对象,对于创建者(Builder)来说,一是要有数据来源(rawData),二是要返回构
- JIRA与SVN插件安装
chenyu19891124
SVNjira
JIRA安装好后提交代码并要显示在JIRA上,这得需要用SVN的插件才能看见开发人员提交的代码。
1.下载svn与jira插件安装包,解压后在安装包(atlassian-jira-subversion-plugin-0.10.1)
2.解压出来的包里下的lib文件夹下的jar拷贝到(C:\Program Files\Atlassian\JIRA 4.3.4\atlassian-jira\WEB
- 常用数学思想方法
comsci
工作
对于搞工程和技术的朋友来讲,在工作中常常遇到一些实际问题,而采用常规的思维方式无法很好的解决这些问题,那么这个时候我们就需要用数学语言和数学工具,而使用数学工具的前提却是用数学思想的方法来描述问题。。下面转帖几种常用的数学思想方法,仅供学习和参考
函数思想
把某一数学问题用函数表示出来,并且利用函数探究这个问题的一般规律。这是最基本、最常用的数学方法
- pl/sql集合类型
daizj
oracle集合typepl/sql
--集合类型
/*
单行单列的数据,使用标量变量
单行多列数据,使用记录
单列多行数据,使用集合(。。。)
*集合:类似于数组也就是。pl/sql集合类型包括索引表(pl/sql table)、嵌套表(Nested Table)、变长数组(VARRAY)等
*/
/*
--集合方法
&n
- [Ofbiz]ofbiz初用
dinguangx
电商ofbiz
从github下载最新的ofbiz(截止2015-7-13),从源码进行ofbiz的试用
1. 加载测试库
ofbiz内置derby,通过下面的命令初始化测试库
./ant load-demo (与load-seed有一些区别)
2. 启动内置tomcat
./ant start
或
./startofbiz.sh
或
java -jar ofbiz.jar
&
- 结构体中最后一个元素是长度为0的数组
dcj3sjt126com
cgcc
在Linux源代码中,有很多的结构体最后都定义了一个元素个数为0个的数组,如/usr/include/linux/if_pppox.h中有这样一个结构体: struct pppoe_tag { __u16 tag_type; __u16 tag_len; &n
- Linux cp 实现强行覆盖
dcj3sjt126com
linux
发现在Fedora 10 /ubutun 里面用cp -fr src dest,即使加了-f也是不能强行覆盖的,这时怎么回事的呢?一两个文件还好说,就输几个yes吧,但是要是n多文件怎么办,那还不输死人呢?下面提供三种解决办法。 方法一
我们输入alias命令,看看系统给cp起了一个什么别名。
[root@localhost ~]# aliasalias cp=’cp -i’a
- Memcached(一)、HelloWorld
frank1234
memcached
一、简介
高性能的架构离不开缓存,分布式缓存中的佼佼者当属memcached,它通过客户端将不同的key hash到不同的memcached服务器中,而获取的时候也到相同的服务器中获取,由于不需要做集群同步,也就省去了集群间同步的开销和延迟,所以它相对于ehcache等缓存来说能更好的支持分布式应用,具有更强的横向伸缩能力。
二、客户端
选择一个memcached客户端,我这里用的是memc
- Search in Rotated Sorted Array II
hcx2013
search
Follow up for "Search in Rotated Sorted Array":What if duplicates are allowed?
Would this affect the run-time complexity? How and why?
Write a function to determine if a given ta
- Spring4新特性——更好的Java泛型操作API
jinnianshilongnian
spring4generic type
Spring4新特性——泛型限定式依赖注入
Spring4新特性——核心容器的其他改进
Spring4新特性——Web开发的增强
Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC
Spring4新特性——Groovy Bean定义DSL
Spring4新特性——更好的Java泛型操作API
Spring4新
- CentOS安装JDK
liuxingguome
centos
1、行卸载原来的:
[root@localhost opt]# rpm -qa | grep java
tzdata-java-2014g-1.el6.noarch
java-1.7.0-openjdk-1.7.0.65-2.5.1.2.el6_5.x86_64
java-1.6.0-openjdk-1.6.0.0-11.1.13.4.el6.x86_64
[root@localhost
- 二分搜索专题2-在有序二维数组中搜索一个元素
OpenMind
二维数组算法二分搜索
1,设二维数组p的每行每列都按照下标递增的顺序递增。
用数学语言描述如下:p满足
(1),对任意的x1,x2,y,如果x1<x2,则p(x1,y)<p(x2,y);
(2),对任意的x,y1,y2, 如果y1<y2,则p(x,y1)<p(x,y2);
2,问题:
给定满足1的数组p和一个整数k,求是否存在x0,y0使得p(x0,y0)=k?
3,算法分析:
(
- java 随机数 Math与Random
SaraWon
javaMathRandom
今天需要在程序中产生随机数,知道有两种方法可以使用,但是使用Math和Random的区别还不是特别清楚,看到一篇文章是关于的,觉得写的还挺不错的,原文地址是
http://www.oschina.net/question/157182_45274?sort=default&p=1#answers
产生1到10之间的随机数的两种实现方式:
//Math
Math.roun
- oracle创建表空间
tugn
oracle
create temporary tablespace TXSJ_TEMP
tempfile 'E:\Oracle\oradata\TXSJ_TEMP.dbf'
size 32m
autoextend on
next 32m maxsize 2048m
extent m
- 使用Java8实现自己的个性化搜索引擎
yangshangchuan
javasuperword搜索引擎java8全文检索
需要对249本软件著作实现句子级别全文检索,这些著作均为PDF文件,不使用现有的框架如lucene,自己实现的方法如下:
1、从PDF文件中提取文本,这里的重点是如何最大可能地还原文本。提取之后的文本,一个句子一行保存为文本文件。
2、将所有文本文件合并为一个单一的文本文件,这样,每一个句子就有一个唯一行号。
3、对每一行文本进行分词,建立倒排表,倒排表的格式为:词=包含该词的总行数N=行号