- 雨晴趣事二三
司徒轩辕
大女儿造句:妈妈一见我就发火,一见小不点就笑。2017-07-10女儿说:“男人负责赚钱养家。”我:“……”女儿又说:“女人负责做家务、花钱。”“……”“还有教训男人!”“……”临了还补了一句:“我负责貌美如花。”“……”2017-03-05前几天,女儿被我和老婆教训了一顿,她很伤心,问奶奶:“爸爸妈妈好像不喜欢我,我是不是垃圾堆上捡来的?”奶奶:“……”女儿继续说:“看来是的,谢谢叔叔阿姨养我这
- 用git统计代码提交行数
carterslam
code
早上收到pmo邮件,要求统计某个时间范围内代码提交行数,一开始是懵逼的,不只如何下手,后来想到git这么强大的工具,这点小事应该能做到,于是乎搜索了一下,命令如下:gitlog--since==2017-04-10--until=2017-07-10|wc-l1822其他的命令(以下来自于网络):统计某人的代码提交量,包括增加,删除:gitlog--author="$(gitconfig--get
- 2017-07-10
雨中蜗牛
每天都想要正经的做件事,或是改变自己,想着今天自己就可以转变成想象中的自己,完成自我的实现和崭新的开始,但好像很难,又是重复着同样的一天,很可气但又很无奈,怎么办,谁能告诉我!想要像别人一样强迫自己日更,但不知写些什么,无从下笔,是不是还没有积累到可以从容应对的时候,是不是读的书还不够多,我决定先从读书笔记写起吧,或者观后感,不断的积累,希望可以看到自己的改变!
- 2017-07-10
宋庭梧
落日很大很美图片发自App还有上帝画的油画图片发自App整条路上,寥寥无几的行人图片发自App
- 2017-07-10
美文环保超市
日期:7月10日学习:迈向富足推荐:1感受:今天家里的一个嫂子竟然跟我说要去支持她同学的老婆,让我非常惊讶,争论一番以后跳过,不在不必要的人身上浪费时间计划:这个月上D
- 2017-07-10温故而知新 JS函数
bd6b5cde5ce9
$是jquery函数的函数名称没有return的函数有时称之为过程js函数可以通过以下几种方式调用作为函数作为方法作为构造函数callapply(1)vartotal=distance(1,3)+distance(2,3)(2)当方法不需要返回值时,最好直接返回thiso.m=f;o.m();varcalculator={op1:1,op2:2,m:function(){this.reult=th
- 2017-07-10
残默淡殇
我们怀念过去,并非放不下当初的人与事,而是怀想曾经的自己。人生是一次单边行程,很多东西都是唯一的,错过了就不可能再遇到。世界变化如此的快,我们一路行色匆匆,却怎么也跟不上它的脚步,丢失的东西越来越多,等到再回头看,已经找不回原来的自己。所以,保持一个本真的自我,是多么难的一件事。
- 2017-07-10农家聚
飞哥判案
故人具鸡黍,邀我至农家。绿树村边合,青山郭外斜。地名欧公店,时当雨后霞。秋葵红薯叶,家鸡偶促蛇。真情唯一片,瞎吹不少夸。逢迎官场事,喜乐山中娃。相别酒酣重,执手乱言它。桂子飘香日,再来挖地瓜。
- 2017-07-10 - 草稿
牛气冲天_7a0a
时间如白驹过隙,五年级的最后一学期就过去了,回首望去,五年级还真是多姿多彩。这个学期我们演了高难度的《麦克白》,这学期是我当部长的第一个学期,很辛苦,有的时候管不了他们。在烈日下坚持轮滑,最终放弃。一切都记录了我们的成长......记得刚开学,我是全班最后一个到的,那时已经八点半了,那绝对是我永生难忘。但在反馈假期的过程中,我感到自豪,因为我还清楚的知道假期的阳光,希望我们这个假期可以继续阳光下去
- 2017-07-10
方一
他努力获得的小小学问启发自己达到了这样一种认识从长远看,各种东西,甚至让他领悟到这点的这份学问,都是徒劳和一场空而且最终要消解成一片他们撼动不了的虚无
- 【Q27亲子班90天践行总结】4组-张玲@2017-07-10
玲儿311
易为-男-200907#90条目标汇总#孩子目标:(1)作息规律:周日-周四:晚9:15关灯早6:55起床;周五-周六晚10:00前关灯,周六因有课早7:55起床周日自然醒。完成情况:早起都能做到,睡觉有大约6天没做到,原因是课外课回家太晚,还有1次是周六晚上首次做IMovie到12点。每天先吃青蛙做得不错,番茄钟做得不够。作为7岁的二年级孩子,几乎每天回家都能自觉先吃青蛙即完成作业再玩儿,甚至有
- 2017-07-10
丨丨丨彳亍
没有人愿意整天活在否定和疑问的生活中,如果看不惯你大可以说出来,没必要在我想解释的时候摇头叹气,我的努力你看不到,只因为一个人喜欢黑白就认定他一辈子在无拥有色彩的权利这样的理论,抱歉,我真的不懂。常爱和同学开玩笑说“你变了”“你知道我经历过什么吗?”看似无聊的回答却让人警醒,的确,我们都经历了什么,我们的经历让我们有了哪些改变,处世为人、人生观、价值观、审美、甚至于看待一杯水的想法都有可能因为不同
- 2017-07-10
蓝柚cy
这是哪?一直以为这里是天堂,可是跟人的世界一样啊。3年了,我始终不相信来到这里就回不去了,一直在梦见徘徊找不到出口。一直不停的问自己这是哪,终究找不到答案,不科学。3年前,我不顾家人朋友反对和她私奔,我不相信爱情,但是每次和她在一起说不好是闺蜜的感觉还是爱人的感觉,就是很温暖,很踏实,家人都说我因为之前的恋爱大脑受了刺激有了同性恋的倾向,但是那种感觉不是恋爱的感觉。
- 2017-07-10
千樱璃曦
图片发自App我们在这年夏天各奔东西,我们在那陌生的城市里生活,无依无靠,这时,你就要自己努力,因为,你的家人在等着你,也许,小时候我们总是在埋怨自己的父母,不关心你们,但你们知不知道,父母每天早上天还没亮就出去了,而你们那时还在睡觉,当你们的父母去外面,他为一的信念就是让自己的孩子过的好,而你们呢?你们没钱了,就问父母要,给少了就生气,有的甚至离家出走,说父母不爱他,可你们知道那是父母辛辛苦苦的
- 2017-07-10
古时月白
即便我很愤怒,很伤心。我也知道,我不能冲动去找别人来转移我的感情。我不想多年以后,后悔自己,拿了一副烂牌,更是打的一手烂牌。
- 【0805】
CC想按自己的意愿过一生
0805CC日本型自然疗养基地原创2017-07-10树先生森林疗养山形县上山市、秋田县三种町、岛根县大田市、大分县由布市等八个自治体发起成立了日本自然疗养地协议会。与日本森林疗法协会有所不同,这个成员均为地方政府的协议会,工作对象不再局限于森林,它致力于整合地域内的大海、山川、温泉等自然疗愈资源,充分挖掘历史文化、工商服务和人才优势,想把德国自然疗养地模式“原汁原味”的带给日本国民。2015年1
- 2017-07-10
厦小薛智一爸爸
2017年7月10日星期一晴亲子日记第76天写了两个多月的亲子日记,我和孩子收益多多。我:了解了孩子内心活动的情况,极时调整我对孩子的态度,增加了与孩子的交流机会。孩子:语言表达能力增强了,并且每天按计划写完作业,最后写完日记再去玩。群里有的家长已经坚持写了100天。我也会与孩子共勉,坚持写到100天,200天……图片发自App
- 2017-07-10
南有肉
听到妈妈说,她租的房子160一个月,还没有洗手间,我就忍不住地想哭出来,为了我,加班到两点,只为了一晚上两百的加班费,这样的日子,什么时候才会完?什么时候才能给我父母一个幸福的生活
- 2017-07-10
陈ccxs
已经放暑假,已经有六七天了吧?刚开始那前几天又没什么事。前天跟寝室去软件项目。今天两点多去高铁站'到大哥那里。过几天就是外公的生日。算是特意回家一个星期吧!以上这几段话都是用,百度语音输入法,输入。感觉,这个输入速度应该会比打字快一点吧!好几年前也用过语音输入,但是发觉现在的语音输入好像变得智能了。他好像能自动识别语气,然后给你加上问号或者感叹号。现在两只猫,就在,旁边玩啦玩去,经常搞那些塑料袋,
- 2017-07-10
沈青青
鲶鱼效应被对手激活的效应危机和竞争可以激活团队的士气寻找鲶鱼的三个方法1中途聘用2内部提拔3红蓝两军调整,调整,做到最好
- (马昊伯)北京好扑:性能和协议的升级
大圣2017
2017-07-10小饭桌新媒体3人团队时便接下海航百万级订单,他的区块链项目获600万天使轮投资文|小饭桌新媒体记者岳珊-编辑丨王艳从外形到思维方式,马昊伯都很“geek”。北京万达广场一个几十平的办公室里,27岁的他正斜靠在椅子上,想起3人团队创立半年就拿到海航的百万大单时,马昊伯挠了挠乱蓬蓬的头发。“国内区块链技术很火,但是真正懂的公司不多,但像我们这样纯技术背景的团队能够拿到海航的单子还是
- 2017-07-10
王界程
图片发自App7.10星期一晴(87)今天儿子陪着我一起来上班,拿着作业并挑了几本自己平常喜欢看的书。计划的暑假作业写完了,看我在练习英语字母(为了更好的引帮助儿子学习英语,从头开始),儿子没忍住和我一起练了一会,“儿子,你写的可比妈妈写的漂亮多了,笔顺也是正确的,你真厉害啊。”“因为我学过啊,之前杨子轩妈妈去看班的时候教过我们,我就记住了。”“你真棒,那你教妈妈写吧,你看,我写还有点不漂亮。”儿
- 2017-07-10
川枝
能记住和一些人建立亲密联结的瞬间,关于如何进入他的客厅摆下一张桌子。却往往不确定是怎么与他们信号中断,悄悄撤离的。人类的关系多半这样,能通晓来由,不明白去路。我们只能保证情感发生的时刻是清晰的、掷地有声——“那时候好像永远是夏天”。不管后来是怎么七拐八拐,成为各自人生中的略
- 2017-07-10
霖霖雨雨霖铃
刚刚的心情老妈从二姐家回来就成了怨妇,就是这样控制不住自己的情绪,所以,没文化的人,没逻辑的人就容易情绪激动。我也已经慢慢习惯了,就是希望自己不要变成这样。突然发现自己这十多年日子也不好过。不是老二的家里事,就是大佬要跑。感觉自己活的真不容易,所以我现在很感恩。现在,我好好工作,好好学习,要自己对自己有要求。
- 2017-07-10
玛丽莲梦娜
夏天的每一天都是烈日当空,出门无非是靠打的代步,进入有空调的店铺,浓妆变阿bu所以说约的出来的都是真爱啊
- 2017-07-10
x天空之城
少即是多,慢即是快!为什么学了那么多东西无法落地?因为学习东西太多,太杂,头脑被塞满,什么也说不出来,什么也没学到,用不出来,等于没用!真正实用的获得成长进步的方法只有一个:那就是循序渐进,按部就班,慢慢来,比较快!
- 2017-07-10
心锐潮红
图片发自App鸳鸯双栖蝶双飞,满园春色惹人醉。悄悄问星空,红妹美不美?虽然我,有所牵绊。虽然我,远在他乡。战战兢兢,心系宝宝,季家湾留思念。最怕宝宝,苦苦等待在天边。怪不得英雄难过美人关,我愿在你枕边眠。说什么王权富贵?说什么戒律清规?只愿天长地久,与我意中人儿紧相随。只要你的陪伴,愿你我今生无怨无悔。
- 2017-07-10
_月球存夢
夏日凌晨五点多,窗外早已透亮,能听到不断的鸟叫声,呼吸到新鲜的空气。早起跑步练操的人们相伴,早餐店的老板也开始忙活,一天就这么又拉开了帷幕。前几天的微博故事,分享了自己玩足球的视频,真的超级帅啊,是发带蓝衣易烊千玺啊。昨晚《我们的少年时代》开播,尹柯学长真的很酷啊,虽然一二集戏份比较少,但是演技特别棒啊。早安尹柯学长,早安易烊千玺。阿欣原创禁cr易烊千玺
- 2017-07-10
乐舞飞扬
图片发自App在上海市少先队委员会的指导下,7月8日78位来自不同学校的优秀队干部们相聚在中福会,参加上海市队长学校实践基地。
- 2017-07-10
道种魔
让我在时光里临摹一幅等待的剪影画剪影在光的背景下能有多明亮等待在心的期待中会有多漫长守望那不可诉说的凄凉不是等待的孤独而是一次次的失望
- apache 安装linux windows
墙头上一根草
apacheinuxwindows
linux安装Apache 有两种方式一种是手动安装通过二进制的文件进行安装,另外一种就是通过yum 安装,此中安装方式,需要物理机联网。以下分别介绍两种的安装方式
通过二进制文件安装Apache需要的软件有apr,apr-util,pcre
1,安装 apr 下载地址:htt
- fill_parent、wrap_content和match_parent的区别
Cb123456
match_parentfill_parent
fill_parent、wrap_content和match_parent的区别:
1)fill_parent
设置一个构件的布局为fill_parent将强制性地使构件扩展,以填充布局单元内尽可能多的空间。这跟Windows控件的dockstyle属性大体一致。设置一个顶部布局或控件为fill_parent将强制性让它布满整个屏幕。
2) wrap_conte
- 网页自适应设计
天子之骄
htmlcss响应式设计页面自适应
网页自适应设计
网页对浏览器窗口的自适应支持变得越来越重要了。自适应响应设计更是异常火爆。再加上移动端的崛起,更是如日中天。以前为了适应不同屏幕分布率和浏览器窗口的扩大和缩小,需要设计几套css样式,用js脚本判断窗口大小,选择加载。结构臃肿,加载负担较大。现笔者经过一定时间的学习,有所心得,故分享于此,加强交流,共同进步。同时希望对大家有所
- [sql server] 分组取最大最小常用sql
一炮送你回车库
SQL Server
--分组取最大最小常用sql--测试环境if OBJECT_ID('tb') is not null drop table tb;gocreate table tb( col1 int, col2 int, Fcount int)insert into tbselect 11,20,1 union allselect 11,22,1 union allselect 1
- ImageIO写图片输出到硬盘
3213213333332132
javaimage
package awt;
import java.awt.Color;
import java.awt.Font;
import java.awt.Graphics;
import java.awt.image.BufferedImage;
import java.io.File;
import java.io.IOException;
import javax.imagei
- 自己的String动态数组
宝剑锋梅花香
java动态数组数组
数组还是好说,学过一两门编程语言的就知道,需要注意的是数组声明时需要把大小给它定下来,比如声明一个字符串类型的数组:String str[]=new String[10]; 但是问题就来了,每次都是大小确定的数组,我需要数组大小不固定随时变化怎么办呢? 动态数组就这样应运而生,龙哥给我们讲的是自己用代码写动态数组,并非用的ArrayList 看看字符
- pinyin4j工具类
darkranger
.net
pinyin4j工具类Java工具类 2010-04-24 00:47:00 阅读69 评论0 字号:大中小
引入pinyin4j-2.5.0.jar包:
pinyin4j是一个功能强悍的汉语拼音工具包,主要是从汉语获取各种格式和需求的拼音,功能强悍,下面看看如何使用pinyin4j。
本人以前用AscII编码提取工具,效果不理想,现在用pinyin4j简单实现了一个。功能还不是很完美,
- StarUML学习笔记----基本概念
aijuans
UML建模
介绍StarUML的基本概念,这些都是有效运用StarUML?所需要的。包括对模型、视图、图、项目、单元、方法、框架、模型块及其差异以及UML轮廓。
模型、视与图(Model, View and Diagram)
&
- Activiti最终总结
avords
Activiti id 工作流
1、流程定义ID:ProcessDefinitionId,当定义一个流程就会产生。
2、流程实例ID:ProcessInstanceId,当开始一个具体的流程时就会产生,也就是不同的流程实例ID可能有相同的流程定义ID。
3、TaskId,每一个userTask都会有一个Id这个是存在于流程实例上的。
4、TaskDefinitionKey和(ActivityImpl activityId
- 从省市区多重级联想到的,react和jquery的差别
bee1314
jqueryUIreact
在我们的前端项目里经常会用到级联的select,比如省市区这样。通常这种级联大多是动态的。比如先加载了省,点击省加载市,点击市加载区。然后数据通常ajax返回。如果没有数据则说明到了叶子节点。 针对这种场景,如果我们使用jquery来实现,要考虑很多的问题,数据部分,以及大量的dom操作。比如这个页面上显示了某个区,这时候我切换省,要把市重新初始化数据,然后区域的部分要从页面
- Eclipse快捷键大全
bijian1013
javaeclipse快捷键
Ctrl+1 快速修复(最经典的快捷键,就不用多说了)Ctrl+D: 删除当前行 Ctrl+Alt+↓ 复制当前行到下一行(复制增加)Ctrl+Alt+↑ 复制当前行到上一行(复制增加)Alt+↓ 当前行和下面一行交互位置(特别实用,可以省去先剪切,再粘贴了)Alt+↑ 当前行和上面一行交互位置(同上)Alt+← 前一个编辑的页面Alt+→ 下一个编辑的页面(当然是针对上面那条来说了)Alt+En
- js 笔记 函数
征客丶
JavaScript
一、函数的使用
1.1、定义函数变量
var vName = funcation(params){
}
1.2、函数的调用
函数变量的调用: vName(params);
函数定义时自发调用:(function(params){})(params);
1.3、函数中变量赋值
var a = 'a';
var ff
- 【Scala四】分析Spark源代码总结的Scala语法二
bit1129
scala
1. Some操作
在下面的代码中,使用了Some操作:if (self.partitioner == Some(partitioner)),那么Some(partitioner)表示什么含义?首先partitioner是方法combineByKey传入的变量,
Some的文档说明:
/** Class `Some[A]` represents existin
- java 匿名内部类
BlueSkator
java匿名内部类
组合优先于继承
Java的匿名类,就是提供了一个快捷方便的手段,令继承关系可以方便地变成组合关系
继承只有一个时候才能用,当你要求子类的实例可以替代父类实例的位置时才可以用继承。
在Java中内部类主要分为成员内部类、局部内部类、匿名内部类、静态内部类。
内部类不是很好理解,但说白了其实也就是一个类中还包含着另外一个类如同一个人是由大脑、肢体、器官等身体结果组成,而内部类相
- 盗版win装在MAC有害发热,苹果的东西不值得买,win应该不用
ljy325
游戏applewindowsXPOS
Mac mini 型号: MC270CH-A RMB:5,688
Apple 对windows的产品支持不好,有以下问题:
1.装完了xp,发现机身很热虽然没有运行任何程序!貌似显卡跑游戏发热一样,按照那样的发热量,那部机子损耗很大,使用寿命受到严重的影响!
2.反观安装了Mac os的展示机,发热量很小,运行了1天温度也没有那么高
&nbs
- 读《研磨设计模式》-代码笔记-生成器模式-Builder
bylijinnan
java设计模式
声明: 本文只为方便我个人查阅和理解,详细的分析以及源代码请移步 原作者的博客http://chjavach.iteye.com/
/**
* 生成器模式的意图在于将一个复杂的构建与其表示相分离,使得同样的构建过程可以创建不同的表示(GoF)
* 个人理解:
* 构建一个复杂的对象,对于创建者(Builder)来说,一是要有数据来源(rawData),二是要返回构
- JIRA与SVN插件安装
chenyu19891124
SVNjira
JIRA安装好后提交代码并要显示在JIRA上,这得需要用SVN的插件才能看见开发人员提交的代码。
1.下载svn与jira插件安装包,解压后在安装包(atlassian-jira-subversion-plugin-0.10.1)
2.解压出来的包里下的lib文件夹下的jar拷贝到(C:\Program Files\Atlassian\JIRA 4.3.4\atlassian-jira\WEB
- 常用数学思想方法
comsci
工作
对于搞工程和技术的朋友来讲,在工作中常常遇到一些实际问题,而采用常规的思维方式无法很好的解决这些问题,那么这个时候我们就需要用数学语言和数学工具,而使用数学工具的前提却是用数学思想的方法来描述问题。。下面转帖几种常用的数学思想方法,仅供学习和参考
函数思想
把某一数学问题用函数表示出来,并且利用函数探究这个问题的一般规律。这是最基本、最常用的数学方法
- pl/sql集合类型
daizj
oracle集合typepl/sql
--集合类型
/*
单行单列的数据,使用标量变量
单行多列数据,使用记录
单列多行数据,使用集合(。。。)
*集合:类似于数组也就是。pl/sql集合类型包括索引表(pl/sql table)、嵌套表(Nested Table)、变长数组(VARRAY)等
*/
/*
--集合方法
&n
- [Ofbiz]ofbiz初用
dinguangx
电商ofbiz
从github下载最新的ofbiz(截止2015-7-13),从源码进行ofbiz的试用
1. 加载测试库
ofbiz内置derby,通过下面的命令初始化测试库
./ant load-demo (与load-seed有一些区别)
2. 启动内置tomcat
./ant start
或
./startofbiz.sh
或
java -jar ofbiz.jar
&
- 结构体中最后一个元素是长度为0的数组
dcj3sjt126com
cgcc
在Linux源代码中,有很多的结构体最后都定义了一个元素个数为0个的数组,如/usr/include/linux/if_pppox.h中有这样一个结构体: struct pppoe_tag { __u16 tag_type; __u16 tag_len; &n
- Linux cp 实现强行覆盖
dcj3sjt126com
linux
发现在Fedora 10 /ubutun 里面用cp -fr src dest,即使加了-f也是不能强行覆盖的,这时怎么回事的呢?一两个文件还好说,就输几个yes吧,但是要是n多文件怎么办,那还不输死人呢?下面提供三种解决办法。 方法一
我们输入alias命令,看看系统给cp起了一个什么别名。
[root@localhost ~]# aliasalias cp=’cp -i’a
- Memcached(一)、HelloWorld
frank1234
memcached
一、简介
高性能的架构离不开缓存,分布式缓存中的佼佼者当属memcached,它通过客户端将不同的key hash到不同的memcached服务器中,而获取的时候也到相同的服务器中获取,由于不需要做集群同步,也就省去了集群间同步的开销和延迟,所以它相对于ehcache等缓存来说能更好的支持分布式应用,具有更强的横向伸缩能力。
二、客户端
选择一个memcached客户端,我这里用的是memc
- Search in Rotated Sorted Array II
hcx2013
search
Follow up for "Search in Rotated Sorted Array":What if duplicates are allowed?
Would this affect the run-time complexity? How and why?
Write a function to determine if a given ta
- Spring4新特性——更好的Java泛型操作API
jinnianshilongnian
spring4generic type
Spring4新特性——泛型限定式依赖注入
Spring4新特性——核心容器的其他改进
Spring4新特性——Web开发的增强
Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC
Spring4新特性——Groovy Bean定义DSL
Spring4新特性——更好的Java泛型操作API
Spring4新
- CentOS安装JDK
liuxingguome
centos
1、行卸载原来的:
[root@localhost opt]# rpm -qa | grep java
tzdata-java-2014g-1.el6.noarch
java-1.7.0-openjdk-1.7.0.65-2.5.1.2.el6_5.x86_64
java-1.6.0-openjdk-1.6.0.0-11.1.13.4.el6.x86_64
[root@localhost
- 二分搜索专题2-在有序二维数组中搜索一个元素
OpenMind
二维数组算法二分搜索
1,设二维数组p的每行每列都按照下标递增的顺序递增。
用数学语言描述如下:p满足
(1),对任意的x1,x2,y,如果x1<x2,则p(x1,y)<p(x2,y);
(2),对任意的x,y1,y2, 如果y1<y2,则p(x,y1)<p(x,y2);
2,问题:
给定满足1的数组p和一个整数k,求是否存在x0,y0使得p(x0,y0)=k?
3,算法分析:
(
- java 随机数 Math与Random
SaraWon
javaMathRandom
今天需要在程序中产生随机数,知道有两种方法可以使用,但是使用Math和Random的区别还不是特别清楚,看到一篇文章是关于的,觉得写的还挺不错的,原文地址是
http://www.oschina.net/question/157182_45274?sort=default&p=1#answers
产生1到10之间的随机数的两种实现方式:
//Math
Math.roun
- oracle创建表空间
tugn
oracle
create temporary tablespace TXSJ_TEMP
tempfile 'E:\Oracle\oradata\TXSJ_TEMP.dbf'
size 32m
autoextend on
next 32m maxsize 2048m
extent m
- 使用Java8实现自己的个性化搜索引擎
yangshangchuan
javasuperword搜索引擎java8全文检索
需要对249本软件著作实现句子级别全文检索,这些著作均为PDF文件,不使用现有的框架如lucene,自己实现的方法如下:
1、从PDF文件中提取文本,这里的重点是如何最大可能地还原文本。提取之后的文本,一个句子一行保存为文本文件。
2、将所有文本文件合并为一个单一的文本文件,这样,每一个句子就有一个唯一行号。
3、对每一行文本进行分词,建立倒排表,倒排表的格式为:词=包含该词的总行数N=行号