第k小整数-洛谷代码区:#include#includeusingnamespacestd;intmain(){intn,k;cin>>n>>k;intarry[n];for(inti=0;i>arry[i];}sort(arry,arry+n);intans=0;for(inti=0;i
gesp(C++六级)(3)洛谷:B3873:[GESP202309 六级] 小杨买饮料
王老师青少年编程
GESP(C++六级)真题题解c++开发语言csp算法数据结构gesp
gesp(C++六级)(3)洛谷:B3873:[GESP202309六级]小杨买饮料题目描述小杨来到了一家商店,打算购买一些饮料。这家商店总共出售NNN种饮料,编号从000至N−1N-1N−1,其中编号为iii的饮料售价cic_ici元,容量lil_ili毫升。小杨的需求有如下几点:小杨想要尽可能尝试不同种类的饮料,因此他希望每种饮料至多购买111瓶;小杨很渴,所以他想要购买总容量不低于LLL的饮
洛谷 B2031:计算三角形面积 ← 叉积
hnjzsyjyj
信息学竞赛#模拟算法与基础语法向量叉积
【题目来源】https://www.luogu.com.cn/problem/B2031【题目描述】平面上有一个三角形,它的三个顶点坐标分别为(x1,y1),(x2,y2),(x3,y3),那么请问这个三角形的面积是多少。【输入格式】输入仅一行,包括6个双精度浮点数,分别对应x1,y1,x2,y2,x3,y3。【输出格式】输出也是一行,输出三角形的面积,精确到小数点后两位。【输入样例】004003
洛谷-P1106-删数问题
信息学奥赛-Mr-H
信息学奥赛-贪心专题算法c++贪心算法
删数问题-洛谷解题思路:1.由题可知,输入一个不超过250位的非负整数,超出了longlong的范围,所以可以利用字符串来输入数字,并利用一个整型的数组从下标1开始来存储最高位到最低位的数字2.首先考虑,在一个n位的整数中去掉k个数字,然后形成新的数字,要求这个数字最小,那么其实就是在n位中选取n-k个数字,并且是按照原来的次序要求这个数最小,那么就可以利用到贪心的思想3.如果这个数最小,那么最高
洛谷 P1106:删数问题 ← 贪心算法
hnjzsyjyj
信息学竞赛#贪心算法贪心算法
【题目来源】https://www.luogu.com.cn/problem/P1106【题目描述】键盘输入一个高精度的正整数n(不超过250位),去掉其中任意k个数字后剩下的数字按原左右次序将组成一个新的非负整数。编程对给定的n和k,寻找一种方案使得剩下的数字组成的新数最小。【输入格式】输入两行正整数。第一行输入一个高精度的正整数n。第二行输入一个正整数k,表示需要删除的数字个数。【输出格式】输
(C++)P1216数字三角形(动态规划)⭐⭐⭐⭐
*TQK*
算法练习c++动态规划
[USACO1.5][IOI1994]数字三角形NumberTriangles-洛谷题目描述观察下面的数字金字塔。写一个程序来查找从最高点到底部任意处结束的路径,使路径经过数字的和最大。每一步可以走到左下方的点也可以到达右下方的点。在上面的样例中,从7→3→8→7→5的路径产生了最大权值。输入格式第一个行一个正整数r,表示行的数目。后面每行为这个数字金字塔特定行包含的整数。输出格式单独的一行,包含
洛谷P1469 找筷子
怀念无所不能的你
洛谷数学1基础数学问题算法数据结构
题目链接:P1469找筷子-洛谷|计算机科学教育新生态题目难度:普及—解题思路:本题我们考虑异或的两个性质:k个相同的数异或当k为奇数时候结果为本身,否则为0;0与任何数异或为该数。注意到上面的题目,求筷子中落单的筷子的长度,根据性质1成双的筷子异或结果为0,如果存在落单的筷子最后肯定是0与该筷子异或得到了该筷子长度。最后上代码:#includeusingnamespacestd;typedefl
【算法笔记】洛谷 - 贪心算法 - P1208 [USACO1.3] 混合牛奶 Mixing Milk
仟濹
算法学习笔记算法笔记贪心算法c++c语言
2024-12-26-第43篇洛谷贪心算法题单-贪心算法-学习笔记作者(Author):郑龙浩/仟濹(CSND账号名)洛谷P1208[USACO1.3]混合牛奶MixingMilk文章目录洛谷P1208[USACO1.3]混合牛奶MixingMilk题目描述输入格式输出格式样例#1样例输入#1样例输出#1提示:思路:代码:题目描述由于乳制品产业利润很低,所以降低原材料(牛奶)价格就变得十分重要。帮
贪心:P1090 合并果子 / [USACO06NOV] Fence Repair G(洛谷)
736我最帅
贪心算法c++贪心算法
本题对c++党来说有个福利STL里的优先队列:priority_queue具体用法参考以下链接:priority_queue本题链接#includeusingnamespacestd;intn,ans=0;priority_queue,greater>q;intmain(){cin>>n;for(inti=1;i>x;q.push(x);}while(q.size()>1){intx=q.top(
P1089 [NOIP2004 提高组] 津津的储蓄计划
沉睡的雄虱
算法c++
目录题目描述输入格式输出格式输入输出样例思路分析:代码实现:总结题目描述P1089[NOIP2004提高组]津津的储蓄计划-洛谷|计算机科学教育新生态津津的零花钱一直都是自己管理。每个月的月初妈妈给津津300300元钱,津津会预算这个月的花销,并且总能做到实际花销和预算的相同。为了让津津学习如何储蓄,妈妈提出,津津可以随时把整百的钱存在她那里,到了年末她会加上20%20%还给津津。因此津津制定了一
【洛谷 P8738】[蓝桥杯 2020 国 C] 天干地支 题解(字符串+数学+模运算)
HEX9CF
AlgorithmProblems蓝桥杯c语言职场和发展
[蓝桥杯2020国C]天干地支题目描述古代中国使用天干地支来记录当前的年份。天干一共有十个,分别为:甲(jiǎ)、乙(yǐ)、丙(bǐng)、丁(dīng)、戊(wù)、己(jǐ)、庚(gēng)、辛(xīn)、壬(rén)、癸(guǐ)。地支一共有十二个,分别为:子(zǐ)、丑(chǒu)、寅(yín)、卯(mǎo)、辰(chén)、巳(sì)、午(wǔ)、未(wèi)、申(shēn)、酉(yǒ
【贪心算法】洛谷P4995 - 跳跳
仟濹
算法学习笔记贪心算法算法
2025-01-21-第44篇【洛谷】贪心算法题单-【贪心算法】-【学习笔记】作者(Author):郑龙浩/仟濹(CSND账号名)目录文章目录目录洛谷P4995跳跳!题目描述输入格式输出格式样例#1样例输入#1样例输出#1样例#2样例输入#2样例输出#2提示样例解释数据范围思路代码洛谷P4995跳跳!题目描述你是一只小跳蛙,你特别擅长在各种地方跳来跳去。这一天,你和朋友小F一起出去玩耍的时候,遇到
P1035 [NOIP2002 普及组] 级数求和
沉睡的雄虱
算法c++
本文主要是分享解决题目的思路题目描述[NOIP2002普及组]级数求和-洛谷已知:Sn=1+12+13+…+1nSn=1+21+31+…+n1。显然对于任意一个整数kk,当nn足够大的时候,Sn>kSn>k。现给出一个整数kk,要求计算出一个最小的nn,使得Sn>kSn>k。输入格式一个正整数kk。输出格式一个正整数nn。输入输出样例输入#1复制1输出#1复制2说明/提示【数据范围】对于100%1
题解:洛谷 P1351 [NOIP2014 提高组] 联合权值
网络骑士hrg.
算法深度优先c++经验分享
题目https://www.luogu.com.cn/problem/P1351我们可以发现,若点对的距离为,则它们一定会经过一个中转点,因此我们考虑枚举中转点,然后枚举与有直接边连接的两个点,按照题意统计答案即可。#includeusingnamespacestd;#pragmaG++optimisze(3,"Ofast","inline")#defineintlonglongconstintm
洛谷B2069求分数序列和
在在在努力鸭
算法(洛谷oj等等)算法c++开发语言
求分数序列和题目描述有一个分数序列q1p1,q2p2,q3p3,q4p4,q5p5,...\dfrac{q_{1}}{p_{1}},\dfrac{q_{2}}{p_{2}},\dfrac{q_{3}}{p_{3}},\dfrac{q_{4}}{p_{4}},\dfrac{q_{5}}{p_{5}},...p1q1,p2q2,p3q3,p4q4,p5q5,...,其中qi+1=qi+pi,pi+1=
洛谷P1127 词链
怀念无所不能的你
洛谷图论算法dfs图论c++数据结构
题目链接:P1127词链-洛谷|计算机科学教育新生态题目描述:如果单词XX的末字母与单词Y的首字母相同,则X与Y可以相连成X.Y。(注意:X、Y之间英文的句号.)。例如,单词dog与单词gopher,则dog与gopher可以相连成dog.gopher。另外还有一些例子:dog.gophergopher.ratrat.tigeraloha.alohaarachnid.dog连接成的词可以与其他单词
【LGR-196-Div.4】洛谷入门赛 #26 题A - H 详细题解--优化思路简洁代码(C++,Python语言描述)
多思考少编码
洛谷入门赛题解算法c++python开发语言
前言:觉得这个比赛很有意思的,都是暴力题,涉及一些细节,难度比较适合刚学编程语言的,可以很好的锻炼基础还有手速,最后两题也是比较有意思,之后也准备更新atc的比赛题解和洛谷的一些高质量比赛题解(算法网瘾就是想参加各种比赛)如果觉得有帮助,或者觉得我写的好,可以点个赞或关注,也可以看看我的一些其他文章,我之后也会更新一些基础算法详细解释比赛链接:【LGR-196-Div.4】洛谷入门赛#26-洛谷|
图论DFS:黑红树
Python_enjoy
C++洛谷题解每周更新栏目深度优先图论算法
我的个人主页{\large\mathsf{{\color{Red}我的个人主页}}}我的个人主页往{\color{Red}{\Huge往}}往期{\color{Green}{\Huge期}}期文{\color{Blue}{\Huge文}}文章{\color{Orange}{\Huge章}}章DFS算法:记忆化搜索DFS算法:全排列问题DFS算法:洛谷B3625迷宫寻路此系列更新频繁,求各位读者点赞
2022.1.10 学习总结
山城有羽
算法c#
今天解出两道洛谷上面的搜索题,分别是“kkksc03考前临时抱佛脚”与“填涂颜色-洛谷”题目:kkksc03考前临时抱佛脚由题目意思可知,该题是要求我们将同一科目的所有“完成习题册”的时间尽可能均衡地分配给左右脑(双核就是强),然后选取各个科目的耗时较多的部分,相加就是正确答案。说起来很简单,就像一道简单的贪心类水题,但实际上需要用到动态规划,主要是解法类似于动态规划里的经典例题“01背包”。(而
洛谷P2392 kkksc03考前临时抱佛脚
Gughost
算法c++
为啥贪心不行!每次哪边用时少就把当前最大值放进去,竟然0分仔细想想很容易找出反例最完美的情况肯定是左右脑所用时间相同,各t(总)/2的时间以此可找出反例:54333用01背包解决,找到最接近t/2的情况intmain(){ints[4],sum=0,t[30],p;for(inti=0;i<4;i
gesp(C++五级)(7)洛谷:B3968:[GESP202403 五级] 成绩排序
王老师青少年编程
GESP(C++四级+五级+六级)真题题解c++开发语言算法数据结构csp信奥赛gesp
gesp(C++五级)(7)洛谷:B3968:[GESP202403五级]成绩排序题目描述有nnn名同学,每名同学有语文、数学、英语三科成绩,你需要按照如下规则对所有同学的成绩从高到低排序:比较总分,高者靠前;如果总分相同,则比较语文和数学两科的总分,高者靠前;如果仍相同,则比较语文和数学两科的最高分,高者靠前;如果仍相同,则二人并列。你需要输出每位同学的排名,如遇xxx人并列,则他们排名相同,并
洛谷P1369 矩形
sjfonv
数论贪心数论贪心
题目描述给出平面上的n个点,请找出一个边与坐标轴平行的矩形,使得它的边界上有尽量多的点输入输出格式输入格式:第一行一个整数n,为平面内点的个数。第2~n+1行每行两个整数,为点的横、纵坐标。输出格式:只有一个数,为所取矩形边界上能包含尽量多的点的个数。输入输出样例输入样例#1:1023927434571510410611446输出样例#1:7说明【数据范围】对于40%的数据,n#include#i
洛谷P1719 最大加权矩形
0hang
算法c++开发语言
洛谷P1719最大加权矩形题目描述为了更好的备战NOIP2013,电脑组的几个女孩子LYQ,ZSC,ZHQ认为,我们不光需要机房,我们还需要运动,于是就决定找校长申请一块电脑组的课余运动场地,听说她们都是电脑组的高手,校长没有马上答应他们,而是先给她们出了一道数学题,并且告诉她们:你们能获得的运动场地的面积就是你们能找到的这个最大的数字。校长先给他们一个n\timesnn×n矩阵。要求矩阵中最大加
apache 安装linux windows
墙头上一根草
apacheinuxwindows
linux安装Apache 有两种方式一种是手动安装通过二进制的文件进行安装,另外一种就是通过yum 安装,此中安装方式,需要物理机联网。以下分别介绍两种的安装方式
通过二进制文件安装Apache需要的软件有apr,apr-util,pcre
1,安装 apr 下载地址:htt
fill_parent、wrap_content和match_parent的区别
Cb123456
match_parentfill_parent
fill_parent、wrap_content和match_parent的区别:
1)fill_parent
设置一个构件的布局为fill_parent将强制性地使构件扩展,以填充布局单元内尽可能多的空间。这跟Windows控件的dockstyle属性大体一致。设置一个顶部布局或控件为fill_parent将强制性让它布满整个屏幕。
2) wrap_conte
网页自适应设计
天子之骄
htmlcss响应式设计页面自适应
网页自适应设计
网页对浏览器窗口的自适应支持变得越来越重要了。自适应响应设计更是异常火爆。再加上移动端的崛起,更是如日中天。以前为了适应不同屏幕分布率和浏览器窗口的扩大和缩小,需要设计几套css样式,用js脚本判断窗口大小,选择加载。结构臃肿,加载负担较大。现笔者经过一定时间的学习,有所心得,故分享于此,加强交流,共同进步。同时希望对大家有所
[sql server] 分组取最大最小常用sql
一炮送你回车库
SQL Server
--分组取最大最小常用sql--测试环境if OBJECT_ID('tb') is not null drop table tb;gocreate table tb( col1 int, col2 int, Fcount int)insert into tbselect 11,20,1 union allselect 11,22,1 union allselect 1
ImageIO写图片输出到硬盘
3213213333332132
javaimage
package awt;
import java.awt.Color;
import java.awt.Font;
import java.awt.Graphics;
import java.awt.image.BufferedImage;
import java.io.File;
import java.io.IOException;
import javax.imagei
自己的String动态数组
宝剑锋梅花香
java动态数组数组
数组还是好说,学过一两门编程语言的就知道,需要注意的是数组声明时需要把大小给它定下来,比如声明一个字符串类型的数组:String str[]=new String[10]; 但是问题就来了,每次都是大小确定的数组,我需要数组大小不固定随时变化怎么办呢? 动态数组就这样应运而生,龙哥给我们讲的是自己用代码写动态数组,并非用的ArrayList 看看字符
pinyin4j工具类
darkranger
.net
pinyin4j工具类Java工具类 2010-04-24 00:47:00 阅读69 评论0 字号:大中小
引入pinyin4j-2.5.0.jar包:
pinyin4j是一个功能强悍的汉语拼音工具包,主要是从汉语获取各种格式和需求的拼音,功能强悍,下面看看如何使用pinyin4j。
本人以前用AscII编码提取工具,效果不理想,现在用pinyin4j简单实现了一个。功能还不是很完美,
StarUML学习笔记----基本概念
aijuans
UML建模
介绍StarUML的基本概念,这些都是有效运用StarUML?所需要的。包括对模型、视图、图、项目、单元、方法、框架、模型块及其差异以及UML轮廓。
模型、视与图(Model, View and Diagram)
&
Activiti最终总结
avords
Activiti id 工作流
1、流程定义ID:ProcessDefinitionId,当定义一个流程就会产生。
2、流程实例ID:ProcessInstanceId,当开始一个具体的流程时就会产生,也就是不同的流程实例ID可能有相同的流程定义ID。
3、TaskId,每一个userTask都会有一个Id这个是存在于流程实例上的。
4、TaskDefinitionKey和(ActivityImpl activityId
从省市区多重级联想到的,react和jquery的差别
bee1314
jqueryUIreact
在我们的前端项目里经常会用到级联的select,比如省市区这样。通常这种级联大多是动态的。比如先加载了省,点击省加载市,点击市加载区。然后数据通常ajax返回。如果没有数据则说明到了叶子节点。 针对这种场景,如果我们使用jquery来实现,要考虑很多的问题,数据部分,以及大量的dom操作。比如这个页面上显示了某个区,这时候我切换省,要把市重新初始化数据,然后区域的部分要从页面
Eclipse快捷键大全
bijian1013
javaeclipse快捷键
Ctrl+1 快速修复(最经典的快捷键,就不用多说了)Ctrl+D: 删除当前行 Ctrl+Alt+↓ 复制当前行到下一行(复制增加)Ctrl+Alt+↑ 复制当前行到上一行(复制增加)Alt+↓ 当前行和下面一行交互位置(特别实用,可以省去先剪切,再粘贴了)Alt+↑ 当前行和上面一行交互位置(同上)Alt+← 前一个编辑的页面Alt+→ 下一个编辑的页面(当然是针对上面那条来说了)Alt+En
js 笔记 函数
征客丶
JavaScript
一、函数的使用
1.1、定义函数变量
var vName = funcation(params){
}
1.2、函数的调用
函数变量的调用: vName(params);
函数定义时自发调用:(function(params){})(params);
1.3、函数中变量赋值
var a = 'a';
var ff
【Scala四】分析Spark源代码总结的Scala语法二
bit1129
scala
1. Some操作
在下面的代码中,使用了Some操作:if (self.partitioner == Some(partitioner)),那么Some(partitioner)表示什么含义?首先partitioner是方法combineByKey传入的变量,
Some的文档说明:
/** Class `Some[A]` represents existin
java 匿名内部类
BlueSkator
java匿名内部类
组合优先于继承
Java的匿名类,就是提供了一个快捷方便的手段,令继承关系可以方便地变成组合关系
继承只有一个时候才能用,当你要求子类的实例可以替代父类实例的位置时才可以用继承。
在Java中内部类主要分为成员内部类、局部内部类、匿名内部类、静态内部类。
内部类不是很好理解,但说白了其实也就是一个类中还包含着另外一个类如同一个人是由大脑、肢体、器官等身体结果组成,而内部类相
盗版win装在MAC有害发热,苹果的东西不值得买,win应该不用
ljy325
游戏applewindowsXPOS
Mac mini 型号: MC270CH-A RMB:5,688
Apple 对windows的产品支持不好,有以下问题:
1.装完了xp,发现机身很热虽然没有运行任何程序!貌似显卡跑游戏发热一样,按照那样的发热量,那部机子损耗很大,使用寿命受到严重的影响!
2.反观安装了Mac os的展示机,发热量很小,运行了1天温度也没有那么高
&nbs
读《研磨设计模式》-代码笔记-生成器模式-Builder
bylijinnan
java设计模式
声明: 本文只为方便我个人查阅和理解,详细的分析以及源代码请移步 原作者的博客http://chjavach.iteye.com/
/**
* 生成器模式的意图在于将一个复杂的构建与其表示相分离,使得同样的构建过程可以创建不同的表示(GoF)
* 个人理解:
* 构建一个复杂的对象,对于创建者(Builder)来说,一是要有数据来源(rawData),二是要返回构
JIRA与SVN插件安装
chenyu19891124
SVNjira
JIRA安装好后提交代码并要显示在JIRA上,这得需要用SVN的插件才能看见开发人员提交的代码。
1.下载svn与jira插件安装包,解压后在安装包(atlassian-jira-subversion-plugin-0.10.1)
2.解压出来的包里下的lib文件夹下的jar拷贝到(C:\Program Files\Atlassian\JIRA 4.3.4\atlassian-jira\WEB
常用数学思想方法
comsci
工作
对于搞工程和技术的朋友来讲,在工作中常常遇到一些实际问题,而采用常规的思维方式无法很好的解决这些问题,那么这个时候我们就需要用数学语言和数学工具,而使用数学工具的前提却是用数学思想的方法来描述问题。。下面转帖几种常用的数学思想方法,仅供学习和参考
函数思想
把某一数学问题用函数表示出来,并且利用函数探究这个问题的一般规律。这是最基本、最常用的数学方法
pl/sql集合类型
daizj
oracle集合typepl/sql
--集合类型
/*
单行单列的数据,使用标量变量
单行多列数据,使用记录
单列多行数据,使用集合(。。。)
*集合:类似于数组也就是。pl/sql集合类型包括索引表(pl/sql table)、嵌套表(Nested Table)、变长数组(VARRAY)等
*/
/*
--集合方法
&n
[Ofbiz]ofbiz初用
dinguangx
电商ofbiz
从github下载最新的ofbiz(截止2015-7-13),从源码进行ofbiz的试用
1. 加载测试库
ofbiz内置derby,通过下面的命令初始化测试库
./ant load-demo (与load-seed有一些区别)
2. 启动内置tomcat
./ant start
或
./startofbiz.sh
或
java -jar ofbiz.jar
&
结构体中最后一个元素是长度为0的数组
dcj3sjt126com
cgcc
在Linux源代码中,有很多的结构体最后都定义了一个元素个数为0个的数组,如/usr/include/linux/if_pppox.h中有这样一个结构体: struct pppoe_tag { __u16 tag_type; __u16 tag_len; &n
Linux cp 实现强行覆盖
dcj3sjt126com
linux
发现在Fedora 10 /ubutun 里面用cp -fr src dest,即使加了-f也是不能强行覆盖的,这时怎么回事的呢?一两个文件还好说,就输几个yes吧,但是要是n多文件怎么办,那还不输死人呢?下面提供三种解决办法。 方法一
我们输入alias命令,看看系统给cp起了一个什么别名。
[root@localhost ~]# aliasalias cp=’cp -i’a
Memcached(一)、HelloWorld
frank1234
memcached
一、简介
高性能的架构离不开缓存,分布式缓存中的佼佼者当属memcached,它通过客户端将不同的key hash到不同的memcached服务器中,而获取的时候也到相同的服务器中获取,由于不需要做集群同步,也就省去了集群间同步的开销和延迟,所以它相对于ehcache等缓存来说能更好的支持分布式应用,具有更强的横向伸缩能力。
二、客户端
选择一个memcached客户端,我这里用的是memc
Search in Rotated Sorted Array II
hcx2013
search
Follow up for "Search in Rotated Sorted Array":What if duplicates are allowed?
Would this affect the run-time complexity? How and why?
Write a function to determine if a given ta
Spring4新特性——更好的Java泛型操作API
jinnianshilongnian
spring4generic type
Spring4新特性——泛型限定式依赖注入
Spring4新特性——核心容器的其他改进
Spring4新特性——Web开发的增强
Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC
Spring4新特性——Groovy Bean定义DSL
Spring4新特性——更好的Java泛型操作API
Spring4新
CentOS安装JDK
liuxingguome
centos
1、行卸载原来的:
[root@localhost opt]# rpm -qa | grep java
tzdata-java-2014g-1.el6.noarch
java-1.7.0-openjdk-1.7.0.65-2.5.1.2.el6_5.x86_64
java-1.6.0-openjdk-1.6.0.0-11.1.13.4.el6.x86_64
[root@localhost
二分搜索专题2-在有序二维数组中搜索一个元素
OpenMind
二维数组算法二分搜索
1,设二维数组p的每行每列都按照下标递增的顺序递增。
用数学语言描述如下:p满足
(1),对任意的x1,x2,y,如果x1<x2,则p(x1,y)<p(x2,y);
(2),对任意的x,y1,y2, 如果y1<y2,则p(x,y1)<p(x,y2);
2,问题:
给定满足1的数组p和一个整数k,求是否存在x0,y0使得p(x0,y0)=k?
3,算法分析:
(
java 随机数 Math与Random
SaraWon
javaMathRandom
今天需要在程序中产生随机数,知道有两种方法可以使用,但是使用Math和Random的区别还不是特别清楚,看到一篇文章是关于的,觉得写的还挺不错的,原文地址是
http://www.oschina.net/question/157182_45274?sort=default&p=1#answers
产生1到10之间的随机数的两种实现方式:
//Math
Math.roun
oracle创建表空间
tugn
oracle
create temporary tablespace TXSJ_TEMP
tempfile 'E:\Oracle\oradata\TXSJ_TEMP.dbf'
size 32m
autoextend on
next 32m maxsize 2048m
extent m
使用Java8实现自己的个性化搜索引擎
yangshangchuan
javasuperword搜索引擎java8全文检索
需要对249本软件著作实现句子级别全文检索,这些著作均为PDF文件,不使用现有的框架如lucene,自己实现的方法如下:
1、从PDF文件中提取文本,这里的重点是如何最大可能地还原文本。提取之后的文本,一个句子一行保存为文本文件。
2、将所有文本文件合并为一个单一的文本文件,这样,每一个句子就有一个唯一行号。
3、对每一行文本进行分词,建立倒排表,倒排表的格式为:词=包含该词的总行数N=行号