- linux二进制包安装svn,linux 安装svn(subversion二进制tar包)
小丑逼
linux二进制包安装svn
#下载subversion安装包,地址:http://subversion.apache.org/download.cgi,我这里是subversion-1.9.7.tar.gz#cd进入你想安装的目录,rz命令上传至服务器tar-xzvfsubversion-1.9.7.tar.gzcdsubversion-1.9.7./configure--prefix=/usr/local/subversi
- IDM下载软件:加速下载体验
虫语者
开源软件
在互联网时代,下载速度和管理效率对用户体验至关重要。InternetDownloadManager(IDM)是一款广受欢迎的下载管理工具,它以其卓越的性能和丰富的功能赢得了全球用户的青睐。本文将深入探讨IDM下载软件的特点、优势以及使用方法。IDM的核心功能下载加速:IDM通过动态文件分割和多线程下载技术,显著提升下载速度。它能够将一个文件分成多个部分并同时下载,从而最大限度地利用带宽资源。断点续
- MySQL 可视化工具
2301_78094384
工具mysql
navicat优点:使用广泛,老牌软件,功能强大缺点:收费HeidiSQL免费,有免安装版本DownloadHeidiSQL//portable:便携式的下载后解压,双击运行左下角新建,然后输入配置,连接就可以使用了
- python与mysql的交互(一)
xiaoking32
Pythonpython
python与mysql的交互(一)在mac上装mysqlpython操作mysql的步骤解析sql注入什么是sql注入?怎么防止?在mac上装mysql下载mysqlformac:https://dev.mysql.com/downloads/mysql/解压dmg文件,点击pkg文件进行安装Continue->Continue,Agree->Install->输入管理员密码->设置root用户
- GaussDB
lanlingxueyu
数据库gaussdb
HCIA-GaussDB思维导图https://download.csdn.net/download/lanlingxueyu/88797517数据库介绍数据库技术概述数据库技术数据Data记录Record数据库DatabaseDB数据库是存放数据的仓库,是大量数据的集合。存放在数据库中数据的特点永久存储有组织可共享数据库管理系统DBMS数据库管理系统是一个能够科学地组织和存储数据,高效地获
- Linux离线安装docker(arm64架构cpu)极速版
gallonyin
linuxdocker架构
之前写过x86版本的快速docker安装部署,现在遇到arm64等架构cpu不适用,主要是因为安装包不通用,因此有这篇文章。cpu测试可以支持鲲鹏cpu或interlarm版本离线安装docker,10分钟极速搞定!亲测适用于CentOS8及其衍生版本。官网下载从官网中选择相应的版本,我选择了最新的包,在联网的环境下载到本地备用https://download.docker.com/linux/s
- pythonnumpy库离线安装_linux Python2.7 离线安装pip、numpy、scipy、sklearn等
weixin_39974932
服务器是离线的,只能离线安装安装pip1.先安装setuptools下载地址:https://pypi.python.org/pypi/setuptools#downloads将下载后的文件解压,进入到解压后的文件所在的目录执行命令:pythonsetup.pyinstall2安装pip下载地址:https://pypi.python.org/pypi/pip#downloads将下载后的文件解压
- docker-compose安装使用
redstone618
容器化部署docker运维linux
1、下载docker-compose链接:https://pan.baidu.com/s/1Mp0bgcgumncl_bPsg-KVYA?pwd=9q3z提取码:9q3z也可以去github上搜索docker-compose下载下载路径:https://github.com/docker/compose/releases/download/1.24.1/docker-compose-Linux-x
- reac 后端接口返回二进制文件流前端导出文件
初遇你时动了情
前端
axios配置在你的请求中加入responseType:'blob'导出函数exportinterfaceDownloadFileOptions{filename:string;//文件名称}/***下载二进制文件流*@paramdata-二进制数据*@paramoptions-下载配置*/exportconstdownloadBinaryFile1=(data:any,//这里使用any是因为后
- Centos7.9 离线安装docker
有谁看见我的剑了?
dockerdocker容器运维
实验环境:[root@192~]#cat/etc/system-releaseCentOSLinuxrelease7.9.2009(Core)下载二进制压缩包a.官网下载地址:https://download.docker.com/linux/static/stable/x86_64/b.阿里云下载地址https://mirrors.aliyun.com/docker-ce/linux/stati
- 2006-2020年 区域经济高质量发展-共享发展指数原始数据及测算
小王毕业啦
大数据大数据人工智能社科数据数据分析数据挖掘毕业论文深度学习
中国区域经济高质量发展-共享发展指数原始数据及测算2006-2020年.z.ziphttps://download.csdn.net/download/2401_84585615/89919914中国区域经济高质量发展-共享发展指数原始数据及测算2006-2020年中国区域经济高质量发展是国家经济发展战略的重要组成部分,旨在通过优化资源配置、提升创新能力、促进产业升级等措施,实现区域经济的可持续发
- frp配置实现内网穿透(阿里云linux服务器[公网]+内网windows)
object_admin
centos
Frp配置实现内网穿透一、下载linux和windows环境的安装包注意:server和目标主机下载的frp要同一个版本GitHub下载地址:https://github.com/fatedier/frp/releases可到我的CSDN的下载地址,方便访问不到GitHub的用户下载:https://download.csdn.net/download/object_admin/85170961[
- python 手动安装第三方库
xiongerbuer
pythonpython库
1.下载对应操作系统的安装包,如lxml包官网有下载,网上也有很多下载地址2.安装wheelpipinstallwheel3.安装lxmlpipinstallF:\Downloads\lxml-3.6.0-cp35-cp35m-win32.whl
- python使用pyzbar报错filenotfounderror: could not find module ‘libiconv.dll‘
susu1083018911
python
查了好久的问题,也不知道为什么。记录一下解决办法:libiconv.dll需要安装动态连接库,下载地址:https://download.microsoft.com/download/F/3/5/F3500770-8A08-488E-94B6-17A1E1DD526F/vcredist_x64.exe下载完以后双击安装,安装好就没有问题了。
- 深度学习(1)
浅忆へ梦微凉
深度学习人工智能深度学习学习方法python
一、torch的安装基于直接设备情况,选择合适的torch版本,有显卡的建议安装GPU版本,可以通过nvidia-smi命令来查看显卡驱动的版本,在官网中根据cuda版本,选择合适的版本号,下面是安装示例代码GPU:pipinstalltorch==2.5.0torchvision==0.20.0torchaudio==2.5.0--index-urlhttps://download.pytorc
- uniapp(小程序、app、微信公众号、H5)预览下载文件(pdf)
会说法语的猪
前端uniappuni-app小程序微信
1.小程序、app在uniapp开发小程序环境或者app环境中,都可以使用以下方式预览文件之前其实写过一篇,就是使用uniapp官网提供文件下载、文件保存、文件打开的API,uniapp文件下载感兴趣也可以去看下uni.downloadFile({//baseURL是
- mac系统如何下载和安装 IntelliJ IDEA
布朗克168
工具软件下载合集经验分享intellij-ideamacos
文章目录一、下载IntelliJIDEA二、安装IntelliJIDEA三、配置IntelliJIDEA四、激活IntelliJIDEA一、下载IntelliJIDEA打开浏览器,访问IntelliJIDEA官方网站:https://www.jetbrains.com/idea/。点击页面上的“Download”按钮,进入下载页面。在下载页面中,你可以看到有两个版本可供选择:Ultimate版和C
- -bash: ./imxdownload: cannot execute binary file: Executable file format error(可执行文件格式错误)
蓝天澈水
Linuxbashlinux开发语言经验分享arm
这可能是因为可执行文件不符合当前主机架构,因此需要在当前主机上再次编译生成可执行文件。1.复制把源代码文件复制到当前主机2.编译sudogccimxdownload.c-oimxdownload3.尝试将以上生成的可执行文件复制到.bin所在的文件夹。赋予权限下载到SD卡。$:sudochmod777imxdownloa$:./imxdownloadu-boot.bin/dev/sdbI.MX6U
- ubuntu 22.04(arm64)环境安装zabbix6.4.4
gaodi2002
ubuntulinux运维服务器
参考https://www.zabbix.com/download?zabbix=6.0&os_distribution=ubuntu_arm64&os_version=22.04&components=server_frontend_agent&db=mysql&ws=apache在arm环境需要部署zabbix6,尝试过centos7编译、centos8编译、docker部署,都不是想要的结果
- 安装 Erlang:一步步教你安装和配置 Erlang 环境
AzProcessgroup
erlangc#开发语言
Erlang是一种功能强大的编程语言和运行时环境,特别适用于构建高可靠性、并发性和分布式性能的应用程序。在本文中,我将为您提供安装和配置Erlang环境的详细步骤。步骤1:下载Erlang安装包首先,让我们从Erlang官方网站下载适用于您的操作系统的最新版本的Erlang安装包。您可以在https://www.erlang.org/downloads找到可用的安装包。选择与您的操作系统和体系结构
- 2021年中国全国最新最全路网shp矢量数据含城市道路、高速、省道、县道、乡道+含各级道路网
鸿业远图科技
地理信息数据库
中国矢量路网arcgis数据shp格式2021年,全部道路,里面字段可以区分道路类型,高速,铁路,小路等等。下载地址https://download.csdn.net/download/zhongguonanren99/19849464
- selenium 各浏览器,各驱动,pycharm源地址
一个测试开发人员的纪录
seleniumpython测试工具
python官网下载地址:https://www.python.org/downloads/windows/安装seleminum之前必须先安装python浏览器和驱动下载地址:Chrome各个版本下载地址GoogleChrome64bitWindows版_chrome浏览器,chrome插件,谷歌浏览器下载,谈笑有鸿儒Chromedriver各个版本下载地址
- javascript document例子
飞行codes
python的荒野javascript前端
document对象是JavaScript中非常核心的对象之一,它是DOM(DocumentObjectModel)的一部分,提供了丰富的属性和方法用于操作网页上的元素和内容。和文件相关操作,比如上传下载等。下载文件例如image.png:functiondownloadImage(){varlink=document.createElement('a');link.href="{{url_for
- debian12实践-安装docker
Nobita Chen
dockereureka容器
参考:https://linuxiac.com/how-to-install-docker-on-debian-12-bookworm/step1sudoaptupdatesudoaptinstallapt-transport-httpsca-certificatescurlgnupgstep2:这一步多尝试两次,避免网络原因下载失败curl-fsSLhttps://download.docker
- Nmap使用总结
黑客KKKing
网络工程师网络安全网络web安全安全
0X00背景nmap是测试中常用的网络探测工具,但是这回简单的操作,一直了解不深入,现在深入的了解和学习一下。在文章结构上,我把平时常用的内容提前了,以便再次查阅的时候,比较方便。0X01安装nmap可以到DownloadtheFreeNmapSecurityScannerforLinux/Mac/Windows下载最新版本(目前最新版本nmap-7.70)0X02实例部分实例下面给出一些实例,简
- 1998-2021年 全国各省居民消费价格指数CPI统计数据
小王毕业啦
大数据大数据人工智能社科数据数据分析数据挖掘深度学习毕业论文
全国各省居民消费价格指数CPI统计数据1998-2021年.z.ziphttps://download.csdn.net/download/2401_84585615/89919909https://download.csdn.net/download/2401_84585615/89919909居民消费价格指数(CPI)是衡量一国居民在一定时期内所消费的商品和服务价格水平变动情况的重要经济指标。
- iterm2文件上传下载
@卷卷
工具的安装及环境配置windowsterminal
安装iterm2https://iterm2.com/downloads.html安装homebrewhttps://docs.brew.sh/Installation1、官网安装,很慢/bin/bash-c"$(curl-fsSLhttps://raw.githubusercontent.com/Homebrew/install/master/install.sh)"2、国内镜像安装/bin/z
- macOS 安装tomcat9
吹泡泡的派大星
macos
macOS安装tomcat9URL:https://tomcat.apache.org/download-90.cgi解压之后放到指定目录/Users/lanren/install/tomcat-9自己取个名字就行给权限:①先进行权限修改:终端输入sudochmod755/Users/lanren/install/tomcat-9/bin/*.sh,接下来提示输入电脑密码:xx②进入bin目录:c
- iOS 集成 ijkplayer k0.11.9 过程
ijkplayerk0.11.9适用于iOS、tvOS、macOS三大平台,据说还会支持安卓平台。下面介绍三种常用的集成ijkplayer的方式:CocoaPods集成可通过CocoaPods快速集成到工程,方便快捷:pod"IJKMediaPlayerKit",:podspec=>'https://github.com/debugly/ijkplayer/releases/download/k0
- linux安装oracl19c
安装OracleDatabase19c(以下简称Oracle19c)在Linux系统上的详细步骤如下。每一步都经过专业分析,确保安装过程顺利且高效。️1.下载安装包首先,从Oracle官方网站下载OracleDatabase19c的安装包。确保选择与您的Linux发行版和系统架构相匹配的版本。#示例命令(实际下载需通过浏览器或Oracle工具进行)wgethttps://download.orac
- apache 安装linux windows
墙头上一根草
apacheinuxwindows
linux安装Apache 有两种方式一种是手动安装通过二进制的文件进行安装,另外一种就是通过yum 安装,此中安装方式,需要物理机联网。以下分别介绍两种的安装方式
通过二进制文件安装Apache需要的软件有apr,apr-util,pcre
1,安装 apr 下载地址:htt
- fill_parent、wrap_content和match_parent的区别
Cb123456
match_parentfill_parent
fill_parent、wrap_content和match_parent的区别:
1)fill_parent
设置一个构件的布局为fill_parent将强制性地使构件扩展,以填充布局单元内尽可能多的空间。这跟Windows控件的dockstyle属性大体一致。设置一个顶部布局或控件为fill_parent将强制性让它布满整个屏幕。
2) wrap_conte
- 网页自适应设计
天子之骄
htmlcss响应式设计页面自适应
网页自适应设计
网页对浏览器窗口的自适应支持变得越来越重要了。自适应响应设计更是异常火爆。再加上移动端的崛起,更是如日中天。以前为了适应不同屏幕分布率和浏览器窗口的扩大和缩小,需要设计几套css样式,用js脚本判断窗口大小,选择加载。结构臃肿,加载负担较大。现笔者经过一定时间的学习,有所心得,故分享于此,加强交流,共同进步。同时希望对大家有所
- [sql server] 分组取最大最小常用sql
一炮送你回车库
SQL Server
--分组取最大最小常用sql--测试环境if OBJECT_ID('tb') is not null drop table tb;gocreate table tb( col1 int, col2 int, Fcount int)insert into tbselect 11,20,1 union allselect 11,22,1 union allselect 1
- ImageIO写图片输出到硬盘
3213213333332132
javaimage
package awt;
import java.awt.Color;
import java.awt.Font;
import java.awt.Graphics;
import java.awt.image.BufferedImage;
import java.io.File;
import java.io.IOException;
import javax.imagei
- 自己的String动态数组
宝剑锋梅花香
java动态数组数组
数组还是好说,学过一两门编程语言的就知道,需要注意的是数组声明时需要把大小给它定下来,比如声明一个字符串类型的数组:String str[]=new String[10]; 但是问题就来了,每次都是大小确定的数组,我需要数组大小不固定随时变化怎么办呢? 动态数组就这样应运而生,龙哥给我们讲的是自己用代码写动态数组,并非用的ArrayList 看看字符
- pinyin4j工具类
darkranger
.net
pinyin4j工具类Java工具类 2010-04-24 00:47:00 阅读69 评论0 字号:大中小
引入pinyin4j-2.5.0.jar包:
pinyin4j是一个功能强悍的汉语拼音工具包,主要是从汉语获取各种格式和需求的拼音,功能强悍,下面看看如何使用pinyin4j。
本人以前用AscII编码提取工具,效果不理想,现在用pinyin4j简单实现了一个。功能还不是很完美,
- StarUML学习笔记----基本概念
aijuans
UML建模
介绍StarUML的基本概念,这些都是有效运用StarUML?所需要的。包括对模型、视图、图、项目、单元、方法、框架、模型块及其差异以及UML轮廓。
模型、视与图(Model, View and Diagram)
&
- Activiti最终总结
avords
Activiti id 工作流
1、流程定义ID:ProcessDefinitionId,当定义一个流程就会产生。
2、流程实例ID:ProcessInstanceId,当开始一个具体的流程时就会产生,也就是不同的流程实例ID可能有相同的流程定义ID。
3、TaskId,每一个userTask都会有一个Id这个是存在于流程实例上的。
4、TaskDefinitionKey和(ActivityImpl activityId
- 从省市区多重级联想到的,react和jquery的差别
bee1314
jqueryUIreact
在我们的前端项目里经常会用到级联的select,比如省市区这样。通常这种级联大多是动态的。比如先加载了省,点击省加载市,点击市加载区。然后数据通常ajax返回。如果没有数据则说明到了叶子节点。 针对这种场景,如果我们使用jquery来实现,要考虑很多的问题,数据部分,以及大量的dom操作。比如这个页面上显示了某个区,这时候我切换省,要把市重新初始化数据,然后区域的部分要从页面
- Eclipse快捷键大全
bijian1013
javaeclipse快捷键
Ctrl+1 快速修复(最经典的快捷键,就不用多说了)Ctrl+D: 删除当前行 Ctrl+Alt+↓ 复制当前行到下一行(复制增加)Ctrl+Alt+↑ 复制当前行到上一行(复制增加)Alt+↓ 当前行和下面一行交互位置(特别实用,可以省去先剪切,再粘贴了)Alt+↑ 当前行和上面一行交互位置(同上)Alt+← 前一个编辑的页面Alt+→ 下一个编辑的页面(当然是针对上面那条来说了)Alt+En
- js 笔记 函数
征客丶
JavaScript
一、函数的使用
1.1、定义函数变量
var vName = funcation(params){
}
1.2、函数的调用
函数变量的调用: vName(params);
函数定义时自发调用:(function(params){})(params);
1.3、函数中变量赋值
var a = 'a';
var ff
- 【Scala四】分析Spark源代码总结的Scala语法二
bit1129
scala
1. Some操作
在下面的代码中,使用了Some操作:if (self.partitioner == Some(partitioner)),那么Some(partitioner)表示什么含义?首先partitioner是方法combineByKey传入的变量,
Some的文档说明:
/** Class `Some[A]` represents existin
- java 匿名内部类
BlueSkator
java匿名内部类
组合优先于继承
Java的匿名类,就是提供了一个快捷方便的手段,令继承关系可以方便地变成组合关系
继承只有一个时候才能用,当你要求子类的实例可以替代父类实例的位置时才可以用继承。
在Java中内部类主要分为成员内部类、局部内部类、匿名内部类、静态内部类。
内部类不是很好理解,但说白了其实也就是一个类中还包含着另外一个类如同一个人是由大脑、肢体、器官等身体结果组成,而内部类相
- 盗版win装在MAC有害发热,苹果的东西不值得买,win应该不用
ljy325
游戏applewindowsXPOS
Mac mini 型号: MC270CH-A RMB:5,688
Apple 对windows的产品支持不好,有以下问题:
1.装完了xp,发现机身很热虽然没有运行任何程序!貌似显卡跑游戏发热一样,按照那样的发热量,那部机子损耗很大,使用寿命受到严重的影响!
2.反观安装了Mac os的展示机,发热量很小,运行了1天温度也没有那么高
&nbs
- 读《研磨设计模式》-代码笔记-生成器模式-Builder
bylijinnan
java设计模式
声明: 本文只为方便我个人查阅和理解,详细的分析以及源代码请移步 原作者的博客http://chjavach.iteye.com/
/**
* 生成器模式的意图在于将一个复杂的构建与其表示相分离,使得同样的构建过程可以创建不同的表示(GoF)
* 个人理解:
* 构建一个复杂的对象,对于创建者(Builder)来说,一是要有数据来源(rawData),二是要返回构
- JIRA与SVN插件安装
chenyu19891124
SVNjira
JIRA安装好后提交代码并要显示在JIRA上,这得需要用SVN的插件才能看见开发人员提交的代码。
1.下载svn与jira插件安装包,解压后在安装包(atlassian-jira-subversion-plugin-0.10.1)
2.解压出来的包里下的lib文件夹下的jar拷贝到(C:\Program Files\Atlassian\JIRA 4.3.4\atlassian-jira\WEB
- 常用数学思想方法
comsci
工作
对于搞工程和技术的朋友来讲,在工作中常常遇到一些实际问题,而采用常规的思维方式无法很好的解决这些问题,那么这个时候我们就需要用数学语言和数学工具,而使用数学工具的前提却是用数学思想的方法来描述问题。。下面转帖几种常用的数学思想方法,仅供学习和参考
函数思想
把某一数学问题用函数表示出来,并且利用函数探究这个问题的一般规律。这是最基本、最常用的数学方法
- pl/sql集合类型
daizj
oracle集合typepl/sql
--集合类型
/*
单行单列的数据,使用标量变量
单行多列数据,使用记录
单列多行数据,使用集合(。。。)
*集合:类似于数组也就是。pl/sql集合类型包括索引表(pl/sql table)、嵌套表(Nested Table)、变长数组(VARRAY)等
*/
/*
--集合方法
&n
- [Ofbiz]ofbiz初用
dinguangx
电商ofbiz
从github下载最新的ofbiz(截止2015-7-13),从源码进行ofbiz的试用
1. 加载测试库
ofbiz内置derby,通过下面的命令初始化测试库
./ant load-demo (与load-seed有一些区别)
2. 启动内置tomcat
./ant start
或
./startofbiz.sh
或
java -jar ofbiz.jar
&
- 结构体中最后一个元素是长度为0的数组
dcj3sjt126com
cgcc
在Linux源代码中,有很多的结构体最后都定义了一个元素个数为0个的数组,如/usr/include/linux/if_pppox.h中有这样一个结构体: struct pppoe_tag { __u16 tag_type; __u16 tag_len; &n
- Linux cp 实现强行覆盖
dcj3sjt126com
linux
发现在Fedora 10 /ubutun 里面用cp -fr src dest,即使加了-f也是不能强行覆盖的,这时怎么回事的呢?一两个文件还好说,就输几个yes吧,但是要是n多文件怎么办,那还不输死人呢?下面提供三种解决办法。 方法一
我们输入alias命令,看看系统给cp起了一个什么别名。
[root@localhost ~]# aliasalias cp=’cp -i’a
- Memcached(一)、HelloWorld
frank1234
memcached
一、简介
高性能的架构离不开缓存,分布式缓存中的佼佼者当属memcached,它通过客户端将不同的key hash到不同的memcached服务器中,而获取的时候也到相同的服务器中获取,由于不需要做集群同步,也就省去了集群间同步的开销和延迟,所以它相对于ehcache等缓存来说能更好的支持分布式应用,具有更强的横向伸缩能力。
二、客户端
选择一个memcached客户端,我这里用的是memc
- Search in Rotated Sorted Array II
hcx2013
search
Follow up for "Search in Rotated Sorted Array":What if duplicates are allowed?
Would this affect the run-time complexity? How and why?
Write a function to determine if a given ta
- Spring4新特性——更好的Java泛型操作API
jinnianshilongnian
spring4generic type
Spring4新特性——泛型限定式依赖注入
Spring4新特性——核心容器的其他改进
Spring4新特性——Web开发的增强
Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC
Spring4新特性——Groovy Bean定义DSL
Spring4新特性——更好的Java泛型操作API
Spring4新
- CentOS安装JDK
liuxingguome
centos
1、行卸载原来的:
[root@localhost opt]# rpm -qa | grep java
tzdata-java-2014g-1.el6.noarch
java-1.7.0-openjdk-1.7.0.65-2.5.1.2.el6_5.x86_64
java-1.6.0-openjdk-1.6.0.0-11.1.13.4.el6.x86_64
[root@localhost
- 二分搜索专题2-在有序二维数组中搜索一个元素
OpenMind
二维数组算法二分搜索
1,设二维数组p的每行每列都按照下标递增的顺序递增。
用数学语言描述如下:p满足
(1),对任意的x1,x2,y,如果x1<x2,则p(x1,y)<p(x2,y);
(2),对任意的x,y1,y2, 如果y1<y2,则p(x,y1)<p(x,y2);
2,问题:
给定满足1的数组p和一个整数k,求是否存在x0,y0使得p(x0,y0)=k?
3,算法分析:
(
- java 随机数 Math与Random
SaraWon
javaMathRandom
今天需要在程序中产生随机数,知道有两种方法可以使用,但是使用Math和Random的区别还不是特别清楚,看到一篇文章是关于的,觉得写的还挺不错的,原文地址是
http://www.oschina.net/question/157182_45274?sort=default&p=1#answers
产生1到10之间的随机数的两种实现方式:
//Math
Math.roun
- oracle创建表空间
tugn
oracle
create temporary tablespace TXSJ_TEMP
tempfile 'E:\Oracle\oradata\TXSJ_TEMP.dbf'
size 32m
autoextend on
next 32m maxsize 2048m
extent m
- 使用Java8实现自己的个性化搜索引擎
yangshangchuan
javasuperword搜索引擎java8全文检索
需要对249本软件著作实现句子级别全文检索,这些著作均为PDF文件,不使用现有的框架如lucene,自己实现的方法如下:
1、从PDF文件中提取文本,这里的重点是如何最大可能地还原文本。提取之后的文本,一个句子一行保存为文本文件。
2、将所有文本文件合并为一个单一的文本文件,这样,每一个句子就有一个唯一行号。
3、对每一行文本进行分词,建立倒排表,倒排表的格式为:词=包含该词的总行数N=行号