hadoop单机模式和伪分布式模式安装过程

python -ssh学习大胖丫 python
defexe_sshcmd(ip,username,userpswd,port,cmd):"""功能：SSH登录到指定设备，并执行对应的命令入参：前四项为ssh登录shell的ip和port，具备管理员权限的用户名和密码，cmd可以是单条命令，也可以是命令列表返回：每次命令执行结果列表，标准输出结果，不包含错误输出Examples:|ExeSshcmd|ip|name|pswd|cmd|"""tr
Flink K8s Application任务的使用老哥哥-老刘 flink
FlinkK8sApplication任务的使用FlinkK8sApplication任务的使用构键k8s集群提供flink运行任务的环境下载flink客户端任务编程任务jar生成过程k8sApplication运行Application模式架构启动命令PodTemplateFlinkK8sApplication任务的使用构键k8s集群在这里，我们需要搭建一个K8S环境用于提供flink任务的运行
Android存储（读取）之SD卡 2501_90225911 android
packagecom.github.c.ceshi;importandroid.content.Context;importandroid.os.Environment;importandroid.widget.Toast;importjava.io.BufferedReader;importjava.io.File;importjava.io.FileInputStream;importjava
Gradio全解系列——Interface：高级抽象界面类（下）龙焰智能 Gradio全解教程 Gradio Interface components Accordion streaming Examples State
Gradio全解系列——Interface：高级抽象界面类（下）前言本篇摘要9.Interface：高级抽象界面类9.2基础类实践9.2.1.不同数量输入输出组件的演示1.Standard演示2.Output-only演示3.Input-only演示4.Unified整合演示9.2.2组件属性1.外观行为类属性2.信息类属性9.2.3Interface类的描述性参数9.2.4使用Accordion
Python3小白基础入门 | 学习笔记查理养殖场编程语言笔记学习笔记 python
一、输入输出1、读入字符串str=input()print(str)2、读入整数数字a=int(input())print(a)print(type(a))#type()输出变量类型3、格式化输出+直接拼接：name="Lihua"age=24print("Hello"+name+",youare"+str(age)+"yearsold")%：name="Lihua"age=24print("He
linux常用基础命令_最新版脚大江山稳 linux
常用命令查看当前目录下个各个文件大小查看当前系统储存使用情况查看当前路径删除当前目录下所有包含".log"的文件linux开机启动jar更改自动配置文件后操作关闭自启动linux静默启动java服务查询端口被占用查看软件版本重启关机开机启动取别名清空当前行创建文件touch创建文件夹查找文件/文件名/大小查找查看文件内容cat/more删除文件或文件夹管道符|过滤grep命令echo命令输出内容重
Git指令的研究霹雳龙 git linux
Git指令的研究文章目录Git指令的研究前言一、ssh密钥1.创建ssh密钥2.读取密钥3.测试二、将项目推送到远程仓库1.初始化git仓库2.将文件送入暂存区3.提交文件4.查看状态5.上传至远程仓库三、Git的一些其他指令总结前言本文将简单介绍git的一些简单命令，以及如何把你的项目推送到远程服务器一、ssh密钥本文介绍的将本地项目推送到远程服务器所采用的方式是SSH且本文默认你已经拥有了一个
STM32之按键检测最爱是生活 stm32 嵌入式硬件单片机
KEY是按键，接PE2口，LED灯，接PC0口，使用STMF103ZET6，则用按键控制小灯亮灭的标准库程序如下：#include"led.h"//Deviceheader#include"key.h"#include"SysTick.h"intmain(){SysTick_Init(72);Led_Init();Key_Init();while(1){if(GPIO_ReadInputDataB
keil显示No Browse information available的解决办法最爱是生活 stm32 嵌入式硬件
keil5经常出现进不去库文件定义的情况，解决办法是进魔术棒，把output下面的Brrowseinfomation勾选，再编译一下
org.apache.commons.jar包官方免费版（附下载地址）王的博客开发
官方免费下载链接：http://commons.apache.org/proper/commons-io/download_io.cgi亲测可用，如上所示。
统计用户输入 C语言 2501_90645732 c语言
从键盘读取用户输入直到遇到#字符，编写程序统计读取的空格数目、读取的换行符数目以及读取的所有其他字符数目。(要求用getchar()输入字符)#includeintmain(){printf("Pleaseinputastringendby#:\n");intc;intspaces=0;intnewlines=0;intother=0;while((c=getchar())!='#'){if(c=
JDBC Java连接数据库 nqqcat~ java idea
1.准备下载jar——QQ群mysql-connect-java新建工程及目录添加驱动：把jar包添加到项目中，并添加到类库新建数据库新建表2.编写代码目标：创建链接打通连接四个参数驱动；URL；用户名；密码五个步骤加载驱动；创建连接；创建Statement；执行SQL；关闭，释放资源packagecom.wdzl.demo01;importjava.sql.Connection;importja
Vue打包（webpack）缓存歌歌的前端学习之路 vue.js webpack 前端
解决方法：1、修改vue.config.js文件constTimestamp=newDate().getTime();module.exports=defineConfig({configureWebpack{output:{filename:`[name].${Timestamp}.js`,chunkFilename:`[name].${Timestamp}.js`},},css:{extrac
多台服务器jenkins+自建gitlab+docker搭建项目自动化部署
一、场景：公司有三台服务器，一台是测试服务器，一台是正式服务器，还有一台是内部服务器。测试服务器就是公司研发用来调试的服务器，正式服务器是生产环境的服务器，内部服务区是用来部署公司gitlab、jenkins、api接口文档等服务。目前想通过内部服务器部署jenkins+docker实现自动化部署功能，要想实现不同服务器的互通，最好通过配对的ssh公钥和秘钥实现，既不用输入密码也能保证服务的安全。
数组的相关概念2 陈体苗 conclusion c++学习方法
1.一维数组的动态分配和内存释放#includeusingnamespacestd;intmain(){cout>sizeofarray;//inputvaliditycheckif(sizeofarray>arr1[i];}coutusingnamespacestd;intmain(){cout>row>>col;//validationif(row<=0||col<=0){cout<<"Dim
10个简单、有趣且适合初学者的Python编程实例！！ shuaige_shiwoa python+AI python 开发语言
好的！以下是10个简单、有趣且适合初学者的Python编程实例，每个例子都附带简要说明和代码（可直接运行）：猜数字游戏用户猜一个随机生成的数字，程序会提示“太大”或“太小”。importrandomnumber=random.randint(1,100)whileTrue:guess=int(input("猜一个1-100之间的数字:"))ifguess==number:print(“猜中了！”)
本地大模型编程实战(11)与外部工具交互(2) 火云牌神 AI编程实战 python langchain llama deepseek
文章目录准备定义工具方法创建提示词生成工具方法实参以`json`格式返回实参自定义`JsonOutputParser`返回`json`调用工具方法定义通用方法用链返回结果返回结果中包含工具输入总结代码在使用LLM(大语言模型)时，经常需要调用一些自定义的工具方法完成特定的任务，比如：执行一些特殊算法、查询天气预报、旅游线路等。很多大模型都具备使用这些工具方法的能力，Langchain也为这些调用提
生成网页链接二维码小雨滴答滴答 html5 javascript
生成二维码#qrcode{margin-top:20px;}生成网页链接二维码生成二维码functiongenerateQRCode(){consturl=document.getElementById('urlInput').value;constqrcodeDiv=document.getElementById('qrcode');//清空之前的二维码qrcodeDiv.innerHTML='
SSH 密钥验证失败，GitHub 无法识别你的 SSH 公钥 weixin_74979678 ssh github 运维
目录**1.检查SSH密钥是否正确添加到GitHub**1.**检查本地SSH密钥**：-确保你已经生成了SSH密钥。默认情况下，公钥文件位于`2.**将公钥添加到GitHub**：3.**测试SSH连接**：**2.检查SSH配置**1.**检查默认密钥文件**：2.**检查SSH代理**：3.**检查权限**：**3.确保仓库存在****4.使用HTTPS克隆（作为临时解决方案）****5.其
PythonLearn yadanuof yy的学习之路 python
简单数据类型数据类型转换int(x)float(x)str(x)chr(x)ord(x)hex(x)oct(x)bin(x)eval函数Python中的内置函数,用于去掉字符串最外侧的引号,并按照逻辑运算age=eval(input('请输入年龄:'))#将input读入的字符串类型转成了int类型,相当于int(age)print(age,type(age))#18hello='北京欢迎你'pr
uniapp请求封装统一处理，token无感刷新刷 Mo_jo uni-app 前端 javascript
import{useStoreUser}from'@/store/user.js';importrequestInterceptorfrom'@/interceptor/request.js';import{goLogin}from'@/interceptor/router.js';import{refreshToken}from'./index';classhttp{/***http请求基类*@
wordpress使用CorePress主题设置项总结 linlinlove2 wordpress二次开发 wordpress主题开发
宝塔面板设置软件商店中安装的软件有：（宝塔网站加速3.1）（Nginx1.18.0）（MySql5.6.50）（PHP-5.6）（phpMyAdmin4.4）（Python项目管理器1.9）（又拍云存储4.5）（Linux工具箱1.4）（宝塔SSH终端1.0）（Nginx免费防火墙5.3）网站：首次添加站点选择自动创建数据库网站–>SSL：申请免费Let’sEncrypt证书，并开启强制https
【ARM】SMMU系统虚拟化(4) Lambor_Ma ARM系列 arm开发 SoC 硬件架构 IC
ReducedIAwidth这个概念的理解是，假如使用的是4KB的granule，IA(inputaddress)的位宽是35位，根据IAbitsresolvedatdifferentlevelsoflookup表格，可以得出initiallevel为level1。level1从38:30，相当于有4-bit的减少。这个时候意味着translationtablesize被减少了2^4倍。但是又因为
YOLOv11-ultralytics-8.3.67部分代码阅读笔记-ops.py 红色的山茶花 YOLO 笔记深度学习
ops.pyultralytics\models\utils\ops.py目录ops.py1.所需的库和模块2.classHungarianMatcher(nn.Module):3.defget_cdn_group(batch,num_classes,num_queries,class_embed,num_dn=100,cls_noise_ratio=0.5,box_noise_scale=1.0
使用宝塔大家Java项目遇到的问题 LOVE_DDZ JAVA Spring-Boot java spring boot 开发语言
记录一下使用宝塔大家Java项目遇到的问题：1.没有那个文件或目录/var/tmp/springboot/vhost/scripts/system-service.sh:没有那个文件或目录Feb2811:13:01hadoop05spring_system-service:/bin/bash:/var/tmp/springboot/vhost/scripts/system-service.sh:没
Spark 运行问题 java.lang.NoSuchMethodError 解决方案 @飞往你的山 spark scala
一般情况，出现这种问题是因为scala和spark的版本不匹配，需要重新下载两者相匹配的版本。File-ProjectStructure-Libraies-“+”-java选择spark目录下jars文件夹Maven项目，pom.xml文件中添加Spark依赖，需要联网下载，或者本地库中已经下载好依赖包2.3.3org.apache.sparkspark-core_2.11${spark.vers
Spring Boot项目打包与部署指南 I~Lucky spring boot 后端 java
在实际中开发，SpringBoot项目的部署是一个重要的环节。SpringBoot项目通常被打包为一个独立的JAR文件，包含所有依赖和资源，这使得部署过程变得非常简单。以下是详细的打包与部署步骤：####一、SpringBoot项目打包1.**添加打包插件**SpringBoot项目默认使用`spring-boot-maven-plugin`插件进行打包。确保在`pom.xml`中添加了以下配置：
[repo] No such file or directory: ‘/xxxx/.repo/manifests/.git/HEAD‘error: manifest missing or unrea 新镜 git
1、运行repoinit-uxxxxx--no-repo-verify报错：Unabletonegotiatewith:nomatchingkeyexchangemethodfound.Theiroffer:diffie-hellman-group1-sha1fatal:Couldnotreadfromremoterepository.【解决方法】：在~/.ssh/config添加这一行（conf
VSCode连接远程服务器报错：vscode-remote://ssh-remote%2B%E5%AE%9E%E9%AA%8C%E5%AE%A4/data 的文件系统提供程序不可用。万年枝服务器使用常见运行错误 vscode 服务器 ssh
文章目录出现问题尝试解决其他可能问题出现问题vscode-remote://ssh-remote%2B%E5%AE%9E%E9%AA%8C%E5%AE%A4/data的文件系统提供程序不可用。尝试解决1.使用本地ssh连接，判断是否能够正常连接,样例如下，请修改成个人的端口号和root@ip形式。[email protected].如果能够连接，用ssh登录到远程服务器，删除
ubuntu 安全策略(等保) Henry_Wu001 linux ubuntu ubuntu linux 运维
windows三个帐号屏保设置组策略,密码超时次数/审计记录；linux应具有登录失败处理功能，应配置并启用结束会话、限制非法登录次数和当登录连接超时自动退出等相关措施。1、在系统中新建测试用户，使用此用户登录时多次输入错误密码，核查登录失败处理功能是否成功启用;2、以root权限账户登录系统，使用命令#cat/etc/pam.d/system-auth(或#cat/etc/pam.d/sshd)
apache 安装linux windows 墙头上一根草 apache inux windows
linux安装Apache 有两种方式一种是手动安装通过二进制的文件进行安装，另外一种就是通过yum 安装，此中安装方式，需要物理机联网。以下分别介绍两种的安装方式通过二进制文件安装Apache需要的软件有apr,apr-util,pcre 1，安装 apr 下载地址：htt
fill_parent、wrap_content和match_parent的区别 Cb123456 match_parent fill_parent
fill_parent、wrap_content和match_parent的区别: 1）fill_parent 设置一个构件的布局为fill_parent将强制性地使构件扩展，以填充布局单元内尽可能多的空间。这跟Windows控件的dockstyle属性大体一致。设置一个顶部布局或控件为fill_parent将强制性让它布满整个屏幕。 2） wrap_conte
网页自适应设计天子之骄 html css 响应式设计页面自适应
网页自适应设计网页对浏览器窗口的自适应支持变得越来越重要了。自适应响应设计更是异常火爆。再加上移动端的崛起，更是如日中天。以前为了适应不同屏幕分布率和浏览器窗口的扩大和缩小，需要设计几套css样式，用js脚本判断窗口大小，选择加载。结构臃肿，加载负担较大。现笔者经过一定时间的学习，有所心得，故分享于此，加强交流，共同进步。同时希望对大家有所
[sql server] 分组取最大最小常用sql 一炮送你回车库 SQL Server
--分组取最大最小常用sql--测试环境if OBJECT_ID('tb') is not null drop table tb;gocreate table tb( col1 int, col2 int, Fcount int)insert into tbselect 11,20,1 union allselect 11,22,1 union allselect 1
ImageIO写图片输出到硬盘 3213213333332132 java image
package awt; import java.awt.Color; import java.awt.Font; import java.awt.Graphics; import java.awt.image.BufferedImage; import java.io.File; import java.io.IOException; import javax.imagei
自己的String动态数组宝剑锋梅花香 java 动态数组数组
数组还是好说，学过一两门编程语言的就知道，需要注意的是数组声明时需要把大小给它定下来，比如声明一个字符串类型的数组：String str[]=new String[10]; 但是问题就来了，每次都是大小确定的数组，我需要数组大小不固定随时变化怎么办呢？动态数组就这样应运而生，龙哥给我们讲的是自己用代码写动态数组，并非用的ArrayList 看看字符
pinyin4j工具类 darkranger .net
pinyin4j工具类Java工具类 2010-04-24 00:47:00 阅读69 评论0 字号：大中小引入pinyin4j-2.5.0.jar包: pinyin4j是一个功能强悍的汉语拼音工具包，主要是从汉语获取各种格式和需求的拼音，功能强悍，下面看看如何使用pinyin4j。本人以前用AscII编码提取工具，效果不理想，现在用pinyin4j简单实现了一个。功能还不是很完美，
StarUML学习笔记----基本概念 aijuans UML建模
介绍StarUML的基本概念，这些都是有效运用StarUML?所需要的。包括对模型、视图、图、项目、单元、方法、框架、模型块及其差异以及UML轮廓。模型、视与图（Model, View and Diagram） &
Activiti最终总结 avords Activiti id 工作流
1、流程定义ID：ProcessDefinitionId，当定义一个流程就会产生。 2、流程实例ID：ProcessInstanceId，当开始一个具体的流程时就会产生，也就是不同的流程实例ID可能有相同的流程定义ID。 3、TaskId，每一个userTask都会有一个Id这个是存在于流程实例上的。 4、TaskDefinitionKey和（ActivityImpl activityId
从省市区多重级联想到的，react和jquery的差别 bee1314 jquery UI react
在我们的前端项目里经常会用到级联的select，比如省市区这样。通常这种级联大多是动态的。比如先加载了省，点击省加载市，点击市加载区。然后数据通常ajax返回。如果没有数据则说明到了叶子节点。针对这种场景，如果我们使用jquery来实现，要考虑很多的问题，数据部分，以及大量的dom操作。比如这个页面上显示了某个区，这时候我切换省，要把市重新初始化数据，然后区域的部分要从页面
Eclipse快捷键大全 bijian1013 java eclipse 快捷键
Ctrl+1 快速修复(最经典的快捷键,就不用多说了)Ctrl+D: 删除当前行 Ctrl+Alt+↓ 复制当前行到下一行(复制增加)Ctrl+Alt+↑ 复制当前行到上一行(复制增加)Alt+↓ 当前行和下面一行交互位置(特别实用,可以省去先剪切,再粘贴了)Alt+↑ 当前行和上面一行交互位置(同上)Alt+← 前一个编辑的页面Alt+→ 下一个编辑的页面(当然是针对上面那条来说了)Alt+En
js 笔记函数征客丶 JavaScript
一、函数的使用 1.1、定义函数变量 var vName = funcation(params){ } 1.2、函数的调用函数变量的调用： vName(params); 函数定义时自发调用：(function(params){})(params); 1.3、函数中变量赋值 var a = 'a'; var ff
【Scala四】分析Spark源代码总结的Scala语法二 bit1129 scala
1. Some操作在下面的代码中，使用了Some操作：if (self.partitioner == Some(partitioner))，那么Some(partitioner)表示什么含义？首先partitioner是方法combineByKey传入的变量， Some的文档说明： /** Class `Some[A]` represents existin
java 匿名内部类 BlueSkator java匿名内部类
组合优先于继承 Java的匿名类，就是提供了一个快捷方便的手段，令继承关系可以方便地变成组合关系继承只有一个时候才能用，当你要求子类的实例可以替代父类实例的位置时才可以用继承。在Java中内部类主要分为成员内部类、局部内部类、匿名内部类、静态内部类。内部类不是很好理解，但说白了其实也就是一个类中还包含着另外一个类如同一个人是由大脑、肢体、器官等身体结果组成，而内部类相
盗版win装在MAC有害发热，苹果的东西不值得买，win应该不用 ljy325 游戏 apple windows XP OS
Mac mini 型号: MC270CH-A RMB:5,688 Apple 对windows的产品支持不好,有以下问题: 1.装完了xp,发现机身很热虽然没有运行任何程序！貌似显卡跑游戏发热一样，按照那样的发热量,那部机子损耗很大,使用寿命受到严重的影响! 2.反观安装了Mac os的展示机，发热量很小，运行了1天温度也没有那么高 &nbs
读《研磨设计模式》-代码笔记-生成器模式-Builder bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 生成器模式的意图在于将一个复杂的构建与其表示相分离，使得同样的构建过程可以创建不同的表示（GoF） * 个人理解： * 构建一个复杂的对象，对于创建者（Builder）来说，一是要有数据来源(rawData)，二是要返回构
JIRA与SVN插件安装 chenyu19891124 SVN jira
JIRA安装好后提交代码并要显示在JIRA上，这得需要用SVN的插件才能看见开发人员提交的代码。 1.下载svn与jira插件安装包，解压后在安装包(atlassian-jira-subversion-plugin-0.10.1) 2.解压出来的包里下的lib文件夹下的jar拷贝到(C:\Program Files\Atlassian\JIRA 4.3.4\atlassian-jira\WEB
常用数学思想方法 comsci 工作
对于搞工程和技术的朋友来讲，在工作中常常遇到一些实际问题，而采用常规的思维方式无法很好的解决这些问题，那么这个时候我们就需要用数学语言和数学工具，而使用数学工具的前提却是用数学思想的方法来描述问题。。下面转帖几种常用的数学思想方法，仅供学习和参考函数思想　　把某一数学问题用函数表示出来，并且利用函数探究这个问题的一般规律。这是最基本、最常用的数学方法
pl/sql集合类型 daizj oracle 集合 type pl/sql
--集合类型 /* 单行单列的数据，使用标量变量单行多列数据，使用记录单列多行数据，使用集合（。。。） *集合：类似于数组也就是。pl/sql集合类型包括索引表（pl/sql table）、嵌套表（Nested Table）、变长数组（VARRAY）等 */ /* --集合方法 &n
[Ofbiz]ofbiz初用 dinguangx 电商 ofbiz
从github下载最新的ofbiz（截止2015-7-13），从源码进行ofbiz的试用 1. 加载测试库 ofbiz内置derby，通过下面的命令初始化测试库 ./ant load-demo (与load-seed有一些区别) 2. 启动内置tomcat ./ant start 或 ./startofbiz.sh 或 java -jar ofbiz.jar &
结构体中最后一个元素是长度为0的数组 dcj3sjt126com c gcc
在Linux源代码中，有很多的结构体最后都定义了一个元素个数为0个的数组，如/usr/include/linux/if_pppox.h中有这样一个结构体： struct pppoe_tag { __u16 tag_type; __u16 tag_len; &n
Linux cp 实现强行覆盖 dcj3sjt126com linux
发现在Fedora 10 /ubutun 里面用cp -fr src dest，即使加了-f也是不能强行覆盖的，这时怎么回事的呢？一两个文件还好说，就输几个yes吧，但是要是n多文件怎么办，那还不输死人呢？下面提供三种解决办法。方法一我们输入alias命令，看看系统给cp起了一个什么别名。 [root@localhost ~]# aliasalias cp=’cp -i’a
Memcached(一)、HelloWorld frank1234 memcached
一、简介高性能的架构离不开缓存，分布式缓存中的佼佼者当属memcached，它通过客户端将不同的key hash到不同的memcached服务器中，而获取的时候也到相同的服务器中获取，由于不需要做集群同步，也就省去了集群间同步的开销和延迟，所以它相对于ehcache等缓存来说能更好的支持分布式应用，具有更强的横向伸缩能力。二、客户端选择一个memcached客户端，我这里用的是memc
Search in Rotated Sorted Array II hcx2013 search
Follow up for "Search in Rotated Sorted Array":What if duplicates are allowed? Would this affect the run-time complexity? How and why? Write a function to determine if a given ta
Spring4新特性——更好的Java泛型操作API jinnianshilongnian spring4 generic type
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
CentOS安装JDK liuxingguome centos
1、行卸载原来的： [root@localhost opt]# rpm -qa | grep java tzdata-java-2014g-1.el6.noarch java-1.7.0-openjdk-1.7.0.65-2.5.1.2.el6_5.x86_64 java-1.6.0-openjdk-1.6.0.0-11.1.13.4.el6.x86_64 [root@localhost
二分搜索专题2-在有序二维数组中搜索一个元素 OpenMind 二维数组算法二分搜索
1,设二维数组p的每行每列都按照下标递增的顺序递增。用数学语言描述如下：p满足 (1),对任意的x1，x2，y，如果x1<x2,则p(x1,y)<p(x2,y); (2),对任意的x，y1,y2, 如果y1<y2,则p(x,y1)<p(x,y2); 2,问题：给定满足1的数组p和一个整数k，求是否存在x0,y0使得p(x0,y0)=k? 3,算法分析： (
java 随机数 Math与Random SaraWon java Math Random
今天需要在程序中产生随机数，知道有两种方法可以使用，但是使用Math和Random的区别还不是特别清楚，看到一篇文章是关于的，觉得写的还挺不错的，原文地址是 http://www.oschina.net/question/157182_45274?sort=default&p=1#answers 产生1到10之间的随机数的两种实现方式： //Math Math.roun
oracle创建表空间 tugn oracle
create temporary tablespace TXSJ_TEMP tempfile 'E:\Oracle\oradata\TXSJ_TEMP.dbf' size 32m autoextend on next 32m maxsize 2048m extent m
使用Java8实现自己的个性化搜索引擎 yangshangchuan java superword 搜索引擎 java8 全文检索
需要对249本软件著作实现句子级别全文检索，这些著作均为PDF文件，不使用现有的框架如lucene，自己实现的方法如下： 1、从PDF文件中提取文本，这里的重点是如何最大可能地还原文本。提取之后的文本，一个句子一行保存为文本文件。 2、将所有文本文件合并为一个单一的文本文件，这样，每一个句子就有一个唯一行号。 3、对每一行文本进行分词，建立倒排表，倒排表的格式为：词=包含该词的总行数N=行号

hadoop单机模式和伪分布式模式安装过程

你可能感兴趣的:(hadoop,jar,ssh,input,login,output)