wapysun

Linux下Nutch分布式配置和使用

介绍

这是本人在完全分布式环境下在 Cent-OS 中配置 Nutch-1.1 时的总结文档，但该文档适合所有 Linux 系统和目前各版本的 nutch 。

0 集群网络环境介绍

集群中所有节点均是Cent-OS系统，防火墙均禁用，sshd服务均开启；所有节点上均有一个名为nutch的用户(非超级用户，安装前root使用useradd添加)，用户主目录是/home/nutch。

集群包含三个节点：1个namenode，2个datanode，节点之间局域网连接，可以相互ping通。节点IP地址和主机名分布如下：

10.10.97.132gc03vm12namenode

10.10.97.142gc04vm12datanode01

10.10.97.144gc04vm14datanode02

本配置将Nutch安装在/home/nutch/nutchinstall目录下。一般最好建议安装在其它非主目录路径下，例如/usr/local下，但此时需要使nutch用户对目录有rwx权限（nutch用户对主目录有rwx权限），一般做法是root用户在/usr/local下创建一个目录，并修改该目录拥有者为nutch(chown –R nutch:nutch 目录路径)。

1 /etc/hosts 文件配置

namenode 节点上vi /etc/hosts，将所有节点的名字和IP地址写入其中，写入如下内容，注意注释掉127.0.0.1行：

10.10.97.132gc03vm12

10.10.97.142gc04vm12

10.10.97.144gc04vm14

# 127.0.0.1 centos54 localhost.localdomain localhost

/etc/hosts 文件需要复制到所有数据节点上。

2 SSH 无密码验证配置

Nutch 是基于Hadoop的，Hadoop需要使用SSH协议，namenode将使用SSH协议启动namenode和datanode进程，datanode 向namenode传递心跳信息可能也是使用SSH协议，这是我认为的，还没有做深入了解，datanode之间可能也需要使用SSH协议。假若是，则需要配置使得所有节点之间可以相互SSH无密码登陆验证 )。

2.1 配置所有节点之间SSH无密码验证

(0) 原理

节点A要实现无密码公钥认证连接到节点B上时，节点A是客户端，节点B是服务端，需要在客户端A 上生成一个密钥对，包括一个公钥和一个私钥，而后将公钥复制到服务端B 上。当客户端A通过 ssh 连接服务端B时，服务端B就会生成一个随机数并用客户端A的公钥对随机数进行加密，并发送给客户端A。客户端A收到加密数之后再用私钥进行解密，并将解密数回传给B，B确认解密数无误之后就允许A进行连接了。这就是一个公钥认证过程，其间不需要用户手工输入密码。重要过程是将客户端A公钥复制到B上。

因此如果要实现所有节点之间无密码公钥认证，则需要将所有节点的公钥都复制到所有节点上。

(1) 所有机器上生成密码对

(a) 所有节点用nutch用户登陆，并执行以下命令，生成rsa密钥对:

zkl@zkl-ubuntu:~$ ssh-keygen -t rsa

Generating public/private rsa key pair.

Enter file in which to save the key (/home/zkl/.ssh/id_rsa): 默认路径

Enter passphrase (empty for no passphrase): 回车，空密码

Enter same passphrase again:

Your identification has been saved in /home/zkl/.ssh/id_rsa.

Your public key has been saved in /home/zkl/.ssh/id_rsa.pub.

这将在/home/nutch/.ssh/目录下生成一个私钥id_rsa和一个公钥id_rsa.pub。

(b) 将所有datanode节点的公钥 id_rsa.pub 传送到namenode 上:

cp id_rsa.pub datanode01.id_rsa.pub

scp datanode01.id_rsa.pub namenode 节点ip地址:/home/nutch/.ssh

......

cp id_rsa.pub datanode0n.id_rsa.pub

(c)namenode 节点上综合所有公钥(包括自身)并传送到所有节点上

cp id_rsa.pub authorized_keys namenode 自己的公钥

cat datanode01.id_rsa.pub >> authorized_keys

......

cat datanode0n.id_rsa.pub >> authorized_keys

然后使用SSH协议将所有公钥信息authorized_keys复制到所有DataNode的.ssh目录下

zkl@zkl-ubuntu:~$ scp authorized_keys data 节点ip地址:/home/zkl/.ssh

这样配置过后，所有节点之间可以相互SSH无密码登陆，可以通过命令

“ssh 节点ip地址”来验证。

3 JDK 安装和Java环境变量配置

3.1 安装 JDK 1.6

root 用户登陆，在Namenode节点上新建文件夹/usr/program，下载JDK安装包 jdk-6u13-linux-i586.bin , 复制到目录 /usr/ program 下，在命令行进入该目录，执行命令“./ jdk-6u13-linux-i586.bin”，命令运行完毕，将在目录下生成文件夹jdk1.6.0_13，安装完毕。

安装完成后，修改/usr/program目录拥有着为nutch用户，

Chown -R nutch:nutch /usr/program

/usr/ program 目录需要复制到所有数据节点上。

3.2 Java 环境变量配置

root 用户登陆，命令行中执行命令”vi /etc/profile”,并加入以下内容，配置环境变量(注意/etc/profile这个文件很重要，后面Hadoop的配置还会用到)。

# set java environment

export JAVA_HOME= /usr/program /jdk1.6.0_13/

export JRE_HOME= /usr/program /jdk1.6.0_13/jre

export CLASSPATH=.:$JAVA_HOME/lib:$JAVA_HOME/jre/lib

export PATH=$JAVA_HOME/bin:$JAVA_HOME/jre/bin:$PATH

保存并退出，执行以下命令使配置生效

chmod +x/etc/profile

source/etc/profile

配置完毕，在命令行中使用命令”java -version”可以判断是否成功。

在nutch下测试java -version

/etc/profile 复制到所有数据节点上。

4 Hadoop 集群配置

在namenode上执行:

下载nutch-1.0，将其解压到/home/nutch/nutchinstall目录下，使用如下命令:

tar zxvf nutch-1.0.tar.gz

(1) 配置Hadoop的配置文件

(a) 配置hadoop-env.sh

$ vi nutch-1.0/conf/hadoop-env.sh

# set java environment

export JAVA_HOME=/usr/program/jdk1.6.0_13/

(b) 配置conf/hadoop-site.xml

Hadoop 配置参数的含义请参考Hadoop-default.xml，在lib/hadoop-xxx.core.jar中能找到。

fs.default.name

hdfs://gc03vm12:9000

HDFS 的URI，文件系统://namenode标识:端口号

hadoop.tmp.dir

/home/nutch/nutchinstall/hadooptmp

namenode 上本地的hadoop临时文件夹

dfs.name.dir

/home/nutch/nutchinstall/hdfs/name

namenode 上存储hdfs名字空间元数据

dfs.data.dir

/home/nutch/nutchinstall/hdfs/data

datanode 上数据块的物理存储位置

dfs.replication

副本个数，不配置默认是3,应小于datanode机器数量

mapred.job.tracker

gc03vm12:9001

jobtracker 标识:端口号，不是URI

mapred.local.dir

/home/nutch/nutchinstall/mapred/local

tasktracker 上执行mapreduce程序时的本地目录

mapred.system.dir

/tmp/hadoop/mapred/system

这个是hdfs中的目录，存储执行mr程序时的共享文件

gc03vm12

(d) 配置slaves文件, 加入所有datanode的主机名

gc04vm12

gc04vm14

(2) 复制配置好的各文件到所有数据节点上。

root 用户下:

scp /etc/hosts 数据节点ip地址:/etc/hosts

scp /etc/profile 数据节点ip地址:/etc/profile

scp /usr/program 数据节点ip地址:/usr/program

nutch 用户下:

scp /home/nutch/nutchinsta 数据节点ip地址:/home/nutch/

5 Hadoop 集群启动

Namenode 执行：

格式化namenode，格式化后在namenode生成了hdfs/name 文件夹

bin/hadoop namenode –format

启动hadoop所有进程，

bin/start-all.sh （或者先后执行start-dfs.sh和start-mapreduce.sh）。

可以通过以下启动日志看出，首先启动namenode,然后启动datanode1,datanode2,然后启动secondarynamenode。再启动jobtracker,然后启动tasktracker1,最后启动tasktracker2。

启动hadoop成功后，在namenode中生成了hadooptmp 文件夹，在datanode中生成了hdfs 文件夹和mapred 文件夹。

namenode 上用java自带的小工具jps查看进程

zkl@zkl-ubuntu:~/$ jps

8383 JobTracker

8733 Jps

8312 SecondaryNameNode

8174 NameNode

每个datanode上查看进程

zkl@zkl-ubuntu:~/$ jps

7636 DataNode

7962 Jps

7749 TaskTracker

在namenode上查看集群状态

bin/hadoop dfsadmin –report

Configured Capacity: 16030539776 (14.93 GB)

Present Capacity: 7813902336 (7.28 GB)

DFS Remaining: 7748620288 (7.22 GB)

DFS Used: 65282048 (62.26 MB)

DFS Used%: 0.84%

-------------------------------------------------

Datanodes available: 2 (2 total, 0 dead)

Name: 10.10.97.142:50010

Decommission Status : Normal

Configured Capacity: 8015269888 (7.46 GB)

DFS Used: 32641024 (31.13 MB)

Non DFS Used: 4364853248 (4.07 GB)

DFS Remaining: 3617775616(3.37 GB)

DFS Used%: 0.41%

DFS Remaining%: 45.14%

Last contact: Thu May 13 06:17:57 CST 2010

Name: 10.10.97.144:50010

Decommission Status : Normal

Configured Capacity: 8015269888 (7.46 GB)

DFS Used: 32641024 (31.13 MB)

Non DFS Used: 3851784192 (3.59 GB)

DFS Remaining: 4130844672(3.85 GB)

DFS Used%: 0.41%

DFS Remaining%: 51.54%

Last contact: Thu May 13 06:17:59 CST 2010

Hadoop 的web 方式查看： http:// namenode ip 地址 :50070

Hadoop 查看工作情况: http:// namenode ip 地址:50030

6 Nutch 分布式爬虫

6.1 配置Nutch配置文件

(1) 配置所有节点上的conf/nutch-site.xml文件

nutch-site.xml 文件

http.agent.name

nutch-1.0

爬虫和搜索此参数必须配置

(2) 配置所有节点上的conf/crawl-urlfilter.txt文件

# skip file:, ftp:, & mailto: urls

-^(file|ftp|mailto):

# skip image and other suffixes we can't yet parse

-\.(gif|GIF|jpg|JPG|png|PNG|ico|ICO|css|sit|eps|wmf|zip|ppt|mpg|xls|gz|rpm|tgz|mov|MOV|exe|jpeg|JPEG|bmp|BMP)$

# skip URLs containing certain characters as probable queries, etc.

-[?*!@=]

# skip URLs with slash-delimited segment that repeats 3+ times, to break loops

-.*(/[^/]+)/[^/]+\1/[^/]+\1/

# accept hosts in MY.DOMAIN.NAME

# 允许下载所有

# skip everything else

6.2 执行Nutch分布式爬虫

Nutch 爬虫命令是:

bin/nutch Crawl [-dir d] [-threads n] [-depth i] [-topN N]

其中的参数是入口地址文件或其所在的目录，启动了集群进行分布式爬虫时，这个目录必须是HDFS中的目录，爬虫完毕将在HDFS中生成存有爬下来的数据的目录[-dir d]。

(1) 入口地址文件

在本地磁盘中新建一个文件，写入一个入口url，然后将其复制到HDFS中，使用如下命令:
bin/hadoop dfs -copyFromLocal crawltest/urls urls

(3) 爬虫测试，在namenode、datanode或者与集群网络连通的安装有Hadoop或者nutch并且hadoop-site.xml配置相同的客户机 上上均可使用如下命令分布式爬虫:

bin/nutch crawl urls -dir data -depth 3 -topN 10

crawl started in: data

rootUrlDir = urls

threads = 10

depth = 3

topN = 10

Injector: starting

Injector: crawlDb: data/crawldb

Injector: urlDir: urls

Injector: Converting injected urls to crawl db entries.

Injector: Merging injected urls into crawl db.

Injector: done

Generator: Selecting best-scoring urls due for fetch.

Generator: starting

Generator: segment: data/segments/20100513022002

Generator: filtering: true

Generator: topN: 10

Generator: Partitioning selected urls by host, for politeness.

Generator: done.

Fetcher: Your 'http.agent.name' value should be listed first in 'http.robots.agents' property.

Fetcher: starting

Fetcher: segment: data/segments/20100513022002

Fetcher: done 第一层的网页下载完毕，depth=0

CrawlDb update: starting

CrawlDb update: db: data/crawldb

CrawlDb update: segments: [data/segments/20100513022002]

CrawlDb update: additions allowed: true

CrawlDb update: URL normalizing: true

CrawlDb update: URL filtering: true

CrawlDb update: Merging segment data into db.

CrawlDb update: done

Generator: Selecting best-scoring urls due for fetch.

Generator: starting

Generator: segment: data/segments/20100513022124

Generator: filtering: true

Generator: topN: 10

Generator: 0 records selected for fetching, exiting ...

Stopping at depth=1 - no more URLs to fetch. 此处就停止了，不能下载第二层的网页，正常情况下是不会出现此错误的。

LinkDb: starting

LinkDb: linkdb: data/linkdb

LinkDb: URL normalize: true

LinkDb: URL filter: true

LinkDb: adding segment:

hdfs://gc03vm12:9000/user/nutch/data/segments/20100513022002

LinkDb: done

Indexer: starting

Indexer: done

Dedup: starting

Dedup: adding indexes in: data/indexes

Dedup: done

merging indexes to: data/index

Adding hdfs://gc03vm12:9000/user/nutch/data/indexes/part-00000

done merging

crawl finished: data

爬虫完毕，hdfs中生成data目录，data目录下面有这些子目录：crawldb,index,

indexes,linkdb,segments 。所有节点上的爬虫日志在logs/hadoop.log中。上述“ Stopping at depth=1 - no more URLs to fetch. ”这个错误不知何故，我在另几台机器上相同配置爬虫却没有出现任何错误，不知何原因。一般情况下按此配置没有任何问题。

从浏览器中可以查看到分布式爬虫时作业状态：

7 Nutch 检索

Nutch 的爬虫和搜索可以说是分离的两块，爬虫可以是 M/R 作业，但搜索不是 M/R 作业。搜索有两种方式：一是将爬虫数据 ( 或者称索引数据 ) 放在本地硬盘，进行搜索。二是直接搜索 HDFS 中的爬虫数据。

Nutch 自带了一个 WEB 前端检索程序，即主目录下的 nutch-x.x.war ，实现 WEB 前端检索时需要安装 Tomcat ，执行应用程序。此外，在命令行中也可执行 Nutch 检索命令。

7.1 Windows 下Nutch单机搜索本地索引数据

(1) 将HDFS中生成的存储爬虫数据的data目录复制到本地，并将data目录拷贝到windows下的某个目录中，例如D盘下。

bin/hadoopfs –copyToLocal data data

(2) 安装tomcat，请确保安装路径没有空格，这很重要，在windows上如果有空格将导致搜索结果始终为0。启动tomcat服务。

(3) 将Nutch主目录下的WEB前端程序nutch-1.0.war复制到 ***/ tomcat/webapps/目录下。

(4) 浏览器中输入http://localhost:8080/nutch-1.0，将自动解压nutch-1.0.war，在webapps下生成nutch-1.0目录。

(5) 配置WEB前端程序中的nutch-site.xml文件，该文件所在目录是***/tomcat/webapps/nutch-1.0/WEB-INF/classes/下，配置如下：

http.agent.name 不可少，否则无搜索结果

nutch-1.0

HTTP 'User-Agent' request header.

searcher.dir

D:\data < alue>data 是爬虫生成的索引数据目录。参数值请使用绝对路径

Path to root of crawl.

(6) 重启tomcat。更改配置文件后必须重启tomcat，否则不会生效。

(7) 在http://localhost:8080/nutch-1.0下检索关键字。

7.2 Linux 下Nutch单机搜索本地索引数据

7.2.1 WEB 前端搜索

(1) 将HDFS中生成的存储爬虫数据的data目录复制到本地某一目录下。

bin/hadoopfs –copyToLocal data data

(2) 安装tomcat，请确保安装路径没有空格，这很重要，否则将导致搜索结果始终为0。安装完后启动tomcat服务，bin/catalina start。

(3) 将Nutch主目录下的WEB前端程序nutch-1.0.war复制到 ***/ tomcat/webapps/目录下。

(4) 浏览器中输入http://localhost:8080/nutch-1.0，将自动解压nutch-1.0.war，在webapps下生成nutch-1.0目录。

(5) 配置WEB前端程序中的nutch-site.xml文件，该文件所在目录是***/tomcat/webapps/nutch-1.0/WEB-INF/classes/下，配置如下：

http.agent.name 不可少，否则无搜索结果

nutch-1.0

HTTP 'User-Agent' request header.

searcher.dir

/home/nutch/nutchinstall/crawltest/data < alue>

data 是爬虫生成的索引数据目录。参数值请使用绝对路径

Path to root of crawl.

(6) 重启tomcat,可以先执行bin/catalina stop停止再start。更改配置文件后必须重启tomcat，否则不会生效。

(7) 在http://localhost:8080/nutch-1.0下检索关键字。

7.2.2 命令行搜索

(1) 机器上安装nutch，即解压nutch软件包即可。

(2) 配置nutch主目录下conf目录下的hadoop-site.xml和nutch-site.xml文件。

由于是单机模式搜索，使用的是本地文件系统，hadoop-site.xml中不要做任何配置；nutch-site.xml中和以上配置一致

(3) 使用命令检索

bin/nutch org.apache.nutch.searcher.NutchBean apache

Total hits: 10

0 20100518233933/http://10.10.97.132:8080/docs/

... changes made to Apache Tomcat. Status - Apache Tomcat development status. Developers - List ... for Apache Tomcat's internals.

1 20100518234217/http://10.

7.3 Linux 下Nutch搜索HDFS中索引数据

分布式爬虫时Nutch生成的索引数据存储的HDFS中，nutch支持搜索HDFS中的数据。检索HDFS中的索引数据和检索本地种的索引数据的配置差别是hadoop-site.xml文件。搜索hdfs中的数据时，nutch在搜索的时候首先通过rpc检索lucene索引文件，然后定位到 segment对应的14位数字时间作为文件夹的名字，然后从这个文件夹中获取结果信息的。

7.3.1 WEB 前端搜索

(0) 选择一台机器，该机器可以是Hadoop集群中的节点，也可以是集群之外的机器，但保证机器和Hadoop集群网络连通。

(1) 安装tomcat，请确保安装路径没有空格，这很重要，否则将导致搜索结果始终为0。安装完后启动tomcat服务，bin/catalina start。

(3) 将Nutch主目录下的WEB前端程序nutch-1.0.war复制到 ***/ tomcat/webapps/目录下。

(4) 浏览器中输入http://localhost:8080/nutch-1.0，将自动解压nutch-1.0.war，在webapps下生成nutch-1.0目录。

(5) 配置WEB前端程序中的hadoop-site.xml文件，该文件所在目录是***/tomcat/webapps/nutch-1.0/WEB-INF/classes/下。至少需要配置fs.default.name参数，指定HDFS文件系统URI：

fs.default.name

hdfs://gc04vm12:9000

(6) 配置WEB前端程序中的nutch-site.xml文件，该文件所在目录是***/tomcat/webapps/nutch-1.0/WEB-INF/classes/下，配置如下：

http.agent.name 不可少，否则无搜索结果

nutch-1.0

HTTP 'User-Agent' request header.

searcher.dir

/user/nutch/data

该值是HDFS中的目录，这里是绝对路径，即爬虫生成的data目录在HDFS中的/user/nutch/data目录下。

由Hadoop-site.xml中的fs.default.name参数可以决定它的HDFS绝对路径是：

hdfs://gc04vm12:9000/user/nutch/data

对应HDFS中的目录情况如下:

hdfs 中的目录情况

bin/hadoop dfs -ls

drwxr-xr-x- nutch supergroup 0 2010-05-18 17:31 /user/nutch/data

-->

index dir

(6) 重启tomcat,可以先执行bin/catalina stop停止，再start。更改配置文件后必须重启tomcat，否则不会生效。

(7) 在http://localhost:8080/nutch-1.0下检索关键字。

7.3.2 命令行搜索

(0) 选择一台机器，该机器可以是Hadoop集群中的节点，也可以是集群之外的机器，但保证机器和Hadoop集群网络连通。

(1) 集群之外的机器上必须安装nutch并做相关配置，安装即解压nutch软件包即可。

(2) 配置Nutch主目录下的hadoop-site.xml和nutch-site.xml文件

配置hadoop-site.xml文件，至少需要配置fs.default.name参数，指定HDFS文件系统URI：

fs.default.name

hdfs://gc04vm12:9000

配置nutch-site.xml文件，配置如下：

http.agent.name 不可少，否则无搜索结果

nutch-1.0

HTTP 'User-Agent' request header.

searcher.dir

/user/nutch/data

该值是HDFS中的目录，这里是绝对路径，即爬虫生成的data目录在HDFS中的/user/nutch/data目录下。

由Hadoop-site.xml中的fs.default.name参数可以决定它的HDFS绝对路径是：

hdfs://gc04vm12:9000/user/nutch/data

对应HDFS中的目录情况如下:

hdfs 中的目录情况

bin/hadoop dfs -ls

drwxr-xr-x- nutch supergroup 0 2010-05-18 17:31 /user/nutch/data

-->

text-indent:

Global site tag (gtag.js) - Google Analytics

你可能感兴趣的:(Linux,Hadoop,SSH,Tomcat,Ubuntu)

ubuntu如何测试网络性能 hunter206206 网络 ubuntu 网络 linux
在Ubuntu中，有多种工具可以测试网络性能，包括带宽、延迟、丢包率等。以下是常用的工具和方法：1.使用ping测试网络延迟和连通性ping是最基本的网络测试工具，用于测试目标主机的连通性和延迟。命令：ping例如：pinggoogle.com参数：-c：指定发送的ICMP包数量。例如ping-c5google.com。-i：设置发送包的时间间隔（单位：秒）。例如ping-i0.5google.c
Linux搭建wordpress 长江空自流 vps linux wordpress 安装
Linux搭建wordpress一、环境vps：Centos6x86minimal512ram小内存xshell5：ssh远程连接主机首先搭建lamp环境（linuxapachemysqlphp或python等）二、apache1安装yuminstallhttpd2启动apacheservicehttpdstart直接在浏览器中输入IP地址，应该就可以访问到Apache的欢迎页面了三、mysql1
如何在 Linux 系统中查看 CPU 核数和内存大小 Ryann6 linux 运维服务器性能优化
在日常运维和开发中，了解服务器或虚拟机的硬件配置是非常重要的一环。无论是进行性能调优，还是资源分配，了解CPU的核数和内存大小可以帮助我们更好地规划应用的运行环境。本篇博客将介绍如何在Linux系统中查看CPU核数和内存大小。一、查看CPU核数在Linux中，查看CPU信息可以使用lscpu和nproc命令。这两个命令提供了CPU详细的配置数据以及核心数量。1.使用lscpu命令lscpu是Lin
Linux pstree 命令详解 linuxlinux运维
简介pstree命令用于以分层（树状）格式显示正在运行的进程。它显示进程之间的关系，例如哪些进程是由其他进程生成的。安装#基于Debian/Ubuntu的系统sudoaptinstallpsmisc#基于CentOS/RHEL/Fedora的系统sudoyuminstallpsmisc#使用dnf安装sudodnfinstallpsmisc基本语法pstree[options][pid|user]
nginx闲谈沉默monkey nginx 运维
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录介绍特点高并发轻量级模块化设计应用场景web服务器反向代理正向代理（类似机场）配置demo负载均衡缓存处理https与ssl/tlsapi网关介绍nginx高性能（同比tomcat性能高20%），轻量的weib服务器和反向代理服务器，能解决大量并发连接（C10K问题），高并发，高可靠，低内存消耗，支持多功能模块（如前端静态资源
Centos7配置vim-plug插件管理器与git安装 icacxygh001 vim centos linux
LINUX下VIM是一款轻量级文本编辑器，功能强大作为开发者常用开发工具之一，本文目的通过安装vim-plug来管理插件，打造基于VIM的IDE继承开发环境，这个算是第一步吧，不废话了网上有很多关于如何安装vim-plug的教程，有些踩过的坑和大家分享下：1.安装步骤看到这里默认你的系统已经安装了vim编辑器（如何安装VIM这里不再阐述），往下看首先建立你要下载vim-plug的目录$mkdir-
Koodo Reader(跨平台电子书阅读器) v1.7.6 北十南五电脑
KoodoReader是一个跨平台的电子书阅读器。平台支持Windows，macOS，Linux和网页版，格式支持epub,pdf,mobi,azw3,txt,djvu,markdown,fb2,cbz,cbt,cbr,rtf和docx。软件特色支持阅读epub,pdf,mobi,azw3,txt,md,djvu,docx,rtf,cbz,cbr,cbt,fb2,html和xml格式的图书支持Wi
centos7中报错ModuleNotFoundError: No module named ‘_ctypes‘解决方法丢失想象 centos python
分析:python3中有个内置模块叫ctypes，它是python3的外部函数库模块，提供了兼容C语言的数据类型，并通过它调用Linux系统下的共享库(Sharedlibrary)，此模块需要使用centos7系统中外部函数库(Foreignfunctionlibrary)的开发链接库(头文件和链接库)。由于在centos7系统中没有安装外部函数库(libffi)的开发链接库软件包，所以在安装pi
视频行为分析系统，可做安全行为检测，比如周界入侵，打架 winxp-pic 音视频安全
基于视频行为分析系统v4系列版本可以在不用考虑流媒体音视频开发，编解码开发，界面开发等情况下，只需要训练自己的模型，开发自己的行为算法插件，就可以轻松开发出任何你想要的安全行为检测，比如周界入侵，打架，斗殴，跌倒，人群聚集，离岗睡岗，安全帽检测，充电桩，工作服，疲劳检测，交通拥堵等等。从v4.24版本开始，该软件已经支持Windows10，Windows11，Ubuntu20，Ubuntu21，U
Windows 下Mamba2 环境安装问题记录及解决方法（causal_conv1d=1.4.0，mamba_ssm=2.2.2） yyywxk #Python模块有关问题 mamba python windows mamba2
导航安装教程导航Mamba及Vim安装问题参看本人博客：Mamba环境安装踩坑问题汇总及解决方法（初版）Linux下Mamba及Vim安装问题参看本人博客：Mamba环境安装踩坑问题汇总及解决方法（重置版）Windows下Mamba的安装参看本人博客：Window下Mamba环境安装踩坑问题汇总及解决方法（无需绕过selective_scan_cuda）Linux下Vim安装问题参看本人博客：Li
Linux 下 Vim 环境安装踩坑问题汇总及解决方法（重置版） yyywxk #Python模块有关问题 linux vim mamba
导航安装教程导航Mamba及Vim安装问题参看本人博客：Mamba环境安装踩坑问题汇总及解决方法（初版）Linux下Mamba及Vim安装问题参看本人博客：Mamba环境安装踩坑问题汇总及解决方法（重置版）Windows下Mamba的安装参看本人博客：Window下Mamba环境安装踩坑问题汇总及解决方法（无需绕过selective_scan_cuda）Linux下Vim安装问题参看本人博客：Li
PySide6的简单介绍深蓝海拓 pyside6学习笔记 python pyqt qt
PySide6是一个用于创建图形用户界面(GUI)应用程序的软件开发工具包(SDK)，它是Qt框架的Python绑定。Qt是一个跨平台的C++图形用户界面应用程序开发框架，而PySide6允许开发者使用Python语言来实现Qt的功能。简单介绍1.跨平台性PySide6支持多个操作系统，包括Windows、macOS和Linux。这使得开发者可以编写一次代码，然后在不同平台上运行，而无需进行大量的
linux 实验感悟_linux实训总结(共10篇).docx 脑叔 linux 实验感悟
linux实训总结(共10篇)实习报告实习性质：linux操作系统课程实习学生姓名：xx专业班级：xx指导教师：xx实习时间：XX年12月16日-XX年12月20日实习地点：4112、4212、4312、4412重庆工程职业技术学院学生实习考核表目录1.实习目的.....................................................................
1、wpa_supplicant介绍--配置参数说明 AryShaw ubuntu linux 网络
转载自：[https://zhuanlan.zhihu.com/p/674052171]，侵权请告知,立即删除。一、wpa_supplicant简介及使用：1.wpa_supplicant简介：wpa_supplicant是linux系统和android系统用来配置无线网络的开源工具，它是WPA的应用层认证客户端，负责完成WEP，WPA/WPA2和WAPI等无线协议认证相关的登录和加密等工作。wp
基于springbootBBS论坛系统的设计与实现四金学长计算机毕业设计参考案例 spring boot maven java BBS论坛系统
1.引言在当今的软件开发领域，企业级应用的开发和部署速度直接影响着业务的竞争力。SpringBoot以其轻量级、快速启动和强大的集成能力，成为构建现代企业级应用的首选框架。本文将带您深入了解SpringBoot框架的核心特性，并展示如何利用它构建一个高效、可扩展的系统。2.开发环境开发语言：Java框架：springbootJD版本：JDK1.8服务器：tomcat7数据库：mysql5.7（一定
麒麟服务器arm64架构离线升级openssh9.8p1 _WHOAM1 服务器运维
1.官网下载openssh、openssl、zlib源码包提示：如果生产环境下请先在测试服务器测试，没问题后再更新正式环境#openssh下载链接https://cdn.openbsd.org/pub/OpenBSD/OpenSSH/portable/openssh-9.8p1.tar.gz#openssl下载链接https://www.openssl.org/source/openssl-3.3
【大数据入门核心技术-Hive】（十六）hive表加载csv格式数据或者json格式数据 forest_long 大数据技术入门到21天通关大数据 hive hadoop 开发语言后端数据仓库
一、环境准备hive安装部署参考：【大数据入门核心技术-Hive】（三）Hive3.1.2非高可用集群搭建【大数据入门核心技术-Hive】（四）Hive3.1.2高可用集群搭建二、hive加载Json格式数据1、数据准备vistu.json[{"id":111,"name":"name111"},{"id":222,"name":"name22"}]上传到hdfshadoopfs-putstu.j
Windows Server 虚拟化环境中SR-IOV网络I/O增强功能 xidianjiapei001 虚拟化技术 windows 网络 SR-IOV 虚拟化 IO虚拟化
WindowsServer虚拟化环境中SR-IOV网络I/O增强功能目录详细文章症状原因解决方案受影响的产品总结：戴尔技术中心的戴尔操作系统和应用解决方案-包括ProjectSputnik、微软Windows、红帽Linux、SUSE、Ubuntu等详细文章症状微软在WindowsServer2012Beta操作系统中引入了对网络领域多项功能的支持。其中一项重要且有趣的功能是单根I/O虚拟化（SR
前端开发概述不会写代码的菜 html 前端 html
我们前后端工程师都一样,最终目的都是开发和维护软件,以给用户以更好的服务我们可以将软件分为以下几类:系统软件:WindowsLinuxmacOS应用软件:officeqq游戏软件:王者荣耀绝地求生我们的软件通常由服务器端和客户端组成客户端:通过客户端来使用软件,我们通常使用电脑时能看到的也就是客户端的软件,服务器端我们平常在使用过程中是无法看到的客户端的形式:文字客户端:一种古老的方式,通过命令行
Tomcat日志文件详解及catalina.out日志清理方法 m0_74824802 tomcat java
目录前言1.Tomcat日志文件详解1.1catalina.out1.2localhost_access_log1.3catalina..log1.4host-manager..log和manager..log1.5localhost..log2.catalina.out文件管理与清理方法2.1为什么不能直接删除catalina.out文件2.2正确清空catalina.out文件的方式2.3自动
ubuntu调用图形化网络测试工具 hunter206206 网络 ubuntu 网络测试工具
在Ubuntu中，除了命令行工具外，还有一些图形化的网络测试工具可以帮助你更直观地测试和分析网络性能。以下是几款常用的图形化网络测试工具及其使用方法：1.gnome-nettoolgnome-nettool是一个简单的图形化网络工具集，包含ping、traceroute、端口扫描等功能。安装：sudoaptupdatesudoaptinstallgnome-nettool使用：在应用程序菜单中搜索
如何理解Linux的根目录?与widows系统盘有何区别？学堂在线 Linux系统 windows操作系统 linux 服务器 php
文章目录Linux根目录1.Linux根目录的理解2.根目录空间大小限制Linux根目录与Windows系统盘（通常指C盘）对比：1.目录结构和组织方式2.文件系统特点3.系统启动和运行机制4.空间管理方式Linux根目录`1.Linux根目录的理解定义：在Linux系统中，根目录（用符号“/”表示）是整个文件系统的最顶层目录。它是所有其他目录和文件的起点。就像一棵大树的树根一样，所有的分支（其他
[4-3-2].Redis笔记 1.01^1000 七中间件 redis 数据库
后端学习大纲第1步：Redis初识[0401].第01节：Redis初识[0402].第02节：Redis配置文件第2步：搭建单点环境[0403].第03节：在Linux环境中搭建Redis6.2.8环境[0404].第04节：在Linux环境中搭建Redis7.0.0环境(与6.2.8过程类似)第3步：Redis开发操作：3.1.数据类型介绍：[0409].第09节：Redis中的键（KEY）常
linux 权限的设置与查看 chmod 与 ls -l 等相关命令 drebander 脚本
本文为转载文章出处：http://blog.csdn.net/sinchb/article/details/11746427本文着重介绍与Linux文件权限相关等问题，比如用户与用户组，文件权限，文件默认权限和文件特殊权限等。Linux为什么需要那么多的权限限制呢？其实这些都是为了“安全起见”啊！如果你的Linux系统里存了你给心上人写的情书，或者是某亚洲岛国的动作大片，你总不希望谁都可以翻翻看吧
【成人版python基础入门】第一章开篇——与 Python 的浪漫相遇精通代码大仙 python python 开发语言
开篇——与Python的浪漫相遇在这个数字化日益menjadi成主流的时代，掌握一门编程语言似乎已经成为了每个人不可推卸的责任。如果你正在寻找一种既强大又易学的语言，那么Python就是你心中的“白月光”。这不仅仅是因为它简洁明了的语法，良好的社区支持，更因为它那无可比拟的跨平台性——无论你的电脑是Windows、MacOS还是Linux，Python都将无差别地陪伴在你身边。现在，让我们一起进入
Linux上安装JDK环境变量配置 jamesge2010 linux
jdk:jdk-8u241-linux-x64.tar.gz1,makedir/usr/local/java（建立java目录）2，上传JDK至java目录3，tarzxvfjdk-8u241-linux-x64.tar.gz（解压jdk）4，在命令行输入:vi/etc/profile在最后添加如下内容exportJAVA_HOME=/usr/local/java/jdk1.8.0_241expo
Linux的几个特殊权限 jamesge2010 linux
1.ACL权限2.SetUID、SetGID、StickyBit权限3.chattr权限4.sudo权限1.ACL权限ACL权限指给文件或目录除用户、组和其他人外额外赋予的权限，赋予权限的用户既不是当前文件或目录的所属用户和所属组也不是其他人。所以给予的ACL权限不受ll显示的rwx限制，给予ACL权限后在文件或目录后会有+标记。（1）查看分区ACL权限是否开启（默认为开启）dumpe2fs-h/
Windows10环境vagrant+VirtualBox虚拟机无法创建私有网络的解决方案。 XiaoYu_3328 运维操作系统
报错信息==>default:Clearinganypreviouslysetnetworkinterfaces...Therewasanerrorwhileexecuting`VBoxManage`,aCLIusedbyVagrantforcontrollingVirtualBox.Thecommandandstderrisshownbelow.Command:["hostonlyif","cr
【PostgreSQL实战1】基于openEuler部署PostgreSQL 云计算老王 postgresql 数据库
【PostgreSQL实战1】基于openEuler部署PostgreSQL目录【PostgreSQL实战1】基于openEuler部署PostgreSQL前言一、PostgreSQL是什么？二、环境准备2.1操作系统2.2内存2.3CPU2.4关闭selinux2.5关闭防火墙三、部署安装3.1创建用户名3.2创建目录3.3安装依赖3.4安装包下载3.5编译安装3.6配置环境变量3.7初始化3.
SSM项目中的Tomcat配置详细教学及启动失败原因总结高危型 tomcat java
一个小学弟找到我说ssm项目不会配tomcat，老出问题，记录一下。为了成功启动一个SSM项目，正确配置Tomcat是至关重要的一步。介绍SSM项目中Tomcat的配置步骤，并总结一些常见的启动失败原因及解决方法，帮助·同学们方便应对课程设计一、Tomcat配置详细教学1.1安装和配置Tomcat1.1.1下载和安装Tomcat下载Tomcat：访问ApacheTomcat官网，下载适合你系统版本
矩阵求逆（JAVA）初等行变换 qiuwanchi 矩阵求逆（JAVA）
package gaodai.matrix; import gaodai.determinant.DeterminantCalculation; import java.util.ArrayList; import java.util.List; import java.util.Scanner; /** * 矩阵求逆(初等行变换) * @author 邱万迟 *
JDK timer antlove java jdk schedule code timer
1.java.util.Timer.schedule(TimerTask task, long delay)：多长时间（毫秒）后执行任务 2.java.util.Timer.schedule(TimerTask task, Date time)：设定某个时间执行任务 3.java.util.Timer.schedule(TimerTask task, long delay,longperiod
JVM调优总结 -Xms -Xmx -Xmn -Xss coder_xpf jvm 应用服务器
堆大小设置JVM 中最大堆大小有三方面限制：相关操作系统的数据模型（32-bt还是64-bit）限制；系统的可用虚拟内存限制；系统的可用物理内存限制。32位系统下，一般限制在1.5G~2G；64为操作系统对内存无限制。我在Windows Server 2003 系统，3.5G物理内存，JDK5.0下测试，最大可设置为1478m。典型设置： java -Xmx
JDBC连接数据库 Array_06 jdbc
package Util; import java.sql.Connection; import java.sql.DriverManager; import java.sql.ResultSet; import java.sql.SQLException; import java.sql.Statement; public class JDBCUtil { //完
Unsupported major.minor version 51.0（jdk版本错误） oloz java
java.lang.UnsupportedClassVersionError: cn/support/cache/CacheType : Unsupported major.minor version 51.0 (unable to load class cn.support.cache.CacheType) at org.apache.catalina.loader.WebappClassL
用多个线程处理1个List集合 362217990 多线程 thread list 集合
昨天发了一个提问，启动5个线程将一个List中的内容，然后将5个线程的内容拼接起来，由于时间比较急迫，自己就写了一个Demo，希望对菜鸟有参考意义。。 import java.util.ArrayList; import java.util.List; import java.util.concurrent.CountDownLatch; public c
JSP简单访问数据库香水浓 sql mysql jsp
学习使用javaBean，代码很烂，仅为留个脚印 public class DBHelper { private String driverName; private String url; private String user; private String password; private Connection connection; privat
Flex4中使用组件添加柱状图、饼状图等图表 AdyZhang Flex
1.添加一个最简单的柱状图 ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 <?xml version= "1.0"&n
Android 5.0 - ProgressBar 进度条无法展示到按钮的前面 aijuans android
在低于SDK < 21 的版本中，ProgressBar 可以展示到按钮前面，并且为之在按钮的中间，但是切换到android 5.0后进度条ProgressBar 展示顺序变化了，按钮再前面，ProgressBar 在后面了我的xml配置文件如下： [html] view plain copy <RelativeLa
查询汇总的sql baalwolf sql
select list.listname, list.createtime,listcount from dream_list as list , (select listid,count(listid) as listcount from dream_list_user group by listid order by count(
Linux du命令和df命令区别 BigBird2012 linux
1，两者区别 du，disk usage,是通过搜索文件来计算每个文件的大小然后累加，du能看到的文件只是一些当前存在的，没有被删除的。他计算的大小就是当前他认为存在的所有文件大小的累加和。
AngularJS中的$apply，用还是不用？ bijian1013 JavaScript AngularJS $apply
在AngularJS开发中，何时应该调用$scope.$apply()，何时不应该调用。下面我们透彻地解释这个问题。但是首先，让我们把$apply转换成一种简化的形式。 scope.$apply就像一个懒惰的工人。它需要按照命
[Zookeeper学习笔记十]Zookeeper源代码分析之ClientCnxn数据序列化和反序列化 bit1129 zookeeper
ClientCnxn是Zookeeper客户端和Zookeeper服务器端进行通信和事件通知处理的主要类，它内部包含两个类，1. SendThread 2. EventThread， SendThread负责客户端和服务器端的数据通信，也包括事件信息的传输，EventThread主要在客户端回调注册的Watchers进行通知处理 ClientCnxn构造方法 &
【Java命令一】jmap bit1129 Java命令
jmap命令的用法： [hadoop@hadoop sbin]$ jmap Usage: jmap [option] <pid> (to connect to running process) jmap [option] <executable <core> (to connect to a
Apache 服务器安全防护及实战 ronin47
此文转自IBM. Apache 服务简介 Web 服务器也称为 WWW 服务器或 HTTP 服务器 (HTTP Server)，它是 Internet 上最常见也是使用最频繁的服务器之一，Web 服务器能够为用户提供网页浏览、论坛访问等等服务。由于用户在通过 Web 浏览器访问信息资源的过程中，无须再关心一些技术性的细节，而且界面非常友好，因而 Web 在 Internet 上一推出就得到
unity 3d实例化位置出现布置？ brotherlamp unity教程 unity unity资料 unity视频 unity自学
问：unity 3d实例化位置出现布置？答：实例化的同时就可以指定被实例化的物体的位置,即 position Instantiate (original : Object, position : Vector3, rotation : Quaternion) : Object 这样你不需要再用Transform.Position了, 如果你省略了第二个参数(
《重构，改善现有代码的设计》第八章 Duplicate Observed Data bylijinnan java 重构
import java.awt.Color; import java.awt.Container; import java.awt.FlowLayout; import java.awt.Label; import java.awt.TextField; import java.awt.event.FocusAdapter; import java.awt.event.FocusE
struts2更改struts.xml配置目录 chiangfai struts.xml
struts2默认是读取classes目录下的配置文件，要更改配置文件目录，比如放在WEB-INF下，路径应该写成../struts.xml(非/WEB-INF/struts.xml) web.xml文件修改如下： <filter> <filter-name>struts2</filter-name> <filter-class&g
redis做缓存时的一点优化 chenchao051 redis hadoop pipeline
最近集群上有个job，其中需要短时间内频繁访问缓存，大概7亿多次。我这边的缓存是使用redis来做的，问题就来了。首先，redis中存的是普通kv，没有考虑使用hash等解结构，那么以为着这个job需要访问7亿多次redis，导致效率低，且出现很多redi
mysql导出数据不输出标题行 daizj mysql 数据导出去掉第一行去掉标题
当想使用数据库中的某些数据，想将其导入到文件中，而想去掉第一行的标题是可以加上-N参数如通过下面命令导出数据： mysql -uuserName -ppasswd -hhost -Pport -Ddatabase -e " select * from tableName" > exportResult.txt 结果为： studentid
phpexcel导出excel表简单入门示例 dcj3sjt126com PHP Excel phpexcel
先下载PHPEXCEL类文件，放在class目录下面，然后新建一个index.php文件，内容如下 <?php error_reporting(E_ALL); ini_set('display_errors', TRUE); ini_set('display_startup_errors', TRUE); if (PHP_SAPI == 'cli') die('
爱情格言 dcj3sjt126com 格言
1) I love you not because of who you are, but because of who I am when I am with you. 　　我爱你，不是因为你是一个怎样的人，而是因为我喜欢与你在一起时的感觉。 　　2) No man or woman is worth your tears, and the one who is, won‘t
转 Activity 详解——Activity文档翻译 e200702084 android UI sqlite 配置管理网络应用
activity 展现在用户面前的经常是全屏窗口，你也可以将 activity 作为浮动窗口来使用（使用设置了 windowIsFloating 的主题），或者嵌入到其他的 activity （使用 ActivityGroup ）中。当用户离开 activity 时你可以在 onPause() 进行相应的操作。更重要的是，用户做的任何改变都应该在该点上提交 ( 经常提交到 ContentPro
win7安装MongoDB服务 geeksun mongodb
1. 下载MongoDB的windows版本：mongodb-win32-x86_64-2008plus-ssl-3.0.4.zip，Linux版本也在这里下载，下载地址： http://www.mongodb.org/downloads 2. 解压MongoDB在D:\server\mongodb, 在D:\server\mongodb下创建d
Javascript魔法方法:__defineGetter__,__defineSetter__ hongtoushizi js
转载自： http://www.blackglory.me/javascript-magic-method-definegetter-definesetter/ 在javascript的类中,可以用defineGetter和defineSetter_控制成员变量的Get和Set行为例如,在一个图书类中,我们自动为Book加上书名符号: function Book(name){
错误的日期格式可能导致走nginx proxy cache时不能进行304响应 jinnianshilongnian cache
昨天在整合某些系统的nginx配置时，出现了当使用nginx cache时无法返回304响应的情况，出问题的响应头： Content-Type:text/html; charset=gb2312 Date:Mon, 05 Jan 2015 01:58:05 GMT Expires:Mon , 05 Jan 15 02:03:00 GMT Last-Modified:Mon, 05
数据源架构模式之行数据入口 home198979 PHP 架构行数据入口
注：看不懂的请勿踩，此文章非针对java，java爱好者可直接略过。一、概念行数据入口（Row Data Gateway）：充当数据源中单条记录入口的对象，每行一个实例。二、简单实现行数据入口为了方便理解，还是先简单实现： <?php /** * 行数据入口类 */ class OrderGateway { /*定义元数
Linux各个目录的作用及内容 pda158 linux 脚本
1）根目录“/” 　　根目录位于目录结构的最顶层，用斜线（/）表示，类似于 Windows 操作系统的“C:\“，包含Fedora操作系统中所有的目录和文件。　　2）/bin 　　/bin 　　目录又称为二进制目录，包含了那些供系统管理员和普通用户使用的重要 linux命令的二进制映像。该目录存放的内容包括各种可执行文件，还有某些可执行文件的符号连接。常用的命令有：cp、d
ubuntu12.04上编译openjdk7 ol_beta HotSpot jvm jdk OpenJDK
获取源码从openjdk代码仓库获取(比较慢) 安装mercurial Mercurial是一个版本管理工具。 sudo apt-get install mercurial 将以下内容添加到$HOME/.hgrc文件中，如果没有则自己创建一个： [extensions] forest=/home/lichengwu/hgforest-crew/forest.py fe
将数据库字段转换成设计文档所需的字段 vipbooks 设计模式工作正则表达式
哈哈，出差这么久终于回来了，回家的感觉真好！ PowerDesigner的物理数据库一出来，设计文档中要改的字段就多得不计其数，如果要把PowerDesigner中的字段一个个Copy到设计文档中，那将会是一件非常痛苦的事情。