weixin_34148456

使用wget工具抓取网页和图片成功尝试

使用wget工具抓取网页和图片

发表于1年前(2014-12-17 11:29) 阅读（ 2471） | 评论（14） 85人收藏此文章, 我要收藏

wget 网页抓取图片抓取

目录[-]

奇怪的需求
wget概述
wget尝试
wget正解

奇怪的需求

公司需要将服务器的网页缓存到路由器，用户在访问该网页时就直接取路由器上的缓存即可。虽然我不知道这个需求有什么意义，但还是尽力去实现吧。

wget概述

wget是unix和类unix下的一个网页抓取工具，待我熟悉它后，发现它的功能远不止这些。但是这篇博文只说怎么抓取一个指定URL以及它下面的相关内容（包括html,js,css,图片）并将内容里的绝对路径换成相对路径。网上搜到一堆有关wget的文章，关于它怎么抓取网页和相关的图片资源，反正我是没有找到一篇实用的，都以失败告终。

这是wget -h > ./help_wget.txt 后的文件内容

        ? 
      
          GNU  Wget 1.16, a non-interactive network retriever. 
           
 Usage: wget [OPTION]... [URL]... 
           
 Mandatory arguments to long options are mandatory  for short options too. 
           
 Startup: 
           
    -V,  --version                   display the version of  Wget and  exit . 
           
    -h,  --help                      print this help. 
           
    -b,  --background                go to background after startup. 
           
    -e,  --execute=COMMAND           execute a `.wgetrc'-style  command . 
           
 Logging and input  file : 
           
    -o,  --output- file =FILE          log messages to FILE. 
           
    -a,  --append-output=FILE        append messages to FILE. 
           
    -q,  --quiet                     quiet (no output). 
           
    - v ,  --verbose                   be verbose (this is the default). 
           
    -nv, --no-verbose                turn off verboseness, without being quiet. 
           
         --report-speed=TYPE         Output bandwidth as TYPE.  TYPE can be bits. 
           
    -i,  --input- file =FILE           download URLs found  in local or external FILE. 
           
    -F,  --force-html                treat input  file as HTML. 
           
    -B,  --base=URL                  resolves HTML input- file links (-i -F) 
           
                                     relative to URL. 
           
         --config=FILE               Specify config  file to use. 
           
         --no-config                 Do not  read any config  file . 
           
 Download: 
           
    -t,  --tries=NUMBER               set number of retries to NUMBER (0 unlimits). 
           
         --retry-connrefused         retry even  if connection is refused. 
           
    -O,  --output-document=FILE      write documents to FILE. 
           
    - nc , --no-clobber                skip downloads that would download to 
           
                                     existing files (overwriting them). 
           
    -c,  -- continue                  resume getting a partially-downloaded  file . 
           
         --start-pos=OFFSET          start downloading from zero-based position OFFSET. 
           
         --progress=TYPE              select progress gauge  type . 
           
         --show-progress             display the progress bar  in any verbosity mode. 
           
    -N,  --timestamping              don't re-retrieve files unless newer than 
           
                                     local . 
           
    --no-use-server-timestamps       don 't set the local file' s timestamp by 
           
                                     the one on the server. 
           
    -S,  --server-response           print server response. 
           
         --spider                    don't download anything. 
           
    -T,  --timeout=SECONDS            set all timeout values to SECONDS. 
           
         --dns-timeout=SECS           set the DNS lookup timeout to SECS. 
           
         --connect-timeout=SECS       set the connect timeout to SECS. 
           
         -- read -timeout=SECS          set the  read timeout to SECS. 
           
    -w,  --wait=SECONDS              wait SECONDS between retrievals. 
           
         --waitretry=SECONDS         wait 1..SECONDS between retries of a retrieval. 
           
         --random-wait               wait from 0.5*WAIT...1.5*WAIT secs between retrievals. 
           
         --no-proxy                  explicitly turn off proxy. 
           
    -Q,  -- quota =NUMBER               set retrieval  quota to NUMBER. 
           
         --bind-address=ADDRESS      bind to ADDRESS ( hostname or IP) on  local host. 
           
         --limit-rate=RATE           limit download rate to RATE. 
           
         --no-dns-cache              disable caching DNS lookups. 
           
         --restrict- file -names=OS    restrict chars  in file names to ones OS allows. 
           
         --ignore- case               ignore  case when matching files /directories . 
           
    -4,  --inet4-only                connect only to IPv4 addresses. 
           
    -6,  --inet6-only                connect only to IPv6 addresses. 
           
         --prefer-family=FAMILY      connect first to addresses of specified family, 
           
                                     one of IPv6, IPv4, or none. 
           
         --user=USER                  set both  ftp and http user to USER. 
           
         --password=PASS              set both  ftp and http password to PASS. 
           
         --ask-password              prompt  for passwords. 
           
         --no-iri                    turn off IRI support. 
           
         -- local -encoding=ENC        use ENC as the  local encoding  for IRIs. 
           
         --remote-encoding=ENC       use ENC as the default remote encoding. 
           
         --unlink                    remove  file before clobber. 
           
 Directories: 
           
    -nd, --no-directories            don't create directories. 
           
    -x,  --force-directories         force creation of directories. 
           
    -nH, --no-host-directories       don't create host directories. 
           
         --protocol-directories      use protocol name  in directories. 
           
    -P,  --directory-prefix=PREFIX   save files to PREFIX/... 
           
         -- cut - dirs =NUMBER           ignore NUMBER remote directory components. 
           
 HTTP options: 
           
         --http-user=USER             set http user to USER. 
           
         --http-password=PASS         set http password to PASS. 
           
         --no-cache                  disallow server-cached data. 
           
         --default-page=NAME         Change the default page name (normally 
           
                                     this is `index.html'.). 
           
    -E,  --adjust-extension          save HTML /CSS documents with proper extensions. 
           
         --ignore-length             ignore `Content-Length' header field. 
           
         --header=STRING             insert STRING among the headers. 
           
         --max-redirect              maximum redirections allowed per page. 
           
         --proxy-user=USER            set USER as proxy username. 
           
         --proxy-password=PASS        set PASS as proxy password. 
           
         --referer=URL               include `Referer: URL' header  in HTTP request. 
           
         --save-headers              save the HTTP headers to  file . 
           
    -U,  --user-agent=AGENT          identify as AGENT instead of  Wget /VERSION . 
           
         --no-http-keep-alive        disable HTTP keep-alive (persistent connections). 
           
         --no-cookies                don't use cookies. 
           
         --load-cookies=FILE         load cookies from FILE before session. 
           
         --save-cookies=FILE         save cookies to FILE after session. 
           
         --keep-session-cookies      load and save session (non-permanent) cookies. 
           
         --post-data=STRING          use the POST method; send STRING as the data. 
           
         --post- file =FILE            use the POST method; send contents of FILE. 
           
         --method=HTTPMethod         use method  "HTTPMethod" in the request. 
           
         --body-data=STRING          Send STRING as data. --method MUST be  set . 
           
         --body- file =FILE            Send contents of FILE. --method MUST be  set . 
           
         --content-disposition       honor the Content-Disposition header when 
           
                                     choosing  local file names (EXPERIMENTAL). 
           
         --content-on-error          output the received content on server errors. 
           
         --auth-no-challenge         send Basic HTTP authentication information 
           
                                     without first waiting  for the server's 
           
                                     challenge. 
           
 HTTPS (SSL /TLS ) options: 
           
         --secure-protocol=PR        choose secure protocol, one of auto, SSLv2, 
           
                                     SSLv3, TLSv1 and PFS. 
           
         --https-only                only follow secure HTTPS links 
           
         --no-check-certificate      don 't validate the server' s certificate. 
           
         --certificate=FILE          client certificate  file . 
           
         --certificate- type =TYPE     client certificate  type , PEM or DER. 
           
         --private-key=FILE          private key  file . 
           
         --private-key- type =TYPE     private key  type , PEM or DER. 
           
         --ca-certificate=FILE        file with the bundle of CA's. 
           
         --ca-directory=DIR          directory where  hash list of CA's is stored. 
           
         --random- file =FILE           file with random data  for seeding the SSL PRNG. 
           
         --egd- file =FILE              file naming the EGD socket with random data. 
           
 FTP options: 
           
         -- ftp -user=USER              set ftp user to USER. 
           
         -- ftp -password=PASS          set ftp password to PASS. 
           
         --no-remove-listing         don 't remove `.listing' files. 
           
         --no-glob                   turn off FTP  file name globbing. 
           
         --no-passive- ftp            disable the  "passive" transfer mode. 
           
         --preserve-permissions      preserve remote  file permissions. 
           
         --retr-symlinks             when recursing, get linked-to files (not  dir ). 
           
 WARC options: 
           
         --warc- file =FILENAME        save request /response data to a .warc.gz  file . 
           
         --warc-header=STRING        insert STRING into the warcinfo record. 
           
         --warc-max-size=NUMBER       set maximum size of WARC files to NUMBER. 
           
         --warc-cdx                  write CDX index files. 
           
         --warc-dedup=FILENAME        do not store records listed  in this CDX  file . 
           
         --no-warc-compression        do not compress WARC files with GZIP. 
           
         --no-warc-digests            do not calculate SHA1 digests. 
           
         --no-warc-keep-log           do not store the log  file in a WARC record. 
           
         --warc-tempdir=DIRECTORY    location  for temporary files created by the 
           
                                     WARC writer. 
           
 Recursive download: 
           
    -r,  --recursive                 specify recursive download. 
           
    -l,  --level=NUMBER              maximum recursion depth (inf or 0  for infinite). 
           
         --delete-after              delete files locally after downloading them. 
           
    -k,  --convert-links              make links  in downloaded HTML or CSS point to 
           
                                     local files. 
           
         --backups=N                 before writing  file X, rotate up to N backup files. 
           
    -K,  --backup-converted          before converting  file X, back up as X.orig. 
           
    -m,  --mirror                    shortcut  for -N -r -l inf --no-remove-listing. 
           
    -p,  --page-requisites           get all images, etc. needed to display HTML page. 
           
         --strict-comments           turn on strict (SGML) handling of HTML comments. 
           
 Recursive accept /reject : 
           
    -A,  --accept=LIST               comma-separated list of accepted extensions. 
           
    -R,  --reject=LIST               comma-separated list of rejected extensions. 
           
         --accept-regex=REGEX        regex matching accepted URLs. 
           
         --reject-regex=REGEX        regex matching rejected URLs. 
           
         --regex- type =TYPE           regex  type (posix). 
           
    -D,  --domains=LIST              comma-separated list of accepted domains. 
           
         --exclude-domains=LIST      comma-separated list of rejected domains. 
           
         --follow- ftp                follow FTP links from HTML documents. 
           
         --follow-tags=LIST          comma-separated list of followed HTML tags. 
           
         --ignore-tags=LIST          comma-separated list of ignored HTML tags. 
           
    -H,  --span-hosts                go to foreign hosts when recursive. 
           
    -L,  --relative                  follow relative links only. 
           
    -I,  --include-directories=LIST  list of allowed directories. 
           
         --trust-server-names  use the name specified by the redirection 
           
                                     url last component. 
           
    -X,  --exclude-directories=LIST  list of excluded directories. 
           
    -np, --no-parent   don't ascend to the parent directory. 
           
 Mail bug reports and suggestions to .

wget尝试

根据wget的帮助文档，我尝试了下面这条命令

        ? 
      
          wget -r -np -pk -nH -P . /download http: //www .baidu.com

解释一下这些参数

-r 递归下载所有内容

-np 只下载给定URL下的内容，不下载它的上级内容

-p 下载有关页面需要用到的所有资源，包括图片和css样式

-k 将绝对路径转换为相对路径（这个很重要，为了在用户打开网页的时候，加载的相关资源都在本地寻找）

-nH 禁止wget以接收的URL为名称创建文件夹（如果没有这个，这条命令会将下载的内容存在./download/www.baidu.com/下）

-P 下载到哪个路径，这里是当前文件夹下的download文件夹下，没有的话，wget会帮你自动创建

这些选项都符合目前的这个需求，单结果很意外，并不是我们想象的那么简单，wget并没有给我们想要的东西

你如果执行了这条命令，会发现在当前的download文件夹中只是下载了一个index.html和一个robots.txt，而index.html文件所需要的图片也并没有被下载

标签中的路径也没有被替换成相对路径，可能只是去掉了"http:"这个字符串而已。

至于为什么会这样，请继续往下看。

wget正解

因为上面的命令行不通，所以，脑洞全开。来吧，让我们写一个shell脚本，名称为wget_cc内容如下

        ? 
      
          #!/bin/sh 
           
 URL= "$2" 
           
 PATH= "$1" 
           
 echo "download url: $URL" 
           
 echo "download dir: $PATH" 
           
 /usr/bin/wget -e robots=off -w 1 -xq -np -nH -pk -m  -t 1 -P  "$PATH" "$URL" 
           
 echo "success to download"

需要注意的是，我的wget是在/usr/bin目录下（这里必须写全路径），你可以使用which wget这个命令确定你的wget路径所在，然后替换到脚本中就行了。

这里多加了几个参数，解释一下：

-e 用法是‘-e command’

用来执行额外的.wgetrc命令。就像vim的配置存在.vimrc文件中一样，wget也用.wgetrc文件来存放它的配置。也就是说在wget执行之前，会先执行.wgetrc文件中的配置命令。一个典型的.wgetrc文件可以参考：

http://www.gnu.org/software/wget/manual/html_node/Sample-Wgetrc.html

http://www.gnu.org/software/wget/manual/html_node/Wgetrc-Commands.html

用户可以在不改写.wgetrc文件的情况下，用-e选项指定额外的配置命令。如果想要制定多个配置命令，-e command1 -e command2 ... -e commandN即可。这些制定的配置命令，会在.wgetrc中所有命令之后执行，因此会覆盖.wgetrc中相同的配置项。

这里robots=off是因为wget默认会根据网站的robots.txt进行操作，如果robots.txt里是User-agent: * Disallow: /的话，wget是做不了镜像或者下载目录的。

这就是前面为什么下载不了图片和其他资源的原因所在了，因为你要爬的HOST禁止蜘蛛去爬它，而wget使用 -e robots=off 这个选项可以通过这个命令绕过这个限制。

-x 创建镜像网站对应的目录结构

-q 静默下载，即不显示下载信息，你如果想知道wget当前在下载什么资源的话，可以去掉这个选项

-m 它会打开镜像相关的选项，比如无限深度的子目录递归下载。

-t times 某个资源下载失败后的重试下载次数

-w seconds 资源请求下载之间的等待时间（减轻服务器的压力）

剩下有不懂的你就去挖文档吧。

写好后保存退出，执行：

        ? 
      
          chmod 744 wget_cc

OK，这样脚本就能直接执行，而不用在每条命令前带 /bin/sh 让sh去解释它了。

下面就让脚本执行起来吧！

        ? 
      
          . /wget_cc . /download http: //www .baidu.com

下载完成后的目录结构

OK，然后再查看标签中的src属性，

src="img/bd_logo1.png"

果然换成了相对路径啊，大功告成，觉得对您有帮助的请点个赞吧！

你可能感兴趣的:(shell,lua,运维)

python os.environ_python os.environ 读取和设置环境变量 weixin_39605414 python os.environ
>>>importos>>>os.environ.keys()['LC_NUMERIC','GOPATH','GOROOT','GOBIN','LESSOPEN','SSH_CLIENT','LOGNAME','USER','HOME','LC_PAPER','PATH','DISPLAY','LANG','TERM','SHELL','J2REDIR','LC_MONETARY','QT_QPA
使用 FinalShell 进行远程连接（ssh 远程连接 Linux 服务器）编程经验分享开发工具服务器 ssh linux
目录前言基本使用教程新建远程连接连接主机自定义命令路由追踪前言后端开发，必然需要和服务器打交道，部署应用，排查问题，查看运行日志等等。一般服务器都是集中部署在机房中，也有一些直接是云服务器，总而言之，程序员不可能直接和服务器直接操作，一般都是通过ssh连接来登录服务器。刚接触远程连接时，使用的是XSHELL来远程连接服务器，连接上就能够操作远程服务器了，但是仅用XSHELL并没有上传下载文件的功能
简介Shell、zsh、bash zhaosuningsn Shell zsh bash shell linux bash
Shell是Linux和Unix的外壳，类似衣服，负责外界与Linux和Unix内核的交互联系。例如接收终端用户及各种应用程序的命令，把接收的命令翻译成内核能理解的语言，传递给内核，并把内核处理接收的命令的结果返回给外界，即Shell是外界和内核沟通的桥梁或大门。Linux和Unix提供了多种Shell，其中有种bash，当然还有其他好多种。Mac电脑中不但有bash，还有一个zsh，预装的，据说
Shell、Bash、Zsh这都是啥啊小白码上飞 bash linux 开发语言
Zsh和Bash都是我们常用的Shell，那先搞明白啥是shell吧。Shell作为一个单词，他是“壳”的意思，蛋壳坚果壳。之所以叫壳，是为了和计算机的“核”来区分，用它表示“为使用者提供的操作界面”。所以这个命名其实很形象，翻译成中文，直译过来叫“壳层”。个人认为这个叫法很奇怪，意译貌似也没有什么好的词汇来匹配。就还是叫shell吧。维基百科给的定义是：Incomputing,ashellisa
ExpRe[25] bash外的其它shell：zsh和fish tritone ExpRe bash linux ubuntu shell
文章目录zsh基础配置实用特性插件`autojump`语法高亮自动补全fish优点缺点时效性本篇撰写时间为2021.12.15，由于计算机技术日新月异，博客中所有内容都有时效和版本限制，具体做法不一定总行得通，链接可能改动失效，各种软件的用法可能有修改。但是其中透露的思想往往是值得学习的。本篇前置：ExpRe[10]Ubuntu[2]准备神秘软件、备份恢复软件https://www.cnblogs
Linux sh命令 fengyehongWorld Linux linux
目录一.基本语法二.选项2.1-c字符串中读取内容，并执行2.1.1基本用法2.1.2获取当前目录下失效的超链接2.2-x每个命令执行之前，将其打印出来2.3结合Here文档使用一.基本语法⏹Linux和Unix系统中用于执行shell脚本或运行命令的命令。sh[选项][脚本文件][参数...]⏹选项-c：从字符串中读取内容，并执行。-x：在每个命令执行之前，将其打印出来。-s：从标准流中读取内容
简单说说关于shell中zsh和bash的选择秋刀prince MacOS 小猿们的开发日常 bash
希望文章能给到你启发和灵感～如果觉得文章对你有帮助的话，点赞+关注+收藏支持一下博主吧～阅读指南开篇说明一、基础环境说明1.1硬件环境1.2软件环境二、什么是shell、bash、zsh?2.1bash2.2zsh三、选择Bash还是Zsh？四、一些常见问题开篇说明本篇主要简单说明一下，shell中bash和zsh的区别和选择；我们经常会把这两个搞混，不知道什么时候用哪一个，以及怎么使用；一、基础
python结束子进程_如何清除python中的子进程 weixin_39995943 python结束子进程
我们使用python进程来管理长时间运行的python子进程。有时需要终止子进程。kill命令不会完全终止进程，只会使其失效。运行以下脚本将演示此行为。importsubprocessp=subprocess.Popen(['sleep','400'],stdout=subprocess.PIPE,shell=False)或者p=subprocess.Popen('sleep400',stdout
linux脚本sed替换变量,sed 命令中替换值为shell变量诺坎普之约 linux脚本sed替换变量
文章目录sed命令中替换值为shell变量替换基本语法sed中替换使用shell变量总结参考文档sed命令中替换值为shell变量替换基本语法大家都是sed有很多用法，最多就应该是替换一些值了。让我们先回忆sed的替换语法。在sed进行替换的时候sed-i's/old/new/g'1.txtecho"hellooldfrank"|sed's/old/new/g'结果如下：hellonewfrank
Shell脚本中sed使用 jcrhl321 linux
目录一、sed编辑器1、sed概述2、sed的工作流程3、sed命令的常见格式4、sed命令常用操作二、sed常用命令使用1、sed打印2、sed删除3、sed替换4、sed插入与增加4、sed剪切粘贴与复制粘贴一、sed编辑器sed（StreamEDitor）是一个强大而简单的文本解析转换工具，可以读取文本，并根据指定的条件对文本内容进行编辑（删除、替换、添加、移动等），最后输出所有行或者仅输出
2020年最新程序员职业发展路线指南，超详细！编程流川枫 11 编程语言程序员互联网 IT 职业
【文章来源微信公众号：每天学编程】01、程序员的特性技术出身的职场人特性很明显，与做市场、业务出身的职场人区别尤其明显。IT行业中常见的一些职场角色：老板、项目经理、产品经理、需求分析师、设计师、开发工程师、运维工程师等。开发工程师具有如下特征：1、逻辑思维清晰、严谨和细腻；但是有时不容易转弯，有些程序员容易较劲、钻牛角尖。2、性格偏内向、不善于沟通、表达和交际；但是在网络聊天工具上，有些显为幽默
shell脚本中sed命令如何使用变量歪歪的酒壶 linux
在shell脚本中我们常常需要使用sed命令进行配置文件的更新，但是更新的内容又往往根据环境相关。值并不是固定的。这里我们介绍一种在sed命令中使用变量的方法。比如，在nginx的配置中，我们需要根据环境来更新/etc/nginx/sites-available/default中的目录配置。通常我们采用一个变量，来记录当前环境需要配置的目录比如：dist_dir=/home/dev/code/ui
【从问题中去学习k8s】k8s中的常见面试题（夯实理论基础）（二十八）向往风的男子 k8s 学习 kubernetes 容器
本站以分享各种运维经验和运维所需要的技能为主《python零基础入门》：python零基础入门学习《python运维脚本》：python运维脚本实践《shell》：shell学习《terraform》持续更新中：terraform_Aws学习零基础入门到最佳实战《k8》从问题中去学习k8s《docker学习》暂未更新《ceph学习》ceph日常问题解决分享《日志收集》ELK+各种中间件《运维日常》
spring security中几大组件的作用和执行顺序阿信在这里 java spring
springsecurity中几大组件的作用和执行顺序在SpringSecurity中，AuthenticationProvider、GroupPermissionEvaluator、PermissionEvaluator、AbstractAuthenticationProcessingFilter、DefaultMethodSecurityExpressionHandler和ManageSecu
【显示后台运行 & 的命令】晨春计 debug linux 服务器运维
目录背景步骤详解示例背景当你在Linuxshell中使用&符号将一个命令放到后台运行时，你可以使用jobs命令来查看这些后台进程的状态。但是，jobs命令并不会直接显示进程的PID（进程ID）。它会显示一个作业列表，其中包括每个作业的状态和一个作业标识符（通常是百分号%后面跟着一个数字），但不会直接显示PID。获取后台进程的PID步骤：1、使用jobs命令查看后台作业。2、使用ps命令配合grep
Android shell 常用 debug 命令晨春计 Audio debug android linux
目录1、查看版本2、am命令3、pm命令4、dumpsys命令5、sed命令6、log定位查看APK进程号7、log定位使用场景1、查看版本1.1、Android串口终端执行getpropro.build.version.release#获取Android版本uname-a#查看linux内核版本信息uname-r#单独查看内核版本1.2、linux服务器执行lsb_release-a#查看Lin
Ubuntu常用命令整理十里染林
ubuntu16.04server开启ssh:使用x-shell连接主机，发现22端口没有打开，开启ssh服务：安装openssh-serversudoapt-getinstallopenssh-server检查安装是否成功sudops-e|grepssh开启ssh服务sudoservicesshstartUbuntu开启/关闭防火墙:开启防火墙sudoufwenable关闭防火墙sudoufwd
CentOS7 安装MySQL5.7.44 不要Null了 java centos mysql
1.下载mysql安装包，我放在百度网盘里(下方链接)链接：https://pan.baidu.com/s/1_Mn1XW_1mWdTV4mhnLG66A提取码：s31n2.首先看看以前是否安装过mysqlrpm-qa|grep-imysql如果已经安装过mysql会提示卸载mysqlrpm-emysql-…3.使用FinallShell或者Xftp进行上传放到/usr/local/mysql，没
ruby和python哪个好学 hakesashou python基础知识 ruby python 开发语言
Ruby和python都挺好学的。建议学习Python，语法的话，Python相对更简洁。而且Python应用场合更广泛，运维、网站开发、数据处理、科学研究都可以。Ruby和Python十分相似，有很多共同点，但也有一些不同之外，以下是Python和Ruby的对比：1、Python和Ruby都是面向对象的语言，都是动态和灵活的。二者的主要区别在于他们解决问题的方式。Ruby提供了不同的方法，而Py
Lua 与 C#交互 z2014z lua c#开发语言
Lua与C#交互前提Lua是一种嵌入式脚本语言，Lua的解释器是用C编写的，因此可以方便的与C/C++进行相互调用。轻量级Lua语言的官方版本只包括一个精简的核心和最基本的库，这使得Lua体积小、启动速度快，也适合嵌入在别的程序里。交互过程C#调用Lua:由C#文件调用Lua解析器底层dll库（由C语言编写），再由dll文件执行相应的Lua文件。Lua调用C#：1、Wrap方式：首先生成C#源文件
基于Python执行lua脚本 xu-jssy Python自动化脚本 python lua 自动化 rpa
一、依赖安装pipinstalllupa二、源码将lua文件存放在base_path路径，将lua文件名称（不包含后缀名）传递给lua_runner函数即可importmultiprocessingimportlupa#lua文件存放位置base_path='D:\\test\\lua'classLuaFuncion:#创建Lua运行时环境lua=lupa.LuaRuntime(unpack_re
Python实现mysql命令行 xu-jssy python mysql adb
一、源码importosimportpymysqldefsql_shell():password=input("EnterPassword:")#访问密码ifpassword.strip()!="yyds":print("Bye")return#清空控制台输出os.system("cls"ifos.name=="nt"else"clear")try:#连接到MySQL数据库conn=pymysql
华为云分布式缓存服务DCS与开源服务差异对比 hcinfo_18 redis使用华为云 Redis5.0 分布式缓存服务 Redis客户端
分布式缓存服务DCS提供单机、主备、集群等丰富的实例类型，满足用户高读写性能及快速数据访问的业务诉求。支持丰富的实例管理操作，帮助用户省去运维烦恼。用户可以聚焦于业务逻辑本身，而无需过多考虑部署、监控、扩容、安全、故障恢复等方面的问题。DCS基于开源Redis、Memcached向用户提供一定程度定制化的缓存服务，因此，除了拥有开源服务缓存数据库的优秀特性，DCS提供更多实用功能。一、与开源Red
软件测试/测试开发/全日制 |利用Django REST framework构建微服务霍格沃兹-慕漓 django 微服务 sqlite
霍格沃兹测试开发学社推出了《Python全栈开发与自动化测试班》。本课程面向开发人员、测试人员与运维人员，课程内容涵盖Python编程语言、人工智能应用、数据分析、自动化办公、平台开发、UI自动化测试、接口测试、性能测试等方向。为大家提供更全面、更深入、更系统化的学习体验，课程还增加了名企私教服务内容，不仅有名企经理为你1v1辅导，还有行业专家进行技术指导，针对性地解决学习、工作中遇到的难题。让找
服务器状态监控php源码,服务器状态监控_监控Linux服务器网站状态的SHELL脚本温糯米服务器状态监控php源码
摘要腾兴网为您分享:监控Linux服务器网站状态的SHELL脚本，蜗牛集市，同花顺，探客宝，手柄助手等软件知识，以及日期倒计时插件，云南省教育资源公共，rui手机桌面，小屁孩桌面便签，合金装备崛起复仇，朝夕日历，photoshop图像处理软件,一年级学生每日计划表，悟空找房，饿了吗外卖商家版，逃生，中国民宿网，realpolitiks，交通安全知识竞赛，雅思流利说等软件it资讯，欢迎关注腾兴网。1
华为USG6000E-S12防火墙Key exchange failed.无法SSH解决方案 redmond88 网络技术 ssh 华为运维
由于目前防火墙算法太新，导致crt和xshell的版本无法登陆，按以下方法解决一、下载华为本地加载除弱安全算法组件包之外的组件包https://download.csdn.net/download/redmond88/89620664?spm=1001.2014.3001.5503二、先改后缀名为.cfg,上传文件到防火墙三、在用户视图下改后缀名为.mod四、move文件到$_install_mo
Mac配置环境变量的地方哪个鹿
Mac配置环境变量的地方①/etc/profile（建议不修改这个文件）全局（公有）配置，不管是哪个用户，登录时都会读取该文件。②/etc/bashrc（一般在这个文件中添加系统级环境变量）全局（公有）配置，bashshell执行时，不管是何种方式，都会读取此文件。③~/.bash_profile（一般在这个文件中添加用户级环境变量）每个用户都可使用该文件输入专用于自己使用的shell信息,当用户
docker 安装、运行nginx shell脚本三希 docker nginx 容器
以下是一个简单的用于安装和运行DockerNginx的shell脚本：bash#!/bin/bash#安装Docker（如果还未安装）#请根据实际情况调整安装命令#拉取Nginx镜像dockerpullnginx#运行Nginx容器dockerrun-d--namemynginx-p80:80nginx
mysql 隐秘后门_【技术分享】CVE-2016-5483：利用mysqldump备份可生成后门 Toby Dai mysql 隐秘后门
预估稿费：100RMB投稿方式：发送邮件至linwei#360.cn，或登陆网页版在线投稿前言mysqldump是用来创建MySQL数据库逻辑备份的一个常用工具。它在默认配置下可以生成一个.sql文件，其中包含创建/删除表和插入数据等。在导入转储文件的时候，攻击者可以通过制造恶意表名来实现任意SQL语句查询和shell命令执行的目的。另一个与之相关的漏洞利用场景可以参考。攻击场景攻击者已经能够访问
docker项目切换（nginx）、重启shell 脚本懒惰的小蜗牛 docker docker nginx 容器
docker项目切换、重启脚本背景具体操作nginx配置配置文件1配置文件2编写nginx替换脚本(用来执行端口替换)编写启动脚本dockerfile文件正常编写给脚本授权执行./start脚本背景项目部署docker中，更新项目时，需要将原原来的容器停止，再启动新的容器，这样会有一个空窗期，导致不可用解决方案：映射不同的端口并启动新的容器，将nginx转发到新容器，停止旧容器具体操作说明ngin
java责任链模式 3213213333332132 java 责任链模式村民告县长
责任链模式，通常就是一个请求从最低级开始往上层层的请求，当在某一层满足条件时，请求将被处理，当请求到最高层仍未满足时，则请求不会被处理。就是一个请求在这个链条的责任范围内，会被相应的处理，如果超出链条的责任范围外，请求不会被相应的处理。下面代码模拟这样的效果：创建一个政府抽象类,方便所有的具体政府部门继承它。 package 责任链模式; /** *
linux、mysql、nginx、tomcat 性能参数优化 ronin47
一、linux 系统内核参数 /etc/sysctl.conf文件常用参数 net.core.netdev_max_backlog = 32768 #允许送到队列的数据包的最大数目 net.core.rmem_max = 8388608 #SOCKET读缓存区大小 net.core.wmem_max = 8388608 #SOCKET写缓存区大
php命令行界面 dcj3sjt126com PHP cli
常用选项 php -v php -i PHP安装的有关信息 php -h 访问帮助文件 php -m 列出编译到当前PHP安装的所有模块执行一段代码 php -r 'echo "hello, world!";' php -r 'echo "Hello, World!\n";' php -r '$ts = filemtime("
Filter&Session 171815164 session
Filter HttpServletRequest requ = (HttpServletRequest) req; HttpSession session = requ.getSession(); if (session.getAttribute("admin") == null) { PrintWriter out = res.ge
连接池与Spring,Hibernate结合 g21121 Hibernate
前几篇关于Java连接池的介绍都是基于Java应用的，而我们常用的场景是与Spring和ORM框架结合，下面就利用实例学习一下这方面的配置。 1.下载相关内容： &nb
[简单]mybatis判断数字类型 53873039oycg mybatis
昨天同事反馈mybatis保存不了int类型的属性,一直报错，错误信息如下: Caused by: java.lang.NumberFormatException: For input string: "null" at sun.mis
项目启动时或者启动后ava.lang.OutOfMemoryError: PermGen space 程序员是怎么炼成的 eclipse jvm tomcat catalina.sh eclipse.ini
在启动比较大的项目时，因为存在大量的jsp页面，所以在编译的时候会生成很多的.class文件，.class文件是都会被加载到jvm的方法区中，如果要加载的class文件很多，就会出现方法区溢出异常 java.lang.OutOfMemoryError: PermGen space. 解决办法是点击eclipse里的tomcat，在
我的crm小结 aijuans crm
各种原因吧，crm今天才完了。主要是接触了几个新技术： Struts2、poi、ibatis这几个都是以前的项目中用过的。 Jsf、tapestry是这次新接触的，都是界面层的框架，用起来也不难。思路和struts不太一样，传说比较简单方便。不过个人感觉还是struts用着顺手啊，当然springmvc也很顺手，不知道是因为习惯还是什么。jsf和tapestry应用的时候需要知道他们的标签、主
spring里配置使用hibernate的二级缓存几步 antonyup_2006 java spring Hibernate xml cache
．在spring的配置文件中 applicationContent.xml，hibernate部分加入 xml 代码 <prop key="hibernate.cache.provider_class">org.hibernate.cache.EhCacheProvider</prop> <prop key="hi
JAVA基础面试题百合不是茶抽象实现接口 String类接口继承抽象类继承实体类自定义异常
/* * 栈（stack）：主要保存基本类型（或者叫内置类型）（char、byte、short、 *int、long、 float、double、boolean）和对象的引用，数据可以共享，速度仅次于 * 寄存器（register），快于堆。堆（heap）：用于存储对象。 */ &
让sqlmap文件 "继承" 起来 bijian1013 java ibatis sqlmap
多个项目中使用ibatis , 和数据库表对应的 sqlmap文件（增删改查等基本语句)，dao, pojo 都是由工具自动生成的, 现在将这些自动生成的文件放在一个单独的工程中，其它项目工程中通过jar包来引用，并通过"继承"为基础的sqlmap文件，dao,pojo 添加新的方法来满足项
精通Oracle10编程SQL(13)开发触发器 bijian1013 oracle 数据库 plsql
/* *开发触发器 */ --得到日期是周几 select to_char(sysdate+4,'DY','nls_date_language=AMERICAN') from dual; select to_char(sysdate,'DY','nls_date_language=AMERICAN') from dual; --建立BEFORE语句触发器 CREATE O
【EhCache三】EhCache查询 bit1129 ehcache
本文介绍EhCache查询缓存中数据，EhCache提供了类似Hibernate的查询API，可以按照给定的条件进行查询。要对EhCache进行查询，需要在ehcache.xml中设定要查询的属性数据准备 @Before public void setUp() { //加载EhCache配置文件 Inpu
CXF框架入门实例白糖_ spring Web 框架 webservice servlet
CXF是apache旗下的开源框架，由Celtix + XFire这两门经典的框架合成，是一套非常流行的web service框架。它提供了JAX-WS的全面支持，并且可以根据实际项目的需要，采用代码优先（Code First）或者 WSDL 优先（WSDL First）来轻松地实现 Web Services 的发布和使用，同时它能与spring进行完美结合。在apache cxf官网提供
angular.equals boyitech AngularJS AngularJS API AnguarJS 中文API angular.equals
angular.equals 描述: 比较两个值或者两个对象是不是相等。还支持值的类型，正则表达式和数组的比较。两个值或对象被认为是相等的前提条件是以下的情况至少能满足一项：两个值或者对象能通过=== （恒等）的比较两个值或者对象是同样类型，并且他们的属性都能通过angular
java-腾讯暑期实习生-输入一个数组A[1,2,...n]，求输入B，使得数组B中的第i个数字B[i]=A[0]*A[1]*...*A[i-1]*A[i+1] bylijinnan java
这道题的具体思路请参看何海涛的微博：http://weibo.com/zhedahht import java.math.BigInteger; import java.util.Arrays; public class CreateBFromATencent { /** * 题目：输入一个数组A[1,2,...n]，求输入B，使得数组B中的第i个数字B[i]=A
FastDFS 的安装和配置修订版 Chen.H linux fastDFS 分布式文件系统
FastDFS Home:http://code.google.com/p/fastdfs/ 1. 安装 http://code.google.com/p/fastdfs/wiki/Setup http://hi.baidu.com/leolance/blog/item/3c273327978ae55f93580703.html 安装libevent (对libevent的版本要求为1.4.
[强人工智能]拓扑扫描与自适应构造器 comsci 人工智能
当我们面对一个有限拓扑网络的时候,在对已知的拓扑结构进行分析之后,发现在连通点之后,还存在若干个子网络,且这些网络的结构是未知的,数据库中并未存在这些网络的拓扑结构数据....这个时候,我们该怎么办呢? 那么,现在我们必须设计新的模块和代码包来处理上面的问题
oracle merge into的用法 daizj oracle sql merget into
Oracle中merge into的使用 http://blog.csdn.net/yuzhic/article/details/1896878 http://blog.csdn.net/macle2010/article/details/5980965 该命令使用一条语句从一个或者多个数据源中完成对表的更新和插入数据. ORACLE 9i 中，使用此命令必须同时指定UPDATE 和INSE
不适合使用Hadoop的场景 datamachine hadoop
转自：http://dev.yesky.com/296/35381296.shtml。　　Hadoop通常被认定是能够帮助你解决所有问题的唯一方案。当人们提到“大数据”或是“数据分析”等相关问题的时候，会听到脱口而出的回答：Hadoop! 实际上Hadoop被设计和建造出来，是用来解决一系列特定问题的。对某些问题来说，Hadoop至多算是一个不好的选择，对另一些问题来说，选择Ha
YII findAll的用法 dcj3sjt126com yii
看文档比较糊涂，其实挺简单的： $predictions=Prediction::model()->findAll("uid=:uid",array(":uid"=>10)); 第一个参数是选择条件：”uid=10″。其中:uid是一个占位符，在后面的array(“:uid”=>10)对齐进行了赋值；更完善的查询需要
vim 常用 NERDTree 快捷键 dcj3sjt126com vim
下面给大家整理了一些vim NERDTree的常用快捷键了，这里几乎包括了所有的快捷键了，希望文章对各位会带来帮助。切换工作台和目录 ctrl + w + h 光标 focus 左侧树形目录ctrl + w + l 光标 focus 右侧文件显示窗口ctrl + w + w 光标自动在左右侧窗口切换ctrl + w + r 移动当前窗口的布局位置 o 在已有窗口中打开文件、目录或书签，并跳
Java把目录下的文件打印出来蕃薯耀列出目录下的文件文件夹下面的文件目录下的文件
Java把目录下的文件打印出来 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月11日 11:02:
linux远程桌面----VNCServer与rdesktop hanqunfeng Desktop
windows远程桌面到linux，需要在linux上安装vncserver，并开启vnc服务，同时需要在windows下使用vnc-viewer访问Linux。vncserver同时支持linux远程桌面到linux。 linux远程桌面到windows，需要在linux上安装rdesktop，同时开启windows的远程桌面访问。下面分别介绍，以windo
guava中的join和split功能 jackyrong java
guava库中，包含了很好的join和split的功能，例子如下： 1）将LIST转换为使用字符串连接的字符串 List<String> names = Lists.newArrayList("John", "Jane", "Adam", "Tom");
Web开发技术十年发展历程 lampcy android Web 浏览器 html5
回顾web开发技术这十年发展历程： Ajax 03年的时候我上六年级，那时候网吧刚在小县城的角落萌生。传奇，大话西游第一代网游一时风靡。我抱着试一试的心态给了网吧老板两块钱想申请个号玩玩，然后接下来的一个小时我一直在，注，册，账，号。彼时网吧用的512k的带宽，注册的时候，填了一堆信息，提交，页面跳转，嘣，”您填写的信息有误，请重填”。然后跳转回注册页面，以此循环。我现在时常想，如果当时a
架构师之mima-----------------mina的非NIO控制IOBuffer(说得比较好) nannan408 buffer
1.前言。如题。 2.代码。 IoService IoService是一个接口，有两种实现：IoAcceptor和IoConnector；其中IoAcceptor是针对Server端的实现，IoConnector是针对Client端的实现；IoService的职责包括： 1、监听器管理 2、IoHandler 3、IoSession
ORA-00054:resource busy and acquire with NOWAIT specified Everyday都不同 oracle session Lock
[Oracle] 今天对一个数据量很大的表进行操作时，出现如题所示的异常。此时表明数据库的事务处于“忙”的状态，而且被lock了，所以必须先关闭占用的session。 step1，查看被lock的session： select t2.username, t2.sid, t2.serial#, t2.logon_time from v$locked_obj
javascript学习笔记 tntxia JavaScript
javascript里面有6种基本类型的值:number、string、boolean、object、function和undefined。number：就是数字值，包括整数、小数、NaN、正负无穷。string:字符串类型、单双引号引起来的内容。boolean:true、false object:表示所有的javascript对象，不用多说function:我们熟悉的方法，也就是
Java enum的用法详解 xieke90 enum 枚举
Java中枚举实现的分析：示例： public static enum SEVERITY{ INFO,WARN,ERROR } enum很像特殊的class，实际上enum声明定义的类型就是一个类。而这些类都是类库中Enum类的子类 (java.l