讲解Python的Scrapy爬虫框架使用代理进行采集的方法

1.在Scrapy工程下新建“middlewares.py”

# Importing base64 library because we'll need it ONLY in case if the proxy we are going to use requires authentication
import base64

# Start your middleware class
class ProxyMiddleware(object):
 # overwrite process request
 def process_request(self, request, spider):
  # Set the location of the proxy
  request.meta['proxy'] = "http://YOUR_PROXY_IP:PORT"

  # Use the following lines if your proxy requires authentication
  proxy_user_pass = "USERNAME:PASSWORD"
  # setup basic authentication for the proxy
  encoded_user_pass = base64.encodestring(proxy_user_pass)
  request.headers['Proxy-Authorization'] = 'Basic ' + encoded_user_pass

2.在项目配置文件里(./project_name/settings.py)添加

DOWNLOADER_MIDDLEWARES = {
 'scrapy.contrib.downloadermiddleware.httpproxy.HttpProxyMiddleware': 110,
 'project_name.middlewares.ProxyMiddleware': 100,
}

只要两步，现在请求就是通过代理的了。测试一下^_^

from scrapy.spider import BaseSpider
from scrapy.contrib.spiders import CrawlSpider, Rule
from scrapy.http import Request

class TestSpider(CrawlSpider):
 name = "test"
 domain_name = "whatismyip.com"
 # The following url is subject to change, you can get the last updated one from here :
 # http://www.whatismyip.com/faq/automation.asp
 start_urls = ["http://xujian.info"]

 def parse(self, response):
  open('test.html', 'wb').write(response.body)

3.使用随机user-agent

默认情况下scrapy采集时只能使用一种user-agent，这样容易被网站屏蔽，下面的代码可以从预先定义的user- agent的列表中随机选择一个来采集不同的页面

在settings.py中添加以下代码

DOWNLOADER_MIDDLEWARES = {
  'scrapy.contrib.downloadermiddleware.useragent.UserAgentMiddleware' : None,
  'Crawler.comm.rotate_useragent.RotateUserAgentMiddleware' :400
 }

注意: Crawler; 是你项目的名字，通过它是一个目录的名称下面是蜘蛛的代码

#!/usr/bin/python
#-*-coding:utf-8-*-

import random
from scrapy.contrib.downloadermiddleware.useragent import UserAgentMiddleware

class RotateUserAgentMiddleware(UserAgentMiddleware):
 def __init__(self, user_agent=''):
  self.user_agent = user_agent

 def process_request(self, request, spider):
  #这句话用于随机选择user-agent
  ua = random.choice(self.user_agent_list)
  if ua:
   request.headers.setdefault('User-Agent', ua)

 #the default user_agent_list composes chrome,I E,firefox,Mozilla,opera,netscape
 #for more user agent strings,you can find it in http://www.useragentstring.com/pages/useragentstring.php
 user_agent_list = [\
  "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.1 (KHTML, like Gecko) Chrome/22.0.1207.1 Safari/537.1"\
  "Mozilla/5.0 (X11; CrOS i686 2268.111.0) AppleWebKit/536.11 (KHTML, like Gecko) Chrome/20.0.1132.57 Safari/536.11",\
  "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/536.6 (KHTML, like Gecko) Chrome/20.0.1092.0 Safari/536.6",\
  "Mozilla/5.0 (Windows NT 6.2) AppleWebKit/536.6 (KHTML, like Gecko) Chrome/20.0.1090.0 Safari/536.6",\
  "Mozilla/5.0 (Windows NT 6.2; WOW64) AppleWebKit/537.1 (KHTML, like Gecko) Chrome/19.77.34.5 Safari/537.1",\
  "Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/536.5 (KHTML, like Gecko) Chrome/19.0.1084.9 Safari/536.5",\
  "Mozilla/5.0 (Windows NT 6.0) AppleWebKit/536.5 (KHTML, like Gecko) Chrome/19.0.1084.36 Safari/536.5",\
  "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/536.3 (KHTML, like Gecko) Chrome/19.0.1063.0 Safari/536.3",\
  "Mozilla/5.0 (Windows NT 5.1) AppleWebKit/536.3 (KHTML, like Gecko) Chrome/19.0.1063.0 Safari/536.3",\
  "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_8_0) AppleWebKit/536.3 (KHTML, like Gecko) Chrome/19.0.1063.0 Safari/536.3",\
  "Mozilla/5.0 (Windows NT 6.2) AppleWebKit/536.3 (KHTML, like Gecko) Chrome/19.0.1062.0 Safari/536.3",\
  "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/536.3 (KHTML, like Gecko) Chrome/19.0.1062.0 Safari/536.3",\
  "Mozilla/5.0 (Windows NT 6.2) AppleWebKit/536.3 (KHTML, like Gecko) Chrome/19.0.1061.1 Safari/536.3",\
  "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/536.3 (KHTML, like Gecko) Chrome/19.0.1061.1 Safari/536.3",\
  "Mozilla/5.0 (Windows NT 6.1) AppleWebKit/536.3 (KHTML, like Gecko) Chrome/19.0.1061.1 Safari/536.3",\
  "Mozilla/5.0 (Windows NT 6.2) AppleWebKit/536.3 (KHTML, like Gecko) Chrome/19.0.1061.0 Safari/536.3",\
  "Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/535.24 (KHTML, like Gecko) Chrome/19.0.1055.1 Safari/535.24",\
  "Mozilla/5.0 (Windows NT 6.2; WOW64) AppleWebKit/535.24 (KHTML, like Gecko) Chrome/19.0.1055.1 Safari/535.24"
  ]

你可能感兴趣的:(讲解Python的Scrapy爬虫框架使用代理进行采集的方法)

python链接hbase模块_Python连接Hbase weixin_40001395 python链接hbase模块
1、安装Hbase库pipinstallhappybase2、连接Hbase2.1、查看Hbase配置image.png2.2、使用happyhase连接hbaseimporthappybase#注意protocol和transport这两个参数，需要和hbase启动命令中的相同，否则会报错connection=happybase.Connection('qa-cdh-001',port=9090
python的应用领域主要有_Python的应用领域有哪些？ weixin_39658966 python的应用领域主要有
Python的应用领域有哪些？Python是一门简单、易学并且很有前途的编程语言，很多人都对Python感兴趣，但是当学完Python基础用法之后，又会产生迷茫，尤其是自学的人员，不知道接下来的Python学习方向，以及学完之后能干些什么？以下是Python十大应用领域！1.WEB开发Python拥有很多免费数据函数库、免费web网页模板系统、以及与web服务器进行交互的库，可以实现web开发，搭
excel波士顿矩阵怎么做_如何用excel做波士顿矩阵图？ weixin_39743064 excel波士顿矩阵怎么做
波士顿矩阵的操作可以参考下这篇文章，把横纵坐标轴改成你想要：占有率，增长率即可。至于尺寸大小如何操作，在文末特意展示了。波士顿矩阵(BCGMatrix)，又称市场增长率—相对市场份额矩阵、波士顿咨询集团法、四象限分析法、产品系列结构管理法等。波士顿矩阵由美国著名的管理学家、波士顿咨询公司创始人布鲁斯·亨德森于1970年首创。通过对两两属性的正负排列组合，得到四种不同性质的类型产品：双高(明星类产品
excel波士顿矩阵怎么做_Excel2013采用散点图气泡图Powerview三种方案轻松制做波士顿矩阵.docx... weixin_39885803 excel波士顿矩阵怎么做
Excel2013采用散点图气泡图Powerview三种方案轻松制做波士顿矩阵Excel2013采用散点图气泡图Powerview三种方案轻松制作波士顿矩阵波士顿矩阵是图形化分析非常好的工具。找遍网络，没有找到一个轻松简单制作波士顿矩阵的方法，基本上都是用比较老的EXCEL版本制作，无法让散点图的各个点的标签显示为该点的名称(标签列的文字)，要做都要采用很复杂的转换，或手工添加，或启用VBA宏写代
安卓python安装库_安卓termux折腾手记：安装python库+tasker调用 weixin_39628380 安卓python安装库
1.termux简介1.1简介termux是安卓手机上的一款软件，相当于在安卓上搭建了一个Linux平台，所以在Linux上能干的事情很多在手机上也都办得到，比如本文就是介绍与python相关的内容。实际上，得益于安卓平台的开放性，类似termux的手机神器着实不少。不说各类强大的编程IDE，单是termux这样的Linux平台类软件就很多，如GnuRoot系列，LinuxDisplay系列等。这
termux使用教程python-Termux折腾记--进阶之python库使用 weixin_37988176
sshdTermux超级终端折腾记Termux超级终端的牛x之处我就不在这里描述了。这次讲的是如何在android手机上安装python的各种科学库和图形库。Jupyter是这次介绍的重点对象，先卖个关子，不忙介绍它。1.Termux超级终端下载Termux的下载链接极其介绍见我的其他博文2.安装python这一步只是作为一个提示，因为现在你不管是装Linux终端还是linux完整发行版，pyth
python packge index 的使用 weixin_34199335 python 开发工具
pythonpackgeindex（PyPI）是Python编程语言的软件存储库。可用下载各种常用库，以及自己制作并上传库官方网站https://pypi.python.org安装pip3installpymysql安装完的库在python根目录下的lib\sitepackgs\目录下如果需要在命令行窗口直接运行pip3需要配置python根目录下的script目录为环境变量转载于:https:/
RabbitMQ 死信队列详解 web18484626332 面试学习路线阿里巴巴 android 前端后端
一、死信的概念死信，顾名思义就是无法被消费的消息。一般来说，Producer将消息投递到Broker或者直接到Queue里了，Consumer从Queue取出消息进行消费，但某些时候由于特定的原因导致Queue中的某些消息无法被消费，这样的消息如果没有后续的处理，就变成了死信，有死信自然就有了死信队列。应用场景：为了保证订单业务的消息数据不丢失，需要使用到RabbitMQ的死信队列机制，档消息消费
精通Python (21) 码商行者人工智能 python 人工智能
Python语言进阶之并发编程Python中实现并发编程的三种方案：多线程、多进程和异步I/O。并发编程的好处在于可以提升程序的执行效率以及改善用户体验；坏处在于并发的程序不容易开发和调试，同时对其他程序来说它并不友好。一，多线程Python中提供了Thread类并辅以Lock、Condition、Event、Semaphore和Barrier。Python中有GIL来防止多个线程同时执行本地字节
搭建本地Python Package Index(pypi)源 tmpbook python
准备一台有外网的机器：nginxpython>=2.7（needreadline-devel,sqlite-devel）1.安装pip2pipipinstallpip2pi2.创建存放软件包的仓库mkdir-d/opt/python/soft/pypi.kevingao.net/3.下载某个包和某些包并建立索引单独下载pip2tgz/opt/python/soft/pypi.kevingao.ne
力扣111 二叉树的最小深度想念@思恋 leetcode
#层次遍历classSolution:defminDepth(self,root:TreeNode)->int:ifrootisNone:return0queue=[]layer=[]cur=rootqueue.append(cur)layer.append(1)min_layer=1cur_layer=1whilequeue:cur=queue.pop(0)cur_layer=layer.pop
Xcode工程pod方式引用第三方SnapKit库流程及问题总结 f8之4 iOS Xcode 笔记 Xcode pod SnapKit
Xcode工程pod方式引用第三方SnapKit库流程及问题总结Podfile文件生成Podfile文件编辑Podfile文件下载库代码问题总结Xcode路径错误CocoaPods版本太低不能写入目录Podfile文件Podfile位于项目目录的根目录下，这里面主要声明了导入第三方库的名称及版本号。生成Podfile文件命令行先cd进入工程所在的目录，执行podinit命令该命令执行成功，目录下会
汇编基础语法及其示例怪怪879 汇编
1.汇编指令1.1汇编指令的基本格式{}{s},,{}{cpsr影响位},,注：第一操作寄存器只能是寄存器，不能写数值第二操作数可以写寄存器名，也可以写#一个数值汇编不区分大小写操作数可以是一个寄存器，也可以是一个立即数立即数：能够经过编码后保存到指令空间中直接当作指令一部分去执行的数据。一个32位指令空间中预留了12位空间保存当前操作数，可以通过某一个规则对操作数进行处理，将处理后数值放在这12
python 语音识别柚梓sir 神经网络语音识别人工智能
在python中训练一个语音识别系统主要需要以下几个步骤：-语料库准备-数据预处理-特征提取-训练模型第一部分：语料库的准备什么是语料库？语料库长什么样？语料库由两部分组成，第一部分是语音，第二部分是玉莹的标注，通常为字符形式。本次项目中，我们选用的语料库是THCHS-30，这个语料库是在安静的办公室环境下，由录音人员用普通话朗读新闻的语音作为数据，总时长超过30个小时。我们利用语料库，构造转换字
双目视觉之获取三维坐标（立体校正、Q矩阵与三角测量原理）乐平要加油啊 YOLO+双目视觉计算机视觉 opencv
前言双目视觉是一种模拟人类立体视觉的计算机视觉技术，它通过两个相机从不同的角度拍摄同一个场景，然后利用三角测量原理，计算出场景中物体的三维坐标信息。这种技术在机器人导航、自动驾驶、物体跟踪、三维重建等领域有广泛的应用。获取三维坐标是双目视觉的核心任务之一。通过对左右相机拍摄的图像进行特征匹配和视差计算，我们可以得到场景中每个像素点的视差值。视差值表示了同一个物体在左右图像中的位置差异，它与物体距离
数据结构——二叉树的最小深度算法 943802606 #数据结构数据结构二叉树 c语言
给定一个二叉树，找出其最小深度。最小深度是从根节点到最近叶子节点的最短路径上的节点数量。说明：叶子节点是指没有子节点的节点。输入：root=[3,9,20,null,null,15,7]输出：2示例2：输入：root=[2,null,3,null,4,null,5,null,6]输出：5提示：树中节点数的范围在[0,105]内-1000lchild不为空且T->rchild为空，返回左子树的高度+
python操作HBase 王壮_ 大数据 Python hbase 数据库大数据
1.安装happybase和thriftpipinstallhappybasepipinstallthrift2.启动hbase的thrift进程，并指定端口9090hbase-daemon.shstartthrift-p90903.操作HBaseimporthappybaseconnection=happybase.Connection(host='hadoop10',port=9090)tab
111.二叉树的最小深度 -----力扣每日打卡Day17 爱吃草莓蛋糕的猴算法题二叉树算法 leetcode
目录1.题目2.题目分析3.代码实现1.题目给定一个二叉树，找出其最小深度。最小深度是从根节点到最近叶子节点的最短路径上的节点数量。说明:叶子节点是指没有子节点的节点。示例:给定二叉树[3,9,20,null,null,15,7],3/\920/\157返回它的最小深度2.C语言函数头：/***Definitionforabinarytreenode.*structTreeNode{*intval
RabbitMQ 死信队列的使用胡尚小知识点 rabbitmq java 分布式
死信队列DLX死信队列。有以下几种情况，消息会进入到死信队列中：消息过期消息被拒绝队列达到最大长度实现的逻辑就是：也是创建一个交换机，就暂时叫它死信交换机，然后再创建一个死信队列，死信交换机和死信队列进行绑定。当设置了ttl的队列中消息过期后就会把消息发送至我们的死信交换机，死信交换机再存入死信队列中，以后肯定还会有一个死信消费者来处理死信队列中的消息的。其实这还是一个提供者–>交换机—>队列--
rabbitmq-死信队列（死信交换机）（十）小白划水 rabbitmq rabbitmq 分布式 java
消息进入死信队列的条件队列消息数量到达限制；比如给队列最大只能存储10条消息，当第11条消息进来的时候存不下了，第11条消息就被称为死信消费者拒接消费消息，basicNack/basicReject，并且不把消息重新放入原目标队列，requeue=false；原队列存在消息过期设置，消息到达超时时间未被消费；队列绑定死信交换机（重点，也就是在正常队列里设置者两个参数）给队列设置参数：x-dead-
Eigen知识点1：数组、向量初始化星辰和大海都需要门票 Eigen c++矩阵开发语言
1知识点总结：（1）数组初始化Eigen::MatrixXdm(2,2);m(0,0)=1;m#includeusingnamespaceEigen;usingnamespacestd;intmain(intargc,char*argv[]){ros::init(argc,argv,"eigen01");ros::NodeHandlenh;//Eigen提供的初始化方法——逗号初始化法//知识点1
doris：ORC 向阳1218 大数据 doris
本文介绍如何在Doris中导入ORC格式的数据文件。支持的导入方式以下导入方式支持ORC格式的数据导入：StreamLoadBrokerLoadINSERTINTOFROMS3TVFINSERTINTOFROMHDFSTVF使用示例本节展示了不同导入方式下的ORC格式使用方法。StreamLoad导入curl--location-trusted-u:\-H"format:orc"\-Texampl
kafka 生产者发送流程 jxj_cd mysql 数据库
Kafka是由Apache软件基金会开发的一个开源流处理平台，由Scala和Java编写。Kafka是一种高吞吐量的分布式发布订阅消息系统，它可以处理消费者在网站中的所有动作流数据。kafka的基础架构：Kafka生产者发送流程详解:拦截器序列化器分区器生产者端由两个线程协调完成，分别是main线程和Sender线程。main线程在将消息通过拦截器、序列化器和分区器处理后缓存到消息累加器（Reco
数据结构图邻接矩阵表示法大和田数据结构数据结构有向图 c++
图邻接矩阵表示法图的邻接表表示法看这里基本结构：enumGraphKind{DG,DN,UDG,UDN};templatestructArcCell{VRTypeadj;InfoType*info;};templateusingAdjMatrix=ArcCell[MAX_VERTEX_NUM][MAX_VERTEX_NUM];templatestructMGraph{VertexTypevexs[
谷歌浏览器打开无标题 mp2020xuexi 运维
你是不是安装了360？装了360安全卫士，还选择了“系统修复”中的“常规修复”，然后修复结果中有一个“组策略”异常的选项，你选择了修复，然后chrome就会这样了。恢复的方法是打开“恢复区”，找到那个选项，选择后面的“恢复”，因为它默认是不处理的，只是隔离了，你恢复之后再重启电脑，就没问题了。
深度优先搜索算法笔记骑狗看夕阳算法笔记深度优先笔记算法
深度优先搜索今天我们来讲解的是深度优先搜索，这是我们大家学习信息是必不可少也是最总要的一个算法，那么深度优先搜索这个算法究竟是干了什么呢？这很简单。本质搜索搜索，就在于这二字，也就是一个一个查找。不过深度优先搜索，其实就是在这棵搜索树中以深度为先，也就是所谓的不撞南墙不回头，就是说我们可以把它认为是走迷宫，如果到了终点就没有关系，不然就继续走，碰到弯道一直往右，碰到死胡同再绕出来。就是怎么简单。那
贪心算法笔记骑狗看夕阳算法笔记算法笔记
贪心算法笔记大概内容贪心就是对于一个问题有很多个步骤，我们在每一个步骤中都选取最优的那一个，最后得出答案。就是在一些函数中可行，但是有些比如二次函数，因为它的转折点不一定最优，就是不可行的。那么如何判断贪心呢？有这么几种看时间复杂度，一般的就是O(n)O(n)O(n)或者是排序O(nlogn)O(n\logn)O(nlogn)或者猜测，看着像就可以试试。自己用数学证明方法，比如归纳法，交换法，就是
白兔的字符串骑狗看夕阳算法
白兔的字符串白兔有一个字符串TTT。白云有若干个字符串S1,S2,SnS_1,S_2,S_nS1,S2,Sn。白兔想知道，对于白云的每一个字符串，它有多少个子串是和TTT循环同构的。提示：对于一个字符串aaa，每次把aaa的第一个字符移动到最后一个，如果操作若干次后能够得到字符串bbb，则aaa和bbb循环同构。所有字符都是小写英文字母.首先我们分析一下，既然循环同构，那么我们可以将串TTT展开直
gcd之和（一维）骑狗看夕阳算法 c++
gcd之和求∑i=1ngcd⁡(n,i)\sum_{i=1}^{n}\gcd(n,i)∑i=1ngcd(n,i)。那么我们这一道题讲得详细一点。因为这一道题目的n≤109n\leq10^9n≤109。这也就导致了一些算法是过不了的，那么我们就先从最简单的讲起：对每一项来一遍gcd⁡\gcdgcd，然后gcd⁡\gcdgcd我们也使用最简单的哪一种去做，也就是从小到大跑，时间复杂度O(n2)O(n^
如何安装和配置PHP开发环境？ m0_74824661 面试学习路线阿里巴巴 java
要安装和配置PHP开发环境，可以按照以下步骤进行：一、下载和安装PHP1：下载PHP：访问PHP官方网站（PHP:Downloads），选择适合您操作系统的版本进行下载。2：解压并安装PHP：下载完成后，将压缩包解压到指定目录。编辑php.ini文件，确保其中的displayerrors设置为on，以便在开发过程中能够看到错误信息。例如：display_errors=On二、下载和安装Apache
关于旗正规则引擎中的MD5加密问题何必如此 jsp MD5 规则加密
一般情况下，为了防止个人隐私的泄露，我们都会对用户登录密码进行加密，使数据库相应字段保存的是加密后的字符串，而非原始密码。在旗正规则引擎中，通过外部调用，可以实现MD5的加密，具体步骤如下： 1.在对象库中选择外部调用，选择“com.flagleader.util.MD5”，在子选项中选择“com.flagleader.util.MD5.getMD5ofStr({arg1})”； 2.在规
【Spark101】Scala Promise/Future在Spark中的应用 bit1129 Promise
Promise和Future是Scala用于异步调用并实现结果汇集的并发原语，Scala的Future同JUC里面的Future接口含义相同，Promise理解起来就有些绕。等有时间了再仔细的研究下Promise和Future的语义以及应用场景，具体参见Scala在线文档：http://docs.scala-lang.org/sips/completed/futures-promises.html
spark sql 访问hive数据的配置详解 daizj spark sql hive thriftserver
spark sql 能够通过thriftserver 访问hive数据，默认spark编译的版本是不支持访问hive，因为hive依赖比较多，因此打的包中不包含hive和thriftserver,因此需要自己下载源码进行编译，将hive，thriftserver打包进去才能够访问，详细配置步骤如下： 1、下载源码 2、下载Maven,并配置此配置简单，就略过
HTTP 协议通信周凡杨 java httpclient http 通信
一：简介 HTTPCLIENT，通过JAVA基于HTTP协议进行点与点间的通信！二：代码举例测试类： import java
java unix时间戳转换 g21121 java
把java时间戳转换成unix时间戳： Timestamp appointTime=Timestamp.valueOf(new SimpleDateFormat("yyyy-MM-dd HH:mm:ss").format(new Date())) SimpleDateFormat df = new SimpleDateFormat("yyyy-MM-dd hh:m
web报表工具FineReport常用函数的用法总结（报表函数）老A不折腾 web报表 finereport 总结
说明：本次总结中，凡是以tableName或viewName作为参数因子的。函数在调用的时候均按照先从私有数据源中查找，然后再从公有数据源中查找的顺序。 CLASS CLASS(object):返回object对象的所属的类。 CNMONEY CNMONEY(number,unit)返回人民币大写。 number:需要转换的数值型的数。 unit:单位，
java jni调用c++ 代码报错墙头上一根草 java C++jni
# # A fatal error has been detected by the Java Runtime Environment: # # EXCEPTION_ACCESS_VIOLATION (0xc0000005) at pc=0x00000000777c3290, pid=5632, tid=6656 # # JRE version: Java(TM) SE Ru
Spring中事件处理de小技巧 aijuans spring Spring 教程 Spring 实例 Spring 入门 Spring3
Spring 中提供一些Aware相关de接口，BeanFactoryAware、 ApplicationContextAware、ResourceLoaderAware、ServletContextAware等等，其中最常用到de匙ApplicationContextAware.实现ApplicationContextAwaredeBean，在Bean被初始后，将会被注入 Applicati
linux shell ls脚本样例 annan211 linux linux ls源码 linux 源码
#! /bin/sh - #查找输入文件的路径 #在查找路径下寻找一个或多个原始文件或文件模式 # 查找路径由特定的环境变量所定义 #标准输出所产生的结果通常是查找路径下找到的每个文件的第一个实体的完整路径 # 或是filename :not found 的标准错误输出。 #如果文件没有找到则退出码为0 #否则即为找不到的文件个数 #语法 pathfind [--
List,Set,Map遍历方式 (收集的资源,值得看一下) 百合不是茶 list set Map遍历方式
List特点：元素有放入顺序，元素可重复 Map特点：元素按键值对存储，无放入顺序 Set特点：元素无放入顺序，元素不可重复（注意：元素虽然无放入顺序，但是元素在set中的位置是有该元素的HashCode决定的，其位置其实是固定的） List接口有三个实现类：LinkedList，ArrayList，Vector LinkedList：底层基于链表实现，链表内存是散乱的，每一个元素存储本身
解决SimpleDateFormat的线程不安全问题的方法 bijian1013 java thread 线程安全
在Java项目中，我们通常会自己写一个DateUtil类，处理日期和字符串的转换，如下所示： public class DateUtil01 { private SimpleDateFormat dateformat = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss"); public void format(Date d
http请求测试实例（采用fastjson解析） bijian1013 http 测试
在实际开发中，我们经常会去做http请求的开发，下面则是如何请求的单元测试小实例，仅供参考。 import java.util.HashMap; import java.util.Map; import org.apache.commons.httpclient.HttpClient; import
【RPC框架Hessian三】Hessian 异常处理 bit1129 hessian
RPC异常处理概述 RPC异常处理指是，当客户端调用远端的服务，如果服务执行过程中发生异常，这个异常能否序列到客户端？如果服务在执行过程中可能发生异常，那么在服务接口的声明中，就该声明该接口可能抛出的异常。在Hessian中，服务器端发生异常，可以将异常信息从服务器端序列化到客户端，因为Exception本身是实现了Serializable的
【日志分析】日志分析工具 bit1129 日志分析
1. 网站日志实时分析工具 GoAccess http://www.vpsee.com/2014/02/a-real-time-web-log-analyzer-goaccess/ 2. 通过日志监控并收集 Java 应用程序性能数据(Perf4J) http://www.ibm.com/developerworks/cn/java/j-lo-logforperf/ 3.log.io 和
nginx优化加强战斗力及遇到的坑解决 ronin47 nginx 优化
　　　先说遇到个坑，第一个是负载问题，这个问题与架构有关，由于我设计架构多了两层，结果导致会话负载只转向一个。解决这样的问题思路有两个：一是改变负载策略，二是更改架构设计。　　　由于采用动静分离部署，而nginx又设计了静态，结果客户端去读nginx静态，访问量上来，页面加载很慢。解决：二者留其一。最好是保留apache服务器。　　　来以下优化：　　　
java-50-输入两棵二叉树A和B，判断树B是不是A的子结构 bylijinnan java
思路来自： http://zhedahht.blog.163.com/blog/static/25411174201011445550396/ import ljn.help.*; public class HasSubtree { /**Q50. * 输入两棵二叉树A和B，判断树B是不是A的子结构。例如，下图中的两棵树A和B，由于A中有一部分子树的结构和B是一
mongoDB 备份与恢复开窍的石头 mongDB备份与恢复
Mongodb导出与导入 1: 导入/导出可以操作的是本地的mongodb服务器,也可以是远程的. 所以,都有如下通用选项: -h host 主机 --port port 端口 -u username 用户名 -p passwd 密码 2: mongoexport 导出json格式的文件
[网络与通讯]椭圆轨道计算的一些问题 comsci 网络
如果按照中国古代农历的历法，现在应该是某个季节的开始，但是由于农历历法是3000年前的天文观测数据，如果按照现在的天文学记录来进行修正的话，这个季节已经过去一段时间了。。。。。也就是说，还要再等3000年。才有机会了，太阳系的行星的椭圆轨道受到外来天体的干扰，轨道次序发生了变
软件专利如何申请 cuiyadll 软件专利申请
软件技术可以申请软件著作权以保护软件源代码，也可以申请发明专利以保护软件流程中的步骤执行方式。专利保护的是软件解决问题的思想，而软件著作权保护的是软件代码（即软件思想的表达形式）。例如，离线传送文件，那发明专利保护是如何实现离线传送文件。基于相同的软件思想，但实现离线传送的程序代码有千千万万种，每种代码都可以享有各自的软件著作权。申请一个软件发明专利的代理费大概需要5000-8000申请发明专利可
Android学习笔记 darrenzhu android
1.启动一个AVD 2.命令行运行adb shell可连接到AVD,这也就是命令行客户端 3.如何启动一个程序 am start -n package name/.activityName am start -n com.example.helloworld/.MainActivity 启动Android设置工具的命令如下所示： # am start -
apache虚拟机配置，本地多域名访问本地网站 dcj3sjt126com apache
现在假定你有两个目录，一个存在于 /htdocs/a，另一个存在于 /htdocs/b 。现在你想要在本地测试的时候访问 www.freeman.com 对应的目录是 /xampp/htdocs/freeman ,访问 www.duchengjiu.com 对应的目录是 /htdocs/duchengjiu。 1、首先修改C盘WINDOWS\system32\drivers\etc目录下的
yii2 restful web服务[速率限制] dcj3sjt126com PHP yii2
速率限制为防止滥用，你应该考虑增加速率限制到您的API。例如，您可以限制每个用户的API的使用是在10分钟内最多100次的API调用。如果一个用户同一个时间段内太多的请求被接收，将返回响应状态代码 429 (这意味着过多的请求)。要启用速率限制, [[yii\web\User::identityClass|user identity class]] 应该实现 [[yii\filter
Hadoop2.5.2安装——单机模式 eksliang hadoop hadoop单机部署
转载请出自出处：http://eksliang.iteye.com/blog/2185414 一、概述 Hadoop有三种模式单机模式、伪分布模式和完全分布模式，这里先简单介绍单机模式，默认情况下，Hadoop被配置成一个非分布式模式，独立运行JAVA进程，适合开始做调试工作。二、下载地址 Hadoop 网址http:
LoadMoreListView+SwipeRefreshLayout（分页下拉）基本结构 gundumw100 android
一切为了快速迭代 import java.util.ArrayList; import org.json.JSONObject; import android.animation.ObjectAnimator; import android.os.Bundle; import android.support.v4.widget.SwipeRefreshLayo
三道简单的前端HTML/CSS题目 ini html Web 前端 css 题目
使用CSS为多个网页进行相同风格的布局和外观设置时，为了方便对这些网页进行修改，最好使用（）。http://hovertree.com/shortanswer/bjae/7bd72acca3206862.htm 在HTML中加入<table style=”color:red; font-size:10pt”>，此为（）。http://hovertree.com/s
overrided方法编译错误 kane_xie override
问题描述：在实现类中的某一或某几个Override方法发生编译错误如下： Name clash: The method put(String) of type XXXServiceImpl has the same erasure as put(String) of type XXXService but does not override it 当去掉@Over
Java中使用代理IP获取网址内容（防IP被封，做数据爬虫） mcj8089 免费代理IP 代理IP 数据爬虫 JAVA设置代理IP 爬虫封IP
推荐两个代理IP网站： 1. 全网代理IP：http://proxy.goubanjia.com/ 2. 敲代码免费IP：http://ip.qiaodm.com/ Java语言有两种方式使用代理IP访问网址并获取内容，方式一，设置System系统属性 // 设置代理IP System.getProper
Nodejs Express 报错之 listen EADDRINUSE qiaolevip 每天进步一点点学习永无止境 nodejs 纵观千象
当你启动 nodejs服务报错： >node app Express server listening on port 80 events.js:85 throw er; // Unhandled 'error' event ^ Error: listen EADDRINUSE at exports._errnoException (
C++中三种new的用法 _荆棘鸟_ C++new
转载自：http://news.ccidnet.com/art/32855/20100713/2114025_1.html 作者: mt 其一是new operator，也叫new表达式；其二是operator new，也叫new操作符。这两个英文名称起的也太绝了，很容易搞混，那就记中文名称吧。new表达式比较常见，也最常用，例如： string* ps = new string("
Ruby深入研究笔记1 wudixiaotie Ruby
module是可以定义private方法的 module MTest def aaa puts "aaa" private_method end private def private_method puts "this is private_method" end end

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他