梦想橡皮擦

纯纯的爬虫知识，python scrapy 下载中间件知多少

这篇博客咱们聊聊 scrapy 中的 Downloader Middleware ，即下载中间件相关知识。

Downloader Middlerware

首先看一下中间件在 scrapy 数据流中的位置，下图黑色箭头即下载中间件。

结合上图就能看出来， Requests 和 Response 都会通过 Downloader Middlerware，所以在后续代码编写的时候需要注意该点。
中间件的开启非常简单，只需要在 settings.py 文件中去除下述代码的注释即可。

DOWNLOADER_MIDDLEWARES = {
     
   'mid_test.middlewares.MidTestDownloaderMiddleware': 543,
}

其实 settings.py 文件仅仅是一个 scrapy 项目基础配置，除此之外，在 scrapy 框架中还存在一个 default_settings.py 文件，里面的 DOWNLOADER_MIDDLEWARES_BASE 包含更多下载中间件，而且它们是 scrapy 项目启动之后默认加载的，具体如下图所示。
我们在设置 DOWNLOADER_MIDDLEWARES 的时候，需要注意优先级的问题，其原因是在后续编写自定义下载中间件时，存在 1 个 process_request() 方法和 1 个 process_response() 方法，它们会按照优先级对中间件进行排序，并按照顺序进行中间的调用。

还有一点要注意的是，如果你想要屏蔽掉 DOWNLOADER_MIDDLEWARES_BASE 中设置的中间件，需要在 DOWNLOADER_MIDDLEWARES 中给其赋值为 None 才可以，例如下述代码将屏蔽 RobotsTxtMiddleware 中间件。

DOWNLOADER_MIDDLEWARES = {
     
    'myproject.middlewares.CustomDownloaderMiddleware': 543,
    'scrapy.downloadermiddlewares.robotstxt.RobotsTxtMiddleware': None,
}

自定义下载中间件的相关知识

本次案例编写使用的网站是 http://httpbin.org ，该站点可以直接返回请求头相关参数，测试起来非常方便。
正式编写代码前在 settings.py 文件中增加添加一个新的字段，便于输出打印日志（屏蔽了一些调试日志的输出）。

LOG_LEVEL = 'WARNING'

编写自己的下载中间件

默认请求代码如下所示，返回数据在代码下方。

import scrapy


class HbinSpider(scrapy.Spider):
    name = 'hbin'
    allowed_domains = ['httpbin.org']
    start_urls = ['http://httpbin.org/get']

    def parse(self, response):
        print(response.text)

请求目标站点之后，得到的返回数据如下所示：

接下来启用中间件，然后将请求相关参数进行修改，主要操作的文件是 middlewares.py，并且要实现其中的 process_request()，process_response()，process_exception()，spider_opened() 方法（可以仅实现一部分）。

process_request(request, spider)

通过下载中间件的每个请求，都会调用该方法。
本方法返回值必须是 None，Response 对象，Request 对象或者 IgnoreRequest 错误。

返回 None：没啥影响，其它的请求继续处理完毕；
返回 Response：直接去调用 process_response() 方法去；
返回 Request：将新的 Request 加入调度队列；
返回 IgnoreRequest：process_exception() 方法被执行。

下面编写一个 UserAgentMiddlerware 中间件，替换默认中间件的同时实现自己的代理设置。
在 middlewares.py 文件中添加如下代码

class UserAgentMiddleware(object):

    def process_request(self, request, spider):
        request.headers.setdefault('User-Agent',
                                   'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/95.0.4638.54 Safari/537.36')

        return None

在 settings.py 文件中添加如下代码

DOWNLOADER_MIDDLEWARES = {
     
   'mid_test.middlewares.UserAgentMiddleware': 543, # 配置自己的中间件，可以修改名称为 MyUserAgentMiddleware
   'scrapy.downloadermiddlewares.useragent.UserAgentMiddleware':None # 覆盖配置
}

如果没有覆盖原配置，会发现我们编写的中间件优先级不如 UserAgentMiddleware 高，即下图加载顺序。

process_response(request, response, spider)

该方法可下载中间件在返回响应数据时，进行一些数据处理，它默认返回的是 response 对象，也可以返回 request 对象，逻辑与 process_request() 方法基本一致。

class MyUserAgentMiddleware(object):

    def process_request(self, request, spider):
        request.headers.setdefault('User-Agent',
                                   'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/95.0.4638.54 Safari/537.36')

        return None

    def process_response(self, request, response, spider):
        print(response)  # 单纯输出一下 response

        return response

process_exception(request, exception, spider)

用于处理异常，默认返回 None，也可以返回 Response 对象和 Request 对象。

一般场景都是返回 Request 对象，当出现异常时，可以重新发起请求。

内置的下载中间件

通过 scrapy 命令行可以查看所有的内置中间件。

> scrapy settings --get DOWNLOADER_MIDDLEWARES_BASE

按照优先级依次为大家介绍一下。

RobotsTxtMiddleware

查看该中间件源码了解到，当 settings.py 文件中的 ROBOTSTXT_OBEY 被设置为 True 时，尊重 robots.txt 协议。

HttpAuthMiddleware

HTTP 认证，核心逻辑如下所示：

def spider_opened(self, spider):
    usr = getattr(spider, 'http_user', '')
    pwd = getattr(spider, 'http_pass', '')
    if usr or pwd:
        self.auth = basic_auth_header(usr, pwd)

def process_request(self, request, spider):
    auth = getattr(self, 'auth', None)
    if auth and b'Authorization' not in request.headers:
        request.headers[b'Authorization'] = auth

DownloadTimeoutMiddleware

设置请求的超时时间，需要配置 settings.py 文件中的 DOWNLOAD_TIMEOUT 值，然后手动给 meta 中 download_timeout 参数赋值。

def process_request(self, request, spider):
   if self._timeout:
       request.meta.setdefault('download_timeout', self._timeout)

DefaultHeadersMiddleware

设置 DEFAULT_REQUEST_HEADERS 指定的默认请求头。

UserAgentMiddleware

请求的用户代理设置。

RetryMiddleware

请求重试次数。

MetaRefreshMiddleware 与 RedirectMiddleware

以上 2 个中间件都继承自 BaseRedirectMiddleware，都与重定向有关系。

HttpCompressionMiddleware

提供了对压缩(gzip, deflate)数据的支持。

CookiesMiddleware

Cookie 相关能力的支持。

HttpProxyMiddleware

代理相关设置。

DownloaderStats

下载中间件的统计信息。

HttpCacheMiddleware

为所有 HTTP 请求和响应提供低级缓存。

本篇博客内容属于 scrapy 知识铺垫，并且部分知识点在后续博客中会反复用到，请掌握。

写在后面

今天是持续写作的第 253 / 365 天。
期待关注，点赞、评论、收藏。

更多精彩

《爬虫 100 例，专栏销售中，买完就能学会系列专栏》

↓ ↓ ↓ ↓一对一指导你的疑问↓ ↓ ↓ ↓ ↓↓↓扫码添加博主参加【78技术人社群】~Python分部↓↓↓

你可能感兴趣的:(Python爬虫120,中间件,python,爬虫,Downloader,Middlerware)

Python——生成AIGC图像朱剑君 AIGC 人工智能 python
文章目录一、背景介绍二、效果图展示三、完整代码四、分步解释五、实用建议1）提示词技巧2）性能优化3）常见问题处理4）扩展功能建议六、注意事项1.硬件要求2.法律合规3.模型安全一、背景介绍AIGC（AI-GeneratedContent），即由人工智能生成的内容，涵盖了文本、图像、音频、视频等各种形式。通过深度学习、生成对抗网络（GAN）和扩散模型等技术，AIGC能够生成高度逼真、具有艺术性的内容
python：实现简易FTP服务(附完整源码) 源代码大师 Python实战教程 python 开发语言
python：实现简易FTP服务importsocket,threading,os,sys,timeimporthashlib,platform,statlisten_ip="localhost"listen_port=21conn_list=[]root_dir
Python爬虫 +数据采集分析：淘宝商品评论页面数据接口代码逐梦人爬虫技能晋升路线 python 爬虫开发语言
Python爬虫+数据采集分析：淘宝商品评论页面数据接口一、引言在当今数字化商业时代，电商平台的数据蕴含着巨大的价值。淘宝作为全球知名的电商平台，其商品评论数据能反映消费者的真实反馈、偏好和需求，对于商家优化产品、制定营销策略，以及研究人员进行市场分析等都具有重要意义。然而，直接从淘宝商品评论页面采集数据并非易事，淘宝有严格的反爬机制。为了高效、合法地获取这些数据，利用数据接口是一种可行的解决方案
python工具——pypinyin 汉字转换拼音 xiaoming0018 python python list
把汉字转成拼音后可以进行深度学习分类，做内容识别1.安装pipinstallpypinyin将汉字转换为拼音并生成slug字符串importpypinyinfrompypinyinimportStylecontent=pypinyin.slug('汉语拼音')print(content)#E:\python\>pythonpinyin.py#han-yu-pin-yin修改分隔字符串importp
Leetcode Day6 (图论I, dfs, bfs) 比起村村长 leetcode 深度优先 leetcode 图论
创建一个visited的模版#mxn大小的矩阵m=len(matrix)n=len(matrix[0])visited=[[Falsefor_inrange(n)]for_inrange(m)]foriinrange(m):forjinrange(n):blablabla#DFS模版```python200岛屿数量classSolution:defnumIslands(self,grid:List
Python爬虫实战：爬取贝壳网二手房成交数据，将数据存入Excel。马虎的程序猿 python 爬虫 excel
importrequests,refromlxmlimporthtmlaaa=['heping','nankai','hexi','hebei','hedong','hongqiao','xiqing','beichen','dongli','jinnan','tanggu','kaifaqutj','wuqing','binhaixinqu','baodi','jizhou','jinghai'
BeautifulSoup爬取贝壳网成都二手房源信息（附：完整源代码）进击的SB 爬虫 python 大数据爬虫
BeautifulSoup爬取贝壳网成都二手房源信息最近想出一套二手房，刚好在学习爬虫，那就顺手爬一下贝壳上成都各区二手房信息了解一下行情，本篇先介绍数据爬取，数据分析稍后有时间再写。仅用于技术交流，请勿商业应用，如有侵权，联系删除。1.开发环境：python3.8.3；bs4,pandas,requests；存为csv,excel文件；个人比较喜欢用bs4,比较简洁，xpath也有优势，虽然路径
【Python爬虫(44)】分布式爬虫：筑牢安全防线，守护数据之旅奔跑吧邓邓子 Python爬虫 python 爬虫分布式开发语言安全
【Python爬虫】专栏简介：本专栏是Python爬虫领域的集大成之作，共100章节。从Python基础语法、爬虫入门知识讲起，深入探讨反爬虫、多线程、分布式等进阶技术。以大量实例为支撑，覆盖网页、图片、音频等各类数据爬取，还涉及数据处理与分析。无论是新手小白还是进阶开发者，都能从中汲取知识，助力掌握爬虫核心技能，开拓技术视野。目录一、引言二、防范分布式爬虫遭受DDoS攻击2.1设置防火墙2.2使
Python 汉字转拼音库 pypinyin, 附：汉字拼音转换工具 tboqi1 python 拼音汉字拼音转换
一、初衷：一些开源软件的配置文件中识别区分的部分用英文，那么我们在批量生成配置文件的时候，可以从CMDB导入汉字(idc_name)，然后将它转换成拼音，再或者拼接上IP地址，以便更准确的识别。例如：Smokeping的Targets配置文件，如下：正在上传…重新上传取消+telcommenu=中国电信title=telcom++yunfuxinxingshuangxian-01-61menu=云
【Python】探索PyPinyin 库：Python 中的中文拼音转换工具音乐学家方大刚 Python 爬虫 python 开发语言
花未全开月未圆，半山微醉尽余欢。何须多虑盈亏事，终是小满胜万全。——《对抗路—吕布》PyPinyin是一个功能强大的Python库，用于将中文文本转换为拼音。它提供了丰富的功能，能够满足各种中文文本处理的需求。在本文中，我们将介绍PyPinyin库的基本用法，并给出三个实用案例。1.安装PyPinyin首先，我们需要通过pip安装PyPinyin：pipinstallpypinyin2.使用案例一
【华为OD技术面试手撕真题】109、长度为 K 子数组中的最大和 | 手撕真题+思路参考+代码解析（C & C++ & Java & Python & JS） KJ.JK 华为OD技术面试手撕真题华为od 面试 c语言华为od机试真题华为od机试E卷长度为 K 子数组中的最大和
文章目录一、题目题目描述样例1二、代码参考C语言思路C语言代码C++语言思路C++代码Java语言思路Java代码Python语言思路Python代码JS语言思路JS代码作者：KJ.JK个人博客首页：KJ.JK专栏介绍：本专栏更新每年华为OD机试的高频手撕代码题，每个题目都会使用五种语言进行解答（C&C++&Java&Python&JS），思路分析都非常详细，争取实现最低的时间复杂度和高通过率，每
一周学会Flask3 Python Web开发-post请求与参数获取 java1234_小锋 Flask3视频教程 python 开发语言 flask flask3
锋哥原创的Flask3PythonWeb开发Flask3视频教程：2025版Flask3Pythonweb开发视频教程(无废话版)玩命更新中~_哔哩哔哩_bilibili@app.route装饰器默认只支持get请求。假如我们要让绑定的视图函数支持其他请求方式，我们可以在methods属性里配置下即可。@app.route('/login',methods=['GET','POST'])我们通过一
AI如何预测比赛结果：体育预测技术全解析翱翔的猪脑花人工智能
利用人工智能技术构建一个完整的体育预测系统，涵盖数据收集、模型构建到部署应用的完整流程。一、系统架构设计1.整体架构数据采集层数据处理层模型训练层预测服务层应用展示层2.技术选型Python3.8+TensorFlow/PyTorchScikit-learnPandas/NumpyFlask/FastAPI二、数据收集与处理1.数据源集成python复制importrequestsimportpa
Python常见面试题的详解16 ylfhpy Python基础 python 开发语言面试
1.如何强行关闭客户端和服务器之间的连接？在网络编程中，有时需要强行中断客户端和服务器之间的连接。对于基于TCP协议的连接，由于其面向连接的特性，需要采取特定的步骤来确保连接被正确关闭；而UDP是无连接协议，处理方式相对简单。服务器端（TCP）pythonimportsocket#创建TCP套接字server_socket=socket.socket(socket.AF_INET,socket.S
Java技术栈 —— RabbitMq入门 CS-Polaris Java技术栈 java-rabbitmq java rabbitmq
Java技术栈——RabbitMq入门一、Linux中安装RabbitMq二、RabbitMQ文档三、Spring中与RabbitMq通信四、Python中与RabbitMq通信一、Linux中安装RabbitMq不推荐物理安装RabbitMq，复杂，成本高，不划算，推荐docker安装参考文章或视频链接[1]InstallingonDebianandUbuntu-rabbitmq[2]Linux
Chrome webdriver下载-避坑 m0_74825502 java
WebDriver以原生的方式驱动浏览器，不需要调整环境变量。一、window版1.chrome和chromedriver下载地址：ChromeforTestingavailability我下载的是如下两个安装包，解压即可。2.导包pipinstallselenium然后用python代码引用即可二、Linux版1.chrome和chromedriver下载地址：ChromeforTestinga
头歌答案--爬虫实战 m0_74825502 爬虫 java 前端
目录urllib爬虫?第1关：urllib基础任务描述第2关：urllib进阶?任务描述requests爬虫第1关：requests基础任务描述第2关：requests进阶任务描述网页数据解析第1关：XPath解析网页?任务描述第2关：BeautifulSoup解析网页?任务描述JSON数据解析第1关：JSON解析?任务描述爬虫实战——网页抓取及信息提取第1关：利用URL获取超文本文件并保存至本地
Python+Spark地铁客流数据分析与预测系统地铁大数据地铁流量预测 qq_79856539 javaweb 大数据 python spark
本系统基于大数据设计并实现成都地铁客流量分析系统，使用网络爬虫爬取并收集成都地铁客流量数据，运用机器学习和时间序列分析等方法，对客流量数据进行预处理和特征选择，构建客流量预测模型，利用历史数据对模型进行训练和优化，实现客流量预测模型的部署和应用，通过系统界面展示预测结果。对预测模型进行评估和验证，并提出改进方案。设计步骤使用Python语言编写爬虫程序采集数据，并对原始数据集进行预处理；使用Pyt
Django项目开发的网站展示来自fasta文件的蛋白质名称和序列的可视化表格 go5463158465 算法前端 django 数据库 sqlite
1.项目初始化首先，确保你已经安装了Django。然后创建一个新的Django项目和应用：django-adminstartprojectprotein_projectcdprotein_projectpythonmanage.pystartappprotein_app在protein_project/settings.py中，将protein_app添加到INSTALLED_APPS列表中：IN
Python基础训练100题（带答案）乔代码嘚 python 开发语言算法
文末有彩蛋！！！Python3100例实例001：数字组合题目有四个数字：1、2、3、4，能组成多少个互不相同且无重复数字的三位数？各是多少？程序分析遍历全部可能，把有重复的剃掉。total=0foriinrange(1,5):forjinrange(1,5):forkinrange(1,5):if((i!=j)and(j!=k)and(k!=i)):print(i,j,k)total+=1pri
PHP爬虫实战：如何抓取网页表格数据数据小爬虫.网站开发-Brad php 爬虫开发语言
随着互联网和大数据时代的到来，越来越多的数据可以被收集和利用。而在众多从网页上获取数据的方法中，爬虫技术可以说是最为强大和高效的一种。在实际的应用场景中，我们经常需要从网页中抓取特定的数据，尤其是网页中的表格数据。因此，本文将介绍如何使用PHP爬虫技术来获取并解析网页中的表格数据。1、安装和配置PHP爬虫库在开始编写爬虫代码之前，我们需要先安装和配置一个PHP爬虫库。这里我们选择使用PHPSimp
网站变更检测自动化：Python + Selenium 实现 DOM 差异对比与邮件预警系统西攻城狮北 python 开发语言实战案例爬虫
引言随着互联网的飞速发展，网站每天都在发生变化。为了能够及时发现和响应这些变化，自动化的网站变更检测工具显得尤为重要。本文将详细介绍如何使用Python和Selenium实现基于DOM（文档对象模型）差异对比的网站变更检测系统，并通过邮件的方式进行预警。一、需求分析在开始之前，我们需要明确需求。假设用户希望监控某个网站的特定页面（例如，一个电商网站的商品页面），当页面中的某些元素（如价格、产品描述
Ubuntu 24.04 安装 Poetry：Python 依赖管理的终极指南 engchina LINUX ubuntu python linux Poetry 虚拟环境
Ubuntu24.04安装Poetry：Python依赖管理的终极指南1.更新系统包列表2.安装Poetry方法1：使用官方安装脚本方法2：使用Pipx安装3.配置环境变量4.验证安装5.配置Poetry（可选）设置虚拟环境位置配置镜像源6.创建和管理项目创建新项目安装依赖添加依赖激活虚拟环境7.卸载Poetry（可选）总结在Python开发中，依赖管理是一个非常重要的环节。Poetry是一个现代
Github 2024-06-30开源项目日报 Top10 老孙正经胡说 github 开源 Github趋势分析开源项目 Python Golang
根据GithubTrendings的统计，今日(2024-06-30统计)共有10个项目上榜。根据开发语言中项目的数量，汇总情况如下：开发语言项目数量C#项目1Python项目1PowerShell项目1JavaScript项目1JupyterNotebook项目1TypeScript项目1PHP项目1C++项目1Swift项目1Rust项目1shadcn/ui:开源组件集合创建周期：393天开发
python-爬虫-图片的下载保存丧尸啃脖子啦 python 爬虫开发语言
在使用爬虫是面对页面上的图片有三种处理方法第一种使用request方法下载图片首先创建了一个名为"images"的文件夹用于保存图片。然后，通过发送HTTPGET请求来获取图片的数据。如果请求成功（状态码为200），则将图片数据保存到本地的文件中。保存图片时需要以二进制写入的方式打开文件，然后将请求返回的内容response.content写入文件中。需要注意的是，上面的示例只适用于单张图片的下载
生物可穿戴产品需要采集和监测哪些番茄老夫子人工智能
健康状态监测生理指标：包括心率、呼吸频率、体温等基础生理参数。例如，通过心率传感器实时监测动物的心跳，正常成年犬的心率在60-120次/分钟，若超出这个范围，可能提示动物存在健康问题，如心脏病、感染等；呼吸频率也是重要指标，犬的正常呼吸频率为10-30次/分钟，呼吸频率异常加快或减慢，可能与呼吸系统疾病、疼痛等有关；体温监测同样关键，猫狗的正常体温一般在37.5℃-39℃之间，体温异常往往是疾病的
Python Linter Ruff是开源和Rust的胜利 christ pan rust 开发语言后端
2022年，CharlieMarsh用Rust编写了一个快速开源Python代码检查器。如今，Ruff每周下载量达数百万次，Marsh也体会到了开源的力量。译自ThePythonLinterRuffIsaWinforOpenSource—andRust，作者DavidCassel。AstralSoftware描述其使命为“为Python生态系统提供高性能的开发人员工具，从Ruff开始，这是一个用R
python下载图片并保存_下载并保存图片Python2.7 weixin_39590566 python下载图片并保存
#!/usr/bin/envpython#-*-encoding:utf-8-*-importurllib2importosdefsave_img(img_url,file_name,file_path='img'):#保存图片到磁盘文件夹file_path中，默认为当前脚本运行目录下的book\img文件夹try:ifnotos.path.exists(file_path):print'文件夹'
Ai阅读各种需求文档需求文档小赖同学啊人工智能自动化测试(app pc API)test Technology Precious 人工智能 c#开发语言
让AI阅读不同格式需求文档的方法在软件项目开发中，需求文档通常以多种格式存储，如Word、Figma、蓝湖和Axure。要让AI阅读这些文档，需针对不同格式采用特定的处理方式。一、Word文档格式转换：可利用Python的python-docx库将Word文档转换为纯文本。示例代码如下：importdocxdefdocx_to_text(file_path):doc=docx.Document(f
python 包管理rye开启uv与软链接symlink csq镜子的月亮 python uv 开发语言 rye
简说：uv的引入，使得当前使用rye的体验得到了极大的提升，特别是reysnyc漫长的等待可以得到缓解了，一个字：爽！uv简介uv，一个用Rust开发的高性能的Python包解析器和安装器。uv作为单一的静态二进制文件发布，能够替代pip、pip-tools和virtualenv。uv没有直接的Python依赖。uv在没有缓存的情况下比pip和pip-tools快8-10倍，而在有热缓存的情况下（
apache ftpserver-CentOS config gengzg apache
<server xmlns="http://mina.apache.org/ftpserver/spring/v1" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation=" http://mina.apache.o
优化MySQL数据库性能的八种方法 AILIKES sql mysql
1、选取最适用的字段属性　　MySQL可以很好的支持大数据量的存取，但是一般说来，数据库中的表越小，在它上面执行的查询也就会越快。因此，在创建表的时候，为了获得更好的性能，我们可以将表中字段的宽度设得尽可能小。例如，在定义邮政编码这个字段时，如果将其设置为CHAR(255),显然给数据库增加了不必要的空间，甚至使用VARCHAR这种类型也是多余的，因为CHAR(6)就可以很
JeeSite 企业信息化快速开发平台 Kai_Ge JeeSite
JeeSite 企业信息化快速开发平台平台简介 JeeSite是基于多个优秀的开源项目，高度整合封装而成的高效，高性能，强安全性的开源Java EE快速开发平台。 JeeSite本身是以Spring Framework为核心容器，Spring MVC为模型视图控制器，MyBatis为数据访问层， Apache Shiro为权限授权层，Ehcahe对常用数据进行缓存，Activit为工作流
通过Spring Mail Api发送邮件 120153216 邮件 main
原文地址：http://www.open-open.com/lib/view/open1346857871615.html 使用Java Mail API来发送邮件也很容易实现，但是最近公司一个同事封装的邮件API实在让我无法接受，于是便打算改用Spring Mail API来发送邮件，顺便记录下这篇文章。【Spring Mail API】 Spring Mail API都在org.spri
Pysvn 程序员使用指南 2002wmj SVN
源文件:http://ju.outofmemory.cn/entry/35762 这是一篇关于pysvn模块的指南. 完整和详细的API请参考 http://pysvn.tigris.org/docs/pysvn_prog_ref.html. pysvn是操作Subversion版本控制的Python接口模块. 这个API接口可以管理一个工作副本, 查询档案库, 和同步两个. 该
在SQLSERVER中查找被阻塞和正在被阻塞的SQL 357029540 SQL Server
SELECT R.session_id AS BlockedSessionID , S.session_id AS BlockingSessionID , Q1.text AS Block
Intent 常用的用法备忘 7454103 .net android Google Blog F#
Intent 应该算是Android中特有的东西。你可以在Intent中指定程序要执行的动作（比如：view,edit,dial），以及程序执行到该动作时所需要的资料。都指定好后，只要调用startActivity()，Android系统会自动寻找最符合你指定要求的应用程序，并执行该程序。下面列出几种Intent 的用法显示网页:
Spring定时器时间配置 adminjun spring 时间配置定时器
红圈中的值由6个数字组成，中间用空格分隔。第一个数字表示定时任务执行时间的秒，第二个数字表示分钟，第三个数字表示小时，后面三个数字表示日，月，年，< xmlnamespace prefix ="o" ns ="urn:schemas-microsoft-com:office:office" /> 测试的时候，由于是每天定时执行，所以后面三个数
POJ 2421 Constructing Roads 最小生成树 aijuans 最小生成树
来源：http://poj.org/problem?id=2421 题意：还是给你n个点，然后求最小生成树。特殊之处在于有一些点之间已经连上了边。思路：对于已经有边的点，特殊标记一下，加边的时候把这些边的权值赋值为0即可。这样就可以既保证这些边一定存在，又保证了所求的结果正确。代码： #include <iostream> #include <cstdio>
重构笔记——提取方法（Extract Method） ayaoxinchao java 重构提炼函数局部变量提取方法
提取方法（Extract Method）是最常用的重构手法之一。当看到一个方法过长或者方法很难让人理解其意图的时候，这时候就可以用提取方法这种重构手法。下面是我学习这个重构手法的笔记：提取方法看起来好像仅仅是将被提取方法中的一段代码，放到目标方法中。其实，当方法足够复杂的时候，提取方法也会变得复杂。当然，如果提取方法这种重构手法无法进行时，就可能需要选择其他
为UILabel添加点击事件 bewithme UILabel
默认情况下UILabel是不支持点击事件的，网上查了查居然没有一个是完整的答案，现在我提供一个完整的代码。 UILabel *l = [[UILabel alloc] initWithFrame:CGRectMake(60, 0, listV.frame.size.width - 60, listV.frame.size.height)]
NoSQL数据库之Redis数据库管理(PHP-REDIS实例) bijian1013 redis 数据库 NoSQL
一.redis.php <?php //实例化 $redis = new Redis(); //连接服务器 $redis->connect("localhost"); //授权 $redis->auth("lamplijie"); //相关操
SecureCRT使用备注 bingyingao secureCRT 每页行数
SecureCRT日志和卷屏行数设置一、使用securecrt时，设置自动日志记录功能。 1、在C:\Program Files\SecureCRT\下新建一个文件夹(也就是你的CRT可执行文件的路径），命名为Logs； 2、点击Options -> Global Options -> Default Session -> Edite Default Sett
【Scala九】Scala核心三：泛型 bit1129 scala
泛型类 package spark.examples.scala.generics class GenericClass[K, V](val k: K, val v: V) { def print() { println(k + "," + v) } } object GenericClass { def main(args: Arr
素数与音乐 bookjovi 素数数学 haskell
由于一直在看haskell，不可避免的接触到了很多数学知识，其中数论最多，如素数，斐波那契数列等，很多在学生时代无法理解的数学现在似乎也能领悟到那么一点。闲暇之余，从图书馆找了<<The music of primes>>和<<世界数学通史>>读了几遍。其中素数的音乐这本书与软件界熟知的&l
Java-Collections Framework学习与总结-IdentityHashMap BrokenDreams Collections
这篇总结一下java.util.IdentityHashMap。从类名上可以猜到，这个类本质应该还是一个散列表，只是前面有Identity修饰，是一种特殊的HashMap。简单的说，IdentityHashMap和HashM
读《研磨设计模式》-代码笔记-享元模式-Flyweight bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.Collection; import java.util.HashMap; import java.util.List; import java
PS人像润饰&调色教程集锦 cherishLC PS
1、仿制图章沿轮廓润饰——柔化图像，凸显轮廓 http://www.howzhi.com/course/retouching/ 新建一个透明图层，使用仿制图章不断Alt+鼠标左键选点，设置透明度为21%，大小为修饰区域的1/3左右（比如胳膊宽度的1/3），再沿纹理方向（比如胳膊方向）进行修饰。所有修饰完成后，对该润饰图层添加噪声，噪声大小应该和
更新多个字段的UPDATE语句 crabdave update
更新多个字段的UPDATE语句 update tableA a set (a.v1, a.v2, a.v3, a.v4) = --使用括号确定更新的字段范围
hive实例讲解实现in和not in子句 daizj hive not in in
本文转自：http://www.cnblogs.com/ggjucheng/archive/2013/01/03/2842855.html 当前hive不支持 in或not in 中包含查询子句的语法，所以只能通过left join实现。假设有一个登陆表login(当天登陆记录,只有一个uid),和一个用户注册表regusers(当天注册用户，字段只有一个uid)，这两个表都包含
一道24点的10+种非人类解法（2,3,10,10） dsjt 算法
这是人类算24点的方法？！！！事件缘由：今天晚上突然看到一条24点状态，当时惊为天人，这NM叫人啊？以下是那条状态朱明西 : 24点，算2 3 10 10，我LX炮狗等面对四张牌痛不欲生，结果跑跑同学扫了一眼说，算出来了，2的10次方减10的3次方。。我草这是人类的算24点啊。。然后么。。。我就在深夜很得瑟的问室友求室友算刚出完题，文哥的暴走之旅开始了 5秒后
关于YII的菜单插件 CMenu和面包末breadcrumbs路径管理插件的一些使用问题 dcj3sjt126com yii framework
在使用 YIi的路径管理工具时，发现了一个问题。 <?php
对象与关系之间的矛盾：“阻抗失配”效应[转] come_for_dream 对象
概述 “阻抗失配”这一词组通常用来描述面向对象应用向传统的关系数据库（RDBMS）存放数据时所遇到的数据表述不一致问题。C++程序员已经被这个问题困扰了好多年，而现在的Java程序员和其它面向对象开发人员也对这个问题深感头痛。 “阻抗失配”产生的原因是因为对象模型与关系模型之间缺乏固有的亲合力。“阻抗失配”所带来的问题包括：类的层次关系必须绑定为关系模式（将对象
学习编程那点事 gcq511120594 编程互联网
一年前的夏天，我还在纠结要不要改行，要不要去学php？能学到真本事吗？改行能成功吗？太多的问题，我终于不顾一切，下定决心，辞去了工作，来到传说中的帝都。老师给的乘车方式还算有效，很顺利的就到了学校，赶巧了，正好学校搬到了新校区。先安顿了下来，过了个轻松的周末，第一次到帝都，逛逛吧！接下来的周一，是我噩梦的开始，学习内容对我这个零基础的人来说，除了勉强完成老师布置的作业外，我已经没有时间和精力去
Reverse Linked List II hcx2013 list
Reverse a linked list from position m to n. Do it in-place and in one-pass. For example:Given 1->2->3->4->5->NULL, m = 2 and n = 4, return
Spring4.1新特性——页面自动化测试框架Spring MVC Test HtmlUnit简介 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
Hadoop集群工具distcp liyonghui160com
1. 环境描述两个集群：rock 和 stone rock无kerberos权限认证，stone有要求认证。 1. 从rock复制到stone，采用hdfs Hadoop distcp -i hdfs://rock-nn:8020/user/cxz/input hdfs://stone-nn:8020/user/cxz/运行在rock端，即源端问题：报版本
一个备份MySQL数据库的简单Shell脚本 pda158 mysql 脚本
　　主脚本（用于备份mysql数据库）：　　该Shell脚本可以自动备份数据库。只要复制粘贴本脚本到文本编辑器中，输入数据库用户名、密码以及数据库名即可。我备份数据库使用的是mysqlump 命令。后面会对每行脚本命令进行说明。　　 1. 分别建立目录“backup”和“oldbackup” 　　#mkdir /backup 　　#mkdir /oldbackup 　
300个涵盖IT各方面的免费资源（中）——设计与编码篇 shoothao IT资源图标库图片库色彩板字体
A. 免费的设计资源 Freebbble:来自于Dribbble的免费的高质量作品。 Dribbble:Dribbble上“免费”的搜索结果——这是巨大的宝藏。 Graphic Burger:每个像素点都做得很细的绝佳的设计资源。 Pixel Buddha:免费和优质资源的专业社区。 Premium Pixels:为那些有创意的人提供免费的素材。
thrift总结 - 跨语言服务开发 uule thrift
官网官网JAVA例子 thrift入门介绍 IBM-Apache Thrift - 可伸缩的跨语言服务开发框架 Thrift入门及Java实例演示 thrift的使用介绍 RPC POM： <dependency> <groupId>org.apache.thrift</groupId>

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他