迷途无归

scrapy 单机版到 scrapy 分布式修改流程

1、设备

scrapy 单机版：1台机器
scrapy 分布式：至少2台机器

2、linux环境配置

2.1 redis安装

具体见：linux redis 完整安装过程

2.2 python环境安装

借助anaconda管理python
具体见：linux anaconda安装和环境配置

3、代码修改

3.1 setting.py修改

在setting中添加如下代码


DUPEFILTER_CLASS = "scrapy_redis.dupefilter.RFPDupeFilter"
SCHEDULER = "scrapy_redis.scheduler.Scheduler"
SCHEDULER_PERSIST = False 			# False ：爬虫时不清空redis
SCHEDULER_FLUSH_ON_START = True  	# True：启动爬虫时清空redis
SCHEDULER_QUEUE_CLASS = "scrapy_redis.queue.SpiderQueue"
# SCHEDULER_QUEUE_CLASS = "scrapy_redis.queue.FifoQueue"
# SCHEDULER_QUEUE_CLASS = "scrapy_redis.queue.PriorityQueue"
# REDIS_URL = 'redis://172.16.1.101:6379'
REDIS_HOST = '172.16.1.101'
REDIS_PORT = 6379

HTTPERROR_ALLOWED_CODES = [403]

3.2 spider代码

1、爬虫的继承改为RedisCrawlSpider

# pip install scrapy-redis

from scrapy_redis.spiders import RedisCrawlSpider

class SampleSpider(RedisCrawlSpider):
	pass

2、去掉allowed_domains、start_urls或者start_requests
3、爬虫的第一个url入口必须是parse或者自定义规则

    def parse(self, response):
    	pass

3.3 扩展：当爬虫长期处于空闲时关闭爬虫

空闲时长为1小时即关闭爬虫

1、setting.py添加

MYEXT_ENABLED = True      # 开启扩展
IDLE_NUMBER = 720           # 配置空闲持续时间单位为 360个 ，一个时间单位为5s。   360个：半小时

# 在 EXTENSIONS 配置，激活扩展
EXTENSIONS = {
            'project.extensions.RedisSpiderSmartIdleClosedExensions': 500,
        }

2、extensions.py
详见extensions附录

4 任务定时

4.1 redis机器crontab任务

# 爬虫启动和start_url

# comic_redis
5 0 * * * sh /home/hilqiqi0/workspace/crawler_redis/run_scrapy.sh sample >> /home/hilqiqi0/workspace/crawler_redis/log.txt 2>&1

15 0 * * * sh /home/hilqiqi0/workspace/crawler_redis/run_scrapy_redis_start_url.sh

4.2 其他爬虫机器crontab任务

# 其他的爬虫启动

# comic_redis
5 0 * * * sh /home/hilqiqi0/workspace/crawler_redis/run_scrapy.sh qq >> /home/hilqiqi0/workspace/crawler_redis/log.txt 2>&1

4.3 爬虫启动脚本：run_scrapy.sh

#!/bin/bash

# 不一样的python环境；若是统一安装就不必判断

# -f 参数判断 $file 是否存在
if [ -f "/data2/hilqiqi0/venv/bin/activate" ]; then
  echo /data2/hilqiqi0/venv/bin/activate
  source /data2/hilqiqi0/venv/bin/activate
fi

if [ ! -f "/data2/hilqiqi0/venv/bin/activate" ]; then
  echo /etc/profile
  source /etc/profile
#  echo conda activate
#  conda activate
fi

cur_dateTime="`date +%Y-%m-%d,%H:%M:%S`"
echo $cur_dateTime
cd /home/hilqiqi0/workspace/crawler_redis
echo $1
echo log/log_$1.txt
scrapy crawl $1 > log/log_$1.txt 2>&1 &

/data2/hilqiqi0/venv/bin/activate：python虚拟环境

4.4 爬虫启动脚本：run_scrapy_redis_start_url.sh

#!/bin/bash
source /etc/profile

redis-cli lpush sample:start_urls www.sample.com

5、附录

5.1extensions.py

# -*- coding: utf-8 -*-

# Define here the models for your scraped Extensions


from scrapy import signals
from scrapy.exceptions import NotConfigured


class RedisSpiderSmartIdleClosedExensions(object):

    def __init__(self, idle_number, crawler):
        self.crawler = crawler
        self.idle_number = idle_number
        self.idle_list = []
        self.idle_count = 0

    @classmethod
    def from_crawler(cls, crawler):
        # first check if the extension should be enabled and raise

        # NotConfigured otherwise

        if not crawler.settings.getbool('MYEXT_ENABLED'):

            raise NotConfigured

        if not 'redis_key' in crawler.spidercls.__dict__.keys():

            raise NotConfigured('Only supports RedisSpider')

        # get the number of items from settings

        idle_number = crawler.settings.getint('IDLE_NUMBER', 360)

        # instantiate the extension object

        ext = cls(idle_number, crawler)

        # connect the extension object to signals

        crawler.signals.connect(ext.spider_opened, signal=signals.spider_opened)

        crawler.signals.connect(ext.spider_closed, signal=signals.spider_closed)

        crawler.signals.connect(ext.spider_idle, signal=signals.spider_idle)

        return ext

    def spider_opened(self, spider):
        spider.logger.info("opened spider {}, Allow waiting time:{} second".format(spider.name, self.idle_number*5))

    def spider_closed(self, spider):
        spider.logger.info("closed spider {}, Waiting time exceeded {} second".format(spider.name, self.idle_number*5))

    def spider_idle(self, spider):
        # 程序启动的时候会调用这个方法一次，之后每隔5秒再请求一次
        # 当持续半个小时都没有spider.redis_key，就关闭爬虫
        # 判断是否存在 redis_key
        if not spider.server.exists(spider.redis_key):
            self.idle_count += 1
        else:
            self.idle_count = 0

        if self.idle_count > self.idle_number:
            # 执行关闭爬虫操作
            self.crawler.engine.close_spider(spider, 'Waiting time exceeded')

你可能感兴趣的:(总结,scrapy)

html重点知识总结 *goliter * html 前端
html重点知识一直在网上看过许多不同的前端资料，但是总觉的只是单单的阅读和记忆不能够真正的加深自己的知识理解，所以开始尝试自己在不查看其他一切资料的情况下对自己了解的知识做一个总结（顺序或许有点乱），如果之后发现有不足再来补充，我相信输出才是最好的输入！！！H5新增内容语义化标签：h5新增了一系列语义化标签，他们本质上和一般的div标签没有区别，但是在语义上有不同。header：专门指页面的顶部
python中的下划线用法总结白色机械键盘 python实践 python 开发语言
在Python中，下划线（underscore）有多种用法。它在不同的上下文中可以扮演不同的角色，下面是其常见用法的总结：1.单下划线"_"1.1作为临时变量或无用变量在循环或解包操作中，表示一个临时的或不关心的变量。for_inrange(5):print("Hello,World!")a,_,b=(1,2,3)print(a,b)#输出:131.2在交互式解释器中在交互式解释器中，"_"用于保
AI学习第二天--监督学习半监督学习无监督学习 iisugar 机器学习支持向量机人工智能
目录1.监督学习（SupervisedLearning）比喻：技术细节：形象例子：2.无监督学习（UnsupervisedLearning）比喻：技术细节：形象例子：3.半监督学习（Semi-SupervisedLearning）比喻：技术细节：形象例子：4.三者的对比与选择表格总结：5.实际案例对比案例：电商平台用户分群6.关键逻辑总结1.监督学习（SupervisedLearning）比喻：老
微服务监控prometheus+Grafana chen2017sheng 经验总结微服务 prometheus grafana
目录Prometheus概述核心组件特点使用场景Grafana概述功能特点使用场景Prometheus+Grafana组合部署和配置一、准备工作二、部署Prometheus三、部署Grafana四、创建监控仪表盘五、验证和调优总结微服务监控是确保微服务架构稳定运行的关键环节，其中Prometheus与Grafana的组合是业界广泛采用的监控解决方案。以下是对这一组合的详细介绍：Prometheus
Python实现自动提取目标文档的大纲（13）写python的鑫哥 Python办公自动化 python 自动提取 Word 文档大纲编号
前言本文是该专栏的第13篇，后面会持续分享Python办公自动化干货知识，记得关注。大纲是一种用于组织和呈现内容结构的工具，它通过层次化的形式展示信息的框架和重点。其通常用于规划、整理和总结文档、报告、演讲、论文或其他任何形式的写作和表达。它可以帮助作者或演讲者清晰地梳理思路，确保内容的逻辑性和连贯性，同时也便于读者或听众快速了解整体结构和重点内容。而本文，笔者也重点来讲述通过Python，如何来
鸿蒙30道高频面试题总结 zero_godv harmonyos 面试华为
1.什么是弹性布局？Flex容器，弹性布局分为单行布局和多行布局，单行内：当子元素尺寸总和大于Flex容器尺寸是，子元素会自动挤压。多行内：用wrap属性控制自动换行2.绝对定位和相对定位的区别？绝对定位：position，相对父组件左上角进行偏移，不占位置相对定位：offset，相对自身左上角进行便宜，占位置3.什么是层叠布局？Stack：实现位置的固定定位与层叠，后一个子元素覆盖前一个子元素通
Django 发送email配置详解及各种错误类型 weixin_30496751 python
跟随DjangoBook的内容发送邮件不成功，总结一下需要配置好settings.py文件，还要注意一些细节。1、在settings文件最后添加以下内容，缺一不可！EMAIL_HOST='smtp.163.com'EMAIL_PORT=25EMAIL_HOST_USER='[email protected]'（你有163邮箱的话）EMAIL_HOST_PASSWORD=‘xxxxxxx'EMAIL_US
Hive函数大全：从核心内置函数到自定义UDF实战指南（附详细案例与总结）一个天蝎座白勺程序猿大数据开发从入门到实战合集 hive hadoop 数据仓库
目录背景‌一、Hive函数分类与核心函数表‌1.内置函数分类‌2.用户自定义函数（UDF）分类二、常用函数详解与实战案例‌1.数学函数‌2.字符串函数‌3.窗口函数‌4.自定义UDF实战‌三、总结与优化建议‌1.核心总结2.性能优化建议‌3.常问问题背景‌Hive作为Hadoop生态中最常用的数据仓库工具，其强大的函数库是高效处理和分析海量数据的核心能力之一。Hive函数分为‌内置函数‌和‌用户自
巴菲特的成功秘诀：长期持有优质股票 AI大模型应用之禅 DeepSeek 大数据人工智能 ai
巴菲特的成功秘诀：长期持有优质股票关键词：巴菲特、投资哲学、股票选择、风险管理、长期持有、优质股票摘要：本文将深入探讨巴菲特的成功秘诀——长期持有优质股票。通过分析巴菲特的投资理念、股票选择方法、投资策略与风险管理，结合实际案例，总结出投资者可以借鉴的投资实战指南，以期为读者提供有价值的投资参考。1.开篇：书名介绍与作者介绍本书《巴菲特的成功秘诀：长期持有优质股票》旨在揭示世界著名投资家沃伦·巴菲
【Python】Flask与Django对比详解：教你如何选择最适合你的Web框架小芬熊面试学习路线阿里巴巴 python flask django
文章目录引言：为何选择PythonWeb框架？Flask简介：轻量级的灵活之选??Flask的核心特点Django简介：全能型的强大框架??Django的核心特点Flask与Django的详细对比架构设计功能与扩展性性能与效率模板系统ORM（对象关系映射）详细对比表格适用场景总结案例分享：如何选择适合的框架小李的博文项目：选择Flask??小张的电商平台：选择Django??了解更多AI内容结论：
【C++动态库】DLL动态库加载失败导致程序启动报错以及DLL库加载失败的常见原因分析与总结 dvlinker C/C++实战专栏 C/C++软件开发从入门到实战 dll动态库隐式加载动态加载加载失败 LoadLibraryEx 动态库找不到接口找不到
目录1、问题说明2、dll库的隐式加载与动态加载2.1、dll库的隐式加载2.2、dll库的显式加载3、使用ProcessExplorer查看进程加载的dll库信息以及动态加载的dll库有没有加载成功3.1、使用ProcessExplorer查看进程加载的dll库信息3.2、使用ProcessExplorer查看动态启动的库有没有加载成功4、dll库加载失败原因详细分析与说明4.1、dll位数与依
python，squeeze的详细解释，代码并进行解释资源存储库笔记算法 python 开发语言
目录python，squeeze的详细解释，代码并进行解释Python中的squeeze操作主要作用：PyTorch中的squeeze示例1：去除所有单维度示例2：指定去除维度NumPy中的squeeze示例1：去除所有单维度示例2：指定去除维度何时使用squeeze？总结python，squeeze的详细解释，代码并进行解释Python中的squeeze操作Squeeze是一个用于去除张量或数组
Android Zygote的进程机制王景程 android zygote github 模块测试
目录✅AndroidZygote进程机制详解一、Zygote的作用⚙️二、Zygote启动流程✅1.init进程启动Zygote✅2.Zygote初始化虚拟机与核心类库✅3.Zygote监听Socket✅4.Zygotefork创建应用进程三、Zygote与应用进程之间的关系四、Zygote多进程模型️五、Zygote性能优化机制✅六、Zygote的安全性总结✅AndroidZygote进程机制详
Promise 让你的代码更优雅、更高效！码熔burning 前端前端 Promise
目录一、什么是Promise？二、Promise的基本用法三、Promise的状态转换四、Promise的链式调用五、Promise的静态方法六、async/await(Promise的语法糖)总结我的其他文章也讲解的比较有趣，如果喜欢博主的讲解方式，可以多多支持一下，感谢！了解双亲委派机制请看：双亲委派机制，你真的懂吗？其他优质专栏：【SpringBoot】【多线程】【Redis】【✨设计模式专
5周0基础冲刺蓝桥杯省重点 4 杰克尼 [速成蓝桥杯]0基础冲省奖重点蓝桥杯职场和发展
目录[算法题解]李白打酒题目详情问题描述题目描述运行限制代码实现cpp运行结果总结分享算法题解是我记录学习、交流进步的方式～如果这篇文章对你有帮助，欢迎关注我的CSDN账号杰克尼，后续会持续更新更多算法题解、编程技巧，一起在代码的世界里探索成长！[算法题解]李白打酒嗨，大家好！我是杰克尼，最近在疯狂刷算法题提升编程能力～今天分享一道很有意思的算法题解题过程。无论是算法新手还是想交流思路的小伙伴，都
【工作记录】python使用总结星光不负赶路人！ python
1.os库2.xlwt库3.xlrd库4.BeautifulSoup库5.panda库6.json库7.re正则8.ddddocr登录网站的时候，经常输入用户名和密码后会遇到验证码，ddddocr是一款强大的通用开源ocr识别库，具有高效、准确、易用的特点，广泛应用于图像处理和文字识别任务。importddddocrtry:login_page.wait_for_timeout(2000)#等待2
使用mockMVC对controller层进行接口调试无一郎的技术圈工作经验积累 java 后端 mvc
文章目录背景一、controller层构建二、controller层测试1.先尝试本地postman测试2.使用mockMVC进行调试3.使用mockMVC和本地不同总结背景后端新增了一个对算法badCase排查功能，通过用户传入的内容按照节点成功或者失败走不同分支流程处理，流程结构如图所示。判定流程的底层功能通过service层以RPC接口形式提供服务，结构定义如下：publicResponse
1.1Vue 3 核心优势与架构革新北辰alk vue.js 架构前端
文章目录**1.1Vue3核心优势与架构革新****一、设计哲学演进****二、响应式系统革命****三、组合式API范式****四、编译器架构升级****五、类型系统集成****六、生态融合能力****七、性能基准对比****八、架构升级路线****本章深度总结**1.1Vue3核心优势与架构革新一、设计哲学演进渐进式框架的终极形态模块化架构：通过@vue/reactivity、@vue/run
01 什么是RPC？原理是什么？立刀旁 rpc 手写rpc框架 lidaopang
系列文章目录后续会出教程文章目录一、什么是RPC？二、RPC原理是什么？总结前言从零开始手把手教你实现一个简单的RPC框架，Rpc项目完整源码我已经上传到github上，可以结合教程一起学习，有疑问的地方可以私信问我。如果觉得这个项目有帮到你的话，希望你能给我的项目一个star，这也是我更新的动力。一、什么是RPC？RPC（RemoteProcedureCall）即远程过程调用，通过名字我们就能看
c++STL常用算法之排序算法——全面总结（附案例解析）（二十四）磊磊cpp C/C++STL详细教学 C++STL
这里有C++STL——全面总结详细教程（附案例解析）（持续更新中）常用排序算法学习目标：掌握常用的排序算法算法简介：sort//对容器内元素进行排序random_shuffle//洗牌指定范围内的元素随机调整次序merge//容器元素合并，并存储到另一容器中reverse//反转指定范围的元素sort功能描述：对容器内元素进行排序函数原型：sort(iteratorbeg,iteratorend,
HTML 专栏总结：回顾与展望烂蜻蜓 HTML html 前端
在本HTML专栏的二十余篇文章中，我们一同深入探索了HTML这一网页构建基石的丰富世界。从最基础的概念出发，我们逐步揭开了HTML的神秘面纱。我们学习到HTML作为在Web上广泛应用的通用标记语言，承担着构建网页基本结构与内容呈现的重任。通过各类标签，我们能够对文本进行多样化的格式化，让标题醒目、段落清晰，强调重点语句，还能为文字添加特殊样式，如加粗、斜体、下划线等，极大地丰富了文本的表现力。在图
iOS底层原理总结 - 探寻OC对象的本质 qq_34666585 底层原理 iOS底层原理
原文链接：iOS底层原理总结-探寻OC对象的本质iOS底层原理总结-探寻OC对象的本质对小码哥底层班视频学习的总结与记录。面试题部分，通过对面试题的分析探索问题的本质内容。面试题：一个NSObject对象占用多少内存？探寻OC对象的本质，我们平时编写的Objective-C代码，底层实现其实都是C\C++代码。OC的对象结构都是通过基础C\C++的结构体实现的。我们通过创建OC文件及对象，并将OC
C语言实现队列数据结构：思路与代码详解共享家9527 c 数据结构 c语言数据结构开发语言
目录一、引言二、整体思路三、代码模块分析（一）头文件包含与宏定义（二）数据类型定义（三）队列操作函数1.队列初始化2.队列销毁3.入队操作4.出队操作5.获取队头元素6.获取队尾元素7.获取队列大小8.判断队列是否为空（四）主函数测试四、总结作者主页：共享家9527-CSDN博客一、引言队列是一种重要的数据结构，遵循先进先出（FIFO）的原则。在C语言中，我们可以通过自定义结构体和一系列操作函数来
Java~二叉树进阶练习题：根据先序遍历和中序遍历构建二叉树与根据后序遍历和中序遍历构建二叉树 Java墨言程序员 java 面试算法
《一线大厂Java面试题解析+核心总结学习笔记+最新讲解视频+实战项目源码》，点击传送门，即可获取！先序遍历中第一个一定是根结点。中序遍历中根结点左子树的所有结点一定在根结点的左边，右子树的所有结点一定在根结点的右边。所有中序遍历的序列组成可以表示为：左子树结点+根结点+右子树结点。后序遍历中最后一个结点一定是根结点。****根据先序遍历和中序遍历构建二叉树解题细想：**设置变量inedx方便从p
问题链的拓扑学重构由数入道 AI辅助教学拓扑学重构
问题链拓扑学重构目录概念框架与理论基础综合知识图谱（Mermaid图示）核心构成要素与参数解析逻辑链条方法论详解与数学模型4.1根源溯源——分形式5Whys与RCA4.2网络建模——系统动力学与贝叶斯网络4.3维度跃迁——第一性原理与跨模态映射4.4时空折叠——历史回溯与未来推演四维操控模型——知识精髓工具、案例及实践方法注意事项、终止机制与系统自适应未来拓展与研究方向总结与战略价值1.概念框架与
Linux缓冲区续集——手撕fopen、fwrite、fflush、fclose等C库函数橙予清的zzz~ Linux C语言知识点 linux c语言
目录头文件：接下来就是设计这四个函数：Mystdio.c重点讲一讲_fflush函数的底层实现原理：所以数据内容的经过如下：总结：执行——测试写好的这4个函数：运行结果:修改测试代码：运行结果:回顾上文，我讲述了关于Linux文件系统中关于缓冲区的含义和理解，用一个特殊案例表明了我们所了解到的缓冲区是C语言库函数中特有的，而系统调用函数没有。此外就是C库缓冲区的刷新策略，共有三种：立即刷新、行缓冲
如何在论文中添加参考文献引用（以Word2016为例）韦_恩 windows日常使用总结 office word
相信很多同学在写论文时候的引用是手动自己加的吧？这样不是不行，就是万一某个引用变了就会导致牵一发动全身的问题，所以利用word中提供给你的方式就可以灵活动态添加引用，因为这个东西并不是天天用，所以很容易忘，今天来总结一下。目录1.自定义编号2.添加引用编号3.调整编号与内容之间的空隙4.在文中添加引用5.引用顺序变更后自动调整6.总结1.自定义编号定义新编号格式。在编号格式中加上文献引用的“[]”
网络爬虫之urllib库 db_zwm_2035 爬虫
目录前言：一、urllib库简介二、使用urllib.request获取网页内容三、处理URL和请求头部四、解析URLs和查询参数五、处理异常七、总结前言：随着互联网的快速发展，网络数据已经成为我们获取信息、解决问题的重要来源。网络爬虫作为获取网络数据的重要工具，越来越受到人们的关注。Python作为一种简单易学、功能强大的编程语言，在网络爬虫领域也得到了广泛的应用。在Python中，urllib
《Operating System Concepts》阅读笔记：p354-p358 操作系统
《OperatingSystemConcepts》学习第31天，p354-p358总结，总计5页。一、技术总结1.logicaladdress&virtualaddressBindingaddressesateithercompileorloadtimegeneratesidenticallogicalandphysicaladdresses.However,theexecution-timead
《Operating System Concepts》阅读笔记：p331-p353 操作系统
《OperatingSystemConcepts》学习第30天，p331-p353总结，总计23页。一、技术总结1.lockdep工具2.claimedge3.banker'salgorithmAdeadlockavoidancealgorithm,lessefficientthantheresource-allocationgraphschemebutabletodealwithmultiple
Js函数返回值 _wy_ js return
一、返回控制与函数结果，语法为：return 表达式;作用: 结束函数执行，返回调用函数，而且把表达式的值作为函数的结果二、返回控制语法为：return;作用: 结束函数执行，返回调用函数，而且把undefined作为函数的结果在大多数情况下,为事件处理函数返回false,可以防止默认的事件行为.例如,默认情况下点击一个<a>元素,页面会跳转到该元素href属性
MySQL 的 char 与 varchar bylijinnan mysql
今天发现，create table 时，MySQL 4.1有时会把 char 自动转换成 varchar 测试举例： CREATE TABLE `varcharLessThan4` ( `lastName` varchar(3) ) ; mysql> desc varcharLessThan4; +----------+---------+------+-
Quartz——TriggerListener和JobListener eksliang TriggerListener JobListener quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208624 一.概述 listener是一个监听器对象，用于监听scheduler中发生的事件，然后执行相应的操作；你可能已经猜到了，TriggerListeners接受与trigger相关的事件，JobListeners接受与jobs相关的事件。二.JobListener监听器 j
oracle层次查询 18289753290 oracle；层次查询；树查询
.oracle层次查询(connect by) oracle的emp表中包含了一列mgr指出谁是雇员的经理，由于经理也是雇员，所以经理的信息也存储在emp表中。这样emp表就是一个自引用表，表中的mgr列是一个自引用列，它指向emp表中的empno列，mgr表示一个员工的管理者， select empno,mgr,ename,sal from e
通过反射把map中的属性赋值到实体类bean对象中酷的飞上天空 javaee 泛型类型转换
使用过struts2后感觉最方便的就是这个框架能自动把表单的参数赋值到action里面的对象中但现在主要使用Spring框架的MVC，虽然也有@ModelAttribute可以使用但是明显感觉不方便。好吧，那就自己再造一个轮子吧。原理都知道，就是利用反射进行字段的赋值，下面贴代码主要类如下： import java.lang.reflect.Field; imp
SAP HANA数据存储：传统硬盘的瓶颈问题蓝儿唯美 HANA
SAPHANA平台有各种各样的应用场景，这也意味着客户的实施方法有许多种选择，关键是如何挑选最适合他们需求的实施方案。在《Implementing SAP HANA》这本书中，介绍了SAP平台在现实场景中的运作原理，并给出了实施建议和成功案例供参考。本系列文章节选自《Implementing SAP HANA》，介绍了行存储和列存储的各自特点，以及SAP HANA的数据存储方式如何提升空间压
Java Socket 多线程实现文件传输随便小屋 java socket
高级操作系统作业，让用Socket实现文件传输，有些代码也是在网上找的，写的不好，如果大家能用就用上。客户端类： package edu.logic.client; import java.io.BufferedInputStream; import java.io.Buffered
java初学者路径 aijuans java
学习Java有没有什么捷径?要想学好Java，首先要知道Java的大致分类。自从Sun推出Java以来，就力图使之无所不包，所以Java发展到现在，按应用来分主要分为三大块：J2SE,J2ME和J2EE,这也就是Sun ONE(Open Net Environment)体系。J2SE就是Java2的标准版，主要用于桌面应用软件的编程；J2ME主要应用于嵌入是系统开发，如手机和PDA的编程；J2EE
APP推广 aoyouzi APP 推广
一，免费篇 1，APP推荐类网站自主推荐最美应用、酷安网、DEMO8、木蚂蚁发现频道等,如果产品独特新颖，还能获取最美应用的评测推荐。PS：推荐简单。只要产品有趣好玩，用户会自主分享传播。例如足迹APP在最美应用推荐一次，几天用户暴增将服务器击垮。 2，各大应用商店首发合作老实盯着排期，多给应用市场官方负责人献殷勤。 3，论坛贴吧推广百度知道，百度贴吧，猫扑论坛，天涯社区，豆瓣（
JSP转发与重定向百合不是茶 jsp servlet Java Web jsp转发
在servlet和jsp中我们经常需要请求,这时就需要用到转发和重定向; 转发包括;forward和include 例子;forwrad转发; 将请求装法给reg.html页面关键代码; req.getRequestDispatcher("reg.html
web.xml之jsp-config bijian1013 java web.xml servlet jsp-config
1.作用：主要用于设定JSP页面的相关配置。 2.常见定义： <jsp-config> <taglib> <taglib-uri>URI(定义TLD文件的URI,JSP页面的tablib命令可以经由此URI获取到TLD文件)</tablib-uri> <taglib-location> TLD文件所在的位置
JSF2.2 ViewScoped Using CDI sunjing CDI JSF 2.2 ViewScoped
JSF 2.0 introduced annotation @ViewScoped; A bean annotated with this scope maintained its state as long as the user stays on the same view(reloads or navigation - no intervening views). One problem w
【分布式数据一致性二】Zookeeper数据读写一致性 bit1129 zookeeper
很多文档说Zookeeper是强一致性保证，事实不然。关于一致性模型请参考http://bit1129.iteye.com/blog/2155336 Zookeeper的数据同步协议 Zookeeper采用称为Quorum Based Protocol的数据同步协议。假如Zookeeper集群有N台Zookeeper服务器(N通常取奇数，3台能够满足数据可靠性同时
Java开发笔记白糖_ java开发
1、Map<key,value>的remove方法只能识别相同类型的key值 Map<Integer,String> map = new HashMap<Integer,String>(); map.put(1,"a"); map.put(2,"b"); map.put(3,"c"
图片黑色阴影 bozch 图片
.event{ padding:0; width:460px; min-width: 460px; border:0px solid #e4e4e4; height: 350px; min-heig
编程之美-饮料供货-动态规划 bylijinnan 动态规划
import java.util.Arrays; import java.util.Random; public class BeverageSupply { /** * 编程之美饮料供货 * 设Opt（V’，i）表示从i到n-1种饮料中，总容量为V’的方案中，满意度之和的最大值。 * 那么递归式就应该是：Opt（V’，i）=max{ k * Hi+Op
ajax大参数（大数据）提交性能分析 chenbowen00 Web Ajax 框架浏览器 prototype
近期在项目中发现如下一个问题项目中有个提交现场事件的功能，该功能主要是在web客户端保存现场数据（主要有截屏，终端日志等信息）然后提交到服务器上方便我们分析定位问题。客户在使用该功能的过程中反应点击提交后反应很慢，大概要等10到20秒的时间浏览器才能操作，期间页面不响应事件。根据客户描述分析了下的代码流程，很简单，主要通过OCX控件截屏，在将前端的日志等文件使用OCX控件打包，在将之转换为
[宇宙与天文]在太空采矿,在太空建造 comsci
我们在太空进行工业活动...但是不太可能把太空工业产品又运回到地面上进行加工,而一般是在哪里开采,就在哪里加工,太空的微重力环境,可能会使我们的工业产品的制造尺度非常巨大.... 地球上制造的最大工业机器是超级油轮和航空母舰,再大些就会遇到困难了,但是在空间船坞中,制造的最大工业机器,可能就没
ORACLE中CONSTRAINT的四对属性 daizj oracle CONSTRAINT
ORACLE中CONSTRAINT的四对属性 summary:在data migrate时,某些表的约束总是困扰着我们,让我们的migratet举步维艰,如何利用约束本身的属性来处理这些问题呢?本文详细介绍了约束的四对属性: Deferrable/not deferrable, Deferred/immediate, enalbe/disable, validate/novalidate,以及如
Gradle入门教程 dengkane gradle
一、寻找gradle的历程一开始的时候，我们只有一个工程，所有要用到的jar包都放到工程目录下面，时间长了，工程越来越大，使用到的jar包也越来越多，难以理解jar之间的依赖关系。再后来我们把旧的工程拆分到不同的工程里，靠ide来管理工程之间的依赖关系，各工程下的jar包依赖是杂乱的。一段时间后，我们发现用ide来管理项程很不方便，比如不方便脱离ide自动构建，于是我们写自己的ant脚本。再后
C语言简单循环示例 dcj3sjt126com c
# include <stdio.h> int main(void) { int i; int count = 0; int sum = 0; float avg; for (i=1; i<=100; i++) { if (i%2==0) { count++; sum += i; } } avg
presentModalViewController 的动画效果 dcj3sjt126com controller
系统自带(四种效果)： presentModalViewController模态的动画效果设置： [cpp] view plain copy UIViewController *detailViewController = [[UIViewController al
java 二分查找 shuizhaosi888 二分查找 java二分查找
需求：在排好顺序的一串数字中，找到数字T 一般解法：从左到右扫描数据，其运行花费线性时间O(N)。然而这个算法并没有用到该表已经排序的事实。 /** * * @param array * 顺序数组 * @param t * 要查找对象 * @return */ public stati
Spring Security（07）——缓存UserDetails 234390216 ehcache 缓存 Spring Security
Spring Security提供了一个实现了可以缓存UserDetails的UserDetailsService实现类，CachingUserDetailsService。该类的构造接收一个用于真正加载UserDetails的UserDetailsService实现类。当需要加载UserDetails时，其首先会从缓存中获取，如果缓存中没
Dozer 深层次复制 jayluns VO maven po
最近在做项目上遇到了一些小问题，因为架构在做设计的时候web前段展示用到了vo层，而在后台进行与数据库层操作的时候用到的是Po层。这样在业务层返回vo到控制层，每一次都需要从po-->转化到vo层，用到BeanUtils.copyProperties(source, target)只能复制简单的属性，因为实体类都配置了hibernate那些关联关系，所以它满足不了现在的需求，但后发现还有个很
CSS规范整理（摘自懒人图库） a409435341 html UI css 浏览器
刚没事闲着在网上瞎逛，找了一篇CSS规范整理，粗略看了一下后还蛮有一定的道理，并自问是否有这样的规范，这也是初入前端开发的人一个很好的规范吧。一、文件规范 1、文件均归档至约定的目录中。具体要求通过豆瓣的CSS规范进行讲解：所有的CSS分为两大类：通用类和业务类。通用的CSS文件，放在如下目录中：基本样式库 /css/core
C++动态链接库创建与使用你不认识的休道人 C++dll
一、创建动态链接库 1.新建工程test中选择”MFC [dll]”dll类型选择第二项"Regular DLL With MFC shared linked"，完成 2.在test.h中添加 extern “C” 返回类型 _declspec(dllexport)函数名(参数列表); 3.在test.cpp中最后写 extern “C” 返回类型 _decls
Android代码混淆之ProGuard rensanning ProGuard
Android应用的Java代码，通过反编译apk文件（dex2jar、apktool）很容易得到源代码，所以在release版本的apk中一定要混淆一下一些关键的Java源码。 ProGuard是一个开源的Java代码混淆器（obfuscation）。ADT r8开始它被默认集成到了Android SDK中。官网： http://proguard.sourceforge.net/
程序员在编程中遇到的奇葩弱智问题 tomcat_oracle jquery 编程 ide
　　现在收集一下：　　排名不分先后，按照发言顺序来的。 1、Jquery插件一个通用函数一直报错，尤其是很明显是存在的函数，很有可能就是你没有引入jquery。。。或者版本不对 2、调试半天没变化：不在同一个文件中调试。这个很可怕，我们很多时候会备份好几个项目，改完发现改错了。有个群友说的好：在汤匙
解决maven-dependency-plugin (goals "copy-dependencies","unpack") is not supported xp9802 dependency
解决办法：在plugins之前添加如下pluginManagement，二者前后顺序如下： [html] view plain copy <build> <pluginManagement

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他