一只程序猿子

Python爬虫之多线程爬取小说

博主：一只程序猿子

博客主页：一只程序猿子博客主页

个人介绍：爱好(bushi)编程！

创作不易：喜欢的话麻烦您点个和⭐！

欢迎访问我的主页（点我直达）

除此之外您还可以通过个人名片联系我
额滴名片儿

目录

1.介绍

2.技术介绍

（1）threading

（2）queue

（3）lxml

3.爬取过程分析

（1）找到完本小说排行榜

（2）获取每一篇小说的信息

（3）获取某篇小说所有章节的信息

（4）多线程下载所有章节的内容

（5）合并该小说的所有章节

4.源码

5.运行效果

1.介绍

本文讲介绍如何使用Python编写爬虫爬取小说网站的小说！在本文中,我们将使用多线程技术提高爬取的效率。

2.技术介绍

（1）threading

Python的threading库是Python标准库中的一个模块，用于实现多线程编程。它提供了一些简单的线程控制机制，使得程序员可以轻松地创建和管理线程。

threading库中的Thread类是实现多线程的核心类，可以创建多个线程，并对线程的状态进行控制。通过调用线程对象的start()方法可以启动线程，线程启动后会自动执行run()方法中的代码。线程的执行可以通过join()方法来等待线程完成。

我们将在本文代码中使用该库来实现多线程爬取！

（2）queue

Python的queue库（在Python 2.x中名为Queue）是Python标准库中的一个模块，提供了线程安全的队列实现。这个库在多线程编程中特别有用，因为当多个线程需要安全地交换数据时，它可以作为一个中间的数据结构来保证数据的安全性和一致性。

queue库中有三种类型的队列：

FIFO队列（先进先出）：这是最常见的队列类型，其中元素的添加和移除都是按照它们首次出现的顺序进行的。可以通过queue.Queue(maxsize)来创建一个FIFO队列，其中maxsize是一个整数，用于设置队列中可以放入的项目数的上限。

LIFO队列（后进先出）：这种队列类似于一个栈，后添加的元素会先被移除。可以使用queue.LifoQueue(maxsize)来创建一个LIFO队列。

优先级队列：在这种队列中，元素是按照它们的优先级被移除的，优先级最低的元素会最先被移除（或者可以根据设置的最高优先级来移除元素）。元素通常是以元组的形式存储的，例如(priority_number, data)，其中priority_number表示优先级。可以使用queue.PriorityQueue(maxsize)来创建一个优先级队列。

除了队列类型外，queue库还提供了一些常用的方法，如put()用于向队列中添加元素，get()用于从队列中移除并返回元素，以及empty()用于检查队列是否为空等。

在多线程应用中，由于多个线程可能同时访问和修改共享数据，因此使用线程安全的队列是很重要的。queue库提供的队列实现是线程安全的，这意味着在多线程环境中，你可以放心地使用这些队列来进行数据交换和通信，而不用担心数据的一致性和安全性问题。

我们将使用该库生成一个队列，用于存放爬取任务，保证数据的安全性和一致性。

（3）lxml

lxml是Python中一个非常快速和方便的XML和HTML解析库。其中，etree是lxml中的一个模块，提供了对XML和HTML文档的解析和操作功能。

etree模块提供了以下几个常用的类：

Element：表示XML或HTML文档中的元素。可以通过Element类创建新的元素，并可以添加子元素、属性和文本内容。

SubElement：表示元素的一个子元素。可以使用SubElement类在现有元素下创建子元素。

ElementTree：表示整个XML或HTML文档。可以使用ElementTree类创建整个文档，并将元素添加到文档中。

fromstring()和parse()：这两个函数可以从字符串或文件中解析XML或HTML文档，并返回一个ElementTree对象。

etree模块还提供了一些常用的方法，如find()、findall()、xpath()等，用于在XML或HTML文档中查找元素。这些方法可以方便地查找具有特定属性、标签名或路径的元素。

使用lxml的etree模块可以方便地解析、操作和生成XML和HTML文档，使得在Python中进行XML和HTML处理更加简单和高效。

我们将使用该库的etree模块在HTML文档中查找我们需要的内容！

3.爬取过程分析

（1）找到完本小说排行榜

（2）获取每一篇小说的信息

（3）获取某篇小说所有章节的信息

（4）多线程下载所有章节的内容

因为小说的章节较多,使用多线程下载每个章节的内容会提高爬取效率。

（5）合并该小说的所有章节

最终实现把整本小说存放到一个.txt文档中！

4.源码

import os
import threading
import time
from threading import Thread

import requests
from lxml import etree
from queue import Queue
from Fiction_Spider.settings import headers

# 创建了一个具有最大长度为 10000 的先进先出（FIFO）队列。
q = Queue(10000)


# 1. 获取完本小说排行榜中的小说信息
def get_fiction_list():
	fiction_list_url = "https://www.52bqg.org/wanben/"

	req = requests.get(url=fiction_list_url, headers=headers).text
	# print(req)
	html = etree.HTML(req)

	fiction_types = html.xpath('//div[@id="newscontent"]/div[2]//span[@class="s1"]/text()')
	# print(fiction_types)
	fiction_urls = html.xpath('//div[@id="newscontent"]/div[2]//a/@href')
	# print(fiction_urls)

	return fiction_types, fiction_urls, fiction_titles, fiction_authors


# 2.获取一本小说的所有章节信息
def get_chapter(fiction_url):
	# fiction_url = "https://www.52bqg.org/book_84747/"
	req = requests.get(url=fiction_url, headers=headers).text

	html = etree.HTML(req)
	chapter_urls = html.xpath('//div[@id="list"]//a/@href')[12:22]    # 去掉22获取所有章节url
	chapter_titles = html.xpath('//div[@id="list"]//a/text()')[12:22]    # 去掉22获取所有章节标题
	# print(chapter_urls)
	# print(chapter_titles)

	return chapter_titles


# 3.获取小说的一个章节的内容
def get_content(chapter_url, chapter_title):
	max_retries = 3
	session = requests.Session()
	retries = 0
	while retries < max_retries:
		try:
			resp = session.get(chapter_url)
			resp.raise_for_status()  # 如果响应状态码不是200，则引发HTTPError异常
			html = etree.HTML(resp.text)
			content = html.xpath('//div[@id="content"]/text()')[1:]
			content = f'{chapter_title}\n\n' + '\n\n'.join(content) + '\n\n'
			# print(content)
			return content


# 4.下载一本小说的所有章节的内容
def download():
	while not q.empty():
		chapter_url, chapter_title = q.get()
		content = get_content(chapter_url, chapter_title)
		if content != "":
			with open(f'data/{chapter_title}.txt', 'w', encoding='utf-8') as f:
				f.write(content)
			print(f'{threading.current_thread().name}已下载.....{chapter_title}')
		else:
			q.put([chapter_url, chapter_title])
		time. Sleep(1)


# 5.合并一本小说的所有章节
def merge(chapter_titles, book_name):
	with open(f'data/{book_name}.txt', 'a', encoding='utf-8') as f:
		for chapter_title in chapter_titles:
			file_path = f"data/{chapter_title}.txt"
			if os.path.exists(file_path):
				with open(file_path, 'r', encoding='utf-8') as fp:
					content = fp.read()
					f.write(content)
					print(f'已合并....{chapter_title}')

			os.remove(file_path)
			print(f'已删除....{chapter_title}')


# 主程序
def main():
	fiction_types, fiction_urls, fiction_titles, fiction_authors = get_fiction_list()
	for fiction_type, fiction_url, fiction_title, fiction_author in\
			zip(fiction_types, fiction_urls, fiction_titles, fiction_authors):
		chapter_titles = get_chapter(fiction_url)
		book_name = f'【{fiction_type}】_{fiction_title}_{fiction_author}'

		tasks = []
		for i in range(3):
			th = Thread(target=download, name=f'线程{i}')
			th.start()
			tasks.append(th)

		for task in tasks:
			task.join()

		merge(chapter_titles, book_name)
		print(f'已爬取 {book_name} 全部章节....休息三秒继续\n\n\n')
		time.sleep(3)


# 主控制程序
if __name__ == '__main__':
	main()

注意：篇幅有限，这里仅提供部分源码！需要完整源码可以通过开头的名片或文末的名片联系我！

5.运行效果

这里我为了进行展示，设置成每篇小说只爬取了前10章，可在源码中修改爬取全部章节！

这里为了演示，在爬取了三篇小说后我主动关闭了爬虫的运行！

你可能感兴趣的:(python爬虫,python,开发语言)

OpenCV-Python图像位与运算bitwise_and函数详解静谧星光c opencv python 人工智能 Python
OpenCV-Python图像位与运算bitwise_and函数详解图像处理中，位与运算是一种常用的操作，它可以对图像进行像素级别的逻辑与操作。在OpenCV-Python库中，提供了一个名为bitwise_and的函数，用于执行图像的位与运算。本文将详细介绍bitwise_and函数的用法，并提供相应的源代码示例。bitwise_and函数的语法如下：cv2.bitwise_and(src1,s
列表（列表是什么）钢铁男儿 Python 从入门到精通服务器前端数据库
你将学习列表是什么以及如何使用列表元素。列表让你能够在一个地方存储成组的信息，其中可以只包含几个元素，也可以包含数百万个元素。列表是新手可直接使用的最强大的Python功能之一，它融合了众多重要的编程概念。列表是什么列表由一系列按特定顺序排列的元素组成。你可以创建包含字母表中所有字母、数字0~9或所有家庭成员姓名的列表；也可以将任何东西加入列表中，其中的元素之间可以没有任何关系。鉴于列表通常包含多
2025年美赛数学建模2025 MCM Problem A: Testing Time: The Constant Wear On Stairs A题测试时间：楼梯上的持续磨损代码解析 2025年数学建模美赛 2025年美赛MCM/ICM 数学建模 2025年数学建模美赛 2025数学建模美赛 A题 2025 楼梯上的持续磨损 matlab代码
目录Python1.数据预处理与特征工程数据标准化与特征构建2.行进方向偏好分析深度神经网络（DNN）用于方向性分析3.多人同时使用分析卷积神经网络（CNN）用于磨损模式识别4.时间序列分析LSTM模型用于时间序列预测matlab代码Python我们将采用更多的机器学习和深度学习技术，例如图像处理、深度神经网络（DNN）、卷积神经网络（CNN）等，并结合不同的算法进行更深入的分析。1.数据预处理与
2025年美赛数学建模 MCM 问题A：测试时间：楼梯上的持续磨损详细解析和代码（持续更新中，matlab和python代码，2025美赛） 2025年数学建模美赛 2025年美赛MCM/ICM 数学建模 matlab 2025年数学建模美赛 2025美赛 python 2025 测试时间：楼梯上的持续磨损
目录1.楼梯的使用频率分析问题描述：建模思路：方法：实现步骤：2.方向偏好分析问题描述：建模思路：方法：实现步骤：3.同时使用人数分析问题描述：建模思路：方法：实现步骤：4.楼梯的年龄推算问题描述：建模思路：方法：实现步骤：python代码matlab代码1.楼梯的使用频率分析问题描述：我们需要分析楼梯的使用频率，特别是通过楼梯的磨损来推断使用频率。磨损程度通常与使用频率成正比，磨损严重的地方表示
7个改变python金融分析神奇库 python茶水实验室 python 金融开发语言数据结构 beautifulsoup scikit-learn scrapy
理解几个常用的Python金融分析库对于金融数据处理和分析非常重要。以下是几个常用的Python金融分析库的介绍和理解方法：1.Pandas用途：用于数据操作和分析。功能：提供数据结构和数据分析工具，尤其适用于时间序列数据。如何学习：基础知识：熟悉DataFrame和Series，学习如何导入和导出数据。数据操作：掌握数据清洗、数据变换、数据聚合等操作。时间序列分析：了解如何处理和分析时间序列数据
#Python 用Sqlite3做模拟银行系统（4） Flash The Dash 前端数据库 javascript python sqlite 开发语言
今天的时间略短，就不做讲解了，直接上干货：defdeposit_submit(account_entry,amount_entry,note_entry):account_name=account_entry.get()amount=float(amount_entry.get())note=note_entry.get()deposit(account_name,amount,note)mess
用PYTHON Tkinter 做四子棋游戏(1) Flash The Dash Python Tkinter 四子棋游戏游戏 python
之前，总在想，既然有五子棋，有三子棋，为何不做一四子棋游戏呢？今天，就来尝试用PYTHON来开发一个四子棋游戏。首先，想好如何设置棋盘：10*10，读者也能自行调整。随后就设置好了网页的初始长宽，背景颜色等等。代码如下：importtkinterastkfromtkinterimportmessageboximporttimeimportrandomclassTicTacToe:def__init
Python Tkinter 四子棋游戏（5） Flash The Dash Python Tkinter 四子棋游戏 python 游戏开发语言
这就是我们如何设置的机器版本，大家有提升的方法请在评论区里评论。defcomputer_move(self):#ImprovedComputerAI:TriestoplaceOneartheplayer'slastmoveavailable_squares=[(row,col)forrowinrange(10)forcolinrange(10)ifself.board[row][col]==""]
BT-Basic编程系列--4--字符串操作可可南木 BT-Basic 开发语言
BT-Basic编程系列–4–字符串操作文章目录BT-Basic编程系列--4--字符串操作4.1确定字符串的长度4.2截取字符串4.3修改字符串内容总结4.1确定字符串的长度怎么确定字符串的长度，这里要用到len这个函数，用法和Python中一样。A$="ABCEDFG"printlen(A$)运行结果：74.2截取字符串通俗地讲就是我们可以截取字符串中想要的那一部分内空，这个在判断时比较常用。
esp8266 初始化重置恢复出厂设置 thegirl0001 1024程序员节
如果你机器上装了python请继续。如果没装请划走。1.pip安装：pipinstallesptool2.找到安装位置：pipshowesptool我的是这个目录：c:\users\pc\appdata\local\programs\python\python37\lib\site-packages3.找到这个目录：c:\users\pc\appdata\local\programs\python
目标检测入门教程：使用Python实现目标检测算法晨曦之光，优美芝麻目标检测 python 算法机器学习-深度学习
目标检测是计算机视觉领域中的重要任务，它旨在识别和定位图像或视频中的特定对象。本教程将介绍如何使用Python编程语言实现目标检测算法。我们将使用一种广泛应用的目标检测算法——基于深度学习的单阶段检测器YOLO（YouOnlyLookOnce）的最新版本YOLOv4作为示例。在开始之前，请确保您已经安装了Python和以下必要的库：NumPy、OpenCV和PyTorch。您可以使用pip命令来安
青少年编程与数学 02-008 Pyhon语言编程基础 04课题、开始编程明月看潮生编程与数学第02阶段青少年编程 python 编程与数学开发语言 pycharm
青少年编程与数学02-008Pyhon语言编程基础04课题、开始编程一、Hello,World!步骤1:打开你的Python环境步骤2:编写代码步骤3:运行程序步骤4:看到结果解释代码二、使用PyCharm步骤1:安装PyCharm步骤2:创建新项目步骤3:创建Python文件步骤4:编写代码步骤5:运行程序步骤6:保存程序三、代码调试步骤1:打开或创建一个Python文件步骤2:设置断点步骤3:
python和C++联合编程 pumpkin84514 python相关 python c++开发语言
将Python和C++结合起来编程可以充分利用Python的易用性和C++的高性能。为什么要结合Python和C++编程？Python具有简洁的语法和强大的库支持，非常适合快速开发和数据处理。然而，Python在某些计算密集型任务上的性能不如C++。通过将这两种语言结合，可以既享受Python的便利，又获得C++的高性能。主要方法和工具使用ctypes：允许Python调用C函数库。使用cffi：
【2024年华为OD机试】(B卷,100分)- 热点网站统计（Java & JS & Python&C/C++）妄北y 华为od java javascript 矩阵 c语言 python
一、问题描述题目描述企业路由器的统计页面需要动态统计公司访问最多的网页URL的TopN。设计一个算法，能够高效动态统计TopN的页面。输入描述每一行都是一个URL或一个数字：如果是URL，代表一段时间内的网页访问。如果是数字N，代表本次需要输出的TopN个URL。输入约束：总访问网页数量小于5000个，单网页访问次数小于65535次。网页URL仅由字母、数字和点分隔符组成，且长度小于等于127字节
Python和C++混合编程源代码分析硬件测试 C++11基础和特性 python c++开发语言
Python与Cython和C++混合编程指南在现代软件开发中，结合使用多种编程语言可以充分利用各自的优势。Python以其简洁易用和广泛的生态系统而著名，而Cython和C++则在性能优化和系统级编程方面表现出色。本文将详细介绍如何实现Python与Cython、Python与C++的混合编程，解释像NumPy这样的库是如何利用C/C++实现高性能的，并提供最佳实践与示例。目录概述Python与
全国青少年编程等级考试python一级真题2020年12月（含题库答题软件账号）程序猿下山
青少年软件编程（Python）等级考试试卷（一级）分数：100题数：37一、单选题(共25题，每题2分，共50分)二、判断题(共10题，每题2分，共20分)三、编程题(共2题，共30分)三、如何开通使用登录网址（PC端）：http://www.123lex.top/pstuLogin.aspx?sID=M03K登录网址（手机端）：www.123lex.top/examt/exam_Login.as
python openpyxl包excel 绘制线性图表呜呜呜小吴莫哭 python 仿真 excel 可视化 python
https://openpyxl.readthedocs.io/en/stable/charts/line.html说明：来自英文手册未翻译LineChartsLinechartsallowdatatobeplottedagainstafixedaxis.Theyaresimilartoscattercharts,themaindifferenceisthatwithlinechartseachd
python编程一级_青少年编程等级考试Python编程一级试卷 weixin_39635373 python编程一级
《青少年编程等级考试Python编程一级试卷》由会员分享，可在线阅读，更多相关《青少年编程等级考试Python编程一级试卷（9页珍藏版）》请在人人文库网上搜索。1、一、单项选择题（共20题，每题2.5分，共50分）1.运行下方代码段，输出的是（）。printa*3Aa3B3aCaaaDaaa2.下列表示为变量c赋值10的语句是（）。Ac10BIntc10Cvarc10DVariablec103.下
python创建excel图表_Python:使用图表创建Excel工作表 weixin_39546312 python创建excel图表
它有点复杂(和/或邪恶)，但类似的东西可以跨平台(包括在Linux下)使用JPype来包装SmartXLSExcelJava库。此示例使用SmartXLS中的简单图表创建(在Charts/ChartSample.class中)示例。#!/usr/bin/envpythonimportosimportos.pathimportjpype#orwhereveryourjavaisinstalledos
VSCode提示pylint isnot installed weixin_30838921 开发工具 python
1.下载所需扩展在https://www.lfd.uci.edu/~gohlke/pythonlibs/中下载所需扩展，我下载的是：pylint-2.1.1-py2.py3-none-any.whl。2.在CMD中执行命令在CMD中执行如下命令：pip3installpylint-2.1.1-py2.py3-none-any.whlC:\Users\Downloads>pip3installpyl
PennyLane 开源项目教程龚翔林Shannon
PennyLane开源项目教程pennylanePennyLaneisacross-platformPythonlibraryfordifferentiableprogrammingofquantumcomputers.Trainaquantumcomputerthesamewayasaneuralnetwork.项目地址:https://gitcode.com/gh_mirrors/pe/pen
五类推理（逻辑推理、概率推理、图推理、基于深度学习的推理）的开源库（一）由数入道深度学习开源人工智能
在开发中，有一些开源库可以实现不同类型的推理，包括逻辑推理、概率推理、图推理、基于深度学习的推理等。以下是五类推理（逻辑推理、概率推理、图推理、基于深度学习的推理）的现成开源库，它们各自的功能、特点和适用场景的详细介绍，并进行对比分析。1.逻辑推理推理：PyDatalog库介绍：PyDatalog是一个Python的逻辑编程库，它将逻辑编程的功能引入到Python中，提供了在Python中进行规则
python openpyxl三行代码将列表数据依次加入excel单元格并生成图表轩哥啊哈OvO Python #openpyxl python pygame numpy scrapy pip
OpenPyXLOpenPyXl几乎可以实现所有的Excel功能，而且接口清晰，文档丰富，学习成本相对较低。安装用pip安装pipinstallopenpyxl使用使用python的openpyxl模块，可以非常方便的将列表或元组数据依次加入excel单元格，可竖排也可横排，以下代码为最简单的横排：fromopenpyxlimportWorkbookl=123,154,165,144,265,36
vscode python pylint 问题汇总解决嘉禾天成
目录一、问题类型：二、解决问题2.1、Unabletoimport'xxx'pylint2.2、Noname'xxx'inmoudle'xxx'2.3、Accesstomemberxxxbeforedefinitionpylint!!!!本文章长期更新!!!!一、问题类型：1、Unabletoimport'xxx'pylint2、Noname'xxx'inmoudle'xxx'3、Accessto
主流编程语言的优劣分析及学习建议我的青春不太冷学习 java 开发语言 android 经验分享笔记
不同语言的特性主流编程语言的优劣分析及学习建议1.Python优点缺点学习建议适用于哪些人？2.JavaScript优点缺点学习建议适用于哪些人？3.Java优点缺点学习建议适用于哪些人？4.C++优点缺点学习建议适用于哪些人？5.Swift优点缺点学习建议适用于哪些人？结论主流编程语言的优劣分析及学习建议对于年轻人或者即将开始编程学习的人来说，选择一门合适的编程语言至关重要。不同的编程语言有各自
「Python系列」Python random模块、hashlib模块 ·零落· Python入门到掌握 python 开发语言 random
文章目录一、Pythonrandom模块1.`random.random()`2.`random.uniform(a,b)`3.`random.randint(a,b)`4.`random.randrange(start,stop,step)`5.`random.choice(seq)`6.`random.shuffle(seq)`7.`random.sample(seq,k)`8.`random
python round函数_python中round函数如何使用 weixin_39823017 python round函数
round函数很简单，对浮点数进行近似取值，保留几位小数。比如>>>round(10.0/3,2)3.33>>>round(20/7)3第一个参数是一个浮点数，第二个参数是保留的小数位数，可选，如果不写的话默认保留到整数。这么简单的函数，能有什么坑呢？1、round的结果跟python版本有关我们来看看python2和python3中有什么不同：$pythonPython2.7.8(default
python中round的用法_python中如何使用round函数 weixin_39754831 python中round的用法
在python3中，round（1.0/2.0）得到的是1，而在python2中，round（1.0/2.0）得到的是0$pythonPython2.7.8(default,Jun182015,18:54:19)[GCC4.9.1]onlinux2Type"help","copyright","credits"or"license"formoreinformation.>>>round(0.5)1
python实现先来先服务_Python基础并发编程——进程 weixin_39568653 python实现先来先服务
一、进程的基础知识1、理论基础知识顾名思义，进程即正在执行的一个过程。进程是对正在运行程序的一个抽象。进程的概念起源于操作系统，是操作系统最核心的概念，也是操作系统提供的最古老也是最重要的抽象概念之一。操作系统的其他所有内容都是围绕进程的概念展开的。PS：即使可以利用的cpu只有一个（早期的计算机确实如此），也能保证支持（伪）并发的能力。将一个单独的cpu变成多个虚拟的cpu（多道技术：时间多路复
python round函数用法 ncst Python python
round()方法返回x的小数点四舍五入到n个数字。语法以下是round()方法的语法：round(x[,n])参数x–这是一个数值表达式n–这也是一个数值表达式返回值该方法返回x的小数点四舍五入到n个数字例子下面的例子显示了round()方法的使用print“round(80.23456,2):“,round(80.23456,2)print“round(100.000056,3):“,roun
ASM系列六利用TreeApi 添加和移除类成员 lijingyao8206 jvm 动态代理 ASM 字节码技术 TreeAPI
同生成的做法一样，添加和移除类成员只要去修改fields和methods中的元素即可。这里我们拿一个简单的类做例子，下面这个Task类，我们来移除isNeedRemove方法，并且添加一个int 类型的addedField属性。 package asm.core; /** * Created by yunshen.ljy on 2015/6/
Springmvc-权限设计 bee1314 spring Web jsp
万丈高楼平地起。权限管理对于管理系统而言已经是标配中的标配了吧，对于我等俗人更是不能免俗。同时就目前的项目状况而言，我们还不需要那么高大上的开源的解决方案，如Spring Security，Shiro。小伙伴一致决定我们还是从基本的功能迭代起来吧。目标： 1.实现权限的管理（CRUD） 2.实现部门管理（CRUD) 3.实现人员的管理（CRUD） 4.实现部门和权限
算法竞赛入门经典（第二版）第2章习题 CrazyMizzz c 算法
2.4.1 输出技巧 #include <stdio.h> int main() { int i, n; scanf("%d", &n); for (i = 1; i <= n; i++) printf("%d\n", i); return 0; } 习题2-2 水仙花数(daffodil
struts2中jsp自动跳转到Action 麦田的设计者 jsp webxml struts2 自动跳转
1、在struts2的开发中，经常需要用户点击网页后就直接跳转到一个Action，执行Action里面的方法，利用mvc分层思想执行相应操作在界面上得到动态数据。毕竟用户不可能在地址栏里输入一个Action（不是专业人士） 2、＜jsp:forward page="xxx.action" /＞，这个标签可以实现跳转，page的路径是相对地址,不同与jsp和j
php 操作webservice实例 IT独行者 PHP webservice
首先大家要简单了解了何谓webservice，接下来就做两个非常简单的例子，webservice还是逃不开server端与client端。我测试的环境为：apache2.2.11 php5.2.10做这个测试之前，要确认你的php配置文件中已经将soap扩展打开，即extension=php_soap.dll; OK 现在我们来体验webservice //server端 serve
Windows下使用Vagrant安装linux系统 _wy_ windows vagrant
准备工作：下载安装 VirtualBox ：https://www.virtualbox.org/ 下载安装 Vagrant ：http://www.vagrantup.com/ 下载需要使用的 box ：官方提供的范例：http://files.vagrantup.com/precise32.box 还可以在 http://www.vagrantbox.es/
更改linux的文件拥有者及用户组(chown和chgrp) 无量 c linux chgrp chown
本文（转） http://blog.163.com/yanenshun@126/blog/static/128388169201203011157308/ http://ydlmlh.iteye.com/blog/1435157 一、基本使用：使用chown命令可以修改文件或目录所属的用户：命令
linux下抓包工具矮蛋蛋 linux
原文地址： http://blog.chinaunix.net/uid-23670869-id-2610683.html tcpdump -nn -vv -X udp port 8888 上面命令是抓取udp包、端口为8888 netstat -tln 命令是用来查看linux的端口使用情况 13 . 列出所有的网络连接 lsof -i 14. 列出所有tcp 网络连接信息 l
我觉得mybatis是垃圾！：“每一个用mybatis的男纸，你伤不起” alafqq mybatis
最近看了每一个用mybatis的男纸，你伤不起原文地址：http://www.iteye.com/topic/1073938 发表一下个人看法。欢迎大神拍砖；个人一直使用的是Ibatis框架，公司对其进行过小小的改良；最近换了公司，要使用新的框架。听说mybatis不错；就对其进行了部分的研究；发现多了一个mapper层；个人感觉就是个dao；
解决java数据交换之谜百合不是茶数据交换
交换两个数字的方法有以下三种，其中第一种最常用 /* 输出最小的一个数 */ public class jiaohuan1 { public static void main(String[] args) { int a =4; int b = 3; if(a<b){ // 第一种交换方式 int tmep =
渐变显示 bijian1013 JavaScript
<style type="text/css"> #wxf { FILTER: progid:DXImageTransform.Microsoft.Gradient(GradientType=0, StartColorStr=#ffffff, EndColorStr=#97FF98); height: 25px; } </style>
探索JUnit4扩展：断言语法assertThat bijian1013 java 单元测试 assertThat
一.概述 JUnit 设计的目的就是有效地抓住编程人员写代码的意图，然后快速检查他们的代码是否与他们的意图相匹配。 JUnit 发展至今，版本不停的翻新，但是所有版本都一致致力于解决一个问题，那就是如何发现编程人员的代码意图，并且如何使得编程人员更加容易地表达他们的代码意图。JUnit 4.4 也是为了如何能够
【Gson三】Gson解析{"data":{"IM":["MSN","QQ","Gtalk"]}} bit1129 gson
如何把如下简单的JSON字符串反序列化为Java的POJO对象? {"data":{"IM":["MSN","QQ","Gtalk"]}} 下面的POJO类Model无法完成正确的解析： import com.google.gson.Gson;
【Kafka九】Kafka High Level API vs. Low Level API bit1129 kafka
1. Kafka提供了两种Consumer API High Level Consumer API Low Level Consumer API(Kafka诡异的称之为Simple Consumer API，实际上非常复杂) 在选用哪种Consumer API时，首先要弄清楚这两种API的工作原理，能做什么不能做什么，能做的话怎么做的以及用的时候，有哪些可能的问题
在nginx中集成lua脚本：添加自定义Http头，封IP等 ronin47 nginx lua
Lua是一个可以嵌入到Nginx配置文件中的动态脚本语言，从而可以在Nginx请求处理的任何阶段执行各种Lua代码。刚开始我们只是用Lua 把请求路由到后端服务器，但是它对我们架构的作用超出了我们的预期。下面就讲讲我们所做的工作。强制搜索引擎只索引mixlr.com Google把子域名当作完全独立的网站，我们不希望爬虫抓取子域名的页面，降低我们的Page rank。 location /{
java-归并排序 bylijinnan java
import java.util.Arrays; public class MergeSort { public static void main(String[] args) { int[] a={20,1,3,8,5,9,4,25}; mergeSort(a,0,a.length-1); System.out.println(Arrays.to
Netty源码学习-CompositeChannelBuffer bylijinnan java netty
CompositeChannelBuffer体现了Netty的“Transparent Zero Copy” 查看API（ http://docs.jboss.org/netty/3.2/api/org/jboss/netty/buffer/package-summary.html#package_description）可以看到，所谓“Transparent Zero Copy”是通
Android中给Activity添加返回键 hotsunshine Activity
// this need android:minSdkVersion="11" getActionBar().setDisplayHomeAsUpEnabled(true); @Override public boolean onOptionsItemSelected(MenuItem item) {
静态页面传参 ctrain 静态
$(document).ready(function () { var request = { QueryString : function (val) { var uri = window.location.search; var re = new RegExp("" + val + "=([^&?]*)", &
Windows中查找某个目录下的所有文件中包含某个字符串的命令 daizj windows 查找某个目录下的所有文件包含某个字符串
findstr可以完成这个工作。 [html] view plain copy >findstr /s /i "string" *.* 上面的命令表示，当前目录以及当前目录的所有子目录下的所有文件中查找"string&qu
改善程序代码质量的一些技巧 dcj3sjt126com 编程 PHP 重构
有很多理由都能说明为什么我们应该写出清晰、可读性好的程序。最重要的一点，程序你只写一次，但以后会无数次的阅读。当你第二天回头来看你的代码时，你就要开始阅读它了。当你把代码拿给其他人看时，他必须阅读你的代码。因此，在编写时多花一点时间，你会在阅读它时节省大量的时间。让我们看一些基本的编程技巧：尽量保持方法简短尽管很多人都遵
SharedPreferences对数据的存储 dcj3sjt126com
SharedPreferences简介： &nbs
linux复习笔记之bash shell (2) bash基础 eksliang bash bash shell
转载请出自出处： http://eksliang.iteye.com/blog/2104329 1.影响显示结果的语系变量（locale） 1.1locale这个命令就是查看当前系统支持多少种语系，命令使用如下： [root@localhost shell]# locale LANG=en_US.UTF-8 LC_CTYPE="en_US.UTF-8"
Android零碎知识总结 gqdy365 android
1、CopyOnWriteArrayList add(E) 和remove(int index)都是对新的数组进行修改和新增。所以在多线程操作时不会出现java.util.ConcurrentModificationException错误。所以最后得出结论：CopyOnWriteArrayList适合使用在读操作远远大于写操作的场景里，比如缓存。发生修改时候做copy，新老版本分离，保证读的高
HoverTree.Model.ArticleSelect类的作用 hvt Web .net C#hovertree asp.net
ArticleSelect类在命名空间HoverTree.Model中可以认为是文章查询条件类，用于存放查询文章时的条件，例如HvtId就是文章的id。HvtIsShow就是文章的显示属性，当为-1是，该条件不产生作用，当为0时，查询不公开显示的文章，当为1时查询公开显示的文章。HvtIsHome则为是否在首页显示。HoverTree系统源码完全开放，开发环境为Visual Studio 2013
PHP 判断是否使用代理 PHP Proxy Detector 天梯梦 proxy
1. php 类 I found this class looking for something else actually but I remembered I needed some while ago something similar and I never found one. I'm sure it will help a lot of developers who try to
apache的math库中的回归——regression（翻译） lvdccyb Math apache
这个Math库，虽然不向weka那样专业的ML库，但是用户友好，易用。多元线性回归，协方差和相关性（皮尔逊和斯皮尔曼），分布测试（假设检验，t，卡方，G），统计。数学库中还包含，Cholesky，LU，SVD，QR，特征根分解，真不错。基本覆盖了：线代，统计，矩阵，最优化理论曲线拟合常微分方程遗传算法（GA），还有3维的运算。。。
基础数据结构和算法十三：Undirected Graphs (2) sunwinner Algorithm
Design pattern for graph processing. Since we consider a large number of graph-processing algorithms, our initial design goal is to decouple our implementations from the graph representation
云计算平台最重要的五项技术 sumapp 云计算云平台智城云
云计算平台最重要的五项技术 1、云服务器云服务器提供简单高效，处理能力可弹性伸缩的计算服务，支持国内领先的云计算技术和大规模分布存储技术，使您的系统更稳定、数据更安全、传输更快速、部署更灵活。特性机型丰富通过高性能服务器虚拟化为云服务器，提供丰富配置类型虚拟机，极大简化数据存储、数据库搭建、web服务器搭建等工作；仅需要几分钟，根据CP
《京东技术解密》有奖试读获奖名单公布 ITeye管理员活动
ITeye携手博文视点举办的12月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 12月试读活动回顾： http://webmaster.iteye.com/blog/2164754 本次技术图书试读活动获奖名单及相应作品如下：一等奖（两名） Microhardest：http://microhardest.ite

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他