答案Xstar

利用Python爬取糗事百科段子信息

文章来源：公众号-智能化IT系统。

爬虫技术目前越来越流行，这里介绍一个爬虫的简单应用。

爬取的内容为糗事百科文字内容中的信息，如图所示：

爬取糗事百科文字35页的信息，通过手动浏览，以下为前四页的网址：

http://www.qiushibaike.com/text/
http://www.qiushibaike.com/text/page/2/?s=4964629
http://www.qiushibaike.com/text/page/3/?s=4964629
http://www.qiushibaike.com/text/page/4/?s=4964629

这里的?s=4964629应该只是从Cookies里提取的用户标识，去掉后依然能打开网页。然后把第一页的网址改为http://www.qiushibaike.com/text/page/1/也能正常浏览，故只需更改page后面的数字即可，以此来构造出35页的网址。

需要爬取的信息有：用户ID，用户等级，用户性别，发表段子文字信息，好笑数量和评论数量，如下图所示：

案例中运用Python对文件的操作，把爬取的信息存储在本地的txt文本中。

一. 前置工作：

1. 安装python

2. 安装PyCharm

python不用说了。Pycharm是python的开发工具。具体安装可以百度参考。

二. 技术点介绍

爬虫技术并不需要掌握python非常精通，本案例只是涉及到python如下的基本技术点：

1. 字符串的基本操作

2. python函数

3. python元组应用

4. python的for循环

5. python的条件判断

6. python文件操作

另外需要了解一下http的请求，涉及如下：

1. http请求和响应基本原理

2. get和post请求基本知识

3. http请求头中的User-Agent，便于伪造精确的请求信息

本案例是针对python的爬取网页数据，所以python针对爬虫的相关技术需要熟悉：

1. Requests库（模拟请求）

2. Re模块（正则表达式的应用，在请求结果中匹配数据）

最后就是网页元素的基本知识了，包括如下：

1. html元素

2. chrome浏览器的使用，以及获取网页指定元素的标签

本文不对上述技术点进行讲述，读者如果有问题可以百度搜索一下，应该很快就能熟悉。熟悉了上述技术点，就可以完全掌握下面的爬取代码了。

三. 爬取代码

如下代码可以直接复制执行：

import requests

import re

headers = {

'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64)AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.143 Safari/537.36'

}

info_lists = []

defjudgment_sex(class_name):

if class_name == 'womenIcon':

return '女'

else:

return '男'

def get_info(url):

res = requests.get(url)

ids = re.findall('

(.*?)

',res.text,re.S)

levels = re.findall('

(.*?)

',res.text,re.S)

sexs = re.findall('

',res.text,re.S)

contents = re.findall('.*?(.*?)',res.text,re.S)

laughs = re.findall('(\d+)',res.text,re.S)

comments = re.findall('(\d+) 评论',res.text,re.S)

for id,level,sex,content,laugh,comment inzip(ids,levels,sexs,contents,laughs,comments):

info = {

'id':id,

'level':level,

'sex':judgment_sex(sex),

'content':content,

'laugh':laugh,

'comment':comment

}

info_lists.append(info)

if __name__ =='__main__':

urls = ['http://www.qiushibaike.com/text/page/{}/'.format(str(i))for i in range(1,36)]

for url in urls:

get_info(url)

for info_list in info_lists:

f = open('C:/Users/Administrator//Desktop/qiushi.text','a+')

try:

f.write(info_list['id']+'\n')

f.write(info_list['level'] + '\n')

f.write(info_list['sex'] + '\n')

f.write(info_list['content'] + '\n')

f.write(info_list['laugh'] + '\n')

f.write(info_list['comment'] + '\n\n')

f.close()

except UnicodeEncodeError:

pass

print(info_list)

运行的结果保存在电脑，文件名为qiushi的文档中，如图所示

四. 代码分析

（1）1~2行

导入程序需要的库，Requests库用于请求网页获取网页数据。运用正则表达式不需要用BeautifulSoup解析网页数据，而是使用Python中的re模块匹配正则表达式。

（2）4~7行

通过Chrome浏览器的开发者工具，复制User-Agent，用于伪装为浏览器，便于爬虫的稳定性。

（3）17~34行

定义get_info()函数，用于获取网页信息并把数据传入到info_lists列表中。传入URL后，进行请求。

（4）第9行

定义了一个info_lists空列表，用于存放爬取的信息，每条数据为字典结构。

（5）11~15行

定义judgment_sex()函数，用于判断用户的性别。

（5）36~51行

为程序的主入口。通过对网页URL的观察，通过列表的推导式构造35个URL，并依次调用get_info()函数，循环遍历info_lists列表，存入到文件名qiushi的TXT文档中。

公众号-智能化IT系统。每周都有技术文章推送，包括原创技术干货，以及技术工作的心得分享。扫描下方关注。

你可能感兴趣的:(爬虫（python）)

Python编写Modbus详细指南与示例达达玲玲 python 开发语言
Python编写Modbus：详细指南与示例理解ModbusModbus是一种串行通信协议，广泛用于工业自动化领域。它定义了一系列消息结构，用于在多个设备之间交换数据。Python由于其易用性和丰富的库，成为了编写Modbus应用程序的热门选择。安装PyModbus库PyModbus是Python中一个功能强大的Modbus协议栈实现，支持RTU和TCP两种模式。Bashpipinstallpym
Pytest Fixtures 介绍与用法香奈儿5号奶茶 pytest
PytestFixtures是Pytest框架中用于管理测试前置条件和后置清理的一种强大工具。可以帮助我们在测试中设置初始状态，减少重复代码，并提高测试的可维护性登录后复制下载代码查看我的示例gitclonehttps://gitee.com/Ac1998/pytest-fixtures-demo.git1.2.下面我们来学习一下如何使用它前置条件已经安装了最新版本已安装Python基本了解如何使
python模块之psutil详解_基于python调用psutil模块过程解析谢艺馨
这篇文章主要介绍了基于python调用psutils模块过程解析,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下用Python来编写脚本简化日常的运维工作是Python的一个重要用途。在Linux下，有许多系统命令可以让我们时刻监控系统运行的状态，如ps，top，free等等。要获取这些系统信息，Python可以通过subprocess模块调用并获
Python subprocess模块学习总结 weixin_34414196 python shell 操作系统
2019独角兽企业重金招聘Python工程师标准>>>从Python2.4开始，Python引入subprocess模块来管理子进程，以取代一些旧模块的方法：如os.system、os.spawn*、os.popen*、popen2.*、commands.*不但可以调用外部的命令作为子进程，而且可以连接到子进程的input/output/error管道，获取相关的返回信息一、subprocess以
Python并发处理 weixin_33768481 python 操作系统数据库
1.创建并销毁线程#!/usr/bin/python#code to execute in an independent threadimport timedef countdown(n): while n > 0: print('T-minus',n) n -= 1 time.sleep(5)#create and launch a threadfrom
Python 使用期物处理并发 weixin_30267785 操作系统 python javascript ViewUI
抨击线程的往往是系统程序员，他们考虑的使用场景对一般的应用程序员来说，也许一生都不会遇到……应用程序员遇到的使用场景，99%的情况下只需知道如何派生一堆独立的线程，然后用队列收集结果。示例：网络下载的三种风格为了高效处理网络I/O，需要使用并发，因为网络有很高的延迟，所以为了不浪费CPU周期去等待，最好在收到网络响应之前做些其他的事。为了通过代码说明这一点，我写了三个示例程序，从网上下载20个国家
「File」文本格式之 PugiXML对XML格式解析何曾参静谧「Lib」第三方库详解 xml
✨博客主页何曾参静谧的博客（✅关注、点赞、⭐收藏、转发）全部专栏（专栏会有变化，以最新发布为准）「Win」Windows程序设计「IDE」集成开发环境「定制」定制开发集合「C/C++」C/C++程序设计「DSA」数据结构与算法「UG/NX」NX二次开发「QT」QT5程序设计「File」数据文件格式「UG/NX」BlockUI集合「Py」Python程序设计「Math」探秘数学世界「PK」Paras
「C/C++」C++经验篇之常见的错误处理策略何曾参静谧 c语言 c++开发语言
✨博客主页何曾参静谧的博客（✅关注、点赞、⭐收藏、转发）全部专栏（专栏会有变化，以最新发布为准）「Win」Windows程序设计「IDE」集成开发环境「定制」定制开发集合「C/C++」C/C++程序设计「DSA」数据结构与算法「UG/NX」NX二次开发「QT」QT5程序设计「File」数据文件格式「UG/NX」BlockUI集合「Py」Python程序设计「Math」探秘数学世界「PK」Paras
DeepSeek R1模型基于ollama部署 &Dirac 机器学习笔记 python 语言模型 nlp
DeepSeekR1模型基于ollama部署1、安装部署ollama(windows)2、在ollama中使用deepseekr13、问答示例4、python调用接口5、ollama常用命令1、安装部署ollama(windows)Ollama是一个专为本地机器设计的开源框架，旨在简化大型语言模型（LLM）的部署和运行过程。它提供了一套工具和命令，使用户能够轻松地下载、管理和运行各种语言模型，包括
python数据类型大哥喝阔落 python 开发语言
数据类型七种可变类型:列表[]字典{}集合{}不可变:数值布尔字符串元组()字符串在计算机中python属于序列结构假设字符串为"adc123"索引下标--从0开始索引下标最大值len(“adc123”)-1列表字符串元组支持索引切片:所谓的切片是指对操作的对象截取其中一部分的操作。字符串、列表、元组都支持切片操作。(只顾头不顾尾)序列名称[开始位置下标:结束位置下标:步长(步阶)]切片例子:nu
Isaac Lab 独鹿算法人工智能 python 开发语言机器人
一、安装isaacsimcondacreate-nisaaclabpython=3.10condaactivateisaaclabpipinstalltorch==2.2.2--index-urlhttps://download.pytorch.org/whl/cu121pipinstallisaacsim-rlisaacsim-replicatorisaacsim-extscache-physi
python之subprocess模块 halazi100 #07python
从python2.4版本开始,可以用subprocess这个模块来产生子进程,并连接到子进程的标准输入/输出/错误中去，还可以得到子进程的返回值。subprocess意在替代其他几个老的模块或者函数，比如：os.systemos.spawn*os.popen*popen2.*commands.*一、subprocess.Popensubprocess模块定义了一个类：subprocess.Pope
subprocess模块篇熊猫Devin python笔记人工智能 python 开发语言
文章目录使用方法调用Python程序设置工作目录使用方法subprocess模块是Python中用于生成新的进程，连接到它们的input/output/error管道，并获取它们的返回码的模块1。下面是subprocess模块的一些主要知识点和详细教程：run()方法创建子进程：使用subprocess.run()方法可以方便地创建一个子进程并等待其完成。例如，要运行一个外部命令并获取其输出，可以
Python 的 subprocess 介绍及如何使用 LavenLiu python subprocess
一、引言在Python中，subprocess模块为程序员提供了与操作系统命令进行交互的桥梁。无论是执行简单的shell命令，还是管理复杂的外部进程，subprocess都能很好地完成任务。通过subprocess，Python脚本可以启动新的应用程序，与其输入/输出/错误管道建立连接，并获取其返回值，这对于实现自动化任务和系统集成至关重要。subprocess模块的出现，极大地扩展了Python
Python 并发编程：多任务处理的实现把海弄干的鱼. python
Python并发编程：多任务处理的实现Python并发编程：多任务处理的实现1.引言2.并发编程的挑战3.Python中的并发编程工具3.1多线程(threading)3.2多进程(multiprocessing)3.3异步I/O(asyncio)4.选择合适的工具5.并发编程最佳实践6.总结Python并发编程：多任务处理的实现1.引言在当今的计算领域，多核处理器已成为主流。为了充分利用多核CP
Python标准库 subprocess 模块多进程编程详解好像要长脑子了1 程序员 python 开发语言
1.1基本功能subprocess模块，允许生成新的进程执行命令行指令，python程序，以及其它语言编写的应用程序,如java,c++,rust应用等。subprocess可连接多个进程的输入、输出、错误管道，并且获取它们的返回码。asyncio也支持subprocess.许多知名库都在使用此模块创建进程，以及做为跨语言粘合工具。典型如ansible,celery，selenium等。1.2与m
「Py」模块篇之 Python中的subprocess模块详解何曾参静谧「Py」Python程序设计 python 数据库开发语言
✨博客主页何曾参静谧的博客（✅关注、点赞、⭐收藏、转发）全部专栏（专栏会有变化，以最新发布为准）「Win」Windows程序设计「IDE」集成开发环境「定制」定制开发集合「C/C++」C/C++程序设计「DSA」数据结构与算法「UG/NX」NX二次开发「QT」QT5程序设计「File」数据文件格式「UG/NX」BlockUI集合「Py」Python程序设计「Math」探秘数学世界「PK」Paras
【Python】已解决：error: subprocess-exited-with-error 屿小夏 python 开发语言 linux
个人简介：某不知名博主，致力于全栈领域的优质博客分享|用最优质的内容带来最舒适的阅读体验！文末获取免费IT学习资料！文末获取更多信息精彩专栏推荐订阅收藏专栏系列直达链接相关介绍书籍分享点我跳转书籍作为获取知识的重要途径，对于IT从业者来说更是不可或缺的资源。不定期更新IT图书，并在评论区抽取随机粉丝，书籍免费包邮到家AI前沿点我跳转探讨人工智能技术领域的最新发展和创新，涵盖机器学习、深度学习、自然
Stable Diffusion：Python图像生成实战指南 AI绘画咪酱 stable diffusion python 人工智能 AI作画 AIGC ai
前言今天要跟大家分享一个特别有趣的话题-如何使用Python和StableDiffusion来生成AI艺术作品。作为一名Python爱好者，我特别喜欢探索AI领域的新技术，而StableDiffusion则是最近特别火热的AI图像生成工具之一。1.StableDiffusion简介与环境配置StableDiffusion是一个强大的AI图像生成模型，它能够根据文字描述生成高质量的图像。在开始实战之
Python无法使用pip wshngyf python pip
在WIN8下使用Python2.764bit。在pyhton/scripts文件下，pip.exepip2.exe是存在的，在CMD命令行下，pip--version无法参看版本号，这是因为没有配置环境变量的原因。将pip.exe所在的目录配置到环境变量就OK了。
Python常用的内置函数（会持续增加的）一个小白hyc python
Python常用内置函数如下：不是原创，但是都是自己整理的1.abs()函数返回数字的绝对值。print(abs(-45))#返回45print("abs(0.2):",abs(0.2))#返回abs(0.2):0.22.all()函数用于判断给定的参数中的所有元素是否都为TRUE，如果是返回True，否则返回False。元素除了是0、空、None、False外都算True；空元组、空列表返回值为
python删除类方法_026.Python面向对象类的相关操作以及对象和类的删除操作 weixin_39708502 python删除类方法
类的相关操作定义的类访问共有成员的成员和方法定义的类动态添加公有成员的属性和方法定义的类删除公有成员的属性和方法1定义一个基本的类#定义一个类classPlane():#添加一个共有成员属性capitain="John"#添加一个私有成员属性__flight_attendant=20#共有绑定方法deffly(self):print("飞机飞行速度更快")#共有普通方法，这个只能是使用类来调用de
python怎么删除对象,Python对象删除自身 weixin_39777967 python怎么删除对象
Whywon'tthiswork?I'mtryingtomakeaninstanceofaclassdeleteitself.>>>classA():defkill(self):delself>>>a=A()>>>a.kill()>>>a解决方案'self'isonlyareferencetotheobject.'delself'isdeletingthe'self'referencefromth
前端js变量踩坑，部分手机浏览器不支持let、const weixin_34244102 前端 python 移动开发 ViewUI
2019独角兽企业重金招聘Python工程师标准>>>浏览器通过userAgent判断机型是Android还是iOS，很简单的几行代码，总有iOS用户手机判断不出来。刚开始总以为是判断的错误，优化了好几版，鉴于身边一直没有真机，终是治标不治本，今日偶遇真机，恍然大悟。。。var才是简单js的王道，引以为鉴转载于:https://my.oschina.net/AmosWang/blog/301786
python 常用的内置函数猰貐的新时代 python python java 开发语言
python内置函数1.abs(x)返回绝对值返回一个数的绝对值。实参可以是整数或浮点数。如果实参是一个复数，返回它的模。2.all(iterable)如果iterable的所有元素为真（或迭代器为空），返回Truedefall(iterable): forelementiniterable: ifnotelement: returnFalse returnTrue3.any(iter
chatgpt赋能python：Python如何删除一个对象 atest166 ChatGpt chatgpt jvm java 计算机
Python如何删除一个对象Python是一种高级、面向对象、动态类型解释型语言，它有广泛的应用，尤其在数据分析、机器学习、人工智能和Web开发等领域。但是，在Python编程过程中，我们也可能需要删除对象。那么，Python如何删除一个对象呢？Python对象和变量在Python中，一切都是对象。对象是内存中的一块数据，有自己的身份、类型和值。变量是指向对象的引用，通过变量可以访问对象的属性和方
Python del 删除对象编程爱好者9913
面向对象的程序设计的核心是对象（上帝式思维），要理解对象为何物，必须把自己当成上帝，上帝眼里世间存在的万物皆为对象，不存在的也可以创造出来。本文主要介绍Pythondel删除对象。原文地址：Pythondel删除对象
Python面向对象2-类对象增删改查、方法海星？海欣！ #Python-模块学习 python 开发语言
类对象万物皆对象，类也是一个对象增删改查增方式一：Money.count=1#1.定义一个类classMoney:pass#给类加属性Money.count=1print(Money.count)print(Money.__dict__)#输出对象Money的所有属性#输出：{'__module__':'__main__','__dict__':,'__weakref__':,'__doc__':
Python：使用PyInstaller打包 Faylynn Python python
本文所讲仅为独立的项目文件夹下如何进行打包，不涉及存在依赖关系的多个文件夹共同打包。项目结构示例D:/└──myproject└──my_project├──main.py├──module1.py└──other_files...项目文件夹：my_project主程序文件：main.py其他自定义模块：如module1.py、module2.py…其他资源文件（如图片、配置文件等）：放在imag
ESP-IDF环境安装出现问题（报错python.exe -m pip“ is not valid. (ERROR_INVALID_PIP)） Lethal Rhythm113 python pip 开发语言
安装参考【ESP-IDF篇】搭建ESP-IDF软件开发环境，包括手动命令行和VSCode两种方式-CSDN博客遇见问题原因分析：1.离线包自带的python3.11.2没有pip，导致安装失败2.电脑中有其他版本的python，需要在环境变量中将py3.11.2的路径上移到原先python环境前解决方案打开cmd，使用cdC:\Espressif\tools\idf-python\3.11.2命令
LeetCode[Math] - #66 Plus One Cwind java LeetCode 题解 Algorithm Math
原题链接：#66 Plus One 要求：给定一个用数字数组表示的非负整数，如num1 = {1, 2, 3, 9}, num2 = {9, 9}等，给这个数加上1。注意： 1. 数字的较高位存在数组的头上，即num1表示数字1239 2. 每一位（数组中的每个元素）的取值范围为0~9 难度：简单分析：题目比较简单，只须从数组
JQuery中$.ajax()方法参数详解 AILIKES JavaScript jsonp jquery Ajax json
url: 要求为String类型的参数，（默认为当前页地址）发送请求的地址。 type: 要求为String类型的参数，请求方式（post或get）默认为get。注意其他http请求方法，例如put和 delete也可以使用，但仅部分浏览器支持。 timeout: 要求为Number类型的参数，设置请求超时时间（毫秒）。此设置将覆盖$.ajaxSetup()方法的全局
JConsole & JVisualVM远程监视Webphere服务器JVM Kai_Ge JVisualVM JConsole Webphere
JConsole是JDK里自带的一个工具，可以监测Java程序运行时所有对象的申请、释放等动作，将内存管理的所有信息进行统计、分析、可视化。我们可以根据这些信息判断程序是否有内存泄漏问题。　　使用JConsole工具来分析WAS的JVM问题，需要进行相关的配置。　　首先我们看WAS服务器端的配置. 　　1、登录was控制台https://10.4.119.18
自定义annotation 120153216 annotation
Java annotation 自定义注释@interface的用法一、什么是注释说起注释，得先提一提什么是元数据(metadata)。所谓元数据就是数据的数据。也就是说，元数据是描述数据的。就象数据表中的字段一样，每个字段描述了这个字段下的数据的含义。而J2SE5.0中提供的注释就是java源代码的元数据，也就是说注释是描述java源
CentOS 5/6.X 使用 EPEL YUM源 2002wmj centos
CentOS 6.X 安装使用EPEL YUM源1. 查看操作系统版本[root@node1 ~]# uname -a Linux node1.test.com 2.6.32-358.el6.x86_64 #1 SMP Fri Feb 22 00:31:26 UTC 2013 x86_64 x86_64 x86_64 GNU/Linux [root@node1 ~]#
在SQLSERVER中查找缺失和无用的索引SQL 357029540 SQL Server
--缺失的索引 SELECT avg_total_user_cost * avg_user_impact * ( user_scans + user_seeks ) AS PossibleImprovement , last_user_seek ,
Spring3 MVC 笔记（二） —json+rest优化 7454103 Spring3 MVC
接上次的 spring mvc 注解的一些详细信息！其实也是一些个人的学习笔记呵呵！
替换“\”的时候报错Unexpected internal error near index 1 \ ^ adminjun java “\替换”
发现还是有些东西没有刻子脑子里,,过段时间就没什么概念了,所以贴出来...以免再忘... 在拆分字符串时遇到通过 \ 来拆分，可是用所以想通过转义 \\ 来拆分的时候会报异常 public class Main { /*
POJ 1035 Spell checker(哈希表) aijuans 暴力求解--哈希表
/* 题意：输入字典，然后输入单词，判断字典中是否出现过该单词，或者是否进行删除、添加、替换操作，如果是，则输出对应的字典中的单词要求按照输入时候的排名输出题解：建立两个哈希表。一个存储字典和输入字典中单词的排名，一个进行最后输出的判重 */ #include <iostream> //#define using namespace std; const int HASH =
通过原型实现javascript Array的去重、最大值和最小值 ayaoxinchao JavaScript array prototype
用原型函数（prototype）可以定义一些很方便的自定义函数，实现各种自定义功能。本次主要是实现了Array的去重、获取最大值和最小值。实现代码如下： <script type="text/javascript"> Array.prototype.unique = function() { var a = {}; var le
UIWebView实现https双向认证请求 bewithme UIWebView https Objective-C
什么是HTTPS双向认证我已在先前的博文 ASIHTTPRequest实现https双向认证请求中有讲述，不理解的读者可以先复习一下。本文是用UIWebView来实现对需要客户端证书验证的服务请求，网上有些文章中有涉及到此内容，但都只言片语，没有讲完全，更没有完整的代码，让人困扰不已。但是此知
NoSQL数据库之Redis数据库管理(Redis高级应用之事务处理、持久化操作、pub_sub、虚拟内存) bijian1013 redis 数据库 NoSQL
3.事务处理 Redis对事务的支持目前不比较简单。Redis只能保证一个client发起的事务中的命令可以连续的执行，而中间不会插入其他client的命令。当一个client在一个连接中发出multi命令时，这个连接会进入一个事务上下文，该连接后续的命令不会立即执行，而是先放到一个队列中，当执行exec命令时，redis会顺序的执行队列中
各数据库分页sql备忘 bingyingao oracle sql 分页
ORACLE 下面这个效率很低 SELECT * FROM ( SELECT A.*, ROWNUM RN FROM (SELECT * FROM IPAY_RCD_FS_RETURN order by id desc) A ) WHERE RN <20; 下面这个效率很高 SELECT A.*, ROWNUM RN FROM (SELECT * FROM IPAY_RCD_
【Scala七】Scala核心一：函数 bit1129 scala
1. 如果函数体只有一行代码，则可以不用写{},比如 def print(x: Int) = println(x) 一行上的多条语句用分号隔开，则只有第一句属于方法体，例如 def printWithValue(x: Int) : String= println(x); "ABC" 上面的代码报错，因为，printWithValue的方法
了解GHC的factorial编译过程 bookjovi haskell
GHC相对其他主流语言的编译器或解释器还是比较复杂的，一部分原因是haskell本身的设计就不易于实现compiler，如lazy特性，static typed，类型推导等。关于GHC的内部实现有篇文章说的挺好，这里，文中在RTS一节中详细说了haskell的concurrent实现，里面提到了green thread，如果熟悉Go语言的话就会发现，ghc的concurrent实现和Go有点类
Java-Collections Framework学习与总结-LinkedHashMap BrokenDreams LinkedHashMap
前面总结了java.util.HashMap，了解了其内部由散列表实现，每个桶内是一个单向链表。那有没有双向链表的实现呢？双向链表的实现会具备什么特性呢？来看一下HashMap的一个子类——java.util.LinkedHashMap。
读《研磨设计模式》-代码笔记-抽象工厂模式-Abstract Factory bylijinnan abstract
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * Abstract Factory Pattern * 抽象工厂模式的目的是： * 通过在抽象工厂里面定义一组产品接口，方便地切换“产品簇” * 这些接口是相关或者相依赖的
压暗面部高光 cherishLC PS
方法一、压暗高光&重新着色当皮肤很油又使用闪光灯时，很容易在面部形成高光区域。下面讲一下我今天处理高光区域的心得：皮肤可以分为纹理和色彩两个属性。其中纹理主要由亮度通道（Lab模式的L通道）决定，色彩则由a、b通道确定。处理思路为在保持高光区域纹理的情况下，对高光区域着色。具体步骤为：降低高光区域的整体的亮度，再进行着色。如果想简化步骤，可以只进行着色（参看下面的步骤1
Java VisualVM监控远程JVM crabdave visualvm
Java VisualVM监控远程JVM JDK1.6开始自带的VisualVM就是不错的监控工具. 这个工具就在JAVA_HOME\bin\目录下的jvisualvm.exe, 双击这个文件就能看到界面通过JMX连接远程机器, 需要经过下面的配置: 1. 修改远程机器JDK配置文件 (我这里远程机器是linux).
Saiku去掉登录模块 daizj saiku 登录 olap BI
1、修改applicationContext-saiku-webapp.xml <security:intercept-url pattern="/rest/**" access="IS_AUTHENTICATED_ANONYMOUSLY" /> <security:intercept-url pattern=&qu
浅析 Flex中的Focus dsjt html Flex Flash
关键字：focus、 setFocus、 IFocusManager、KeyboardEvent 焦点、设置焦点、获得焦点、键盘事件一、无焦点的困扰——组件监听不到键盘事件原因：只有获得焦点的组件（确切说是InteractiveObject）才能监听到键盘事件的目标阶段；键盘事件（flash.events.KeyboardEvent）参与冒泡阶段，所以焦点组件的父项（以及它爸
Yii全局函数使用 dcj3sjt126com yii
由于YII致力于完美的整合第三方库，它并没有定义任何全局函数。yii中的每一个应用都需要全类别和对象范围。例如，Yii::app()->user;Yii::app()->params['name'];等等。我们可以自行设定全局函数，使得代码看起来更加简洁易用。(原文地址) 我们可以保存在globals.php在protected目录下。然后，在入口脚本index.php的，我们包括在
设计模式之单例模式二（解决无序写入的问题） come_for_dream 单例模式 volatile 乱序执行双重检验锁
在上篇文章中我们使用了双重检验锁的方式避免懒汉式单例模式下由于多线程造成的实例被多次创建的问题，但是因为由于JVM为了使得处理器内部的运算单元能充分利用，处理器可能会对输入代码进行乱序执行（Out Of Order Execute）优化，处理器会在计算之后将乱序执行的结果进行重组，保证该
程序员从初级到高级的蜕变 gcq511120594 框架工作 PHP android html5
软件开发是一个奇怪的行业，市场远远供不应求。这是一个已经存在多年的问题，而且随着时间的流逝，愈演愈烈。我们严重缺乏能够满足需求的人才。这个行业相当年轻。大多数软件项目是失败的。几乎所有的项目都会超出预算。我们解决问题的最佳指导方针可以归结为——“用一些通用方法去解决问题，当然这些方法常常不管用，于是，唯一能做的就是不断地尝试，逐个看看是否奏效”。现在我们把淫浸代码时间超过3年的开发人员称为
Reverse Linked List hcx2013 list
Reverse a singly linked list. /** * Definition for singly-linked list. * public class ListNode { * int val; * ListNode next; * ListNode(int x) { val = x; } * } */ p
Spring4.1新特性——数据库集成测试 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
C# Ajax上传图片同时生成微缩图(附Demo) liyonghui160com
1.Ajax无刷新上传图片,详情请阅我的这篇文章。（jquery + c# ashx） 2.C#位图处理 System.Drawing。 3.最新demo支持IE7,IE8,Fir
Java list三种遍历方法性能比较 pda158 java
从c/c++语言转向java开发，学习java语言list遍历的三种方法，顺便测试各种遍历方法的性能，测试方法为在ArrayList中插入1千万条记录，然后遍历ArrayList，发现了一个奇怪的现象，测试代码例如以下： package com.hisense.tiger.list; import java.util.ArrayList; import java.util.Iterator;
300个涵盖IT各方面的免费资源（上）——商业与市场篇 shoothao seo 商业与市场 IT资源免费资源
A.网站模板+logo+服务器主机+发票生成 HTML5 UP:响应式的HTML5和CSS3网站模板。 Bootswatch:免费的Bootstrap主题。 Templated:收集了845个免费的CSS和HTML5网站模板。 Wordpress.org|Wordpress.com:可免费创建你的新网站。 Strikingly:关注领域中免费无限的移动优
localStorage、sessionStorage uule localStorage
W3School 例子 HTML5 提供了两种在客户端存储数据的新方法： localStorage - 没有时间限制的数据存储 sessionStorage - 针对一个 session 的数据存储之前，这些都是由 cookie 完成的。但是 cookie 不适合大量数据的存储，因为它们由每个对服务器的请求来传递，这使得 cookie 速度很慢而且效率也不

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他