十先生(公众号：Python知识学堂）

Python 爬虫基础教程——BeautifulSoup抓取入门（1）

大家好，上篇推文介绍了爬虫方面需要注意的地方、使用vscode开发环境的时候会遇到的问题以及使用正则表达式的方式爬取页面信息，本篇内容主要是介绍BeautifulSoup模块的使用教程。

一、BeautifulSoup介紹

引用官方的解释：

Beautiful Soup 是一个可以从HTML或XML文件中提取数据的Python库.它能够通过你喜欢的转换器实现惯用的文档导航,查找,修改文档的方式.

简单来说Beautiful Soup是python的一个库，是一个可以从网页抓取数据的利器。

官方文档：

https://beautifulsoup.readthedocs.io/zh_CN/v4.4.0/

二、BeautifulSoup安裝

pip install beautifulsoup4

或

pip install beautifulsoup4

-i http://pypi.douban.com/simple/

--trusted-host http://pypi.douban.com

顺便说一句：我使用的开发工具还是vscode，不清楚的看一下之前的推文。

三、BeautifulSoup解析器

3.1 html.parse

html.parse 是内置的不需要安装的

import requests
from bs4 import BeautifulSoup


url='https://www.baidu.com'
response=requests.get(url)
response.encoding = 'utf-8'
soup = BeautifulSoup(response.text, 'html.parser')
print(soup.prettify())

结果

3.2 lxml

lxml 是需要安装 pip install lxml

import requests
from bs4 import BeautifulSoup


url='https://www.baidu.com'
response=requests.get(url)
response.encoding = 'utf-8'
soup = BeautifulSoup(response.text, 'lxml')
print(soup)

结果

3.3 lxml-xml/xml

lxml-xml/Xm是需要安装的 pip install lxml

import requests
from bs4 import BeautifulSoup


url='https://www.baidu.com'
response=requests.get(url)
response.encoding = 'utf-8'
soup = BeautifulSoup(response.text, 'xml')
print(soup)

结果

3.4 html5lib

html5lib 是需要安装的 pip install html5lib

import requests
from bs4 import BeautifulSoup

url='https://www.baidu.com'
response=requests.get(url)
response.encoding = 'utf-8'
soup = BeautifulSoup(response.text, 'html5lib')
print(soup)

结果

大家看到这几个解析器解析出来的记过基本上都是一样，但是如果一段HTML或XML文档格式不正确的话,那么在不同的解析器中返回的结果可能是不一样的。什么叫HTML或XML文档格式不正确，简单的来说就是缺少不必要的标签或者标签没有闭合，比如页面缺少body标签、只有a标签开始的部分缺少a标签结束的部分（这里是一些前端的知识，不明白的可以搜索一下，很简单）。

我们来尝试一下

from bs4 import BeautifulSoup


html="Python知识学堂
"
soup = BeautifulSoup(html, 'html.parser')
print("html.parser 结果：")
print(soup)
soup1 = BeautifulSoup(html, 'lxml')
print("lxml 结果：")
print(soup1)
soup2 = BeautifulSoup(html, 'xml')
print("xml 结果：")
print(soup2)
soup3 = BeautifulSoup(html, 'html5lib')
print("html5lib 结果：")
print(soup3)

结果

可以看出html.parser与lxml 差不多的都会给标签补齐，但lxml会把html 标签给补齐，xml也会给标签补齐，而且还会加上xml文档的版本编码方式等信息,但是不会把html标签补齐，html5lib 也会补齐不但补齐了html标签而且给整个页面补齐head 标签。

这就验证了上面表格上的html5lib 的容错性最好，但是html5lib 解析器的速度不快，内容比较少的话是比较不出速度的差别的，所以推荐使用lxml作为解析器,因为效率更高. 在Python2.7.3之前的版本和Python3中3.2.2之前的版本,必须安装lxml或html5lib, 因为那些Python版本的标准库中内置的HTML解析方法不够稳定.

如果我们不指定解析器会怎么样？

from bs4 import BeautifulSoup


html="Python知识学堂
"
soup = BeautifulSoup(html)
print("html.parser 结果：")
print(soup)

结果

从结果提示可以得出，不指定解析器的话，他会给出系统最好的解析器，我的系统是lxml,如果你在别的环境没有安装lxml的话，可能会是别的解析器，总之系统会给你选择一个默认最好的解析器给你，所以你可以不指定，这还不是比较人性化的吧。

四、BeautifulSoup对象种类

Beautiful Soup将复杂HTML文档转换成一个复杂的树形结构,每个节点都是Python对象,所有对象可以归纳为4种: Tag , NavigableString , BeautifulSoup , Comment .

4.1 tag

tag中最重要的属性: name和attributes

from bs4 import BeautifulSoup

html="Python知识学堂
Python知识学堂"
soup = BeautifulSoup(html,'lxml')
tag=soup.a #a标签就相当于一个标签
tag.name
print(tag.name)
tag=soup.test #test 也是算是标签
tag.name
print(tag.name)

结果

上面的代码中的a标签就是表示一个tag，而且test也算是一个标签，test是我随便写的，所以Beautiful Soup中html标签和自定义的标签都是可以当作是tag，是不是很强大！

那么什么是attributes呢？看上面的代码 a 标签中的data-id与class这个就算是标签中的属性；

from bs4 import BeautifulSoup


html="Python知识学堂
"
soup = BeautifulSoup(html,'lxml')
tag=soup.a 
print(tag.attrs)

结果：

如果要获取某一个属性，可以使用tag['data-id']或tag.attrs['data-id'] 都是可以的。

这个用处最多的应该是获取a标签的链接地址以及img标签的媒体文件地址等。

如果属于里有多个值的话会返回一个list

from bs4 import BeautifulSoup

html="Python知识学堂
"
soup = BeautifulSoup(html,'lxml')
print(tag['data-id'])

结果：

4.2 NavigableString

包含在tag内的字符串可以用NavigableString类来直接获取，也叫可以遍历的字符串。

from bs4 import BeautifulSoup


html="Python知识学堂,欢迎你！
"
soup = BeautifulSoup(html,'lxml')
tag=soup.a 
print(tag.string)

结果：

这个比较简单，就不再多说了；

4.3 BeautifulSoup

BeautifulSoup 对象表示的是一个文档的全部内容.大部分时候,可以把它当作 Tag 对象,它支持遍历文档树和搜索文档树中描述的大部分的方法.

先大概了解一下，在后面遍历文档、搜索文档会有描述；

4.4 Comment

主要是文档中的注释部分。

Comment 对象是一个特殊类型的 NavigableString 对象：

from bs4 import BeautifulSoup


html= ""
soup = BeautifulSoup(html,'lxml')
comment = soup.b.string
print(comment)

结果

不过下面这种情况是获取不到的

from bs4 import BeautifulSoup


html= "我是谁？"
soup = BeautifulSoup(html,'lxml')
comment = soup.b.string
print(comment)

结果

可以看到返回的结果是None,所以只有在特殊的情况下才能获取到注释的内容；

五、总结

本篇文章讲述了关于BeautifulSoup的一些基础的内容。主要是bs的几种解析器，根据实际的情况选择不同的解析器。

你可能感兴趣的:(python爬虫,python,爬虫)

Python异步: 什么时候使用异步？后端python
从广义上讲，Asyncio是新的、流行的、讨论广泛的和令人兴奋的。然而，对于何时应该在项目中采用它存在很多困惑。我们什么时候应该在Python中使用asyncio？在Python中使用Asyncio的原因在Python项目中使用asyncio可能有3个原因：使用asyncio以便在您的程序中采用协程。使用asyncio以使用异步编程范例。使用asyncio以使用非阻塞I/O。1.1.使用协程我们可
Python 常用运维模块之OS模块篇阿俊仔（摸鱼版） python学习系列 python 运维开发语言云服务器
Python常用运维模块之OS模块篇OS模块获取当前工作目录更改当前工作目录返回当前目录路径返回上一级目录路径递归生成目录路径删除目录创建目录删除目录列出特定目录下文件和子目录删除某个特定文件重命名某个文件获取某个文件/目录的信息输出目录路径分隔符输出文件行终止符输出用于分隔文件路径的字符串输出当前操作系统的名称获取当前系统的环境变量判断是否有权限执行操作修改文件的权限修改文件的属主和属组创建软连
Python笔记 Lucky_1129 笔记 python 笔记
Python笔记1.Python数组和列表的区别1.创建方式不同列表可以直接创建，数组需要引用numpy包2.存储对象不同列表可以存储任何的对象，包括数字，字符串，数组，字典等等数组只能存储单一的数据类型3.运算方式不同数组可以进行四则运算，列表只能使用加号进行拼接，拼接之后形成一个新的列表4.运算效率不同array数组是为了精确便捷的处理庞大的类似的数据而产生的，他的存储效率要比列表快着很多2.
python list常用方法_Python 列表 list 数组 array 常用操作集锦 weixin_39890289 python list常用方法
Python中的列表(list)类似于C#中的可变数组（ArrayList），用于顺序存储结构。创建列表sample_list=['a',1,('a','b')]Python列表操作sample_list=['a','b',0,1,3]得到列表中的某一个值value_start=sample_list[0]end_value=sample_list[-1]删除列表的第一个值delsample_li
Python数据分析与可视化研究阿尔法星球 python python 数据分析开发语言
Python数据分析与可视化研究摘要随着大数据和人工智能技术的飞速发展，Python数据分析与可视化技术已成为现代科学研究、企业决策等领域不可或缺的工具。本研究全面梳理了Python在数据分析与可视化领域的基本理论框架和关键技术，系统分析了Pandas、NumPy等核心数据分析库以及Matplotlib、Seaborn等可视化库的应用优势与特点。通过实际案例，本研究深入探讨了Python在数据清洗
《CPython Internals》阅读笔记：p336-p352 python
《CPythonInternals》学习第17天，p336-p352总结，总计17页。一、技术总结1.GDBGDB是GNUDbugger的缩写。(1)安装sudoaptinstallgdb(2)创建.gdbinit文件touch~/.gdbinitvim~/.gdbinit(3)配置.gdbinit文件add-auto-load-safe-path/project/cpython注：1./proj
提升Python性能：数据结构与算法优化指南步入烟尘 Python超入门指南全册 python 开发语言
优化Python中的数据结构与算法Python是一种强大而灵活的编程语言，它提供了丰富的数据结构和算法库，但是在处理大规模数据或者需要高效运行的情况下，需要考虑一些优化技巧。本文将介绍一些Python中常用的数据结构与算法优化技巧，并附带代码实例，帮助你更好地理解和运用。1.使用内置数据结构Python提供了许多内置的数据结构，如列表、字典、集合等，它们在大多数情况下都能满足需求，并且具有良好的性
可以与 FastAPI 不分伯仲的 Python 著名的 Web 框架程序员小麦 fastapi python 前端服务器 excel 开发语言
正如你所理解的，任何领域都不可能停止进步，不断使用相同的工具意味着不思进取。这一点在信息技术领域，尤其是网络开发行业非常明显。关于网络框架，不论是Django和Flask等传统框架还是Python的新型高级框架，一直有着新的框架不断出现，它们正在挤掉传统和成熟的技术，它们特征更好、编码更方便、更简单、更快捷。众所周知的Pythonweb框架Django该网络框架是最流行的Python网络框架之一。
python爬虫报错日记雁于飞笔记经验分享其他 python 爬虫网络爬虫
python爬虫报错日记类未定义原因：代码检查没有问题**，位置错了**，测试代码包含在类里……UnicodedecodeError错误原因：字符没有自动转换成utf-8格式KeyError：“href”原因：前面运行正常，有异常路由，加个判断写入文件乱码原因：获取正常，写入时encoding异常，不会自动转换成“utf-8”同上3
Ollama 完整教程：本地 LLM 管理、WebUI 对话、PythonJava 客户端 API 应用 web13765607643 java
随着大语言模型（LLM）的普及和应用场景的广泛扩展，Ollama提供了一个强大的本地LLM管理工具，支持WebUI对话功能，同时还为Python和Java提供了灵活的客户端API。本教程将详细介绍如何使用Ollama工具，涵盖从本地安装、模型管理、WebUI聊天界面到通过Python和Java进行集成的全方位应用。一、Ollama简介Ollama是一款用于本地运行大语言模型的工具，支持对LLM模型
【包邮送书】你好！Python Mindtechnist 粉丝福利 python 网络开发语言机器学习
欢迎关注博主Mindtechnist或加入【智能科技社区】一起学习和分享Linux、C、C++、Python、Matlab，机器人运动控制、多机器人协作，智能优化算法，滤波估计、多传感器信息融合，机器学习，人工智能等相关领域的知识和技术。关注公粽号《机器和智能》回复关键词“python项目实战”即可获取美哆商城视频资源！博主介绍：CSDN博客专家，CSDN优质创作者，CSDN实力新星，CSDN内容
Python开发接水果小游戏 YhPythonJSCPP 【游戏开发】【Python】python 游戏开发 pylash
我研发的Python游戏引擎Pylash已经更新到1.4了。现在我们就来使用它完成一个极其简单的小游戏：接水果。以下是游戏截图：游戏操作说明：点击屏幕左右两边或者使用键盘方向键控制人物移动，使人物与水果接触得分，碰到非水果的物品，如碎玻璃，就会gameover。接下来是详尽的开发过程，篇幅较长，请看官耐心阅读。Pylash项目地址由于本次开发用到了pylash，大家可以先去Github上对引擎进行
华为OD机试2024年E卷-数组拼接[100分]（ Java | Python3 | C++ | C语言 | JsNode | Go）实现100%通过率梅花C 华为OD题库华为od
题目描述现在有多组整数数组，需要将它们合并成一个新的数组。合并规则，从每个数组里按顺序取出固定长度的内容合并到新的数组中，取完的内容会删除掉，如果该行不足固定长度或者已经为空，则直接取出剩余部分的内容放到新的数组中，继续下一行。输入描述第一行是每次读取的固定长度，0<长度<10第二行是整数数组的数目，0<数目<1000第3-n行是需要合并的数组，不同的数组用回车换行分隔，数组内部用逗号分隔，最大不
Python 变量和简单数据类型(变量) 钢铁男儿 Python 从入门到精通 python 开发语言
变量每个变量都存储一个值——与变量相关联的信息。变量的命名规则①变量名只能包含字母、数字和下划线。变量名可以字母或下划线打头，但不能以数字打头，例如，可将变量名message_1，但不能将变量名1_message。②变量名不能包含空格，但可使用下划线来分割其中的单词。例如，变量名greeting_message可行，但变量名greetingmessage会引发错误。③不要将Python关键字和函数
python红包游戏_脑力2048红包版影智 python红包游戏
脑力2048红包版是一款最新推出的非常好玩的手机2048闯关赢红包小游戏,在脑力2048红包版游戏中玩家可以通过2048的玩法来进行闯关,游戏玩法非常的简单有趣,成功通过关卡就有机会获得现金红包,感兴趣的朋友赶紧下载脑力2048红包版开始游戏吧!脑力2048红包版游戏特色1、经典2048玩法带玩家找回童年的感觉，指尖操作探险数字之间的关系。2、全新主题挑战模式，全部解锁12种主题，最有趣的宫廷版2
华为OD机试E卷 - 最大值（Java & Python& JS & C++ & C ）算法大师最新华为OD机试华为od java python javascript c++华为OD机试E卷 C语言
最新华为OD机试真题目录：点击查看目录华为OD面试真题精选：点击立即查看题目描述给定一组整数（非负），重排顺序后输出一个最大的整数。示例1输入：[10,9]输出：910说明:输出结果可能非常大，所以你需要返回一个字符串而不是整数。输入描述数字组合输出描述最大的整数示例1输入109输出910说明解题思路题目要求是：给定一组
Python 入门路线（2025 极简无废话版）墨鱼爆蛋 Python python 开发语言编程
大家好，梳理一个Python从入门到精通路线大家都挺忙的，突出一个无废话注：时间仅供参考第一阶段：基础入门(0-3个月)1.Python基础语法开发环境搭建(Python安装、IDE选择)变量和数据类型运算符和表达式控制流(if/else、循环)函数定义与调用基本输入输出2.数据结构基础列表(List)和元组(Tuple)字典(Dict)和集合(Set)字符串处理文件操作3.错误处理try/exc
用Python写了一个好玩的桌面宠物游戏脚本，简单又好玩墨鱼爆蛋 Python Python游戏 python 开发语言游戏桌面宠物
今天，我们来分享一个宠物桌面小程序，全程都是通过PyQT来制作的，对于PythonGUI感兴趣的朋友，千万不要错过哦！我们先来看看最终的效果，对于一个小小的娱乐项目来说，还是不错啦！好了，废话不多说，我直接上干货，本项目使用PYQT5作为编码框架，如果你对于该框架不是特别熟悉的话，建议先去简单学习一下~源码和素材图片在文末领取！素材图片项目源码展示importsysimportosimportra
Python 上下文管理器：优雅地管理资源墨鱼爆蛋 python 开发语言数据库
一、什么是上下文管理器上下文管理器是一个可以在with语句中使用的对象，它定义了__enter__和__exit__方法，它定义了在进入和退出特定代码块时需要执行的操作，确保资源在使用完毕后能够被正确地释放或清理。二、如何实现上下文管理器Python的上下文管理器通常通过两种方式实现：一种是使用类，另一种是使用生成器。1.使用类实现上下文管理器要实现一个自定义的上下文管理器类，你需要在类中定义两个
Python 如何使用 Bert 进行中文情感分析程序员徐师兄 Python 入门专栏 python bert 开发语言情感分析
前言在自然语言处理（NLP）领域，情感分析是一个非常常见且重要的应用。情感分析通常用于识别文本中的情感，例如判断一条微博或评论是正面、负面还是中性。在过去的几年中，随着深度学习的发展，BERT（BidirectionalEncoderRepresentationsfromTransformers）模型迅速成为了处理自然语言的强大工具。BERT是一种基于Transformer架构的预训练模型，它能够
【Python百日进阶-Web开发-Feffery】Day604 - 趣味dash_04：Excel转Pdf文件岳涛@泰山医院 Dash python excel 前端 dash
文章目录一、环境准备1.1初始化基础`Python+Dash`环境1.2本例中使用的第三方包二、本项目B站视频讲解三、页面效果四、项目源码一、环境准备1.1初始化基础Python+Dash环境CSDN文档参见：https://blog.csdn.net/yuetaope/article/details/129795264Bilibili视频参见：https://www.bilibili.com/v
Python进阶--Python操作excel 小昀小杭 python excel 数据库
一、xlsxwirter三方库优点：写的快功能多缺点：只能写问题：内容并不是直接写入文件中只有在关闭的时候才会写入文件实例：#创建excel文件wb=xlsxwriter.Workbook("cars.xlsx")#在该文件下创建sheetws=self.wb.get_worksheet_by_name("Car")orself.wb.add_worksheet("Car")ws.write(ro
python进阶-10.pandas基本数据类型（1） wang旭炎 python numpy 索引
importpandasaspdimportnumpyasnpfrompandasimportSeries,DataFrame文章目录1,Series自定义索引读取SeriesSereis.loc['自定义的索引']||Sereis.iloc[0-n的数字]xxx.loc['yy']=new修改和增加读取多个值,会得到一个新对象通过字典数据得到Series2.DataFrame2.1把numpy的
tensorflow-迁移学习使用Resnet残差网络实现猫狗分类问题浮夸 tensorflow python
遇到的bug都放在之前的文章里了importosimportpandasaspdimportwarningsimporttensorflowastffromtensorflow.pythonimportkerasfromkeras.preprocessing.imageimportImageDataGeneratorimportkeras.optimizersasopfromtensorflow.
selenium框架你们的好朋友大强测试开发 python 功能测试 selenium
selenium（仅作为个人笔记，如有雷同，请联系删除。。）1、Selenium的特点：开源、免费，多浏览器支持，多平台支持，多语言支持，对Web页面有良好的支持，API简单，灵活(用开发语言驱动)，支持分布式测试用例执行。2、Windows下的测试环境搭建：安装Python；安装setuptools与pip（注：Python3不支持setuptools，但已经集成了pip）安装Selenium：
python爬取电影天堂beautiful_Python爬虫 -- 抓取电影天堂8分以上电影 carafqy
看了几天的python语法，还是应该写个东西练练手。刚好假期里面看电影，找不到很好的影片，于是有个想法，何不搞个爬虫把电影天堂里面8分以上的电影爬出来。做完花了两三个小时，撸了这么一个程序。反正蛮简单的，思路和之前用nodejs写爬虫一样。爬虫的入口从分页的列表开始，比如美剧的列表第一页地址这样：http://www.ygdy8.net/html/gndy/oumei/list_7_1.html，
【python进阶】txt excel pickle opencv操作demo 闪闪发亮的小星星 AI算法工程师打怪 python excel opencv
文章目录1.txt读写读综合案例日志文件读写2.excel读写读取csv读取xlsx3.matplotlib案例折线图多个折现图散点图柱状图饼状图4opencv案例加载与展示图片缩放图片旋转图片保存图片读取摄像头视频保存opencv综合案例5pickle案例1.txt读写读file.read()file.readlines()file.readline()##使用'read'方法读取文件的所有内容
python爬取公众号历史文章_微信公众号爬虫--历史文章冷风吹心冷风吹心 python爬取公众号历史文章
今天搞了一个微信公众号历史文章爬虫的demo，亲测可行，记录一下！(不喜勿喷)缺点：1.不是很智能2.兼容性不是很好，但是能应付正常情况啦使用mysql+request数据库部分直接建表ddl吧：CREATETABLE`wechat_content`(`id`int(11)NOTNULLAUTO_INCREMENT,`wechat_name`varchar(255)DEFAULTNULLCOMME
python-django 安装与基本配置默执_ django 后端开发 python django 后端
安装pipinstallDjango==3.2.4查看版本python-mdjango--version创建项目django-adminstartproject项目名称cd项目名称创建数据库pythonmanage.pymigrate创建超级用户用户名邮箱pythonmanage.pycreatesuperuser--username=用户名--email=邮箱自己设置密码必要设置：#设置中文：s
selenium通过cookie实现自动登录 Zds丶小顺顺 python 开发语言
原理很简单，首先手动完成登录后，把cookies保存到本地，下次再把cookies注入到浏览器里面，就自动实现了登录最近在学习写python的自动化脚本,但是发现测试工具打开之后的网页是没有用户自己打开浏览器时记录的cookie,简单来说也就是打开的网站不会自己登录,所以想要简单的实现下如何用cookie来登录总的来说分两步目录第一步，把cookies保存到本地第二步，把保存到本地的cookies
TOMCAT在POST方法提交参数丢失问题 357029540 java tomcat jsp
摘自http://my.oschina.net/luckyi/blog/213209 昨天在解决一个BUG时发现一个奇怪的问题，一个AJAX提交数据在之前都是木有问题的，突然提交出错影响其他处理流程。检查时发现页面处理数据较多，起初以为是提交顺序不正确修改后发现不是由此问题引起。于是删除掉一部分数据进行提交，较少数据能够提交成功。恢复较多数据后跟踪提交FORM DATA ，发现数
在MyEclipse中增加JSP模板删除-2008-08-18 ljy325 jsp xml MyEclipse
在D:\Program Files\MyEclipse 6.0\myeclipse\eclipse\plugins\com.genuitec.eclipse.wizards_6.0.1.zmyeclipse601200710\templates\jsp 目录下找到Jsp.vtl，复制一份，重命名为jsp2.vtl,然后把里面的内容修改为自己想要的格式，保存。然后在 D:\Progr
JavaScript常用验证脚本总结 eksliang JavaScript javaScript表单验证
转载请出自出处：http://eksliang.iteye.com/blog/2098985 下面这些验证脚本，是我在这几年开发中的总结，今天把他放出来，也算是一种分享吧，现在在我的项目中也在用！包括日期验证、比较，非空验证、身份证验证、数值验证、Email验证、电话验证等等...! &nb
微软BI（4） 18289753290 微软BI SSIS
1） Q:查看ssis里面某个控件输出的结果： A MessageBox.Show(Dts.Variables["v_lastTimestamp"].Value.ToString()); 这是我们在包里面定义的变量 2):在关联目的端表的时候如果是一对多的关系，一定要选择唯一的那个键作为关联字段。 3) Q：ssis里面如果将多个数据源的数据插入目的端一
定时对大数据量的表进行分表对数据备份酷的飞上天空大数据量
工作中遇到数据库中一个表的数据量比较大，属于日志表。正常情况下是不会有查询操作的，但如果不进行分表数据太多，执行一条简单sql语句要等好几分钟。。分表工具：linux的shell + mysql自身提供的管理命令原理：使用一个和原表数据结构一样的表，替换原表。 linux shell内容如下： =======================开始
本质的描述与因材施教永夜-极光感想随笔
不管碰到什么事,我都下意识的想去探索本质,找寻一个最形象的描述方式。我坚信,世界上对一件事物的描述和解释,肯定有一种最形象,最贴近本质,最容易让人理解 &
很迷茫。。。随便小屋随笔
小弟我今年研一，也是从事的咱们现在最流行的专业（计算机）。本科三流学校，为了能有个更好的跳板，进入了考研大军，非常有幸能进入研究生的行业（具体学校就不说了，怕把学校的名誉给损了）。先说一下自身的条件，本科专业软件工程。主要学习就是软件开发，几乎和计算机没有什么区别。因为学校本身三流，也就是让老师带着学生学点东西，然后让学生毕业就行了。对专业性的东西了解的非常浅。就那学的语言来说
23种设计模式的意图和适用范围 aijuans 设计模式
Factory Method 意图定义一个用于创建对象的接口，让子类决定实例化哪一个类。Factory Method 使一个类的实例化延迟到其子类。　　适用性当一个类不知道它所必须创建的对象的类的时候。　　当一个类希望由它的子类来指定它所创建的对象的时候。　　当类将创建对象的职责委托给多个帮助子类中的某一个，并且你希望将哪一个帮助子类是代理者这一信息局部化的时候。 Abstr
Java中的synchronized和volatile aoyouzi java volatile synchronized
说到Java的线程同步问题肯定要说到两个关键字synchronized和volatile。说到这两个关键字，又要说道JVM的内存模型。JVM里内存分为main memory和working memory。 Main memory是所有线程共享的，working memory则是线程的工作内存，它保存有部分main memory变量的拷贝，对这些变量的更新直接发生在working memo
js数组的操作和this关键字百合不是茶 js 数组操作 this关键字
js数组的操作; 一:数组的创建: 1、数组的创建 var array = new Array();　//创建一个数组 var array = new Array([size]);　//创建一个数组并指定长度，注意不是上限，是长度 var arrayObj = new Array([element0[, element1[, ...[, elementN]]]
别人的阿里面试感悟 bijian1013 面试分享工作感悟阿里面试
原文如下：http://greemranqq.iteye.com/blog/2007170 一直做企业系统，虽然也自己一直学习技术，但是感觉还是有所欠缺，准备花几个月的时间，把互联网的东西，以及一些基础更加的深入透析，结果这次比较意外，有点突然，下面分享一下感受吧！ &nb
淘宝的测试框架Itest Bill_chen spring maven 框架单元测试 JUnit
Itest测试框架是TaoBao测试部门开发的一套单元测试框架，以Junit4为核心，集合DbUnit、Unitils等主流测试框架，应该算是比较好用的了。近期项目中用了下，有关itest的具体使用如下： 1.在Maven中引入itest框架： <dependency> <groupId>com.taobao.test</groupId&g
【Java多线程二】多路条件解决生产者消费者问题 bit1129 java多线程
package com.tom; import java.util.LinkedList; import java.util.Queue; import java.util.concurrent.ThreadLocalRandom; import java.util.concurrent.locks.Condition; import java.util.concurrent.loc
汉字转拼音pinyin4j 白糖_ pinyin4j
以前在项目中遇到汉字转拼音的情况，于是在网上找到了pinyin4j这个工具包，非常有用，别的不说了，直接下代码： import java.util.HashSet; import java.util.Set; import net.sourceforge.pinyin4j.PinyinHelper; import net.sourceforge.pinyin
org.hibernate.TransactionException: JDBC begin failed解决方案 bozch ssh 数据库异常 DBCP
org.hibernate.TransactionException: JDBC begin failed: at org.hibernate.transaction.JDBCTransaction.begin(JDBCTransaction.java:68) at org.hibernate.impl.SessionImp
java-并查集（Disjoint-set）-将多个集合合并成没有交集的集合 bylijinnan java
import java.util.ArrayList; import java.util.Arrays; import java.util.HashMap; import java.util.HashSet; import java.util.Iterator; import java.util.List; import java.util.Map; import java.ut
Java PrintWriter打印乱码 chenbowen00 java
一个小程序读写文件，发现PrintWriter输出后文件存在乱码，解决办法主要统一输入输出流编码格式。读文件： BufferedReader 从字符输入流中读取文本，缓冲各个字符，从而提供字符、数组和行的高效读取。可以指定缓冲区的大小，或者可使用默认的大小。大多数情况下，默认值就足够大了。通常，Reader 所作的每个读取请求都会导致对基础字符或字节流进行相应的读取请求。因
[天气与气候]极端气候环境 comsci 环境
如果空间环境出现异变...外星文明并未出现,而只是用某种气象武器对地球的气候系统进行攻击,并挑唆地球国家间的战争,经过一段时间的准备...最大限度的削弱地球文明的整体力量,然后再进行入侵...... 那么地球上的国家应该做什么样的防备工作呢? &n
oracle order by与union一起使用的用法 daizj UNION oracle order by
当使用union操作时，排序语句必须放在最后面才正确，如下：只能在union的最后一个子查询中使用order by，而这个order by是针对整个unioning后的结果集的。So：如果unoin的几个子查询列名不同，如 Sql代码 select supplier_id, supplier_name from suppliers UNI
zeus持久层读写分离单元测试 deng520159 单元测试
本文是zeus读写分离单元测试,距离分库分表,只有一步了.上代码: 1.ZeusMasterSlaveTest.java package com.dengliang.zeus.webdemo.test; import java.util.ArrayList; import java.util.List; import org.junit.Assert; import org.j
Yii 截取字符串(UTF-8) 使用组件 dcj3sjt126com yii
1.将Helper.php放进protected\components文件夹下。 2.调用方法： Helper::truncate_utf8_string($content,20,false); //不显示省略号 Helper::truncate_utf8_string($content,20); //显示省略号 &n
安装memcache及php扩展 dcj3sjt126com PHP
安装memcache tar zxvf memcache-2.2.5.tgz cd memcache-2.2.5/ /usr/local/php/bin/phpize (?) ./configure --with-php-confi
JsonObject 处理日期 feifeilinlin521 java json JsonOjbect JsonArray JSONException
写这边文章的初衷就是遇到了json在转换日期格式出现了异常 net.sf.json.JSONException: java.lang.reflect.InvocationTargetException 原因是当你用Map接收数据库返回了java.sql.Date 日期的数据进行json转换出的问题话不多说直接上代码 &n
Ehcache（06）——监听器 234390216 监听器 listener ehcache
监听器 Ehcache中监听器有两种，监听CacheManager的CacheManagerEventListener和监听Cache的CacheEventListener。在Ehcache中，Listener是通过对应的监听器工厂来生产和发生作用的。下面我们将来介绍一下这两种类型的监听器。
activiti 自带设计器中chrome 34版本不能打开bug的解决 jackyrong Activiti
在acitivti modeler中，如果是chrome 34，则不能打开该设计器，其他浏览器可以，经证实为bug，参考 http://forums.activiti.org/content/activiti-modeler-doesnt-work-chrome-v34 修改为，找到 oryx.debug.js 在最头部增加 if (!Document.
微信收货地址共享接口-终极解决 laotu5i0 微信开发
最近要接入微信的收货地址共享接口，总是不成功，折腾了好几天，实在没办法网上搜到的帖子也是骂声一片。我把我碰到并解决问题的过程分享出来，希望能给微信的接口文档起到一个辅助作用，让后面进来的开发者能快速的接入，而不需要像我们一样苦逼的浪费好几天，甚至一周的青春。各种羞辱、谩骂的话就不说了，本人还算文明。如果你能搜到本贴，说明你已经碰到了各种 ed
关于人才 netkiller.github.com 工作面试招聘 netkiller 人才
关于人才每个月我都会接到许多猎头的电话，有些猎头比较专业，但绝大多数在我看来与猎头二字还是有很大差距的。与猎头接触多了，自然也了解了他们的工作，包括操作手法，总体上国内的猎头行业还处在初级阶段。总结就是“盲目推荐，以量取胜”。目前现状许多从事人力资源工作的人，根本不懂得怎么找人才。处在人才找不到企业，企业找不到人才的尴尬处境。企业招聘，通常是需要用人的部门提出招聘条件，由人
搭建 CentOS 6 服务器 - 目录 rensanning centos
(1) 安装CentOS ISO（desktop/minimal）、Cloud（AWS/阿里云）、Virtualization（VMWare、VirtualBox）详细内容 (2) Linux常用命令 cd、ls、rm、chmod...... 详细内容 (3) 初始环境设置用户管理、网络设置、安全设置...... 详细内容 (4) 常驻服务Daemon
【求助】mongoDB无法更新主键 toknowme mongodb
Query query = new Query(); query.addCriteria(new Criteria("_id").is(o.getId())); &n
jquery 页面滚动到底部自动加载插件集合 xp9802 jquery
很多社交网站都使用无限滚动的翻页技术来提高用户体验，当你页面滑到列表底部时候无需点击就自动加载更多的内容。下面为你推荐 10 个 jQuery 的无限滚动的插件： 1. jQuery ScrollPagination jQuery ScrollPagination plugin 是一个 jQuery 实现的支持无限滚动加载数据的插件。 2. jQuery Screw S

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他