dichangsi2813

Python爬虫系列（六）：搜索文档树

今天早上，写的东西掉了。这个烂知乎，有bug，说了自动保存草稿，其实并没有保存。无语

今晚，我们将继续讨论如何分析html文档。

1.字符串

#直接找元素
soup.find_all('b')

2.正则表达式

#通过正则找
import re
for tag in soup.find_all(re.compile("^b")):
print(tag.name)

3.列表

找a 和 b标签

soup.find_all(["a", "b"])

4.True

找所有标签

for tag in soup.find_all(True):
print(tag.name)

5.方法

def has_class_but_no_id(tag):
return tag.has_attr('class') and not tag.has_attr('id')

#调用外部方法。只返回方法满足为true的元素

soup.find_all(has_class_but_no_id)

6.find_all

ind_all() 方法搜索当前tag的所有tag子节点,并判断是否符合过滤器的条件.这里有几个例子:

soup.find_all("title")

#找class=title的p元素

soup.find_all("p", "title")

#找所有元素

soup.find_all("a")

#通过ID找

soup.find_all(id="link2")

#通过内容找

import re
soup.find(text=re.compile("sisters"))

#通过正则：查找元素属性满足条件的

soup.find_all(href=re.compile("elsie"))

#查找包含id的元素

soup.find_all(id=True)

#多条件查找

soup.find_all(href=re.compile("elsie"), id='link1')

有些tag属性在搜索不能使用,比如HTML5中的 data-* 属性

data_soup = BeautifulSoup('

foo!

')
data_soup.find_all(data-foo="value")

但是可以通过 find_all() 方法的 attrs 参数定义一个字典参数来搜索包含特殊属性的tag:

data_soup.find_all(attrs={"data-foo": "value"})

#按CSS搜索注意class的用法

按照CSS类名搜索tag的功能非常实用,但标识CSS类名的关键字 class 在Python中是保留字,使用 class 做参数会导致语法错误.从Beautiful Soup的4.1.1版本开始,可以通过 class_ 参数搜索有指定CSS类名的tag

soup.find_all("a", class_="sister")

class_ 参数同样接受不同类型的过滤器 ,字符串,正则表达式,方法或 True :

soup.find_all(class_=re.compile("itl"))

def has_six_characters(css_class):
return css_class is not None and len(css_class) == 6

soup.find_all(class_=has_six_characters)

tag的 class 属性是多值属性 .按照CSS类名搜索tag时,可以分别搜索tag中的每个CSS类名:

css_soup = BeautifulSoup('

')
css_soup.find_all("p", class_="strikeout")

css_soup.find_all("p", class_="body")

搜索 class 属性时也可以通过CSS值完全匹配

css_soup.find_all("p", class_="body strikeout")

完全匹配 class 的值时,如果CSS类名的顺序与实际不符,将搜索不到结果

soup.find_all("a", attrs={"class": "sister"})

通过 text 参数可以搜搜文档中的字符串内容.

与 name 参数的可选值一样, text 参数接受字符串 , 正则表达式 , 列表, True .

soup.find_all(text="Elsie")

soup.find_all(text=["Tillie", "Elsie", "Lacie"])

soup.find_all(text=re.compile("Dormouse"))

def is_the_only_string_within_a_tag(s):
return (s == s.parent.string)

soup.find_all(text=is_the_only_string_within_a_tag)

虽然 text 参数用于搜索字符串,还可以与其它参数混合使用来过滤tag.Beautiful Soup会找到 .string 方法与 text 参数值相符的tag.下面代码用来搜索内容里面包含“Elsie”的标签

soup.find_all("a", text="Elsie")

find_all() 方法返回全部的搜索结构,如果文档树很大那么搜索会很慢.如果我们不需要全部结果,可以使用 limit 参数限制返回结果的数量.效果与SQL中的limit关键字类似,当搜索到的结果数量达到 limit 的限制时,就停止搜索返回结果

soup.find_all("a", limit=2)

调用tag的 find_all() 方法时,Beautiful Soup会检索当前tag的所有子孙节点,如果只想搜索tag的直接子节点,可以使用参数 recursive=False .

soup.html.find_all("title")

soup.html.find_all("title", recursive=False)

find_all() 几乎是Beautiful Soup中最常用的搜索方法,所以我们定义了它的简写方法. BeautifulSoup 对象和 tag 对象可以被当作一个方法来使用,这个方法的执行结果与调用这个对象的 find_all() 方法相同,下面两行代码是等价的

soup.find_all("a")
soup("a")

soup.title.find_all(text=True)
soup.title(text=True)

7.find

soup.find_all('title', limit=1)与soup.find('title')一样

find就是找到满足条件的第一个就返回。all返回列表，find返回一个对象

find_all() 方法没有找到目标是返回空列表, find() 方法找不到目标时,返回 None

soup.head.title 是 tag的名字方法的简写.这个简写的原理就是多次调用当前tag的 find() 方法

soup.head.title与soup.find("head").find("title")

8.find_parents() 和 find_parent()

soup = BeautifulSoup(html_doc, "lxml")
a_string = soup.find(text="Lacie")
print('1---------------------------')
print(a_string)
print('2---------------------------')
#找直接父节点
print(a_string.find_parents("a"))
print('3---------------------------')
#迭代找父节点
print(a_string.find_parent("p"))
print('4---------------------------')
#找直接父节点
print(a_string.find_parents("p", class_="title"))

9.find_next_siblings() 合 find_next_sibling()

soup = BeautifulSoup(html_doc, "lxml")
a_string = soup.find(text="Lacie")
print('1---------------------------')
first_link = soup.a
print(first_link)
print('2---------------------------')
#找当前元素的所有后续元素
print(first_link.find_next_siblings("a"))
print('3---------------------------')
first_story_paragraph = soup.find("p", "story")
#找当前元素的紧接着的第一个元素
print(first_story_paragraph.find_next_sibling("p"))

10.find_previous_siblings() 和 find_previous_sibling()

和第9点方向相反

last_link = soup.find("a", id="link3")
last_link
last_link.find_previous_siblings("a")
first_story_paragraph = soup.find("p", "story")
first_story_paragraph.find_previous_sibling("p")

11.find_all_next() 和 find_next()

这2个方法通过 .next_elements 属性对当前tag的之后的tag和字符串进行迭代, find_all_next() 方法返回所有符合条件的节点, find_next() 方法返回第一个符合条件的节点:

first_link.find_all_next(text=True)
first_link.find_next("p")

12.find_all_previous() 和 find_previous()

这2个方法通过 .previous_elements 属性对当前节点前面的tag和字符串进行迭代, find_all_previous() 方法返回所有符合条件的节点, find_previous() 方法返回第一个符合条件的节点

first_link.find_all_previous("p")

first_link.find_previous("title")

13.CSS选择器

查找class=title的元素

soup.select("title")
soup.select("p nth-of-type(3)")

通过元素层级查找

soup.select("body a")

soup.select("html head title")

找直接子元素

soup.select("head > title")

soup.select("p > a")

soup.select("p > a:nth-of-type(2)")

oup.select("p > #link1")

up.select("body > a")

找到兄弟节点标签

soup.select("#link1 ~ .sister")

soup.select("#link1 + .sister")

通过CSS的类名查找

soup.select(".sister")

这里的class没有加 _

soup.select("[class~=sister]")

通过tag的id查找

soup.select("#link1")

通过是否存在某个属性来查找

oup.select('a[href]')

通过属性的值来查找

soup.select('a[href="http://example.com/elsie"]')

#以title结尾

soup.select('a[href$="tillie"]')

#包含.com

soup.select('a[href*=".com/el"]')

通过语言设置来查找:就是通过元素属性来查找

multilingual_markup = """

Hello

Howdy, y'all

Pip-pip, old fruit

Bonjour mes amis

"""

multilingual_soup = BeautifulSoup(multilingual_markup)

multilingual_soup.select('p[lang|=en]')

这一部分内容，了解jquery的人一眼就看明白了

作为程序员，一定要学会触类旁通

转载于:https://www.cnblogs.com/zijiyanxi/p/7726212.html

你可能感兴趣的:(Python爬虫系列（六）：搜索文档树)

使用arxiv提供的API爬取文章信息 ye6 爬虫 python
大致阅读了一下arxiv提供的文档，里面4.1.SimpleExamples部分提供了4种语言的API请求样例。我的需求是使用Python，所以直接复制粘贴了。网址：https://arxiv.org/help/api/user-manualimporturlliburl='http://export.arxiv.org/api/query?search_query=all:electron&st
JSON-to-Excel v2.0.0发布，可以在Excel内部，把JSON转换成Excel格式，嵌套的JSON也能转 wtsolutions excel与json互相转换 json excel 转换 json-to-excel
本文是JSON-to-Excel插件的官方文档https://json-to-excel.wtsolutions.cn简化浓缩翻译的中文版，仅供参考。详细的还请查看官方文档。插件简介JSON-to-Excel是一款强大的MicrosoftExcel插件，专门用于将JSON数据转换为Excel表格格式。这款插件能够帮助用户轻松处理和转换JSON数据，提高数据处理效率。插件版本20250228发布v2
大模型WebUI：Gradio全解12——LangChain原理、架构和组件（2）龙焰智能 langchain openai deepseek intergrations api reference 操作指南教程
大模型WebUI：Gradio全解12——LangChain原理、架构和组件（2）前言12.LangChain原理及agents构建GradioUI12.2学习资料12.2.1学习文档12.2.2用途示例12.2.3OpenAI和DeepSeek例程1.OpenAI示例2.DeepSeek例程参考文献前言本系列文章主要介绍WEB界面工具Gradio。Gradio是HuggingFace发布的简易W
SQL 实战—递归 SQL：层级结构查询与处理树形数据 m0_74823239 面试学习路线阿里巴巴 sql java 数据库
在数据库中，树形或层级结构的数据非常常见，如组织架构、分类目录、评论回复等。SQL提供了递归查询的能力，通过递归通用表表达式（CTE），可以高效地查询和处理树形数据。本文将通过实际案例详细讲解递归SQL的应用。一、递归SQL基本概念1.什么是递归SQL？递归SQL是指在SQL查询中，自我引用以遍历层级结构或处理递归关系的一种方式。MySQL8.0、PostgreSQL和SQLServer等数据库均
用Meta的开源工具打造AI驱动的应用：LASER、Faiss与聊天加载器示例 dgay_hua 人工智能 faiss python
MetaPlatforms（原Facebook）在AI技术领域持续创新，推出了多个优秀的开源工具，比如用于多语言句子嵌入的LASER、用于高效相似性搜索的Faiss，以及用于加载和处理Messenger和WhatsApp聊天记录的工具。这些工具可以帮助开发者快速构建AI驱动的应用。在本文中，我们将深入介绍这些工具的功能，并通过可运行的代码示例展示如何将它们应用到实际项目中。技术背景介绍LASER（
使用Nuclia Understanding API 处理和索引非结构化数据 dgay_hua python
技术背景介绍在当今信息化社会中，非结构化数据如视频、音频、图像和文档在企业中占据了大量的数据存储资源。处理这些数据以提取有效信息并进行快速检索已经成为一项重要任务。NucliaUnderstanding是一个强大的工具，可自动索引这些非结构化数据，提供优化的搜索结果和生成式答案。NucliaUnderstandingAPI支持处理各种非结构化数据，包括文本、网页、文档和音视频内容。它能够提取文本(
如何用Python 3调用ArXiv API查询ArXiv论文元数据诸神缄默不语编程学习笔记 python 开发语言 ArXiv API XML urllib
诸神缄默不语-个人CSDN博文目录ArXivAPI文档：arXivAPIAccess-arXivinfoarXivAPIBasics-arXivinfoarXivAPIUser’sManual-arXivinfo文章目录1.调包2.获取数据1.简单入门2.XML返回值示例3.添加分类信息，获取最新论文4.ArXiv查询入参详解3.解析XML数据1.调包importurllibfromurllib.
软件工程---需求工程 Dragonlongbo 软件工程
软件需求工程师发现、获取、组织、分析、编写和管理需求的系统方法，以使客户和项目组之间达成共识。需求工程共包含五个步骤：需求获取：对业务问题分析，与项目干系人沟通，以理解系统的目标、期望和约束，进一步分析，形成前景文档。需求获取：提炼、分析和审查已收集到的项目干系人的需求，建立需求分析模型。需求定义：在上述分析模型的基础上形成软件需求规约SRS，作为用户和开发者之间的一个契约需求验证：以上述前景文档
【STL】7.STL常用算法（2）零零时 c/c++c++算法开发语言学习数据结构笔记经验分享
STL常用算法（2）前言简介四.常用拷贝和替换算法1.copy2.replace3.replace_if4.swap五.算术生成算法1.accumulate2.fill六.常用集合算法1.set_intersection2.set_union3.set_difference总结前言stl系列主要讲述有关stl的文章，使用STL可以大大提高程序开发的效率和代码的可维护性，且在算法比赛中，STL可以帮
RabbitMQ系列（六）基本概念之Routing Key yyueshen RabbitMQ #RabbitMQ概念 rabbitmq 分布式
在RabbitMQ中，RoutingKey（路由键）是用于将消息从交换机（Exchange）路由到指定队列（Queue）的关键参数。其核心作用是通过特定规则匹配绑定关系，确保消息被正确分发。以下是其核心机制与用法的详细说明：一、核心定义与作用消息路由的核心标识生产者发送消息时需指定RoutingKey，交换机根据此值和队列绑定的BindingKey决定消息流向。类比：类似快递单上的“地址”，决定包
STL之容器——map/multimap 虔诚的学习者 stl stl
map/multimap：由红黑树实现，元素为键值-实值。一：特点1.map为单重映射，键值和实值是一对一的关系，不允许重复键值；multimap是多重映射，允许相同键值，一个键值可以对应多个实值。2.具有自动排序功能，所有map里的数据都是有序的。3.map提供的[]操作符的重载；multimap未提供。二：定义与初始化mapm1;map>m2;map>m3;multimapm4;multima
【六祎 - Note】消息队列的演变，架构图；备忘录； IBM MQ,RabbitMQ,Kafka,Pulsar 鞠崽23333 消息中间件 rabbitmq kafka 分布式
IBMMQ于1993年推出。它最初称为MQSeries，2002年更名为WebSphereMQ。2014年更名为IBMMQ。IBMMQ是一款非常成功的产品，广泛应用于金融领域。其收入在2020年仍达到10亿美元。RabbitMQ架构与IBMMQ不同，更类似于Kafka的概念。生产者向指定交换类型的交换发布消息。它可以是直接、主题或扇出。然后，交换中心根据不同的消息属性和交换类型将消息路由到队列中。
【C++】：STL标准库之map/multimap yuanCruise C++C++map
map/multimap1.简介map是标准的关联式容器，一个map是一个键值对序列，即(key,value)对。它提供基于key的快速检索能力。map中key值是唯一的。集合中的元素按一定的顺序排列。元素插入过程是按排序规则插入，所以不能指定插入位置。map的具体实现采用红黑树变体的平衡二叉树的数据结构。在插入操作和删除操作上比vector快。map可以直接存取key所对应的value，支持[]
使用 ONLYOFFICE API 新方法，从第二页开始插入自定义页码！ ONLYOFFICE 前端服务器数据库
ONLYOFFICE宏是一种功能强大的工具，可以让用户扩展编辑器的功能并对其进行定制，以满足特定需求。随着8.3版本的发布，我们推出了一系列新的API方法，能够帮您简化工作流程。在本文中，我们将使用其中一种方法创建一个宏，从第二页开始，在整个文档中插入自定义页码。关于ONLYOFFICEONLYOFFICE是一个国际开源项目，专注于高级和安全的文档处理，可提供文本文档、电子表格、幻灯片、表单和PD
“伪元素”是啥向贤前端开发 css
“伪元素”是啥CSS伪元素（Pseudo-elements）是一种特殊的CSS选择器，允许开发者在不修改HTML结构的前提下，通过样式表操作元素的特定部分或插入虚拟内容。以下是其核心特性解析：一、本质特性‌虚拟元素‌伪元素并非真实存在于HTML文档树中，而是通过CSS生成的抽象元素‌。例如::before会在元素内容前生成一个虚拟容器，::after则在内容后生成。‌无法通过JS直接操作‌由于伪元
【STL】6.＜map/multimap＞零零时 c/c++c++开发语言算法学习数据结构 map multimap
map/multimap前言map/multimap容器一.pair对组（头文件utility）1.pair初始化2.pair数据访问二.map容器的构造与赋值三.map容器的大小与交换四.map容器的插入与删除五.map容器的查找与统计六.multimap容器总结前言stl系列主要讲述有关stl的文章，使用STL可以大大提高程序开发的效率和代码的可维护性，且在算法比赛中，STL可以帮助我们更方便
Go语言学习笔记（二）正在绘制中 Go语言学习之路 golang 学习笔记
文章目录六、数组和map数组多维数组切片直接声明新的切片使用make()函数构造切片map遍历map删除线程安全的mapnew和make七、nil八、条件判断&循环ifelseforforrangeswitchgotobreakcontinue九、函数函数的参数匿名函数闭包延迟调用十、异常六、数组和map数组数组是一个由固定长度的特定类型元素组成的序列，一个数组可以由零个或多个元素组成。因为数组的
【一看就会】Autoware.universe的“规划”部分源码梳理【四十六】（autoware_obstacle_cruise_planner：障碍物巡航规划器）不断学习加努力自动驾驶算法
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言十二、autoware_obstacle_cruise_planner：障碍物巡航规划器1.功能概述2.工作流程3.调用关系4.订阅发布话题订阅话题发布话题5.关键算法实现6.主要参数配置规划器选择安全参数优化器参数PID参数巡航参数7.文件结构和功能a)核心实现文件node.cpp：planner_interface.c
【Sequel Ace/Pro】苹果Mac电脑上免费的mysql管理工具 weixin_43343144 大数据
下载方式：appStore搜索下载【SequelAce】SequelAce|MySQL/MariaDBdatabasemanagementformacOSSequelPro
OpenCV 入门（六） —— Android 下的人脸识别 tmacfrank Android #NDK opencv android 人工智能
OpenCV入门系列：OpenCV入门（一）——OpenCV基础OpenCV入门（二）——车牌定位OpenCV入门（三）——车牌筛选OpenCV入门（四）——车牌号识别OpenCV入门（五）——人脸识别模型训练与Windows下的人脸识别OpenCV入门（六）——Android下的人脸识别OpenCV入门（七）——身份证识别本篇我们来介绍在Android下如何实现人脸识别。上一篇我们介绍了如何在W
Java基于SpringBoot的校园心声墙小程序（附源码，文档） stormjun 小程序毕业设计 java spring boot 小程序校园心声墙小程序
基于SpringBoot的校园心声墙小程序博主介绍：✌stormjun、8年大厂程序员经历。全网粉丝15w+、csdn博客专家、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌文末获取源码联系精彩专栏推荐订阅不然下次找不到哟Java项目精品实战案例《100套》Java微信小程序项目实战《100套》Python项目实战《100套》感兴趣的可以先收藏起来，还有大家
深度优先和广度优先【栈、堆前端举例】幸运小圣 JavaScript 前端算法数据结构
深度优先和广度优先：深度优先搜索（DFS）和广度优先搜索（BFS）是两种用于图和树遍历的算法，它们各自有不同的应用场景和特点。深度优先DFS：‌深度优先搜索（DFS）‌的核心思想是“深入探索，直至无路可走，然后再回溯”。它从起始节点开始，沿着一条路径一直遍历到最后一个节点，然后回溯到上一个节点继续遍历其他路径。DFS适合用于查找目标节点在深度较大的情况下，可以节省存储空间，但可能导致无限循环。DF
【八股】非关系型数据库篇（Redis+ES）林子漾八股项目 redis 数据库缓存
关系型和非关系型数据库特性关系型数据库(RDBMS)非关系型数据库(NoSQL)数据模型表格（行和列）文档、键值、列族、图等多样化模型模式固定（Schema）灵活的，无需预定义结构扩展性纵向扩展为主，横向扩展困难横向扩展容易，适合大规模分布式系统事务支持完全支持ACID事务多数不支持或仅支持单一操作的事务查询语言SQL各种API或NoSQL特定的查询语言数据一致性强一致性最终一致性或可调的一致性级
GO语言学习笔记——详细版码农之家★资源共享 golang 学习笔记
1.1.1.Go编译词法与语法分析意义:解析源代码文件,将文件中字符串序列转换成Token序列把执行词法分析的程序称为词法解析器(lexer)语法解析的结果就是抽象语法树(AST)每个AST都对应一个单独的Go语言文件,这个抽象语法树中包括当前文件属于的包名,定义的常量,结构体和函数等如果发生错误,被语法解析器发现并将消息打印在标准输出上,编译过程直接中止Go语言早期用lex做词法分析,后续还是使
python+flask计算机毕业设计基于Web的空巢老人服务系统的设计与实现（程序+开题+论文） node.js毕设小健 python flask 课程设计
本系统（程序+源码+数据库+调试部署+开发环境）带论文文档1万字以上，文末可获取，系统界面在最后面。系统程序文件列表开题报告内容研究背景随着社会的快速发展和人口老龄化的加剧，空巢老人群体日益庞大，成为社会关注的重点。空巢老人指的是子女离家后独自生活的老年人，他们面临着生活孤独、信息闭塞、健康管理不便等多重挑战。在传统家庭养老功能逐渐弱化的背景下，如何利用现代信息技术，特别是互联网技术，为空巢老人提
Golang：Go 1.23 版本新特性介绍梦想画家 #Golang golang
流行的编程语言Go已经发布了1.23版本，带来了许多改进、优化和新特性。在Go1.22发布六个月后，这次更新增强了工具链、运行时和库，同时保持了向后兼容性。Go1.23的新增特性主要包括语言特性、工具链改进、标准库更新等方面，以下是具体介绍1：语言特性新的迭代器语法：for-range循环中现在可以使用迭代器函数作为range表达式，如func(func(K)bool)。开发者能够为任意序列创建自
【Jetpack Compose】Color.kt 文件左侧没有显示颜色解决方法新镜 android Jetpack Compose
跟着B站学项目练习JetpackCompose的时候，发现我的Color.kt左侧没有显示颜色，网络搜索也没搜处理，只好出Plugin里输入color自己搜插件。看到这个安装即可在编辑器边缘显示颜色。
详解动态规划之01背包问题及其空间压缩(图文并茂+例题讲解) 看繁星aa 动态规划算法
1.动态规划问题的本质记忆化地暴力搜索所有可能性来得到问题的解我们常常会遇到一些问题，需要我们在n次操作，且每次操作有k种选择时，求出最终需要的最小或最大代价。处理类似的问题，我们一般需要遍历所有的可能性(相当于走一遍所有的路径)，然后找到我们所需要的解。很明显我们可以构成一棵“决策树”，假设n=2,k=3,那么：我们可以通过DFS或者BFS来遍历整棵树，从而搜寻到我们需要的结果。时间复杂度：O(
几种AI模型在算法工作中的使用测评——Grok3,Deepseek,Chatgpt,Kimi,Claude（持续更新）不断学习加努力算法 ai
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、Grok3二、Deepseek-R1三、Chatgpt-4o四、Kimi五、Claude-3.5总结前言在工作中现在已经离不开这AI模型了。于是我单开一个博客，记录在使用过程中的这几种模型使用感受。大家的感受也可以在评论区畅所欲言，我会抽空放进博客中。当然ai编程主要用的还是cluade3.5.一、Grok3嘿嘿，最吸
关系型数据库的技术思路编程之升级打怪数据库
一、网络协议需要根据TCP协议设计一个客户端和服务器之间的命令响应协议。1、服务端回复声明2、客户端发送登录包3、服务端返回登录结果4、登录成功后进入命令阶段，否则退出。二、每个连接用一个线程服务器为每个客户端连接开启一个线程。三、需要文件的随机读写需要方便的跳转到存储文件的指针。四、数据结构用B+树1、非叶子节点存放很多个关键字每个关键字递增排列。2、叶子节点存放关键字对应记录的文件存放指针。五
统一思想认识永夜-极光思想
1.统一思想认识的基础,才能有的放矢原因: 总有一种描述事物的方式最贴近本质,最容易让人理解. 如何让教育更轻松,在于找到最适合学生的方式. 难点在于,如何模拟对方的思维基础选择合适的方式. &
Joda Time使用笔记 bylijinnan java joda time
Joda Time的介绍可以参考这篇文章： http://www.ibm.com/developerworks/cn/java/j-jodatime.html 工作中也常常用到Joda Time，为了避免每次使用都查API，记录一下常用的用法： /** * DateTime变化（增减） */ @Tes
FileUtils API eksliang FileUtils FileUtils API
转载请出自出处：http://eksliang.iteye.com/blog/2217374 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
各种新兴技术不懂事的小屁孩技术
1:gradle Gradle 是以 Groovy 语言为基础，面向Java应用为主。基于DSL（领域特定语言）语法的自动化构建工具。现在构建系统常用到maven工具，现在有更容易上手的gradle，搭建java环境: http://www.ibm.com/developerworks/cn/opensource/os-cn-gradle/ 搭建android环境： http://m
tomcat6的https双向认证酷的飞上天空 tomcat6
1.生成服务器端证书 keytool -genkey -keyalg RSA -dname "cn=localhost,ou=sango,o=none,l=china,st=beijing,c=cn" -alias server -keypass password -keystore server.jks -storepass password -validity 36
托管虚拟桌面市场势不可挡蓝儿唯美
用户还需要冗余的数据中心，dinCloud的高级副总裁兼首席营销官Ali Din指出。该公司转售一个MSP可以让用户登录并管理和提供服务的用于DaaS的云自动化控制台，提供服务或者MSP也可以自己来控制。在某些情况下，MSP会在dinCloud的云服务上进行服务分层，如监控和补丁管理。 MSP的利润空间将根据其参与的程度而有所不同，Din说。 “我们有一些合作伙伴负责将我们推荐给客户作为个
spring学习——xml文件的配置 a-john spring
在Spring的学习中，对于其xml文件的配置是必不可少的。在Spring的多种装配Bean的方式中，采用XML配置也是最常见的。以下是一个简单的XML配置文件： <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.or
HDU 4342 History repeat itself 模拟 aijuans 模拟
来源：http://acm.hdu.edu.cn/showproblem.php?pid=4342 题意：首先让求第几个非平方数，然后求从1到该数之间的每个sqrt(i)的下取整的和。思路：一个简单的模拟题目，但是由于数据范围大，需要用__int64。我们可以首先把平方数筛选出来，假如让求第n个非平方数的话，看n前面有多少个平方数，假设有x个，则第n个非平方数就是n+x。注意两种特殊情况，即
java中最常用jar包的用途 asia007 java
java中最常用jar包的用途 jar包用途axis.jarSOAP引擎包commons-discovery-0.2.jar用来发现、查找和实现可插入式接口，提供一些一般类实例化、单件的生命周期管理的常用方法.jaxrpc.jarAxis运行所需要的组件包saaj.jar创建到端点的点到点连接的方法、创建并处理SOAP消息和附件的方法，以及接收和处理SOAP错误的方法. w
ajax获取Struts框架中的json编码异常和Struts中的主控制器异常的解决办法百合不是茶 js json编码返回异常
一:ajax获取自定义Struts框架中的json编码出现以下问题: 1,强制flush输出 json编码打印在首页 2, 不强制flush js会解析json 打印出来的是错误的jsp页面却没有跳转到错误页面 3, ajax中的dataType的json 改为text 会
JUnit使用的设计模式 bijian1013 java 设计模式 JUnit
JUnit源代码涉及使用了大量设计模式 1、模板方法模式（Template Method）定义一个操作中的算法骨架，而将一些步骤延伸到子类中去，使得子类可以不改变一个算法的结构，即可重新定义该算法的某些特定步骤。这里需要复用的是算法的结构，也就是步骤，而步骤的实现可以在子类中完成。
Linux常用命令（摘录） sunjing crond chkconfig
chkconfig --list 查看linux所有服务 chkconfig --add servicename 添加linux服务 netstat -apn | grep 8080 查看端口占用 env 查看所有环境变量 echo $JAVA_HOME 查看JAVA_HOME环境变量安装编译器 yum install -y gcc
【Hadoop一】Hadoop伪集群环境搭建 bit1129 hadoop
结合网上多份文档，不断反复的修正hadoop启动和运行过程中出现的问题，终于把Hadoop2.5.2伪分布式安装起来，跑通了wordcount例子。Hadoop的安装复杂性的体现之一是，Hadoop的安装文档非常多，但是能一个文档走下来的少之又少，尤其是Hadoop不同版本的配置差异非常的大。Hadoop2.5.2于前两天发布，但是它的配置跟2.5.0，2.5.1没有分别。 &nb
Anychart图表系列五之事件监听白糖_ chart
创建图表事件监听非常简单：首先是通过addEventListener('监听类型',js监听方法)添加事件监听，然后在js监听方法中定义具体监听逻辑。以钻取操作为例，当用户点击图表某一个point的时候弹出point的name和value，代码如下： <script> //创建AnyChart var chart = new AnyChart(); //添加钻取操作&quo
Web前端相关段子 braveCS web前端
Web标准：结构、样式和行为分离使用语义化标签 0）标签的语义：使用有良好语义的标签，能够很好地实现自我解释，方便搜索引擎理解网页结构，抓取重要内容。去样式后也会根据浏览器的默认样式很好的组织网页内容，具有很好的可读性，从而实现对特殊终端的兼容。 1）div和span是没有语义的：只是分别用作块级元素和行内元素的区域分隔符。当页面内标签无法满足设计需求时，才会适当添加div
编程之美-24点游戏 bylijinnan 编程之美
import java.util.ArrayList; import java.util.Arrays; import java.util.HashSet; import java.util.List; import java.util.Random; import java.util.Set; public class PointGame { /**编程之美
主页面子页面传值总结 chengxuyuancsdn 总结
1、showModalDialog returnValue是javascript中html的window对象的属性,目的是返回窗口值,当用window.showModalDialog函数打开一个IE的模式窗口时,用于返回窗口的值主界面 var sonValue=window.showModalDialog("son.jsp"); 子界面 window.retu
[网络与经济]互联网+的含义 comsci 互联网+
互联网+后面是一个人的名字 = 网络控制系统互联网+你的名字 = 网络个人数据库每日提示:如果人觉得不舒服,千万不要外出到处走动,就呆在床上,玩玩手游,更不能够去开车,现在交通状况不
oracle 创建视图 with check option daizj 视图 view oralce
我们来看下面的例子： create or replace view testview as select empno,ename from emp where ename like ‘M%’ with check option; 这里我们创建了一个视图，并使用了with check option来限制了视图。然后我们来看一下视图包含的结果： select * from testv
ToastPlugin插件在cordova3.3下使用 dibov Cordova
自己开发的Todos应用，想实现“ 再按一次返回键退出程序 ”的功能，采用网上的ToastPlugins插件，发现代码或文章基本都是老版本，运行问题比较多。折腾了好久才弄好。下面吧基于cordova3.3下的ToastPlugins相关代码共享。 ToastPlugin.java package&nbs
C语言22个系统函数 dcj3sjt126com c function
C语言系统函数一、数学函数下列函数存放在math.h头文件中Double floor(double num) 求出不大于num的最大数。Double fmod(x, y) 求整数x/y的余数。Double frexp(num, exp); double num; int *exp; 将num分为数字部分（尾数）x和以2位的指数部分n，即num=x*2n，指数n存放在exp指向的变量中，返回x。D
开发一个类的流程 dcj3sjt126com 开发
本人近日根据自己的开发经验总结了一个类的开发流程。这个流程适用于单独开发的构件，并不适用于对一个项目中的系统对象开发。开发出的类可以存入私人类库，供以后复用。以下是开发流程： 1. 明确类的功能，抽象出类的大概结构 2. 初步设想类的接口 3. 类名设计（驼峰式命名） 4. 属性设置(权限设置) 判断某些变量是否有必要作为成员属
java 并发 shuizhaosi888 java 并发
能够写出高伸缩性的并发是一门艺术在JAVA SE5中新增了3个包 java.util.concurrent java.util.concurrent.atomic java.util.concurrent.locks 在java的内存模型中，类的实例字段、静态字段和构成数组的对象元素都会被多个线程所共享，局部变量与方法参数都是线程私有的，不会被共享。
Spring Security（11）——匿名认证 234390216 Spring Security ROLE_ANNOYMOUS 匿名
匿名认证目录 1.1 配置 1.2 AuthenticationTrustResolver 对于匿名访问的用户，Spring Security支持为其建立一个匿名的AnonymousAuthenticat
NODEJS项目实践0.2[ express,ajax通信...] 逐行分析JS源代码 Ajax nodejs express
一、前言通过上节学习，我们已经 ubuntu系统搭建了一个可以访问的nodejs系统，并做了nginx转发。本节原要做web端服务及 mongodb的存取，但写着写着，web端就
在Struts2 的Action中怎样获取表单提交上来的多个checkbox的值 lhbthanks java html struts checkbox
第一种方法：获取结果String类型在 Action 中获得的是一个 String 型数据，每一个被选中的 checkbox 的 value 被拼接在一起，每个值之间以逗号隔开(,)。所以在 Action 中定义一个跟 checkbox 的 name 同名的属性来接收这些被选中的 checkbox 的 value 即可。以下是实现的代码：前台 HTML 代码：
003.Kafka基本概念 nweiren hadoop kafka
Kafka基本概念：Topic、Partition、Message、Producer、Broker、Consumer。 Topic：消息源（Message）的分类。 Partition： Topic物理上的分组，一
Linux环境下安装JDK roadrunners jdk linux
1、准备工作创建JDK的安装目录： mkdir -p /usr/java/ 下载JDK，找到适合自己系统的JDK版本进行下载： http://www.oracle.com/technetwork/java/javase/downloads/index.html 把JDK安装包下载到/usr/java/目录，然后进行解压： tar -zxvf jre-7
Linux忘记root密码的解决思路 tomcat_oracle linux
1：使用同版本的linux启动系统，chroot到忘记密码的根分区passwd改密码　　2：grub启动菜单中加入init=/bin/bash进入系统，不过这时挂载的是只读分区。根据系统的分区情况进一步判断. 　　3: grub启动菜单中加入 single以单用户进入系统. 　　4:用以上方法mount到根分区把/etc/passwd中的root密码去除　　例如: 　　ro
跨浏览器 HTML5 postMessage 方法以及 message 事件模拟实现 xueyou jsonp jquery 框架 UI html5
postMessage 是 HTML5 新方法，它可以实现跨域窗口之间通讯。到目前为止，只有 IE8+, Firefox 3, Opera 9, Chrome 3和 Safari 4 支持，而本篇文章主要讲述 postMessage 方法与 message 事件跨浏览器实现。postMessage 方法 JSONP 技术不一样，前者是前端擅长跨域文档数据即时通讯，后者擅长针对跨域服务端数据通讯，p

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他