dearbaba_8520

Xpath语法格式整理

原文地址为： Xpath语法格式整理

经常在工作中会使用到XPath的相关知识，但每次总会在一些关键的地方不记得或不太清楚，所以免不了每次总要查一些零碎的知识，感觉即很烦又浪费时间，所以对XPath归纳及总结一下。

在这篇文章中你将能学习到：

XPath简介
XPath 路径表达式详解
XPath在DOM，XSLT及XQuery中的应用

XPath简介

XPath是W3C的一个标准。它最主要的目的是为了在XML1.0或XML1.1文档节点树中定位节点所设计。目前有XPath1.0和XPath2.0两个版本。其中Xpath1.0是1999年成为W3C标准，而XPath2.0标准的确立是在2007年。W3C关于XPath的英文详细文档请见：http://www.w3.org/TR/xpath20/ 。

XPath是一种表达式语言，它的返回值可能是节点，节点集合，原子值，以及节点和原子值的混合等。XPath2.0是XPath1.0的超集。它是对XPath1.0的扩展，它可以支持更加丰富的数据类型，并且XPath2.0保持了对XPath1.0的相对很好的向后兼容性，几乎所有的XPath2.0的返回结果都可以和XPath1.0保持一样。另外XPath2.0也是XSLT2.0和XQuery1.0的用于查询定位节点的主表达式语言。XQuery1.0是对XPath2.0的扩展。关于在XSLT和XQuery中使用XPath表达式定位节点的知识在后面的实例中会有所介绍。

在学习XPath之前你应该对XML的节点，元素，属性，原子值（文本），处理指令，注释，根节点（文档节点），命名空间以及对节点间的关系如：父（Parent），子（Children），兄弟（Sibling），先辈（Ancestor），后代（Descendant）等概念有所了解。这里不在说明。

XPath路径表达式

在本小节下面的内容中你将可以学习到：

路径表达式语法
相对/绝对路径
表达式上下文
谓词（筛选表达式）及轴的概念
运算符及特殊字符
常用表达式实例
函数及说明

这里给出一个实例Xml文件。下面的说明及实例都是基于该XML文件。

gukaitong@gmail.com anonymous@gmail.com

111@gmail.com

222@gmail.com

aaa@gmail.com

bbb@gmail.com

ccc@gmail.com

This is a sample 2008-12-11T12:00:00Z Are you interested in? anonymous@gmail.com gukaitong@gmail.com We strongly recommend the following books Professional C# 2008 USA 37.79 2007 Microsoft Visual C# 2008 Step by Step USA 26.39 2008 C# in Depth USA 29.69 2006 Thinking in Java USA 23.69 2004 333@gmail.com 444@gmail.com No title

路径表达式语法：
1. 路径 = 相对路径 | 绝对路径
2. XPath路径表达式 = 步进表达式 | 相对路径 "/"步进表达式。
3. 步进表达式=轴节点测试谓词

说明：

其中轴表示步进表达式选择的节点和当前上下文节点间的树状关系（层次关系），节点测试指定步进表达式选择的节点名称扩展名，谓词即相当于过滤表达式以进一步过滤细化节点集。
谓词可以是0个或多个。多个多个谓词用逻辑操作符and， or连接。取逻辑非用not()函数。

请看一个典型的XPath查询表达式：/messages/message//child::node()[@id=0]，其中/messages/message是路径（绝对路径以"/"开始），child::是轴表示在子节点下选择，node()是节点测试表示选择所有的节点。[@id=0]是谓词，表示选择所有有属性id并且值为0的节点。

相对路径与绝对路径：

如果"/"处在XPath表达式开头则表示文档根元素，（表达式中间作为分隔符用以分割每一个步进表达式）如：/messages/message/subject是一种绝对路径表示法，它表明是从文档根开始查找节点。假设当前节点是在第一个message节点【/messages/message[1]】，则路径表达式subject（路径前没有"/"）这种表示法称为相对路径，表明从当前节点开始查找。具体请见下面所述的"表达式上下文"。

表达式上下文（Context）:

上下文其实表示一种环境。以明确当前XPath路径表达式处在什么样的环境下执行。例如同样一个路径表达式处在对根节点操作的环境和处在对某一个特定子节点操作的环境下执行所获得的结果可能是完全不一样的。也就是说XPath路径表达式计算结果取决于它所处的上下文。

XPath上下文基本有以下几种：

当前节点(./)：
如./sender表示选择当前节点下的sender节点集合（等同于下面所讲的"特定元素"，如：sender）
父节点(../)：
如../sender表示选择当前节点的父节点下的sender节点集合
根元素（/）：
如/messages表示选择从文档根节点下的messages节点集合.
根节点（/*）：
这里的*是代表所有节点，但是根元素只有一个，所以这里表示根节点。/*的返回结果和/messages返回的结果一样都是messages节点。
递归下降（//）:
如当前上下文是messages节点。则//sender将返回以下结果：
/messages//sender :
gkt1980@gmail.com
111@gmail.com
333@gmail.com

/messages/message[1]//sender:
gkt1980@gmail.com
111@gmail.com

我们可以看出XPath表达式返回的结果是：从当前节点开始递归步进搜索当前节点下的所有子节点找到满足条件的节点集。
特定元素
如sender：表示选择当前节点下的sender节点集合，等同于（./sender）

注意：在执行XPath时一定要注意上下文。即当前是在哪个节点下执行XPath表达式。这在XMLDOM中很重要。如：在XMLDOM中的selectNodes,selectSingleNode方法的参数都是一个XPath表达式，此时这个XPath表达式的执行上下文就是调用这个方法的节点及它所在的环境。更多信息请参见：http://www.w3.org/TR/xpath20/

谓词（筛选表达式）及轴的概念：

XPath的谓词即筛选表达式，类似于SQL的where子句.

轴名称	结果
ancestor	选取当前节点的所有先辈（父、祖父等）
ancestor-or-self	选取当前节点的所有先辈（父、祖父等）以及当前节点本身
attribute	选取当前节点的所有属性
child	选取当前节点的所有子元素。
descendant	选取当前节点的所有后代元素（子、孙等）。
descendant-or-self	选取当前节点的所有后代元素（子、孙等）以及当前节点本身。
following	选取文档中当前节点的结束标签之后的所有节点。
namespace	选取当前节点的所有命名空间节点
parent	选取当前节点的父节点。
preceding	直到所有这个节点的父辈节点，顺序选择每个父辈节点前的所有同级节点
preceding-sibling	选取当前节点之前的所有同级节点。
self	选取当前节点。

运算符及特殊字符：

运算符/特殊字符	说明
/	此路径运算符出现在模式开头时，表示应从根节点选择。
//	从当前节点开始递归下降，此路径运算符出现在模式开头时，表示应从根节点递归下降。
.	当前上下文。
..	当前上下文节点父级。
*	通配符；选择所有元素节点与元素名无关。（不包括文本，注释，指令等节点，如果也要包含这些节点请用node()函数）
@	属性名的前缀。
@*	选择所有属性，与名称无关。
:	命名空间分隔符；将命名空间前缀与元素名或属性名分隔。
( )	括号运算符(优先级最高)，强制运算优先级。
[ ]	应用筛选模式（即谓词，包括"过滤表达式"和"轴（向前/向后）"）。
[ ]	下标运算符；用于在集合中编制索引。
\|	两个节点集合的联合，如：//messages/message/to \| //messages/message/cc
-	减法。
div，	浮点除法。
and, or	逻辑运算。
mod	求余。
not()	逻辑非
=	等于
！=	不等于
特殊比较运算符	< 或者 < <= 或者 <= > 或者 > >= 或者 >= 需要转义的时候必须使用转义的形式，如在XSLT中，而在XMLDOM的scripting中不需要转义。

常用表达式实例：

/	Document Root文档根.
/*	选择文档根下面的所有元素节点，即根节点（XML文档只有一个根节点）
/node()	根元素下所有的节点（包括文本节点，注释节点等）
/text()	查找文档根节点下的所有文本节点
/messages/message	messages节点下的所有message节点
/messages/message[1]	messages节点下的第一个message节点
/messages/message[1]/self::node()	第一个message节点（self轴表示自身，node()表示选择所有节点）
/messages/message[1]/node()	第一个message节点下的所有子节点
/messages/message[1]/*[last()]	第一个message节点的最后一个子节点
/messages/message[1]/[last()]	Error，谓词前必须是节点或节点集
/messages/message[1]/node()[last()]	第一个message节点的最后一个子节点
/messages/message[1]/text()	第一个message节点的所有子节点
/messages/message[1]//text()	第一个message节点下递归下降查找所有的文本节点（无限深度）
/messages/message[1] /child::node() /messages/message[1] /node() /messages/message[position()=1]/node() //message[@id=1] /node()	第一个message节点下的所有子节点
//message[@id=1] //child::node()	递归所有子节点（无限深度）
//message[position()=1]/node()	选择id=1的message节点以及id=0的message节点
/messages/message[1] /parent::*	Messages节点
/messages/message[1]/body/attachments/parent::node() /messages/message[1]/body/attachments/parent::* /messages/message[1]/body/attachments/..	attachments节点的父节点。父节点只有一个,所以node()和* 返回结果一样。（..也表示父节点. 表示自身节点）
//message[@id=0]/ancestor::*	Ancestor轴表示所有的祖辈，父，祖父等。向上递归
//message[@id=0]/ancestor-or-self::*	向上递归,包含自身
//message[@id=0]/ancestor::node()	对比使用*,多一个文档根元素(Document root)
/messages/message[1]/descendant::node() //messages/message[1]//node()	递归下降查找message节点的所有节点
/messages/message[1]/sender/following::*	查找第一个message节点的sender节点后的所有同级节点，并对每一个同级节点递归向下查找。
//message[@id=1]/sender/following-sibling::*	查找id=1的message节点的sender节点的所有后续的同级节点。
//message[@id=1]/datetime/@date	查找id=1的message节点的datetime节点的date属性
//message[@id=1]/datetime[@date] //message/datetime[attribute::date]	查找id=1的message节点的所有含有date属性的datetime节点
//message[datetime]	查找所有含有datetime节点的message节点
//message/datetime/attribute::* //message/datetime/attribute::node() //message/datetime/@*	返回message节点下datetime节点的所有属性节点
//message/datetime[attribute::] //message/datetime[attribute::node()] //message/datetime[@] //message/datetime[@node()]	选择所有含有属性的datetime节点
//attribute::*	选择根节点下的所有属性节点
//message[@id=0]/body/preceding::node()	顺序选择body节点所在节点前的所有同级节点。（查找顺序为：先找到body节点的顶级节点（根节点）,得到根节点标签前的所有同级节点，执行完成后继续向下一级，顺序得到该节点标签前的所有同级节点，依次类推。）注意：查找同级节点是顺序查找，而不是递归查找。
//message[@id=0]/body/preceding-sibling::node()	顺序查找body标签前的所有同级节点。（和上例一个最大的区别是：不从最顶层开始到body节点逐层查找。我们可以理解成少了一个循环，而只查找当前节点前的同级节点）
//message[@id=1]//*[namespace::amazon]	查找id=1的所有message节点下的所有命名空间为amazon的节点。
//namespace::*	文档中的所有的命名空间节点。（包括默认命名空间xmlns:xml）
//message[@id=0]//books/*[local-name()='book']	选择books下的所有的book节点，注意：由于book节点定义了命名空间.若写成//message[@id=0]//books/book则查找不出任何节点。
//message[@id=0]//books/*[local-name()='book' and namespace-uri()='http://www.amazon.com/books/schema']	选择books下的所有的book节点，(节点名和命名空间都匹配)
//message[@id=0]//books/*[local-name()='book'][year>2006]	选择year节点值>2006的book节点
//message[@id=0]//books/*[local-name()='book'][1]/year>2006	指示第一个book节点的year节点值是否大于2006. 返回xs:boolean: true

函数及说明：

值得欣喜的是XPath函数和XSLT，XQuery等共享函数库，函数库为我们提供了功能丰富的各种函数的调用，我们也可以自定义自己的函数。这里不再对每个函数的用法逐一说明，英文好点的朋友直接去看看w3关于XPath函数的介绍吧：http://www.w3.org/TR/xquery-operators 。中文的可以参考这个网站, http://www.w3school.com.cn/xpath/xpath_functions.asp

XPath在DOM,XSLT及XQuery中的应用

DOM：

XPath Test

注意：

我们若使用new ActiveXObject("Microsoft.XMLDOM")则需要注意的是：因为早期的XMLDOM的SelectionLanguage属性默认是正则表达式，不是XPath语言。所以需要指定这样一条语句xmlDoc.setProperty("SelectionLanguage", "XPath"); 以支持XPath查询表达式。.

若没有指定SelectionLanguage属性值为XPath则要注意以下情况：

数组下标从0开始（我们知道在XPath查询表达式中数组下标是从1开始的）
不支持在XPath查询表达式中使用XPath函数。

转载请注明本文地址： Xpath语法格式整理

python基础题目练习19 码卡巴卡bug python 算法数据结构
说反话-加强版给定一句英语，要求你编写程序，将句中所有单词的顺序颠倒输出。输入格式：测试输入包含一个测试用例，在一行内给出总长度不超过500000的字符串。字符串由若干单词和若干空格组成，其中单词是由英文字母（大小写有区分）组成的字符串，单词之间用若干个空格分开。输出格式：每个测试用例的输出占一行，输出倒序后的句子，并且保证单词间只有1个空格。输入样例：HelloWorldHereICome输出样
配置文件对比工具 foolishboy_w 开发工具提效小工具服务器 json
配置文件对比工具文章目录配置文件对比工具Introdutiongit地址QuickStart1.下载源码，获取可执行的jar包2.执行jar包，对比文件3.执行结果说明Introdutionconfig-compare是一个小工具，你可以使用它来对比配置文件。目前支持的配置文件格式有yaml、yml、properties以及json，甚至你可以对比两个类型不同的文件，比如yml和json。git地
Pika 技术浅析（二）：文本编码爱研究的小牛 AIGC—视频 AIGC—预处理 AIGC—自然语言处理人工智能算法 AIGC 深度学习数据预处理
在Pika的视频生成过程中，文本编码是至关重要的一步，它将用户输入的自然语言文本转换为机器可以理解的向量表示。这一步骤不仅影响生成视频的质量，还决定了视频与文本描述的匹配度。1.基本原理1.1文本编码的目的文本编码的目的是将自然语言文本转换为机器可以理解的向量表示。这些向量需要捕捉文本的语义信息和语法结构，以便在后续的视频生成过程中，模型能够根据这些向量生成与文本描述高度匹配的视频内容。1.2Tr
PAT乙级(1111 对称日)C语言白羊不吃白菜 C语言机试合集 c语言算法开发语言
文章目录1111对称日输入格式输出格式输入样例：输出样例代码示例1111对称日央视新闻发了一条微博，指出2020年有个罕见的“对称日”，即2020年2月2日，按照年年年年月月日日格式组成的字符串20200202是完全对称的。给定任意一个日期，本题就请你写程序判断一下，这是不是一个对称日？输入格式输入首先在第一行给出正整数N（1#include//将月份缩写转换为数字intmonthToNum(ch
快瞳通用文档解析技术是怎样赋能下游各类大语言模型任务？深圳市快瞳科技有限公司语言模型 easyui 人工智能
、为什么不直接用大模型去解析文档？在文档、票据结构化识别这个赛道上，大语言模型存在天然的局限性：1.结构化数据生成效率低大模型在处理表格、公式等结构化内容时，需消耗大量计算资源，生成速度慢且成本高昂。例如，生成复杂表格可能导致响应延迟或格式错误。2.幻觉与准确性不足大模型可能虚据（如编造表格内容）或偏离文档原意，尤其在处理专业领域文档时，缺乏对上下文和实体关系的精准把控。3.格式兼容性差大模型难以
JavaScript中的主要知识点 C7211BA javascript okhttp 开发语言
一、基础语法与数据类型变量声明使用var（函数作用域）、let（块级作用域）和const（常量）声明变量，理解变量提升与暂时性死区。数据类型分为基本类型（Undefined、Null、Boolean、Number、String、Symbol、BigInt）和引用类型（Object、Array、Function）。注意类型转换规则（如==与===的区别）。运算符与控制流程包括算术、比较、逻辑运算符，
ue5.5崩溃报gpu错误快速修复注册表命令方法 Maya和blender动画技术 ue5 ue5.5崩溃报gpu错误
网上已经有很多方法了，自己写了个regedit比处理dos批处理命令，启动时需要win管理员身份拷贝后，将以下代码，保存为run.bat格式批处理文件，右键鼠标，在弹出菜单中，选择用管理员身份运行。即可。南无阿弥陀佛。命令如下：::如果存在先删除原来变量，如下：regdeleteHKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\Graphics
反内卷，大疆强制21点下班；网易数智回应“关闭公有云”传闻；ChatGPT成为全球职场最受欢迎AI工具 | 极客头条极客日报 chatgpt 人工智能
「极客头条」——技术人员的新闻圈！CSDN的读者朋友们好，「极客头条」来啦，快来看今天都有哪些值得我们技术人关注的重要新闻吧。整理|苏宓出品|CSDN（ID：CSDNnews）一分钟速览新闻点！反内卷，消息称大疆开始实施的“强制9点下班”政策网易数智回应“关闭公有云”传闻：公司业务正常运营，蜂巢只是其中一个模块国家超算互联网平台QwQ-32BAPI接口服务上线，免费提供100万Tokens西湖大学
高速PCB设计(布线设计) 四代目水门高速PCB设计学习笔记 fpga开发嵌入式硬件 pcb工艺
以下是针对高速PCB布线设计的综合笔记，结合用户提供的设计规范及行业通用原则整理而成：一、关键信号布线原则布线优先级顺序：射频信号＞中/低频信号＞时钟信号＞高速信号射频信号需包地处理，线宽≥8mil且满足阻抗要求，禁止无关信号穿越射频区域阻抗控制优先选择地平面作为参考层，线宽/间距按工艺计算结果严格控制5G以上高速信号需在过孔处增加回流地孔拓扑结构DDR2以下用T型拓扑，DDR3以上建议菊花链拓扑
Linux下C语言文件IO 标准IO相关命令芯片烧毁大师 linux c语言运维
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档Linux下C语言文件IO标准IO相关命令前言一、标准IO和文本IO指令文本IO指令常用指令如下openwritereadcloselseek标准IOfopenfwritefreadfclosefseek总结前言整理了下相关指令。多多支持，一起学习进步提示：以下是本篇文章正文内容，下面案例可供参考一、标准IO和文本IO指令相对比下进行
python中format函数 weixin_30646315 python
---恢复内容开始---python中format函数用于字符串的格式化通过关键字1print('{名字}今天{动作}'.format(名字='陈某某',动作='拍视频'))#通过关键字2grade={'name':'陈某某','fenshu':'59'}3print('{name}电工考了{fenshu}'.format(**grade))#通过关键字，可用字典当关键字传入值时，在字典前加**即
Pyhton网络编程_UDP_TCP(IP地址--端口--socket编程) Felix-微信(Felixzfb) 网络编程 TCP UDP
Python高级语法——网络编程——进阶学习笔记项目中案例参考：https://github.com/FangbaiZhang/Python_advanced_learning/tree/master/03_Python_network_programming1网络通信使用网络能够把多方链接在一起，然后可以进行数据传递所谓的网络编程就是，让在不同的电脑上的软件能够进行数据传递，即进程之间的通信1.
python学习，Windows图标一键替换工具开发详解木木黄木木 python 学习 windows
Windows图标一键替换工具开发详解项目概述本项目是一个基于Python开发的Windows图标一键替换工具，提供了简单易用的图形界面，让用户能够轻松地替换Windows系统中的回收站图标、快捷方式图标以及应用程序图标。功能特点支持三种图标替换模式：回收站图标替换桌面快捷方式图标替换系统应用程序图标替换图标预览功能：实时预览选择的图标支持缩放预览支持多种图片格式（ICO、PNG、JPEG等）便捷
Ruff：极速的Python代码检查工具 python二级小助手 python 开发语言
随着开发工具的不断进步，Python社区终于迎来了一个突破性的新工具——Ruff。这是一个由Rust编写的Python代码检查和格式化工具，致力于比现有的工具（如Flake8、Black）快10到100倍，并且集成了更多功能。无论你是Python开发者，还是开源项目的维护者，Ruff都能带给你惊人的提升。Ruff是什么？Ruff是一个极快的Python代码检查器和格式化工具，使用Rust语言编写，
AF3 squeeze_features函数解读 qq_27390023 pytorch 深度学习人工智能生物信息学
AlphaFold3data_transforms模块的squeeze_features函数的作用去除蛋白质特征张量中不必要的单维度（singletondimensions）和重复维度，以使其适配AlphaFold3预期的输入格式。源代码：defsqueeze_features(protein):"""Removesingletonandrepeateddimensionsinproteinfea
Java基础系列：深入解析抽象类、接口与Lambda表达式及避坑指南 JouJz java 开发语言
目录一、抽象类：半成品的艺术1.核心特征解析2.典型应用场景3.三大经典陷阱陷阱1：尝试实例化抽象类陷阱2：未实现全部抽象方法陷阱3：构造方法调用可覆盖方法二、接口：行为契约的进化1.接口的现代形态（Java8+）2.接口与抽象类对比3.五大核心陷阱陷阱1：默认方法冲突陷阱2：常量隐藏陷阱3：静态方法陷阱陷阱4：函数式接口误用陷阱5：接口演化风险三、Lambda表达式：简洁之美与暗礁1.核心语法全
IntelliJ IDEA 快捷键全解析：让你的开发效率翻倍！ Leaton Lee intellij-idea java ide
引言：为什么学习IDEA快捷键？作为一名Java开发者，IntelliJIDEA是你每天都会使用的工具。而掌握IDEA的快捷键，就像是为你的开发之旅装上了一对“翅膀”！想象一下，当你在编码时，手指不需要离开键盘，就能完成代码补全、跳转到目标类、格式化代码甚至调试程序。这些快捷操作不仅能让你的效率翻倍，还能让你在团队中显得更加专业！在这篇文章中，我将为你详细讲解IDEA中最常用的快捷键，从代码补全到
【自学笔记】R语言基础知识点总览-持续更新 Long_poem 笔记 r语言开发语言
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录R语言基础知识点总览1.R语言简介2.R语言安装与环境配置3.R语言基础语法3.1数据类型3.2向量与矩阵3.3数据框与列表4.控制结构4.1条件语句4.2循环结构5.函数6.数据可视化总结R语言基础知识点总览1.R语言简介R是一种用于统计计算和图形的编程语言和软件环境。R语言由RossIhaka和RobertGentlema
【自学笔记】Python的基础知识点总览-持续更新 Long_poem Python python 笔记开发语言
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录Python基础知识总览1.Python简介2.安装与环境配置3.基本语法3.1变量与数据类型3.2控制结构3.3函数与模块3.4文件操作4.面向对象编程（OOP）5.异常处理6.高级特性7.标准库与第三方库8.实践项目总结Python基础知识总览1.Python简介解释型语言：Python是一种解释型、高级编程、通用型编程语
Python中的format格式化、填充与对齐、数字格式化方式五月天的尾巴 python format格式化填充与对齐
文章目录一、format语法二、format格式化的用法2.1、按照先后顺序替换{}2.2、按照索引进行匹配替换{0}2.3、按关键字索引进行匹配替换2.4、通过列表索引格式化字符串2.5、使用元组2.6、通过字典设置格式化字符串2.7、混合使用三、字符串填充与对齐3.1、左对齐及填充3.2、右对齐及填充3.3、居中对齐及填充四、格式化4.1、格式化数字4.2、格式化日期和时间五、format()
前端学习——CSS W起名有点难学习笔记前端学习 css
CSSCSS（CascadingStyleSheets）级联样式表语法选择器全局选择器元素选择器类选择器ID选择器合并选择器选择器的优先级字体属性字体颜色背景属性background-color属性background-image属性background-repeat属性background-size属性background-position属性文本属性text-aligntext-decorat
深度学习-144-Text2SQL之基于langchain的少量样本提示词模板FewShotPromptTemplate的应用实战(三) 皮皮冰燃深度学习深度学习 langchain Text2SQL
文章目录1基本组件1.1大模型1.2数据库Chinook1.2.1创建并载入数据1.2.2SQLDatabase2年龄最大的员工姓名和年龄3少量样本提示词模板3.1创建示例集3.2创建格式化程序3.3创建示例选择器3.4创建少量示例提示词模板3.5应用测试3.6添加新示例4参考附录1基本组件1.1大模型fromlangchain_ollamaimportChatOllamaimportosos.e
python爬虫（7）爬虫实例（3）丁叔叔爬虫实例
#-*-coding:utf-8-*-importrequestsimportosfromlxmlimportetree#解析库XPath#在本地建立一个文件夹，命名为pic_truck，用于存放下载的图片folder='pic_truck'ifnotos.path.exists(folder):os.makedirs(folder)#定义下载函数，用于下载图片defdownload(url):r
python：print语句中插入水平制表符\t来对齐内容听海边涛声 python 开发语言
说明\t是水平制表符，就是键盘上的tab键。print语句中插入水平制表符\t来对齐内容，使得打印出来的内容格式漂亮。下面以在pycharm中的打印进行演示。在print语句中，如果插入\t，相当于插入多少空格不是固定的，跟\t前面有多个字符有关系：情况1：如果前面字符数不是4的倍数，那么\t的作用是插入一定数量的空格，补足到4的倍数。例如，如果前面有1个字符，那么\t就是插入3个空格；如果前面有
一维数组基础（题目+答案）电摇小人 #C++的各种算法及习题算法数据结构 c++开发语言
第1题反向输出时限：1s空间：256m输入n个数，要求程序按输入时的逆序把这n个数打印出来，已知整数不超过100个。也就是说，按输入相反顺序打印这n个数。输入格式第一行：一个整数n，代表n个数；第二行：n个数的具体数值，每个数之间用空格隔开。输出格式一行，共有n个数，每个数之间用一个空格隔开。输入/输出例子1输入：517345输出：54371作答区域#includeusingnamespacest
什么是 YAML及OCP、IBM CP4BA中的YAML文件解析自由鬼运维技术 IT应用探讨 IBM产品技术服务器前端数据库 ocp cp4ba ibm
YAML(YAMLAin'tMarkupLanguage)是一种人类友好的数据序列化格式。它的设计目标是易于人类阅读和编写，同时也易于机器解析和生成。YAML常用于配置文件、数据交换以及跨语言数据持久化等场景。一、YAML介绍1、YAML的主要特点：易于阅读：YAML语法简洁明了，使用缩进和符号来表示数据结构，避免了像XML那样繁琐的标签，以及像JSON那样大量的花括号和方括号。数据序列化：YAM
用AI学编程4——swift学习1 AnalogElectronic swift 学习 ssh
一个swift文件，整理出swift从入门到精通的所有知识点，给出注释，给出这样的swift文件以下是一个整合了Swift从入门到精通的主要知识点的Swift文件，包含了基础语法、面向对象编程、异常处理、集合框架、多线程、Lambda表达式等内容，并添加了注释以帮助理解：/***Swift学习整合文件*包含Swift从入门到精通的主要知识点，包括基础语法、面向对象编程、异常处理、集合框架、多线程、
2021-09-09【linux】丨shell使用for循环遍历文件/数组穆易青数据处理读书笔记生物信息 linux python 正则表达式
目录摘要for循环遍历文件使用方法方法一方法二总结摘要在日常生信分析过程中，分析员或多或少会使用for循环批量处理样品或者分组。这里我简单整理一下自己常用的两种遍历方法。for循环遍历文件使用方法方法一对于在同一个文件内的所有样品，使用ls可以遍历该文件夹内的所有文件名。foriin`ls./`;doecho${i}done<
关于 Scapy 的详细介绍、安装指南、使用方法及配置说明程序员的世界你不懂效率工具提升百度新浪微博
一、Scapy简介Scapy是一个开源的Python库，专注于网络数据包的创建、嗅探、分析和注入。它支持几乎所有标准的网络协议（如IP、TCP、UDP、ICMP、ARP等），并提供灵活的扩展机制，可自定义协议字段或开发专用工具。核心特点：跨平台：支持Linux、Windows、macOS等操作系统。低层级操作：直接访问原始数据包的二进制格式。强大的过滤与分析：支持BPF表达式过滤数据包。脚本化：可
linux怎么做raid0,Linux创建RAID0_实战耿直GG linux怎么做raid0
Linux创建RAID实战一、Linux创建RAID0RAID0俗称条带，它将两个或多个硬盘组成一个逻辑硬盘，容量是所有硬盘之和因为是多个硬盘组合成一个，故可并行写操作，写入速度提高，但此方式硬盘数据没有冗余，没有容错，一旦一个物理硬盘损坏，则所有数据均丢失RAID0适合于对数据量大，但安全性要求不高的场景，比如音像、视频文件的存储等二、创建RAID0，并格式化、挂载使用添加两块10G的虚拟硬盘[
java数字签名三种方式知了ing java jdk
以下3钟数字签名都是基于jdk7的 1，RSA String password="test"; // 1.初始化密钥 KeyPairGenerator keyPairGenerator = KeyPairGenerator.getInstance("RSA"); keyPairGenerator.initialize(51
Hibernate学习笔记 caoyong Hibernate
1>、Hibernate是数据访问层框架，是一个ORM(Object Relation Mapping)框架，作者为:Gavin King 2>、搭建Hibernate的开发环境 a>、添加jar包: aa>、hibernatte开发包中/lib/required/所
设计模式之装饰器模式Decorator（结构型）漂泊一剑客 Decorator
1. 概述若你从事过面向对象开发，实现给一个类或对象增加行为，使用继承机制，这是所有面向对象语言的一个基本特性。如果已经存在的一个类缺少某些方法，或者须要给方法添加更多的功能（魅力），你也许会仅仅继承这个类来产生一个新类—这建立在额外的代码上。
读取磁盘文件txt，并输入String 一炮送你回车库 String
public static void main(String[] args) throws IOException { String fileContent = readFileContent("d:/aaa.txt"); System.out.println(fileContent);
js三级联动下拉框 3213213333332132 三级联动
//三级联动省/直辖市<select id="province"></select> 市/省直辖<select id="city"></select> 县/区 <select id="area"></select>
erlang之parse_transform编译选项的应用 616050468 parse_transform 游戏服务器属性同步 abstract_code
最近使用erlang重构了游戏服务器的所有代码，之前看过C++/lua写的服务器引擎代码，引擎实现了玩家属性自动同步给前端和增量更新玩家数据到数据库的功能，这也是现在很多游戏服务器的优化方向，在引擎层面去解决数据同步和数据持久化，数据发生变化了业务层不需要关心怎么去同步给前端。由于游戏过程中玩家每个业务中玩家数据更改的量其实是很少
JAVA JSON的解析 darkranger java
// { // “Total”：“条数”， // Code: 1, // // “PaymentItems”:[ // { // “PaymentItemID”:”支款单ID”, // “PaymentCode”:”支款单编号”, // “PaymentTime”:”支款日期”, // ”ContractNo”:”合同号”， //
POJ-1273-Drainage Ditches aijuans ACM_POJ
POJ-1273-Drainage Ditches http://poj.org/problem?id=1273 基本的最大流，按LRJ的白书写的 #include<iostream> #include<cstring> #include<queue> using namespace std; #define INF 0x7fffffff int ma
工作流Activiti5表的命名及含义 atongyeye 工作流 Activiti
activiti5 - http://activiti.org/designer/update在线插件安装 activiti5一共23张表 Activiti的表都以ACT_开头。第二部分是表示表的用途的两个字母标识。用途也和服务的API对应。 ACT_RE_*: 'RE'表示repository。这个前缀的表包含了流程定义和流程静态资源（图片，规则，等等）。 A
android的广播机制和广播的简单使用百合不是茶 android 广播机制广播的注册
Android广播机制简介在Android中，有一些操作完成以后，会发送广播，比如说发出一条短信，或打出一个电话，如果某个程序接收了这个广播，就会做相应的处理。这个广播跟我们传统意义中的电台广播有些相似之处。之所以叫做广播，就是因为它只负责“说”而不管你“听不听”，也就是不管你接收方如何处理。另外，广播可以被不只一个应用程序所接收，当然也可能不被任何应
Spring事务传播行为详解 bijian1013 java spring 事务传播行为
在service类前加上@Transactional，声明这个service所有方法需要事务管理。每一个业务方法开始时都会打开一个事务。 Spring默认情况下会对运行期例外(RunTimeException)进行事务回滚。这
eidtplus operate 征客丶 eidtplus
开启列模式: Alt+C 鼠标选择 OR Alt+鼠标左键拖动列模式替换或复制内容(多行): 右键-->格式-->填充所选内容-->选择相应操作 OR Ctrl+Shift+V(复制多行数据,必须行数一致) -------------------------------------------------------
【Kafka一】Kafka入门 bit1129 kafka
这篇文章来自Spark集成Kafka(http://bit1129.iteye.com/blog/2174765)，这里把它单独取出来，作为Kafka的入门吧下载Kafka http://mirror.bit.edu.cn/apache/kafka/0.8.1.1/kafka_2.10-0.8.1.1.tgz 2.10表示Scala的版本，而0.8.1.1表示Kafka
Spring 事务实现机制 BlueSkator spring 代理事务
Spring是以代理的方式实现对事务的管理。我们在Action中所使用的Service对象，其实是代理对象的实例，并不是我们所写的Service对象实例。既然是两个不同的对象，那为什么我们在Action中可以象使用Service对象一样的使用代理对象呢？为了说明问题，假设有个Service类叫AService，它的Spring事务代理类为AProxyService，AService实现了一个接口
bootstrap源码学习与示例：bootstrap-dropdown（转帖） BreakingBad bootstrap dropdown
bootstrap-dropdown组件是个烂东西，我读后的整体感觉。一个下拉开菜单的设计： <ul class="nav pull-right"> <li id="fat-menu" class="dropdown">
读《研磨设计模式》-代码笔记-中介者模式-Mediator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* * 中介者模式（Mediator）：用一个中介对象来封装一系列的对象交互。 * 中介者使各对象不需要显式地相互引用，从而使其耦合松散，而且可以独立地改变它们之间的交互。 * * 在我看来，Mediator模式是把多个对象（
常用代码记录 chenjunt3 UI Excel J#
1、单据设置某行或某字段不能修改 //i是行号,"cash"是字段名称 getBillCardPanelWrapper().getBillCardPanel().getBillModel().setCellEditable(i, "cash", false); //取得单据表体所有项用以上语句做循环就能设置整行了 getBillC
搜索引擎与工作流引擎 comsci 算法工作搜索引擎网络应用
最近在公司做和搜索有关的工作，(只是简单的应用开源工具集成到自己的产品中)工作流系统的进一步设计暂时放在一边了，偶然看到谷歌的研究员吴军写的数学之美系列中的搜索引擎与图论这篇文章中的介绍，我发现这样一个关系(仅仅是猜想) -----搜索引擎和流程引擎的基础--都是图论，至少像在我在JWFD中引擎算法中用到的是自定义的广度优先
oracle Health Monitor daizj oracle Health Monitor
About Health Monitor Beginning with Release 11g, Oracle Database includes a framework called Health Monitor for running diagnostic checks on the database. About Health Monitor Checks Health M
JSON字符串转换为对象 dieslrae java json
作为前言,首先是要吐槽一下公司的脑残编译部署方式,web和core分开部署本来没什么问题,但是这丫居然不把json的包作为基础包而作为web的包,导致了core端不能使用,而且我们的core是可以当web来用的(不要在意这些细节),所以在core中处理json串就是个问题.没办法,跟编译那帮人也扯不清楚,只有自己写json的解析了.
C语言学习八结构体，综合应用，学生管理系统 dcj3sjt126com C语言
实现功能的代码： # include <stdio.h> # include <malloc.h> struct Student { int age; float score; char name[100]; }; int main(void) { int len; struct Student * pArr; int i,
vagrant学习笔记 dcj3sjt126com vagrant
想了解多主机是如何定义和使用的, 所以又学习了一遍vagrant 1. vagrant virtualbox 下载安装 https://www.vagrantup.com/downloads.html https://www.virtualbox.org/wiki/Downloads 查看安装在命令行输入vagrant 2.
14.性能优化-优化-软件配置优化 frank1234 软件配置性能优化
1.Tomcat线程池修改tomcat的server.xml文件： <Connector port="8080" protocol="HTTP/1.1" connectionTimeout="20000" redirectPort="8443" maxThreads="1200" m
一个不错的shell 脚本教程入门级 HarborChung linux shell
一个不错的shell 脚本教程入门级建立一个脚本　　Linux中有好多中不同的shell，但是通常我们使用bash (bourne again shell) 进行shell编程，因为bash是免费的并且很容易使用。所以在本文中笔者所提供的脚本都是使用bash（但是在大多数情况下，这些脚本同样可以在 bash的大姐，bourne shell中运行）。　　如同其他语言一样
Spring4新特性——核心容器的其他改进 jinnianshilongnian spring 动态代理 spring4 依赖注入
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
Linux设置tomcat开机启动 liuxingguome tomcat linux 开机自启动
执行命令sudo gedit /etc/init.d/tomcat6 然后把以下英文部分复制过去。（注意第一句#!/bin/sh如果不写，就不是一个shell文件。然后将对应的jdk和tomcat换成你自己的目录就行了。 #!/bin/bash # # /etc/rc.d/init.d/tomcat # init script for tomcat precesses
第13章 Ajax进阶（下） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Troubleshooting Crystal Reports off BW blueoxygen BO
http://wiki.sdn.sap.com/wiki/display/BOBJ/Troubleshooting+Crystal+Reports+off+BW#TroubleshootingCrystalReportsoffBW-TracingBOE Quite useful, especially this part: SAP BW connectivity For t
Java开发熟手该当心的11个错误 tomcat_oracle java jvm 多线程单元测试
#1、不在属性文件或XML文件中外化配置属性。比如，没有把批处理使用的线程数设置成可在属性文件中配置。你的批处理程序无论在DEV环境中，还是UAT（用户验收测试）环境中，都可以顺畅无阻地运行，但是一旦部署在PROD 上，把它作为多线程程序处理更大的数据集时，就会抛出IOException，原因可能是JDBC驱动版本不同，也可能是#2中讨论的问题。如果线程数目可以在属性文件中配置，那么使它成为
正则表达式大全 yang852220741 html 编程正则表达式
今天向大家分享正则表达式大全，它可以大提高你的工作效率正则表达式也可以被当作是一门语言，当你学习一门新的编程语言的时候，他们是一个小的子语言。初看时觉得它没有任何的意义，但是很多时候，你不得不阅读一些教程，或文章来理解这些简单的描述模式。一、校验数字的表达式数字：^[0-9]*$ n位的数字：^\d{n}$ 至少n位的数字：^\d{n,}$ m-n位的数字：^\d{m,n}$

Xpath语法格式整理

你可能感兴趣的:(Xpath语法格式整理)