即使再小的船也能远航

【爬虫】4.2 Scrapy 中查找 html 元素

Xpath简介

1. Scrapy 的 Xpath 简介

（1）使用xpath查找HTML中的元素

2. Xpath 查找 html 元素

（2）"//"与"/"的使用

（3）使用"."进行Xpath连续调用

（4）extract与extract_first函数使用

（5）获取元素属性值

（6）获取节点的文本值

（7）多个文本节点值

（8）使用condition限定tag元素

（9）使用position()序号来确定所选择的元素

（10）使用"*"代表任何element元素,不包括Text、Comment的结点

（11）使用@*代表属性

（12）Xpath搜索元素的父结点

（13）搜索后面的兄弟结点

（14）搜索前面的兄弟结点

Xpath简介

XPath是一门在XML和HTML文档中查找信息的语言，通过路径表达式从XML文档中选取节点或节点位置，可以用来在XML和HTML文档中对元素和属性进行遍历。
Xpath节点类型：元素、属性、文本、命名空间、指令处理、注释及文档
xpath定位方式（路径表达式+索引+属性）
格式：/node1/node2/node3[1]/node4[@attribute[="value“]]
xpath的索引值从1开始

**Xpath 常用表达式**
表达式	描述	例子
nodename	选取此节点	例： body ，选取 body 元素
/	绝对路径 , 表示当前节点的下一级节点元素。	例： /body ，当前节点下一级的 body 元素，默认当前节点选取根元素
//	相对路径，全文档查找；	例： //title ，全文档搜索 title 元素 body//title,在 body 元素后代中搜索所有 title 元素。
.	当前节点	例： .//title ，在当前节点后代中搜索所有 title元素
@	选取属性	//node[@attribute] ，例包含 attribute 属性的节点node 。
*	通配符	/* ，绝对路径匹配任意节点， //* ，全文匹配任意节点，@* ，匹配任意属性

**Xpath 特有的Selector对象函数/方法**
函数/方法	功能描述
extract()	获取对象的元素文本的列表
extract_first()	获取对象的元素文本的列表的第一个元素
"/@attrName"	/@attrName" 获取元素的属性节点对象，用extract() 获取属性值
"/text()"	获取元素的文本节点对象，用 extract() 获取文本值
"/tag[condition]"	获取符合限定条件的元素对象，其中 condition 是由这个 tag 的属性、文本等计算出的一个逻辑值。多个限定条件如下： "tag[condition1][condition2]...[conditionN]" 或者： "tag[condition1 and condition2 and ... and conditionN]"
position()	限定某元素对象，从 1 开始。可通过 and 、 or 等构造复杂的表达式
"element/parent::*"	获取元素的父亲节点对象
" element/folllowing-sibling::*"	所有后序同级兄弟节点
“element/preceding-sibling::*“	所有前序同级兄弟节点

1. Scrapy 的 Xpath 简介

（1）使用xpath查找HTML中的元素

# 使用Xpath查找HTML中的元素
from scrapy.selector import Selector

htmlText = '''


    
        Harry Potter
        29.99
    
    
        Learning XML
        39.95
    


'''
selector = Selector(text=htmlText)
print(type(selector))  # 
print(selector)  # 
s = selector.xpath("//title")  # 全文查找title  形成一个Selector的列表
print(type(s))  # 
print(s)  # [, ]

from scrapy.selector import Selector

从 scrapy 中引入 Selector 类，这个类就是选择查找类。

selector=Selector(text=htmlText)

使用 htmlText 的文字建立 Selector类，就是装载 HTML 文档，文档装载后就形成一个 Selector对象，就可以使用 xpath 查找元素。

print(type(selector)

可看到 selector 是一个类型为 scrapy.selector.unified.Selector，这个类型是一个有 xpath 方法的类型。

s=selector.xpath("//title")

这个方法在文档中查找所有的 </span> <span style="color:#000000;">的元素，其中"//"</span> <span style="color:#000000;">表示文档中的任何位置。一般地： </span> </div> <div> <span style="color:#000000;">selector.xpath("//tagName") </span> </div> <div> <span style="color:#000000;">表示在权文档中搜索<tagName></span> <span style="color:#000000;">的</span> <span style="color:#000000;">tags</span> <span style="color:#000000;">，形成一个</span> <span style="color:#000000;">Selector</span> <span style="color:#000000;">的列表。 </span> </div> </blockquote> <blockquote> <div> <span style="color:#ff0000;">print(type(s)) </span> </div> <div> <span style="color:#000000;">由于</span> <span style="color:#000000;"><title></span> <span style="color:#000000;">有两个元素，因此这是一个 scrapy.selector.unified.SelectorList类，</span> </div> <div> <span style="color:#000000;">类似 scrapy.selector.unified.Selector的列表。</span> </div> </blockquote> <div> <blockquote> <div> <span style="color:#ff0000;">print(s) </span> </div> <div> <span style="color:#000000;">s</span> <span style="color:#000000;">包含两个</span> <span style="color:#000000;">Selector</span> <span style="color:#000000;">对象，一个是</span> <span style="color:#000000;"><Selector xpath='//title' data='<title lang="eng">Harry Potter'>，

另外一个是。

由此可见一般 selector 搜索一个的 HTML 元素的方法是：

selector.xpath("//tagName")

在装载 HTML 文档后 selector=Selector(text=htmlText)得到的 selector 是对应全文档顶层的元素的，其中 "//" 表示全文档搜索，结果是一个 Selector 的列表，哪怕只有一个元素也成一个列表，例如：

selector.xpath("//body") 搜索到元素，结果是一个Selector的列表，包含一个Selector元素；

selector.xpath("//title")搜索到两个</span><span style="color:#000000;">元素，结果是</span><span style="color:#000000;">Selector </span><span style="color:#000000;">的列表，包含</span><span style="color:#000000;">2</span><span style="color:#000000;">个</span><span style="color:#000000;">Selector</span><span style="color:#000000;">元素； </span></li> <li><span style="color:#000000;">selector.xpath("//book")</span><span style="color:#000000;">搜索到两个</span><span style="color:#000000;"><book></span><span style="color:#000000;">元素，结果是</span><span style="color:#000000;">Selector </span><span style="color:#000000;">的列表，包含</span><span style="color:#000000;">2</span><span style="color:#000000;">个</span><span style="color:#000000;">Selector</span><span style="color:#000000;">元素</span></li> </ul> </div> </div> </div> <h1 id="2.%20Xpath%20%E6%9F%A5%E6%89%BE%20html%20%E5%85%83%E7%B4%A0">2. Xpath 查找 html 元素</h1> <h3 id="%EF%BC%882%EF%BC%89%22%2F%2F%22%E4%B8%8E%22%2F%22%E7%9A%84%E4%BD%BF%E7%94%A8">（2）"//"与"/"的使用</h3> <p> 使用 “<strong>//</strong>” 表示文档下面的<strong>所有结点</strong>元素，用 “<strong>/</strong>” 表示<strong>当前结点</strong>的下一级结点元素</p> <pre><code class="language-python"># "//"与"/"的使用 from scrapy.selector import Selector htmlText = ''' <html><body> <bookstore> <book> <title lang="eng">Harry Potter 29.99 Learning XML 39.95 ''' selector = Selector(text=htmlText) print(type(selector)) print(selector) print("====================s1====================") s1 = selector.xpath("//bookstore/book") # 搜索下一级的元素，找到2个 print(type(s1)) print(s1) print("====================s2====================") s2 = selector.xpath("//body/book") # 搜索下一级的元素，结果为空 print(type(s2)) print(s2) print("====================s3====================") s3 = selector.xpath("//body//book") # 搜索下元素，找到2个 print(type(s3)) print(s3) print("====================s4====================") s4 = selector.xpath("/body//book") # 搜索文档下一级的下的元素，结果为空，∵文档的下一级是元素，不是元素 print(type(s4)) print(s4) print("====================s5====================") s5 = selector.xpath("/html/body//book") # 或 s5 = selector.xpath("/html//book") # 搜索元素，找到2个 print(type(s5)) print(s5) print("====================s6====================") s6 = selector.xpath("//book/title") # 搜索文档中所有下一级的元素，找到2个 print(type(s6)) print(s6) # 结果与 selector.xpath("//title") selector.xpath("//bookstore//title")一样 print("====================s7====================") s7 = selector.xpath("//book//price") # # 搜索文档中所有<book>下一级的<price>元素，找到2个 print(type(s7)) print(s7) # 结果与 selector.xpath("//price")一样 </code></pre> <blockquote> <p><strong>运行结果：</strong><br> <class 'scrapy.selector.unified.Selector'><br> <Selector query=None data='<html><body>\n<bookstore>\n <book>\n ...'><br> ====================s1====================<br> <class 'scrapy.selector.unified.SelectorList'><br> [<Selector query='//bookstore/book' data='<book>\n <title lang="eng">Harr...'>, <Selector query='//bookstore/book' data='<book>\n <title lang="eng">Lear...'>]<br> ====================s2====================<br> <class 'scrapy.selector.unified.SelectorList'><br> []<br> ====================s3====================<br> <class 'scrapy.selector.unified.SelectorList'><br> [<Selector query='//body//book' data='<book>\n <title lang="eng">Harr...'>, <Selector query='//body//book' data='<book>\n <title lang="eng">Lear...'>]<br> ====================s4====================<br> <class 'scrapy.selector.unified.SelectorList'><br> []<br> ====================s5====================<br> <class 'scrapy.selector.unified.SelectorList'><br> [<Selector query='/html/body//book' data='<book>\n <title lang="eng">Harr...'>, <Selector query='/html/body//book' data='<book>\n <title lang="eng">Lear...'>]<br> ====================s6====================<br> <class 'scrapy.selector.unified.SelectorList'><br> [<Selector query='//book/title' data='<title lang="eng">Harry Potter'>, ]
====================s7====================

[, ]

（3）使用"."进行Xpath连续调用

使用 “.” 表示当前结点元素，使用 Xpath 可以连续调用，如果前一个 Xpath 返回一个 Selector 的列表，那么这个列表可以继续调用 Xpath

功能：为了每个列表元素调用 Xpath ，最后结果是全部元素调用 Xpath 的汇总

# 使用"."进行Xpath连续调用
from scrapy.selector import Selector

htmlText = '''


    books
    
        Novel
        Harry Potter
        29.99
    
    
        TextBook
        Learning XML
        39.95
    


'''
selector = Selector(text=htmlText)
s = selector.xpath("//book").xpath("./title")
# s = selector.xpath("//book").xpath("/title")  # 结果是空的，因为后面的 xpath("/title")从文档开始搜索。
# s = selector.xpath("//book").xpath("//title")  # 结果有10个元素，因为每个 <book>都驱动xpath("//title")在全文档搜索 <title>元素，每次都搜索到5个元素。
for e in s:
    print(e)</code></pre> 
  <blockquote> 
   <p><strong>运行结果：</strong></p> 
   <p><Selector query='./title' data='<title>Novel'>
 
 
  
   
           selector.xpath("//book") 首先搜索到文档中所有  元素，总共有2 个，然后再次调用 xpath("./title") ，就是从当前元素  开始往下一级搜索</span> <span style="color:#000000;">，每个</span> <span style="color:#000000;"><book></span> <span style="color:#000000;">都找到</span> <span style="color:#000000;">2</span> <span style="color:#000000;">个</span> <span style="color:#000000;"><title></span> <span style="color:#000000;">，因此结果有</span> <span style="color:#000000;">4</span> <span style="color:#000000;">个</span> <span style="color:#000000;"><title>。</span> 
  </div> 
  <div></div> 
  <div> 
   <blockquote> 
    <div> <strong><span style="color:#fe2c24;">注意：</span></strong> <span style="color:#000000;">如果</span> <span style="color:#000000;">xpath</span> <span style="color:#000000;">连续调用时不指定是从前一个</span> <span style="color:#000000;">xpath</span> <span style="color:#000000;">的结果元素开始的，那么默认是从全文档开始的，结果会不一样，例如： </span> 
    </div> 
    <div> <span style="color:#000000;">s=selector.xpath("//book").xpath("/title") </span> <span style="color:#000000;">结果是空的，因为后面的 xpath("/title")从文档开始搜索</span> <span style="color:#000000;"><title></span> <span style="color:#000000;">。 </span> 
    </div> 
    <div> <span style="color:#000000;">s=selector.xpath("//book").xpath("//title") </span> <span style="color:#000000;">结果有</span> <span style="color:#000000;">10</span> <span style="color:#000000;">个元素，因为每个 <book>都驱动</span> <span style="color:#000000;">xpath("//title")</span> <span style="color:#000000;">在全文档搜索 <title>元素，每次都搜索到</span> <span style="color:#000000;">5</span> <span style="color:#000000;">个元素。</span> 
    </div> 
   </blockquote> 
  </div> 
  <h3 id="%EF%BC%884%EF%BC%89extract%E4%B8%8Eextract_first%E5%87%BD%E6%95%B0%E4%BD%BF%E7%94%A8">（4）extract与extract_first函数使用</h3> 
  <div> <span style="color:#000000;"><strong>如果</strong></span> <span style="color:#000000;"><strong>xpath</strong></span> <span style="color:#000000;"><strong>返回的</strong></span> <span style="color:#000000;"><strong>Selector</strong></span> <span style="color:#000000;"><strong>对象列表 </strong></span> 
  </div> 
  <div> <span style="color:#000000;"><strong>① 调用</strong></span> <span style="color:#ff0000;"><strong>extract()</strong></span> <span style="color:#000000;"><strong>函数会得到这些对象的</strong></span> <span style="color:#ff0000;"><strong>元素文本</strong></span> <span style="color:#000000;"><strong>的</strong></span> <span style="color:#ff0000;"><strong>列表 </strong></span> 
  </div> 
  <div> <span style="color:#000000;"><strong>② 使用</strong></span> <span style="color:#ff0000;"><strong>extract_first()</strong></span> <span style="color:#000000;"><strong>获取列表中</strong></span> <span style="color:#ff0000;"><strong>第一个元素值</strong></span> <span style="color:#000000;"><strong>，如果列表为空 </strong></span> <span style="color:#000000;"><strong>extract_first()</strong></span> <span style="color:#000000;"><strong>的值为</strong></span> <span style="color:#000000;"><strong>None</strong></span> <span style="color:#000000;"><strong>。 </strong></span> 
  </div> 
  <div></div> 
  <div> <span style="color:#000000;"><strong>而对于单一的一个</strong></span> <span style="color:#000000;"><strong>Selector</strong></span> <span style="color:#000000;"><strong>对象 </strong></span> 
  </div> 
  <div> <span style="color:#000000;"><strong>① 调用</strong></span> <span style="color:#000000;"><strong>extract()</strong></span> <span style="color:#000000;"><strong>函数就可以得到</strong></span> <span style="color:#000000;"><strong>Selector</strong></span> <span style="color:#000000;"><strong>对象对应的元素的文本值。 </strong></span> 
  </div> 
  <div> <span style="color:#000000;"><strong>② </strong></span> <span style="color:#ff0000;"><strong>单一的</strong></span> <span style="color:#ff0000;"><strong>Selector</strong></span> <span style="color:#ff0000;"><strong>对象没有</strong></span> <span style="color:#ff0000;"><strong>extract_first()</strong></span> <span style="color:#ff0000;"><strong>函数</strong></span> <span style="color:#000000;"><strong>。</strong></span> 
  </div> 
  <div> 
   <pre><code class="language-python"># extract与extract_first函数使用
from scrapy.selector import Selector

htmlText = '''
<html><body>
<bookstore>
    <book id="b1">
        <title lang="english">Harry Potter
        29.99
    
    
        学习 XML
        39.95
    


'''
selector = Selector(text=htmlText)
s = selector.xpath("//book/price")
print(type(s), s)
s = selector.xpath("//book/price").extract()
print(type(s), s)
s = selector.xpath("//book/price").extract_first()
print(type(s), s)

运行结果：

[, ]
['29.99', '39.95']
29.99

由此可见:

s=selector.xpath("//book/price") 得到的是SelectorList列表；

s=selector.xpath("//book/price").extract() 得到的是元素的Selector对象对应的元素的文本组成的列表，即：

['29.99', '39.95']

s=selector.xpath("//book/price").extrac_first() 得到的是元素的文本组成的列表的第一个元素，是一个文本，即： 29.99

（5）获取元素属性值

xpath使用 "/@attrName " 得到一个 Selector 元素的 attrName 属性节点对象，属性节点对象也是一个Selector 对象，通过 extract() 获取属性值。

# 获取元素属性值
from scrapy.selector import Selector

htmlText = '''


    
        Harry Potter
        29.99
    
    
        学习 XML
        39.95
    


'''
selector = Selector(text=htmlText)
s = selector.xpath("//book").xpath("./@id")
print(s)  # [, ]
print(s.extract())  # ['b1', 'b2']
for e in s:
    print(e.extract())  # b1 \n  b2

运行结果：

[, ]
['b1', 'b2']
b1
b2

由此可见：

s=selector.xpath("//book/@id")

结果是 2 个的 id 属性组成的 SelectorList 列表， 即属性也是一个 Selector 对象；

print(s.extract()) 结果是的 id 属性的两个 Selector 对象的属性文本值的列表，即['b1', 'b2'] ；

for e in s:

print(e.extract())

每个 e 是一个 Selector 对象，因此 extract() 获取对象的属性值。

（6）获取节点的文本值

xpath使用 "/text()" 得到一个 Selector 元素包含的文本值，文本值节点对象也是一个Selector 对象，通过 extract() 获取文本值。

# 获取节点的文本值
from scrapy.selector import Selector

htmlText = '''


    
        Harry Potter
        29.99
    
    
        学习 XML
        39.95
    


'''
selector = Selector(text=htmlText)
s = selector.xpath("//book/title/text()")
print(s)
print(s.extract())  # ['Harry Potter', '学习 XML']
for e in s:
    print(e.extract())  # Harry Potter  \n  学习 XML

运行结果：

[, ]
['Harry Potter', '学习 XML']
Harry Potter
学习 XML

由此可见：

s=selector.xpath("//book/title/text()") 结果也是 SelectorList 列表，即文本也是一个节点 ；

print(s.extract()) 结果是文本节点的字符串值的列表，即['Harry Potter', ' 学习 XML'] ；

for e in s:

print(e.extract())

每个 e 是一个 Selector 对象，因此 extract() 获取对象的属性值。 值得注意 的是如果一个 element 的元素包含的文本不是单一的文本，那么可能会 产生多个文本值。

（7）多个文本节点值

# 多个文本节点值
from scrapy.selector import Selector

htmlText = '''


    
        <b>H</b>ary <b>P</b>otter
        29.99
    


'''
selector = Selector(text=htmlText)
s = selector.xpath("//book/title/text()")
print(s)
print(s.extract())  # ['ary ', 'otter']
for e in s:
    print(e.extract())

运行结果：

[, ]
['ary ', 'otter']
ary
otter

由此可见 </span> <span style="color:#000000;">中的文本值包含</span> <span style="color:#000000;">arry</span> <span style="color:#000000;">与</span> <span style="color:#000000;">otter</span> <span style="color:#000000;">两个。</span> </div> <h3 id="%EF%BC%888%EF%BC%89%E4%BD%BF%E7%94%A8condition%E9%99%90%E5%AE%9Atag%E5%85%83%E7%B4%A0">（8）使用condition限定tag元素</h3> <pre><code class="language-python"># 使用condition限定tag元素 from scrapy.selector import Selector htmlText = ''' <html><body> <bookstore> <book id="b1"> <title lang="english">Harry Potter 29.99 学习 XML 39.95 ''' selector = Selector(text=htmlText) s = selector.xpath("//book/title[@lang='chinese']/text()") print(s.extract_first()) # 学习 XML s = selector.xpath("//book[@id='b1']/title") print(s.extract_first()) # Harry Potter

运行结果：

学习 XML
Harry Potter

由此可见：

s=selector.xpath("//book/title[@lang='chinese']/text()")

搜索下面属性 lang="chinese" 的 </span> </div> <div></div> <div> <span style="color:#000000;">s=selector.xpath("//book[@id='b1']/title") </span> </div> <div> <span style="color:#000000;">搜索属性</span> <span style="color:#000000;">id="b1"</span> <span style="color:#000000;">的</span> <span style="color:#000000;"><book></span> <span style="color:#000000;">下面的</span> <span style="color:#000000;"><title></span> <span style="color:#000000;">。</span> </div> <h3 id="%EF%BC%889%EF%BC%89%E4%BD%BF%E7%94%A8position()%E5%BA%8F%E5%8F%B7%E6%9D%A5%E7%A1%AE%E5%AE%9A%E6%89%80%E9%80%89%E6%8B%A9%E7%9A%84%E5%85%83%E7%B4%A0">（9）使用position()序号来确定所选择的元素</h3> <div> <span style="color:#000000;"> xpath可以使用</span> <span style="color:#ff0000;">position()</span> <span style="color:#000000;">来确定其中一个元素的限制，这个选择序号</span> <span style="color:#000000;">是</span> <span style="color:#ff0000;">从</span> <span style="color:#ff0000;">1</span> <span style="color:#ff0000;">开始的</span> <span style="color:#000000;">，不是从</span> <span style="color:#000000;">0</span> <span style="color:#000000;">开始编号的，还可以通过 </span> <span style="color:#000000;">and</span> <span style="color:#000000;">、</span> <span style="color:#000000;">or</span> <span style="color:#000000;">等构造复杂的表</span> <span style="color:#000000;">达式。</span> </div> <div> <pre><code class="language-python"># 使用position()序号来确定所选择的元素 from scrapy.selector import Selector htmlText = ''' <html><body> <bookstore> <book id="b1"> <title lang="english">Harry Potter 29.99 学习 XML 39.95 ''' selector = Selector(text=htmlText) s = selector.xpath("//book[position()=1]/title") # 选择第一个元素下的title print(s.extract_first()) # Harry Potter s = selector.xpath("//book[position()=2]/title") # 选择第二个元素下的title print(s.extract_first()) # 学习 XML

运行结果：

Harry Potter
学习 XML

（10）使用"*"代表任何element元素,不包括Text、Comment的结点

xpath使用星号 "*" 代表任何 Element 节点，不包括 Text 、 Comment 的节点。

# 使用"*"代表任何element元素,不包括Text、Comment的结点
from scrapy.selector import Selector

htmlText = '''


    
        Harry Potter
        29.99
    
    
        学习 XML
        39.95
    


'''
selector = Selector(text=htmlText)
s = selector.xpath("//bookstore/*/title")
print(s.extract())  # ['Harry Potter', '学习 XML']

运行结果：

['Harry Potter', '学习 XML']

其中 s=selector.xpath("//bookstore/*/title")是搜索的孙子节点，中间隔开一层任何元素。</span> </div> </div> <h3 id="%EF%BC%8811%EF%BC%89%E4%BD%BF%E7%94%A8%40*%E4%BB%A3%E8%A1%A8%E5%B1%9E%E6%80%A7">（11）使用@*代表属性</h3> <div> <span style="color:#000000;"> xpath使用</span> <span style="color:#ff0000;">"@*"</span> <span style="color:#000000;">代表任何属性</span> </div> <div> <pre><code class="language-python"># 使用@*代表属性 from scrapy.selector import Selector htmlText = ''' <html><body> <bookstore> <book> <title lang="english">Harry Potter 29.99 学习 XML 39.95 ''' selector = Selector(text=htmlText) s = selector.xpath("//book[@*]/title") # 搜索任何包含属性的元素下面的 print(s.extract()) # ['<title lang="chinese">学习 XML'] s = selector.xpath("//@*") # 搜索文档中所有属性结点 print(s.extract()) # ['english', 'b2', 'chinese']

运行结果：

['学习 XML']
['english', 'b2', 'chinese']

其中： s=selector.xpath("//book[@*]/title") 是搜索任何 包含属性的 元素下面的</span> <span style="color:#000000;">，结果搜索到第二个 <book>s=selector.xpath("//@*")是搜索文档中所有</span> <span style="color:#c00000;"><strong>属性节点</strong></span> <span style="color:#000000;">。</span> </div> </div> <h3 id="%EF%BC%8812%EF%BC%89Xpath%E6%90%9C%E7%B4%A2%E5%85%83%E7%B4%A0%E7%9A%84%E7%88%B6%E7%BB%93%E7%82%B9">（12）Xpath搜索元素的父结点</h3> <div> <span style="color:#000000;"> xpath使用</span> <span style="color:#ff0000;">"element/parent::*"</span> <span style="color:#000000;">选择</span> <span style="color:#000000;">element</span> <span style="color:#000000;">的父节点，这个节点只有一个。如果写成element/parent::tag</span> <span style="color:#000000;">，就指定</span> <span style="color:#000000;">element</span> <span style="color:#000000;">的</span> <span style="color:#000000;">tag</span> <span style="color:#000000;">父节点，除非 element的父节点正好为</span> <span style="color:#000000;"><tag></span> <span style="color:#000000;">节点，不然就为[ ]</span> <span style="color:#000000;">。</span> </div> <div> <pre><code class="language-python"># Xpath搜索元素的父结点 from scrapy.selector import Selector htmlText = ''' <html><body> <bookstore> <book> <title lang="english">Harry Potter 29.99 学习 XML 39.95 ''' selector = Selector(text=htmlText) s = selector.xpath("//title[@lang='chinese']/parent::*") # 等价 /parent::book print(s.extract()) # ['\n 学习 XML\n 39.95\n ']

运行结果：

['\n 学习 XML\n 39.95\n ']

其中 s=selector.xpath("//title[@lang='chinese']/parent::*")是查找属性为 lang='chinese'的元素的父节点，就是id="b2"的<book>元素节点。</span> </div> </div> <h3 id="%EF%BC%8813%EF%BC%89%E6%90%9C%E7%B4%A2%E5%90%8E%E9%9D%A2%E7%9A%84%E5%85%84%E5%BC%9F%E7%BB%93%E7%82%B9">（13）搜索后面的兄弟结点</h3> <div> <span style="color:#000000;"> xpath使用</span> <span style="color:#ff0000;">"element/folllowing-sibling::*"</span> <span style="color:#000000;">搜索</span> <span style="color:#000000;">element</span> <span style="color:#000000;">后面的同级</span> <span style="color:#000000;">的所有兄弟节点，使用</span> <span style="color:#000000;">"element/folllowing-sibling::*[position()=1]" </span> <span style="color:#000000;">搜</span> <span style="color:#000000;">索</span> <span style="color:#000000;">element</span> <span style="color:#000000;">后面的同级的第一个兄弟节点。</span> </div> <div> <pre><code class="language-python"># 搜索后面的兄弟结点 from scrapy.selector import Selector htmlText = """<a>A1</a> <b>B1</b> <c>C1</c> <d>D<e>E</e></d> <b>B2</b> <c>C2</c>""" selector = Selector(text=htmlText) s = selector.xpath("//a/following-sibling::*") # 搜素<a>结点后面的兄弟结点 print(s.extract()) # ['<b>B1</b>', '<c>C1</c>', '<d>D<e>E</e></d>', '<b>B2</b>', '<c>C2</c>'] s = selector.xpath("//a/following-sibling::*[position()=1]") # 搜索<a>结点后面的第1个兄弟结点 print(s.extract()) # ['<b>B1</b>'] s = selector.xpath("//b[position()=1]/following-sibling::*") # 搜索第一个<b>结点后面的兄弟结点 print(s.extract()) # ['<c>C1</c>', '<d>D<e>E</e></d>', '<b>B2</b>', '<c>C2</c>'] s = selector.xpath("//b[position()=1]/following-sibling::*[position()=1]") # 搜索第一个<b>结点后面的第1个兄弟结点 print(s.extract()) # ['<c>C1</c>'] </code></pre> <blockquote> <p><strong>运行结果：</strong></p> <p>['<b>B1</b>', '<c>C1</c>', '<d>D<e>E</e></d>', '<b>B2</b>', '<c>C2</c>']<br> ['<b>B1</b>']<br> ['<c>C1</c>', '<d>D<e>E</e></d>', '<b>B2</b>', '<c>C2</c>']<br> ['<c>C1</c>']</p> </blockquote> </div> <h3 id="%EF%BC%8814%EF%BC%89%E6%90%9C%E7%B4%A2%E5%89%8D%E9%9D%A2%E7%9A%84%E5%85%84%E5%BC%9F%E7%BB%93%E7%82%B9">（14）搜索前面的兄弟结点</h3> <div> <span style="color:#000000;"> xpath使用 </span> <span style="color:#ff0000;">"element/preceding-sibling::*" </span> <span style="color:#000000;">搜索</span> <span style="color:#000000;">element</span> <span style="color:#000000;">前面的同级的所有兄弟节点，使用"element/preceding-sibling::*[position()=1]"</span> <span style="color:#000000;">搜索 element前面的同级的第一个兄弟节点。</span> </div> <pre><code class="language-python"># 搜索前面的兄弟结点 from scrapy.selector import Selector htmlText = """<a>A1</a> <b>B1</b> <c>C1</c> <d>D<e>E</e></d> <b>B2</b> <c>C2</c>""" selector = Selector(text=htmlText) s = selector.xpath("//a/preceding-sibling::*") print(s.extract()) # [] s = selector.xpath("//b/preceding-sibling::*[position()=1]") # 是所有<b>前面的第1个兄弟结点 print(s.extract()) # ['<a>A1</a>', '<d>D<e>E</e></d>'] s = selector.xpath("//b[position()=2]/preceding-sibling::*") # 是第二个<b>前面的所有兄弟结点 print(s.extract()) # ['<a>A1</a>', '<b>B1</b>', '<c>C1</c>', '<d>D<e>E</e></d>'] s = selector.xpath("//b[position()=2]/preceding-sibling::*[position()=1]") # 这里的position()=1指的是前1个兄弟结点 print(s.extract()) # ['<d>D<e>E</e></d>'] </code></pre> <blockquote> <p><strong>运行结果：</strong></p> <p>[ ]<br> ['<a>A1</a>', '<d>D<e>E</e></d>']<br> ['<a>A1</a>', '<b>B1</b>', '<c>C1</c>', '<d>D<e>E</e></d>']<br> ['<d>D<e>E</e></d>']</p> </blockquote> </div> </div> </div> </div> </div>  <div id="SOHUCS" sid="1668196543586459648"></div> <script type="text/javascript" src="/views/front/js/chanyan.js"></script>  <div class="youdao-fixed-ad" id="detail_ad_bottom"></div> </div> <div class="col-md-3"> <div class="row" id="ad">  <div id="right-1" class="col-lg-12 col-md-12 col-sm-4 col-xs-4 ad"> <div class="youdao-fixed-ad" id="detail_ad_1"> </div> </div>  <div id="right-2" class="col-lg-12 col-md-12 col-sm-4 col-xs-4 ad"> <div class="youdao-fixed-ad" id="detail_ad_2"></div> </div>  <div id="right-3" class="col-lg-12 col-md-12 col-sm-4 col-xs-4 ad"> <div class="youdao-fixed-ad" id="detail_ad_3"></div> </div> </div> </div> </div> </div> </div> <div class="container"> <h4 class="pt20 mb15 mt0 border-top">你可能感兴趣的:(爬虫,python,Xpath,html,爬虫,scrapy,Xpath,python)</h4> <div id="paradigm-article-related"> <div class="recommend-post mb30"> <ul class="widget-links"> <li><a href="/article/1835511912843014144.htm" title="理解Gunicorn：Python WSGI服务器的基石" target="_blank">理解Gunicorn：Python WSGI服务器的基石</a> <span class="text-muted">范范0825</span> <a class="tag" taget="_blank" href="/search/ipython/1.htm">ipython</a><a class="tag" taget="_blank" href="/search/linux/1.htm">linux</a><a class="tag" taget="_blank" href="/search/%E8%BF%90%E7%BB%B4/1.htm">运维</a> <div>理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico</div> </li> <li><a href="/article/1835509770287673344.htm" title="swagger访问路径" target="_blank">swagger访问路径</a> <span class="text-muted">igotyback</span> <a class="tag" taget="_blank" href="/search/swagger/1.htm">swagger</a> <div>Swagger2.x版本访问地址：http://{ip}:{port}/{context-path}/swagger-ui.html{ip}是你的服务器IP地址。{port}是你的应用服务端口，通常为8080。{context-path}是你的应用上下文路径，如果应用部署在根路径下，则为空。Swagger3.x版本对于Swagger3.x版本（也称为OpenAPI3）访问地址：http://{ip</div> </li> <li><a href="/article/1835508130608410624.htm" title="html 中如何使用 uniapp 的部分方法" target="_blank">html 中如何使用 uniapp 的部分方法</a> <span class="text-muted">某公司摸鱼前端</span> <a class="tag" taget="_blank" href="/search/html/1.htm">html</a><a class="tag" taget="_blank" href="/search/uni-app/1.htm">uni-app</a><a class="tag" taget="_blank" href="/search/%E5%89%8D%E7%AB%AF/1.htm">前端</a> <div>示例代码：Documentconsole.log(window);效果展示：好了，现在就可以uni.使用相关的方法了</div> </li> <li><a href="/article/1835506869838376960.htm" title="Python数据分析与可视化实战指南" target="_blank">Python数据分析与可视化实战指南</a> <span class="text-muted">William数据分析</span> <a class="tag" taget="_blank" href="/search/python/1.htm">python</a><a class="tag" taget="_blank" href="/search/python/1.htm">python</a><a class="tag" taget="_blank" href="/search/%E6%95%B0%E6%8D%AE/1.htm">数据</a> <div>在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学</div> </li> <li><a href="/article/1835505858939809792.htm" title="python os.environ" target="_blank">python os.environ</a> <span class="text-muted">江湖偌大</span> <a class="tag" taget="_blank" href="/search/python/1.htm">python</a><a class="tag" taget="_blank" href="/search/%E6%B7%B1%E5%BA%A6%E5%AD%A6%E4%B9%A0/1.htm">深度学习</a> <div>os.environ['TF_CPP_MIN_LOG_LEVEL']='0'#默认值，输出所有信息os.environ['TF_CPP_MIN_LOG_LEVEL']='1'#屏蔽通知信息（INFO）os.environ['TF_CPP_MIN_LOG_LEVEL']='2'#屏蔽通知信息和警告信息（INFO\WARNING）os.environ['TF_CPP_MIN_LOG_LEVEL']='</div> </li> <li><a href="/article/1835505606245576704.htm" title="Python中os.environ基本介绍及使用方法" target="_blank">Python中os.environ基本介绍及使用方法</a> <span class="text-muted">鹤冲天Pro</span> <a class="tag" taget="_blank" href="/search/%23/1.htm">#</a><a class="tag" taget="_blank" href="/search/Python/1.htm">Python</a><a class="tag" taget="_blank" href="/search/python/1.htm">python</a><a class="tag" taget="_blank" href="/search/%E6%9C%8D%E5%8A%A1%E5%99%A8/1.htm">服务器</a><a class="tag" taget="_blank" href="/search/%E5%BC%80%E5%8F%91%E8%AF%AD%E8%A8%80/1.htm">开发语言</a> <div>文章目录python中os.environos.environ简介os.environ进行环境变量的增删改查python中os.environ的使用详解1.简介2.key字段详解2.1常见key字段3.os.environ.get()用法4.环境变量的增删改查和判断是否存在4.1新增环境变量4.2更新环境变量4.3获取环境变量4.4删除环境变量4.5判断环境变量是否存在python中os.envi</div> </li> <li><a href="/article/1835505226933694464.htm" title="Pyecharts数据可视化大屏：打造沉浸式数据分析体验" target="_blank">Pyecharts数据可视化大屏：打造沉浸式数据分析体验</a> <span class="text-muted">我的运维人生</span> <a class="tag" taget="_blank" href="/search/%E4%BF%A1%E6%81%AF%E5%8F%AF%E8%A7%86%E5%8C%96/1.htm">信息可视化</a><a class="tag" taget="_blank" href="/search/%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90/1.htm">数据分析</a><a class="tag" taget="_blank" href="/search/%E6%95%B0%E6%8D%AE%E6%8C%96%E6%8E%98/1.htm">数据挖掘</a><a class="tag" taget="_blank" href="/search/%E8%BF%90%E7%BB%B4%E5%BC%80%E5%8F%91/1.htm">运维开发</a><a class="tag" taget="_blank" href="/search/%E6%8A%80%E6%9C%AF%E5%85%B1%E4%BA%AB/1.htm">技术共享</a> <div>Pyecharts数据可视化大屏：打造沉浸式数据分析体验在当今这个数据驱动的时代，如何将海量数据以直观、生动的方式展现出来，成为了数据分析师和企业决策者关注的焦点。Pyecharts，作为一款基于Python的开源数据可视化库，凭借其丰富的图表类型、灵活的配置选项以及高度的定制化能力，成为了构建数据可视化大屏的理想选择。本文将深入探讨如何利用Pyecharts打造数据可视化大屏，并通过实际代码案例</div> </li> <li><a href="/article/1835504217729626112.htm" title="Python教程：一文了解使用Python处理XPath" target="_blank">Python教程：一文了解使用Python处理XPath</a> <span class="text-muted">旦莫</span> <a class="tag" taget="_blank" href="/search/Python%E8%BF%9B%E9%98%B6/1.htm">Python进阶</a><a class="tag" taget="_blank" href="/search/python/1.htm">python</a><a class="tag" taget="_blank" href="/search/%E5%BC%80%E5%8F%91%E8%AF%AD%E8%A8%80/1.htm">开发语言</a> <div>目录1.环境准备1.1安装lxml1.2验证安装2.XPath基础2.1什么是XPath？2.2XPath语法2.3示例XML文档3.使用lxml解析XML3.1解析XML文档3.2查看解析结果4.XPath查询4.1基本路径查询4.2使用属性查询4.3查询多个节点5.XPath的高级用法5.1使用逻辑运算符5.2使用函数6.实战案例6.1从网页抓取数据6.1.1安装Requests库6.1.2代</div> </li> <li><a href="/article/1835503965563875328.htm" title="python os.environ_python os.environ 读取和设置环境变量" target="_blank">python os.environ_python os.environ 读取和设置环境变量</a> <span class="text-muted">weixin_39605414</span> <a class="tag" taget="_blank" href="/search/python/1.htm">python</a><a class="tag" taget="_blank" href="/search/os.environ/1.htm">os.environ</a> <div>>>>importos>>>os.environ.keys()['LC_NUMERIC','GOPATH','GOROOT','GOBIN','LESSOPEN','SSH_CLIENT','LOGNAME','USER','HOME','LC_PAPER','PATH','DISPLAY','LANG','TERM','SHELL','J2REDIR','LC_MONETARY','QT_QPA</div> </li> <li><a href="/article/1835499615491813376.htm" title="四章-32-点要素的聚合" target="_blank">四章-32-点要素的聚合</a> <span class="text-muted">彩云飘过</span> <div>本文基于腾讯课堂老胡的课《跟我学Openlayers--基础实例详解》做的学习笔记，使用的openlayers5.3.xapi。源码见1032.html，对应的官网示例https://openlayers.org/en/latest/examples/cluster.htmlhttps://openlayers.org/en/latest/examples/earthquake-clusters.</div> </li> <li><a href="/article/1835498925755297792.htm" title="DIV+CSS+JavaScript技术制作网页（旅游主题网页设计与制作）云南大理" target="_blank">DIV+CSS+JavaScript技术制作网页（旅游主题网页设计与制作）云南大理</a> <span class="text-muted">STU学生网页设计</span> <a class="tag" taget="_blank" href="/search/%E7%BD%91%E9%A1%B5%E8%AE%BE%E8%AE%A1/1.htm">网页设计</a><a class="tag" taget="_blank" href="/search/%E6%9C%9F%E6%9C%AB%E7%BD%91%E9%A1%B5%E4%BD%9C%E4%B8%9A/1.htm">期末网页作业</a><a class="tag" taget="_blank" href="/search/html%E9%9D%99%E6%80%81%E7%BD%91%E9%A1%B5/1.htm">html静态网页</a><a class="tag" taget="_blank" href="/search/html5%E6%9C%9F%E6%9C%AB%E5%A4%A7%E4%BD%9C%E4%B8%9A/1.htm">html5期末大作业</a><a class="tag" taget="_blank" href="/search/%E7%BD%91%E9%A1%B5%E8%AE%BE%E8%AE%A1/1.htm">网页设计</a><a class="tag" taget="_blank" href="/search/web%E5%A4%A7%E4%BD%9C%E4%B8%9A/1.htm">web大作业</a> <div>️精彩专栏推荐作者主页:【进入主页—获取更多源码】web前端期末大作业：【HTML5网页期末作业(1000套)】程序员有趣的告白方式：【HTML七夕情人节表白网页制作(110套)】文章目录二、网站介绍三、网站效果▶️1.视频演示2.图片演示四、网站代码HTML结构代码CSS样式代码五、更多源码二、网站介绍网站布局方面：计划采用目前主流的、能兼容各大主流浏览器、显示效果稳定的浮动网页布局结构。网站程</div> </li> <li><a href="/article/1835497664922349568.htm" title="使用Faiss进行高效相似度搜索" target="_blank">使用Faiss进行高效相似度搜索</a> <span class="text-muted">llzwxh888</span> <a class="tag" taget="_blank" href="/search/faiss/1.htm">faiss</a><a class="tag" taget="_blank" href="/search/python/1.htm">python</a> <div>在现代AI应用中，快速和高效的相似度搜索是至关重要的。Faiss（FacebookAISimilaritySearch）是一个专门用于快速相似度搜索和聚类的库，特别适用于高维向量。本文将介绍如何使用Faiss来进行相似度搜索，并结合Python代码演示其基本用法。什么是Faiss？Faiss是一个由FacebookAIResearch团队开发的开源库，主要用于高维向量的相似性搜索和聚类。Faiss</div> </li> <li><a href="/article/1835497665853485056.htm" title="python是什么意思中文-在python中%是什么意思" target="_blank">python是什么意思中文-在python中%是什么意思</a> <span class="text-muted">编程大乐趣</span> <div>Python中%有两种：1、数值运算：%代表取模，返回除法的余数。如：>>>7%212、%操作符（字符串格式化，stringformatting），说明如下：%[(name)][flags][width].[precision]typecode(name)为命名flags可以有+，-，''或0。+表示右对齐。-表示左对齐。''为一个空格，表示在正数的左侧填充一个空格，从而与负数对齐。0表示使用0填</div> </li> <li><a href="/article/1835496149843275776.htm" title="关于城市旅游的HTML网页设计——(旅游风景云南 5页)HTML+CSS+JavaScript" target="_blank">关于城市旅游的HTML网页设计——(旅游风景云南 5页)HTML+CSS+JavaScript</a> <span class="text-muted">二挡起步</span> <a class="tag" taget="_blank" href="/search/web%E5%89%8D%E7%AB%AF%E6%9C%9F%E6%9C%AB%E5%A4%A7%E4%BD%9C%E4%B8%9A/1.htm">web前端期末大作业</a><a class="tag" taget="_blank" href="/search/javascript/1.htm">javascript</a><a class="tag" taget="_blank" href="/search/html/1.htm">html</a><a class="tag" taget="_blank" href="/search/css/1.htm">css</a><a class="tag" taget="_blank" href="/search/%E6%97%85%E6%B8%B8/1.htm">旅游</a><a class="tag" taget="_blank" href="/search/%E9%A3%8E%E6%99%AF/1.htm">风景</a> <div>⛵源码获取文末联系✈Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业|游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作|HTML期末大学生网页设计作业，Web大学生网页HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScrip</div> </li> <li><a href="/article/1835496148601761792.htm" title="HTML网页设计制作大作业（div+css）云南我的家乡旅游景点带文字滚动" target="_blank">HTML网页设计制作大作业（div+css）云南我的家乡旅游景点带文字滚动</a> <span class="text-muted">二挡起步</span> <a class="tag" taget="_blank" href="/search/web%E5%89%8D%E7%AB%AF%E6%9C%9F%E6%9C%AB%E5%A4%A7%E4%BD%9C%E4%B8%9A/1.htm">web前端期末大作业</a><a class="tag" taget="_blank" href="/search/web%E8%AE%BE%E8%AE%A1%E7%BD%91%E9%A1%B5%E8%A7%84%E5%88%92%E4%B8%8E%E8%AE%BE%E8%AE%A1/1.htm">web设计网页规划与设计</a><a class="tag" taget="_blank" href="/search/html/1.htm">html</a><a class="tag" taget="_blank" href="/search/css/1.htm">css</a><a class="tag" taget="_blank" href="/search/javascript/1.htm">javascript</a><a class="tag" taget="_blank" href="/search/dreamweaver/1.htm">dreamweaver</a><a class="tag" taget="_blank" href="/search/%E5%89%8D%E7%AB%AF/1.htm">前端</a> <div>Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作HTML期末大学生网页设计作业HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScript：做与用户的交互行为文章目录前端学习路线</div> </li> <li><a href="/article/1835495644123459584.htm" title="Day1笔记-Python简介&标识符和关键字&输入输出" target="_blank">Day1笔记-Python简介&标识符和关键字&输入输出</a> <span class="text-muted">~在杰难逃~</span> <a class="tag" taget="_blank" href="/search/Python/1.htm">Python</a><a class="tag" taget="_blank" href="/search/python/1.htm">python</a><a class="tag" taget="_blank" href="/search/%E5%BC%80%E5%8F%91%E8%AF%AD%E8%A8%80/1.htm">开发语言</a><a class="tag" taget="_blank" href="/search/%E5%A4%A7%E6%95%B0%E6%8D%AE/1.htm">大数据</a><a class="tag" taget="_blank" href="/search/%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90/1.htm">数据分析</a><a class="tag" taget="_blank" href="/search/%E6%95%B0%E6%8D%AE%E6%8C%96%E6%8E%98/1.htm">数据挖掘</a> <div>大家好，从今天开始呢，杰哥开展一个新的专栏，当然，数据分析部分也会不定时更新的，这个新的专栏主要是讲解一些Python的基础语法和知识，帮助0基础的小伙伴入门和学习Python，感兴趣的小伙伴可以开始认真学习啦！一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码，再通过语言处理程序执行向计算机发送指令，让计算机完成对应的工作，编程</div> </li> <li><a href="/article/1835495517774245888.htm" title="python八股文面试题分享及解析(1)" target="_blank">python八股文面试题分享及解析(1)</a> <span class="text-muted">Shawn________</span> <a class="tag" taget="_blank" href="/search/python/1.htm">python</a> <div>#1.'''a=1b=2不用中间变量交换a和b'''#1.a=1b=2a,b=b,aprint(a)print(b)结果：21#2.ll=[]foriinrange(3):ll.append({'num':i})print(11)结果:#[{'num':0},{'num':1},{'num':2}]#3.kk=[]a={'num':0}foriinrange(3):#0,12#可变类型，不仅仅改变</div> </li> <li><a href="/article/1835493753557708800.htm" title="每日算法&面试题，大厂特训二十八天——第二十天（树）" target="_blank">每日算法&面试题，大厂特训二十八天——第二十天（树）</a> <span class="text-muted">肥学</span> <a class="tag" taget="_blank" href="/search/%E2%9A%A1%E7%AE%97%E6%B3%95%E9%A2%98%E2%9A%A1%E9%9D%A2%E8%AF%95%E9%A2%98%E6%AF%8F%E6%97%A5%E7%B2%BE%E8%BF%9B/1.htm">⚡算法题⚡面试题每日精进</a><a class="tag" taget="_blank" href="/search/java/1.htm">java</a><a class="tag" taget="_blank" href="/search/%E7%AE%97%E6%B3%95/1.htm">算法</a><a class="tag" taget="_blank" href="/search/%E6%95%B0%E6%8D%AE%E7%BB%93%E6%9E%84/1.htm">数据结构</a> <div>目录标题导读算法特训二十八天面试题点击直接资料领取导读肥友们为了更好的去帮助新同学适应算法和面试题，最近我们开始进行专项突击一步一步来。上一期我们完成了动态规划二十一天现在我们进行下一项对各类算法进行二十八天的一个小总结。还在等什么快来一起肥学进行二十八天挑战吧！！特别介绍小白练手专栏，适合刚入手的新人欢迎订阅编程小白进阶python有趣练手项目里面包括了像《机器人尬聊》《恶搞程序》这样的有趣文章</div> </li> <li><a href="/article/1835493626688401408.htm" title="Python快速入门 —— 第三节：类与对象" target="_blank">Python快速入门 —— 第三节：类与对象</a> <span class="text-muted">孤华暗香</span> <a class="tag" taget="_blank" href="/search/Python%E5%BF%AB%E9%80%9F%E5%85%A5%E9%97%A8/1.htm">Python快速入门</a><a class="tag" taget="_blank" href="/search/python/1.htm">python</a><a class="tag" taget="_blank" href="/search/%E5%BC%80%E5%8F%91%E8%AF%AD%E8%A8%80/1.htm">开发语言</a> <div>第三节：类与对象目标：了解面向对象编程的基础概念，并学会如何定义类和创建对象。内容：类与对象：定义类：class关键字。类的构造函数：__init__()。类的属性和方法。对象的创建与使用。示例：classStudent:def__init__(self,name,age,major):self.name&#</div> </li> <li><a href="/article/1835492869062881280.htm" title="pyecharts——绘制柱形图折线图" target="_blank">pyecharts——绘制柱形图折线图</a> <span class="text-muted">2224070247</span> <a class="tag" taget="_blank" href="/search/%E4%BF%A1%E6%81%AF%E5%8F%AF%E8%A7%86%E5%8C%96/1.htm">信息可视化</a><a class="tag" taget="_blank" href="/search/python/1.htm">python</a><a class="tag" taget="_blank" href="/search/java/1.htm">java</a><a class="tag" taget="_blank" href="/search/%E6%95%B0%E6%8D%AE%E5%8F%AF%E8%A7%86%E5%8C%96/1.htm">数据可视化</a> <div>一、pyecharts概述自2013年6月百度EFE(ExcellentFrontEnd）数据可视化团队研发的ECharts1.0发布到GitHub网站以来，ECharts一直备受业界权威的关注并获得广泛好评，成为目前成熟且流行的数据可视化图表工具，被应用到诸多数据可视化的开发领域。Python作为数据分析领域最受欢迎的语言，也加入ECharts的使用行列，并研发出方便Python开发者使用的数据</div> </li> <li><a href="/article/1835491859351302144.htm" title="Python 实现图片裁剪（附代码） | Python工具" target="_blank">Python 实现图片裁剪（附代码） | Python工具</a> <span class="text-muted">剑客阿良_ALiang</span> <div>前言本文提供将图片按照自定义尺寸进行裁剪的工具方法，一如既往的实用主义。环境依赖ffmpeg环境安装，可以参考我的另一篇文章：windowsffmpeg安装部署_阿良的博客-CSDN博客本文主要使用到的不是ffmpeg，而是ffprobe也在上面这篇文章中的zip包中。ffmpy安装：pipinstallffmpy-ihttps://pypi.douban.com/simple代码不废话了，上代码</div> </li> <li><a href="/article/1835491353451130880.htm" title="【华为OD技术面试真题 - 技术面】- python八股文真题题库（4)" target="_blank">【华为OD技术面试真题 - 技术面】- python八股文真题题库（4)</a> <span class="text-muted">算法大师</span> <a class="tag" taget="_blank" href="/search/%E5%8D%8E%E4%B8%BAod/1.htm">华为od</a><a class="tag" taget="_blank" href="/search/%E9%9D%A2%E8%AF%95/1.htm">面试</a><a class="tag" taget="_blank" href="/search/python/1.htm">python</a> <div>华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选**1.Python中的`with`**用途和功能自动资源管理示例：文件操作上下文管理协议示例代码工作流程解析优点2.\_\_new\_\_和**\_\_init\_\_**区别__new____init__区别总结3.**切片（Slicing）操作**基本切片语法</div> </li> <li><a href="/article/1835490974911000576.htm" title="python os 环境变量" target="_blank">python os 环境变量</a> <span class="text-muted">CV矿工</span> <a class="tag" taget="_blank" href="/search/python/1.htm">python</a><a class="tag" taget="_blank" href="/search/%E5%BC%80%E5%8F%91%E8%AF%AD%E8%A8%80/1.htm">开发语言</a><a class="tag" taget="_blank" href="/search/numpy/1.htm">numpy</a> <div>环境变量：环境变量是程序和操作系统之间的通信方式。有些字符不宜明文写进代码里，比如数据库密码，个人账户密码，如果写进自己本机的环境变量里，程序用的时候通过os.environ.get（）取出来就行了。os.environ是一个环境变量的字典。环境变量的相关操作importos"""设置/修改环境变量：os.environ[‘环境变量名称’]=‘环境变量值’#其中key和value均为string类</div> </li> <li><a href="/article/1835490218845761536.htm" title="Python爬虫解析工具之xpath使用详解" target="_blank">Python爬虫解析工具之xpath使用详解</a> <span class="text-muted">eqa11</span> <a class="tag" taget="_blank" href="/search/python/1.htm">python</a><a class="tag" taget="_blank" href="/search/%E7%88%AC%E8%99%AB/1.htm">爬虫</a><a class="tag" taget="_blank" href="/search/%E5%BC%80%E5%8F%91%E8%AF%AD%E8%A8%80/1.htm">开发语言</a> <div>文章目录Python爬虫解析工具之xpath使用详解一、引言二、环境准备1、插件安装2、依赖库安装三、xpath语法详解1、路径表达式2、通配符3、谓语4、常用函数四、xpath在Python代码中的使用1、文档树的创建2、使用xpath表达式3、获取元素内容和属性五、总结Python爬虫解析工具之xpath使用详解一、引言在Python爬虫开发中，数据提取是一个至关重要的环节。xpath作为一门</div> </li> <li><a href="/article/1835483915071090688.htm" title="【华为OD技术面试真题 - 技术面】- python八股文真题题库（1）" target="_blank">【华为OD技术面试真题 - 技术面】- python八股文真题题库（1）</a> <span class="text-muted">算法大师</span> <a class="tag" taget="_blank" href="/search/%E5%8D%8E%E4%B8%BAod/1.htm">华为od</a><a class="tag" taget="_blank" href="/search/%E9%9D%A2%E8%AF%95/1.htm">面试</a><a class="tag" taget="_blank" href="/search/python/1.htm">python</a> <div>华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.数据预处理流程数据预处理的主要步骤工具和库2.介绍线性回归、逻辑回归模型线性回归（LinearRegression）模型形式：关键点：逻辑回归（LogisticRegression）模型形式：关键点：参数估计与评估：3.python浅拷贝及深拷贝浅拷贝（Shal</div> </li> <li><a href="/article/1835483159630802944.htm" title="nosql数据库技术与应用知识点" target="_blank">nosql数据库技术与应用知识点</a> <span class="text-muted">皆过客，揽星河</span> <a class="tag" taget="_blank" href="/search/NoSQL/1.htm">NoSQL</a><a class="tag" taget="_blank" href="/search/nosql/1.htm">nosql</a><a class="tag" taget="_blank" href="/search/%E6%95%B0%E6%8D%AE%E5%BA%93/1.htm">数据库</a><a class="tag" taget="_blank" href="/search/%E5%A4%A7%E6%95%B0%E6%8D%AE/1.htm">大数据</a><a class="tag" taget="_blank" href="/search/%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90/1.htm">数据分析</a><a class="tag" taget="_blank" href="/search/%E6%95%B0%E6%8D%AE%E7%BB%93%E6%9E%84/1.htm">数据结构</a><a class="tag" taget="_blank" href="/search/%E9%9D%9E%E5%85%B3%E7%B3%BB%E5%9E%8B%E6%95%B0%E6%8D%AE%E5%BA%93/1.htm">非关系型数据库</a> <div>Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)</div> </li> <li><a href="/article/1835481269690003456.htm" title="《Python数据分析实战终极指南》" target="_blank">《Python数据分析实战终极指南》</a> <span class="text-muted">xjt921122</span> <a class="tag" taget="_blank" href="/search/python/1.htm">python</a><a class="tag" taget="_blank" href="/search/%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90/1.htm">数据分析</a><a class="tag" taget="_blank" href="/search/%E5%BC%80%E5%8F%91%E8%AF%AD%E8%A8%80/1.htm">开发语言</a> <div>对于分析师来说，大家在学习Python数据分析的路上，多多少少都遇到过很多大坑**，有关于技能和思维的**：Excel已经没办法处理现有的数据量了，应该学Python吗？找了一大堆Python和Pandas的资料来学习，为什么自己动手就懵了？跟着比赛类公开数据分析案例练了很久，为什么当自己面对数据需求还是只会数据处理而没有分析思路？学了对比、细分、聚类分析，也会用PEST、波特五力这类分析法，为啥</div> </li> <li><a href="/article/1835477362700021760.htm" title="Python中深拷贝与浅拷贝的区别" target="_blank">Python中深拷贝与浅拷贝的区别</a> <span class="text-muted">yuxiaoyu.</span> <div>转自：http://blog.csdn.net/u014745194/article/details/70271868定义：在Python中对象的赋值其实就是对象的引用。当创建一个对象，把它赋值给另一个变量的时候，python并没有拷贝这个对象，只是拷贝了这个对象的引用而已。浅拷贝：拷贝了最外围的对象本身，内部的元素都只是拷贝了一个引用而已。也就是，把对象复制一遍，但是该对象中引用的其他对象我不复</div> </li> <li><a href="/article/1835476983614631936.htm" title="Python开发常用的三方模块如下：" target="_blank">Python开发常用的三方模块如下：</a> <span class="text-muted">换个网名有点难</span> <a class="tag" taget="_blank" href="/search/python/1.htm">python</a><a class="tag" taget="_blank" href="/search/%E5%BC%80%E5%8F%91%E8%AF%AD%E8%A8%80/1.htm">开发语言</a> <div>Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机</div> </li> <li><a href="/article/1835473704432267264.htm" title="Python编译器" target="_blank">Python编译器</a> <span class="text-muted">鹿鹿~</span> <a class="tag" taget="_blank" href="/search/Python%E7%BC%96%E8%AF%91%E5%99%A8/1.htm">Python编译器</a><a class="tag" taget="_blank" href="/search/Python/1.htm">Python</a><a class="tag" taget="_blank" href="/search/python/1.htm">python</a><a class="tag" taget="_blank" href="/search/%E5%BC%80%E5%8F%91%E8%AF%AD%E8%A8%80/1.htm">开发语言</a><a class="tag" taget="_blank" href="/search/%E5%90%8E%E7%AB%AF/1.htm">后端</a> <div>嘿嘿嘿我又来了啊有些小盆友可能不知道Python其实是有编译器的，也就是PyCharm。你们可能会问到这个是干嘛的又不可以吃也不可以穿好像没有什么用，其实你还说对了这个还真的不可以吃也不可以穿，但是它用来干嘛的呢。用来编译你所打出的代码进行运行（可能这里说的有点不对但是只是个人认为）现在我们来说说PyCharm是用来干嘛的。PyCharm是一种PythonIDE，带有一整套可以帮助用户在使用Pyt</div> </li> <li><a href="/article/37.htm" title="ASM系列五利用TreeApi 解析生成Class" target="_blank">ASM系列五利用TreeApi 解析生成Class</a> <span class="text-muted">lijingyao8206</span> <a class="tag" taget="_blank" href="/search/ASM/1.htm">ASM</a><a class="tag" taget="_blank" href="/search/%E5%AD%97%E8%8A%82%E7%A0%81%E5%8A%A8%E6%80%81%E7%94%9F%E6%88%90/1.htm">字节码动态生成</a><a class="tag" taget="_blank" href="/search/ClassNode/1.htm">ClassNode</a><a class="tag" taget="_blank" href="/search/TreeAPI/1.htm">TreeAPI</a> <div> 前面CoreApi的介绍部分基本涵盖了ASMCore包下面的主要API及功能，其中还有一部分关于MetaData的解析和生成就不再赘述。这篇开始介绍ASM另一部分主要的Api。TreeApi。这一部分源码是关联的asm-tree-5.0.4的版本。在介绍前，先要知道一点， Tree工程的接口基本可以完</div> </li> <li><a href="/article/164.htm" title="链表树——复合数据结构应用实例" target="_blank">链表树——复合数据结构应用实例</a> <span class="text-muted">bardo</span> <a class="tag" taget="_blank" href="/search/%E6%95%B0%E6%8D%AE%E7%BB%93%E6%9E%84/1.htm">数据结构</a><a class="tag" taget="_blank" href="/search/%E6%A0%91%E5%9E%8B%E7%BB%93%E6%9E%84/1.htm">树型结构</a><a class="tag" taget="_blank" href="/search/%E8%A1%A8%E7%BB%93%E6%9E%84%E8%AE%BE%E8%AE%A1/1.htm">表结构设计</a><a class="tag" taget="_blank" href="/search/%E9%93%BE%E8%A1%A8/1.htm">链表</a><a class="tag" taget="_blank" href="/search/%E8%8F%9C%E5%8D%95%E6%8E%92%E5%BA%8F/1.htm">菜单排序</a> <div>我们清楚：数据库设计中，表结构设计的好坏，直接影响程序的复杂度。所以，本文就无限级分类（目录）树与链表的复合在表设计中的应用进行探讨。当然，什么是树，什么是链表，这里不作介绍。有兴趣可以去看相关的教材。需求简介：经常遇到这样的需求，我们希望能将保存在数据库中的树结构能够按确定的顺序读出来。比如，多级菜单、组织结构、商品分类。更具体的，我们希望某个二级菜单在这一级别中就是第一个。虽然它是最后</div> </li> <li><a href="/article/291.htm" title="为啥要用位运算代替取模呢" target="_blank">为啥要用位运算代替取模呢</a> <span class="text-muted">chenchao051</span> <a class="tag" taget="_blank" href="/search/%E4%BD%8D%E8%BF%90%E7%AE%97/1.htm">位运算</a><a class="tag" taget="_blank" href="/search/%E5%93%88%E5%B8%8C/1.htm">哈希</a><a class="tag" taget="_blank" href="/search/%E6%B1%87%E7%BC%96/1.htm">汇编</a> <div> 在hash中查找key的时候，经常会发现用&取代%，先看两段代码吧， JDK6中的HashMap中的indexFor方法： /** * Returns index for hash code h. */ static int indexFor(int h, int length) { </div> </li> <li><a href="/article/418.htm" title="最近的情况" target="_blank">最近的情况</a> <span class="text-muted">麦田的设计者</span> <a class="tag" taget="_blank" href="/search/%E7%94%9F%E6%B4%BB/1.htm">生活</a><a class="tag" taget="_blank" href="/search/%E6%84%9F%E6%82%9F/1.htm">感悟</a><a class="tag" taget="_blank" href="/search/%E8%AE%A1%E5%88%92/1.htm">计划</a><a class="tag" taget="_blank" href="/search/%E8%BD%AF%E8%80%83/1.htm">软考</a><a class="tag" taget="_blank" href="/search/%E6%83%B3/1.htm">想</a> <div> 今天是2015年4月27号整理一下最近的思绪以及要完成的任务 1、最近在驾校科目二练车，每周四天，练三周。其实做什么都要用心，追求合理的途径解决。为</div> </li> <li><a href="/article/545.htm" title="PHP去掉字符串中最后一个字符的方法" target="_blank">PHP去掉字符串中最后一个字符的方法</a> <span class="text-muted">IT独行者</span> <a class="tag" taget="_blank" href="/search/PHP/1.htm">PHP</a><a class="tag" taget="_blank" href="/search/%E5%AD%97%E7%AC%A6%E4%B8%B2/1.htm">字符串</a> <div>今天在PHP项目开发中遇到一个需求，去掉字符串中的最后一个字符原字符串1,2,3,4,5,6, 去掉最后一个字符","，最终结果为1,2,3,4,5,6 代码如下： $str = "1,2,3,4,5,6,"; $newstr = substr($str,0,strlen($str)-1); echo $newstr; </div> </li> <li><a href="/article/672.htm" title="hadoop在linux上单机安装过程" target="_blank">hadoop在linux上单机安装过程</a> <span class="text-muted">_wy_</span> <a class="tag" taget="_blank" href="/search/linux/1.htm">linux</a><a class="tag" taget="_blank" href="/search/hadoop/1.htm">hadoop</a> <div>1、安装JDK jdk版本最好是1.6以上，可以使用执行命令java -version查看当前JAVA版本号，如果报命令不存在或版本比较低，则需要安装一个高版本的JDK，并在/etc/profile的文件末尾，根据本机JDK实际的安装位置加上以下几行： export JAVA_HOME=/usr/java/jdk1.7.0_25 </div> </li> <li><a href="/article/799.htm" title="JAVA进阶----分布式事务的一种简单处理方法" target="_blank">JAVA进阶----分布式事务的一种简单处理方法</a> <span class="text-muted">无量</span> <a class="tag" taget="_blank" href="/search/%E5%A4%9A%E7%B3%BB%E7%BB%9F%E4%BA%A4%E4%BA%92/1.htm">多系统交互</a><a class="tag" taget="_blank" href="/search/%E5%88%86%E5%B8%83%E5%BC%8F/1.htm">分布式</a><a class="tag" taget="_blank" href="/search/%E4%BA%8B%E5%8A%A1/1.htm">事务</a> <div>每个方法都是原子操作：提供第三方服务的系统，要同时提供执行方法和对应的回滚方法 A系统调用B,C,D系统完成分布式事务 =========执行开始======== A.aa(); try { B.bb(); } catch(Exception e) { A.rollbackAa(); } try { C.cc(); } catch(Excep</div> </li> <li><a href="/article/926.htm" title="安墨移动广告：移动DSP厚积薄发引领未来广告业发展命脉" target="_blank">安墨移动广告：移动DSP厚积薄发引领未来广告业发展命脉</a> <span class="text-muted">矮蛋蛋</span> <a class="tag" taget="_blank" href="/search/hadoop/1.htm">hadoop</a><a class="tag" taget="_blank" href="/search/%E4%BA%92%E8%81%94%E7%BD%91/1.htm">互联网</a> <div>　　“谁掌握了强大的DSP技术，谁将引领未来的广告行业发展命脉。”2014年，移动广告行业的热点非移动DSP莫属。各个圈子都在纷纷谈论，认为移动DSP是行业突破点，一时间许多移动广告联盟风起云涌，竞相推出专属移动DSP产品。　　到底什么是移动DSP呢? 　　DSP(Demand-SidePlatform)，就是需求方平台，为解决广告主投放的各种需求，真正实现人群定位的精准广 </div> </li> <li><a href="/article/1053.htm" title="myelipse设置" target="_blank">myelipse设置</a> <span class="text-muted">alafqq</span> <a class="tag" taget="_blank" href="/search/IP/1.htm">IP</a> <div> 在一个项目的完整的生命周期中，其维护费用，往往是其开发费用的数倍。因此项目的可维护性、可复用性是衡量一个项目好坏的关键。而注释则是可维护性中必不可少的一环。注释模板导入步骤安装方法：打开eclipse/myeclipse 选择 window-->Preferences-->JAVA-->Code-->Code </div> </li> <li><a href="/article/1180.htm" title="java数组" target="_blank">java数组</a> <span class="text-muted">百合不是茶</span> <a class="tag" taget="_blank" href="/search/java%E6%95%B0%E7%BB%84/1.htm">java数组</a> <div>java数组的声明创建初始化； java支持C语言数组中的每个数都有唯一的一个下标一维数组的定义声明： int[] a = new int[3];声明数组中有三个数int[3] int[] a 中有三个数，下标从0开始，可以同过for来遍历数组中的数 </div> </li> <li><a href="/article/1307.htm" title="javascript读取表单数据" target="_blank">javascript读取表单数据</a> <span class="text-muted">bijian1013</span> <a class="tag" taget="_blank" href="/search/JavaScript/1.htm">JavaScript</a> <div>利用javascript读取表单数据，可以利用以下三种方法获取： 1、通过表单ID属性：var a = document.getElementByIdx_x_x("id"); 2、通过表单名称属性：var b = document.getElementsByName("name"); 3、直接通过表单名字获取：var c = form.content.</div> </li> <li><a href="/article/1434.htm" title="探索JUnit4扩展：使用Theory" target="_blank">探索JUnit4扩展：使用Theory</a> <span class="text-muted">bijian1013</span> <a class="tag" taget="_blank" href="/search/java/1.htm">java</a><a class="tag" taget="_blank" href="/search/JUnit/1.htm">JUnit</a><a class="tag" taget="_blank" href="/search/Theory/1.htm">Theory</a> <div>理论机制（Theory）一.为什么要引用理论机制（Theory）当今软件开发中，测试驱动开发（TDD — Test-driven development）越发流行。为什么 TDD 会如此流行呢？因为它确实拥有很多优点，它允许开发人员通过简单的例子来指定和表明他们代码的行为意图。 TDD 的优点： &nb</div> </li> <li><a href="/article/1561.htm" title="[Spring Data Mongo一]Spring Mongo Template操作MongoDB" target="_blank">[Spring Data Mongo一]Spring Mongo Template操作MongoDB</a> <span class="text-muted">bit1129</span> <a class="tag" taget="_blank" href="/search/template/1.htm">template</a> <div>什么是Spring Data Mongo Spring Data MongoDB项目对访问MongoDB的Java客户端API进行了封装，这种封装类似于Spring封装Hibernate和JDBC而提供的HibernateTemplate和JDBCTemplate，主要能力包括 1. 封装客户端跟MongoDB的链接管理 2. 文档-对象映射，通过注解:@Document(collectio</div> </li> <li><a href="/article/1688.htm" title="【Kafka八】Zookeeper上关于Kafka的配置信息" target="_blank">【Kafka八】Zookeeper上关于Kafka的配置信息</a> <span class="text-muted">bit1129</span> <a class="tag" taget="_blank" href="/search/zookeeper/1.htm">zookeeper</a> <div>问题： 1. Kafka的哪些信息记录在Zookeeper中 2. Consumer Group消费的每个Partition的Offset信息存放在什么位置 3. Topic的每个Partition存放在哪个Broker上的信息存放在哪里 4. Producer跟Zookeeper究竟有没有关系？没有关系！！！ //consumers、config、brokers、cont</div> </li> <li><a href="/article/1815.htm" title="java OOM内存异常的四种类型及异常与解决方案" target="_blank">java OOM内存异常的四种类型及异常与解决方案</a> <span class="text-muted">ronin47</span> <a class="tag" taget="_blank" href="/search/java+OOM+%E5%86%85%E5%AD%98%E5%BC%82%E5%B8%B8/1.htm">java OOM 内存异常</a> <div> 　OOM异常的四种类型：　　　　　一：　StackOverflowError ：通常因为递归函数引起（死递归，递归太深）。-Xss 128k 一般够用。　二：　out Of memory: PermGen Space：通常是动态类大多，比如web 服务器自动更新部署时引起。-Xmx</div> </li> <li><a href="/article/1942.htm" title="java-实现链表反转-递归和非递归实现" target="_blank">java-实现链表反转-递归和非递归实现</a> <span class="text-muted">bylijinnan</span> <a class="tag" taget="_blank" href="/search/java/1.htm">java</a> <div>20120422更新：对链表中部分节点进行反转操作，这些节点相隔k个： 0->1->2->3->4->5->6->7->8->9 k=2 8->1->6->3->4->5->2->7->0->9 注意1 3 5 7 9 位置是不变的。解法：将链表拆成两部分： a.0-&</div> </li> <li><a href="/article/2069.htm" title="Netty源码学习-DelimiterBasedFrameDecoder" target="_blank">Netty源码学习-DelimiterBasedFrameDecoder</a> <span class="text-muted">bylijinnan</span> <a class="tag" taget="_blank" href="/search/java/1.htm">java</a><a class="tag" taget="_blank" href="/search/netty/1.htm">netty</a> <div> 看DelimiterBasedFrameDecoder的API，有举例：接收到的ChannelBuffer如下： +--------------+ | ABC\nDEF\r\n | +--------------+ 经过DelimiterBasedFrameDecoder(Delimiters.lineDelimiter())之后，得到： +-----+----</div> </li> <li><a href="/article/2196.htm" title="linux的一些命令 -查看cc攻击-网口ip统计等" target="_blank">linux的一些命令 -查看cc攻击-网口ip统计等</a> <span class="text-muted">hotsunshine</span> <a class="tag" taget="_blank" href="/search/linux/1.htm">linux</a> <div>Linux判断CC攻击命令详解 2011年12月23日 ⁄ 安全 ⁄ 暂无评论查看所有80端口的连接数 netstat -nat|grep -i '80'|wc -l 对连接的IP按连接数量进行排序 netstat -ntu | awk '{print $5}' | cut -d: -f1 | sort | uniq -c | sort -n 查看TCP连接状态 n</div> </li> <li><a href="/article/2323.htm" title="Spring获取SessionFactory" target="_blank">Spring获取SessionFactory</a> <span class="text-muted">ctrain</span> <a class="tag" taget="_blank" href="/search/sessionFactory/1.htm">sessionFactory</a> <div> String sql = "select sysdate from dual"; WebApplicationContext wac = ContextLoader.getCurrentWebApplicationContext(); String[] names = wac.getBeanDefinitionNames(); for(int i=0; i&</div> </li> <li><a href="/article/2450.htm" title="Hive几种导出数据方式" target="_blank">Hive几种导出数据方式</a> <span class="text-muted">daizj</span> <a class="tag" taget="_blank" href="/search/hive/1.htm">hive</a><a class="tag" taget="_blank" href="/search/%E6%95%B0%E6%8D%AE%E5%AF%BC%E5%87%BA/1.htm">数据导出</a> <div>Hive几种导出数据方式 1.拷贝文件如果数据文件恰好是用户需要的格式，那么只需要拷贝文件或文件夹就可以。 hadoop fs –cp source_path target_path 2.导出到本地文件系统 --不能使用insert into local directory来导出数据，会报错 --只能使用</div> </li> <li><a href="/article/2577.htm" title="编程之美" target="_blank">编程之美</a> <span class="text-muted">dcj3sjt126com</span> <a class="tag" taget="_blank" href="/search/%E7%BC%96%E7%A8%8B/1.htm">编程</a><a class="tag" taget="_blank" href="/search/PHP/1.htm">PHP</a><a class="tag" taget="_blank" href="/search/%E9%87%8D%E6%9E%84/1.htm">重构</a> <div>我个人的 PHP 编程经验中，递归调用常常与静态变量使用。静态变量的含义可以参考 PHP 手册。希望下面的代码，会更有利于对递归以及静态变量的理解 header("Content-type: text/plain"); function static_function () { static $i = 0; if ($i++ < 1</div> </li> <li><a href="/article/2704.htm" title="Android保存用户名和密码" target="_blank">Android保存用户名和密码</a> <span class="text-muted">dcj3sjt126com</span> <a class="tag" taget="_blank" href="/search/android/1.htm">android</a> <div>转自：http://www.2cto.com/kf/201401/272336.html 我们不管在开发一个项目或者使用别人的项目，都有用户登录功能，为了让用户的体验效果更好，我们通常会做一个功能，叫做保存用户，这样做的目地就是为了让用户下一次再使用该程序不会重新输入用户名和密码，这里我使用3种方式来存储用户名和密码 1、通过普通的txt文本存储 2、通过properties属性文件进行存</div> </li> <li><a href="/article/2831.htm" title="Oracle 复习笔记之同义词" target="_blank">Oracle 复习笔记之同义词</a> <span class="text-muted">eksliang</span> <a class="tag" taget="_blank" href="/search/Oracle+%E5%90%8C%E4%B9%89%E8%AF%8D/1.htm">Oracle 同义词</a><a class="tag" taget="_blank" href="/search/Oracle+synonym/1.htm">Oracle synonym</a> <div>转载请出自出处：http://eksliang.iteye.com/blog/2098861 1.什么是同义词同义词是现有模式对象的一个别名。概念性的东西，什么是模式呢？创建一个用户，就相应的创建了一个模式。模式是指数据库对象，是对用户所创建的数据对象的总称。模式对象包括表、视图、索引、同义词、序列、过</div> </li> <li><a href="/article/2958.htm" title="Ajax案例" target="_blank">Ajax案例</a> <span class="text-muted">gongmeitao</span> <a class="tag" taget="_blank" href="/search/Ajax/1.htm">Ajax</a><a class="tag" taget="_blank" href="/search/jsp/1.htm">jsp</a> <div>数据库采用Sql Server2005 项目名称为:Ajax_Demo 1.com.demo.conn包 package com.demo.conn; import java.sql.Connection;import java.sql.DriverManager;import java.sql.SQLException; //获取数据库连接的类public class DBConnec</div> </li> <li><a href="/article/3085.htm" title="ASP.NET中Request.RawUrl、Request.Url的区别" target="_blank">ASP.NET中Request.RawUrl、Request.Url的区别</a> <span class="text-muted">hvt</span> <a class="tag" taget="_blank" href="/search/.net/1.htm">.net</a><a class="tag" taget="_blank" href="/search/Web/1.htm">Web</a><a class="tag" taget="_blank" href="/search/C%23/1.htm">C#</a><a class="tag" taget="_blank" href="/search/asp.net/1.htm">asp.net</a><a class="tag" taget="_blank" href="/search/hovertree/1.htm">hovertree</a> <div> 如果访问的地址是：http://h.keleyi.com/guestbook/addmessage.aspx?key=hovertree%3C&n=myslider#zonemenu那么Request.Url.ToString() 的值是：http://h.keleyi.com/guestbook/addmessage.aspx?key=hovertree<&</div> </li> <li><a href="/article/3212.htm" title="SVG 教程（七）SVG 实例，SVG 参考手册" target="_blank">SVG 教程（七）SVG 实例，SVG 参考手册</a> <span class="text-muted">天梯梦</span> <a class="tag" taget="_blank" href="/search/svg/1.htm">svg</a> <div>SVG 实例在线实例下面的例子是把SVG代码直接嵌入到HTML代码中。谷歌Chrome，火狐，Internet Explorer9，和Safari都支持。注意：下面的例子将不会在Opera运行，即使Opera支持SVG - 它也不支持SVG在HTML代码中直接使用。 SVG 实例 SVG基本形状一个圆矩形不透明矩形一个矩形不透明2 一个带圆角矩</div> </li> <li><a href="/article/3339.htm" title="事务管理" target="_blank">事务管理</a> <span class="text-muted">luyulong</span> <a class="tag" taget="_blank" href="/search/java/1.htm">java</a><a class="tag" taget="_blank" href="/search/spring/1.htm">spring</a><a class="tag" taget="_blank" href="/search/%E7%BC%96%E7%A8%8B/1.htm">编程</a><a class="tag" taget="_blank" href="/search/%E4%BA%8B%E5%8A%A1/1.htm">事务</a> <div>事物管理 spring事物的好处为不同的事物API提供了一致的编程模型支持声明式事务管理提供比大多数事务API更简单更易于使用的编程式事务管理API 整合spring的各种数据访问抽象 TransactionDefinition 定义了事务策略 int getIsolationLevel()得到当前事务的隔离级别 READ_COMMITTED </div> </li> <li><a href="/article/3466.htm" title="基础数据结构和算法十一：Red-black binary search tree" target="_blank">基础数据结构和算法十一：Red-black binary search tree</a> <span class="text-muted">sunwinner</span> <a class="tag" taget="_blank" href="/search/Algorithm/1.htm">Algorithm</a><a class="tag" taget="_blank" href="/search/Red-black/1.htm">Red-black</a> <div> The insertion algorithm for 2-3 trees just described is not difficult to understand; now, we will see that it is also not difficult to implement. We will consider a simple representation known</div> </li> <li><a href="/article/3593.htm" title="centos同步时间" target="_blank">centos同步时间</a> <span class="text-muted">stunizhengjia</span> <a class="tag" taget="_blank" href="/search/linux/1.htm">linux</a><a class="tag" taget="_blank" href="/search/%E9%9B%86%E7%BE%A4%E5%90%8C%E6%AD%A5%E6%97%B6%E9%97%B4/1.htm">集群同步时间</a> <div>做了集群，时间的同步就显得非常必要了。以下是查到的如何做时间同步。在CentOS 5不再区分客户端和服务器，只要配置了NTP，它就会提供NTP服务。 1)确认已经ntp程序包： # yum install ntp 2)配置时间源（默认就行，不需要修改） # vi /etc/ntp.conf server pool.ntp.o</div> </li> <li><a href="/article/3720.htm" title="ITeye 9月技术图书有奖试读获奖名单公布" target="_blank">ITeye 9月技术图书有奖试读获奖名单公布</a> <span class="text-muted">ITeye管理员</span> <a class="tag" taget="_blank" href="/search/ITeye/1.htm">ITeye</a> <div>ITeye携手博文视点举办的9月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 9月试读活动回顾：http://webmaster.iteye.com/blog/2118112本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《NFC：Arduino、Andro</div> </li> </ul> </div> </div> </div> <div> <div class="container"> <div class="indexes"> <strong>按字母分类：</strong> <a href="/tags/A/1.htm" target="_blank">A</a><a href="/tags/B/1.htm" target="_blank">B</a><a href="/tags/C/1.htm" target="_blank">C</a><a href="/tags/D/1.htm" target="_blank">D</a><a href="/tags/E/1.htm" target="_blank">E</a><a href="/tags/F/1.htm" target="_blank">F</a><a href="/tags/G/1.htm" target="_blank">G</a><a href="/tags/H/1.htm" target="_blank">H</a><a href="/tags/I/1.htm" target="_blank">I</a><a href="/tags/J/1.htm" target="_blank">J</a><a href="/tags/K/1.htm" target="_blank">K</a><a href="/tags/L/1.htm" target="_blank">L</a><a href="/tags/M/1.htm" target="_blank">M</a><a href="/tags/N/1.htm" target="_blank">N</a><a href="/tags/O/1.htm" target="_blank">O</a><a href="/tags/P/1.htm" target="_blank">P</a><a href="/tags/Q/1.htm" target="_blank">Q</a><a href="/tags/R/1.htm" target="_blank">R</a><a href="/tags/S/1.htm" target="_blank">S</a><a href="/tags/T/1.htm" target="_blank">T</a><a href="/tags/U/1.htm" target="_blank">U</a><a href="/tags/V/1.htm" target="_blank">V</a><a href="/tags/W/1.htm" target="_blank">W</a><a href="/tags/X/1.htm" target="_blank">X</a><a href="/tags/Y/1.htm" target="_blank">Y</a><a href="/tags/Z/1.htm" target="_blank">Z</a><a href="/tags/0/1.htm" target="_blank">其他</a> </div> </div> </div> <footer id="footer" class="mb30 mt30"> <div class="container"> <div class="footBglm"> <a target="_blank" href="/">首页</a> - <a target="_blank" href="/custom/about.htm">关于我们</a> - <a target="_blank" href="/search/Java/1.htm">站内搜索</a> - <a target="_blank" href="/sitemap.txt">Sitemap</a> - <a target="_blank" href="/custom/delete.htm">侵权投诉</a> </div> <div class="copyright">版权所有 IT知识库 CopyRight © 2000-2050 E-COM-NET.COM , All Rights Reserved.  </div> </div> </footer>  <script type="text/javascript" src="/static/syntaxhighlighter/scripts/shCore.js"></script> <script type="text/javascript" src="/static/syntaxhighlighter/scripts/shLegacy.js"></script> <script type="text/javascript" src="/static/syntaxhighlighter/scripts/shAutoloader.js"></script> <link type="text/css" rel="stylesheet" href="/static/syntaxhighlighter/styles/shCoreDefault.css"/> <script type="text/javascript" src="/static/syntaxhighlighter/src/my_start_1.js"></script> </body> </html>