【爬虫】4.2 Scrapy 中查找 html 元素

目录

Xpath简介

1. Scrapy 的 Xpath 简介

(1)使用xpath查找HTML中的元素

2. Xpath 查找 html 元素

(2)"//"与"/"的使用

(3)使用"."进行Xpath连续调用

(4)extract与extract_first函数使用

(5)获取元素属性值

(6)获取节点的文本值

(7)多个文本节点值

(8)使用condition限定tag元素

(9)使用position()序号来确定所选择的元素

(10)使用"*"代表任何element元素,不包括Text、Comment的结点

(11)使用@*代表属性

(12)Xpath搜索元素的父结点

(13)搜索后面的兄弟结点

(14)搜索前面的兄弟结点


Xpath简介

  • XPath是一门在XMLHTML文档中查找信息的语言,通 路径表达式XML文档中选取节点或节点位置,可以用 来在XMLHTML文档中对元素和属性进行遍历。
  • Xpath节点类型:元素、属性、文本、命名空间、指令处理、注释及文档
  • xpath定位方式(路径表达式+索引+属性
  • 格式:/node1/node2/node3[1]/node4[@attribute[="value“]]
  • xpath索引值从1开始
Xpath 常用表达式
表达式
描述
例子
nodename
选取此节点
例: body ,选取 body 元素
/
绝对路径 , 表示当前节点的下一级节点元素。
例: /body ,当前节点下一级的 body 元素,
默认当前节点选取根元素
//
相对路径,全文档查找;
例: //title ,全文档搜索 title 元素 body//title,在 body 元素后代中搜索所有 title 元素。
.
当前节点
例: .//title ,在当前节点后代中搜索所有 title元素
@
选取属性
//node[@attribute] ,例包含 attribute 属性的节点node
*
通配符
/* ,绝对路径匹配任意节点, //* ,全文匹 配任意节点,@* ,匹配任意属性
Xpath 特有的Selector对象函数/方法
函数/方法
功能描述
extract()
获取对象的元素文本的列表
extract_first()
获取对象的元素文本的列表的第一个元素
"/@attrName"
/@attrName" 获取元素的属性节点对象,用extract() 获取属性值
"/text()"
获取元素的文本节点对象,用 extract() 获取文本值
"/tag[condition]"
获取符合限定条件的元素对象,其中 condition 是由这个 tag 的属性、
文本等计算出的一个逻辑值。多个限定条件如下:
"tag[condition1][condition2]...[conditionN]" 或者:
"tag[condition1 and condition2 and ... and conditionN]"
position()
限定某元素对象,从 1 开始。可通过 and or 等构造复杂的表达式
"element/parent::*"
获取元素的父亲节点对象
" element/folllowing-sibling::*"
所有后序同级兄弟节点
“element/preceding-sibling::*“
所有前序同级兄弟节点

1. Scrapy 的 Xpath 简介

(1)使用xpath查找HTML中的元素

# 使用Xpath查找HTML中的元素
from scrapy.selector import Selector

htmlText = '''


    
        Harry Potter
        29.99
    
    
        Learning XML
        39.95
    


'''
selector = Selector(text=htmlText)
print(type(selector))  # 
print(selector)  # 
s = selector.xpath("//title")  # 全文查找title  形成一个Selector的列表
print(type(s))  # 
print(s)  # [, ]
from scrapy.selector import Selector
scrapy 中引入 Selector 类,这个类就是选择查找类。
selector=Selector(text=htmlText)
使用 htmlText 的文字建立 Selector类,就是装载 HTML 文档,文档装载后就形成一个   Selector对象,就可以使用 xpath 查找元素。
print(type(selector)
可看到 selector 是一个类型为 scrapy.selector.unified.Selector,这个类型是一个有 xpath 方法的类 型。
s=selector.xpath("//title")
这个方法在文档中查找 所有 </span> <span style="color:#000000;">的元素,其中"//"</span> <span style="color:#000000;">表示文档中的任何位置。一般地: </span> </div> <div> <span style="color:#000000;">selector.xpath("//tagName") </span> </div> <div> <span style="color:#000000;">表示在权文档中搜索<tagName></span> <span style="color:#000000;">的</span> <span style="color:#000000;">tags</span> <span style="color:#000000;">,形成一个</span> <span style="color:#000000;">Selector</span> <span style="color:#000000;">的列表。 </span> </div> </blockquote> <blockquote> <div> <span style="color:#ff0000;">print(type(s)) </span> </div> <div> <span style="color:#000000;">由于</span> <span style="color:#000000;"><title></span> <span style="color:#000000;">有两个元素,因此这是一个 scrapy.selector.unified.SelectorList类,</span> </div> <div> <span style="color:#000000;">类似 scrapy.selector.unified.Selector的列表。</span> </div> </blockquote> <div> <blockquote> <div> <span style="color:#ff0000;">print(s) </span> </div> <div> <span style="color:#000000;">s</span> <span style="color:#000000;">包含两个</span> <span style="color:#000000;">Selector</span> <span style="color:#000000;">对象,一个是</span> <span style="color:#000000;"><Selector xpath='//title' data='<title lang="eng">Harry Potter'>,
另外一个是
由此可见一般 selector 搜索一个 HTML 元素的方法是:
selector.xpath("//tagName")
在装载 HTML 文档后 selector=Selector(text=htmlText)得到的 selector 是对应全文档顶层的元素 的,其中 "//" 表示全文档搜索,结果是一个 Selector 的列表,哪怕只有一个元素也成一个列表,例如:
  • selector.xpath("//body") 搜索到元素,结果是一个Selector的列表,包含一个Selector元素;
  •  selector.xpath("//title")搜索到两个</span><span style="color:#000000;">元素,结果是</span><span style="color:#000000;">Selector </span><span style="color:#000000;">的列表,包含</span><span style="color:#000000;">2</span><span style="color:#000000;">个</span><span style="color:#000000;">Selector</span><span style="color:#000000;">元素; </span></li> <li><span style="color:#000000;">selector.xpath("//book")</span><span style="color:#000000;">搜索到两个</span><span style="color:#000000;"><book></span><span style="color:#000000;">元素,结果是</span><span style="color:#000000;">Selector </span><span style="color:#000000;">的列表,包含</span><span style="color:#000000;">2</span><span style="color:#000000;">个</span><span style="color:#000000;">Selector</span><span style="color:#000000;">元素</span></li> </ul> </div> </div> </div> <h1 id="2.%20Xpath%20%E6%9F%A5%E6%89%BE%20html%20%E5%85%83%E7%B4%A0">2. Xpath 查找 html 元素</h1> <h3 id="%EF%BC%882%EF%BC%89%22%2F%2F%22%E4%B8%8E%22%2F%22%E7%9A%84%E4%BD%BF%E7%94%A8">(2)"//"与"/"的使用</h3> <p>        使用 “<strong>//</strong>” 表示文档下面的<strong>所有结点</strong>元素,用 “<strong>/</strong>” 表示<strong>当前结点</strong>的下一级结点元素</p> <pre><code class="language-python"># "//"与"/"的使用 from scrapy.selector import Selector htmlText = ''' <html><body> <bookstore> <book> <title lang="eng">Harry Potter 29.99 Learning XML 39.95 ''' selector = Selector(text=htmlText) print(type(selector)) print(selector) print("====================s1====================") s1 = selector.xpath("//bookstore/book") # 搜索下一级的元素,找到2个 print(type(s1)) print(s1) print("====================s2====================") s2 = selector.xpath("//body/book") # 搜索下一级的元素,结果为空 print(type(s2)) print(s2) print("====================s3====================") s3 = selector.xpath("//body//book") # 搜索下元素,找到2个 print(type(s3)) print(s3) print("====================s4====================") s4 = selector.xpath("/body//book") # 搜索文档下一级的下的元素,结果为空,∵文档的下一级是元素,不是元素 print(type(s4)) print(s4) print("====================s5====================") s5 = selector.xpath("/html/body//book") # 或 s5 = selector.xpath("/html//book") # 搜索元素,找到2个 print(type(s5)) print(s5) print("====================s6====================") s6 = selector.xpath("//book/title") # 搜索文档中所有下一级的元素,找到2个 print(type(s6)) print(s6) # 结果与 selector.xpath("//title") selector.xpath("//bookstore//title")一样 print("====================s7====================") s7 = selector.xpath("//book//price") # # 搜索文档中所有<book>下一级的<price>元素,找到2个 print(type(s7)) print(s7) # 结果与 selector.xpath("//price")一样 </code></pre> <blockquote> <p><strong>运行结果:</strong><br> <class 'scrapy.selector.unified.Selector'><br> <Selector query=None data='<html><body>\n<bookstore>\n    <book>\n ...'><br> ====================s1====================<br> <class 'scrapy.selector.unified.SelectorList'><br> [<Selector query='//bookstore/book' data='<book>\n        <title lang="eng">Harr...'>, <Selector query='//bookstore/book' data='<book>\n        <title lang="eng">Lear...'>]<br> ====================s2====================<br> <class 'scrapy.selector.unified.SelectorList'><br> []<br> ====================s3====================<br> <class 'scrapy.selector.unified.SelectorList'><br> [<Selector query='//body//book' data='<book>\n        <title lang="eng">Harr...'>, <Selector query='//body//book' data='<book>\n        <title lang="eng">Lear...'>]<br> ====================s4====================<br> <class 'scrapy.selector.unified.SelectorList'><br> []<br> ====================s5====================<br> <class 'scrapy.selector.unified.SelectorList'><br> [<Selector query='/html/body//book' data='<book>\n        <title lang="eng">Harr...'>, <Selector query='/html/body//book' data='<book>\n        <title lang="eng">Lear...'>]<br> ====================s6====================<br> <class 'scrapy.selector.unified.SelectorList'><br> [<Selector query='//book/title' data='<title lang="eng">Harry Potter'>, ]
    ====================s7====================

    [, ]

    (3)使用"."进行Xpath连续调用

            使用 “.” 表示当前结点元素,使用 Xpath 可以连续调用,如果前一个 Xpath 返回一个 Selector 的列表,那么这个列表可以继续调用 Xpath 

            功能:为了每个列表元素调用 Xpath ,最后结果是全部元素调用 Xpath 的汇总

    # 使用"."进行Xpath连续调用
    from scrapy.selector import Selector
    
    htmlText = '''
    
    
        books
        
            Novel
            Harry Potter
            29.99
        
        
            TextBook
            Learning XML
            39.95
        
    
    
    '''
    selector = Selector(text=htmlText)
    s = selector.xpath("//book").xpath("./title")
    # s = selector.xpath("//book").xpath("/title")  # 结果是空的,因为后面的 xpath("/title")从文档开始搜索。
    # s = selector.xpath("//book").xpath("//title")  # 结果有10个元素,因为每个 <book>都驱动xpath("//title")在全文档搜索 <title>元素,每次都搜索到5个元素。
    for e in s:
        print(e)</code></pre> 
      <blockquote> 
       <p><strong>运行结果:</strong></p> 
       <p><Selector query='./title' data='<title>Novel'>


            selector.xpath("//book") 首先搜索到文档中所有 元素,总共有2 个,然后再次调用 xpath("./title") ,就是从当前元素 开始往下一级搜索</span> <span style="color:#000000;">,每个</span> <span style="color:#000000;"><book></span> <span style="color:#000000;">都找到</span> <span style="color:#000000;">2</span> <span style="color:#000000;">个</span> <span style="color:#000000;"><title></span> <span style="color:#000000;">,因此结果有</span> <span style="color:#000000;">4</span> <span style="color:#000000;">个</span> <span style="color:#000000;"><title>。</span> </div> <div></div> <div> <blockquote> <div> <strong><span style="color:#fe2c24;">注意:</span></strong> <span style="color:#000000;">如果</span> <span style="color:#000000;">xpath</span> <span style="color:#000000;">连续调用时不指定是从前一个</span> <span style="color:#000000;">xpath</span> <span style="color:#000000;">的结果元素开始的,那么默认是从全文档开始的,结果会不一样,例如: </span> </div> <div> <span style="color:#000000;">s=selector.xpath("//book").xpath("/title") </span> <span style="color:#000000;">结果是空的,因为后面的 xpath("/title")从文档开始搜索</span> <span style="color:#000000;"><title></span> <span style="color:#000000;">。 </span> </div> <div> <span style="color:#000000;">s=selector.xpath("//book").xpath("//title") </span> <span style="color:#000000;">结果有</span> <span style="color:#000000;">10</span> <span style="color:#000000;">个元素,因为每个 <book>都驱动</span> <span style="color:#000000;">xpath("//title")</span> <span style="color:#000000;">在全文档搜索 <title>元素,每次都搜索到</span> <span style="color:#000000;">5</span> <span style="color:#000000;">个元素。</span> </div> </blockquote> </div> <h3 id="%EF%BC%884%EF%BC%89extract%E4%B8%8Eextract_first%E5%87%BD%E6%95%B0%E4%BD%BF%E7%94%A8">(4)extract与extract_first函数使用</h3> <div> <span style="color:#000000;"><strong>如果</strong></span> <span style="color:#000000;"><strong>xpath</strong></span> <span style="color:#000000;"><strong>返回的</strong></span> <span style="color:#000000;"><strong>Selector</strong></span> <span style="color:#000000;"><strong>对象列表 </strong></span> </div> <div> <span style="color:#000000;"><strong>① 调用</strong></span> <span style="color:#ff0000;"><strong>extract()</strong></span> <span style="color:#000000;"><strong>函数会得到这些对象的</strong></span> <span style="color:#ff0000;"><strong>元素文本</strong></span> <span style="color:#000000;"><strong>的</strong></span> <span style="color:#ff0000;"><strong>列表 </strong></span> </div> <div> <span style="color:#000000;"><strong>② 使用</strong></span> <span style="color:#ff0000;"><strong>extract_first()</strong></span> <span style="color:#000000;"><strong>获取列表中</strong></span> <span style="color:#ff0000;"><strong>第一个元素值</strong></span> <span style="color:#000000;"><strong>,如果列表为空 </strong></span> <span style="color:#000000;"><strong>extract_first()</strong></span> <span style="color:#000000;"><strong>的值为</strong></span> <span style="color:#000000;"><strong>None</strong></span> <span style="color:#000000;"><strong>。 </strong></span> </div> <div></div> <div> <span style="color:#000000;"><strong>而对于单一的一个</strong></span> <span style="color:#000000;"><strong>Selector</strong></span> <span style="color:#000000;"><strong>对象 </strong></span> </div> <div> <span style="color:#000000;"><strong>① 调用</strong></span> <span style="color:#000000;"><strong>extract()</strong></span> <span style="color:#000000;"><strong>函数就可以得到</strong></span> <span style="color:#000000;"><strong>Selector</strong></span> <span style="color:#000000;"><strong>对象对应的元素的文本值。 </strong></span> </div> <div> <span style="color:#000000;"><strong>② </strong></span> <span style="color:#ff0000;"><strong>单一的</strong></span> <span style="color:#ff0000;"><strong>Selector</strong></span> <span style="color:#ff0000;"><strong>对象没有</strong></span> <span style="color:#ff0000;"><strong>extract_first()</strong></span> <span style="color:#ff0000;"><strong>函数</strong></span> <span style="color:#000000;"><strong>。</strong></span> </div> <div> <pre><code class="language-python"># extract与extract_first函数使用 from scrapy.selector import Selector htmlText = ''' <html><body> <bookstore> <book id="b1"> <title lang="english">Harry Potter 29.99 学习 XML 39.95 ''' selector = Selector(text=htmlText) s = selector.xpath("//book/price") print(type(s), s) s = selector.xpath("//book/price").extract() print(type(s), s) s = selector.xpath("//book/price").extract_first() print(type(s), s)

    运行结果:

    [, ]
    ['29.99', '39.95']
    29.99

由此可见:
s=selector.xpath("//book/price") 得到的是SelectorList列表;
s=selector.xpath("//book/price").extract() 得到的是元素的Selector对象对 应的元素的文本组成的列表,即:
['29.99', '39.95']
s=selector.xpath("//book/price").extrac_first() 得到的是元素的文本组成的列表的第一个元素,是一个文本,即: 29.99

(5)获取元素属性值

        xpath使用 "/@attrName " 得到一个 Selector 元素的 attrName 属性 节点对象,属性节点对象也是一个Selector 对象,通过 extract() 获取属性值。
# 获取元素属性值
from scrapy.selector import Selector

htmlText = '''


    
        Harry Potter
        29.99
    
    
        学习 XML
        39.95
    


'''
selector = Selector(text=htmlText)
s = selector.xpath("//book").xpath("./@id")
print(s)  # [, ]
print(s.extract())  # ['b1', 'b2']
for e in s:
    print(e.extract())  # b1 \n  b2

运行结果:

[, ]
['b1', 'b2']
b1
b2

由此可见:
s=selector.xpath("//book/@id")
结果是 2 id 属性组成的 SelectorList 列表, 即属性也是一个 Selector 对象
print(s.extract()) 结果是 id 属性的两个 Selector 对象的属性文本值的列表,即['b1', 'b2']
for e in s:
      print(e.extract())
每个 e 是一个 Selector 对象,因此 extract() 获取对象的属性值。

(6)获取节点的文本值

        xpath使用 "/text()" 得到一个 Selector 元素包含的 文本值 ,文本值节点对象也是一个Selector 对象,通过 extract() 获取文本值。
# 获取节点的文本值
from scrapy.selector import Selector

htmlText = '''


    
        Harry Potter
        29.99
    
    
        学习 XML
        39.95
    


'''
selector = Selector(text=htmlText)
s = selector.xpath("//book/title/text()")
print(s)
print(s.extract())  # ['Harry Potter', '学习 XML']
for e in s:
    print(e.extract())  # Harry Potter  \n  学习 XML

运行结果:

[, ]
['Harry Potter', '学习 XML']
Harry Potter
学习 XML

由此可见:
s=selector.xpath("//book/title/text()") 结果也是 SelectorList 列表,即文本也是一个节点
print(s.extract()) 结果是文本节点的字符串值的列表,即['Harry Potter', ' 学习 XML']
for e in s:
     print(e.extract())
每个 e 是一个 Selector 对象,因此 extract() 获取对象的属性值。 值得注意 的是如果一个 element 的元素包含的文本不是单一的文本,那么可能会 产生多个文本值。

(7)多个文本节点值

# 多个文本节点值
from scrapy.selector import Selector

htmlText = '''


    
        <b>H</b>ary <b>P</b>otter
        29.99
    


'''
selector = Selector(text=htmlText)
s = selector.xpath("//book/title/text()")
print(s)
print(s.extract())  # ['ary ', 'otter']
for e in s:
    print(e.extract())

运行结果:

[, ]
['ary ', 'otter']
ary 
otter

由此可见 </span> <span style="color:#000000;">中的文本值包含</span> <span style="color:#000000;">arry</span> <span style="color:#000000;">与</span> <span style="color:#000000;">otter</span> <span style="color:#000000;">两个。</span> </div> <h3 id="%EF%BC%888%EF%BC%89%E4%BD%BF%E7%94%A8condition%E9%99%90%E5%AE%9Atag%E5%85%83%E7%B4%A0">(8)使用condition限定tag元素</h3> <pre><code class="language-python"># 使用condition限定tag元素 from scrapy.selector import Selector htmlText = ''' <html><body> <bookstore> <book id="b1"> <title lang="english">Harry Potter 29.99 学习 XML 39.95 ''' selector = Selector(text=htmlText) s = selector.xpath("//book/title[@lang='chinese']/text()") print(s.extract_first()) # 学习 XML s = selector.xpath("//book[@id='b1']/title") print(s.extract_first()) # Harry Potter

运行结果:

学习 XML
Harry Potter

由此可见:
s=selector.xpath("//book/title[@lang='chinese']/text()")
搜索 下面属性 lang="chinese" </span> </div> <div></div> <div> <span style="color:#000000;">s=selector.xpath("//book[@id='b1']/title") </span> </div> <div> <span style="color:#000000;">搜索属性</span> <span style="color:#000000;">id="b1"</span> <span style="color:#000000;">的</span> <span style="color:#000000;"><book></span> <span style="color:#000000;">下面的</span> <span style="color:#000000;"><title></span> <span style="color:#000000;">。</span> </div> <h3 id="%EF%BC%889%EF%BC%89%E4%BD%BF%E7%94%A8position()%E5%BA%8F%E5%8F%B7%E6%9D%A5%E7%A1%AE%E5%AE%9A%E6%89%80%E9%80%89%E6%8B%A9%E7%9A%84%E5%85%83%E7%B4%A0">(9)使用position()序号来确定所选择的元素</h3> <div> <span style="color:#000000;">        xpath可以使用</span> <span style="color:#ff0000;">position()</span> <span style="color:#000000;">来确定其中一个元素的限制,这个选择序号</span> <span style="color:#000000;">是</span> <span style="color:#ff0000;">从</span> <span style="color:#ff0000;">1</span> <span style="color:#ff0000;">开始的</span> <span style="color:#000000;">,不是从</span> <span style="color:#000000;">0</span> <span style="color:#000000;">开始编号的,还可以通过 </span> <span style="color:#000000;">and</span> <span style="color:#000000;">、</span> <span style="color:#000000;">or</span> <span style="color:#000000;">等构造复杂的表</span> <span style="color:#000000;">达式。</span> </div> <div> <pre><code class="language-python"># 使用position()序号来确定所选择的元素 from scrapy.selector import Selector htmlText = ''' <html><body> <bookstore> <book id="b1"> <title lang="english">Harry Potter 29.99 学习 XML 39.95 ''' selector = Selector(text=htmlText) s = selector.xpath("//book[position()=1]/title") # 选择第一个元素下的title print(s.extract_first()) # Harry Potter s = selector.xpath("//book[position()=2]/title") # 选择第二个元素下的title print(s.extract_first()) # 学习 XML

运行结果:

Harry Potter
学习 XML

(10)使用"*"代表任何element元素,不包括Text、Comment的结点

        xpath使用星号  "*"  代表任何 Element 节点, 不包括 Text Comment 的节 点。
# 使用"*"代表任何element元素,不包括Text、Comment的结点
from scrapy.selector import Selector

htmlText = '''


    
        Harry Potter
        29.99
    
    
        学习 XML
        39.95
    


'''
selector = Selector(text=htmlText)
s = selector.xpath("//bookstore/*/title")
print(s.extract())  # ['Harry Potter', '学习 XML']

运行结果:

['Harry Potter', '学习 XML']

        其中 s=selector.xpath("//bookstore/*/title")是搜索的孙子节点, 中间隔开一层任何元素。</span> </div> </div> <h3 id="%EF%BC%8811%EF%BC%89%E4%BD%BF%E7%94%A8%40*%E4%BB%A3%E8%A1%A8%E5%B1%9E%E6%80%A7">(11)使用@*代表属性</h3> <div> <span style="color:#000000;">        xpath使用</span> <span style="color:#ff0000;">"@*"</span> <span style="color:#000000;">代表任何属性</span> </div> <div> <pre><code class="language-python"># 使用@*代表属性 from scrapy.selector import Selector htmlText = ''' <html><body> <bookstore> <book> <title lang="english">Harry Potter 29.99 学习 XML 39.95 ''' selector = Selector(text=htmlText) s = selector.xpath("//book[@*]/title") # 搜索任何包含属性的元素下面的 print(s.extract()) # ['<title lang="chinese">学习 XML'] s = selector.xpath("//@*") # 搜索文档中所有属性结点 print(s.extract()) # ['english', 'b2', 'chinese']

运行结果:

['学习 XML']
['english', 'b2', 'chinese']

        其中: s=selector.xpath("//book[@*]/title") 是搜索任何 包含属性的 元素下面 的</span> <span style="color:#000000;">,结果搜索到第二个 <book>s=selector.xpath("//@*")是搜索文档中所有</span> <span style="color:#c00000;"><strong>属性节点</strong></span> <span style="color:#000000;">。</span> </div> </div> <h3 id="%EF%BC%8812%EF%BC%89Xpath%E6%90%9C%E7%B4%A2%E5%85%83%E7%B4%A0%E7%9A%84%E7%88%B6%E7%BB%93%E7%82%B9">(12)Xpath搜索元素的父结点</h3> <div> <span style="color:#000000;">        xpath使用</span> <span style="color:#ff0000;">"element/parent::*"</span> <span style="color:#000000;">选择</span> <span style="color:#000000;">element</span> <span style="color:#000000;">的父节点,这个节点只有一个。如果写成element/parent::tag</span> <span style="color:#000000;">,就指定</span> <span style="color:#000000;">element</span> <span style="color:#000000;">的</span> <span style="color:#000000;">tag</span> <span style="color:#000000;">父节点,除非 element的父节点正好为</span> <span style="color:#000000;"><tag></span> <span style="color:#000000;">节点,不然就为[ ]</span> <span style="color:#000000;">。</span> </div> <div> <pre><code class="language-python"># Xpath搜索元素的父结点 from scrapy.selector import Selector htmlText = ''' <html><body> <bookstore> <book> <title lang="english">Harry Potter 29.99 学习 XML 39.95 ''' selector = Selector(text=htmlText) s = selector.xpath("//title[@lang='chinese']/parent::*") # 等价 /parent::book print(s.extract()) # ['\n 学习 XML\n 39.95\n ']

运行结果:

['\n        学习 XML\n        39.95\n    ']

        其中 s=selector.xpath("//title[@lang='chinese']/parent::*")是查找属性为 lang='chinese'的元素的父节点,就是id="b2"的<book>元素节点。</span> </div> </div> <h3 id="%EF%BC%8813%EF%BC%89%E6%90%9C%E7%B4%A2%E5%90%8E%E9%9D%A2%E7%9A%84%E5%85%84%E5%BC%9F%E7%BB%93%E7%82%B9">(13)搜索后面的兄弟结点</h3> <div> <span style="color:#000000;">        xpath使用</span> <span style="color:#ff0000;">"element/folllowing-sibling::*"</span> <span style="color:#000000;">搜索</span> <span style="color:#000000;">element</span> <span style="color:#000000;">后面的同级</span> <span style="color:#000000;">的所有兄弟节点,使用</span> <span style="color:#000000;">"element/folllowing-sibling::*[position()=1]" </span> <span style="color:#000000;">搜</span> <span style="color:#000000;">索</span> <span style="color:#000000;">element</span> <span style="color:#000000;">后面的同级的第一个兄弟节点。</span> </div> <div> <pre><code class="language-python"># 搜索后面的兄弟结点 from scrapy.selector import Selector htmlText = """<a>A1</a> <b>B1</b> <c>C1</c> <d>D<e>E</e></d> <b>B2</b> <c>C2</c>""" selector = Selector(text=htmlText) s = selector.xpath("//a/following-sibling::*") # 搜素<a>结点后面的兄弟结点 print(s.extract()) # ['<b>B1</b>', '<c>C1</c>', '<d>D<e>E</e></d>', '<b>B2</b>', '<c>C2</c>'] s = selector.xpath("//a/following-sibling::*[position()=1]") # 搜索<a>结点后面的第1个兄弟结点 print(s.extract()) # ['<b>B1</b>'] s = selector.xpath("//b[position()=1]/following-sibling::*") # 搜索第一个<b>结点后面的兄弟结点 print(s.extract()) # ['<c>C1</c>', '<d>D<e>E</e></d>', '<b>B2</b>', '<c>C2</c>'] s = selector.xpath("//b[position()=1]/following-sibling::*[position()=1]") # 搜索第一个<b>结点后面的第1个兄弟结点 print(s.extract()) # ['<c>C1</c>'] </code></pre> <blockquote> <p><strong>运行结果:</strong></p> <p>['<b>B1</b>', '<c>C1</c>', '<d>D<e>E</e></d>', '<b>B2</b>', '<c>C2</c>']<br> ['<b>B1</b>']<br> ['<c>C1</c>', '<d>D<e>E</e></d>', '<b>B2</b>', '<c>C2</c>']<br> ['<c>C1</c>']</p> </blockquote> </div> <h3 id="%EF%BC%8814%EF%BC%89%E6%90%9C%E7%B4%A2%E5%89%8D%E9%9D%A2%E7%9A%84%E5%85%84%E5%BC%9F%E7%BB%93%E7%82%B9">(14)搜索前面的兄弟结点</h3> <div> <span style="color:#000000;">        xpath使用 </span> <span style="color:#ff0000;">"element/preceding-sibling::*" </span> <span style="color:#000000;">搜索</span> <span style="color:#000000;">element</span> <span style="color:#000000;">前面的同级的所有兄弟节点,使用"element/preceding-sibling::*[position()=1]"</span> <span style="color:#000000;">搜索 element前面的同级的第一个兄弟节点。</span> </div> <pre><code class="language-python"># 搜索前面的兄弟结点 from scrapy.selector import Selector htmlText = """<a>A1</a> <b>B1</b> <c>C1</c> <d>D<e>E</e></d> <b>B2</b> <c>C2</c>""" selector = Selector(text=htmlText) s = selector.xpath("//a/preceding-sibling::*") print(s.extract()) # [] s = selector.xpath("//b/preceding-sibling::*[position()=1]") # 是所有<b>前面的第1个兄弟结点 print(s.extract()) # ['<a>A1</a>', '<d>D<e>E</e></d>'] s = selector.xpath("//b[position()=2]/preceding-sibling::*") # 是第二个<b>前面的所有兄弟结点 print(s.extract()) # ['<a>A1</a>', '<b>B1</b>', '<c>C1</c>', '<d>D<e>E</e></d>'] s = selector.xpath("//b[position()=2]/preceding-sibling::*[position()=1]") # 这里的position()=1指的是前1个兄弟结点 print(s.extract()) # ['<d>D<e>E</e></d>'] </code></pre> <blockquote> <p><strong>运行结果:</strong></p> <p>[ ]<br> ['<a>A1</a>', '<d>D<e>E</e></d>']<br> ['<a>A1</a>', '<b>B1</b>', '<c>C1</c>', '<d>D<e>E</e></d>']<br> ['<d>D<e>E</e></d>']</p> </blockquote> </div> </div> </div> </div> </div> <!--PC和WAP自适应版--> <div id="SOHUCS" sid="1668196543586459648"></div> <script type="text/javascript" src="/views/front/js/chanyan.js"></script> <!-- 文章页-底部 动态广告位 --> <div class="youdao-fixed-ad" id="detail_ad_bottom"></div> </div> <div class="col-md-3"> <div class="row" id="ad"> <!-- 文章页-右侧1 动态广告位 --> <div id="right-1" class="col-lg-12 col-md-12 col-sm-4 col-xs-4 ad"> <div class="youdao-fixed-ad" id="detail_ad_1"> </div> </div> <!-- 文章页-右侧2 动态广告位 --> <div id="right-2" class="col-lg-12 col-md-12 col-sm-4 col-xs-4 ad"> <div class="youdao-fixed-ad" id="detail_ad_2"></div> </div> <!-- 文章页-右侧3 动态广告位 --> <div id="right-3" class="col-lg-12 col-md-12 col-sm-4 col-xs-4 ad"> <div class="youdao-fixed-ad" id="detail_ad_3"></div> </div> </div> </div> </div> </div> </div> <div class="container"> <h4 class="pt20 mb15 mt0 border-top">你可能感兴趣的:(爬虫,python,Xpath,html,爬虫,scrapy,Xpath,python)</h4> <div id="paradigm-article-related"> <div class="recommend-post mb30"> <ul class="widget-links"> <li><a href="/article/1892565454380134400.htm" title="【部署】Ktransformer是什么、如何利用单卡24GB显存部署Deepseek-R1 和 Deepseek-V3" target="_blank">【部署】Ktransformer是什么、如何利用单卡24GB显存部署Deepseek-R1 和 Deepseek-V3</a> <span class="text-muted">仙人掌_lz</span> <a class="tag" taget="_blank" href="/search/%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD/1.htm">人工智能</a><a class="tag" taget="_blank" href="/search/%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD/1.htm">人工智能</a><a class="tag" taget="_blank" href="/search/AI/1.htm">AI</a><a class="tag" taget="_blank" href="/search/%E9%83%A8%E7%BD%B2/1.htm">部署</a><a class="tag" taget="_blank" href="/search/%E8%87%AA%E7%84%B6%E8%AF%AD%E8%A8%80%E5%A4%84%E7%90%86/1.htm">自然语言处理</a> <div>简介KTransformers是一个灵活的、以Python为中心的框架,旨在通过先进的内核优化和放置/并行策略提升HuggingFaceTransformers的使用体验。它具有高度的可扩展性,用户可通过单行代码注入优化模块,获得兼容Transformers的接口、符合OpenAI和Ollama的RESTfulAPI,甚至简化的ChatGPT风格的WebUI。KTransformers的性能优化基</div> </li> <li><a href="/article/1892564697887076352.htm" title="技术分享:MyBatis SQL 日志解析脚本" target="_blank">技术分享:MyBatis SQL 日志解析脚本</a> <span class="text-muted">£漫步 云端彡</span> <a class="tag" taget="_blank" href="/search/%E8%BF%90%E7%BB%B4%E8%B6%A3%E5%88%86%E4%BA%AB/1.htm">运维趣分享</a><a class="tag" taget="_blank" href="/search/sql/1.htm">sql</a><a class="tag" taget="_blank" href="/search/java/1.htm">java</a><a class="tag" taget="_blank" href="/search/mybatis/1.htm">mybatis</a><a class="tag" taget="_blank" href="/search/%E6%97%A5%E5%BF%97%E8%A7%A3%E6%9E%90/1.htm">日志解析</a> <div>技术分享:MyBatisSQL日志解析脚本1.脚本功能概述2.实现细节2.1HTML结构2.2JavaScript逻辑3.脚本代码4.使用方法4.1示例5.总结在日常开发中,使用MyBatis作为持久层框架时,我们经常需要查看SQL日志以调试和优化查询。然而,MyBatis的日志输出通常包含占位符和参数信息,这使得直接执行这些SQL语句变得困难。为了解决这个问题,我们开发了一个简单的HTML和Ja</div> </li> <li><a href="/article/1892564445058625536.htm" title="C语言-回调函数的应用" target="_blank">C语言-回调函数的应用</a> <span class="text-muted">woainizhongguo.</span> <a class="tag" taget="_blank" href="/search/C%2FC%2B%2B/1.htm">C/C++</a><a class="tag" taget="_blank" href="/search/c%E8%AF%AD%E8%A8%80/1.htm">c语言</a> <div>什么是回调函数回调函数就是一个被作为参数传递的函数。在C语言中,回调函数只能使用函数指针实现,在C++、Python、ECMAScript等更现代的编程语言中还可以使用仿函数或匿名函数。工作机制⑴定义一个回调函数;⑵提供函数实现的一方在初始化的时候,将回调函数的函数指针注册给调用者;⑶当特定的事件或条件发生的时候,调用者使用函数指针调用回调函数对事件进行处理。应用案例(1)应用层:通过调用hal层</div> </li> <li><a href="/article/1892562803177353216.htm" title="前端:纯前端快速实现html导出word和pdf" target="_blank">前端:纯前端快速实现html导出word和pdf</a> <span class="text-muted">m0_74823715</span> <a class="tag" taget="_blank" href="/search/%E5%89%8D%E7%AB%AF/1.htm">前端</a><a class="tag" taget="_blank" href="/search/html/1.htm">html</a><a class="tag" taget="_blank" href="/search/word/1.htm">word</a> <div>实现html导出word,需要使用两个库。html-docx-js和file-saver导出word的js方法>npminstallhtml-docx-js>npminstallfile-saverjs引入importFileSaverfrom“file-saver”;importhtmlDocxfrom“html-docx-js/dist/html-docx”;/**导出word方法*/expo</div> </li> <li><a href="/article/1892562173436162048.htm" title="Python Union 联合类型注解详解" target="_blank">Python Union 联合类型注解详解</a> <span class="text-muted">人才程序员</span> <a class="tag" taget="_blank" href="/search/%E6%9D%82%E8%B0%88/1.htm">杂谈</a><a class="tag" taget="_blank" href="/search/python/1.htm">python</a><a class="tag" taget="_blank" href="/search/%E6%9C%8D%E5%8A%A1%E5%99%A8/1.htm">服务器</a><a class="tag" taget="_blank" href="/search/java/1.htm">java</a><a class="tag" taget="_blank" href="/search/linux/1.htm">linux</a><a class="tag" taget="_blank" href="/search/%E5%90%8E%E7%AB%AF/1.htm">后端</a><a class="tag" taget="_blank" href="/search/%E8%BD%AF%E4%BB%B6%E5%B7%A5%E7%A8%8B/1.htm">软件工程</a><a class="tag" taget="_blank" href="/search/%E5%BC%80%E5%8F%91%E8%AF%AD%E8%A8%80/1.htm">开发语言</a> <div>文章目录PythonUnion联合类型注解详解1.什么是Union联合类型?**语法(Python3.9及之前版本)**:**语法(Python3.10及之后版本)**:2.Union联合类型注解示例**(1)使用Union来表示多个类型的参数****(2)使用`|`来表示联合类型(Python3.10及之后版本)**3.使用Union进行复杂类型注解**(1)使用Union与列表结合****(2</div> </li> <li><a href="/article/1892559400569204736.htm" title="释放 DeepSeek 的力量:像专家一样本地安装与探索!" target="_blank">释放 DeepSeek 的力量:像专家一样本地安装与探索!</a> <span class="text-muted">guzhoumingyue</span> <a class="tag" taget="_blank" href="/search/AI/1.htm">AI</a><a class="tag" taget="_blank" href="/search/python/1.htm">python</a> <div>要在本地运行DeepSeek,您需要遵循以下步骤。请确保您的计算机上已安装Python和Git,并且满足DeepSeek的依赖项。步骤1:安装依赖项安装Python和pip确保您已安装Python(建议使用Python3.6及以上版本)。您可以通过在终端/命令提示符中输入以下命令来检查Python是否已安装:bash复制代码python--version或者bash复制代码python3--ver</div> </li> <li><a href="/article/1892555994295234560.htm" title="ffmpeg-python安装" target="_blank">ffmpeg-python安装</a> <span class="text-muted">neverayever</span> <a class="tag" taget="_blank" href="/search/%E8%AE%A1%E7%AE%97%E6%9C%BA/1.htm">计算机</a><a class="tag" taget="_blank" href="/search/ffmpeg/1.htm">ffmpeg</a><a class="tag" taget="_blank" href="/search/python/1.htm">python</a><a class="tag" taget="_blank" href="/search/linux/1.htm">linux</a> <div>centos-ffmpeg-python安装安装ffmpeg一:下载并解压wgethttp://www.ffmpeg.org/releases/ffmpeg-4.2.tar.gztar-zxvfffmpeg-4.2.tar.gz若linux服务器没网,可以在windows上直接访问http://www.ffmpeg.org/releases/ffmpeg-4.2.tar.gz就可下载,然后上传至服</div> </li> <li><a href="/article/1892547290837610496.htm" title="Python的那些事第二十七篇:Python中的“数据魔法师”NumPy" target="_blank">Python的那些事第二十七篇:Python中的“数据魔法师”NumPy</a> <span class="text-muted">暮雨哀尘</span> <a class="tag" taget="_blank" href="/search/Python%E7%9A%84%E9%82%A3%E4%BA%9B%E4%BA%8B/1.htm">Python的那些事</a><a class="tag" taget="_blank" href="/search/python/1.htm">python</a><a class="tag" taget="_blank" href="/search/numpy/1.htm">numpy</a><a class="tag" taget="_blank" href="/search/%E5%BC%80%E5%8F%91%E8%AF%AD%E8%A8%80/1.htm">开发语言</a><a class="tag" taget="_blank" href="/search/%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90/1.htm">数据分析</a><a class="tag" taget="_blank" href="/search/%E7%AE%97%E6%B3%95/1.htm">算法</a><a class="tag" taget="_blank" href="/search/%E6%95%B0%E7%BB%84/1.htm">数组</a><a class="tag" taget="_blank" href="/search/%E7%B4%A2%E5%BC%95/1.htm">索引</a> <div>摘要在这篇幽默风趣的论文中,我们将深入探讨NumPy——Python中最强大的数值计算库之一。它不仅提供了高性能的多维数组对象,还让复杂的数学运算变得像吃冰淇淋一样简单。本文将通过生动的代码示例和幽默的比喻,带你领略NumPy的魔法世界,让你在欢笑中掌握这个强大的工具。一、引言:为什么NumPy是程序员的“超级英雄”?1.1NumPy的起源:从“数据苦力”到“数据魔法师”想象一下,你被困在一个全是</div> </li> <li><a href="/article/1892544893620908032.htm" title="纯前端导入导出txt文件" target="_blank">纯前端导入导出txt文件</a> <span class="text-muted">今天吃了嘛o</span> <a class="tag" taget="_blank" href="/search/%E5%89%8D%E7%AB%AF%E5%AF%BC%E5%85%A5%E5%AF%BC%E5%87%BAtxt%E6%96%87%E4%BB%B6/1.htm">前端导入导出txt文件</a><a class="tag" taget="_blank" href="/search/javascript/1.htm">javascript</a><a class="tag" taget="_blank" href="/search/html/1.htm">html</a><a class="tag" taget="_blank" href="/search/html5/1.htm">html5</a> <div>1.html部分导入导出{{alone}}2.js部分导出的时候我尝试了很多次改变编码格式为gb2312的,但是无果,所以我再读取的时候先读取文件判断了文件编码格式,然后再去根据编码格式读取文件并展示页面。exportdefault{data(){return{works:[],};},methods:{handleBeforeUpload(file){this.fileList=[file];c</div> </li> <li><a href="/article/1892538578999767040.htm" title="基于Transformer的YOLOv8检测头架构改进:提升目标检测精度的全新突破(YOLOv8)" target="_blank">基于Transformer的YOLOv8检测头架构改进:提升目标检测精度的全新突破(YOLOv8)</a> <span class="text-muted">步入烟尘</span> <a class="tag" taget="_blank" href="/search/transformer/1.htm">transformer</a><a class="tag" taget="_blank" href="/search/YOLO/1.htm">YOLO</a><a class="tag" taget="_blank" href="/search/%E7%9B%AE%E6%A0%87%E6%A3%80%E6%B5%8B/1.htm">目标检测</a> <div>本专栏专为AI视觉领域的爱好者和从业者打造。涵盖分类、检测、分割、追踪等多项技术,带你从入门到精通!后续更有实战项目,助你轻松应对面试挑战!立即订阅,开启你的YOLOv8之旅!专栏订阅地址:https://blog.csdn.net/mrdeam/category_12804295.html文章目录基于Transformer的YOLOv8检测头架构改进:提升目标检测精度的全新突破什么是DAtten</div> </li> <li><a href="/article/1892537949245992960.htm" title="Python爬虫TLS" target="_blank">Python爬虫TLS</a> <span class="text-muted">dme.</span> <a class="tag" taget="_blank" href="/search/Python%E7%88%AC%E8%99%AB%E9%9B%B6%E5%9F%BA%E7%A1%80%E5%85%A5%E9%97%A8/1.htm">Python爬虫零基础入门</a><a class="tag" taget="_blank" href="/search/%E7%88%AC%E8%99%AB/1.htm">爬虫</a><a class="tag" taget="_blank" href="/search/python/1.htm">python</a> <div>TLS指纹校验原理和绕过浏览器可以正常访问,但是用requests发送请求失败。后端是如何监测得呢?为什么浏览器可以返回结果,而requests模块不行呢?https://cn.investing.com/equities/amazon-com-inc-historical-data1.指纹校验案例1.1案例:ascii2dhttps://ascii2d.net/importrequestsres</div> </li> <li><a href="/article/1892537066504384512.htm" title="python爬虫Selenium库详细教程_python爬虫之selenium库的使用详解" target="_blank">python爬虫Selenium库详细教程_python爬虫之selenium库的使用详解</a> <span class="text-muted">嘻嘻哈哈学编程</span> <a class="tag" taget="_blank" href="/search/%E7%A8%8B%E5%BA%8F%E5%91%98/1.htm">程序员</a><a class="tag" taget="_blank" href="/search/python/1.htm">python</a><a class="tag" taget="_blank" href="/search/%E7%88%AC%E8%99%AB/1.htm">爬虫</a><a class="tag" taget="_blank" href="/search/selenium/1.htm">selenium</a> <div>网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。需要这份系统化学习资料的朋友,可以戳这里获取一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!2.2访问页面2.3查找元素2.3.1单个元素下面</div> </li> <li><a href="/article/1892537067355828224.htm" title="排序算法:冒泡排序(Python)" target="_blank">排序算法:冒泡排序(Python)</a> <span class="text-muted">娱乐不打烊丶</span> <a class="tag" taget="_blank" href="/search/%E6%8E%92%E5%BA%8F%E7%AE%97%E6%B3%95/1.htm">排序算法</a><a class="tag" taget="_blank" href="/search/%E7%AE%97%E6%B3%95/1.htm">算法</a><a class="tag" taget="_blank" href="/search/%E6%95%B0%E6%8D%AE%E7%BB%93%E6%9E%84/1.htm">数据结构</a> <div>思路:大家一定都喝过汽水吧,汽水中常常有许多小小的气泡,往上飘,这是因为组成小气泡的二氧化碳比水要轻,所以小气泡才会一点一点的向上浮。而冒泡排序之所以叫冒泡排序,正是因为这种排序算法的每一个元素都可以向小气泡一样,根据自身大小,一点一点向着数组的一侧移动。一图解百惑,上图!那么,话不多说,上代码!defbubble_sort(input_list):#冒泡排序:每次循环,锁定一个最值,并朝着最大或</div> </li> <li><a href="/article/1892536436008218624.htm" title="图片粘贴上传实现" target="_blank">图片粘贴上传实现</a> <span class="text-muted">SarinaDu</span> <a class="tag" taget="_blank" href="/search/javascript/1.htm">javascript</a><a class="tag" taget="_blank" href="/search/html5/1.htm">html5</a> <div>图片上传htmldemo直接粘贴本地运行查看效果即可,有看不懂的直接喂给deepseek会解释的很清晰粘贴图片上传示例-使用场景,粘贴桌面图片上传、粘贴word文档中图片上传、直接截图上传等body{font-family:Arial,sans-serif;padding:20px;}.upload-area{width:100%;height:200px;border:2pxdashed#ccc</div> </li> <li><a href="/article/1892536309688365056.htm" title="supervisord 命令介绍和使用案例" target="_blank">supervisord 命令介绍和使用案例</a> <span class="text-muted">lisanmengmeng</span> <a class="tag" taget="_blank" href="/search/linux/1.htm">linux</a><a class="tag" taget="_blank" href="/search/%E5%91%BD%E4%BB%A4%E5%B7%A5%E5%85%B7/1.htm">命令工具</a><a class="tag" taget="_blank" href="/search/%E7%B3%BB%E7%BB%9F%E8%BF%90%E7%BB%B4/1.htm">系统运维</a><a class="tag" taget="_blank" href="/search/shell%E7%BC%96%E7%A8%8B/1.htm">shell编程</a><a class="tag" taget="_blank" href="/search/%E6%9C%8D%E5%8A%A1%E5%99%A8/1.htm">服务器</a><a class="tag" taget="_blank" href="/search/linux/1.htm">linux</a><a class="tag" taget="_blank" href="/search/%E8%BF%90%E7%BB%B4/1.htm">运维</a> <div>supervisord命令介绍和使用案例supervisord是一个用Python编写的进程管理工具,用于监控和管理Linux系统中的进程。它可以将普通的命令行进程转变为后台守护进程(daemon),并监控进程状态,在进程异常退出时自动重启。它通过fork/exec的方式把被管理的进程当作自己的子进程来启动。主要功能:进程管理:能够启动、停止、重启和关闭进程.自动重启:监控进程状态,并在进程崩溃时</div> </li> <li><a href="/article/1892536183204933632.htm" title="ptython setup.py install 设置python包编译时的并行数" target="_blank">ptython setup.py install 设置python包编译时的并行数</a> <span class="text-muted">leo0308</span> <a class="tag" taget="_blank" href="/search/%E5%9F%BA%E7%A1%80%E7%9F%A5%E8%AF%86/1.htm">基础知识</a><a class="tag" taget="_blank" href="/search/Python/1.htm">Python</a><a class="tag" taget="_blank" href="/search/python/1.htm">python</a><a class="tag" taget="_blank" href="/search/pytorch3d/1.htm">pytorch3d</a> <div>通过源码编译安装pytorch3d的时候,直接执行pythonsetup.pyinstall时,默认开的并行数很多,有10几个,直接导致机器卡死。通过设置下面的环境变量,可以设置较小的并行数,避免占用过多的资源。exportMAX_JOBS=4设置后,同时只有4个编译的进程。</div> </li> <li><a href="/article/1892528359695511552.htm" title="详细介绍:封装简易的 Axios 函数获取省份列表" target="_blank">详细介绍:封装简易的 Axios 函数获取省份列表</a> <span class="text-muted">还是鼠鼠</span> <a class="tag" taget="_blank" href="/search/javascript/1.htm">javascript</a><a class="tag" taget="_blank" href="/search/vscode/1.htm">vscode</a><a class="tag" taget="_blank" href="/search/ajax/1.htm">ajax</a><a class="tag" taget="_blank" href="/search/%E5%89%8D%E7%AB%AF/1.htm">前端</a><a class="tag" taget="_blank" href="/search/%E5%89%8D%E7%AB%AF%E6%A1%86%E6%9E%B6/1.htm">前端框架</a> <div>目录关键步骤:完整代码(html):代码解析:程序运行结果:本示例展示了如何通过封装一个简易的myAxios函数来模拟axios的功能,使用原生的XMLHttpRequest(XHR)对象来发起HTTP请求。我们将实现一个简单的功能,通过该封装函数从服务器获取省份列表数据,并在网页上显示这些省份。关键步骤:封装myAxios函数:myAxios函数接收一个配置对象(如请求的URL和方法),并返回一</div> </li> <li><a href="/article/1892521045080993792.htm" title="python 自动化数据提取之正则表达式_python 正则提取(2)" target="_blank">python 自动化数据提取之正则表达式_python 正则提取(2)</a> <span class="text-muted">m0_60607245</span> <a class="tag" taget="_blank" href="/search/%E7%A8%8B%E5%BA%8F%E5%91%98/1.htm">程序员</a><a class="tag" taget="_blank" href="/search/python/1.htm">python</a><a class="tag" taget="_blank" href="/search/%E5%AD%A6%E4%B9%A0/1.htm">学习</a><a class="tag" taget="_blank" href="/search/%E9%9D%A2%E8%AF%95/1.htm">面试</a> <div>一、Python所有方向的学习路线Python所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照下面的知识点去找对应的学习资源,保证自己学得较为全面。二、Python必备开发工具工具都帮大家整理好了,安装就可直接上手!三、最新Python学习笔记当我学到一定基础,有自己的理解能力的时候,会去阅读一些前辈整理的书籍或者手写的笔记资料,这些笔记详细记载了他们对一些技术点的理</div> </li> <li><a href="/article/1892519279048323072.htm" title="GUI编程(window系统→Linux系统)" target="_blank">GUI编程(window系统→Linux系统)</a> <span class="text-muted">诚信爱国敬业友善</span> <a class="tag" taget="_blank" href="/search/%E5%BF%83%E5%BE%97/1.htm">心得</a><a class="tag" taget="_blank" href="/search/linux/1.htm">linux</a><a class="tag" taget="_blank" href="/search/python/1.htm">python</a><a class="tag" taget="_blank" href="/search/gui/1.htm">gui</a> <div>最近有个项目需要将windows系统的程序往Linux系统上面移植,由于之前程序没有考虑过多平台兼容的问题,导致部分功能不可用以下是对近期遇到的问题的总结,以及相应的解决方案和经验分享。1.Python模块安装与管理在Linux系统中,安装和管理Python模块时可能会遇到权限问题或依赖冲突。安装模块:使用pip安装模块时,建议使用--user选项,避免需要管理员权限:bash复制pipinsta</div> </li> <li><a href="/article/1892516757122379776.htm" title="spring boot基于知识图谱的阿克苏市旅游管理系统python-计算机毕业设计" target="_blank">spring boot基于知识图谱的阿克苏市旅游管理系统python-计算机毕业设计</a> <span class="text-muted">QQ1963288475</span> <a class="tag" taget="_blank" href="/search/spring/1.htm">spring</a><a class="tag" taget="_blank" href="/search/boot/1.htm">boot</a><a class="tag" taget="_blank" href="/search/%E7%9F%A5%E8%AF%86%E5%9B%BE%E8%B0%B1/1.htm">知识图谱</a><a class="tag" taget="_blank" href="/search/%E6%97%85%E6%B8%B8/1.htm">旅游</a><a class="tag" taget="_blank" href="/search/python/1.htm">python</a><a class="tag" taget="_blank" href="/search/vue.js/1.htm">vue.js</a><a class="tag" taget="_blank" href="/search/django/1.htm">django</a><a class="tag" taget="_blank" href="/search/flask/1.htm">flask</a> <div>目录功能和技术介绍具体实现截图开发核心技术:开发环境开发步骤编译运行核心代码部分展示系统设计详细视频演示可行性论证软件测试源码获取功能和技术介绍该系统基于浏览器的方式进行访问,采用springboot集成快速开发框架,前端使用vue方式,基于es5的语法,开发工具IntelliJIDEAx64,因为该开发工具,内嵌了Tomcat服务运行机制,可不用单独下载Tomcatserver服务器。由于考虑到</div> </li> <li><a href="/article/1892512851331969024.htm" title="Python从0到100(三十九):数据提取之正则(文末免费送书)" target="_blank">Python从0到100(三十九):数据提取之正则(文末免费送书)</a> <span class="text-muted">是Dream呀</span> <a class="tag" taget="_blank" href="/search/python/1.htm">python</a><a class="tag" taget="_blank" href="/search/mysql/1.htm">mysql</a><a class="tag" taget="_blank" href="/search/%E5%BC%80%E5%8F%91%E8%AF%AD%E8%A8%80/1.htm">开发语言</a> <div>前言:零基础学Python:Python从0到100最新最全教程。想做这件事情很久了,这次我更新了自己所写过的所有博客,汇集成了Python从0到100,共一百节课,帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识,成为学习学习和学业的先行者!欢迎大家订阅专栏:零基础学Python:Python从0到100最新</div> </li> <li><a href="/article/1892510076510466048.htm" title="Python学习心得两大编程思想" target="_blank">Python学习心得两大编程思想</a> <span class="text-muted">lifegoesonwjl</span> <a class="tag" taget="_blank" href="/search/python/1.htm">python</a><a class="tag" taget="_blank" href="/search/%E5%BC%80%E5%8F%91%E8%AF%AD%E8%A8%80/1.htm">开发语言</a><a class="tag" taget="_blank" href="/search/pycharm/1.htm">pycharm</a><a class="tag" taget="_blank" href="/search/%E5%89%8D%E7%AB%AF/1.htm">前端</a><a class="tag" taget="_blank" href="/search/c%E8%AF%AD%E8%A8%80/1.htm">c语言</a> <div>一、两大编程思想:1.面向过程:功能上的封装典型代表:C语言2.面向对象:属性和行为上的封装典型代表:Python、Java二、面向过程与面向对象的异同点:1.区别:面向过程:事物比较简单,可用线性的思维去解决面向对象:事务比较复杂,使用简单的线性思维无法解决2.共同点:(1)面向过程和面向对象都是解决实际问题的一种思维方式;(2)二者相辅相成,并不是对立的;(3)解决复杂问题,通过面向对象方式便</div> </li> <li><a href="/article/1892509698381377536.htm" title="Linux升级Anacodna并配置jupyterLab" target="_blank">Linux升级Anacodna并配置jupyterLab</a> <span class="text-muted">伪_装</span> <a class="tag" taget="_blank" href="/search/%E7%8E%AF%E5%A2%83%E9%83%A8%E7%BD%B2/1.htm">环境部署</a><a class="tag" taget="_blank" href="/search/linux/1.htm">linux</a><a class="tag" taget="_blank" href="/search/%E6%9C%8D%E5%8A%A1%E5%99%A8/1.htm">服务器</a><a class="tag" taget="_blank" href="/search/Anaconda/1.htm">Anaconda</a><a class="tag" taget="_blank" href="/search/python/1.htm">python</a><a class="tag" taget="_blank" href="/search/jupyter/1.htm">jupyter</a> <div>在使用Anaconda的过程中,随着项目和需求的发展,可能需要升级Anaconda的Base环境中的Python版本。本文将详细介绍如何安全地进行升级,包括步骤、代码示例与最终流程图。升级Python一、环境准备在进行任何升级之前,建议先检查当前的Python版本以及各个库的兼容性。我们可以通过以下命令检查当前的Python版本:condainfo你会看到类似以下的输出,其中包含了当前Python</div> </li> <li><a href="/article/1892508940047020032.htm" title="【Linux】删除Conda虚拟环境" target="_blank">【Linux】删除Conda虚拟环境</a> <span class="text-muted">不是伍壹</span> <a class="tag" taget="_blank" href="/search/Linux/1.htm">Linux</a><a class="tag" taget="_blank" href="/search/linux/1.htm">linux</a><a class="tag" taget="_blank" href="/search/conda/1.htm">conda</a><a class="tag" taget="_blank" href="/search/%E8%BF%90%E7%BB%B4/1.htm">运维</a> <div>1、查看当前系统的conda虚拟环境condainfo--envscondaenvlist2、创建虚拟的环境condacreate-n(你的环境名字)python=(你需要的版本号,如(3.7,3.8,3.10))3、查看安装了哪些包condalist4、删除虚拟环境condaremove-nname--all5、删除虚拟环境中的包condaremove--name$(需要删除的环境名字)$(需要</div> </li> <li><a href="/article/1892507680455585792.htm" title="Android arcgis加载在线底图" target="_blank">Android arcgis加载在线底图</a> <span class="text-muted">Angie洛林</span> <a class="tag" taget="_blank" href="/search/android/1.htm">android</a><a class="tag" taget="_blank" href="/search/arcgis/1.htm">arcgis</a> <div>我整理的一些关于【信息系统】的项目学习资料(附讲解~~)和大家一起分享、学习一下:https://edu.51cto.com/mic-position/757.html在Android中使用ArcGIS加载在线底图ArcGIS是Esri提供的一套强大的地理信息系统(GIS)解决方案,支持多种平台,包括Android。本文将介绍如何在Android应用中使用ArcGIS加载在线底图,并配有相关代码示</div> </li> <li><a href="/article/1892505537497591808.htm" title="动态规划之背包问题--python版本" target="_blank">动态规划之背包问题--python版本</a> <span class="text-muted">我是小码搬运工</span> <a class="tag" taget="_blank" href="/search/%23/1.htm">#</a><a class="tag" taget="_blank" href="/search/python%E5%9F%BA%E7%A1%80/1.htm">python基础</a><a class="tag" taget="_blank" href="/search/%E5%8A%A8%E6%80%81%E8%A7%84%E5%88%92/1.htm">动态规划</a><a class="tag" taget="_blank" href="/search/%E8%83%8C%E5%8C%85%E9%97%AE%E9%A2%98/1.htm">背包问题</a><a class="tag" taget="_blank" href="/search/python%E7%89%88%E6%9C%AC/1.htm">python版本</a> <div>动态规划之背包问题–python版本问题已知一个最大量的背包,给定一组给定固定价值和固定体积的物品,求在不超过最大值的前提下,能放入背包中的最大总价值。解题思路该问题是典型的动态规划问题,分为三种不同的类型(0-1背包问题、完全背包和多重背包问题)解题关键–状态转移表达式:B(k,C)=max(B(k−1,C),B(k−1,C−ci)+vi)B(k,C)=max(B(k-1,C),B(k-1,C-</div> </li> <li><a href="/article/1892502492609048576.htm" title="CSS中五种定位方式(position)对比分析" target="_blank">CSS中五种定位方式(position)对比分析</a> <span class="text-muted">七公子77</span> <a class="tag" taget="_blank" href="/search/css/1.htm">css</a><a class="tag" taget="_blank" href="/search/css/1.htm">css</a><a class="tag" taget="_blank" href="/search/%E5%89%8D%E7%AB%AF/1.htm">前端</a> <div>在CSS中,定位方式(position)决定了元素如何相对于其参照物进行定位,同时影响文档流的布局。以下是五种定位方式的对比、参照物说明及代码示例:1.position:static(默认定位)参照物:无,元素位于默认文档流中。文档流:元素按照HTML顺序自然排列。特点:top、right、bottom、left和z-index属性无效。示例:Box1Box2.box{width:100px;he</div> </li> <li><a href="/article/1892501862800748544.htm" title="Centos7 搭建 Jupyter + Nginx 服务" target="_blank">Centos7 搭建 Jupyter + Nginx 服务</a> <span class="text-muted">某龙兄</span> <a class="tag" taget="_blank" href="/search/python/1.htm">python</a><a class="tag" taget="_blank" href="/search/nginx/1.htm">nginx</a><a class="tag" taget="_blank" href="/search/linux/1.htm">linux</a><a class="tag" taget="_blank" href="/search/centos/1.htm">centos</a> <div>JupyterNotebook(此前被称为IPythonnotebook)是一个交互式笔记本,支持运行40多种编程语言。JupyterNotebook的本质是一个Web应用程序,便于创建和共享文学化程序文档,支持实时代码,数学方程,可视化和markdown。用途包括:数据清理和转换,数值模拟,统计建模,机器学习等等。本文讲述如何搭建Jupyter+Nginx服务,仅供学习与交流,请勿用于商业用途一</div> </li> <li><a href="/article/1892498961952993280.htm" title="动态规划之背包问题的Python实现" target="_blank">动态规划之背包问题的Python实现</a> <span class="text-muted">名侦探debug</span> <a class="tag" taget="_blank" href="/search/Python/1.htm">Python</a><a class="tag" taget="_blank" href="/search/%E6%95%B0%E6%8D%AE%E7%BB%93%E6%9E%84/1.htm">数据结构</a><a class="tag" taget="_blank" href="/search/python/1.htm">python</a><a class="tag" taget="_blank" href="/search/%E6%95%B0%E6%8D%AE%E7%BB%93%E6%9E%84/1.htm">数据结构</a><a class="tag" taget="_blank" href="/search/%E5%8A%A8%E6%80%81%E8%A7%84%E5%88%92%E6%B1%82%E8%A7%A3/1.htm">动态规划求解</a> <div>目录1.问题描述2.动态规划之网格法3.python实现1.问题描述题目来源于《算法图解》第9章练习题9.2,如下图所示。对于背包问题,通常的做法有列举法、贪婪算法和动态规划(1)列举法:列举出所有的可能情况,再选择最优解,但当情况很多时,这种算法复杂度很高(2)贪婪算法:在容量允许范围内,每次都拿剩余物品中价值最高的,贪婪算法能够快速解决复杂度很高的问题,但通常得到的是次优解,但就对这个题目而言</div> </li> <li><a href="/article/1892497197967142912.htm" title="总结10个Python赚钱的接单平台 兼职月入5000+" target="_blank">总结10个Python赚钱的接单平台 兼职月入5000+</a> <span class="text-muted">begefefsef</span> <a class="tag" taget="_blank" href="/search/%E9%9D%A2%E8%AF%95/1.htm">面试</a><a class="tag" taget="_blank" href="/search/%E5%AD%A6%E4%B9%A0%E8%B7%AF%E7%BA%BF/1.htm">学习路线</a><a class="tag" taget="_blank" href="/search/%E9%98%BF%E9%87%8C%E5%B7%B4%E5%B7%B4/1.htm">阿里巴巴</a><a class="tag" taget="_blank" href="/search/android/1.htm">android</a><a class="tag" taget="_blank" href="/search/%E5%89%8D%E7%AB%AF/1.htm">前端</a><a class="tag" taget="_blank" href="/search/%E5%90%8E%E7%AB%AF/1.htm">后端</a> <div>前言“如果说当下什么编程语言最靠谱或者比较适合搞副业?”答案肯定100%是:Pythonpython是所有语法中最简单易上手的语言,不需要特别的的英语词汇量,逻辑思维也不需要很差就能上手。而且学会了之后就能编写代码爬取各种数据,制作各种图表,提升工作效率。而且还能利用业余时间接点私活,一个月轻松收入过万不是问题,这样的生活他不香吗?今天就给大家盘点几个基本入门接私活的资源,让你轻松学python,</div> </li> <li><a href="/article/37.htm" title="ASM系列五 利用TreeApi 解析生成Class" target="_blank">ASM系列五 利用TreeApi 解析生成Class</a> <span class="text-muted">lijingyao8206</span> <a class="tag" taget="_blank" href="/search/ASM/1.htm">ASM</a><a class="tag" taget="_blank" href="/search/%E5%AD%97%E8%8A%82%E7%A0%81%E5%8A%A8%E6%80%81%E7%94%9F%E6%88%90/1.htm">字节码动态生成</a><a class="tag" taget="_blank" href="/search/ClassNode/1.htm">ClassNode</a><a class="tag" taget="_blank" href="/search/TreeAPI/1.htm">TreeAPI</a> <div>   前面CoreApi的介绍部分基本涵盖了ASMCore包下面的主要API及功能,其中还有一部分关于MetaData的解析和生成就不再赘述。这篇开始介绍ASM另一部分主要的Api。TreeApi。这一部分源码是关联的asm-tree-5.0.4的版本。          在介绍前,先要知道一点, Tree工程的接口基本可以完</div> </li> <li><a href="/article/164.htm" title="链表树——复合数据结构应用实例" target="_blank">链表树——复合数据结构应用实例</a> <span class="text-muted">bardo</span> <a class="tag" taget="_blank" href="/search/%E6%95%B0%E6%8D%AE%E7%BB%93%E6%9E%84/1.htm">数据结构</a><a class="tag" taget="_blank" href="/search/%E6%A0%91%E5%9E%8B%E7%BB%93%E6%9E%84/1.htm">树型结构</a><a class="tag" taget="_blank" href="/search/%E8%A1%A8%E7%BB%93%E6%9E%84%E8%AE%BE%E8%AE%A1/1.htm">表结构设计</a><a class="tag" taget="_blank" href="/search/%E9%93%BE%E8%A1%A8/1.htm">链表</a><a class="tag" taget="_blank" href="/search/%E8%8F%9C%E5%8D%95%E6%8E%92%E5%BA%8F/1.htm">菜单排序</a> <div>我们清楚:数据库设计中,表结构设计的好坏,直接影响程序的复杂度。所以,本文就无限级分类(目录)树与链表的复合在表设计中的应用进行探讨。当然,什么是树,什么是链表,这里不作介绍。有兴趣可以去看相关的教材。 需求简介: 经常遇到这样的需求,我们希望能将保存在数据库中的树结构能够按确定的顺序读出来。比如,多级菜单、组织结构、商品分类。更具体的,我们希望某个二级菜单在这一级别中就是第一个。虽然它是最后</div> </li> <li><a href="/article/291.htm" title="为啥要用位运算代替取模呢" target="_blank">为啥要用位运算代替取模呢</a> <span class="text-muted">chenchao051</span> <a class="tag" taget="_blank" href="/search/%E4%BD%8D%E8%BF%90%E7%AE%97/1.htm">位运算</a><a class="tag" taget="_blank" href="/search/%E5%93%88%E5%B8%8C/1.htm">哈希</a><a class="tag" taget="_blank" href="/search/%E6%B1%87%E7%BC%96/1.htm">汇编</a> <div>    在hash中查找key的时候,经常会发现用&取代%,先看两段代码吧,     JDK6中的HashMap中的indexFor方法: /** * Returns index for hash code h. */ static int indexFor(int h, int length) { </div> </li> <li><a href="/article/418.htm" title="最近的情况" target="_blank">最近的情况</a> <span class="text-muted">麦田的设计者</span> <a class="tag" taget="_blank" href="/search/%E7%94%9F%E6%B4%BB/1.htm">生活</a><a class="tag" taget="_blank" href="/search/%E6%84%9F%E6%82%9F/1.htm">感悟</a><a class="tag" taget="_blank" href="/search/%E8%AE%A1%E5%88%92/1.htm">计划</a><a class="tag" taget="_blank" href="/search/%E8%BD%AF%E8%80%83/1.htm">软考</a><a class="tag" taget="_blank" href="/search/%E6%83%B3/1.htm">想</a> <div>      今天是2015年4月27号      整理一下最近的思绪以及要完成的任务             1、最近在驾校科目二练车,每周四天,练三周。其实做什么都要用心,追求合理的途径解决。为</div> </li> <li><a href="/article/545.htm" title="PHP去掉字符串中最后一个字符的方法" target="_blank">PHP去掉字符串中最后一个字符的方法</a> <span class="text-muted">IT独行者</span> <a class="tag" taget="_blank" href="/search/PHP/1.htm">PHP</a><a class="tag" taget="_blank" href="/search/%E5%AD%97%E7%AC%A6%E4%B8%B2/1.htm">字符串</a> <div>今天在PHP项目开发中遇到一个需求,去掉字符串中的最后一个字符 原字符串1,2,3,4,5,6, 去掉最后一个字符",",最终结果为1,2,3,4,5,6 代码如下: $str = "1,2,3,4,5,6,"; $newstr = substr($str,0,strlen($str)-1); echo $newstr; </div> </li> <li><a href="/article/672.htm" title="hadoop在linux上单机安装过程" target="_blank">hadoop在linux上单机安装过程</a> <span class="text-muted">_wy_</span> <a class="tag" taget="_blank" href="/search/linux/1.htm">linux</a><a class="tag" taget="_blank" href="/search/hadoop/1.htm">hadoop</a> <div>1、安装JDK     jdk版本最好是1.6以上,可以使用执行命令java -version查看当前JAVA版本号,如果报命令不存在或版本比较低,则需要安装一个高版本的JDK,并在/etc/profile的文件末尾,根据本机JDK实际的安装位置加上以下几行:    export JAVA_HOME=/usr/java/jdk1.7.0_25  </div> </li> <li><a href="/article/799.htm" title="JAVA进阶----分布式事务的一种简单处理方法" target="_blank">JAVA进阶----分布式事务的一种简单处理方法</a> <span class="text-muted">无量</span> <a class="tag" taget="_blank" href="/search/%E5%A4%9A%E7%B3%BB%E7%BB%9F%E4%BA%A4%E4%BA%92/1.htm">多系统交互</a><a class="tag" taget="_blank" href="/search/%E5%88%86%E5%B8%83%E5%BC%8F/1.htm">分布式</a><a class="tag" taget="_blank" href="/search/%E4%BA%8B%E5%8A%A1/1.htm">事务</a> <div>每个方法都是原子操作: 提供第三方服务的系统,要同时提供执行方法和对应的回滚方法 A系统调用B,C,D系统完成分布式事务 =========执行开始======== A.aa(); try { B.bb(); } catch(Exception e) { A.rollbackAa(); } try { C.cc(); } catch(Excep</div> </li> <li><a href="/article/926.htm" title="安墨移动广 告:移动DSP厚积薄发 引领未来广 告业发展命脉" target="_blank">安墨移动广 告:移动DSP厚积薄发 引领未来广 告业发展命脉</a> <span class="text-muted">矮蛋蛋</span> <a class="tag" taget="_blank" href="/search/hadoop/1.htm">hadoop</a><a class="tag" taget="_blank" href="/search/%E4%BA%92%E8%81%94%E7%BD%91/1.htm">互联网</a> <div>  “谁掌握了强大的DSP技术,谁将引领未来的广 告行业发展命脉。”2014年,移动广 告行业的热点非移动DSP莫属。各个圈子都在纷纷谈论,认为移动DSP是行业突破点,一时间许多移动广 告联盟风起云涌,竞相推出专属移动DSP产品。   到底什么是移动DSP呢?   DSP(Demand-SidePlatform),就是需求方平台,为解决广 告主投放的各种需求,真正实现人群定位的精准广 </div> </li> <li><a href="/article/1053.htm" title="myelipse设置" target="_blank">myelipse设置</a> <span class="text-muted">alafqq</span> <a class="tag" taget="_blank" href="/search/IP/1.htm">IP</a> <div>  在一个项目的完整的生命周期中,其维护费用,往往是其开发费用的数倍。因此项目的可维护性、可复用性是衡量一个项目好坏的关键。而注释则是可维护性中必不可少的一环。 注释模板导入步骤  安装方法: 打开eclipse/myeclipse 选择 window-->Preferences-->JAVA-->Code-->Code </div> </li> <li><a href="/article/1180.htm" title="java数组" target="_blank">java数组</a> <span class="text-muted">百合不是茶</span> <a class="tag" taget="_blank" href="/search/java%E6%95%B0%E7%BB%84/1.htm">java数组</a> <div>java数组的   声明  创建  初始化;   java支持C语言      数组中的每个数都有唯一的一个下标 一维数组的定义 声明: int[] a = new int[3];声明数组中有三个数int[3] int[] a 中有三个数,下标从0开始,可以同过for来遍历数组中的数 </div> </li> <li><a href="/article/1307.htm" title="javascript读取表单数据" target="_blank">javascript读取表单数据</a> <span class="text-muted">bijian1013</span> <a class="tag" taget="_blank" href="/search/JavaScript/1.htm">JavaScript</a> <div>利用javascript读取表单数据,可以利用以下三种方法获取: 1、通过表单ID属性:var a = document.getElementByIdx_x_x("id"); 2、通过表单名称属性:var b = document.getElementsByName("name"); 3、直接通过表单名字获取:var c = form.content.</div> </li> <li><a href="/article/1434.htm" title="探索JUnit4扩展:使用Theory" target="_blank">探索JUnit4扩展:使用Theory</a> <span class="text-muted">bijian1013</span> <a class="tag" taget="_blank" href="/search/java/1.htm">java</a><a class="tag" taget="_blank" href="/search/JUnit/1.htm">JUnit</a><a class="tag" taget="_blank" href="/search/Theory/1.htm">Theory</a> <div>理论机制(Theory) 一.为什么要引用理论机制(Theory)         当今软件开发中,测试驱动开发(TDD — Test-driven development)越发流行。为什么 TDD 会如此流行呢?因为它确实拥有很多优点,它允许开发人员通过简单的例子来指定和表明他们代码的行为意图。 TDD 的优点:     &nb</div> </li> <li><a href="/article/1561.htm" title="[Spring Data Mongo一]Spring Mongo Template操作MongoDB" target="_blank">[Spring Data Mongo一]Spring Mongo Template操作MongoDB</a> <span class="text-muted">bit1129</span> <a class="tag" taget="_blank" href="/search/template/1.htm">template</a> <div>什么是Spring Data Mongo Spring Data MongoDB项目对访问MongoDB的Java客户端API进行了封装,这种封装类似于Spring封装Hibernate和JDBC而提供的HibernateTemplate和JDBCTemplate,主要能力包括 1. 封装客户端跟MongoDB的链接管理 2. 文档-对象映射,通过注解:@Document(collectio</div> </li> <li><a href="/article/1688.htm" title="【Kafka八】Zookeeper上关于Kafka的配置信息" target="_blank">【Kafka八】Zookeeper上关于Kafka的配置信息</a> <span class="text-muted">bit1129</span> <a class="tag" taget="_blank" href="/search/zookeeper/1.htm">zookeeper</a> <div>问题: 1. Kafka的哪些信息记录在Zookeeper中 2. Consumer Group消费的每个Partition的Offset信息存放在什么位置 3. Topic的每个Partition存放在哪个Broker上的信息存放在哪里 4. Producer跟Zookeeper究竟有没有关系?没有关系!!!   //consumers、config、brokers、cont</div> </li> <li><a href="/article/1815.htm" title="java OOM内存异常的四种类型及异常与解决方案" target="_blank">java OOM内存异常的四种类型及异常与解决方案</a> <span class="text-muted">ronin47</span> <a class="tag" taget="_blank" href="/search/java+OOM+%E5%86%85%E5%AD%98%E5%BC%82%E5%B8%B8/1.htm">java OOM 内存异常</a> <div>       OOM异常的四种类型:       一: StackOverflowError :通常因为递归函数引起(死递归,递归太深)。-Xss 128k 一般够用。        二: out Of memory: PermGen Space:通常是动态类大多,比如web 服务器自动更新部署时引起。-Xmx</div> </li> <li><a href="/article/1942.htm" title="java-实现链表反转-递归和非递归实现" target="_blank">java-实现链表反转-递归和非递归实现</a> <span class="text-muted">bylijinnan</span> <a class="tag" taget="_blank" href="/search/java/1.htm">java</a> <div>20120422更新: 对链表中部分节点进行反转操作,这些节点相隔k个: 0->1->2->3->4->5->6->7->8->9 k=2 8->1->6->3->4->5->2->7->0->9 注意1 3 5 7 9 位置是不变的。 解法: 将链表拆成两部分: a.0-&</div> </li> <li><a href="/article/2069.htm" title="Netty源码学习-DelimiterBasedFrameDecoder" target="_blank">Netty源码学习-DelimiterBasedFrameDecoder</a> <span class="text-muted">bylijinnan</span> <a class="tag" taget="_blank" href="/search/java/1.htm">java</a><a class="tag" taget="_blank" href="/search/netty/1.htm">netty</a> <div> 看DelimiterBasedFrameDecoder的API,有举例: 接收到的ChannelBuffer如下: +--------------+ | ABC\nDEF\r\n | +--------------+ 经过DelimiterBasedFrameDecoder(Delimiters.lineDelimiter())之后,得到: +-----+----</div> </li> <li><a href="/article/2196.htm" title="linux的一些命令 -查看cc攻击-网口ip统计等" target="_blank">linux的一些命令 -查看cc攻击-网口ip统计等</a> <span class="text-muted">hotsunshine</span> <a class="tag" taget="_blank" href="/search/linux/1.htm">linux</a> <div>Linux判断CC攻击命令详解 2011年12月23日 ⁄ 安全 ⁄ 暂无评论 查看所有80端口的连接数 netstat -nat|grep -i '80'|wc -l 对连接的IP按连接数量进行排序 netstat -ntu | awk '{print $5}' | cut -d: -f1 | sort | uniq -c | sort -n 查看TCP连接状态 n</div> </li> <li><a href="/article/2323.htm" title="Spring获取SessionFactory" target="_blank">Spring获取SessionFactory</a> <span class="text-muted">ctrain</span> <a class="tag" taget="_blank" href="/search/sessionFactory/1.htm">sessionFactory</a> <div> String sql = "select sysdate from dual"; WebApplicationContext wac = ContextLoader.getCurrentWebApplicationContext(); String[] names = wac.getBeanDefinitionNames(); for(int i=0; i&</div> </li> <li><a href="/article/2450.htm" title="Hive几种导出数据方式" target="_blank">Hive几种导出数据方式</a> <span class="text-muted">daizj</span> <a class="tag" taget="_blank" href="/search/hive/1.htm">hive</a><a class="tag" taget="_blank" href="/search/%E6%95%B0%E6%8D%AE%E5%AF%BC%E5%87%BA/1.htm">数据导出</a> <div>Hive几种导出数据方式   1.拷贝文件   如果数据文件恰好是用户需要的格式,那么只需要拷贝文件或文件夹就可以。 hadoop fs –cp source_path target_path   2.导出到本地文件系统   --不能使用insert into local directory来导出数据,会报错 --只能使用</div> </li> <li><a href="/article/2577.htm" title="编程之美" target="_blank">编程之美</a> <span class="text-muted">dcj3sjt126com</span> <a class="tag" taget="_blank" href="/search/%E7%BC%96%E7%A8%8B/1.htm">编程</a><a class="tag" taget="_blank" href="/search/PHP/1.htm">PHP</a><a class="tag" taget="_blank" href="/search/%E9%87%8D%E6%9E%84/1.htm">重构</a> <div>我个人的 PHP 编程经验中,递归调用常常与静态变量使用。静态变量的含义可以参考 PHP 手册。希望下面的代码,会更有利于对递归以及静态变量的理解   header("Content-type: text/plain"); function static_function () { static $i = 0; if ($i++ < 1</div> </li> <li><a href="/article/2704.htm" title="Android保存用户名和密码" target="_blank">Android保存用户名和密码</a> <span class="text-muted">dcj3sjt126com</span> <a class="tag" taget="_blank" href="/search/android/1.htm">android</a> <div>转自:http://www.2cto.com/kf/201401/272336.html 我们不管在开发一个项目或者使用别人的项目,都有用户登录功能,为了让用户的体验效果更好,我们通常会做一个功能,叫做保存用户,这样做的目地就是为了让用户下一次再使用该程序不会重新输入用户名和密码,这里我使用3种方式来存储用户名和密码 1、通过普通 的txt文本存储 2、通过properties属性文件进行存</div> </li> <li><a href="/article/2831.htm" title="Oracle 复习笔记之同义词" target="_blank">Oracle 复习笔记之同义词</a> <span class="text-muted">eksliang</span> <a class="tag" taget="_blank" href="/search/Oracle+%E5%90%8C%E4%B9%89%E8%AF%8D/1.htm">Oracle 同义词</a><a class="tag" taget="_blank" href="/search/Oracle+synonym/1.htm">Oracle synonym</a> <div>转载请出自出处:http://eksliang.iteye.com/blog/2098861 1.什么是同义词       同义词是现有模式对象的一个别名。       概念性的东西,什么是模式呢?创建一个用户,就相应的创建了 一个模式。模式是指数据库对象,是对用户所创建的数据对象的总称。模式对象包括表、视图、索引、同义词、序列、过</div> </li> <li><a href="/article/2958.htm" title="Ajax案例" target="_blank">Ajax案例</a> <span class="text-muted">gongmeitao</span> <a class="tag" taget="_blank" href="/search/Ajax/1.htm">Ajax</a><a class="tag" taget="_blank" href="/search/jsp/1.htm">jsp</a> <div>数据库采用Sql Server2005 项目名称为:Ajax_Demo 1.com.demo.conn包 package com.demo.conn; import java.sql.Connection;import java.sql.DriverManager;import java.sql.SQLException; //获取数据库连接的类public class DBConnec</div> </li> <li><a href="/article/3085.htm" title="ASP.NET中Request.RawUrl、Request.Url的区别" target="_blank">ASP.NET中Request.RawUrl、Request.Url的区别</a> <span class="text-muted">hvt</span> <a class="tag" taget="_blank" href="/search/.net/1.htm">.net</a><a class="tag" taget="_blank" href="/search/Web/1.htm">Web</a><a class="tag" taget="_blank" href="/search/C%23/1.htm">C#</a><a class="tag" taget="_blank" href="/search/asp.net/1.htm">asp.net</a><a class="tag" taget="_blank" href="/search/hovertree/1.htm">hovertree</a> <div>  如果访问的地址是:http://h.keleyi.com/guestbook/addmessage.aspx?key=hovertree%3C&n=myslider#zonemenu那么Request.Url.ToString() 的值是:http://h.keleyi.com/guestbook/addmessage.aspx?key=hovertree<&</div> </li> <li><a href="/article/3212.htm" title="SVG 教程 (七)SVG 实例,SVG 参考手册" target="_blank">SVG 教程 (七)SVG 实例,SVG 参考手册</a> <span class="text-muted">天梯梦</span> <a class="tag" taget="_blank" href="/search/svg/1.htm">svg</a> <div>SVG 实例 在线实例 下面的例子是把SVG代码直接嵌入到HTML代码中。 谷歌Chrome,火狐,Internet Explorer9,和Safari都支持。 注意:下面的例子将不会在Opera运行,即使Opera支持SVG - 它也不支持SVG在HTML代码中直接使用。   SVG 实例 SVG基本形状 一个圆 矩形 不透明矩形 一个矩形不透明2 一个带圆角矩</div> </li> <li><a href="/article/3339.htm" title="事务管理" target="_blank">事务管理</a> <span class="text-muted">luyulong</span> <a class="tag" taget="_blank" href="/search/java/1.htm">java</a><a class="tag" taget="_blank" href="/search/spring/1.htm">spring</a><a class="tag" taget="_blank" href="/search/%E7%BC%96%E7%A8%8B/1.htm">编程</a><a class="tag" taget="_blank" href="/search/%E4%BA%8B%E5%8A%A1/1.htm">事务</a> <div>事物管理 spring事物的好处 为不同的事物API提供了一致的编程模型 支持声明式事务管理 提供比大多数事务API更简单更易于使用的编程式事务管理API 整合spring的各种数据访问抽象 TransactionDefinition 定义了事务策略 int getIsolationLevel()得到当前事务的隔离级别 READ_COMMITTED </div> </li> <li><a href="/article/3466.htm" title="基础数据结构和算法十一:Red-black binary search tree" target="_blank">基础数据结构和算法十一:Red-black binary search tree</a> <span class="text-muted">sunwinner</span> <a class="tag" taget="_blank" href="/search/Algorithm/1.htm">Algorithm</a><a class="tag" taget="_blank" href="/search/Red-black/1.htm">Red-black</a> <div>  The insertion algorithm for 2-3 trees just described is not difficult to understand; now, we will see that it is also not difficult to implement. We will consider a simple representation known</div> </li> <li><a href="/article/3593.htm" title="centos同步时间" target="_blank">centos同步时间</a> <span class="text-muted">stunizhengjia</span> <a class="tag" taget="_blank" href="/search/linux/1.htm">linux</a><a class="tag" taget="_blank" href="/search/%E9%9B%86%E7%BE%A4%E5%90%8C%E6%AD%A5%E6%97%B6%E9%97%B4/1.htm">集群同步时间</a> <div>做了集群,时间的同步就显得非常必要了。 以下是查到的如何做时间同步。 在CentOS 5不再区分客户端和服务器,只要配置了NTP,它就会提供NTP服务。 1)确认已经ntp程序包: # yum install ntp 2)配置时间源(默认就行,不需要修改) # vi /etc/ntp.conf server pool.ntp.o</div> </li> <li><a href="/article/3720.htm" title="ITeye 9月技术图书有奖试读获奖名单公布" target="_blank">ITeye 9月技术图书有奖试读获奖名单公布</a> <span class="text-muted">ITeye管理员</span> <a class="tag" taget="_blank" href="/search/ITeye/1.htm">ITeye</a> <div>ITeye携手博文视点举办的9月技术图书有奖试读活动已圆满结束,非常感谢广大用户对本次活动的关注与参与。 9月试读活动回顾:http://webmaster.iteye.com/blog/2118112本次技术图书试读活动的优秀奖获奖名单及相应作品如下(优秀文章有很多,但名额有限,没获奖并不代表不优秀):      《NFC:Arduino、Andro</div> </li> </ul> </div> </div> </div> <div> <div class="container"> <div class="indexes"> <strong>按字母分类:</strong> <a href="/tags/A/1.htm" target="_blank">A</a><a href="/tags/B/1.htm" target="_blank">B</a><a href="/tags/C/1.htm" target="_blank">C</a><a href="/tags/D/1.htm" target="_blank">D</a><a href="/tags/E/1.htm" target="_blank">E</a><a href="/tags/F/1.htm" target="_blank">F</a><a href="/tags/G/1.htm" target="_blank">G</a><a href="/tags/H/1.htm" target="_blank">H</a><a href="/tags/I/1.htm" target="_blank">I</a><a href="/tags/J/1.htm" target="_blank">J</a><a href="/tags/K/1.htm" target="_blank">K</a><a href="/tags/L/1.htm" target="_blank">L</a><a href="/tags/M/1.htm" target="_blank">M</a><a href="/tags/N/1.htm" target="_blank">N</a><a href="/tags/O/1.htm" target="_blank">O</a><a href="/tags/P/1.htm" target="_blank">P</a><a href="/tags/Q/1.htm" target="_blank">Q</a><a href="/tags/R/1.htm" target="_blank">R</a><a href="/tags/S/1.htm" target="_blank">S</a><a href="/tags/T/1.htm" target="_blank">T</a><a href="/tags/U/1.htm" target="_blank">U</a><a href="/tags/V/1.htm" target="_blank">V</a><a href="/tags/W/1.htm" target="_blank">W</a><a href="/tags/X/1.htm" target="_blank">X</a><a href="/tags/Y/1.htm" target="_blank">Y</a><a href="/tags/Z/1.htm" target="_blank">Z</a><a href="/tags/0/1.htm" target="_blank">其他</a> </div> </div> </div> <footer id="footer" class="mb30 mt30"> <div class="container"> <div class="footBglm"> <a target="_blank" href="/">首页</a> - <a target="_blank" href="/custom/about.htm">关于我们</a> - <a target="_blank" href="/search/Java/1.htm">站内搜索</a> - <a target="_blank" href="/sitemap.txt">Sitemap</a> - <a target="_blank" href="/custom/delete.htm">侵权投诉</a> </div> <div class="copyright">版权所有 IT知识库 CopyRight © 2000-2050 E-COM-NET.COM , All Rights Reserved. <!-- <a href="https://beian.miit.gov.cn/" rel="nofollow" target="_blank">京ICP备09083238号</a><br>--> </div> </div> </footer> <!-- 代码高亮 --> <script type="text/javascript" src="/static/syntaxhighlighter/scripts/shCore.js"></script> <script type="text/javascript" src="/static/syntaxhighlighter/scripts/shLegacy.js"></script> <script type="text/javascript" src="/static/syntaxhighlighter/scripts/shAutoloader.js"></script> <link type="text/css" rel="stylesheet" href="/static/syntaxhighlighter/styles/shCoreDefault.css"/> <script type="text/javascript" src="/static/syntaxhighlighter/src/my_start_1.js"></script> </body> </html>