Python Scrapy 爬虫教程之选择器 Selectors

Selectors

在抓取一个web页面的时候,大多数任务在于从HTML源中提取数据。有很多可用的的库支持这些操作,比如:

  • BeautifulSoup:这是一个在 Python 编程中非常流行的网页抓取库,它依照HTML代码的结构来构造 Python 对象,并且能正确处理不良标记,但是它有一个弱项:太慢
  • lxml:以非常 python 化的 ElementTree 接口为基础,建立 XML 解析库(同时也能解析 HTML)

Scrapy 有自己的提取数据的机制。它们称之为 selectors(选择器),因为从 HTML 文档中筛选特定内容,可以使用XPathCSS表达式。

XPath是一个筛选 XML 文档节点的语言,也能用于筛选 HTML 文档。
CSS 是一个应用格式到 HTML 文档的语言,它定义选择器与特定 HTML 元素格式之间的关系。

注意:
Scrapy 选择器是 `parsel` 库的轻量级再封装;封装的目的是为了与 Scrapy 响应对象提供更好的整合。
`parsel` 是一个独立的网页抓取库,可以不依赖于 Scrapy。它使用 `lxml` 库作为底层引擎,并且在 lxml 顶层接口再实现了一个简单API。这意味着 Scrapy 选择器的速度与解析准确性与 lxml 十分接近。

一、使用选择器

scrapy shell https://docs.scrapy.org/en/latest/_static/selectors-sample1.html 为例

1.1 构建选择器

使用 .selector 暴露 Response 对象的 Selector 实例:

In [4]: response.selector.xpath('//a/text()').getall()
Out[4]:
['Name: My image 1 ',
 'Name: My image 2 ',
 'Name: My image 3 ',
 'Name: My image 4 ',
 'Name: My image 5 ']

更简洁的方式查询,Scrapy 提供了两种简写:response.xpath()response.css()

In [5]: response.css('a::text').getall()
In [6]: response.xpath('//a/text()').getall()

Scrapy selectors 是 Selector 类的实例,通过传输 TextResponse 对象或作为 unicode 的补全来构成。
通常不需要手动构造 Scrapy selectors,原因如下:response 对象可以用于 Spider 回调,所以大部分场景下会偏向于使用 response.css()response.xpath() 作为简写。通过使用 response.selectorresponse.xpath() response.css() 可以确保响应体只被解析一次。

todo:这里的 Selector 类 和 Spider 与 response 之间的回调 问题,以后在研究源码的时候着重看看怎么处理的

但是在必要条件下,需要直接使用 Selector ,比如要从如下的内容中构造对象:

>>> from scrapy.selector import Selector
>>> body = 'good'
>>> Selector(text=body).xpath('//span/text()').get()
'good'

Selector 会自动基于输入类型选择最好的解析规则(XML 或 HTML)。

1.2 选择器

接下来先介绍如何使用Scrapy shell(它提供了可交互的测试)
使用方法scrapy shell https://docs.scrapy.org/en/latest/_static/selectors-sample1.html

在 shell 加载完成后,可以通过 response 直接获取响应,通过 response.selector 属性获取选择器

由于该网页返回的是 HTML 内容,所以选择器会自动使用 HTML 解析模式。

为title标签内的文本构造 XPath 访问方式

In [7]: response.xpath('//title/text()')
Out[7]: []

可以看到返回的是一个选择器对象列表,如果想要提取文本内容,需要使用选择器的 .get() 或者 .getall() 方法,如下所示:

In [8]: response.xpath('//title/text()').get()
Out[8]: 'Example website'

.get() 永远只返回一个结果;

如果选择器有多个匹配,那么只返回匹配的第一个内容;
如果只有没有匹配,将返回 None

.getall() 返回一个结果列表

注意 CSS 选择器可以使用 CSS3 的伪元素(pseudoelements)选择文本内容和属性节点。

In [9]: response.css('title::text')
Out[9]: []

In [10]: response.css('title::text').get()
Out[10]: 'Example website'

可以得知,.xpath().css() 方法都会返回一个 SelectorList 实例对象,该实例对象是选择器的列表。

这个接口还可以用于快速选择嵌套的数据:

In [11]: response.css('img').xpath('@src').getall()
Out[11]:
['image1_thumb.jpg',
 'image2_thumb.jpg',
 'image3_thumb.jpg',
 'image4_thumb.jpg',
 'image5_thumb.jpg']

自定义返回结果

如果在获取元素时,没有发现对应的元素,那么将返回 None;但是也可以自定义返回结果:

In [12]: response.css('ab_post').get('no_element')
Out[12]: 'no_element'

css 获取属性值 .attrib

在上面的例子中,获取 src 属性使用了 ‘@src’ XPath,在 CSS 中通过 .attrib 也可以查询该属性。

In [13]: [img.attrib['src'] for img in response.css('img')]
Out[13]:
['image1_thumb.jpg',
 'image2_thumb.jpg',
 'image3_thumb.jpg',
 'image4_thumb.jpg',
 'image5_thumb.jpg']

.attrib 作为简写同样也可以直接获取 SelectorList, 它返回第一个被匹配的元素:

In [14]: response.css('img').attrib['src']
Out[14]: 'image1_thumb.jpg'

这种做法在只需要一个结果时非常有用,比如当根据id或页面上唯一的元素选择时:

In [18]: response.css('base').attrib['href']
Out[18]: 'http://example.com/'

综合用法

获取 base 标签的 href 属性内容

In [18]: response.css('base').attrib['href']
Out[18]: 'http://example.com/'

In [19]: response.xpath('//base/@href').get()
Out[19]: 'http://example.com/'

In [20]: response.css('base::attr(href)').get()
Out[20]: 'http://example.com/'

In [21]: response.css('base').attrib['href']
Out[21]: 'http://example.com/'

获取标签的 href 属性内容(限定内容包含 “image”)

In [24]: response.xpath('//a[contains(@href, "image")]/@href').getall()
Out[24]: ['image1.html', 'image2.html', 'image3.html', 'image4.html', 'image5.html']

In [25]: response.css('a[href*=image]::attr(href)').getall()
Out[25]: ['image1.html', 'image2.html', 'image3.html', 'image4.html', 'image5.html']

获取标签 href 内容包含“image”的子标签 src 属性值

In [26]: response.xpath('//a[contains(@href, "image")]/img/@src').getall()
Out[26]:
['image1_thumb.jpg',
 'image2_thumb.jpg',
 'image3_thumb.jpg',
 'image4_thumb.jpg',
 'image5_thumb.jpg']

In [27]: response.css('a[href*=image] img::attr(src)').getall()
Out[27]:
['image1_thumb.jpg',
 'image2_thumb.jpg',
 'image3_thumb.jpg',
 'image4_thumb.jpg',
 'image5_thumb.jpg']

1.3 扩展CSS选择器

根据 W3C 标准,CSS 选择器不能提供选择文本节点或属性值的功能。
但是在网页中抓取内容是非常必要的,Scrapy 为此实现了许多非标准的伪元素。

  • 选择文本节点,使用 ::text
  • 选择属性值,使用 ::attr(name) 这里的 name 属性对应的名称

实例

  • title::text 筛选 </em> 元素的子节点文本</li> <li> <em>*::text</em> 筛选当前选择器上下文的所有子文本节点</li> <li> <em>foo::text</em> 如果 <em>foo</em> 元素存在但是不包含文本,那么返回结果为空。 <ul> <li>这意味着 <em>.css('foo::text').get()</em> 即使元素存在也返回 <em>None</em>,如果需要修改返回值,可以添加 *.get(default='')</li> </ul> </li> <li> <em>a::attr(href)</em> 筛选 <em>href</em> 属性的值</li> </ul> <h2>1.4 嵌套选择器</h2> <p>筛选模式( <em>.xapth()</em> 和 <em>.css()</em> )都返回同一类型选择器的列表,所以你可以对这些筛选列表进行调用,下面是例子:</p> <pre><code class="shell">In [28]: links = response.xpath('//a[contains(@href, "image")]') In [29]: links.getall() Out[29]: ['<a href="image1.html">Name: My image 1 <br><img src="image1_thumb.jpg"></a>', '<a href="image2.html">Name: My image 2 <br><img src="image2_thumb.jpg"></a>', '<a href="image3.html">Name: My image 3 <br><img src="image3_thumb.jpg"></a>', '<a href="image4.html">Name: My image 4 <br><img src="image4_thumb.jpg"></a>', '<a href="image5.html">Name: My image 5 <br><img src="image5_thumb.jpg"></a>'] In [30]: for index, link in enumerate(links): ...: args = (index, link.xpath('@href').get(), link.xpath('img/@src').get()) ...: print('Link numver %d points to url %r and image %r' % args) ...: Link numver 0 points to url 'image1.html' and image 'image1_thumb.jpg' Link numver 1 points to url 'image2.html' and image 'image2_thumb.jpg' Link numver 2 points to url 'image3.html' and image 'image3_thumb.jpg' Link numver 3 points to url 'image4.html' and image 'image4_thumb.jpg' Link numver 4 points to url 'image5.html' and image 'image5_thumb.jpg' </code></pre> <h2>1.5 选择元素属性</h2> <blockquote> <p>有多种方式获取属性的值。</p> </blockquote> <h4>XPath 选择属性</h4> <p>首先,可以使用 XPath 语法:</p> <pre><code class="shell">In [31]: response.xpath('//a/@href').getall() Out[31]: ['image1.html', 'image2.html', 'image3.html', 'image4.html', 'image5.html'] </code></pre> <p>XPath 语法有多种优势:在标准的 XPath 格式中,<em>@attributes</em> 可以作为 XPath 表达式的一部分,等等,可以通过属性值来筛选内容。</p> <h4>CSS 选择属性</h4> <p>Scrapy 也提供了 CSS 选择器的扩展(<em>::attr(...)</em>),它允许这样获得属性值:</p> <pre><code class="shell">In [32]: response.css('a::attr(href)').getall() Out[32]: ['image1.html', 'image2.html', 'image3.html', 'image4.html', 'image5.html'] </code></pre> <h4>Selector attrib 属性</h4> <p>除了这种做法,还有 Selector 的 <em>.attrib</em> 属性。<br> 如果你更希望使用 Python 代码,而不是通过 XPath 或者 CSS 扩展来获取属性,那么这种方式也比较有用:</p> <pre><code class="shell">In [33]: [a.attrib['href'] for a in response.css('a')] Out[33]: ['image1.html', 'image2.html', 'image3.html', 'image4.html', 'image5.html'] </code></pre> <p>这种 python 代码直接读取的方式也可作用于 SelectorList 上;<br> 将会将返回字典,包含第一个匹配元素的属性和值。<br> 如果只需要选择器返回一个结果,那么这么做很方便:</p> <pre><code class="shell">In [34]: response.css('base').attrib Out[34]: {'href': 'http://example.com/'} In [35]: response.css('base').attrib['href'] Out[35]: 'http://example.com/' </code></pre> <h2>1.6 在选择器中使用正则表达式</h2> <p>Selector 类还有 .re() 方法用于提取正则匹配的数据。<br> 然而,不同于 .xpath() 和 .css() 方法,.re() 返回的是一个字符串列表。<br> 所以 .re() 不能做内嵌的 .re() 调用。</p> <blockquote> <p>提取图片名字的例子</p> </blockquote> <pre><code class="shell">In [36]: response.xpath('//a[contains(@href, "image")]/text()').re(r'Name:\s*(.*)') Out[36]: ['My image 1 ', 'My image 2 ', 'My image 3 ', 'My image 4 ', 'My image 5 '] In [37]: response.xpath('//a[contains(@href, "image")]/text()').re_first(r'Name:\s*(.*)') Out[37]: 'My image 1 ' </code></pre> <h1>二、XPaths 的使用</h1> <blockquote> <p>在 Scrapy 中高效使用 XPath 的一些建议</p> </blockquote> <blockquote> <p>扩展链接: http://www.zvon.org/comp/r/tut-XPath_1.html<br> 扩展链接2:https://blog.scrapinghub.com/2014/07/17/xpath-tips-from-the-web-scraping-trenches/</p> </blockquote> <h2>2.1 使用 XPath 相对路径</h2> <p>假设你在嵌套选择器中使用 XPath,如果路径以 '/' 开头,那么 Xpath 会指向文档的绝对位置,而不是你现在调用的选择器。</p> <p>比如,如果想提取 <div>元素 中的所有 <a> 元素。</p> <p>首先,获取 <div> 元素,然后遍历 dvi 内容时使用 '//a' 定位元素</p> <pre><code class="shell">In [38]: divs = response.xpath('//div') In [39]: for p in divs.xpath('//a'): ...: print(p.get()) ...: </code></pre> <p>结果返回为空。</p> <p>实际上,第39行代码中的路径,意味着重新以文档起点为基准构建path,而不是在 <div> 元素中构建。</p> <p>可以做这样的修改:</p> <pre><code class="shell">In [56]: for p in divs.xpath('.//a'): ...: print(p) ...: <Selector xpath='.//a' data='<a href="image1.html">Name: My image 1 <'> <Selector xpath='.//a' data='<a href="image2.html">Name: My image 2 <'> <Selector xpath='.//a' data='<a href="image3.html">Name: My image 3 <'> <Selector xpath='.//a' data='<a href="image4.html">Name: My image 4 <'> <Selector xpath='.//a' data='<a href="image5.html">Name: My image 5 <'> </code></pre> <p>更常规的使用方法,直接使用 a 即可:</p> <pre><code class="shell">In [56]: for p in divs.xpath('a'): ...: print(p) ...: </code></pre> <h2>2.2 当通过类 class 查询时,尽量考虑 CSS</h2> <p>由于一个元素可以包含多个 CSS classes,通过 XPath 锁定 class 的方式去选择元素会冗长无比。</p> <p>你需要这样操作 contains(@class, 'someclass') 来弥补多个类的情况。</p> <p>事实证明,Scrapy 选择器允许你使用「链选择器」,所以大多数情况下可以采用:先使用 CSS 筛选class,然后再切换到 XPath 继续筛选。</p> <pre><code class="shell">>>> sel = Selector(text='<div class="hero shout"><time datetime="2014-07-23 19:00">') >>> sel.css('.shout').xpath('./time/@datetime').get() '2014-07-23 19:00' </code></pre> <p>这种灵活使用的「链式筛选」非常实用,别忘了在使用 .xpath() 的时候,路径添加 '.'。</p> <h2>2.3 区别 //node[1] 和 (//node)[1]</h2> <p>//node[1] 返回的是所有父节点下,第一次出现的节点<br> (//node)[1] 返回所有文档匹配节点的第一个,只返回一个值</p> <h2>2.4 在条件中使用文本节点 ❤️</h2> <p>获取文本内容最好选择 XPath https://www.w3.org/TR/xpath/all/#section-String-Functions,而不要使用 .//text() 而选择 '.' 。</p> <p>这是因为 .//text() 表达式会生成一个节点集合,当 节点集合(node-set) 转换成字符串,这个过程经常发生传递参数到字符串函数中,如 conatins() 或 starts_with() 函数,这会导致只会处理第一个元素。</p> <pre><code class="shell">>>> sel = Selector(text='<a href="#">Click here to go to the <strong>Next Page</strong>') >>> sel.xpath('//a//text()').getall() ['Click here to go to the ', 'Next Page'] >>> sel.xpath("string(//a[1]//text())").getall() # convert it to string ['Click here to go to the '] </code></pre> <p>这里只返回了列表中的第一个元素</p> <blockquote> <p>处理方式:将整个节点转换为字符串,这样就会把字内容都加在一起</p> </blockquote> <pre><code class="shell">>>> sel.xpath('//a[1]').getall() ['<a href="#">Click here to go to the <strong>Next Page</strong></a>'] >>> sel.xpath('string(//a[1])').getall() ['Click here to go to the Next Page'] </code></pre> <h3>从子节点中匹配字符串</h3> <p>如:</p> <pre><code class="shell">>>> sel.xpath("//a[contains(.//text(), 'Next Page')]").getall() [] </code></pre> <p>使用 '.' ,情况变得不同</p> <pre><code class="shell">>>> sel.xpath("//a[contains(., 'Next Page')]").getall() ['<a href="#">Click here to go to the <strong>Next Page</strong></a>'] </code></pre> <h2>2.5 XPath 中的表达式</h2> <p>XPath 允许你在 XPath 表达式中引用变量,语法:$somevariable。<br> 这有点类似于参数查询或 SQL 中的查询占位符 '?',意味着你可以预制查询点,再设置值。</p> <h4>举例一:不通过硬编码的方式,通过 id 属性来匹配元素</h4> <pre><code class="shell">In [66]: response.xpath('//div[@id=$val]/a/text()', val='images').get() Out[66]: 'Name: My image 1 ' </code></pre> <h4>举例二:找到包含五个<a>子标签的<div>标签的id值</h4> <pre><code class="shell">In [69]: response.xpath('//div[count(a)=$cnt]/@id', cnt=5).get() Out[69]: 'images' </code></pre> <p>在调用 .xpath() 的时候,必须绑定引用变量的值,否值会抛出 'ValueError: XPath error' 错误。</p> <p>如果想了解更多,这部分内容是以 parsel 库为基础,更多详情和例子在 parse 教程中有介绍</p> <h2>2.6 移除域名</h2> <p>在使用爬虫项目时,经常会使用到「清除域名,只处理元素名」的操作,从而获得更简单/方便的 XPath。<br> 你可以使用 Selector.remove_namespaces() 方法来移除域名。</p> <p>首先,找到一个博客网站用于实践</p> <pre><code>(base) ☁ cherry scrapy shell https://feeds.feedburner.com/PythonInsider </code></pre> <p>如果网页设定了命名空间,一旦我们想要尝试获取某些标签对象,会全部失败,返回None,因为 Atom XML 会混淆这些节点标签。</p> <p>但是如果先调用了 Selector.remove_namespaces() 方法,那么就可以直接获取这些名称。</p> <p>如果你在好奇为什么域名空间移除操作为什么不默认执行,而是采取手动的方式。简单来说有两个原因:</p> <ol> <li>移除域名空间需要遍历和修改文档中所有节点,这意味着在Scrapy对所有文档执行默认抓取操作过程中,不可避免的产生高昂的操作量。</li> <li>预防在某些情况下不需要使用域名空间,尽管这个操作很少见。</li> </ol> <h2>2.7 使用 EXSLT 扩展 ❤️</h2> <p>由于基于 lxml 顶层再封装,所以 Scrapy 也支持一些 EXSLT 扩展。<br> 它可以预注册域名空间从而使用 XPath 表达式。</p> <table> <thead> <tr> <th>预置</th> <th>域名</th> <th>使用方式</th> </tr> </thead> <tbody> <tr> <td>re</td> <td>http://exslt.org/regular-expression</td> <td>http://exslt.org/regexp/index.html</td> </tr> <tr> <td>set</td> <td>http://exsl.org/sets</td> <td>http://exslt.org/set/index.html</td> </tr> </tbody> </table> <h3>2.7.1 正则表达式</h3> <p>在 test() 方法中,可以提供许多 XPath 没法提供的方法</p> <pre><code>doc = u""" <div> <ul> <li class="item-0"><a href="link1.html">first item</a></li> <li class="item-1"><a href="link2.html">second item</a></li> <li class="item-inactive"><a href="link3.html">third item</a></li> <li class="item-1"><a href="link4.html">fourth item</a></li> <li class="item-0"><a href="link5.html">fifth item</a></li> </ul> </div> """ >>> sel = Selector(text=doc, type='html') >>> sel.xpath('//li//@href').getall() ['link1.html', 'link2.html', 'link3.html', 'link4.html', 'link5.html'] >>> sel.xpath('//li[re:test(@class, "item-\d$")]//@href').getall() ['link1.html', 'link2.html', 'link4.html', 'link5.html'] </code></pre> <blockquote> <p>这里的 li[re:test(@class, "item-\d$')] 使用了正则表达式,这前面的 re() 处理节点文本不同,是处理属性值的正则表达式,而这个功能是 XPath 提供的 contains() 和 start-with() 进阶版本,它可以实现更强的匹配功能。</p> </blockquote> <blockquote> <p>注意 <br> C 语言库的 libxslt 不支持本地 EXSLT 正则表达式,所以 lxml 的功能实现与 Python 的 re 挂钩。尽管如此,在 XPath 中使用正则表达式函数会对性能有影响。</p> </blockquote> <h3>2.7.2 set 操作</h3> <p>set 操作可以在抓取文本前很方便地排除部分文档树内容。</p> <p>比如从某个网站提取微型结构数据:网址(http://schema.org/Product)。只提取 timescopes 和与 itemprops 有关的组。</p> <pre><code class="python">props = scop.xpath('''set:difference(./descendant::*/@itemprop, .//*[@itemscope]/*/@itemprop)''') </code></pre> <h2>2.8 其他的 XPath 扩展</h2> <h3>has-class 扩展</h3> <pre><code class="html"><p class="foo bar-baz">First</p> <p class="foo">Second</p> <p class="bar">Third</p> <p>Fourth</p> </code></pre> <p>可以这么使用</p> <pre><code class="shell">>>> response.xpath('//p[has-class("foo")]') [<Selector xpath='//p[has-class("foo")]' data='<p class="foo bar-baz">First</p>'>, <Selector xpath='//p[has-class("foo")]' data='<p class="foo">Second</p>'>] >>> response.xpath('//p[has-class("foo", "bar-baz")]') [<Selector xpath='//p[has-class("foo", "bar-baz")]' data='<p class="foo bar-baz">First</p>'>] >>> response.xpath('//p[has-class("foo", "bar")]') [] </code></pre> <p>所以 XPath 路径 '//p[has-class("foo", "bar-baz")]' 大致等同于 CSS 路径 'p.foo.bar-baz'。</p> <p>但是记住,XPath 的方式会更慢,因为他是纯 Python 函数,这种方式仅适用于 CSS 选择器无法正常描述的场景。</p> <h3>parsel 的简单扩展</h3> <p>parsel.xpathfuncs.set_xpathfunc(fname, func)</p> <h1>三、引用内建的选择器</h1> <h2>3.1 Selector 选择器对象</h2> <pre><code class="python">class scrapy.selector.Selector(response=None, text=None, type=None, root=None, **kwargs) </code></pre> <p>Selector 对象是选择部分响应内容的包装。</p> <blockquote> <p>response</p> </blockquote> <p>是 HtmlResponse 或 XMLResponse 对象,用于选择和抓取数据</p> <blockquote> <p>text</p> </blockquote> <p>uincode 字符串或utf-8编码的文本,在 response 不可用的情况下替代。不会发生使用 text 或 reponse 。</p> <blockquote> <p>type</p> </blockquote> <p>定义了选择器的类型,可以为 html/xml/None(默认)</p> <ol> <li>如果 type 为 None,那么选择器基于响应,会选择最好的类型解析内容;如果内容为文本,则默认为 html。</li> <li>如果 type 为 None,且传入 response,那么选择器的类型将会按照下面类型推断: <ul> <li>HtmlResponse 对应类型为 html</li> <li>XmlResponse 对应选择器类型为 xml</li> <li>否则选择器类型为 html</li> </ul> </li> <li>如果 type 设定了类型,则不会对内容格式进行检测,强制使用设置的类型。</li> </ol> <blockquote> <p>方法一 xpath</p> </blockquote> <p>xpath(query, namespace=None, **kwargs)</p> <p>寻找匹配 xpath 查询的节点,返回 SelectorList 选择器列表实例,扁平化所有的元素。<br> 元素列表也实现了 Selector 的接口。</p> <ul> <li>query</li> </ul> <p>XPath 查询体,字符串</p> <ul> <li>namaspace<br> 可选项</li> </ul> <p>通过 register_namespace(prefix, uri) 注册后的内容,可以通过 prefis: namespace-uri 的形式使用,不过仅限于当前 Selector 调用。<br> <strong>TODO:这种方式的使用,有一点了解,但是不是很透彻,可待来日解决</strong></p> <p>任何新增的参数名称都可以通过 XPath 表达式传输给 XPath 变量</p> <p><strong>为方便起见,这个方法可以被 response.xpath() 调用</strong></p> <blockquote> <p>方法二 css</p> </blockquote> <p>css(query)</p> <p>应用给定的 CSS 选择器,返回 SelectorList 实例</p> <ul> <li>query</li> </ul> <p>CSS 选择器,字符串格式</p> <p>在后台,CSS 查询会被解析成 XPath,并执行 .xpath() 方法</p> <blockquote> <p>方法三 get</p> </blockquote> <p>get()</p> <p>加载并返回匹配的节点</p> <blockquote> <p>attrib</p> </blockquote> <p>返回基础元素的属性字典</p> <blockquote> <p>re</p> </blockquote> <p>re(regex, replace_entities=True)</p> <p>应用给定的正则表达式,返回匹配的 unicode 字符串列表</p> <ul> <li>regex<br> 可以是编译的正则表达式,字符串会通过 re.compile(regex) 编译。</li> </ul> <p>默认情况下,如 ‘&' 会被直接解析成对应的内容;replace_entities 为 False 则不会做这种改变。</p> <blockquote> <p>re_first</p> </blockquote> <p>re_first(regex, default=None, replace_entities=True)</p> <p>应用给定的正则表达式,返回第一个被匹配的 unicode 字符串。<br> 如果没有匹配,返回默认的值(如果默认值没有提供,则默认为None)</p> <p>另一个可选参数,如上</p> <ul> <li>register_namespace(prefix, uri)<br> 注册给定的域名空间,在当前 Selector 中应用。<br> 没有注册域名空间,你无法从非标准的命名空间中选择或提取数据,具体查看下文 Selector examples on XML response</li> </ul> <blockquote> <p>remove_namespaces()</p> </blockquote> <p>移除所有的域名,允许直接跨过文档获取无域名空间的路径。</p> <blockquote> <p>_<em>bool</em>_()</p> </blockquote> <p>如果没有任何内容,返回 True,否则返回 False。<br> 换句话说,选择器是否有内容</p> <blockquote> <p>getall()</p> </blockquote> <p>加载并返回匹配的所有节点,以 unicode 字符串列表展示。</p> <h2>3.2 选择器列表对象 SelectorList objects</h2> <pre><code class="python">class scrap.selector.SelectorList </code></pre> <p>SelectorList 对象是 list 子类,提供一些额外的方法</p> <blockquote> <p>xpath(xpath, namespaces=None, **kwargs)</p> </blockquote> <p>每个元素都调用 .xpath() 方法,并扁平化返回另一个 SelectorList 对象</p> <ul> <li>query</li> <li>namespace</li> </ul> <blockquote> <p>css(query)</p> </blockquote> <p>为每个元素调用 .css() 方法</p> <ul> <li>query</li> </ul> <blockquote> <p>getall()</p> </blockquote> <p>为每个元素调用 .get() 方法</p> <blockquote> <p>get(default=None)</p> </blockquote> <p>返回第一个元素调用 .get() 的结果。<br> 如果列表为空,则返回默认的结果</p> <blockquote> <p>re(regex, replace_entities=True)</p> </blockquote> <p>为每个元素调用 .re() 方法,扁平化返回列表</p> <blockquote> <p>re_first(regex, default=None, replace_entities=True)</p> </blockquote> <blockquote> <p>attrib</p> </blockquote> <h1>四、例子</h1> <h2>选择 XML 响应</h2> <p>抓取网址:https://support.google.com/merchants/answer/160589?hl=en&ref_topic=2473799</p> <p>提取所有的价格,需要注册一个域名空间:</p> <pre><code class="python">sel = Selector(xml_reponse) # 注册域名空间 sel.regisgter_namespace("g", "http://base.google.com/ns/1.0") sel.xpath("//g:price").getall() </code></pre> <p>[1] https://docs.scrapy.org/en/latest/topics/selectors.html</p> </article>���� </div> </div> </div> <!--PC和WAP自适应版--> <div id="SOHUCS" sid="1495911196547678208"></div> <script type="text/javascript" src="/views/front/js/chanyan.js"></script> <!-- 文章页-底部 动态广告位 --> <div class="youdao-fixed-ad" id="detail_ad_bottom"></div> </div> <div class="col-md-3"> <div class="row" id="ad"> <!-- 文章页-右侧1 动态广告位 --> <div id="right-1" class="col-lg-12 col-md-12 col-sm-4 col-xs-4 ad"> <div class="youdao-fixed-ad" id="detail_ad_1"> </div> </div> <!-- 文章页-右侧2 动态广告位 --> <div id="right-2" class="col-lg-12 col-md-12 col-sm-4 col-xs-4 ad"> <div class="youdao-fixed-ad" id="detail_ad_2"></div> </div> <!-- 文章页-右侧3 动态广告位 --> <div id="right-3" class="col-lg-12 col-md-12 col-sm-4 col-xs-4 ad"> <div class="youdao-fixed-ad" id="detail_ad_3"></div> </div> </div> </div> </div> </div> </div> <div class="container"> <h4 class="pt20 mb15 mt0 border-top">你可能感兴趣的:(Python Scrapy 爬虫教程之选择器 Selectors)</h4> <div id="paradigm-article-related"> <div class="recommend-post mb30"> <ul class="widget-links"> <li><a href="/article/1880629043305443328.htm" title="Python 潮流周刊#84:2024 年 Python 的最佳实践(摘要)" target="_blank">Python 潮流周刊#84:2024 年 Python 的最佳实践(摘要)</a> <span class="text-muted"></span> <a class="tag" taget="_blank" href="/search/python/1.htm">python</a> <div>本周刊由Python猫出品,精心筛选国内外的250+信息源,为你挑选最值得分享的文章、教程、开源项目、软件工具、播客和视频、热门话题等内容。愿景:帮助所有读者精进Python技术,并增长职业和副业的收入。分享了12篇文章,12个开源项目,全文2200字。以下是本期摘要:文章&教程①现代Python开发的良好实践②2024年最先进的Python③回顾一年:2024年的Flask④介绍Annotate</div> </li> <li><a href="/article/1880628253392171008.htm" title="Python基于matplotlib-scalebar库绘制比例尺" target="_blank">Python基于matplotlib-scalebar库绘制比例尺</a> <span class="text-muted">懒大王爱吃狼</span> <a class="tag" taget="_blank" href="/search/python/1.htm">python</a><a class="tag" taget="_blank" href="/search/python/1.htm">python</a><a class="tag" taget="_blank" href="/search/matplotlib/1.htm">matplotlib</a><a class="tag" taget="_blank" href="/search/%E5%BC%80%E5%8F%91%E8%AF%AD%E8%A8%80/1.htm">开发语言</a><a class="tag" taget="_blank" href="/search/%E8%87%AA%E5%8A%A8%E5%8C%96/1.htm">自动化</a><a class="tag" taget="_blank" href="/search/Python%E5%9F%BA%E7%A1%80/1.htm">Python基础</a><a class="tag" taget="_blank" href="/search/opencv/1.htm">opencv</a> <div>在Python中,你可以使用matplotlib-scalebar库来在图表上绘制比例尺。这个库是matplotlib的一个扩展,专门用于在绘图时添加比例尺。以下是一个简单的示例,展示了如何使用matplotlib-scalebar来绘制带有比例尺的图表。首先,你需要安装matplotlib-scalebar库。如果你还没有安装它,可以使用以下命令来安装:pipinstallmatplotlib-</div> </li> <li><a href="/article/1880627276027064320.htm" title="Python 潮流周刊#77:Python 依赖管理就像垃圾场火灾?(摘要)" target="_blank">Python 潮流周刊#77:Python 依赖管理就像垃圾场火灾?(摘要)</a> <span class="text-muted"></span> <a class="tag" taget="_blank" href="/search/python/1.htm">python</a> <div>本周刊由Python猫出品,精心筛选国内外的250+信息源,为你挑选最值得分享的文章、教程、开源项目、软件工具、播客和视频、热门话题等内容。愿景:帮助所有读者精进Python技术,并增长职业和副业的收入。分享了12篇文章,12个开源项目,2则热门讨论,全文2200字。以下是本期摘要:文章&教程①Python依赖管理一种垃圾场火灾②Python的膨胀:精细的项目间依赖关系分析③分享我的Django项</div> </li> <li><a href="/article/1880627023014064128.htm" title="Python 潮流周刊#74:创下吉尼斯世界记录的 Python 编程课(摘要)" target="_blank">Python 潮流周刊#74:创下吉尼斯世界记录的 Python 编程课(摘要)</a> <span class="text-muted"></span> <a class="tag" taget="_blank" href="/search/python/1.htm">python</a> <div>本周刊由Python猫出品,精心筛选国内外的250+信息源,为你挑选最值得分享的文章、教程、开源项目、软件工具、播客和视频、热门话题等内容。愿景:帮助所有读者精进Python技术,并增长职业和副业的收入。本期分享了12篇文章,12个开源项目,2则音视频,全文2300字。好消息:即日起至万圣节(12.31),周刊限时99元/年,欢迎订阅!!以下是本期摘要:文章&教程①创下吉尼斯世界记录的Python</div> </li> <li><a href="/article/1880626642808795136.htm" title="Python 潮流周刊#71:PyPI 应该摆脱掉它的赞助依赖(摘要)" target="_blank">Python 潮流周刊#71:PyPI 应该摆脱掉它的赞助依赖(摘要)</a> <span class="text-muted"></span> <a class="tag" taget="_blank" href="/search/python/1.htm">python</a> <div>本周刊由Python猫出品,精心筛选国内外的250+信息源,为你挑选最值得分享的文章、教程、开源项目、软件工具、播客和视频、热门话题等内容。愿景:帮助所有读者精进Python技术,并增长职业和副业的收入。分享了12篇文章,12个开源项目,1则音视频,全文2000字。以下是本期摘要:文章&教程①PyPI应该摆脱掉它的赞助依赖②创建不分大小写的Python字符串类③用Tree-sitter&Jedi重</div> </li> <li><a href="/article/1880626644146778112.htm" title="Python 潮流周刊#72:Python 3.13.0 最终版已发布!(摘要)" target="_blank">Python 潮流周刊#72:Python 3.13.0 最终版已发布!(摘要)</a> <span class="text-muted"></span> <a class="tag" taget="_blank" href="/search/python/1.htm">python</a> <div>本周刊由Python猫出品,精心筛选国内外的250+信息源,为你挑选最值得分享的文章、教程、开源项目、软件工具、播客和视频、热门话题等内容。愿景:帮助所有读者精进Python技术,并增长职业和副业的收入。分享了14篇文章,12个开源项目,4则音视频,全文2300字。以下是本期摘要:文章&教程①Python3.13.0最终版已发布!②关于Python3.13,了解这些信息就够了③Python3.13</div> </li> <li><a href="/article/1880626388600418304.htm" title="Python 潮流周刊#67:uv 的重磅更新(摘要)" target="_blank">Python 潮流周刊#67:uv 的重磅更新(摘要)</a> <span class="text-muted"></span> <a class="tag" taget="_blank" href="/search/python/1.htm">python</a> <div>本周刊由Python猫出品,精心筛选国内外的250+信息源,为你挑选最值得分享的文章、教程、开源项目、软件工具、播客和视频、热门话题等内容。愿景:帮助所有读者精进Python技术,并增长职业和副业的收入。分享了12篇文章,12个开源项目,全文2000字。以下是本期摘要:文章&教程①uv:统一的Python打包工具②PyJWT和python-jose在处理JWT令牌时的差异③Kindle+Pytho</div> </li> <li><a href="/article/1880626389921624064.htm" title="Python 潮流周刊#68:2023 年 Python 开发者调查结果(摘要)" target="_blank">Python 潮流周刊#68:2023 年 Python 开发者调查结果(摘要)</a> <span class="text-muted"></span> <a class="tag" taget="_blank" href="/search/python/1.htm">python</a> <div>本周刊由Python猫出品,精心筛选国内外的250+信息源,为你挑选最值得分享的文章、教程、开源项目、软件工具、播客和视频、热门话题等内容。愿景:帮助所有读者精进Python技术,并增长职业和副业的收入。分享了12篇文章,12个开源项目,2则热门讨论,全文2100字。以下是本期摘要:文章&教程①2023年Python开发者调查结果②为什么在Docker中我仍然要用Python虚拟环境?③我如何用P</div> </li> <li><a href="/article/1880625756594302976.htm" title="智能合约安全之重入攻击" target="_blank">智能合约安全之重入攻击</a> <span class="text-muted"></span> <div>概述重入攻击(ReentrancyAttack)是一种常见的智能合约安全漏洞,指黑客利用合约中存在的逻辑漏洞,在调用合约函数时,利用合约逻辑漏洞,反复调用合约的函数,并利用这种递归调用的机制,以欺骗合约的计算,从而使攻击者获得非法利益。重入攻击的本质是合约内部调用的函数未能恰当地处理合约状态的更改。攻击者利用这个漏洞,将攻击代码插入到合约执行流程中,使得攻击者可以在合约还未完成之前再次调用某个函数</div> </li> <li><a href="/article/1880625481221468160.htm" title="具体毕设方案100例之第4例STM32智能家居烟雾温度火灾防盗报警系统设计版本1" target="_blank">具体毕设方案100例之第4例STM32智能家居烟雾温度火灾防盗报警系统设计版本1</a> <span class="text-muted">李学长单片机毕设</span> <a class="tag" taget="_blank" href="/search/%E5%8D%95%E7%89%87%E6%9C%BA%E6%AF%95%E8%AE%BE%E5%85%B7%E4%BD%93%E6%96%B9%E6%A1%88/1.htm">单片机毕设具体方案</a><a class="tag" taget="_blank" href="/search/stm32/1.htm">stm32</a><a class="tag" taget="_blank" href="/search/%E6%99%BA%E8%83%BD%E5%AE%B6%E5%B1%85/1.htm">智能家居</a><a class="tag" taget="_blank" href="/search/%E6%AF%95%E4%B8%9A%E8%AE%BE%E8%AE%A1/1.htm">毕业设计</a><a class="tag" taget="_blank" href="/search/51%E5%8D%95%E7%89%87%E6%9C%BA/1.htm">51单片机</a><a class="tag" taget="_blank" href="/search/%E5%B5%8C%E5%85%A5%E5%BC%8F%E7%A1%AC%E4%BB%B6/1.htm">嵌入式硬件</a> <div>使用STM32单片机进行数据处理任务。通过LCD1602液晶显示屏实时显示当前的烟雾浓度值。利用按键功能,用户可以设置烟雾浓度报警的上限值。当检测到的烟雾浓度超过预设的上限值时,启动蜂鸣器进行声光报警。</div> </li> <li><a href="/article/1880624597779410944.htm" title="Python WebSocket服务器介绍" target="_blank">Python WebSocket服务器介绍</a> <span class="text-muted">一只会写程序的猫</span> <a class="tag" taget="_blank" href="/search/Python/1.htm">Python</a><a class="tag" taget="_blank" href="/search/python/1.htm">python</a><a class="tag" taget="_blank" href="/search/websocket/1.htm">websocket</a><a class="tag" taget="_blank" href="/search/%E6%9C%8D%E5%8A%A1%E5%99%A8/1.htm">服务器</a> <div>PythonWebSocket服务器介绍WebSocket是一种在Web浏览器和服务器之间实现全双工通信的协议。它允许服务器主动发送消息到浏览器,而不需要浏览器发起请求。Python提供了许多库和框架来实现WebSocket服务器,本文将介绍如何使用Python构建一个简单的WebSocket服务器。WebSocket协议和工作原理WebSocket协议是通过HTTP协议的升级实现的。在HTTP协</div> </li> <li><a href="/article/1880623211608076288.htm" title="python如何读取csv文件?" target="_blank">python如何读取csv文件?</a> <span class="text-muted">gaogsf</span> <a class="tag" taget="_blank" href="/search/Python/1.htm">Python</a><a class="tag" taget="_blank" href="/search/python/1.htm">python</a><a class="tag" taget="_blank" href="/search/%E5%BC%80%E5%8F%91%E8%AF%AD%E8%A8%80/1.htm">开发语言</a> <div>CSV(CommaSeparatedValues)文件是一种常见的文件格式,它将数据以逗号分隔的形式存储,通常用于存储表格数据。在Python中,我们可以使用多种方法来读取CSV文件,本文将从多个角度分析Python如何读取CSV文件。一、Python内置的csv库Python内置了csv库,可以使用该库中的reader对象来读取CSV文件。下面是一个示例代码:importcsvwithopen(</div> </li> <li><a href="/article/1880622203490332672.htm" title="探索装饰器的奥秘:Python里的超级英雄披风" target="_blank">探索装饰器的奥秘:Python里的超级英雄披风</a> <span class="text-muted">大梦百万秋</span> <a class="tag" taget="_blank" href="/search/%E7%9F%A5%E8%AF%86%E5%AD%A6%E7%88%86/1.htm">知识学爆</a><a class="tag" taget="_blank" href="/search/python/1.htm">python</a><a class="tag" taget="_blank" href="/search/%E5%BC%80%E5%8F%91%E8%AF%AD%E8%A8%80/1.htm">开发语言</a> <div>引言:每一行代码都可以是一件披风有没有想过,代码写得再帅气,读起来再优雅,它始终是千篇一律的套路?有时候,代码中的函数就像是穿着普通衣服的路人,默默地完成任务。而这时候,你可能会想:“嘿,我要给它们一点魔法,让它们更具超能力!”别担心,Python里的装饰器正是你需要的神秘工具,它能给你的函数加上一件“超级英雄披风”,让它们瞬间拥有更多的功能,且不改变它们原本的外貌。今天我们就来一起揭开装饰器的面</div> </li> <li><a href="/article/1880621698949115904.htm" title="在 Python 中使用 PyPDF2 向 PDF 文件批量添加水印" target="_blank">在 Python 中使用 PyPDF2 向 PDF 文件批量添加水印</a> <span class="text-muted">信息科技云课堂</span> <a class="tag" taget="_blank" href="/search/python/1.htm">python</a><a class="tag" taget="_blank" href="/search/pdf/1.htm">pdf</a> <div>目录:使用PyPDF2添加水印到PDF文件批量添加水印到PDF文件所有页PDF文件广泛用于不同的设备和平台上,在某些情况下,可能需要在PDF文件中申明版权,需要将水印、条形码、二维码等添加到PDF中。PyPDF2提供了一种将另一个PDF文件作为水印,添加到PDF文件的方法。在下面的示例中,制作一个PDF水印文档,可以加入文字、二维码,通过合并的方法为PDF文件添加水印。使用PyPDF2添加水印到P</div> </li> <li><a href="/article/1880621348758286336.htm" title="Python 潮流周刊#86:Jupyter Notebook 智能编码助手(摘要)" target="_blank">Python 潮流周刊#86:Jupyter Notebook 智能编码助手(摘要)</a> <span class="text-muted"></span> <a class="tag" taget="_blank" href="/search/python/1.htm">python</a> <div>本周刊由Python猫出品,精心筛选国内外的250+信息源,为你挑选最值得分享的文章、教程、开源项目、软件工具、播客和视频、热门话题等内容。愿景:帮助所有读者精进Python技术,并增长职业和副业的收入。分享了12篇文章,12个开源项目,全文2000字。以下是本期摘要:文章&教程①介绍JupyterNotebook智能助手②用纯Python写一个“Redis”,速度比原生Redis还快?③30分钟</div> </li> <li><a href="/article/1880621094310834176.htm" title="Python 中最易误解的功能" target="_blank">Python 中最易误解的功能</a> <span class="text-muted"></span> <a class="tag" taget="_blank" href="/search/%E5%89%8D%E7%AB%AF/1.htm">前端</a> <div>有些功能即使是经验丰富的开发者也会被难住。我也曾被它们绊倒,花数小时挠头苦思,最终才学会如何正确应对。所以,不浪费时间,让我们来探索Python中最易误解的功能,它们为何棘手,以及你如何能最终掌握它们。1.可变默认参数问题:如果你曾写过一个带有默认列表或字典参数的函数,你可能会注意到一些奇怪的现象。它会在函数调用之间“记住”值!defadd_item(item,items=[]):items.ap</div> </li> <li><a href="/article/1880619178713477120.htm" title="python注册nacos服务" target="_blank">python注册nacos服务</a> <span class="text-muted">MTonj</span> <a class="tag" taget="_blank" href="/search/Python/1.htm">Python</a><a class="tag" taget="_blank" href="/search/python/1.htm">python</a><a class="tag" taget="_blank" href="/search/%E5%BC%80%E5%8F%91%E8%AF%AD%E8%A8%80/1.htm">开发语言</a> <div>根据nacosopenapiOpenAPI指南主要是实现以下接口:创建服务注册实例注销实例删除服务发送实例心跳实现demo如下:一个web服务1http_server1.py#coding:utf-8importsocketfrommultiprocessingimportProcessdefhandle_client(client_socket):"""处理客户端请求"""request_dat</div> </li> <li><a href="/article/1880615142870282240.htm" title="用Python进行websocket接口测试" target="_blank">用Python进行websocket接口测试</a> <span class="text-muted">代码小念</span> <a class="tag" taget="_blank" href="/search/%E8%BD%AF%E4%BB%B6%E6%B5%8B%E8%AF%95/1.htm">软件测试</a><a class="tag" taget="_blank" href="/search/%E8%87%AA%E5%8A%A8%E5%8C%96%E6%B5%8B%E8%AF%95/1.htm">自动化测试</a><a class="tag" taget="_blank" href="/search/%E6%8A%80%E6%9C%AF%E5%88%86%E4%BA%AB/1.htm">技术分享</a><a class="tag" taget="_blank" href="/search/python/1.htm">python</a><a class="tag" taget="_blank" href="/search/websocket/1.htm">websocket</a><a class="tag" taget="_blank" href="/search/%E5%BC%80%E5%8F%91%E8%AF%AD%E8%A8%80/1.htm">开发语言</a> <div>这篇文章主要介绍了用Python进行websocket接口测试,帮助大家更好的理解和使用python,感兴趣的朋友可以了解下我们在做接口测试时,除了常见的http接口,还有一种比较多见,就是socket接口,今天讲解下怎么用Python进行websocket接口测试。SocketSocket又称"套接字",应用程序通常通过"套接字"向网络发出请求或者应答网络请求,使主机间或者一台计算机上的进程间可</div> </li> <li><a href="/article/1880611855605493760.htm" title="使用 Python 实现 WebSocket 服务器与客户端通信" target="_blank">使用 Python 实现 WebSocket 服务器与客户端通信</a> <span class="text-muted">又蓝</span> <a class="tag" taget="_blank" href="/search/python/1.htm">python</a><a class="tag" taget="_blank" href="/search/websocket/1.htm">websocket</a> <div>简介WebSocket是一种基于TCP协议的通信协议,能够在客户端与服务器之间进行全双工(双向)通信。相比传统的HTTP协议,WebSocket可以实现实时数据的传输,尤其适合需要实时交互的应用场景,如在线游戏、实时聊天、金融交易等。我通过Python实现一个简单的WebSocket服务器,并使其与客户端进行通信。我们将创建两个Python文件:websocket.py和main.py,webso</div> </li> <li><a href="/article/1880607822786392064.htm" title="基于Python实现读取嵌套压缩包下的文件" target="_blank">基于Python实现读取嵌套压缩包下的文件</a> <span class="text-muted">袁袁袁袁满</span> <a class="tag" taget="_blank" href="/search/Python%E5%AE%9E%E7%94%A8%E6%8A%80%E5%B7%A7%E5%A4%A7%E5%85%A8/1.htm">Python实用技巧大全</a><a class="tag" taget="_blank" href="/search/python/1.htm">python</a><a class="tag" taget="_blank" href="/search/%E5%B5%8C%E5%A5%97%E5%8E%8B%E7%BC%A9%E5%8C%85%E4%B8%8B%E6%96%87%E4%BB%B6%E8%AF%BB%E5%8F%96/1.htm">嵌套压缩包下文件读取</a><a class="tag" taget="_blank" href="/search/Python%E5%AE%9E%E7%8E%B0%E5%B5%8C%E5%A5%97%E5%8E%8B%E7%BC%A9%E5%8C%85/1.htm">Python实现嵌套压缩包</a><a class="tag" taget="_blank" href="/search/%E5%8E%8B%E7%BC%A9%E5%8C%85/1.htm">压缩包</a><a class="tag" taget="_blank" href="/search/zipfile/1.htm">zipfile</a><a class="tag" taget="_blank" href="/search/BytesIO/1.htm">BytesIO</a> <div>文章目录前言思路完整代码代码优化前言工作中遇到的问题,需要用Python实现嵌套压缩包下文件读取,这里记录下方法,希望能帮助到更多的人。思路打开外层zip压缩包并遍历文件:使用withzipfile.ZipFile(outer_zip_path,'r')asouter_zip语句以读取模式'r'打开用户输入的外层zip压缩包对应的文件,这样在代码块结束后会自动关闭该文件,避免资源泄露。通过oute</div> </li> <li><a href="/article/1880607696642699264.htm" title="【如何利用Python抢演唱会门票】python利用selenium实现大麦网抢票" target="_blank">【如何利用Python抢演唱会门票】python利用selenium实现大麦网抢票</a> <span class="text-muted">Python小炮车</span> <a class="tag" taget="_blank" href="/search/python/1.htm">python</a><a class="tag" taget="_blank" href="/search/selenium/1.htm">selenium</a><a class="tag" taget="_blank" href="/search/%E6%95%B0%E6%8D%AE%E5%BA%93/1.htm">数据库</a> <div>一、selenium原理介绍Selenium是一个用于Web[应用程序](https://link.juejin.cn/?target=https%3A%2F%2Fbaike.baidu.com%2Fitem%2F%25E5%25BA%2594%25E7%2594%25A8%25E7%25A8%258B%25E5%25BA%258F%2F5985445%3FfromModule%3Dlemma_i</div> </li> <li><a href="/article/1880602145523298304.htm" title="Python 实现七大排序算法" target="_blank">Python 实现七大排序算法</a> <span class="text-muted">weixin_30527323</span> <a class="tag" taget="_blank" href="/search/python/1.htm">python</a><a class="tag" taget="_blank" href="/search/shell/1.htm">shell</a><a class="tag" taget="_blank" href="/search/%E6%95%B0%E6%8D%AE%E7%BB%93%E6%9E%84%E4%B8%8E%E7%AE%97%E6%B3%95/1.htm">数据结构与算法</a> <div>技术博客:github.com/yongxinz/te…本文用Python实现了插入排序、希尔排序、冒泡排序、快速排序、直接选择排序、堆排序、归并排序。先整体看一下各个算法之间的对比,然后再进行详细介绍:排序算法平均时间复杂度最好情况最坏情况空间复杂度排序方式稳定性插入排序O(n²)O(n)O(n²)O(1)In-place稳定冒泡排序O(n²)O(n)O(n²)O(1)In-place稳定选择排</div> </li> <li><a href="/article/1880597353434509312.htm" title="设计模式之命令模式:从原理到实战,深入解析及源码应用" target="_blank">设计模式之命令模式:从原理到实战,深入解析及源码应用</a> <span class="text-muted">coffee_baby</span> <a class="tag" taget="_blank" href="/search/%E8%AE%BE%E8%AE%A1%E6%A8%A1%E5%BC%8F%E5%8E%9F%E7%90%86%E5%92%8C%E5%AE%9E%E6%88%98/1.htm">设计模式原理和实战</a><a class="tag" taget="_blank" href="/search/%E8%AE%BE%E8%AE%A1%E6%A8%A1%E5%BC%8F/1.htm">设计模式</a><a class="tag" taget="_blank" href="/search/%E5%91%BD%E4%BB%A4%E6%A8%A1%E5%BC%8F/1.htm">命令模式</a><a class="tag" taget="_blank" href="/search/java/1.htm">java</a> <div>命令模式什么是命令模式?命令模式(CommandPattern)是一种行为设计模式,它将一个请求封装为一个对象,从而允许使用不同的请求、队列或者日志来参数化对象,并支持可撤销的操作。命令模式的核心思想是将命令的发起者和执行者解耦,从而使得命令的发起者不必关心命令是如何被执行的。命令模式的关键组成部分:命令(Command):定义命令的接口,声明执行方法。具体命令(ConcreteCommand):</div> </li> <li><a href="/article/1880597101025488896.htm" title="Python数据分析高频面试题及答案" target="_blank">Python数据分析高频面试题及答案</a> <span class="text-muted">闲人编程</span> <a class="tag" taget="_blank" href="/search/%E7%A8%8B%E5%BA%8F%E5%91%98%E9%9D%A2%E8%AF%95/1.htm">程序员面试</a><a class="tag" taget="_blank" href="/search/python/1.htm">python</a><a class="tag" taget="_blank" href="/search/%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90/1.htm">数据分析</a><a class="tag" taget="_blank" href="/search/%E9%9D%A2%E8%AF%95%E9%A2%98/1.htm">面试题</a><a class="tag" taget="_blank" href="/search/%E6%A0%B8%E5%BF%83/1.htm">核心</a> <div>目录1.基础知识2.数据处理3.数据可视化4.机器学习模型5.进阶问题6.数据清洗与预处理7.数据转换与操作8.时间序列分析9.高级数据分析技术10.数据降维与特征选择11.模型评估与优化12.数据操作与转换13.数据筛选与分析14.数据可视化与报告15.数据统计与分析16.高级数据处理以下是一些Python数据分析的高频核心面试题及其答案,涵盖了基础知识、数据1.基础知识问1:Python中列表</div> </li> <li><a href="/article/1880593937723355136.htm" title="Java 基础之泛型:类型安全的保障与灵活运用" target="_blank">Java 基础之泛型:类型安全的保障与灵活运用</a> <span class="text-muted">幽兰的天空</span> <a class="tag" taget="_blank" href="/search/Java/1.htm">Java</a><a class="tag" taget="_blank" href="/search/%E5%9F%BA%E7%A1%80%E5%90%AF%E8%88%AA%EF%BC%9A%E4%BB%8E%E9%9B%B6%E5%88%B0%E5%B0%8F%E6%9C%89%E6%89%80%E6%88%90/1.htm">基础启航:从零到小有所成</a><a class="tag" taget="_blank" href="/search/%E5%BC%80%E5%8F%91%E8%AF%AD%E8%A8%80/1.htm">开发语言</a><a class="tag" taget="_blank" href="/search/java/1.htm">java</a> <div>在Java编程的世界里,泛型是一个至关重要且非常实用的特性。它在Java5中被引入,从根本上改变了我们处理数据类型的方式,提供了更强的类型安全保障,同时也增加了代码的复用性和可读性。一、什么是泛型泛型(Generics)简单来说,就是允许在定义类、接口和方法时使用类型参数。这些类型参数在使用时会被具体的类型所替代。例如,我们常见的集合类ArrayList就是一个泛型类,它的定义形式是ArrayLi</div> </li> <li><a href="/article/1880593054130302976.htm" title="Python数据分析常见面试题和答案01-10" target="_blank">Python数据分析常见面试题和答案01-10</a> <span class="text-muted">飞翔还哈哈6</span> <a class="tag" taget="_blank" href="/search/Python%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90/1.htm">Python数据分析</a><a class="tag" taget="_blank" href="/search/python/1.htm">python</a><a class="tag" taget="_blank" href="/search/pandas/1.htm">pandas</a><a class="tag" taget="_blank" href="/search/%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90/1.htm">数据分析</a> <div>以下是一些Python数据分析常见面试题和答案:1.Python中的list和tuple的区别是什么?答:List是可变的,而元组(tuple)是不可变的。因此,使用list来存储需要频繁修改的数据,而使用元组来存储不能更改的数据项。2.解释NumPy中的数组?为什么numpy在数据分析中很重要?答:NumPy是Python中提供高性能科学计算和数据分析的包。NumPy数组是一种类似于列表的数据结</div> </li> <li><a href="/article/1880592927818838016.htm" title="【Python小技巧】使用prettytable格式化显示dataframe数据" target="_blank">【Python小技巧】使用prettytable格式化显示dataframe数据</a> <span class="text-muted">IT里的交易员</span> <a class="tag" taget="_blank" href="/search/Python%E7%BB%8F%E9%AA%8C%E6%B1%A0/1.htm">Python经验池</a><a class="tag" taget="_blank" href="/search/python/1.htm">python</a> <div>文章目录前言一、安装prettytable二、函数打包三、应用示例总结前言经常我们使用print(df)输出dataframe数据,打印输出的数据没有格式,看起来屏幕一篇乱。有没有一种可以格式化输出的工具?还真有,那就是prettytable。一、安装prettytablePrettyTable是Python中的一个库,用于以美观的表格形式显示数据。要使用PrettyTable,首先需要安装它,可</div> </li> <li><a href="/article/1880588888624394240.htm" title="Python中用ollama库实现连续对话" target="_blank">Python中用ollama库实现连续对话</a> <span class="text-muted">longnershot</span> <a class="tag" taget="_blank" href="/search/python/1.htm">python</a><a class="tag" taget="_blank" href="/search/%E5%BC%80%E5%8F%91%E8%AF%AD%E8%A8%80/1.htm">开发语言</a><a class="tag" taget="_blank" href="/search/AI%E7%BC%96%E7%A8%8B/1.htm">AI编程</a> <div>找来找去没找到一个简单示例,用4o和问心来回调整简单生成了一个,抛砖引玉了。importollamadefchat_with_ollama():#初始化一个列表来存储对话历史,每个元素是一个包含用户输入和模型回复的元组history=[]whileTrue:#获取用户输入,并转换为小写,方便后续判断退出条件user_input=input("\nUser:")#判断用户是否想要退出对话ifuser</div> </li> <li><a href="/article/1880588001894002688.htm" title="Python电子书教程汇总" target="_blank">Python电子书教程汇总</a> <span class="text-muted">iteye_3941</span> <a class="tag" taget="_blank" href="/search/python/1.htm">python</a> <div>From:http://bathome.net/thread-15554-1-1.html[转载教程]Python电子书教程汇总(2012-02-16更新)简明Python教程(AByteofPython)_1.20_中文版pdfhttp://www.rayfile.com/zh-cn/files/6cdcc561-58b2-11e1-ad5e-0015c55db73d/Python语言从入门到精</div> </li> <li><a href="/article/1880587998697943040.htm" title="深入理解观察者模式 —— Qt信号槽机制的实现" target="_blank">深入理解观察者模式 —— Qt信号槽机制的实现</a> <span class="text-muted">拾工</span> <a class="tag" taget="_blank" href="/search/%E8%BD%AF%E4%BB%B6%E8%AE%BE%E8%AE%A1/1.htm">软件设计</a><a class="tag" taget="_blank" href="/search/%E8%A7%82%E5%AF%9F%E8%80%85%E6%A8%A1%E5%BC%8F/1.htm">观察者模式</a><a class="tag" taget="_blank" href="/search/qt/1.htm">qt</a><a class="tag" taget="_blank" href="/search/%E5%BC%80%E5%8F%91%E8%AF%AD%E8%A8%80/1.htm">开发语言</a> <div>观察者模式是一种行为型设计模式,允许一个对象(被观察者)状态发生变化时通知一组依赖它的对象(观察者),从而实现对象之间的解耦。在这篇文章中,我们将探讨如何用C++和Python实现观察者模式,并在代码中清晰地体现这一设计模式的核心思想。其实Qt的信号槽机制,就是借住了这一设计模式,并对其进行了一些扩展。由于Qt广泛的被C++和Python用户使用,所以这里给出Python和C++两个版本的简单实现</div> </li> <li><a href="/article/96.htm" title="怎么样才能成为专业的程序员?" target="_blank">怎么样才能成为专业的程序员?</a> <span class="text-muted">cocos2d-x小菜</span> <a class="tag" taget="_blank" href="/search/%E7%BC%96%E7%A8%8B/1.htm">编程</a><a class="tag" taget="_blank" href="/search/PHP/1.htm">PHP</a> <div>  如何要想成为一名专业的程序员?仅仅会写代码是不够的。从团队合作去解决问题到版本控制,你还得具备其他关键技能的工具包。当我们询问相关的专业开发人员,那些必备的关键技能都是什么的时候,下面是我们了解到的情况。   关于如何学习代码,各种声音很多,然后很多人就被误导为成为专业开发人员懂得一门编程语言就够了?!呵呵,就像其他工作一样,光会一个技能那是远远不够的。如果你想要成为</div> </li> <li><a href="/article/223.htm" title="java web开发 高并发处理" target="_blank">java web开发 高并发处理</a> <span class="text-muted">BreakingBad</span> <a class="tag" taget="_blank" href="/search/java/1.htm">java</a><a class="tag" taget="_blank" href="/search/Web/1.htm">Web</a><a class="tag" taget="_blank" href="/search/%E5%B9%B6%E5%8F%91/1.htm">并发</a><a class="tag" taget="_blank" href="/search/%E5%BC%80%E5%8F%91/1.htm">开发</a><a class="tag" taget="_blank" href="/search/%E5%A4%84%E7%90%86/1.htm">处理</a><a class="tag" taget="_blank" href="/search/%E9%AB%98/1.htm">高</a> <div>java处理高并发高负载类网站中数据库的设计方法(java教程,java处理大量数据,java高负载数据) 一:高并发高负载类网站关注点之数据库 没错,首先是数据库,这是大多数应用所面临的首个SPOF。尤其是Web2.0的应用,数据库的响应是首先要解决的。 一般来说MySQL是最常用的,可能最初是一个mysql主机,当数据增加到100万以上,那么,MySQL的效能急剧下降。常用的优化措施是M-S(</div> </li> <li><a href="/article/350.htm" title="mysql批量更新" target="_blank">mysql批量更新</a> <span class="text-muted">ekian</span> <a class="tag" taget="_blank" href="/search/mysql/1.htm">mysql</a> <div>mysql更新优化: 一版的更新的话都是采用update set的方式,但是如果需要批量更新的话,只能for循环的执行更新。或者采用executeBatch的方式,执行更新。无论哪种方式,性能都不见得多好。 三千多条的更新,需要3分多钟。 查询了批量更新的优化,有说replace into的方式,即: replace into tableName(id,status) values</div> </li> <li><a href="/article/477.htm" title="微软BI(3)" target="_blank">微软BI(3)</a> <span class="text-muted">18289753290</span> <a class="tag" taget="_blank" href="/search/%E5%BE%AE%E8%BD%AFBI+SSIS/1.htm">微软BI SSIS</a> <div>1) Q:该列违反了完整性约束错误;已获得 OLE DB 记录。源:“Microsoft SQL Server Native Client 11.0” Hresult: 0x80004005 说明:“不能将值 NULL 插入列 'FZCHID',表 'JRB_EnterpriseCredit.dbo.QYFZCH';列不允许有 Null 值。INSERT 失败。”。 A:一般这类问题的存在是 </div> </li> <li><a href="/article/604.htm" title="Java中的List" target="_blank">Java中的List</a> <span class="text-muted">g21121</span> <a class="tag" taget="_blank" href="/search/java/1.htm">java</a> <div>        List是一个有序的 collection(也称为序列)。此接口的用户可以对列表中每个元素的插入位置进行精确地控制。用户可以根据元素的整数索引(在列表中的位置)访问元素,并搜索列表中的元素。         与 set 不同,列表通常允许重复</div> </li> <li><a href="/article/731.htm" title="读书笔记" target="_blank">读书笔记</a> <span class="text-muted">永夜-极光</span> <a class="tag" taget="_blank" href="/search/%E8%AF%BB%E4%B9%A6%E7%AC%94%E8%AE%B0/1.htm">读书笔记</a> <div>   1.  K是一家加工厂,需要采购原材料,有A,B,C,D 4家供应商,其中A给出的价格最低,性价比最高,那么假如你是这家企业的采购经理,你会如何决策?          传统决策: A:100%订单  B,C,D:0%     &nbs</div> </li> <li><a href="/article/858.htm" title="centos 安装 Codeblocks" target="_blank">centos 安装 Codeblocks</a> <span class="text-muted">随便小屋</span> <a class="tag" taget="_blank" href="/search/codeblocks/1.htm">codeblocks</a> <div>1.安装gcc,需要c和c++两部分,默认安装下,CentOS不安装编译器的,在终端输入以下命令即可yum install gccyum install gcc-c++   2.安装gtk2-devel,因为默认已经安装了正式产品需要的支持库,但是没有安装开发所需要的文档.yum install gtk2* 3. 安装wxGTK    yum search w</div> </li> <li><a href="/article/985.htm" title="23种设计模式的形象比喻" target="_blank">23种设计模式的形象比喻</a> <span class="text-muted">aijuans</span> <a class="tag" taget="_blank" href="/search/%E8%AE%BE%E8%AE%A1%E6%A8%A1%E5%BC%8F/1.htm">设计模式</a> <div>1、ABSTRACT FACTORY—追MM少不了请吃饭了,麦当劳的鸡翅和肯德基的鸡翅都是MM爱吃的东西,虽然口味有所不同,但不管你带MM去麦当劳或肯德基,只管向服务员说“来四个鸡翅”就行了。麦当劳和肯德基就是生产鸡翅的Factory   工厂模式:客户类和工厂类分开。消费者任何时候需要某种产品,只需向工厂请求即可。消费者无须修改就可以接纳新产品。缺点是当产品修改时,工厂类也要做相应的修改。如:</div> </li> <li><a href="/article/1112.htm" title="开发管理 CheckLists" target="_blank">开发管理 CheckLists</a> <span class="text-muted">aoyouzi</span> <a class="tag" taget="_blank" href="/search/%E5%BC%80%E5%8F%91%E7%AE%A1%E7%90%86+CheckLists/1.htm">开发管理 CheckLists</a> <div>开发管理 CheckLists(23) -使项目组度过完整的生命周期 开发管理 CheckLists(22) -组织项目资源 开发管理 CheckLists(21) -控制项目的范围开发管理 CheckLists(20) -项目利益相关者责任开发管理 CheckLists(19) -选择合适的团队成员开发管理 CheckLists(18) -敏捷开发 Scrum Master 工作开发管理 C</div> </li> <li><a href="/article/1239.htm" title="js实现切换" target="_blank">js实现切换</a> <span class="text-muted">百合不是茶</span> <a class="tag" taget="_blank" href="/search/JavaScript/1.htm">JavaScript</a><a class="tag" taget="_blank" href="/search/%E6%A0%8F%E7%9B%AE%E5%88%87%E6%8D%A2/1.htm">栏目切换</a> <div>js主要功能之一就是实现页面的特效,窗体的切换可以减少页面的大小,被门户网站大量应用思路: 1,先将要显示的设置为display:bisible 否则设为none 2,设置栏目的id ,js获取栏目的id,如果id为Null就设置为显示 3,判断js获取的id名字;再设置是否显示   代码实现:   html代码: <di</div> </li> <li><a href="/article/1366.htm" title="周鸿祎在360新员工入职培训上的讲话" target="_blank">周鸿祎在360新员工入职培训上的讲话</a> <span class="text-muted">bijian1013</span> <a class="tag" taget="_blank" href="/search/%E6%84%9F%E6%82%9F/1.htm">感悟</a><a class="tag" taget="_blank" href="/search/%E9%A1%B9%E7%9B%AE%E7%AE%A1%E7%90%86/1.htm">项目管理</a><a class="tag" taget="_blank" href="/search/%E4%BA%BA%E7%94%9F/1.htm">人生</a><a class="tag" taget="_blank" href="/search/%E8%81%8C%E5%9C%BA/1.htm">职场</a> <div>        这篇文章也是最近偶尔看到的,考虑到原博客发布者可能将其删除等原因,也更方便个人查找,特将原文拷贝再发布的。“学东西是为自己的,不要整天以混的姿态来跟公司博弈,就算是混,我觉得你要是能在混的时间里,收获一些别的有利于人生发展的东西,也是不错的,看你怎么把握了”,看了之后,对这句话记忆犹新。  &</div> </li> <li><a href="/article/1493.htm" title="前端Web开发的页面效果" target="_blank">前端Web开发的页面效果</a> <span class="text-muted">Bill_chen</span> <a class="tag" taget="_blank" href="/search/html/1.htm">html</a><a class="tag" taget="_blank" href="/search/Web/1.htm">Web</a><a class="tag" taget="_blank" href="/search/Microsoft/1.htm">Microsoft</a> <div>1.IE6下png图片的透明显示: <img src="图片地址" border="0" style="Filter.Alpha(Opacity)=数值(100),style=数值(3)"/> 或在<head></head>间加一段JS代码让透明png图片正常显示。 2.<li>标</div> </li> <li><a href="/article/1620.htm" title="【JVM五】老年代垃圾回收:并发标记清理GC(CMS GC)" target="_blank">【JVM五】老年代垃圾回收:并发标记清理GC(CMS GC)</a> <span class="text-muted">bit1129</span> <a class="tag" taget="_blank" href="/search/%E5%9E%83%E5%9C%BE%E5%9B%9E%E6%94%B6/1.htm">垃圾回收</a> <div>  CMS概述 并发标记清理垃圾回收(Concurrent Mark and Sweep GC)算法的主要目标是在GC过程中,减少暂停用户线程的次数以及在不得不暂停用户线程的请夸功能,尽可能短的暂停用户线程的时间。这对于交互式应用,比如web应用来说,是非常重要的。   CMS垃圾回收针对新生代和老年代采用不同的策略。相比同吞吐量垃圾回收,它要复杂的多。吞吐量垃圾回收在执</div> </li> <li><a href="/article/1747.htm" title="Struts2技术总结" target="_blank">Struts2技术总结</a> <span class="text-muted">白糖_</span> <a class="tag" taget="_blank" href="/search/struts2/1.htm">struts2</a> <div>  必备jar文件 早在struts2.0.*的时候,struts2的必备jar包需要如下几个: commons-logging-*.jar   Apache旗下commons项目的log日志包 freemarker-*.jar          </div> </li> <li><a href="/article/1874.htm" title="Jquery easyui layout应用注意事项" target="_blank">Jquery easyui layout应用注意事项</a> <span class="text-muted">bozch</span> <a class="tag" taget="_blank" href="/search/jquery/1.htm">jquery</a><a class="tag" taget="_blank" href="/search/%E6%B5%8F%E8%A7%88%E5%99%A8/1.htm">浏览器</a><a class="tag" taget="_blank" href="/search/easyui/1.htm">easyui</a><a class="tag" taget="_blank" href="/search/layout/1.htm">layout</a> <div>在jquery easyui中提供了easyui-layout布局,他的布局比较局限,类似java中GUI的border布局。下面对其使用注意事项作简要介绍:      如果在现有的工程中前台界面均应用了jquery easyui,那么在布局的时候最好应用jquery eaysui的layout布局,否则在表单页面(编辑、查看、添加等等)在不同的浏览器会出</div> </li> <li><a href="/article/2001.htm" title="java-拷贝特殊链表:有一个特殊的链表,其中每个节点不但有指向下一个节点的指针pNext,还有一个指向链表中任意节点的指针pRand,如何拷贝这个特殊链表?" target="_blank">java-拷贝特殊链表:有一个特殊的链表,其中每个节点不但有指向下一个节点的指针pNext,还有一个指向链表中任意节点的指针pRand,如何拷贝这个特殊链表?</a> <span class="text-muted">bylijinnan</span> <a class="tag" taget="_blank" href="/search/java/1.htm">java</a> <div> public class CopySpecialLinkedList { /** * 题目:有一个特殊的链表,其中每个节点不但有指向下一个节点的指针pNext,还有一个指向链表中任意节点的指针pRand,如何拷贝这个特殊链表? 拷贝pNext指针非常容易,所以题目的难点是如何拷贝pRand指针。 假设原来链表为A1 -> A2 ->... -> An,新拷贝</div> </li> <li><a href="/article/2128.htm" title="color" target="_blank">color</a> <span class="text-muted">Chen.H</span> <a class="tag" taget="_blank" href="/search/JavaScript/1.htm">JavaScript</a><a class="tag" taget="_blank" href="/search/html/1.htm">html</a><a class="tag" taget="_blank" href="/search/css/1.htm">css</a> <div><!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"  "http://www.w3.org/TR/html4/loose.dtd">    <HTML>    <HEAD>&nbs</div> </li> <li><a href="/article/2255.htm" title="[信息与战争]移动通讯与网络" target="_blank">[信息与战争]移动通讯与网络</a> <span class="text-muted">comsci</span> <a class="tag" taget="_blank" href="/search/%E7%BD%91%E7%BB%9C/1.htm">网络</a> <div>      两个坚持:手机的电池必须可以取下来                光纤不能够入户,只能够到楼宇       建议大家找这本书看看:<&</div> </li> <li><a href="/article/2382.htm" title="oracle flashback query(闪回查询)" target="_blank">oracle flashback query(闪回查询)</a> <span class="text-muted">daizj</span> <a class="tag" taget="_blank" href="/search/oracle/1.htm">oracle</a><a class="tag" taget="_blank" href="/search/flashback+query/1.htm">flashback query</a><a class="tag" taget="_blank" href="/search/flashback+table/1.htm">flashback table</a> <div>在Oracle 10g中,Flash back家族分为以下成员: Flashback Database Flashback Drop Flashback Table Flashback Query(分Flashback Query,Flashback Version Query,Flashback Transaction Query) 下面介绍一下Flashback Drop 和Flas</div> </li> <li><a href="/article/2509.htm" title="zeus持久层DAO单元测试" target="_blank">zeus持久层DAO单元测试</a> <span class="text-muted">deng520159</span> <a class="tag" taget="_blank" href="/search/%E5%8D%95%E5%85%83%E6%B5%8B%E8%AF%95/1.htm">单元测试</a> <div>zeus代码测试正紧张进行中,但由于工作比较忙,但速度比较慢.现在已经完成读写分离单元测试了,现在把几种情况单元测试的例子发出来,希望有人能进出意见,让它走下去. 本文是zeus的dao单元测试: 1.单元测试直接上代码   package com.dengliang.zeus.webdemo.test; import org.junit.Test; import o</div> </li> <li><a href="/article/2636.htm" title="C语言学习三printf函数和scanf函数学习" target="_blank">C语言学习三printf函数和scanf函数学习</a> <span class="text-muted">dcj3sjt126com</span> <a class="tag" taget="_blank" href="/search/c/1.htm">c</a><a class="tag" taget="_blank" href="/search/printf/1.htm">printf</a><a class="tag" taget="_blank" href="/search/scanf/1.htm">scanf</a><a class="tag" taget="_blank" href="/search/language/1.htm">language</a> <div>printf函数 /* 2013年3月10日20:42:32 地点:北京潘家园 功能: 目的: 测试%x %X %#x %#X的用法 */ # include <stdio.h> int main(void) { printf("哈哈!\n"); // \n表示换行 int i = 10; printf</div> </li> <li><a href="/article/2763.htm" title="那你为什么小时候不好好读书?" target="_blank">那你为什么小时候不好好读书?</a> <span class="text-muted">dcj3sjt126com</span> <a class="tag" taget="_blank" href="/search/life/1.htm">life</a> <div>dady, 我今天捡到了十块钱, 不过我还给那个人了 good girl! 那个人有没有和你讲thank you啊 没有啦....他拉我的耳朵我才把钱还给他的, 他哪里会和我讲thank you   爸爸, 如果地上有一张5块一张10块你拿哪一张呢.... 当然是拿十块的咯... 爸爸你很笨的, 你不会两张都拿   爸爸为什么上个月那个人来跟你讨钱, 你告诉他没</div> </li> <li><a href="/article/2890.htm" title="iptables开放端口" target="_blank">iptables开放端口</a> <span class="text-muted">Fanyucai</span> <a class="tag" taget="_blank" href="/search/linux/1.htm">linux</a><a class="tag" taget="_blank" href="/search/iptables/1.htm">iptables</a><a class="tag" taget="_blank" href="/search/%E7%AB%AF%E5%8F%A3/1.htm">端口</a> <div>1,找到配置文件 vi /etc/sysconfig/iptables   2,添加端口开放,增加一行,开放18081端口 -A INPUT -m state --state NEW -m tcp -p tcp --dport 18081 -j ACCEPT   3,保存 ESC :wq!   4,重启服务 service iptables </div> </li> <li><a href="/article/3017.htm" title="Ehcache(05)——缓存的查询" target="_blank">Ehcache(05)——缓存的查询</a> <span class="text-muted">234390216</span> <a class="tag" taget="_blank" href="/search/%E6%8E%92%E5%BA%8F/1.htm">排序</a><a class="tag" taget="_blank" href="/search/ehcache/1.htm">ehcache</a><a class="tag" taget="_blank" href="/search/%E7%BB%9F%E8%AE%A1/1.htm">统计</a><a class="tag" taget="_blank" href="/search/query/1.htm">query</a> <div>缓存的查询 目录 1.    使Cache可查询 1.1     基于Xml配置 1.2     基于代码的配置 2     指定可搜索的属性 2.1     可查询属性类型 2.2 &</div> </li> <li><a href="/article/3144.htm" title="通过hashset找到数组中重复的元素" target="_blank">通过hashset找到数组中重复的元素</a> <span class="text-muted">jackyrong</span> <a class="tag" taget="_blank" href="/search/hashset/1.htm">hashset</a> <div>  如何在hashset中快速找到重复的元素呢?方法很多,下面是其中一个办法: int[] array = {1,1,2,3,4,5,6,7,8,8}; Set<Integer> set = new HashSet<Integer>(); for(int i = 0</div> </li> <li><a href="/article/3271.htm" title="使用ajax和window.history.pushState无刷新改变页面内容和地址栏URL" target="_blank">使用ajax和window.history.pushState无刷新改变页面内容和地址栏URL</a> <span class="text-muted">lanrikey</span> <a class="tag" taget="_blank" href="/search/history/1.htm">history</a> <div>后退时关闭当前页面 <script type="text/javascript"> jQuery(document).ready(function ($) {         if (window.history && window.history.pushState) {</div> </li> <li><a href="/article/3398.htm" title="应用程序的通信成本" target="_blank">应用程序的通信成本</a> <span class="text-muted">netkiller.github.com</span> <a class="tag" taget="_blank" href="/search/%E8%99%9A%E6%8B%9F%E6%9C%BA/1.htm">虚拟机</a><a class="tag" taget="_blank" href="/search/%E5%BA%94%E7%94%A8%E6%9C%8D%E5%8A%A1%E5%99%A8/1.htm">应用服务器</a><a class="tag" taget="_blank" href="/search/%E9%99%88%E6%99%AF%E5%B3%B0/1.htm">陈景峰</a><a class="tag" taget="_blank" href="/search/netkiller/1.htm">netkiller</a><a class="tag" taget="_blank" href="/search/neo/1.htm">neo</a> <div>应用程序的通信成本 什么是通信 一个程序中两个以上功能相互传递信号或数据叫做通信。 什么是成本 这是是指时间成本与空间成本。 时间就是传递数据所花费的时间。空间是指传递过程耗费容量大小。 都有哪些通信方式 全局变量 线程间通信 共享内存 共享文件 管道 Socket 硬件(串口,USB) 等等 全局变量 全局变量是成本最低通信方法,通过设置</div> </li> <li><a href="/article/3525.htm" title="一维数组与二维数组的声明与定义" target="_blank">一维数组与二维数组的声明与定义</a> <span class="text-muted">恋洁e生</span> <a class="tag" taget="_blank" href="/search/%E4%BA%8C%E7%BB%B4%E6%95%B0%E7%BB%84/1.htm">二维数组</a><a class="tag" taget="_blank" href="/search/%E4%B8%80%E7%BB%B4%E6%95%B0%E7%BB%84/1.htm">一维数组</a><a class="tag" taget="_blank" href="/search/%E5%AE%9A%E4%B9%89/1.htm">定义</a><a class="tag" taget="_blank" href="/search/%E5%A3%B0%E6%98%8E/1.htm">声明</a><a class="tag" taget="_blank" href="/search/%E5%88%9D%E5%A7%8B%E5%8C%96/1.htm">初始化</a> <div>/**  *  */ package test20111005; /**  * @author FlyingFire  * @date:2011-11-18 上午04:33:36  * @author :代码整理  * @introduce :一维数组与二维数组的初始化  *summary:  */ public c</div> </li> <li><a href="/article/3652.htm" title="Spring Mybatis独立事务配置" target="_blank">Spring Mybatis独立事务配置</a> <span class="text-muted">toknowme</span> <a class="tag" taget="_blank" href="/search/mybatis/1.htm">mybatis</a> <div>在项目中有很多地方会使用到独立事务,下面以获取主键为例   (1)修改配置文件spring-mybatis.xml  <!-- 开启事务支持 -->  <tx:annotation-driven transaction-manager="transactionManager" />   &n</div> </li> <li><a href="/article/3779.htm" title="更新Anadroid SDK Tooks之后,Eclipse提示No update were found" target="_blank">更新Anadroid SDK Tooks之后,Eclipse提示No update were found</a> <span class="text-muted">xp9802</span> <a class="tag" taget="_blank" href="/search/eclipse/1.htm">eclipse</a> <div>使用Android SDK Manager 更新了Anadroid SDK Tooks 之后, 打开eclipse提示 This Android SDK requires Android Developer Toolkit version 23.0.0 or above, 点击Check for Updates  检测一会后提示 No update were found  </div> </li> </ul> </div> </div> </div> <div> <div class="container"> <div class="indexes"> <strong>按字母分类:</strong> <a href="/tags/A/1.htm" target="_blank">A</a><a href="/tags/B/1.htm" target="_blank">B</a><a href="/tags/C/1.htm" target="_blank">C</a><a href="/tags/D/1.htm" target="_blank">D</a><a href="/tags/E/1.htm" target="_blank">E</a><a href="/tags/F/1.htm" target="_blank">F</a><a href="/tags/G/1.htm" target="_blank">G</a><a href="/tags/H/1.htm" target="_blank">H</a><a href="/tags/I/1.htm" target="_blank">I</a><a href="/tags/J/1.htm" target="_blank">J</a><a href="/tags/K/1.htm" target="_blank">K</a><a href="/tags/L/1.htm" target="_blank">L</a><a href="/tags/M/1.htm" target="_blank">M</a><a href="/tags/N/1.htm" target="_blank">N</a><a href="/tags/O/1.htm" target="_blank">O</a><a href="/tags/P/1.htm" target="_blank">P</a><a href="/tags/Q/1.htm" target="_blank">Q</a><a href="/tags/R/1.htm" target="_blank">R</a><a href="/tags/S/1.htm" target="_blank">S</a><a href="/tags/T/1.htm" target="_blank">T</a><a href="/tags/U/1.htm" target="_blank">U</a><a href="/tags/V/1.htm" target="_blank">V</a><a href="/tags/W/1.htm" target="_blank">W</a><a href="/tags/X/1.htm" target="_blank">X</a><a href="/tags/Y/1.htm" target="_blank">Y</a><a href="/tags/Z/1.htm" target="_blank">Z</a><a href="/tags/0/1.htm" target="_blank">其他</a> </div> </div> </div> <footer id="footer" class="mb30 mt30"> <div class="container"> <div class="footBglm"> <a target="_blank" href="/">首页</a> - <a target="_blank" href="/custom/about.htm">关于我们</a> - <a target="_blank" href="/search/Java/1.htm">站内搜索</a> - <a target="_blank" href="/sitemap.txt">Sitemap</a> - <a target="_blank" href="/custom/delete.htm">侵权投诉</a> </div> <div class="copyright">版权所有 IT知识库 CopyRight © 2000-2050 E-COM-NET.COM , All Rights Reserved. <!-- <a href="https://beian.miit.gov.cn/" rel="nofollow" target="_blank">京ICP备09083238号</a><br>--> </div> </div> </footer> <!-- 代码高亮 --> <script type="text/javascript" src="/static/syntaxhighlighter/scripts/shCore.js"></script> <script type="text/javascript" src="/static/syntaxhighlighter/scripts/shLegacy.js"></script> <script type="text/javascript" src="/static/syntaxhighlighter/scripts/shAutoloader.js"></script> <link type="text/css" rel="stylesheet" href="/static/syntaxhighlighter/styles/shCoreDefault.css"/> <script type="text/javascript" src="/static/syntaxhighlighter/src/my_start_1.js"></script> </body> </html>