不怕猫的耗子A

python爬虫：BeautifulSoup_搜索文档树

搜索文档树

1、Beautiful Soup定义了很多搜索方法,这里着重介绍2个: find() 和 find_all()

2、使用find_all()类似的方法可以查找到想要查找的文档内容

过滤器

1、介绍find_all()方法前,先介绍一下过滤器的类型,这些过滤器贯穿整个搜索的API。过滤器可以被用在tag的name中,节点的属性中,字符串中或他们的混合中

2、过滤器只能作为搜索文档的参数,或者说应该叫参数类型更为贴切(即需要查找什么，就将其作为find_all()类似方法的参数)

字符串

最简单的过滤器是字符串(标签对名)。在搜索方法中传入一个字符串参数,BeautifulSoup会查找与字符串完整匹配的内容

例1：查找文档中所有的标签

from bs4 import BeautifulSoup #导入bs4库 html = """ The Dormouse's story The Dormouse's story Once upon a time there were three little sisters; and their names were , Lacie and Tillie; and they lived at the bottom of a well. ... """ soup = BeautifulSoup(html,"lxml")#指定解析器 tag_p = soup.find_all("p") print(tag_p) tag_b = soup.find_all("b")#b标签对是内嵌在第一个p标签对中的 print(tag_b) tag_a = soup.find_all("a")#a标签对是内嵌在第二个p标签对中的 print(tag_a) """ [The Dormouse's story, Once upon a time there were three little sisters; and their names were , Lacie and Tillie; and they lived at the bottom of a well. , ...] [The Dormouse's story] [, Lacie, Tillie] """

注：由上面的例子可以看出
1、输入结果为所有符合要求的标签对组成的列表(元素的类型为tag对象)，每一对符合要求的标签对为列表中的一个元素

2、不论标签对中有什么，只要符合查找要求都会将其整个输出：a标签对中内嵌了b标签对，在查找a标签对时，也会把a中内嵌的b标签对一起输出(当然内嵌的b标签对可能是整个b标签对中的一部分)

3、a标签对中内嵌了b标签对，在查找b标签对时：只会输入符合要求的b标签对，不会输入用于内嵌b的a标签对

4、如果传入字节码参数,Beautiful Soup会当作UTF-8编码,可以传入一段Unicode 编码来避免Beautiful Soup解析编码出错

5、我们遍历列表后就可以得到一个一个的类型为tag对象的标签对，因此我们也可以对其使用tag对象的方法
例1_1:

for i in tag_a: print(i,type(i)) print(soup.a.get("href"))    """ http://example.com/elsie Lacie http://example.com/elsie Tillie http://example.com/elsie """

正则表达式

如果传入正则表达式作为参数。Beautiful Soup会通过正则表达式的match()来匹配内容
例2：找出所有以b开头的标签

from bs4 import BeautifulSoup #导入bs4库 import re html = """ The Dormouse's story The Dormouse's story Once upon a time there were three little sisters; and their names were , Lacie and Tillie; and they lived at the bottom of a well. ... """ soup = BeautifulSoup(html,"lxml")#指定解析器 tag_b = soup.find_all(re.compile("^b"))#返回的也是一个列表 for i in tag_b: print(i,type(i)) print(i.name) """ The Dormouse's story Once upon a time there were three little sisters; and their names were , Lacie and Tillie; and they lived at the bottom of a well. ... body The Dormouse's story b """

注：由上面的例子可以看出
1、find_all()的搜索条件(过滤器)为正则表达式(以b开头的标签对)，则在整个HTML文件中符合条件的有body标签对和b标签对，因此分别输出了两个标签对的内容

2、返回的类型为tag对象，因此我们可以使用tag对象的方法

列表

如果传入列表参数。Beautiful Soup会将与列表中任一元素匹配的内容返回
例3：找到文档中所有标签和标签
from bs4 import BeautifulSoup #导入bs4库 html = """ The Dormouse's story The Dormouse's storyOnce upon a time there were three little sisters; and their names were , Lacie and Tillie; and they lived at the bottom of a well. ... """ soup = BeautifulSoup(html,"lxml")#指定解析器 tag_a_b = soup.find_all(["a","b"])#返回的也是一个列表 print(tag_a_b,type(tag_a_b)) """ [The Dormouse's story, , Lacie, Tillie] """

注：由上面的例子可以看出
1、需要查找多个标签对时，可以将需要查找的内容组成一个列表传到find_all()方法中作为过滤器

2、返回的结果是所有符合条件的标签对组成的列表，且其原始的类型也为tag对象

True

True可以匹配任何值。下面代码查找到所有的tag,但是不会返回字符串节点
例4：

from bs4 import BeautifulSoup html = """ The Dormouse's story The Dormouse's story Once upon a time there were three little sisters; and their names were , Lacie and Tillie; and they lived at the bottom of a well. ... """ soup = BeautifulSoup(html,"lxml")#指定解析器 tag = soup.find_all(True) print(tag) #感觉这种方法用得不是很多，所以只是了解了下，知道有这种方法就好了

方法

1、如果没有合适过滤器,那么还可以定义一个方法,方法只接受一个元素参数,如果这个方法返回True表示当前元素匹配并且被找到,如果不是则反回False

2、元素参数：HTML文档中的一个tag节点,不能是文本节点

例5：包含class属性却不包含id属性,那么将返回True

from bs4 import BeautifulSoup html = """ The Dormouse's story The Dormouse's story Once upon a time there were three little sisters; and their names were , Lacie and Tillie; and they lived at the bottom of a well. ... """ def has_class_but_no_id(tag): return tag.has_attr('class') and not tag.has_attr('id') soup = BeautifulSoup(html,"lxml") tag = soup.find_all(has_class_but_no_id)#这个方法作为参数传入find_all()方法 print(tag) """ [The Dormouse's story, Once upon a time there were three little sisters; and their names were , Lacie and Tillie;and they lived at the bottom of a well., ...] """

注：
上面例子中的搜索条件为有class属性但不包含id属性，因此整个HTML中p标签对符合该条件(a标签对虽然不符合，但是其是内嵌在P标签对中的，因此在输入P时会有a)

find_all( )方法

语法：

find_all(name , attrs , recursive , text , **kwargs )

描述：

1、find_all()方法搜索当前tag的所有tag子节点,并判断是否符合过滤器的条件

2、这里的使用方法感觉跟前面说的过滤器差不多，只是这里用的是标签对内中的属性，而过滤器用得是标签对的名字

name 参数

1、name 参数可以查找所有名字为name的tag,字符串对象会被自动忽略掉

2、搜索name参数的值可以使任一类型的过滤器 ,字符串,正则表达式,列表,方法或是True
例6：

from bs4 import BeautifulSoup html = """ The Dormouse's story The Dormouse's story Once upon a time there were three little sisters; and their names were , Lacie and Tillie; and they lived at the bottom of a well. ... """ soup = BeautifulSoup(html,"lxml")#指定解析器 tag_title = soup.find_all("title") print(tag_title) tag_a = soup.find_all("a") print(tag_a) """ [The Dormouse's story] [, Lacie, Tillie] """

注：
从上面的结果可以看出，其实这种方法跟前面说的过滤器是一样的，即name参数的值可以使任一类型的过滤器

keyword 参数

如果一个指定名字的参数不是搜索内置的参数名,搜索时会把该参数当作指定名字tag的属性来搜索
例：如果包含一个名字为id的参数,Beautiful Soup会搜索每个tag的”id”属性
例7：

from bs4 import BeautifulSoup import re html = """ The Dormouse's story The Dormouse's story Once upon a time there were three little sisters; and their names were , Lacie and Tillie; and they lived at the bottom of a well. ... """ soup = BeautifulSoup(html,"lxml")#指定解析器 tag_link = soup.find_all(id ="link2")#传入id参数 print(tag_link) tag_href = soup.find_all(href=re.compile("example"))#传入href参数 print(tag_href) tag_True = soup.find_all(id=True)#传入Trur参数 print(tag_True) tag_all = soup.find_all(href=re.compile("example"), id='link1')#多个指定名字的参数 print(tag_all) tag_class = soup.find_all(class_="sister")#传入class参数 print(tag_class) """ [Lacie] [, Lacie, Tillie] [, Lacie, Tillie] [] [, Lacie, Tillie] """

注：
上面介绍了几种keyword 参数的搜索方式:搜索指定名字的属性时可以使用的参数值包括字符串 , 正则表达式 , 列表, True，各种参数间可以相互组合
   1、使用id关键字：包含一个名字为 id 的参数,Beautiful Soup会搜索每个tag的”id”属性
2、使用href关键字：如果传入href参数,Beautiful Soup会搜索每个tag的”href”属性
   3、使用True关键字：在文档树中查找所有包含 id 属性的tag,无论id的值是什么
   4、多个关键字组合：使用多个指定名字的参数可以同时过滤tag的多个属性
   5、使用class关键字：class是python的关键词，所以在使用其作为关键字时需要加个下划线
   6、多种过滤类型组合在一起可以进一步加强搜索(匹配)结果的准确性

按CSS搜索

1、按照CSS类名搜索tag的功能非常实用,但标识CSS类名的关键字class在Python中是保留字,使用class做参数会导致语法错误。从Beautiful Soup的4.1.1版本开始。可以通过 class_ 参数搜索有指定CSS类名的tag(在上面例子中也有讲解)

例8：

from bs4 import BeautifulSoup html = """ The Dormouse's story The Dormouse's story Once upon a time there were three little sisters; and their names were , Lacie and Tillie; and they lived at the bottom of a well. ... """ soup = BeautifulSoup(html,"lxml")#指定解析器 tag_class_1 = soup.find_all(class_="sister",id="link3")#class参数与id参数组合使用 print(tag_class_1) """ [Tillie] """

2、class_ 参数同样接受不同类型的过滤器 ,字符串,正则表达式,方法或 True
例8_1:

from bs4 import BeautifulSoup import re html = """ The Dormouse's story The Dormouse's story Once upon a time there were three little sisters; and their names were , Lacie and Tillie; and they lived at the bottom of a well. ... """ soup = BeautifulSoup(html,"lxml")#指定解析器 tag_class_1 = soup.find_all(class_=re.compile("itl")) print(tag_class_1) #[The Dormouse's story ]

text 参数

1、通过 text 参数可以搜文档中的字符串内容与 name 参数的可选值一样, text 参数接受字符串 , 正则表达式 , 列表, True

例9：

from bs4 import BeautifulSoup import re html = """ The Dormouse's story The Dormouse's story Once upon a time there were three little sisters; and their names were , Lacie and Tillie; and they lived at the bottom of a well. ... """ soup = BeautifulSoup(html,"lxml")#指定解析器 more = soup.find_all(text=["Tillie", "Elsie", "Lacie"]) print(more) all = soup.find_all(text=re.compile("story")) print(all) """ ['Lacie', 'Tillie'] ["The Dormouse's story", "The Dormouse's story"] """

2、虽然 text 参数用于搜索字符串,还可以与其它参数混合使用来过滤tag.Beautiful Soup会找到 .string 方法与 text 参数值相符的tag
例9_1：

from bs4 import BeautifulSoup import re html = """ The Dormouse's story The Dormouse's story Once upon a time there were three little sisters; and their names were , Lacie and Tillie; and they lived at the bottom of a well. ... """ soup = BeautifulSoup(html,"lxml")#指定解析器 tag_a = soup.find_all("a",text= "Tillie") print(tag_a) #[Tillie]

limit 参数

find_all() 方法返回全部的搜索结构，如果文档树很大那么搜索会很慢。如果我们不需要全部结果，可以使用 limit 参数限制返回结果的数量。效果与SQL中的limit关键字类似,当搜索到的结果数量达到 limit 的限制时,就停止搜索返回结果。

例10：文档树中有3个tag符合搜索条件,但结果只返回了2个,因为我们限制了返回数量

soup.find_all("a", limit=2) """ [Elsie, Lacie] """

find( )方法

语法：

find( name , attrs , recursive , text , **kwargs )

描述
1、find_all()方法将返回文档中符合条件的所有tag,尽管有时候我们只想得到一个结果。比如文档中只有一个标签，那么使用find_all()方法来查找标签就不太合适, 使用find_all()方法并设置 limit=1 参数不如直接使用find()方法。
例11：下面两行代码是等价的

import re from bs4 import BeautifulSoup html = """ The Dormouse's story The Dormouse's story Once upon a time there were three little sisters; and their names were , Lacie and Tillie; and they lived at the bottom of a well. ... """ soup = BeautifulSoup(html,"lxml")#指定解析器 print(soup.find_all('title', limit=1))#返回一个列表 print(soup.find('title'))#返回一个tag """ [The Dormouse's story] The Dormouse's story """

注：
1、上面两段代码：唯一的区别是find_all()方法的返回结果是值包含一个元素的列表(未设置limit参数时则是全部满足要求的标签对)，而find()方法直接返回结果

2、find_all() 方法没有找到目标是返回空列表, find()方法找不到目标时,返回 None

3、由输出结果可以看出find_all()方法返回的是一个列表，需要遍历后才是一个tag对象，而find()方法直接返回的就是一个tag对象

例：

from bs4 import BeautifulSoup # 导入bs4库 html = """ The Dormouse's story The Dormouse's story Once upon a time there were three little sisters; and their names were , Lacie and Tillie; and they lived at the bottom of a well. ... """ soup = BeautifulSoup(html, "lxml") # 指定解析器，创建beautifulsoup对象 p_string = soup.p.string print(r"直接查找标签对中的string：",p_string) p = soup.find_all("p") print(r"标签对：",p) for i in p: print(r"先查找标签对，再在标签对中找string：",i.string) print(r"先查找标签对，再在标签对中找某个属性的值：",i["class"]) print(i.get("class")) """直接查找标签对中的string： The Dormouse's story 标签对： [The Dormouse's story , Once upon a time there were three little sisters; and their names were , Lacie and Tillie; and they lived at the bottom of a well. , ...] 先查找标签对，再在标签对中找string： The Dormouse's story 先查找标签对，再在标签对中找某个属性的值： ['title'] ['title'] 先查找标签对，再在标签对中找string： None 先查找标签对，再在标签对中找某个属性的值： ['story'] ['story'] 先查找标签对，再在标签对中找string： ... 先查找标签对，再在标签对中找某个属性的值： ['story'] ['story'] """

注：

1、find_all()方法返回的是：一个所有符合查找条件的tag对象组成的列表，需要遍历后才是具体的某个tag对象

2、find()方法返回的是：第一个符合查找条件的tag对象，直接返回的就是一个tag对象

3、查找标签对中字符串的方法：

⑴直接使用"soup对象.标签对.string"的方法：这样查找出来的是第一个符合查找条件的标签对的字符串

⑵先找出所有符合查找条件的tag对象，在使用"tag对象.string"的方法：这样查找出来的就是全部符合条件的标签对的字符串

4、简析XML文档时，必须制定简析器为"xml"，不能是"lxml"，不然会报错

5、对于HTML文档和XML文档来说里面主要的就是：

⑴标签对：标签对里面的属性和属性值(key:value)。可通过找到的tag对象，再在tag对象中使用字典的方法，找出具体某个属性的值

⑵字符串：就是标签对之间的字符串，查找方法如3中所述

CSS选择器

1、Beautiful Soup支持大部分的CSS选择器，在Tag或BeautifulSoup对象的。select()方法中传入字符串参数，即可使用CSS选择器的语法找到tag

2、CSS选择器是一种单独的文档搜索语法, 参考 http://www.w3school.com.cn/css/css_selector_type.asp

3、CSS选择器的方法很多，这里重点介绍一种很常见的方法，其他方法请参考

https://www.crummy.com/software/BeautifulSoup/bs4/doc/index.zh.html#id87

步骤1：在原网页通过F12打开开发者模式，选中我们需要的东西，【右键】->copy->Copy Selector：复制我们需要的标签对的路径

步骤2：将路径粘贴在任意文本中(我们可以多复制几条，进行对比)，代码如下：

   ⑴#mainBox > main > div.article-list > div:nth-child(4) > h4 > a    ⑵#mainBox > main > div.article-list > div:nth-child(5) > h4 > a

步骤3：由步骤2中的路径我们可以发现：不同的部分为"nth-child(num)",因此需要将冒号后(包括冒号)的部分删掉，就得到的通用的路径

#mainBox > main > div.article-list > div > h4 > a

例12：

import requests from bs4 import BeautifulSoup url = 'https://blog.csdn.net/qq_39********' header = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.102 UBrowser/6.1.2107.204 Safari/537.36'} html = requests.get(url,headers = header) #使用自带的html.parser解析，速度慢但通用 soup = BeautifulSoup(html.text,'html.parser') tag = soup.select("#mainBox > main > div.article-list > div > h4 > a") print(tag)

拓展

测试HTML

                 1 2 3 4 … 228 下一页»

例13:

import requests from bs4 import BeautifulSoup url = 'http://www.mzitu.com' header = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.102 UBrowser/6.1.2107.204 Safari/537.36'} html = requests.get(url,headers = header) #使用自带的html.parser解析，速度慢但通用 soup = BeautifulSoup(html.text,'html.parser') #方法1 """ #实际上是第一个class = 'postlist'的div里的所有a 标签是我们要找的信息 all_a = soup.find('div',class_='postlist').find_all('a',target='_blank') for a in all_a: print(a["href"]) """ #方法2 all_a = soup.find_all('a',target="_blank") for a in all_a: print(a["href"])

注：在上面例子中我们使用了两种方法去找符合('a',target="_blank")的标签对，可以发现两种方法的输出结果不一致

1、一个HTML页面中可能会有一些标签对包含我们不需要的信息：符合我们的查找条件，但是实际是我们不需要的

2、通过观察HTML页面可以发现，我们需要的信息都是在一个叫
的标签对下面，因此我们可以先通过find()方法去返回这个tag对象，然后再在这个标签对对象中去使用find_all()方法去查找我们需要的标签对，其他在这个标签对(

注：

1、通过自己的学习，感觉经常用到的还是fing_all(标签对名参数，关键字参数)，当然这种查找当然使用fing_all(标签对名参数)。加上关键字参数可以提高准确性

2、本文是参照BeautifulSoup官方文档写的。只是自己在学习过程中的记录，方便以后查找的，文中肯定有错误的和遗漏的，如果有幸被您看到，请不要介意。可以直接去看官方文档

https://www.crummy.com/software/BeautifulSoup/bs4/doc/index.zh.html#id87

你可能感兴趣的:(python：爬虫)

使用python对pdf批量添加水印，并且水印字体，大小，位置，旋转角度都是可以调节不懂python不懂R python python pdf
1.使用python对pdf批量添加水印，并且水印字体，大小，位置，旋转角度都是可以调节的importosfromPyPDF2importPdfReader,PdfWriterfromreportlab.pdfgenimportcanvasfromreportlab.lib.pagesizesimportletterfromreportlab.lib.colorsimportColordefcre

Python批量为PDF添加水印：让你的文件瞬间高大上！码无止尽 Python办公自动化 python pdf
嗨，各位可爱的小伙伴们！小编在此奉上今天的超级干货：如何用Python给一大堆PDF文件添加水印。请放心，这不是在交朋友圈秀操作，而是有实际需求的哦！有时候我们需要在PDF文件上添加水印，比如“草稿”、“保密”、“审阅”等标识，来提醒自己或他人。今天就让我来教你如何用Python轻松搞定这件事！首先，让我给你看一下大致的实现思路，然后再附上实际代码。实现思路1、首先，我们需要一个PDF处理的Pyt

构建自动化网页内容监控系统：使用Python 爱你不会累
本文还有配套的精品资源，点击获取简介：网页监控更新工具是一个由Python开发的软件，用于检测和记录网页内容的变化。该工具利用Python在Web抓取和数据分析方面的优势，包括利用requests,BeautifulSoup,lxml,和diff-match-patch等库来获取网页内容、解析HTML文档及计算文本差异。工具支持在Windows7及Python2.7.3环境下运行，并允许用户设定监

python监控网页更新_【小白教程】Python3监控网页 weixin_39553904 python监控网页更新
之前用RSS来监控网页更新内容，可惜刷新时间太长了，三个小时。。只能看看新闻啥的，又没有小钱钱充会员（摊手听说Python可以做这个功能，抱着试试看的态度，本以为会很麻烦，没想到这么简单哈哈~我从来没有用过Python都做出来了，相信你也没问题！（我真是纯小白，路过的大佬请指教（⊙ｏ⊙）ノ）所用模块#监控模块fromurllibimportrequestfrombs4importBeautiful

python鸢尾花数据集knn_【python+机器学习1】python 实现 KNN weixin_39629269 python鸢尾花数据集knn
欢迎关注哈希大数据微信公众号【哈希大数据】1KNN算法基本介绍K-NearestNeighbor(k最邻近分类算法)，简称KNN，是最简单的一种有监督的机器学习算法。也是一种懒惰学习算法，即开始训练仅仅是保存所有样本集的信息，直到测试样本到达才开始进行分类决策。KNN算法的核心思想：要想确定测试样本属于哪一类，就先寻找所有训练样本中与该测试样本“距离”最近的前K个样本，然后判断这K个样本中大部分所

实时监控网页变化，并增加多种提示信息安替-AnTi 自动化工具 linux 运维服务器监控网页变化
文章目录python代码实现优势手动部署下载源码安装依赖初次登录设置Docker部署设置监控chromeJS插件实现插件1背景介绍使用方法插件2参考文献通过订阅本篇文章，您可以实现在任意打开网页情况下，监控网页内指定内容或者全部内容的变化，变化的内容、时间点可以通过邮箱、微信等方式进行提醒。使用场景可以用来监控足球比赛的赔率、京东商品库存、价格等因素，并且可以为订阅用户添加各种定制化的服务。如在订

用python监控网页某个位置的值的变化老光私享 python 开发语言爬虫
可以使用Python的第三方库来监控网页上某个位置的值的变化。一种方法是使用BeautifulSoup库来爬取网页并解析HTML/XML。然后，您可以使用正则表达式或其他方法来提取所需信息。另一种方法是使用Selenium库来模拟浏览器行为，并使用JavaScript来获取网页上的信息。下面是一个使用BeautifulSoup的例子：importrequestsfrombs4importBeaut

python向pdf添加水印 ChenWenKen Python应用 python 前端
fromtypingimportUnion,Tuplefromreportlab.libimportunitsfromreportlab.pdfgenimportcanvasfromreportlab.pdfbaseimportpdfmetricsfromreportlab.pdfbase.ttfontsimportTTFontpdfmetrics.registerFont(TTFont('msy

python笔记（3）(re库和pandas库) Techer_Y 笔记
参考链接：Python正则表达式|菜鸟教程(runoob.com)1、re库，python正则表达式正则表达式是一个特殊的字符序列它能帮助你检查一个字符串是否与某种模式匹配。re模块使python语言拥有全部的正则表达式功能。re.match尝试从字符串起始位置匹配一个模式，如果不是起始位置匹配成功的话，match()就返回none。re.match(pattern,string,flags=0)

Python PDF添加水印 lxccc9 python 笔记
PDF添加水印加载模块：fromPyPDF2importPdfFileReader,PdfFileWriterimportosPDF添加水印：watermark_pdf=PdfFileReader('./tests/watermark.pdf')#读取第一页watermark=watermark_pdf.getPage(0)#读取需要加水印的pdf文件input_pdf=PdfFileReader

用Python写前端 eternity_ld 前端 python 开发语言
分享一个让开发交互式Webapp超级简单的工具。不会HTML，CSS，JAVASCRIPT也没事。交互式Webapp非常实用，比如说做一个问卷调查页面、一个投票系统、一个信息收集表单，上传文件等等，因为网页是可视化的，因此还可以作为一个没有服务端的图片界面应用程序而使用。如果你有这样的开发需求，那用Python真的是太简单了。借助于PyWebIO（pipinstallpywebio），你可以分分钟

使用python做出一只懒羊羊大G哥 python 开发语言
今天使用Python的Turtle库做出一只懒羊羊PythonTurtle库功能与用途一、绘图基础功能Turtle库提供了一种简单易用的方式来进行图形绘制。通过控制屏幕上的海龟指针移动来完成线条和形状的创建。可以设置画笔的颜色、大小以及方向等属性，从而实现多样化的视觉效果。importturtlet=turtle.Turtle()t.forward(100)#向前走100像素距离t.right(9

【全栈】SprintBoot+vue3迷你商城-扩展：vue3项目创建及目录介绍杰九 vue.js javascript 前端 spring boot
【全栈】SprintBoot+vue3迷你商城-扩展：vue3项目创建及目录介绍往期的文章都在这里啦，大家有兴趣可以看一下【全栈】SprintBoot+vue3迷你商城（1）【全栈】SprintBoot+vue3迷你商城（2）【全栈】SprintBoot+vue3迷你商城-扩展：利用python爬虫爬取商品数据【全栈】SprintBoot+vue3迷你商城（3）【全栈】SprintBoot+vue

【算法】动态规划：从斐波那契数列到背包问题杰九优质文章算法动态规划
【算法】动态规划：从斐波那契数列到背包问题文章目录【算法】动态规划：从斐波那契数列到背包问题1.斐波那契数列2.爬楼梯3.零钱转换Python代码4.零钱兑换II5.组合数dp和排列数dp6.为什么动态规划的核心思想计算组合数的正确方法代码实现为什么先遍历硬币再遍历金额可以计算组合数详细解释举例说明最终结果具体组合情况为什么有效7.背包问题01背包问题定义完全背包问题定义示例为什么需要倒序遍历8.

通过Python为PDF添加图片水印 nini！ pdf python vscode 安全
前言之前介绍了如何通过Python向PDF添加文本水印。事实上，添加图片水印也同样实用。例如将公司或产品logo添加到文档中，从而提升品牌效应或防止他人随意盗用。或者将图片插入到文档中以注明文档用处或状态。与文本水印类似，添加图片水印时，也可以设置添加单个图片水印或者多个重复水印。下面是以Python平台为例，为PDF添加图片水印的方法介绍。所需工具VisualStudioCodeSpire.PD

282道Python面试八股文（答案、分析和深入提问）整理 ocean2103 面试题 python 面试开发语言
1.请解释Python中的模块和包。回答在Python中，模块和包是组织代码的重要工具，它们有助于代码的重用和结构化。模块(Module)模块是一个包含Python代码的文件，通常以.py作为文件扩展名。模块可以定义函数、类和变量，也可以包含可执行的代码。通过模块，可以将相关的功能分组到一个文件中，从而使得代码更加结构化和可维护。创建和使用模块创建模块：你可以创建一个Python文件（例如mymo

【Pip】深入理解 `requirements.txt` 文件：Python 项目依赖管理的核心工具丶2136 #pip pip python
目录引言1.什么是`requirements.txt`？2.创建`requirements.txt`文件2.1手动创建2.2使用`pipfreeze`命令2.3使用`pipreqs`生成2.4使用`pipenv`或`poetry`3.安装依赖4.版本管理与更新4.1版本管理的最佳实践5.依赖关系的管理5.1使用`pip-tools`5.2使用虚拟环境5.3使用Docker5.4`requireme

数字孪生技术：虚拟与现实的完美融合 Echo_Wish Python进阶 python 人工智能深度学习虚拟现实
在现代技术飞速发展的时代，数字孪生技术（DigitalTwin）逐渐成为工业、医疗、城市规划等领域的重要工具。通过数字孪生技术，我们可以创建一个与现实世界对象高度一致的虚拟模型，从而实现对现实对象的监测、分析和优化。本文将深入探讨数字孪生技术的原理、应用场景，并结合Python代码示例，展示如何实现一个简单的数字孪生应用。一、数字孪生技术的基本概念数字孪生技术是指利用传感器、物联网（IoT）、大数

python 查询sqlserver 视图_SQL Server 2017 数据库教与学（教学大纲，含Python+SQL Server案例）... weixin_39724748 python 查询sqlserver 视图
原标题：SQLServer2017数据库教与学(教学大纲，含Python+SQLServer案例)本书提供Python+SQLServer案例SQLServer教学大纲一、课程的性质和教学目的课程性质：数据库技术是各类信息系统、管理系统的基础。SQLServer数据库是微软公司的一款数据库产品，它被广泛应用到各大软件公司。本课程适合在计算机专业、非计算机专业但需要数据库辅助科研的理工科专业。教学目

python连sql server学生管理系统_SQL Server 2017 数据库教与学（教学大纲，含Python+SQL Server案例）... weixin_39529302 python连sql server学生管理系统
原标题：SQLServer2017数据库教与学(教学大纲，含Python+SQLServer案例)本书提供Python+SQLServer案例SQLServer教学大纲一、课程的性质和教学目的课程性质：数据库技术是各类信息系统、管理系统的基础。SQLServer数据库是微软公司的一款数据库产品，它被广泛应用到各大软件公司。本课程适合在计算机专业、非计算机专业但需要数据库辅助科研的理工科专业。教学目

python查询sqlserver视图_SQL Server 2017 数据库教与学（教学大纲，含Python+SQL Server案例）... weixin_39614874
原标题：SQLServer2017数据库教与学(教学大纲，含Python+SQLServer案例)本书提供Python+SQLServer案例SQLServer教学大纲一、课程的性质和教学目的课程性质：数据库技术是各类信息系统、管理系统的基础。SQLServer数据库是微软公司的一款数据库产品，它被广泛应用到各大软件公司。本课程适合在计算机专业、非计算机专业但需要数据库辅助科研的理工科专业。教学目

Python进阶与拾遗8：Python中的异常处理 jiongnima 进阶拾遗 Python python 面向对象编程大数据计算机视觉人工智能
Python进阶与拾遗8：Python中的异常处理异常相关概念异常的定义异常的角色常用的异常处理方法try/except/else/finally语句raise语句assert语句with/as环境管理器相关概念环境管理协议异常对象写在最后作为一门面向对象编程的语言，异常处理是Python中常用的技术。本篇博文主要讲解Python中的异常处理，下面开始干货。异常相关概念异常的定义异常，是可以改变程

使用Python将PDF文件转换为MOBI格式 choiiie 菜狗的怪问题合集 pdf python 经验分享
使用Python将PDF文件转换为MOBI格式引言在这篇文章中，我们将学习如何使用Python创建一个图形用户界面（GUI）应用程序，将PDF文件转换为MOBI格式。我们将使用tkinter作为GUI库，PyMuPDF或PyPDF2来处理PDF文件，以及Calibre的ebook-convert命令行工具来完成文件格式的转换。GitHub项目地址这个项目已经托管在GitHub上准备工作在开始之前，

JsonPath用法详解吴少凡 python 开发语言自动化 pycharm
JSONPath是一种信息抽取类库，是从JSON文档中抽取指定信息的工具，提供多种语言实现版本，包括Javascript、Python、PHP和Java。1、JSONPath安装:pipinstalljsonpath#如果安装太慢可以使用清华源来加速安装pipinstalljsonpath-ihttps://pypi.tuna.tsinghua.edu.cn/simple2、JSONPath语法J

python批量转化pdf图片为jpg图片不懂python不懂R python python pdf
1.把pdf图片批量转为jpg；需要注意的是，需要先安装poppler这个软件，具体安装教程放在下面代码中了2.代码#poppler安装教程参考：https://blog.csdn.net/wy01415/article/details/110257130#windows上poppler下载链接：https://github.com/oschwartz10612/poppler-windowsfr

python程序中调用openai接口 MEMORYLORRY gpt openai gpt 人工智能机器学习 python transformer
调用openai接口1.openai例子（国内访问）2.解决思路3.搭建nginx3.1创建OpenSSL创建证书3.2nginx配置3.3验证效果4.python调用5.SSL:certificate_verify_failed错误1.openai例子（国内访问）fromopenaiimportOpenAIAPI_KEY='sk-api-key'client=OpenAI(api_key=API

python config使用 Soochow_NJU_Smile python config
config.cfg[test]filename=C:\\Users\\86188\\Desktop\\study\\configstudy\\fire.png[detect]number=1main.pyimportcv2importconfigparsercfg=configparser.ConfigParser()cfg.read('config.cfg')source=cfg.get('t

2024年最全办公室文员必备python神器，将PDF文件表格转换成excel表格！(1)，把面试官逗笑了 TOP级别安卓开发程序员 python pdf excel
如果你也是看准了Python，想自学Python，在这里为大家准备了丰厚的免费学习大礼包，带大家一起学习，给大家剖析Python兼职、就业行情前景的这些事儿。一、Python所有方向的学习路线Python所有方向路线就是把Python常用的技术点做整理，形成各个领域的知识点汇总，它的用处就在于，你可以按照上面的知识点去找对应的学习资源，保证自己学得较为全面。二、学习软件工欲善其必先利其器。学习Py

第 9 课 Python 异常处理嵌入式老牛 Python入门 python 开发语言
1.异常与错误程序错误是指语法错误（指令输入不正确）和逻辑错误（程序执行结果不正确），而程序异常是一个意外事件，该事件会在程序执行过程中发生，影响了程序的正常执行，比如：打开的文件不存在、被除数为0、操作的数据类型不对、存储错误，互联网请求错误等等。一般情况下，在Python无法正常处理程序时就会发生一个异常。异常是Python对象，表示一个错误。当Python脚本发生异常时我们需要捕获处理它，否

华为OD机试E卷 -boss的收入（Java & Python& JS & C++ & C ）算法大师最新华为OD机试华为od java python javascript c++c语言华为od机考e卷
最新华为OD机试真题目录：点击查看目录华为OD面试真题精选：点击立即查看题目描述一个XX产品行销总公司，只有一个boss，其有若干一级分销，一级分销又有若干二级分销，每个分销只有唯一的上级分销。规定，每个月，下级分销需要将自己的总收入（自己的+下级上交的）每满100元上交15元给自己的上级。现给出一组分销的关系，和每个分销的收入，请找出boss并计算出这个boss的收入。比如：收入100元，上交1

Java序列化进阶篇 g21121 java序列化
        1.transient         类一旦实现了Serializable 接口即被声明为可序列化，然而某些情况下并不是所有的属性都需要序列化，想要人为的去阻止这些属性被序列化，就需要用到transient 关键字。

escape()、encodeURI()、encodeURIComponent()区别详解 aigo JavaScript Web
原文：http://blog.sina.com.cn/s/blog_4586764e0101khi0.html JavaScript中有三个可以对字符串编码的函数，分别是： escape,encodeURI,encodeURIComponent，相应3个解码函数：,decodeURI,decodeURIComponent 。下面简单介绍一下它们的区别 1 escape()函

ArcgisEngine实现对地图的放大、缩小和平移 Cb123456 添加矢量数据对地图的放大、缩小和平移 Engine
ArcgisEngine实现对地图的放大、缩小和平移: 个人觉得是平移，不过网上的都是漫游，通俗的说就是把一个地图对象从一边拉到另一边而已。就看人说话吧. 具体实现: 一、引入命名空间 using ESRI.ArcGIS.Geometry; using ESRI.ArcGIS.Controls; 二、代码实现.

Java集合框架概述天子之骄 Java集合框架概述
集合框架集合框架可以理解为一个容器，该容器主要指映射(map)、集合(set)、数组(array)和列表(list)等抽象数据结构。从本质上来说，Java集合框架的主要组成是用来操作对象的接口。不同接口描述不同的数据类型。简单介绍： Collection接口是最基本的接口，它定义了List和Set，List又定义了LinkLi

旗正4.0页面跳转传值问题何必如此 java jsp
跳转和成功提示 a)        成功字段非空forward 成功字段非空forward，不会弹出成功字段，为jsp转发，页面能超链接传值,传输变量时需要拼接。接拼接方式list.jsp?test="+strweightUnit+"或list.jsp?test="+weightUnit+&qu

全网唯一:移动互联网服务器端开发课程 cocos2d-x小菜 web开发移动开发移动端开发移动互联程序员
    移动互联网时代来了！     App市场爆发式增长为Web开发程序员带来新一轮机遇，近两年新增创业者，几乎全部选择了移动互联网项目！传统互联网企业中超过98%的门户网站已经或者正在从单一的网站入口转向PC、手机、Pad、智能电视等多端全平台兼容体系。据统计，AppStore中超过85%的App项目都选择了PHP作为后端程

Log4J通用配置|注意问题笔记 7454103 DAO apache tomcat log4j Web
关于日志的等级那些去百度就知道了！这几天要搭个新框架配置了日志记下来！做个备忘！ #这里定义能显示到的最低级别,若定义到INFO级别,则看不到DEBUG级别的信息了~! log4j.rootLogger=INFO,allLog # DAO层 log记录到dao.log 控制台和总日志文件 log4j.logger.DAO=INFO,dao,C

SQLServer TCP/IP 连接失败问题 ---SQL Server Configuration Manager darkranger sql c windows SQL Server XP
当你安装完之后,连接数据库的时候可能会发现你的TCP/IP 没有启动.. 发现需要启动客户端协议 : TCP/IP 需要打开 SQL Server Configuration Manager... 却发现无法打开 SQL Server Configuration Manager..?? 解决方法: C:\WINDOWS\system32目录搜索framedyn.

[置顶] 做有中国特色的程序员 aijuans 程序员
从出版业说起网络作品排到靠前的，都不会太难看，一般人不爱看某部作品也是因为不喜欢这个类型，而此人也不会全不喜欢这些网络作品。究其原因，是因为网络作品都是让人先白看的，看的好了才出了头。而纸质作品就不一定了，排行榜靠前的，有好作品，也有垃圾。许多大牛都是写了博客，后来出了书。这些书也都不次，可能有人让为不好，是因为技术书不像小说，小说在读故事，技术书是在学知识或温习知识，有些技术书读得可

document.domain 跨域问题 avords document
document.domain用来得到当前网页的域名。比如在地址栏里输入：javascript:alert(document.domain); //www.315ta.com我们也可以给document.domain属性赋值，不过是有限制的，你只能赋成当前的域名或者基础域名。比如：javascript:alert(document.domain = "315ta.com");

关于管理软件的一些思考 houxinyou 管理
工作好多看年了,一直在做管理软件,不知道是我最开始做的时候产生了一些惯性的思维,还是现在接触的管理软件水平有所下降.换过好多年公司,越来越感觉现在的管理软件做的越来越乱. 在我看来,管理软件不论是以前的结构化编程,还是现在的面向对象编程,不管是CS模式,还是BS模式.模块的划分是很重要的.当然,模块的划分有很多种方式.我只是以我自己的划分方式来说一下. 做为管理软件,就像现在讲究MVC这

NoSQL数据库之Redis数据库管理(String类型和hash类型) bijian1013 redis 数据库 NoSQL
一.Redis的数据类型 1.String类型及操作 String是最简单的类型，一个key对应一个value，string类型是二进制安全的。Redis的string可以包含任何数据，比如jpg图片或者序列化的对象。 Set方法：设置key对应的值为string类型的value

Tomcat 一些技巧征客丶 java tomcat dos
以下操作都是在windows 环境下一、Tomcat 启动时配置 JAVA_HOME 在 tomcat 安装目录，bin 文件夹下的 catalina.bat 或 setclasspath.bat 中添加 set JAVA_HOME=JAVA 安装目录 set JRE_HOME=JAVA 安装目录/jre 即可；二、查看Tomcat 版本在 tomcat 安装目

【Spark七十二】Spark的日志配置 bit1129 spark
在测试Spark Streaming时，大量的日志显示到控制台，影响了Spark Streaming程序代码的输出结果的查看(代码中通过println将输出打印到控制台上)，可以通过修改Spark的日志配置的方式，不让Spark Streaming把它的日志显示在console 在Spark的conf目录下，把log4j.properties.template修改为log4j.p

Haskell版冒泡排序 bookjovi 冒泡排序 haskell
面试的时候问的比较多的算法题要么是binary search，要么是冒泡排序，真的不想用写C写冒泡排序了，贴上个Haskell版的，思维简单，代码简单，下次谁要是再要我用C写冒泡排序，直接上个haskell版的，让他自己去理解吧。 sort [] = [] sort [x] = [x] sort (x:x1:xs) | x>x1 = x1:so

java 路径配置文件读取 bro_feng java
这几天做一个项目，关于路径做如下笔记，有需要供参考。取工程内的文件，一般都要用相对路径，这个自然不用多说。在src统计目录建配置文件目录res,在res中放入配置文件。读取文件使用方式： 1. MyTest.class.getResourceAsStream("/res/xx.properties") 2. properties.load(MyTest.

读《研磨设计模式》-代码笔记-简单工厂模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 个人理解：简单工厂模式就是IOC; * 客户端要用到某一对象，本来是由客户创建的，现在改成由工厂创建，客户直接取就好了 */ interface IProduct {

SVN与JIRA的关联 chenyu19891124 SVN
SVN与JIRA的关联一直都没能装成功，今天凝聚心思花了一天时间整合好了。下面是自己整理的步骤：一、搭建好SVN环境，尤其是要把SVN的服务注册成系统服务二、装好JIRA，自己用是jira-4.3.4破解版三、下载SVN与JIRA的插件并解压，然后拷贝插件包下lib包里的三个jar，放到Atlassian\JIRA 4.3.4\atlassian-jira\WEB-INF\lib下，再

JWFDv0.96 最新设计思路 comsci 数据结构算法工作企业应用公告
                   随着工作流技术的发展，工作流产品的应用范围也不断的在扩展，开始进入了像金融行业(我已经看到国有四大商业银行的工作流产品招标公告了)，实时生产控制和其它比较重要的工程领域，而

vi 保存复制内容格式粘贴 daizj vi 粘贴复制保存原格式不变形
    vi是linux中非常好用的文本编辑工具，功能强大无比，但对于复制带有缩进格式的内容时，粘贴的时候内容错位很严重，不会按照复制时的格式排版，vi能不能在粘贴时，按复制进的格式进行粘贴呢？答案是肯定的，vi有一个很强大的命令可以实现此功能。     在命令模式输入:set paste，则进入paste模式，这样再进行粘贴时

shell脚本运行时报错误：/bin/bash^M: bad interpreter 的解决办法 dongwei_6688 shell脚本
出现原因：windows上写的脚本，直接拷贝到linux系统上运行由于格式不兼容导致解决办法： 1. 比如文件名为myshell.sh，vim myshell.sh 2. 执行vim中的命令 : set ff?查看文件格式，如果显示fileformat=dos，证明文件格式有问题 3. 执行vim中的命令 :set fileformat=unix 将文件格式改过来就可以了，然后:w

高一上学期难记忆单词 dcj3sjt126com word english
honest 诚实的；正直的 argue 争论 classical 古典的 hammer 锤子 share 分享；共有 sorrow 悲哀；悲痛 adventure 冒险 error 错误；差错 closet 壁橱；储藏室 pronounce 发音；宣告 repeat 重做；重复 majority 大多数；大半 native 本国的，本地的，本国

hibernate查询返回DTO对象，DTO封装了多个pojo对象的属性 frankco POJO hibernate查询 DTO
      DTO-数据传输对象；pojo-最纯粹的java对象与数据库中的表一一对应。       简单讲：DTO起到业务数据的传递作用，pojo则与持久层数据库打交道。       有时候我们需要查询返回DTO对象，因为DTO

Partition List hcx2013 partition
Given a linked list and a value x, partition it such that all nodes less than x come before nodes greater than or equal to x. You should preserve the original relative order of th

Spring MVC测试框架详解——客户端测试 jinnianshilongnian
上一篇《Spring MVC测试框架详解——服务端测试》已经介绍了服务端测试，接下来再看看如果测试Rest客户端，对于客户端测试以前经常使用的方法是启动一个内嵌的jetty/tomcat容器，然后发送真实的请求到相应的控制器；这种方式的缺点就是速度慢；自Spring 3.2开始提供了对RestTemplate的模拟服务器测试方式，也就是说使用RestTemplate测试时无须启动服务器，而是模拟一

关于推荐个人观点 liyonghui160com 推荐系统关于推荐个人观点
    回想起来，我也做推荐了3年多了，最近公司做了调整招聘了很多算法工程师，以为需要多么高大上的算法才能搭建起来的，从实践中走过来，我只想说【不是这样的】     第一次接触推荐系统是在四年前入职的时候，那时候，机器学习和大数据都是没有的概念，什么大数据处理开源软件根本不存在，我们用多台计算机web程序记录用户行为，用.net的w

不间断旋转的动画 pangyulei 动画
CABasicAnimation* rotationAnimation; rotationAnimation = [CABasicAnimation animationWithKeyPath:@"transform.rotation.z"]; rotationAnimation.toValue = [NSNumber numberWithFloat: M

自定义annotation sha1064616837 java enum annotation reflect
对象有的属性在页面上可编辑，有的属性在页面只可读，以前都是我们在页面上写死的，时间一久有时候会混乱，此处通过自定义annotation在类属性中定义。越来越发现Java的Annotation真心很强大，可以帮我们省去很多代码，让代码看上去简洁。下面这个例子主要用到了 1.自定义annotation：@interface，以及几个配合着自定义注解使用的几个注解 2.简单的反射 3.枚举

Spring 源码 up2pu spring
1.Spring源代码 https://github.com/SpringSource/spring-framework/branches/3.2.x 注：兼容svn检出 2.运行脚本 import-into-eclipse.bat 注：需要设置JAVA_HOME为jdk 1.7 build.gradle compileJava { sourceCompatibilit

利用word分词来计算文本相似度 yangshangchuan word word分词文本相似度余弦相似度简单共有词
word分词提供了多种文本相似度计算方式：方式一：余弦相似度，通过计算两个向量的夹角余弦值来评估他们的相似度实现类：org.apdplat.word.analysis.CosineTextSimilarity 用法如下： String text1 = "我爱购物"; String text2 = "我爱读书"; String text3 =

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他

首页 - 关于我们 - 站内搜索 - Sitemap - 侵权投诉

版权所有 IT知识库 CopyRight © 2000-2050 E-COM-NET.COM , All Rights Reserved.