weixin_39940182

beautifulsoup获取属性_Python 爬虫基础教程——BeautifulSoup抓取入门

点击上方蓝色文字关注我们吧

有你想要的精彩

作者 | 東不归出品 | Python知识学堂

大家好，上篇推文介绍了爬虫方面需要注意的地方、使用vscode开发环境的时候会遇到的问题以及使用正则表达式的方式爬取页面信息，本篇内容主要是介绍BeautifulSoup模块的使用教程。

BeautifulSoup介紹

引用官方的解释：

Beautiful Soup 是一个可以从HTML或XML文件中提取数据的Python库.它能够通过你喜欢的转换器实现惯用的文档导航,查找,修改文档的方式.

简单来说Beautiful Soup是python的一个库，是一个可以从网页抓取数据的利器。

官方文档：

https://beautifulsoup.readthedocs.io/zh_CN/v4.4.0/

BeautifulSoup安裝

pip install beautifulsoup4

或

pip install beautifulsoup4

-i http://pypi.douban.com/simple/

--trusted-host pypi.douban.com

顺便说一句：我使用的开发工具还是vscode，不清楚的看一下之前的推文。

BeautifulSoup解析器

html.parse

html.parse 是内置的不需要安装的

import requestsfrom bs4 import BeautifulSoup
url='https://www.baidu.com'
response=requests.get(url)
response.encoding = 'utf-8'
soup = BeautifulSoup(response.text, 'html.parser')
print(soup.prettify())

结果

lxml

lxml 是需要安装 pip install lxml

import requestsfrom bs4 import BeautifulSoup
url='https://www.baidu.com'
response=requests.get(url)
response.encoding = 'utf-8'
soup = BeautifulSoup(response.text, 'lxml')
print(soup)

结果

lxml-xml/xml

lxml-xml/Xm是需要安装的 pip install lxml

import requestsfrom bs4 import BeautifulSoup
url='https://www.baidu.com'
response=requests.get(url)
response.encoding = 'utf-8'
soup = BeautifulSoup(response.text, 'xml')
print(soup)

结果

html5lib

html5lib 是需要安装的 pip install html5lib

import requestsfrom bs4 import BeautifulSoup
url='https://www.baidu.com'
response=requests.get(url)
response.encoding = 'utf-8'
soup = BeautifulSoup(response.text, 'html5lib')
print(soup)

结果

大家看到这几个解析器解析出来的记过基本上都是一样，但是如果一段HTML或XML文档格式不正确的话,那么在不同的解析器中返回的结果可能是不一样的。什么叫HTML或XML文档格式不正确，简单的来说就是缺少不必要的标签或者标签没有闭合，比如页面缺少body标签、只有a标签开始的部分缺少a标签结束的部分(这里是一些前端的知识，不明白的可以搜索一下，很简单)。

我们来尝试一下

from bs4 import BeautifulSoup
html="

Python知识学堂

"
soup = BeautifulSoup(html, 'html.parser')
print("html.parser 结果：")
print(soup)
soup1 = BeautifulSoup(html, 'lxml')
print("lxml 结果：")
print(soup1)
soup2 = BeautifulSoup(html, 'xml')
print("xml 结果：")
print(soup2)
soup3 = BeautifulSoup(html, 'html5lib')
print("html5lib 结果：")
print(soup3)

结果

可以看出html.parser与lxml 差不多的都会给标签补齐，但lxml会把html 标签给补齐，xml也会给标签补齐，而且还会加上xml文档的版本编码方式等信息,但是不会把html标签补齐，html5lib 也会补齐不但补齐了html标签而且给整个页面补齐head 标签。

这就验证了上面表格上的html5lib 的容错性最好，但是html5lib 解析器的速度不快，内容比较少的话是比较不出速度的差别的，所以推荐使用lxml作为解析器,因为效率更高. 在Python2.7.3之前的版本和Python3中3.2.2之前的版本,必须安装lxml或html5lib, 因为那些Python版本的标准库中内置的HTML解析方法不够稳定.

如果我们不指定解析器会怎么样？

from bs4 import BeautifulSoup
html="

Python知识学堂

"
soup = BeautifulSoup(html)
print("html.parser 结果：")
print(soup)

结果

从结果提示可以得出，不指定解析器的话，他会给出系统最好的解析器，我的系统是lxml,如果你在别的环境没有安装lxml的话，可能会是别的解析器，总之系统会给你选择一个默认最好的解析器给你，所以你可以不指定，这还不是比较人性化的吧。

BeautifulSoup对象种类

Beautiful Soup将复杂HTML文档转换成一个复杂的树形结构,每个节点都是Python对象,所有对象可以归纳为4种: Tag , NavigableString , BeautifulSoup , Comment .

tag

tag中最重要的属性: name和attributes

from bs4 import BeautifulSoup
html="

Python知识学堂

Python知识学堂"
soup = BeautifulSoup(html,'lxml')
tag=soup.a #a标签就相当于一个标签
tag.name
print(tag.name)
tag=soup.test #test 也是算是标签
tag.name
print(tag.name)

结果

上面的代码中的a标签就是表示一个tag，而且test也算是一个标签，test是我随便写的，所以Beautiful Soup中html标签和自定义的标签都是可以当作是tag，是不是很强大！

那么什么是attributes呢？看上面的代码 a 标签中的data-id与class这个就算是标签中的属性；

from bs4 import BeautifulSoup
html="

Python知识学堂

"
soup = BeautifulSoup(html,'lxml')
tag=soup.a 
print(tag.attrs)

结果：

如果要获取某一个属性，可以使用tag['data-id']或tag.attrs['data-id'] 都是可以的。

这个用处最多的应该是获取a标签的链接地址以及img标签的媒体文件地址等。

如果属于里有多个值的话会返回一个list

from bs4 import BeautifulSoup
html="

Python知识学堂

"
soup = BeautifulSoup(html,'lxml')
print(tag['data-id'])

结果：

NavigableString

包含在tag内的字符串可以用NavigableString类来直接获取，也叫可以遍历的字符串。

from bs4 import BeautifulSoup
html="

Python知识学堂,欢迎你！

"
soup = BeautifulSoup(html,'lxml')
tag=soup.a 
print(tag.string)

结果：

这个比较简单，就不再多说了；

BeautifulSoup

BeautifulSoup 对象表示的是一个文档的全部内容.大部分时候,可以把它当作 Tag 对象,它支持遍历文档树和搜索文档树中描述的大部分的方法.

先大概了解一下，在后面遍历文档、搜索文档会有描述；

Comment

主要是文档中的注释部分。

Comment 对象是一个特殊类型的 NavigableString 对象：

from bs4 import BeautifulSoup
html= ""
soup = BeautifulSoup(html,'lxml')
comment = soup.b.string
print(comment)

结果

不过下面这种情况是获取不到的

from bs4 import BeautifulSoup
html= "我是谁？"
soup = BeautifulSoup(html,'lxml')
comment = soup.b.string
print(comment)

结果

可以看到返回的结果是None,所以只有在特殊的情况下才能获取到注释的内容；

遍历文档树

直接看代码吧

from bs4 import BeautifulSoup
html='      python 知识学堂

Python 知识学堂欢迎您

  '#上面是随便写的一个页面代码
soup=BeautifulSoup(html,'lxml')
#print(soup.prettify())
print("-------------------------------------------------分割符----------------------------------------------------") 
print(soup.head)           # 获取head 标签
print("-------------------------------------------------分割符----------------------------------------------------") 
print(soup.a)                     #获取a 标签 默认是第一个
print("-------------------------------------------------分割符----------------------------------------------------") 
print('contents：')
print(soup.a.contents)              #tag的 .contents 属性可以将tag的子节点以列表的方式输出
print("-------------------------------------------------分割符----------------------------------------------------") 
print('children:')for child in soup.form.children:  #获取标签下的一级子标签 
    print(child)
print("-------------------------------------------------分割符----------------------------------------------------") 
print('descendants：')for child in soup.form.descendants: #获取标签下的所有tag子孙节点进行递归循环
    print(child)
print("-------------------------------------------------分割符----------------------------------------------------") 
print('strings:')for str in soup.strings:            #输入标签内的字符串
    print(str)
print("-------------------------------------------------分割符----------------------------------------------------") 
print('stripped_strings:')for str in soup.stripped_strings:  #输入标签内的字符串 去除空字符串
    print(str)

结果：

上面知识简单的举了几个获取树的节点的方式，还有很多其他的方式，比如获取父节点，兄弟节点等等。有点与jquery 遍历 DOM的概念类似。

搜索文档树

Beautiful Soup定义了很多搜索方法，这里主要介绍一下比较常用的到的两个方法：find()和find_all()，其他的可以用法类似，举一反三。

过滤器

字符串
正则表达式
列表
True
方法

from bs4 import BeautifulSoupimport re
html='      python 知识学堂

Python 知识学堂欢迎您

  '#上面是随便写的一个页面代码
soup=BeautifulSoup(html,'lxml')
print("-------------------------------------------------分割符----------------------------------------------------") #最简单的过滤器是字符串.在搜索方法中传入一个字符串参数,Beautiful Soup会查找与字符串完整匹配的内容,下面的例子用于查找文档中所有的标签
print("字符串：")
print(soup.find_all('a'))
print("-------------------------------------------------分割符----------------------------------------------------") #如果传入正则表达式作为参数,Beautiful Soup会通过正则表达式的 match() 来匹配内容.下面例子中找出所有以a开头的标签,这表示所有标签都应该被找到
print("正则表达式：")
print(soup.find_all(re.compile("^a")))
print("-------------------------------------------------分割符----------------------------------------------------") #如果传入列表参数,Beautiful Soup会将与列表中任一元素匹配的内容返回.下面代码找到文档中所有标签和标签
print("列表：")
print(soup.find_all(['a','head']))
print("-------------------------------------------------分割符----------------------------------------------------") #True 可以匹配任何值,下面代码查找到所有的tag,但是不会返回字符串节点
print("Ture:")
print(soup.find_all(True))

结果：

find_all()

Name:可以查找所有名字为 name 的tag,字符串对象会被自动忽略掉;

keyword 参数：如果一个指定名字的参数不是搜索内置的参数名,搜索时会把该参数当作指定名字tag的属性来搜索,如果包含一个名字为 id 的参数,Beautiful Soup会搜索每个tag的”id”属性;

按CSS搜索：按照CSS类名搜索tag的功能非常实用,但标识CSS类名的关键字 class 在Python中是保留字,使用 class 做参数会导致语法错误.从Beautiful Soup的4.1.1版本开始,可以通过 class_ 参数搜索有指定CSS类名的tag;

string 参数:通过 string 参数可以搜搜文档中的字符串内容.与 name 参数的可选值一样, string 参数接受字符串 , 正则表达式 , 列表, True .;

limit 参数:find_all() 方法返回全部的搜索结构,如果文档树很大那么搜索会很慢.如果我们不需要全部结果,可以使用 limit 参数限制返回结果的数量.效果与SQL中的limit关键字类似,当搜索到的结果数量达到 limit 的限制时,就停止搜索返回结果;

recursive 参数:调用tag的 find_all() 方法时,Beautiful Soup会检索当前tag的所有子孙节点,如果只想搜索tag的直接子节点,可以使用参数 recursive=False .

from bs4 import BeautifulSoup
html='      python 知识学堂

Python 知识学堂欢迎您

  '#上面是随便写的一个页面代码
soup=BeautifulSoup(html,'lxml')
#print(soup.prettify())
print("通过tag的name：")
print(soup.find_all('head'))              #获取head 标签
print("通过keyword获取：")
print(soup.find_all(id="head"))          #获取Id 为head的所有标签
print("通过css类名获取：")
print(soup.find_all('a',class_='mnav')) #获取所有a标签 并且class属性值为mnavprint("通过string获取：")print(soup.find_all(string="知识")) #获取所有a标签内容为python 的所有标签,全字符匹配
print("limit参数：")
print(soup.find_all("a",limit=2))      #limit表示获取的数量
print("recursive 参数：")
print(soup.find_all("a",recursive=false)) #recursive 默认为true 表示获取当前tag的所有子孙节点，如果为false 只搜索tag直接子节点

结果：

注意只有 find_all() 和 find() 支持 recursive 参数.

find()的方法跟find_all()基本一样，唯一的区别是 find_all() 方法的返回结果是值包含一个元素的列表,而 find() 方法直接返回结果。

输出

格式化输出
压缩输出
输出格式
get_text()

from bs4 import BeautifulSoup
html='      python 知识学堂

Python 知识学堂欢迎您

  '#上面是随便写的一个页面代码
soup = BeautifulSoup(html,'lxml')#prettify() 方法将Beautiful Soup的文档树格式化后以Unicode编码输出,每个XML/HTML标签都独占一行
print("格式化输出：")
print(soup.prettify())
print("-------------------------------------------------分割符----------------------------------------------------") #如果只想得到结果字符串,不重视格式,那么可以对一个 BeautifulSoup 对象或 Tag 对象使用Python的 unicode() 或 str() 方法
print("压缩输出:")
print(str(soup))
print("-------------------------------------------------分割符----------------------------------------------------") #Beautiful Soup输出是会将HTML中的特殊字符转换成Unicode,比如“&lquot;”
print("输出格式:")
print(str(BeautifulSoup("&&*&*",'lxml')))
print("-------------------------------------------------分割符----------------------------------------------------") #如果只想得到tag中包含的文本内容,那么可以用 get_text() 方法,这个方法获取到tag中包含的所有文版内容包括子孙tag中的内容,并将结果作为Unicode字符串返回
print("get_text():")
print(soup.get_text())
print("-------------------------------------------------分割符----------------------------------------------------")

结果我就不贴出来了，自己执行一下就知道了。

当然还有别的很多方法，在这里就不再赘述了，可以直接参考官方

https://beautifulsoup.readthedocs.io/zh_CN/v4.4.0/

Buaautiful soup 的功能还是很强大的，这里只是简单的描述了一下爬虫常用的一些东西。

下面就来实操一下吧，还是一上篇文章获取省市区为例子

实例

我们还是用上篇的获取省市区来举例子。

import requestsfrom bs4 import BeautifulSoupimport timeclass Demo():def __init__(self):try:base_url = 'http://www.stats.gov.cn/tjsj/tjbz/tjyqhdmhcxhfdm/2019/'
            trlist = self.get_data(base_url, "provincetable",'provincetr') #查看页面，就知道所有的省所在的tr上都有唯一的class='provincetr'for tr in trlist:for td in tr:if td.a is None:continue
                    p_name = td.a.get_text()
                    c_url = base_url + td.a.get('href')             #获取下级城市的地址
                    print("省:" + p_name) #获取每个省
                    # time.sleep(0.5)
                    trs = self.get_data(c_url, "citytable","citytr")for tr in trs:  #循环每个市if tr.find_all('td')[1] is None:continue
                        #c_code = tr.find_all('td')[0].string       #获取城市code
                        c_name = tr.find_all('td')[1].string        #获取城市 name
                        ct_url = base_url + tr.find_all('td')[1].a.get('href') #获取下级区的地址
                        print(p_name+"-"+c_name)
                        time.sleep(0.5)
                        trs1 = self.get_courtydata(ct_url)if trs1 is None:continuefor tr1 in trs1:  #循环每个区if tr1.find_all('td')[1] is None:continue
                            #ct_code = tr.find_all('td')[0].string  #获取区code
                            ct_name = tr1.find_all('td')[1].string  #获取区name
                            print(p_name+"-"+c_name+"-"+ct_name)
        except:
            print("出错了")
    def get_data(self, url, table_attr,attr):
        response = requests.get(url)
        response.encoding = 'gb2312'  #编码转换
        soup = BeautifulSoup(response.text, 'lxml')  #使用lxml的解析器
        table = soup.find('table',class_=table_attr) #查看页面元素就知道数据都在第二个 tbody
        trlist = table.find_all('tr',class_=attr)return trlist
    def get_courtydata(self, url):
        response = requests.get(url)
        response.encoding = 'gb2312'                 #编码转换
        soup = BeautifulSoup(response.text, 'lxml')  #使用lxml的解析器
        towntr=soup.find('table',class_='towntable')if towntr is not None:
            table = soup.find('table',class_='towntable')
            trlist = table.find_all('tr',class_='towntr')else:
            table = soup.find('table',class_='countytable')
            trlist = table.find_all('tr',class_='countytr')return trlistif __name__ == '__main__':
    Demo()

结果

直接给大家看一下获取到的最后一个省市区的结果了，大家注意每次获取的页面信息时的时间间隔;

总结

本篇文章讲述了关于BeautifulSoup的一些基础的内容，主要是与爬虫相关的，关于BeautifulSoup其他功能还有很多，大家可以区官网上自行学习。

再贴一下官网地址：

https://beautifulsoup.readthedocs.io/zh_CN/v4.4.0/

下期预告

下次的推文是关于lxml的模块的相关基础内容，不过下周的的推文是关于深度学习的内容，爬虫的可能要等到下下周了，感谢大家的支持！

往期精选(?猛戳可查看)

Python爬虫基础教程——正则表达式抓取入门

2020-08-30

beautifulsoup获取属性_Python 爬虫基础教程——BeautifulSoup抓取入门_第17张图片

Python实用教程系列——VSCode Python 开发环境搭建

2020-08-01

beautifulsoup获取属性_Python 爬虫基础教程——BeautifulSoup抓取入门_第18张图片

Python实用教程系列——异常处理

2020-07-05

beautifulsoup获取属性_Python 爬虫基础教程——BeautifulSoup抓取入门_第19张图片

点赞和在看一下吧

你可能感兴趣的:(beautifulsoup获取属性_Python 爬虫基础教程——BeautifulSoup抓取入门)

《python基于时间序列分析的降雨量预测系统》毕业设计项目陈辰学长 python 课程设计开发语言
大家好，我是陈辰学长，一名在Java圈辛勤劳作的码农。今日要和大家分享的是一款《python基于时间序列分析的降雨量预测系统》毕业设计项目。项目源码以及部署相关事宜，请联系陈辰学长，文末会附上联系信息哦。作者：陈辰学长个人简介：在Java领域已沉浸十余年，对Java、微信小程序、Python、Android等技术颇为精通。若大家在这些领域有任何问题，欢迎一起交流探讨！各类成品Java毕业设计丰富多
dlib库的whl文件下载杭林菲
dlib库的whl文件下载【下载地址】dlib库的whl文件下载dlib库的whl文件下载项目地址:https://gitcode.com/open-source-toolkit/f2aaf资源文件介绍本仓库提供了一个dlib库的whl文件下载，文件名为：dlib-19.7.0-cp36-cp36m-win_amd64.rar。该文件适用于Windows64位系统，Python版本为3.6。文件描
chatgpt赋能python：用Python安装Jupyter：让数据科学变得更加高效！ aijinglingchat ChatGpt python chatgpt jupyter 计算机
用Python安装Jupyter：让数据科学变得更加高效！对于数据科学家而言，jupyter是不可或缺的工具之一。它是一个基于web的交互式计算环境，可以帮助我们在Python中以一种轻松、方便、可交互的方式进行编程和数据分析。今天，我们将向您介绍在Python中如何安装jupyter。安装Python要安装jupyter，首先需要安装Python。如果您已经安装了Python，请跳到下一步。您可
ECMAScript 2016（ES7） - ECMAScript 2024(ES15)新特性全览孤影_ls JS javascript 前端 ES7-ES15
ECMAScript新特性w3shoolsECMAScript2016ECMAScript2024Es2022array.at获取数组的第N个元素时Object.hasOwn()替代Object.prototype.hasOwnProperty()使用“#”声明私有属性(方法，字段)不用下划线_为前缀了await不需要写asyncRegExp匹配索引/d允许我们指定我们想要获取给定字符串中RegE
Kylin入门教程 -龙川- 介绍学习笔记 kylin
引言ApacheKylin是一个开源的分布式分析引擎，提供Hadoop上的多维分析（OLAP）能力，使得超大规模数据集的实时查询和分析成为可能。它通过预计算数据立方体来加速查询，使得复杂查询可以在亚秒级响应。本文将详细介绍Kylin的基本概念、安装与配置、基本操作及高级功能，帮助你全面掌握这款强大的数据分析工具。第一部分：Kylin简介1.1什么是Kylin？Kylin是由eBay开发并捐赠给Ap
[dlib][python]dlib所有whl文件下载地址汇总 Xiao张不会深度学习 python 开发语言深度学习
dlib库的wheel文件3.7-3.12GitHub-z-mahmud22/Dlib_Windows_Python3.x:Dlibcompiledbinary(.whl)forPython3.7-3.12andWindowsx64这里存储了适用于python3.7-3.12的wheel文件下载wheel文件之后，比如：dlib-19.22.99-cp310-cp310-win_amd64.whl
Python剪辑视频小妙招（moivepy库）对不起，我辜负了你 python
起因最近一直在b站上投稿喜羊羊与灰太狼的视频，但是苦于需要手动裁剪视频的片头和片尾，裁剪的多了就发现喜羊羊与灰太狼的视频片头几乎都是1分25秒结束，也就是持续85秒，片尾也差不多是持续1分02秒差不多也就是62秒，于是开始思考有没有什么方法可以替代人类进行自动化批量裁剪？思路发展迭代与确定一开始是想使用Premier里面的预设来做的，结果发现Premier里面高版本的导出变成了各种网站的标准，相比
Python 实战-优化排班表节省成本奔向理想的星辰大海技术研发 python ios objective-c
1.基础概念：理解排班表排班表，顾名思义，就是安排员工工作时间的表格。在餐馆中，它通常需要考虑员工的可用性、工作时间限制、用餐高峰时段等因素。2.使用列表存储员工信息首先，我们需要一个数据结构来存储员工信息。Python中的列表是一个不错的选择。#员工信息列表，包括姓名、可用时间段employees=[{"name":"张三","available":[(9,17),(20,23)]},{"nam
No module named ‘moviepy.editor‘ weixin_66009678 python
python3.7版本后不支持frommoviepy.editor引用方式，由于是moviepy2.0.0版本修改方法：frommoviepy.editorimportVideoFileClip,clips_array改为frommoviepyimport*
安装python3.12.2环境（实验机器银河麒麟高级服务器） Red丶哞桌面运维 Python linux 运维服务器
1.下载官网Python安装包wgethttps://www.python.org/ftp/python/3.12.2/Python-3.12.2.tar.xz1.1解压tar-xfPython-3.12.2.tar.xz解压完后切换到Python-3.12.2文件夹(这里根据自己解压的文件夹路径)cd/usr/packages/Python-3.12.2/1.2升级软件包管理器CentOS系统：
自己动手写CPU - 6 qq85058522 自己动手写CPU fpga开发
自己动手写CPU_qq85058522的博客-CSDN博客CPU不加功能了，但汇编器可以有。下面写一个把汇编（助记符）翻译成机器码的小工具。Python熟些，就用它了。很简单，就是字符串替换。直接上代码。importsysiflen(sys.argv)!=2:print("usage:pythonassemblerxxx.asm")exit(0)code_path=sys.argv[1]print
如何安装python3.7.4_银河麒麟安装Python3.7.4以及升级自带OpenSSL weixin_39873191 如何安装python3.7.4
银河麒麟安装Python3.7.4以及升级自带OpenSSL升级OpenSSL1.下载opensslwgethttps://www.openssl.org/source/openssl-1.1.1a.tar.gztar-zxvfopenssl-1.1.1a.tar.gzcdopenssl-1.1.1a2.编译安装./config--prefix=/usr/local/opensslno-zlib#
python多进程编程_深入理解python多进程编程 weixin_39620001 python多进程编程
1、python多进程编程背景python中的多进程最大的好处就是充分利用多核cpu的资源，不像python中的多线程，受制于GIL的限制，从而只能进行cpu分配，在python的多进程中，适合于所有的场合，基本上能用多线程的，那么基本上就能用多进程。在进行多进程编程的时候，其实和多线程差不多，在多线程的包threading中，存在一个线程类Thread，在其中有三种方法来创建一个线程，启动线程，
python多进程编程实例_Python多进程编程multiprocessing代码实例 weixin_39791386 python多进程编程实例
在多线程与多进程的比较这一篇中记录了多进程编程的一种方式.下面记录一下多进程编程的别一种方式,即使用multiprocessing编程importmultiprocessingimporttimedefget_html(n):time.sleep(n)print('subprocess%s'%n)returnnif__name__=='__main__':#多进程编程process=multipr
python打开一个软件并进行操作_模拟试卷 B weixin_39551611
原标题：模拟试卷B一、单项选择题1.关于算法的描述，以下选项中错误的是算法是指解题方案的准确而完整的描述算法具有可行性、确定性、有穷性的基本特征算法的复杂度主要包括时间复杂度和数据复杂度算法的基本要素包括数据对象的运算和操作及算法的控制结构2.关于数据结构的描述，以下选项中正确的是数据结构指相互有关联的数据元素的集合数据的存储结构是指反映数据元素之间逻辑关系的数据结构数据的逻辑结构有顺序、链接、索
python之openpyxl模块 weixin_34248849 python 数据结构与算法测试
一.Python操作EXCEL库的简介1.1Python官方库操作excelPython官方库一般使用xlrd库来读取Excel文件，使用xlwt库来生成Excel文件，使用xlutils库复制和修改Excel文件，这三个库只支持到Excel2003。1.2第三方库openpyxl介绍第三方库openpyxl（可读写excel表），专门处理Excel2007及以上版本产生的xlsx文件，xls和x
Strus2 @JSON(serialize=false)，过滤不需要的变量 sageparadise struts2 Java s struts2.0 json
在用struts2的Action加@ParentPackage("json-default")注解orstruts.xml配置文件中Action所在的package继承json-default，Action中方法返回json类型的数据时，在没有任何设定的情况下，改类下的所有getter方法的返回值将被包含在返回给客户端的JSON字符串中。需要剔除不需要包含的属性，在类结构结构中需要在getter方
wireshark解密TLS流量头顶路由器网络工程师
原理：通过设置环境变量截取浏览器的master_secret,进而实现解密TLS的目的。未解密的TLS包：1.设置系统属性环境变量右键我的电脑点击属性>>高级系统设置>>环境变量
python使用多进程multiprocessing 小蜗笔记 python python
python使用多进程multiprocessing1多进程解释2进程的演示3进程池方法4pool.map()的解析pool.map()的基本用法返回值语法示例注意事项适用场景5pool.join()详解示例注意事项pool.join()的运行逻辑阻塞特性的影响对计算速度的影响示例总结6apply_async(),apply(),和pool.map()`apply_async()`特性：语法：`a
centos下安裝python 白小白的小白 python python centos
更新系统文件yumupdateyuminstallzlib-develbzip2-developenssl-develncurses-develsqlite-develreadline-develtk-devellibffi-develgccmake下载安装包并解压wgethttps://www.python.org/ftp/python/3.7.6/Python-3.7.6.tar.xztar-
将python文件(.py)打包为可执行文件(.exe)的多种方法，看这一篇就够了，万字教学，全网最全！！！盲敲代码的阿豪 python实用知识点 python 可执行程序代码打包
文章目录前言1、PyInstaller库的使用（最简单，常用）1.1安装PyInstaller1.2常用参数及使用1.3其它参数（了解）1.4案例演示2、cx_Freeze库的使用2.1安装cx_Freeze2.2创建打包脚本2.3运行打包文件2.4参数说明2.5案例演示3、py2exe库的使用3.1安装py2exe3.2创建打包脚本3.3运行打包文件3.4参数说明3.5案例演示3.6常见问题4、
通过python代码实现向钉钉群内自动推送消息，详细步骤及代码，超实用教学！！！盲敲代码的阿豪 python实用知识点 python 钉钉自动化发消息
文章目录前言一、创建钉钉群机器人二、以文本格式发送信息三、以MarkDown格式发送信息四、以Link格式发送信息前言我们在使用钉钉时，通常会创建或加入多个群聊，身为群聊的管理者，当我们需要及时、并按时的向这些群聊推送一些固定信息，若通过人力来解决肯定非常耗时、耗力，这时我们就可以考虑开发一个自动化脚本来实现这个功能，本篇文章我将教会大家，如何使用python开发程序，实现向钉钉群内自动发送消息。
Python3-excel文档操作（二）：利用openpyxl库处理excel表格：在excel表格中插入图片 liranke Python学习笔记 python openpyxl python处理excel load_workbook
1.简介excel表中可以插入图片，使用openpyxl库可以实现这个功能。2.代码：#-*-coding:utf-8-*-importosimportsysimporttimeimportopenpyxlfromopenpyxlimportload_workbookfromopenpyxl.drawing.imageimportImagedefopenxls_insert_img(fname,i
基于Python的多元医疗知识图谱构建与应用研究（上） Allen_LVyingbo python 医疗高效编程研发 python 知识图谱健康医疗
一、引言1.1研究背景与意义在当今数智化时代，医疗数据呈爆发式增长，如何高效管理和利用这些数据，成为提升医疗服务质量的关键。传统医疗数据管理方式存在数据孤岛、信息整合困难等问题，难以满足现代医疗对精准诊断和个性化治疗的需求。知识图谱作为一种知识表示和管理技术，为医疗领域带来了新的解决方案。它能够将海量的医疗信息以结构化、语义化的方式组织起来，揭示疾病、症状、药物、治疗方法等实体之间的复杂关系，从而
学习ASP.NET Core的身份认证（基于JwtBearer的身份认证4） gc_2299 网页编程 JwtBear 身份认证
本文学习并记录builder.Services.AddAuthentication().AddJwtBearer函数中配置类的主要属性及用途。AddJwtBearer函数原型如下图所示，划红线的为常用形式，主要设置JwtBearerOptions类型的常用属性或事件。 JwtBearerOptions类中的属性虽多，但从参考文献的示例来看，大多没有直接设置，主要是对TokenValidati
学习ASP.NET Core的身份认证（基于JwtBearer的身份认证1） gc_2299 网页编程 JWT 身份认证 JwtBear
本文开始学习基于JWT的身份认证基本用法，相比Cookie、Session等方式，JWT要复杂一些，除了注册认证服务之外，还需提供JWTToken的生成函数或生成类，以便在访问需授权的函数之前获取Token。参考文献1-7中大部分示例都是基于WebApi项目，本文基于Microsoft.AspNetCore.Authentication.JwtBearer包，参照参考文献中的代码，实现最简单的
PostgreSQL - pgvector 插件构建向量数据库并进行相似度查询花千树-010 RAG 数据库 postgresql AI编程
在现代的机器学习和人工智能应用中，向量相似度检索是一个非常重要的技术，尤其是在文本、图像或其他类型的嵌入向量的操作中。本文将介绍如何在PostgreSQL中安装pgvector插件，用于存储和检索向量数据，并展示如何通过Python脚本向数据库插入向量并执行相似度查询。一、安装PostgreSQL并配置pgvector插件1.安装PostgreSQL首先，确保你已经安装了PostgreSQL。可以
全面解析NVIDIA显卡：从入门级到旗舰级显卡详解花千树-010 大模型人工智能算法智能电视
在选择显卡时，了解不同显卡的性能和适用场景是非常重要的。无论你是预算有限的入门用户，还是追求极致性能的游戏玩家，亦或是专业的内容创作者和深度学习研究人员，NVIDIA都有适合你的显卡。本篇博文将详细列举NVIDIA显卡的各项配置，从低到高逐一整理，并给出适用的使用场景。入门级显卡NVIDIAGeForceGT1030CUDA核心数:384基础频率:1227MHz加速频率:1468MHz显存:2GB
MoviePy视频编辑和处理Python库的版本问题解决：No module named ‘moviepy.editor‘ 封步宇AIGC 文字音频视频自动化工具 python 音视频 ffmpeg 人工智能
MoviePy是一个强大的Python库，用于视频编辑和处理。它支持多种基本操作，如视频剪切、拼接、插入标题，以及更高级的视频合成（非线性编辑）、视频处理和自定义特效创建。MoviePy能够读写包括GIF在内的常见音频和视频格式，并且兼容Windows、Mac和Linux操作系统，支持Python2.7和3.x版本MoviePy基于ffmpeg和ImageMagick，提供了易于使用的API，能够
《CPython Internals》阅读笔记：p177-p220 codists 读书笔记 python
《CPythonInternals》学习第11天，p177-p220总结，总计44页。一、技术总结1.memoryallocationinC(1)staticmemeoryallocationMemoryrequirementsarecalculatedatcompiletimeandallocatedbytheexecutablewhenitstarts.(2)automaticmemeorya
异常的核心类Throwable 无量 java 源码异常处理 exception
java异常的核心是Throwable，其他的如Error和Exception都是继承的这个类里面有个核心参数是detailMessage，记录异常信息，getMessage核心方法，获取这个参数的值，我们可以自己定义自己的异常类，去继承这个Exception就可以了，方法基本上，用父类的构造方法就OK，所以这么看异常是不是很easy package com.natsu;
mongoDB 游标（cursor）实现分页迭代开窍的石头 mongodb
上篇中我们讲了mongoDB 中的查询函数，现在我们讲mongo中如何做分页查询如何声明一个游标 var mycursor = db.user.find({_id:{$lte:5}}); 迭代显示游标数
MySQL数据库INNODB 表损坏修复处理过程 0624chenhong tomcat mysql
最近mysql数据库经常死掉，用命令net stop mysql命令也无法停掉，关闭Tomcat的时候，出现Waiting for N instance(s) to be deallocated 信息。查了下，大概就是程序没有对数据库连接释放，导致Connection泄露了。因为用的是开元集成的平台，内部程序也不可能一下子给改掉的，就验证一下咯。启动Tomcat,用户登录系统，用netstat -
剖析如何与设计人员沟通不懂事的小屁孩工作
最近做图烦死了，不停的改图，改图……。烦，倒不是因为改，而是反反复复的改，人都会死。很多需求人员不知该如何与设计人员沟通，不明白如何使设计人员知道他所要的效果，结果只能是沟通变成了扯淡，改图变成了应付。那应该如何与设计人员沟通呢？我认为设计人员与需求人员先天就存在语言障碍。对一个合格的设计人员来说，整天玩的都是点、线、面、配色，哪种构图看起来协调；哪种配色看起来合理心里跟明镜似的，
qq空间刷评论工具换个号韩国红果果 JavaScript
var a=document.getElementsByClassName('textinput'); var b=[]; for(var m=0;m<a.length;m++){ if(a[m].getAttribute('placeholder')!=null) b.push(a[m]) } var l
S2SH整合之session 灵静志远 spring AOP struts session
错误信息： Caused by: org.springframework.beans.factory.BeanCreationException: Error creating bean with name 'cartService': Scope 'session' is not active for the current thread; consider defining a scoped
xmp标签 a-john 标签
今天在处理数据的显示上遇到一个问题： var html = '<li><div class="pl-nr"><span class="user-name">' + user + '</span>' + text + '</div></li>'; ulComme
Ajax的常用技巧（2）---实现Web页面中的级联菜单 aijuans Ajax
在网络上显示数据，往往只显示数据中的一部分信息，如文章标题，产品名称等。如果浏览器要查看所有信息，只需点击相关链接即可。在web技术中，可以采用级联菜单完成上述操作。根据用户的选择，动态展开，并显示出对应选项子菜单的内容。在传统的web实现方式中，一般是在页面初始化时动态获取到服务端数据库中对应的所有子菜单中的信息，放置到页面中对应的位置，然后再结合CSS层叠样式表动态控制对应子菜单的显示或者隐
天-安-门，好高 atongyeye 情感
我是85后，北漂一族，之前房租1100，因为租房合同到期，再续，房租就要涨150。最近网上新闻，地铁也要涨价。算了一下，涨价之后，每次坐地铁由原来2块变成6块。仅坐地铁费用，一个月就要涨200。内心苦痛。晚上躺在床上一个人想了很久，很久。我生在农
android 动画百合不是茶 android 透明度平移缩放旋转
android的动画有两种 tween动画和Frame动画 tween动画;,透明度,缩放,旋转,平移效果 Animation 动画 AlphaAnimation 渐变透明度 RotateAnimation 画面旋转 ScaleAnimation 渐变尺寸缩放 TranslateAnimation 位置移动 Animation
查看本机网络信息的cmd脚本 bijian1013 cmd
@echo 您的用户名是：%USERDOMAIN%\%username%>"%userprofile%\网络参数.txt" @echo 您的机器名是：%COMPUTERNAME%>>"%userprofile%\网络参数.txt" @echo ___________________>>"%userprofile%\
plsql 清除登录过的用户征客丶 plsql
tools---preferences----logon history---history 把你想要删除的删除 -------------------------------------------------------------------- 若有其他凝问或文中有错误，请及时向我指出，我好及时改正，同时也让我们一起进步。 email ： binary_spac
【Pig一】Pig入门 bit1129 pig
Pig安装 1.下载pig wget http://mirror.bit.edu.cn/apache/pig/pig-0.14.0/pig-0.14.0.tar.gz 2. 解压配置环境变量如果Pig使用Map/Reduce模式，那么需要在环境变量中，配置HADOOP_HOME环境变量 expor
Java 线程同步几种方式 BlueSkator volatile synchronized ThredLocal ReenTranLock Concurrent
为何要使用同步？ java允许多线程并发控制，当多个线程同时操作一个可共享的资源变量时（如数据的增删改查），将会导致数据不准确，相互之间产生冲突，因此加入同步锁以避免在该线程没有完成操作之前，被其他线程的调用，从而保证了该变量的唯一性和准确性。 1.同步方法&
StringUtils判断字符串是否为空的方法（转帖） BreakingBad null StringUtils “”
转帖地址：http://www.cnblogs.com/shangxiaofei/p/4313111.html public static boolean isEmpty(String str) 　　判断某字符串是否为空，为空的标准是 str== null 或 str.length()== 0
编程之美-分层遍历二叉树 bylijinnan java 数据结构算法编程之美
import java.util.ArrayList; import java.util.LinkedList; import java.util.List; public class LevelTraverseBinaryTree { /** * 编程之美分层遍历二叉树 * 之前已经用队列实现过二叉树的层次遍历，但这次要求输出换行，因此要
jquery取值和ajax提交复习记录 chengxuyuancsdn jquery取值 ajax提交
// 取值 // alert($("input[name='username']").val()); // alert($("input[name='password']").val()); // alert($("input[name='sex']:checked").val()); // alert($("
推荐国产工作流引擎嵌入式公式语法解析器-IK Expression comsci java 应用服务器工作 Excel 嵌入式
这个开源软件包是国内的一位高手自行研制开发的，正如他所说的一样，我觉得它可以使一个工作流引擎上一个台阶。。。。。。欢迎大家使用，并提出意见和建议。。。 ----------转帖--------------------------------------------------- IK Expression是一个开源的（OpenSource），可扩展的（Extensible），基于java语言
关于系统中使用多个PropertyPlaceholderConfigurer的配置及PropertyOverrideConfigurer daizj spring
1、PropertyPlaceholderConfigurer Spring中PropertyPlaceholderConfigurer这个类，它是用来解析Java Properties属性文件值，并提供在spring配置期间替换使用属性值。接下来让我们逐渐的深入其配置。基本的使用方法是：(1) <bean id="propertyConfigurerForWZ&q
二叉树:二叉搜索树 dieslrae 二叉树
所谓二叉树,就是一个节点最多只能有两个子节点,而二叉搜索树就是一个经典并简单的二叉树.规则是一个节点的左子节点一定比自己小,右子节点一定大于等于自己(当然也可以反过来).在树基本平衡的时候插入,搜索和删除速度都很快,时间复杂度为O(logN).但是,如果插入的是有序的数据,那效率就会变成O(N),在这个时候,树其实变成了一个链表. tree代码:
C语言字符串函数大全 dcj3sjt126com c function
C语言字符串函数大全函数名: stpcpy 功能: 拷贝一个字符串到另一个用法: char *stpcpy(char *destin, char *source); 程序例: #include <stdio.h> #include <string.h> int main
友盟统计页面技巧 dcj3sjt126com 技巧
在基类调用就可以了, 基类ViewController示例代码 -(void)viewWillAppear:(BOOL)animated { [super viewWillAppear:animated]; [MobClick beginLogPageView:[NSString stringWithFormat:@"%@",self.class]];
window下在同一台机器上安装多个版本jdk，修改环境变量不生效问题处理办法 flyvszhb java jdk
window下在同一台机器上安装多个版本jdk，修改环境变量不生效问题处理办法本机已经安装了jdk1.7，而比较早期的项目需要依赖jdk1.6，于是同时在本机安装了jdk1.6和jdk1.7. 安装jdk1.6前，执行java -version得到 C:\Users\liuxiang2>java -version java version "1.7.0_21&quo
Java在创建子类对象的同时会不会创建父类对象 happyqing java 创建子类对象父类对象
1.在thingking in java 的第四版第六章中明确的说了，子类对象中封装了父类对象， 2."When you create an object of the derived class, it contains within it a subobject of the base class. This subobject is the sam
跟我学spring3 目录贴及电子书下载 jinnianshilongnian spring
一、《跟我学spring3》电子书下载地址：《跟我学spring3》（1-7 和 8-13） http://jinnianshilongnian.iteye.com/blog/pdf 跟我学spring3系列 word原版下载二、源代码下载最新依
第12章 Ajax（上） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
BI and EIM 4.0 at a glance blueoxygen BO
http://www.sap.com/corporate-en/press.epx?PressID=14787 有机会研究下EIM家族的两个新产品~~~~ New features of the 4.0 releases of BI and EIM solutions include: Real-time in-memory computing –
Java线程中yield与join方法的区别 tomcat_oracle java
长期以来，多线程问题颇为受到面试官的青睐。虽然我个人认为我们当中很少有人能真正获得机会开发复杂的多线程应用(在过去的七年中，我得到了一个机会)，但是理解多线程对增加你的信心很有用。之前，我讨论了一个wait()和sleep()方法区别的问题，这一次，我将会讨论join()和yield()方法的区别。坦白的说，实际上我并没有用过其中任何一个方法，所以，如果你感觉有不恰当的地方，请提出讨论。 &nb
android Manifest.xml选项阿尔萨斯 Manifest
结构继承关系 public final class Manifest extends Objectjava.lang.Objectandroid.Manifest 内部类 class Manifest.permission权限 class Manifest.permission_group权限组构造函数 public Manifest () 详细 androi
Oracle实现类split函数的方 zhaoshijie oracle
关键字：Oracle实现类split函数的方项目里需要保存结构数据，批量传到后他进行保存，为了减小数据量，子集拼装的格式，使用存储过程进行保存。保存的过程中需要对数据解析。但是oracle没有Java中split类似的函数。从网上找了一个，也补全了一下。 CREATE OR REPLACE TYPE t_split_100 IS TABLE OF VARCHAR2(100); cr