嘿嘿潶黑黑

BeautifulSoup4的介绍与使用

BeautifulSoup4 的使用

BeautifulSoup的简介
BeautifulSoup4的安装

安装
出现的问题
安装解析器

BeautifulSoup4的使用

使用
对象的种类

Tag
NavigableString
BeautifulSoup
Comment

遍历文档树

子节点

tagName
.contents和.children

.contents
.children

.descendants
.string
.strings
.stripped_strings

父节点

.parent
.parents

兄弟节点

.next_sibling和.previous_sibling
.next_siblings和.previous_siblings

前进和回退

.next_element 和 .previous_element
.next_elements 和 .previous_elements

搜索文档树

find_all()
find()
过滤器

字符串
正则表达式
列表
True
方法

find_parents()和find_parent()
find_next_siblings()和find_next_sibling()
find_all_next() 和 find_next()
find_all_previous() 和 find_previous()
CSS选择器

修改文档树

修改tag的名称和属性
修改 .string
append()
BeautifulSoup.new_string() 和 .new_tag()
插入
clear()
extract()
decompose()
replace_with()
wrap() 和 unwrap()
最后

python环境
Python 3.7.1

BeautifulSoup的简介

Beautiful Soup 是一个可以从HTML或XML文件中提取数据的Python库。
它通过转换器实现文档导航,查找,修改文档的方式。

BeautifulSoup4的安装

安装

若使用的是新版的ubuntu,可以通过系统的软件包管理来安装:

$ apt-get install Python-bs4

若无法使用系统包管理安装,那么也可以通过 easy_install 或 pip 来安装.包的名字是 beautifulsoup4 ,这个包兼容Python2和Python3.

$ easy_install beautifulsoup4
$ pip install beautifulsoup4

若没有安装 easy_install 或 pip ,那你也可以下载BS4的源码解压后，进入到beautifulsoup目录下，然后通过setup.py来安装.（Windows下的beautifulsoup安装过程和此方法一样）

$ Python setup.py install

出现的问题

如果此时代码抛出了异常，可能是因为你在Python2版本中执行Python3版本的代码或你在Python3版本中执行Python2的代码.最好的解决方法是重新安装BeautifulSoup4.

假设需要将把BS4的Python代码版本从Python2转换到Python3. 可以重新安装BS4:

$ Python3 setup.py install

或在bs4的目录中执行Python代码版本转换脚本

$ 2to3-3.2 -w bs4

安装解析器

BeautifulSoup本身支持Python标准库中的HTML解析器
但若想使BeautifulSoup使用html5lib解析器，可以使用下面方法安装：

$ pip install html5lib

若想使BeautifulSoup使用lxml 解析器，可以使用下面方法安装：

$ pip install lxml

BeautifulSoup4的使用

使用

from bs4 import BeautifulSoup						#导入BeautifulSoup4库
soup = BeautifulSoup("hello python")	#得到文档的对象
print(soup)

'''
结果：
hello python
'''

对象的种类

Beautiful Soup将复杂HTML文档转换成一个复杂的树形结构,每个节点都是Python对象,所有对象可以归纳为4种: Tag , NavigableString , BeautifulSoup, Comment .

Tag

from bs4 import BeautifulSoup

soup = BeautifulSoup('baidu')

tag = soup.a

print(tag)
print(type(tag))
'''
result:
baidu

'''

print('tag.name:',tag.name)
tag.name = 'b'
print(tag)
'''
result:
tag.name: a
baidu
'''

print(tag.attrs)
print(tag['href'])
tag['href'] = 'www.163.com'
print(tag['href'])

del tag
print(tag)
'''
result:
{'href': 'www.baidu.com'}
www.baidu.com
www.163.com
Traceback (most recent call last): 
File "UseBeautifulSoup4.py", line 21, in 
print(tag)
NameError: name 'tag' is not defined 
'''

#若含有多个值的属性也可以进行操作
soup = BeautifulSoup('
')
print(soup.p['class'])
soup.p['class'] = ['t3','s1']
print(soup.p['class'])
'''
result:
['t1', 't2']
['t3', 's1']
'''

NavigableString

用来包装tag中的字符串

soup = BeautifulSoup('testong
')
tag = soup.p
print(tag.string)
'''
resutl:
testong 
'''

#用来替换字符串
print(tag.string)
tag.string.replace_with(" one two three")
print(tag.string)
'''
result:
testong
one two three  
'''

BeautifulSoup

BeautifulSoup对象表示的是一个文档的全部内容,它包含了一个值为’[document]'的属性

soup = BeautifulSoup('testong
')
print(soup.name)
'''
result:
[document]
'''

Comment

Comment对象用于操作文档的注释部分

soup = BeautifulSoup('
')
print(soup.p.string)
print('string type ',type(soup.p.string))
print(soup.p.prettify())
'''
result:
 when where who 
string type  
 
 
  
'''

遍历文档树

使用例子：

from bs4 import BeautifulSoup

soup = BeautifulSoup('''


 
    
    王牌对王牌4之姚晨沙溢再聚同福客栈
 
 

    
    
            
            综艺
            
            
           
 
''')

子节点

tagName

#通过tag.name可以获取标签
print(soup.head)
print()
print(soup.div)

'''
result:


王牌对王牌4之姚晨沙溢再聚同福客栈                                                                  
  
 
  
 

综艺


 
'''

#使用find_all()方法查找所有的标签
print(soup.find_all('div'))

'''
result:
[
 

 
综艺 
  

,  

综艺
, ] 
'''

.contents和.children

.contents

tag的.contents属性会将tag的子节点以列表形式输出

tag = soup.head
print(tag)
print()
print(tag.contents)

'''
result:


王牌对王牌4之姚晨沙溢再聚同福客栈

['\n', , '\n', 王牌对王牌4之姚晨沙溢再聚同福
客栈, '\n'] 
'''

.children

tag的.children属性可以对tag的子节点进行循环


for t in tag.children:
	print(t)
'''
result:


王牌对王牌4之姚晨沙溢再聚同福客栈                                                                                                                         
'''

.descendants

tag的.children和.contents只包含tag的直接子节点，.descendants可以直接对所有的子孙节点进行递归循环


for t in tag.descendants:
	print(t)
'''
result:


王牌对王牌4之姚晨沙溢再聚同福客栈
王牌对王牌4之姚晨沙溢再聚同福客栈
'''

.string

如果tag只有一个NavgableString类型的子节点，可以使用.string得到子节点


tag = soup.head
print(tag.string)

title_tag = tag.title
print(title_tag.string)
'''
result:
None
王牌对王牌4之姚晨沙溢再聚同福客栈
'''

.strings

如果tag中有多个字符串，可以使用.strings来循环获取


for str in soup.strings:
	print(repr(str))
'''
'\n'
'\n'
'\n'
'王牌对王牌4之姚晨沙溢再聚同福客栈'
'\n'
'\n'
'\n'
'\n'
'\n'
'\n'
'\n'
'综艺'
'\n'
'\n'
'\n'
'\n'
'\n'
'''

.stripped_strings

使用.stripped_strings可以去除多余空白内容


for str in soup.stripped_strings:
	print(repr(str))
'''
'王牌对王牌4之姚晨沙溢再聚同福客栈'
'综艺'
'''

父节点

.parent

可以通过.parent属性来获取某个元素的父节点


tag = soup.title
print(tag.parent)
'''


王牌对王牌4之姚晨沙溢再聚同福客栈

'''

.parents

可以通过.parents属性递归得到元素的所有父节点


tag = soup.title

for p in tag.parents:
	if p is None:
		print(p)
	else:
		print(p.name)
'''
head
html
[document]
'''

兄弟节点

.next_sibling和.previous_sibling

通过.next_sibling和.previous_sibling属性来操作兄弟节点

#.previous_sibling的使用
tag = soup.a
previous_tag = tag.previous_sibling

print(previous_tag)
print(previous_tag.previous_sibling)
'''
result:
				这里是一个输出，空格也算一个节点

'''

#.next_sibling的使用
tag = soup.i
next_tag = tag.next_sibling

print(next_tag)
print(next_tag.next_sibling)
'''
result:

综艺
'''

.next_siblings和.previous_siblings

通过.next_siblings和.previous_siblings属性可以迭代输出所有的兄弟节点

#.previous_siblings的使用
tag = soup.a

for previous in tag.previous_siblings:
	print(repr(previous))
'''
result:
'\n'

'\n'
'''

#.next_siblings的使用
tag = soup.i

for next in tag.next_siblings:
	print(repr(next))
'''
result:
'\n'
综艺
'\n'
'''

前进和回退

.next_element 和 .previous_element

通过.next_element和.previous_element可以解析下一个或上一个对象

tag = soup.a
#previous_element
print(tag.next_element)
print(tag.next_element.next_element)
'''
result:
							该tag上一个对象是\n

'''

#.next_element
print(tag.next_element)
'''
result:
综艺
'''

.next_elements 和 .previous_elements

通过.next_elements和.previous_elements可以迭代解析下一个或上一个对象

#.previous_element
tag = soup.head
for e in tag.previous_elements:
	print(e)
'''
result:




王牌对王牌4之姚晨沙溢再聚同福客栈






综艺




HTML
'''

#next_element
tag = soup.h2
for e in tag.next_elements:
	print(e)
'''
result:
综艺











'''

搜索文档树

使用例子：

from bs4 import BeautifulSoup

soup = BeautifulSoup('''


 
    
    王牌对王牌4之姚晨沙溢再聚同福客栈
 
 

    
    
            
            综艺
            
            
           
 
''')

find_all()

find_all(name,attrs,recursive,string,**kwargs)


#name参数
#查找所有名字为name的tag
print(soup.find_all("a"))
'''
result:
[综艺]
'''

#keyword参数
#将属性作为key值来查找
import re
	
print(soup.find_all(id='nav_logo'))
print(soup.find_all(href=re.compile("zongyi/")))
#有些tag在搜索中不能使用，但可以使用attrs参数来定义参数
#print(soup.find_all(class="qy-logo"))  此处结果会报错 SyntaxError: invalid syntax
print(soup.find_all(attrs=["class","qy-logo"]))
'''
result:
[

综艺
]
[综艺]

[

综艺
]
'''

#css参数
#class在Python是保留字，使用class作为参数将会报错，但BeautifulSoup4.1.1版本之后，可以通过class_参数搜索
print(soup.find_all('i',class_='logo-dot'))
'''
result:
[]
'''

#text参数
#通过text参数可以搜索文档中的字符串的内容，text参数也可以是正则、列表等
print(soup.find_all(text="综艺"))
'''
result:
['综艺']
'''

#limit参数
#使用limit属性来限制返回值的数量
print(soup.find_all("div",limit=1))
'''
result:
[



综艺


]
'''

#recursive参数
#find_all()方法默认会搜索当前tag的所有子孙节点，若只想搜索直接子节点，将recursive参数设为False即可
print(soup.find_all("div",id='nav_logo',recursive=True))
print(soup.find_all("div",id='nav_logo',recursive=False))
'''
result:
[

综艺
]
[]
'''

find()

若只想得到一个结果，可以使用find()方法

print(soup.find("title"))
'''
result:
王牌对王牌4之姚晨沙溢再聚同福客栈
'''
#soup.find("title") 等价于soup.find_all('title',limit=1)

过滤器

字符串

在find_all()方法中传一个字符串作为参数

print(soup.find_all('a'))
'''
result:
[综艺]
'''

正则表达式

在find_all()方法中传一个正则表达式作为参数

import re

for tag in soup.find_all(re.compile("^b")):
	print(tag.name)
'''
result:
body
'''

列表

在find_all()方法中传入一个列表作为参数


print(soup.find_all(["i","a"]))
'''
result:
[, 综艺]
'''

True

True可以匹配任何值


for tag in soup.find_all(True):
	print(tag.name)
'''
result:
html
head
meta
title
body
div
div
i
a
h2
div
'''

方法

在find_all()方法中传入一个方法作为参数


def method1(tag):
	return tag.has_attr('class') and not tag.has_attr('id')
	
print(soup.find_all(method1))
'''
result:
[, 综艺, ]
'''

find_parents()和find_parent()

用来搜索当前节点的父辈节点

a_string = soup.find(text="综艺")
print(a_string)
print(a_string.find_parents("a"))
print(a_string.find_parent("a"))
'''
result:
综艺
[综艺]
综艺
'''

find_next_siblings()和find_next_sibling()

用来查找兄弟节点,find_next_siblings()可以迭代查出所有的兄弟节点，find_next_sibling()只能查出符合条件的第一个兄弟节点

print(soup.i.find_next_siblings("a"))
print(soup.i.find_next_sibling("a"))
'''
result:
[综艺]
综艺
'''

find_all_next() 和 find_next()

用来查找当前节点后面的节点

print(soup.i.find_all_next())
print(soup.i.find_next())
'''
result:
[综艺, 综 艺
, ]
综艺
'''

find_all_previous() 和 find_previous()

查找当前节点前面的节点

print(soup.title.find_all_previous())
print(soup.title.find_previous())
'''
result:
[, 

王牌对王牌4之姚晨沙溢再聚同福客栈
, 


王牌对王牌4之姚晨沙溢再聚同福客栈






综艺



]

'''

CSS选择器

使用 .select() 方法传入字符串参数即可查找

#通过tag来查找
print(soup.select('a'))
'''
result:
[综艺]
'''

#通过id来查找
print(soup.select('#nav_logo'))
'''
result:
[

综艺
]
'''

#通过class来查找
print(soup.select('.qy-logo'))
'''
result:
[

综艺
]
'''

#通过属性的值来查找
print(soup.select('div[style="display:none;"]'))
'''
result:
[]
'''

修改文档树

使用例子：

from bs4 import BeautifulSoup

soup = BeautifulSoup('''


 
    
    王牌对王牌4之姚晨沙溢再聚同福客栈
 
 

    
    
            
            综艺
            
            
           
 
''')

修改tag的名称和属性

tag = soup.i
print(tag)
tag.name = "a"
print(tag)
tag['class']='logo'
print(tag)
del tag['class']
print(tag)
'''
result:




'''

修改 .string

tag = soup.h2
print(tag)
tag.string = "zongyi"
print(tag)
'''
result:
综艺
zongyi
'''

append()

用于往字符串中追加内容

tag = soup.h2
print(tag)
tag.append(" hhhh ")
print(tag)
'''
result:
综艺
综艺 hhhh 
'''

BeautifulSoup.new_string() 和 .new_tag()

#new_string()方法是BeautifulSoup对象的，不是tag的
s1 = BeautifulSoup("")
tag = s1.b
print(tag)
tag.append(s1.new_string(" test "))
print(tag)
'''
result:
  s1 = BeautifulSoup("")

 test 
'''

#添加注释
s1 = BeautifulSoup("")
tag = s1.b
print(tag)
from bs4 import Comment
comment = s1.new_string("1 2 3",Comment)
tag.append(comment)
print(tag)
'''
result:
  s1 = BeautifulSoup("")


'''

#添加新的节点
s1 = BeautifulSoup("")
tag = s1.b
print(tag)
new_tag = s1.new_tag("a",href="http://www.baidu.com")
tag.append(new_tag)
print(tag)
'''
result:
  s1 = BeautifulSoup("")


'''

插入

# insert()
tag = soup.a
tag.insert(0," hello ")
print(tag)
tag.insert(2," world ")
print(tag)
'''
result:
 hello 综艺
 hello 综艺
 world 
'''

# insert_before()
tag = soup.a
tag1 = soup.i
tag1.string = "hello"
tag.string.insert_before(tag1)
print(tag)
'''
result:
hello综艺
'''

# insert_after()
tag = soup.a
tag1 = soup.i
tag1.string = "hello"
tag.string.insert_after(tag1)
print(tag)
'''
result:
综艺hello
'''

clear()

用于移除当前节点的内容

tag = soup.a
print(tag)
tag.clear()
print(tag)
'''
result:
综艺

'''

extract()

将当前节点移除文档树

tag = soup.a
print(tag)
h_tag = tag.h2.extract()
print(tag)
print(h_tag)
'''
result:
综艺

综艺
'''

decompose()

将当前节点移除文档树并完全销毁

tag = soup.a
print(tag)
tag.h2.decompose()
print(tag)
'''
result:
综艺

'''

replace_with()

用新tag或文本节点替换文档树的部分内容

tag = soup.a
print(tag)
new_tag = soup.new_tag("b")
new_tag.string = "test"
tag.h2.replace_with(new_tag)
print(tag)
'''
result:
综艺
test
'''

wrap() 和 unwrap()

对指定元素进行包装和解包

# wrap()
tag = BeautifulSoup("I wish I was bold.
")
print(tag)
tag.string.wrap(tag.new_tag("b"))
print(tag)
'''
result:
  tag = BeautifulSoup("I wish I was bold.")
I wish I was bold.
I wish I was bold.
'''

#unwrap()
tag = BeautifulSoup("I wish I was bold.
")
print(tag)
tag.string.wrap(tag.new_tag("b"))
print(tag)
tag.b.unwrap()
print(tag)
'''
result:
  tag = BeautifulSoup("I wish I was bold.")
I wish I was bold.
I wish I was bold.
I wish I was bold.
'''

最后

以上是我通过BeautifulSoup4文档学习BeautifulSoup4的过程，可能有些地方写的不够详细，但仍希望对其他初学者有帮助，若想了解更多，请参考Beautiful Soup Documentation

你可能感兴趣的:(Python)

Python笔记——DeprecationWarning 小橘猫cate Python python 开发语言
定义如下阶跃函数时出现警告，defstep_function(x):returnnp.array(x>0,dtype=np.int)DeprecationWarning:`np.int`isadeprecatedaliasforthebuiltin`int`.Tosilencethiswarning,use`int`byitself.Doingthiswillnotmodifyanybehavio
使用 ArcGIS 和 Python 进行地理信息系统(GIS)分析 scaFHIO arcgis python java
在本篇文章中，我们将探讨如何利用ArcGIS和Python进行地理信息系统(GIS)分析。ArcGIS是由Esri开发和维护的一系列GIS软件，包括客户端、服务器和在线解决方案。本文主要聚焦于如何使用Python和arcgis库来实现GIS功能。技术背景介绍ArcGIS提供了功能强大的工具来进行矢量和栅格分析、地理编码、地图制作以及路线和路径规划。通过arcgisPython库，我们可以访问Esr
DeprecationWarning: 无效的转义序列‘\/‘解决方案数据科学智慧 linux 运维服务器 Python
DeprecationWarning:无效的转义序列’/'解决方案在Python编程中，您可能会遇到"DeprecationWarning:无效的转义序列’/'"的警告消息。这个警告通常在您尝试使用无效的转义序列时出现，例如在正则表达式或字符串中。本文将为您提供解决方案，以解决这个问题。首先，让我们了解一下转义序列的概念。在Python中，某些字符前面带有反斜杠（\），以表示特殊含义，例如换行符（
python做飞机大战让敌机打子弹_python（pygame）滑稽大战(类似飞机大战) 教程青云若水
初始准备工作本项目使用的python3版本(如果你用python2，我不知会怎么样)Ide推荐大家选择pycharm(不同ide应该没影响)需要安装第三方库pygame，pygame安装方法(windows电脑，mac系统本人实测与pygame不兼容，强行运行本项目卡成ppt)电脑打开cmd命令窗口，输入pip3installpygame补充说明:由于众所周知的原因，安装过程中下载可能十分缓慢，甚
利用Python和深度学习方法实现手写数字识别的高精度解决方案——从数据预处理到模型优化的全流程解析快撑死的鱼 Python算法精解 python 深度学习开发语言
利用Python和深度学习方法实现手写数字识别的高精度解决方案——从数据预处理到模型优化的全流程解析在人工智能的众多应用领域中，手写数字识别是一项经典且具有重要实际应用价值的任务。随着深度学习技术的飞速发展，通过构建和训练神经网络模型，手写数字识别的精度已经可以达到99%以上。本文将以Python为主要编程语言，结合深度学习的核心技术，详细解析手写数字识别的实现过程，并探讨如何进一步优化模型以提高
python之连连看游戏 CrMylive. python 游戏 pygame
实现一个简单的连连看游戏需要用到pygame库和一些基本的数据结构和算法。导入pygame库在程序开始之前，首先需要导入pygame库。在Python中，可以使用以下代码导入pygame库：importpygame初始化Pygame在导入pygame库之后，需要使用以下代码初始化pygame：pygame.init()设置游戏窗口设置游戏窗口的大小、标题等属性。可以使用以下代码设置游戏窗口大小为6
Python, Java, C ++开发全球热能动态监测APP Geeker-2025 python java c++
开发一个“全球热能动态监测APP”是一个非常有意义的想法，尤其是在能源管理和环境保护领域。以下是开发该APP的详细思路和技术实现方案，分别针对Python、Java和C++。---###**功能需求分析**1.**全球热能数据展示**：-各国或地区的热能生产、消费和进出口数据。-实时监测热能动态（如发电厂的热能输出、温度变化等）。2.**地图可视化**：-在地图上标注热能发电厂的位置。-使用颜色或
动物识别系统代码python_动物识别系统__代码 weixin_39812065 动物识别系统代码python
1动物识别专家系统动物识别专家系统是流行的专家系统实验模型，它用产生式规则来表示知识，共15条规则、可以识别七种动物，这些规则既少又简单，可以改造他们，也可以加进新的规则，还可以用来识别其他东西的新规则来取代这些规则。动物识别15条规则的中文表示是：规则1：如果：动物有毛发则：该动物是哺乳动物规则2：如果：动物有奶则：该单位是哺乳动物规则3:如果：该动物有羽毛则：该动物是鸟规则4：如果：动物会飞，
动物识别系统代码python_动物识别系统代码 weixin_39862794 动物识别系统代码python
简易动物识别专家系统源代码（调试无错！）#includevoidbirds(){inta;printf("**************************************\n");printf("1.长腿，长脖子，黑色，不会飞。\n");printf("2.不会飞，会游泳，黑色.\n");printf("3.善飞\n");printf("4.无上述特征\n");printf("****
Python深浅拷贝 Karl_zhujt Python python
文章目录1概述2数据类型2.1可变类型2.2不可变类型3深浅拷贝3.1浅拷贝3.2深拷贝4深浅拷贝对数据类型的影响4.1对于不可变类型的影响4.2对于可变类型的影响4.3总结5实现机制5.1copy5.2id6示例6.1普通赋值6.2浅拷贝可变类型6.3浅拷贝不可变类型6.4深拷贝可变类型6.5深拷贝不可变类型7注意事项1概述在Python中，可变类型和不可变类型的拷贝行为有所不同。理解它们的区别
基于 EMA12 指标结合 iTick 外汇报价 API 、股票报价API、指数报价API的量化策略编写与回测
iTick提供了强大的外汇报价API、股票报价API和指数报价API服务，为量化策略的开发提供了丰富的数据支持。本文将详细介绍如何使用Python结合EMA12指标和iTick的报价API来构建一个简单的量化交易策略，并对该策略进行回测。1.引言在量化交易领域，技术指标是构建交易策略的重要基础。iTick提供了强大的外汇报价API、股票报价API和指数报价API服务，为量化策略的开发提供了丰富的数
python动物识别系统(仅有识别功能) OnlySecondS
''@Time:2022/03/298:39@Author:11863@File:AIS_main.py@software:PyCharm'''rules={}#以字典形式存储#读取文件defreadRules():rulesFile=open("rules.txt","r",encoding='utf-8')forlineinrulesFile:#按行读取line=line.replace('I
深度优先搜索和广度优先搜索详细解析和区别潇杨爱吃粉深度优先宽度优先算法数据结构
一、深度优先搜索（DFS）1.核心思想像探险家走迷宫，遇到岔路就选一条路走到头，无路可走时返回上一个岔路口换另一条路。2.实现方式数据结构：栈（Stack，先进后出）或递归（隐式栈）遍历顺序：纵向深入，优先访问最深层的节点3.图解示例假设有以下树结构：A/\BC/\/DEFDFS遍历顺序（从根节点A出发）：A→B→D→E→C→F4.代码实现（Python）defdfs(graph,start):s
DeepSeek 模型未来怎么走？技术创新、行业落地全解析！网罗开发 AI 大模型人工智能人工智能职场和发展
网罗开发（小红书、快手、视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者：《ESP32-C3物联网工程开发实战》图书作者：《SwiftUI入门，进阶与实战》超级个体：CO
Python-modbustcp通信-plc读写张凯的工作室 python python
Python-modbustcp通信-plc读写1，功能码说明读取：%m对应READ_COILS线圈寄存器数值0和1%mw存单字节%mf浮点数%md双字节对应READ_HOLDING_REGISTERS保持寄存器写入单个写入线圈寄存器WRITE_SINGLE_COIL%m单个写入保持寄存器WRITE_SINGLE_REGISTER写入多个保持寄存器WRITE_MULTIPLE_REGISTERS写
PyCharm v2024.3.5 强大的Python IDE工具支持M、Intel芯片 2401_89264762 python ide pycharm
PyCharm是一种PythonIDE，带有一整套可以帮助用户在使用Python语言开发时提高其效率的工具，比如调试、语法高亮、Project管理、代码跳转、智能提示、自动完成、单元测试、版本控制。此外，该IDE提供了一些高级功能，以用于支持Django框架下的专业Web开发。应用介绍PyCharm是由JetBrains打造的一款PythonIDE，VS2010的重构插件Resharper就是出自
免费界面库 python_一个非常简单好用的Python图形界面库(PysimpleGUI) 不妧免费界面库 python
前一阵，我在为朋友编写一个源代码监控程序的时候，发现了一个Python领域非常简单好用的图形界面库。说起图形界面库，你可能会想到TkInter、PyQt、PyGUI等流行的图形界面库，我也曾经尝试使用，一个很直观的感受就是，这太难用了。就去网上搜搜，看看有没有一些demo，拿来改改，结果很少有，当时我就放弃了这些图形库的学习，转而使用了vue+flask的形式以浏览器网页作为程序界面，因为我会这个
Python 网络爬虫：从入门到实践一ge科研小菜菜编程语言 Python python
个人主页：一ge科研小菜鸡-CSDN博客期待您的关注网络爬虫是一种自动化的程序，用于从互联网上抓取数据。Python以其强大的库和简单的语法，是开发网络爬虫的绝佳选择。本文将详细介绍Python网络爬虫的基本原理、开发工具、常用框架以及实践案例。一、网络爬虫的基本原理网络爬虫的工作流程通常包括以下步骤：发送请求：向目标网站发送HTTP请求，获取网页内容。解析内容：提取需要的数据，可以是HTML标签
PySimpleGUI 4.60.5 孔帆贝
PySimpleGUI4.60.5【下载地址】PySimpleGUI4.60.5**PySimpleGUI**是一款专为简化PythonGUI（图形用户界面）编程而生的库。该库设计宗旨在于通过提供简洁、易懂的API接口，使开发者能够以更快的速度和更少的代码量创建出美观实用的应用程序。对于无论是GUI编程新手还是寻求快速开发工具的老手来说，PySimpleGUI都是一个极具吸引力的选择。其通过封装了
《今日AI-人工智能-编程日报》-源自2025年3月19日小亦编辑部每日AI-人工智能-编程日报人工智能
1.豆包AI编程功能迎来三项重磅升级豆包平台今日宣布其AI编程功能迎来三项重要升级，包括：HTML实时预览：支持用户在编写HTML代码时实时查看网页效果，显著提升前端开发效率，尤其适用于小游戏和网页制作。Python代码直接运行与一键修复：用户可直接运行Python代码，并在出错时一键修复，极大降低了编程门槛，提升了开发效率。生成完整项目：新增生成完整项目的功能，帮助用户快速创建应用程序，缩短开发
python PySimpleGUI 使用 Seeklike python
#PySimpleGUI库快速简单构建一个gui窗口#PySimpleGUI是一个用于简化GUI编程的Python包，它封装了多种底层GUI框架（如tkinter、Qt、WxPython等），提供了简单易用的API。#PySimpleGUI包含了大量的控件（也称为小部件或组件），这些控件可以帮助你快速构建用户界面#导包importPySimpleGUIassgimportcv2importkeyb
2024年最全Python二级考试试题汇总（史上最全） 2401_84584831 程序员 python 开发语言算法
C‘1,2,3,4,5,’D1,2,3,4,5,正确答案：D以下程序的输出结果是：a=30b=1ifa>=10:a=20elifa>=20:a=30elifa>=30:b=aelse:b=0print(‘a={},b={}’.format(a,b))Aa=30,b=1Ba=30,b=30Ca=20,b=20Da=20,b=1正确答案：D以下程序的输出结果是：s=‘’try:foriinrange(
如何通过Python实现自动化任务：从入门到实践小弟有话说1.0 python 自动化开发语言
在当今快节奏的数字化时代，自动化技术正逐渐成为提高工作效率的利器。无论是处理重复性任务，还是管理复杂的工作流程，自动化都能为我们节省大量时间和精力。本文将以Python为例，带你从零开始学习如何实现自动化任务，并通过一个实际案例展示其强大功能。一、为什么选择Python实现自动化？Python作为一种简单易学、功能强大的编程语言，已经成为自动化领域的首选工具。以下是Python在自动化中的几大优势
2024年Python最新Python二级考试试题汇总（史上最全）_计算机二级python真题 2301_82243979 程序员 python 开发语言前端
表达式1001==0x3e7的结果是：AfalseBFalseCtrueDTrue正确答案：B以下选项，不是Python保留字的选项是：AdelBpassCnotDstring正确答案：D表达式eval(‘500/10’)的结果是：A‘500/10’B500/10C50D50.0正确答案：D表达式type(eval(‘45’))的结果是：ABCNoneD正确答案：D表达式divmod(20,3)的
Python点名器代码及打包教程羽落惊鸿TQ python 开发语言
接下来再写一个功能性齐全稍微复杂一点的Python点名器程序，在原简易版的基础上增加历史记录功能、支持多种名单格式（CSV/Excel）、增加点名统计功能，并详细说明了将该程序打包成exe可执行文件的方法，以下是源代码，仅供学习参考：importtkinterastkfromtkinterimportttk, messagebox, filedialogimportrandomimportcsvi
基于python+django的旅游信息网站-旅游景点门票管理系统源码+运行步骤冷琴1996 Python系统设计 python django 旅游
该系统是基于python+django开发的旅游景点门票管理系统。是给师弟做的课程作业。大家学习过程中，遇到问题可以在github咨询作者。学习过程问题可以留言哦演示地址前台地址：http://travel.gitapp.cn后台地址：http://travel.gitapp.cn/admin后台管理帐号：用户名：admin123密码：admin123源码地址https://github.com/
50个常见的python毕业设计/课程设计（源码+文档）冷琴1996 Python系统设计 python 课程设计开发语言
计算机课程设计/毕业设计指南，为计算机相关专业毕业生提供源码、数据库安装、远程调试等相关服务，提供功能讲解视频。下面是50个基于python/django/vue的毕业设计/课程设计。1.网上商城系统这是一个基于python+vue开发的商城网站，平台采用B/S结构，后端采用主流的Python语言进行开发，前端采用主流的Vue.js进行开发。整个平台包括前台和后台两个部分。前台功能包括：首页、商品
分享Python7个爬虫小案例（附源码）人工智能-猫猫爬虫 python 开发语言
在这篇文章中，我们将分享7个Python爬虫的小案例，帮助大家更好地学习和了解Python爬虫的基础知识。以下是每个案例的简介和源代码：1.爬取豆瓣电影Top250这个案例使用BeautifulSoup库爬取豆瓣电影Top250的电影名称、评分和评价人数等信息，并将这些信息保存到CSV文件中。importrequestsfrombs4importBeautifulSoupimportcsv#请求U
后端框架模块化 GIS程序媛—椰子后端
后端框架的模块化设计旨在简化开发流程、提高可维护性，并通过分层解耦降低复杂性。以下是常见的后端模块及其在不同语言（Node.js、Java、Python）中的实现方式：目录1.路由（Routing）2.中间件（Middleware）3.数据库与ORM（models）4.迁移（Migration）5.服务层（ServiceLayer）6.配置管理（Configuration）7.依赖注入（DI）8.
Pyhton 基础 368. python python 开发语言
初识PythonPython是一种解释型语言Python使用缩进对齐组织代码执行，所以没有缩进的代码，都会在载入时自动执行数据类型：整形int无限大浮点型float小数复数complex由实数和虚数组成Python中有6个标准的数据类型：Number(数字)String(字符串)List(列表)Tuple(元组)Sets(集合)Dictionart(字典)其中不可变得数据：Number(数字)St
ASM系列五利用TreeApi 解析生成Class lijingyao8206 ASM 字节码动态生成 ClassNode TreeAPI
前面CoreApi的介绍部分基本涵盖了ASMCore包下面的主要API及功能，其中还有一部分关于MetaData的解析和生成就不再赘述。这篇开始介绍ASM另一部分主要的Api。TreeApi。这一部分源码是关联的asm-tree-5.0.4的版本。在介绍前，先要知道一点， Tree工程的接口基本可以完
链表树——复合数据结构应用实例 bardo 数据结构树型结构表结构设计链表菜单排序
我们清楚：数据库设计中，表结构设计的好坏，直接影响程序的复杂度。所以，本文就无限级分类（目录）树与链表的复合在表设计中的应用进行探讨。当然，什么是树，什么是链表，这里不作介绍。有兴趣可以去看相关的教材。需求简介：经常遇到这样的需求，我们希望能将保存在数据库中的树结构能够按确定的顺序读出来。比如，多级菜单、组织结构、商品分类。更具体的，我们希望某个二级菜单在这一级别中就是第一个。虽然它是最后
为啥要用位运算代替取模呢 chenchao051 位运算哈希汇编
在hash中查找key的时候，经常会发现用&取代%，先看两段代码吧， JDK6中的HashMap中的indexFor方法： /** * Returns index for hash code h. */ static int indexFor(int h, int length) {
最近的情况麦田的设计者生活感悟计划软考想
今天是2015年4月27号整理一下最近的思绪以及要完成的任务 1、最近在驾校科目二练车，每周四天，练三周。其实做什么都要用心，追求合理的途径解决。为
PHP去掉字符串中最后一个字符的方法 IT独行者 PHP 字符串
今天在PHP项目开发中遇到一个需求，去掉字符串中的最后一个字符原字符串1,2,3,4,5,6, 去掉最后一个字符","，最终结果为1,2,3,4,5,6 代码如下： $str = "1,2,3,4,5,6,"; $newstr = substr($str,0,strlen($str)-1); echo $newstr;
hadoop在linux上单机安装过程 _wy_ linux hadoop
1、安装JDK jdk版本最好是1.6以上，可以使用执行命令java -version查看当前JAVA版本号，如果报命令不存在或版本比较低，则需要安装一个高版本的JDK，并在/etc/profile的文件末尾，根据本机JDK实际的安装位置加上以下几行： export JAVA_HOME=/usr/java/jdk1.7.0_25
JAVA进阶----分布式事务的一种简单处理方法无量多系统交互分布式事务
每个方法都是原子操作：提供第三方服务的系统，要同时提供执行方法和对应的回滚方法 A系统调用B,C,D系统完成分布式事务 =========执行开始======== A.aa(); try { B.bb(); } catch(Exception e) { A.rollbackAa(); } try { C.cc(); } catch(Excep
安墨移动广告：移动DSP厚积薄发引领未来广告业发展命脉矮蛋蛋 hadoop 互联网
　　“谁掌握了强大的DSP技术，谁将引领未来的广告行业发展命脉。”2014年，移动广告行业的热点非移动DSP莫属。各个圈子都在纷纷谈论，认为移动DSP是行业突破点，一时间许多移动广告联盟风起云涌，竞相推出专属移动DSP产品。　　到底什么是移动DSP呢? 　　DSP(Demand-SidePlatform)，就是需求方平台，为解决广告主投放的各种需求，真正实现人群定位的精准广
myelipse设置 alafqq IP
在一个项目的完整的生命周期中，其维护费用，往往是其开发费用的数倍。因此项目的可维护性、可复用性是衡量一个项目好坏的关键。而注释则是可维护性中必不可少的一环。注释模板导入步骤安装方法：打开eclipse/myeclipse 选择 window-->Preferences-->JAVA-->Code-->Code
java数组百合不是茶 java数组
java数组的声明创建初始化； java支持C语言数组中的每个数都有唯一的一个下标一维数组的定义声明： int[] a = new int[3];声明数组中有三个数int[3] int[] a 中有三个数，下标从0开始，可以同过for来遍历数组中的数
javascript读取表单数据 bijian1013 JavaScript
利用javascript读取表单数据，可以利用以下三种方法获取： 1、通过表单ID属性：var a = document.getElementByIdx_x_x("id"); 2、通过表单名称属性：var b = document.getElementsByName("name"); 3、直接通过表单名字获取：var c = form.content.
探索JUnit4扩展：使用Theory bijian1013 java JUnit Theory
理论机制（Theory）一.为什么要引用理论机制（Theory）当今软件开发中，测试驱动开发（TDD — Test-driven development）越发流行。为什么 TDD 会如此流行呢？因为它确实拥有很多优点，它允许开发人员通过简单的例子来指定和表明他们代码的行为意图。 TDD 的优点： &nb
[Spring Data Mongo一]Spring Mongo Template操作MongoDB bit1129 template
什么是Spring Data Mongo Spring Data MongoDB项目对访问MongoDB的Java客户端API进行了封装，这种封装类似于Spring封装Hibernate和JDBC而提供的HibernateTemplate和JDBCTemplate，主要能力包括 1. 封装客户端跟MongoDB的链接管理 2. 文档-对象映射，通过注解:@Document(collectio
【Kafka八】Zookeeper上关于Kafka的配置信息 bit1129 zookeeper
问题： 1. Kafka的哪些信息记录在Zookeeper中 2. Consumer Group消费的每个Partition的Offset信息存放在什么位置 3. Topic的每个Partition存放在哪个Broker上的信息存放在哪里 4. Producer跟Zookeeper究竟有没有关系？没有关系！！！ //consumers、config、brokers、cont
java OOM内存异常的四种类型及异常与解决方案 ronin47 java OOM 内存异常
　OOM异常的四种类型：　　　　　一：　StackOverflowError ：通常因为递归函数引起（死递归，递归太深）。-Xss 128k 一般够用。　二：　out Of memory: PermGen Space：通常是动态类大多，比如web 服务器自动更新部署时引起。-Xmx
java-实现链表反转-递归和非递归实现 bylijinnan java
20120422更新：对链表中部分节点进行反转操作，这些节点相隔k个： 0->1->2->3->4->5->6->7->8->9 k=2 8->1->6->3->4->5->2->7->0->9 注意1 3 5 7 9 位置是不变的。解法：将链表拆成两部分： a.0-&
Netty源码学习-DelimiterBasedFrameDecoder bylijinnan java netty
看DelimiterBasedFrameDecoder的API，有举例：接收到的ChannelBuffer如下： +--------------+ | ABC\nDEF\r\n | +--------------+ 经过DelimiterBasedFrameDecoder(Delimiters.lineDelimiter())之后，得到： +-----+----
linux的一些命令 -查看cc攻击-网口ip统计等 hotsunshine linux
Linux判断CC攻击命令详解 2011年12月23日 ⁄ 安全 ⁄ 暂无评论查看所有80端口的连接数 netstat -nat|grep -i '80'|wc -l 对连接的IP按连接数量进行排序 netstat -ntu | awk '{print $5}' | cut -d: -f1 | sort | uniq -c | sort -n 查看TCP连接状态 n
Spring获取SessionFactory ctrain sessionFactory
String sql = "select sysdate from dual"; WebApplicationContext wac = ContextLoader.getCurrentWebApplicationContext(); String[] names = wac.getBeanDefinitionNames(); for(int i=0; i&
Hive几种导出数据方式 daizj hive 数据导出
Hive几种导出数据方式 1.拷贝文件如果数据文件恰好是用户需要的格式，那么只需要拷贝文件或文件夹就可以。 hadoop fs –cp source_path target_path 2.导出到本地文件系统 --不能使用insert into local directory来导出数据，会报错 --只能使用
编程之美 dcj3sjt126com 编程 PHP 重构
我个人的 PHP 编程经验中，递归调用常常与静态变量使用。静态变量的含义可以参考 PHP 手册。希望下面的代码，会更有利于对递归以及静态变量的理解 header("Content-type: text/plain"); function static_function () { static $i = 0; if ($i++ < 1
Android保存用户名和密码 dcj3sjt126com android
转自：http://www.2cto.com/kf/201401/272336.html 我们不管在开发一个项目或者使用别人的项目，都有用户登录功能，为了让用户的体验效果更好，我们通常会做一个功能，叫做保存用户，这样做的目地就是为了让用户下一次再使用该程序不会重新输入用户名和密码，这里我使用3种方式来存储用户名和密码 1、通过普通的txt文本存储 2、通过properties属性文件进行存
Oracle 复习笔记之同义词 eksliang Oracle 同义词 Oracle synonym
转载请出自出处：http://eksliang.iteye.com/blog/2098861 1.什么是同义词同义词是现有模式对象的一个别名。概念性的东西，什么是模式呢？创建一个用户，就相应的创建了一个模式。模式是指数据库对象，是对用户所创建的数据对象的总称。模式对象包括表、视图、索引、同义词、序列、过
Ajax案例 gongmeitao Ajax jsp
数据库采用Sql Server2005 项目名称为:Ajax_Demo 1.com.demo.conn包 package com.demo.conn; import java.sql.Connection;import java.sql.DriverManager;import java.sql.SQLException; //获取数据库连接的类public class DBConnec
ASP.NET中Request.RawUrl、Request.Url的区别 hvt .net Web C#asp.net hovertree
如果访问的地址是：http://h.keleyi.com/guestbook/addmessage.aspx?key=hovertree%3C&n=myslider#zonemenu那么Request.Url.ToString() 的值是：http://h.keleyi.com/guestbook/addmessage.aspx?key=hovertree<&
SVG 教程（七）SVG 实例，SVG 参考手册天梯梦 svg
SVG 实例在线实例下面的例子是把SVG代码直接嵌入到HTML代码中。谷歌Chrome，火狐，Internet Explorer9，和Safari都支持。注意：下面的例子将不会在Opera运行，即使Opera支持SVG - 它也不支持SVG在HTML代码中直接使用。 SVG 实例 SVG基本形状一个圆矩形不透明矩形一个矩形不透明2 一个带圆角矩
事务管理 luyulong java spring 编程事务
事物管理 spring事物的好处为不同的事物API提供了一致的编程模型支持声明式事务管理提供比大多数事务API更简单更易于使用的编程式事务管理API 整合spring的各种数据访问抽象 TransactionDefinition 定义了事务策略 int getIsolationLevel()得到当前事务的隔离级别 READ_COMMITTED
基础数据结构和算法十一：Red-black binary search tree sunwinner Algorithm Red-black
The insertion algorithm for 2-3 trees just described is not difficult to understand; now, we will see that it is also not difficult to implement. We will consider a simple representation known
centos同步时间 stunizhengjia linux 集群同步时间
做了集群，时间的同步就显得非常必要了。以下是查到的如何做时间同步。在CentOS 5不再区分客户端和服务器，只要配置了NTP，它就会提供NTP服务。 1)确认已经ntp程序包： # yum install ntp 2)配置时间源（默认就行，不需要修改） # vi /etc/ntp.conf server pool.ntp.o
ITeye 9月技术图书有奖试读获奖名单公布 ITeye管理员 ITeye
ITeye携手博文视点举办的9月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 9月试读活动回顾：http://webmaster.iteye.com/blog/2118112本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《NFC：Arduino、Andro

BeautifulSoup4的介绍与使用

BeautifulSoup4 的使用

BeautifulSoup的简介

BeautifulSoup4的安装

安装

出现的问题

安装解析器

BeautifulSoup4的使用

使用

对象的种类

Tag

NavigableString

BeautifulSoup

Comment

遍历文档树

综艺

子节点

tagName

综艺

综艺

综艺

.contents和.children

.contents

.children

.descendants

.string

.strings

.stripped_strings

父节点

.parent

.parents

兄弟节点

.next_sibling和.previous_sibling

综艺

.next_siblings和.previous_siblings

综艺

前进和回退

.next_element 和 .previous_element

综艺

.next_elements 和 .previous_elements

综艺

搜索文档树

综艺

find_all()

综艺

综艺

综艺

综艺

综艺

综艺

find()

过滤器

字符串

综艺

正则表达式

列表

综艺

True

方法

综艺

find_parents()和find_parent()

综艺

综艺

find_next_siblings()和find_next_sibling()

综艺

综艺

find_all_next() 和 find_next()

综艺

综 艺

综艺

find_all_previous() 和 find_previous()

综艺

CSS选择器

综艺

综艺

综艺

修改文档树

综艺

修改tag的名称和属性

修改 .string

综艺