不怕猫的耗子A

Python：处理XML文件

Python XML解析

什么是XML

1、XML指可扩展标记语言（eXtensible Markup Language）

2、XML 设计用来传输和存储数据

3、XML是一种允许用户对自己的标记语言进行定义的源语言

XML语法规则

1、所有的元素都必须有开始标签和结束标签，省略结束标签是非法的(在HTML中结束标签是可以省略的)

2、大小写敏感，大小写不一致时表示两个不同的标签

3、xml文档必须有根元素

4、XML必须正确嵌套，父元素必须完全包住子元素

5、XML属性值必须加引号，元素的属性值都是一个键值对形式

XML命名规则

1、名称可以包含字母、数字以及其他字符

2、名称不能以数字或标点符号开头

3、名称不能以字母xml或XML开始

4、名称不能包含空格，但可以使用任何名称，没有保留字

5、名称应该具有描述性，简短和简单，可以同时使用下划线。

6、避免“-”、“.”、“：”等字符

7、Xml的注释格式：

Python对XML的解析

Python 有三种方法解析XML，SAX，DOM，以及ElementTree
   ⑴SAX：Python标准库包含SAX解析器，SAX用事件驱动模型，通过在解析XML的过程中触发一个个的事件并调用用户定义的回调函数来处理XML文件
   ⑵DOM：将XML数据在内存中解析成一个树，通过对树的操作来操作XML
   ⑶ElementTree：一个轻量级的DOM，具有方便友好的API。代码可用性好，速度快，消耗内存少

注：
1、DOM需要将XML数据映射到内存中的树，一是比较慢，二是比较耗内存，

2、SAX流式读取XML文件，比较快，占用内存少，但需要用户实现回调函数

3、ElementTree具有方便友好的API。代码可用性好，速度快，消耗内存少。因此我就只了解了这种解析方式

例1：XML示例

注：它有如下特
1、首先，它是有标签对组成，例如：

2、标签可以有属性：

3、标签对可以嵌入数据：abc

4、标签可以嵌入子标签（具有层级关系）

5、在这个例子中data标签就是跟标签(元素)：它是最外层的标签，其里面包含了各种子标签、孙标签等

6、当然标签对的属性、值(标签对中间的数据)，是可以选择没有的，没有值的标签表示空标签对

7、xml文件可以理解为一个树结构，有根结点，子结点的概念。每个结点元素（element）包含结点名（tag）、属性值（atrrib）和文本（text）

Python解析HTML文件

1、因为前面学习了下Python解析HTML文件。Python解析HTML文件使用的BeautifulSoup库。这个库前面有专门的介绍，并且当时也说过也可以使用这个库来解析XML文档的

2、其实我感觉有时使用BeautifulSoup库来解析XML文件比使用ElementTree库来解析XML方便点。只是说BeautifulSoup库在处理的XML文档可能跟XML规则有点出入。比如使用BeautifulSoup库创建XML时会出现省略结束标签的问题

3、所以现在又专门来了解了下使用ElementTree库来解析XML，毕竟这个库是专门用来解析XML文件的

例2：使用BeautifulSoup库解析XML

from bs4 import BeautifulSoup

html = """

 
  20200706  
   
    1  
    2008  
    141100  
      
     
    

"""

soup = BeautifulSoup(html,'xml')    #使用xml解析器，将一个文件或字符串转为BeautifulSoup对象
#print(type(soup)) #返回一个
#print(soup.prettify()) #格式化输出HTML文件

tag_year = soup.find_all("year") #find_all()方法返回文档中全部的year标签组成的列表
print("year标签对有：",tag_year)
for i in tag_year:
    print("返回的a标签类型为：",type(i))#返回的是一个字符串型的Tag对象，可以直接使用str()方法进行强转换
    print(i.name)   #通过Tag对象的name属性来获得标签的名字
    print(i.attrs)  #通过Tag对象的attrs属性来获得标签的属性(为属性名与属性值组成的字典)
    print(i.string) #通过Tag对象的string属性来获得标签对中的数据(值)

"""
year标签对有： [2008]
返回的a标签类型为： 
year
{'type': 'year'}
2008
"""

注：
1、其实只是简单的解析下THML文档或XML文档的话，这个例子中的这些方法或属性应该就够了，感觉平时用到最多的也就只有这么几个
   ⑴BeautifulSoup()：用来创建一个BeautifulSoup对象。这个是必须的，要解析的话，就必须将字符串HTML文档转为BeautifulSoup对象
   ⑵find_all()：用来搜索文档中所有符合条件的标签对(一个tag对象)。这里是根据标签名来进行搜索的
   ⑶Tag对象的name属性：返回指定Tag对象的标签名。这个意义不大，因为这里本来就是根据标签名来搜索的
   ⑷Tag对象的attrs属性：返回指定Tag对象的属性，返回值为一个字典
   ⑸Tag对象的string属性：返回指定Tag对象的值(标签对之间的数据)

2、感觉整个解析过程就是：soup对象->Tag对象->通过tag对象的name、attrs(string)属性来获取想要的

3、感觉使用ElementTree库来解析XML也是这个过程：一层一层的找下去，首先就是找到想要的标签对。只是说相对于使用BeautifulSoup库来解析有点差别

使用ElementTree解析XML文件

概述

1、XML树和元素：XML是一种固有的分层数据格式，最自然的表示方法是使用树。 ElementTree为此，有两个类：ElementTree和Element

2、在利用ElementTree解析XML文件的时候，有两个对象我们会用到：ElementTree和Element
   ⑴ElementTree代表了整个XML文档(将整个XML文档表示为树)
   ⑵Element代表了文档中的每个节点数据(表示此树中的单个节点)
   ⑶与整个文档的交互（读/写文件）通常在该ElementTree级别上进行。与单个XML元素及其子元素的交互在Element级别上完成
   ⑷当我们对XML文档进行解析时，主要考虑Element节点，通常一个节点具有以下属性：节点名称、节点属性、节点的文本、节点的子节点

ElementTree解析XML文件的过程

1、导入ElementTree

2、解析Xml文件找到根节点

2.1、解析字符串，root = ET.fromstring(country_data_as_string)

3、遍历根节点可以获得所有子节点，然后就可以根据需求拿到需要的字段了

注：
1、第三步是一次性获得根节点下所有的子节点，可能在实际是我们只需要其中的一部分节点的数据。特别是当XML文件较大或者其中的子节点tag非常多的时候，这样做就很不合适了

2、所以感觉更多的时候还是先找到符合条件的节点，然后再获得该节点的数据。而不是说一次性就获得全部节点的数据，然后再去查找我们需要的节点及其数据

解析：获得ElementTree对象

ElementTree模块提供了两种方式来获得ElementTree对象
⑴通过加载XML文件：使用parse()方法
⑵通过加载字符串型的XML：使用fromstring()方法

例3：加载XML文件

from xml.etree import ElementTree

tree = ElementTree.parse("F:\\test.xml") #加载xml文件
print(tree) #返回一个ElementTree对象,对应整个XML

root = tree.getroot() #获取根节点
print(root)  #返回一个Element对象(将整个xml看出一个节点)

"""


"""

例3_1：

from xml.etree import ElementTree

xml = """
 
  20200706  
   
    1  
    2008  
    141100  
      
     
    

"""
tree = ElementTree.fromstring(xml)
print(tree)   #直接返回一个Element对象：获取根节点

#

注：
1、通过上面例子可以看出：通过两种方式来加载XML文件还是有点区别的
⑴使用parse()方法加载XML文件，首先获得的是一个ElementTree对象，然后还需要通过getroot()才能获得根节点
⑵使用fromstring()方法加载XML的话，就是直接获得一个Element对象，这个对象也就是根节点

2、fromstring()将XML从字符串直接解析为Element，这是解析树的根元素。其他解析功能可能会创建一个ElementTree

例3_2：

from xml.etree import ElementTree

xml = """
 
  20200706  
   
    1  
    2008  
    141100  
      
     
    

"""
tree = ElementTree.fromstring(xml)
print(ElementTree.tostring(tree,encoding="unicode"))   #使用tostring()方法，来将一个Element对象转为字符串

"""
b' \n  20200706  \n   \n    1  \n    2008  \n    141100  \n      \n     \n    \n'
"""

注：
1、Element对象对应XML文件中的节点，这个对象是不能使用str()方法直接转为字符串型的。需要借助tostring()方法：来将一个Element对象转为字符串，并且还可以使用encoding参数来执行转换后的编码

2、这一点的话跟BeautifulSoup库有很大的区别：BeautifulSoup库获得一个节点后，其直接返回的是一个字符串型的Tag对象，并且可以直接使用str()方法进行强制转换

3、作为一个Element对象，本身是具有子元素，因此可以直接对Element进行迭代取值

例3_3：

from xml.etree import ElementTree

xml = """
 
  20200706  
   
    1  
    2008  
    141100  
      
     
    

"""
tree = ElementTree.fromstring(xml)
for child in tree:
    print(child.tag, child.attrib,child.text)
    
"""
time {} 20200706
country {'name': 'Liechtenstein'}  
    
"""

注：
1、这种遍历的话，只会遍历出当前节点的子节点：这个例子中使用根节点遍历的，根节点(data标签)下只有time和country两个子节点

2、这个例子中涉及到了Element对象的属性：tag、attrib、text，这三个属性后面具体介绍

3、country标签对中没有具体的值，其标签对之间是嵌套的其他的标签对，因此在使用text属性获得其值时，返回的是空格

4、记住一句话：在使用ElementTree库来解析XML(获得标签)时，始终是一层一层的往下找的，只有找到上一层后才能找到下一层
⑴这里也能BeautifulSoup库也有很大的区别：BeautifulSoup库是通过find()等方法查找标签时，不管标签在第几层，都能直接找到
⑵使用ElementTree库来解析XML的流程基本上也是：加载XML文件，找到根节点->根据根节点一层一层的往下找，直到直到我们需要的节点(标签)

5、当然，这个例子中我们是遍历的根节点，以此来获得根节点下的子节点的。如果我们想要找其他节点，如根节点下的孙节点，那该怎么办呢
⑴继续对子节点进行遍历：这种感觉应该也可以，不管应该很麻烦，就没尝试
⑵ElementTree库提供了find()和findall()方法来查找指定的标签节点

Element中的遍历与查询

find()方法

1、Element.find(path)：查找当前元素下tag或path能够匹配的首个直系节点

2、一般的话，都是根据节点名字去找节点的：find(节点名字)
例4：

xml = """

    20200706
    
        1
        2008
        141100
        
        
    
    
        4
        2011
        59900
        
    

"""
from xml.etree import ElementTree

tree = ElementTree.fromstring(xml)
#print(tree)
time =ElementTree.tostring(tree.find("time"),encoding="unicode")  #使用tostring()方法返回字符串型的标签对
print(time)
country  = tree.find("country")  #存在多个相同的节点时，返回第一个节点
print(country)

"""
20200706

"""

注：
1、find(path)：查找当前元素下tag或path能够匹配的首个直系节点

2、在查找节点时，不能跳着去找，不然会找不到，只能一层一层的往下找

3、总结的来说整个流程就是：加载XML文件->获得根节点->根据根节点一层一层的往下找直到找到我们需要的节点->根据节点属性(Element对象的属性)来获取我们想要的数据

例4_1：

xml = """

    20200706
    
        1
        2008
        141100
        
        
    

"""
from xml.etree import ElementTree

tree = ElementTree.fromstring(xml)
#print(tree)
year  = tree.find("year")  #tree是根节点，year是其孙节点：跳过父节点直接去找孙节点是找不到的
print(year)

country = tree.find("country") #先找到父节点，在根据父节点去找其下的子节点
year = country.find("year")
print(year)
"""
None

"""

findall()方法

1、Element.findall(path)：查找当前元素下tag或path能够匹配的直系节点

2、存在多个相同的子节点时，返回的是一个所有子节点组成的列表

例5：

xml = """

    20200706
    
        1
        2008
        141100
        
        
    
    
        4
        2011
        59900
        
    

"""
from xml.etree import ElementTree

tree = ElementTree.fromstring(xml)
#print(tree)
time = tree.findall("time")
print(time)  #f返回的是一个Element对象列表
for i in time:
    print(ElementTree.tostring(i,encoding="unicode"))  #使用tostring()方法返回字符串型的标签对

country  = tree.findall("country") #存在多个相同的节点时，返回的是一个列表
print(country)

"""
[]
20200706
[, ]
"""

例5_1：

xml = """

    20200706
    
        1
        2008
        141100
        
        
    
    
        4
        2011
        59900
        
    

"""
from xml.etree import ElementTree

tree = ElementTree.fromstring(xml)
rank  = tree.findall("rank") #tree为根节点，rank为它的孙节点，也不能跳过父节点去找
print(rank)

country = tree.findall("country")[0] #返回的是一个列表，因此可以使用索引
rank  = country.findall("rank") 
print(rank)
"""
[]
[]
"""

注：
与find()方法一样：findall()方法也不能跳着找

iter()方法

Element.iter(tag=None)：遍历该Element所有后代，也可以指定tag进行精确寻找

例6：

xml = """

    20200706
    
        1
        2008
        141100
        
        
    
    
        4
        2011
        59900
        
    

"""
from xml.etree import ElementTree

tree = ElementTree.fromstring(xml)
country = tree.findall("country")[0] #返回的是一个列表，因此可以使用索引

tags  = country.iter()   #返回某个节点下的所有子节点也包含节点本身
for i in tags:
    print(i)
    print(i.tag,i.attrib,i.text)
    
"""

country {'name': 'Liechtenstein'} 
        

rank {} 1

year {} 2008

gdppc {} 141100

neighbor {'direction': 'E', 'name': 'Austria'} None

neighbor {'direction': 'W', 'name': 'Switzerland'} None
"""

Element对象属性

1、Element对象提供了三种属性来分别获取一个Element对象(节点)的标签名、属性、值(标签对键的数据)

2、其实我们获取一个标签对象，最主要的还是想获得这个标签的属性、值(标签对键的数据)：text、attrib

3、方法：Element对象.属性名

属性名	说明
tag	标签
text	获得标签对之间的内容(当标签无值时返回None)
attrib	获取标签中的属性和属性值

例7：

xml = """

    20200706
    
        1
        2008
        141100
        
        
    

"""
from xml.etree import ElementTree

tree = ElementTree.fromstring(xml)
rank = tree.findall("country")[0].find("rank") #返回的是一个列表，因此可以使用索引
print("当前标签为：",rank)
print("标签的名字为：",rank.tag)  #返回标签的名字，类型为字符串
print("标签的属性为：",rank.attrib)    #返回标签的属性，类型为字典
print("标签的值为：",rank.text)   #返回标签的值，类型为字符串

"""
当前标签为： 
标签的名字为： rank
标签的属性为： {'type': 'number'}
标签的值为： 1
"""

针对属性的操作

前面说到标签的属性返回的是一组字典，因此可以使用字典的方式来对标签的属性进行一些操作

方法	说明
clear()	清空元素的后代、属性、text和tail也设置为None
get(key, default=None)	获取key对应的属性值，如该属性不存在则返回default值
items()	根据属性字典返回一个列表，列表元素为(key, value）
keys()	返回包含所有元素属性键的列表
set(key, value)	设置新的属性键与值

例8：

xml = """

    20200706
    
        1
        2008
        141100
        
        
    

"""
from xml.etree import ElementTree

tree = ElementTree.fromstring(xml)
rank = tree.findall("country")[0].find("rank") #返回的是一个列表，因此可以使用索引
rank_attrib = rank.attrib
print("标签的属性为：",rank_attrib)    #返回标签的属性，类型为字典
print(rank_attrib.items())


"""
标签的属性为： {'type': 'number'}
dict_items([('type', 'number')])
"""

创建xml文档

1、要使用ElementTree库来创建一个XML对象(文件)的话，主要会用到：Element()和SubElement()方法
⑴Element()方法：用于创建一个根节点
⑵SubElement()方法：用于创建一个节点下的子节点

2、同样的，在创建XML文件时，也是需要一层一层的往下创建：创建跟节点->创建第一层节点->创建第二层节点....

例9：函数源码

def SubElement(parent, tag, attrib={}, **extra):
    attrib = attrib.copy()
    attrib.update(extra)
    element = parent.makeelement(tag, attrib)
    parent.append(element)
    return element

注：
Element()方法和SubElement()方法的源码类似，上面是SubElement()方法的源码
   ⑴Element()方法：因为是创建的根元素，它是第一层标签对，因此它的第一个参数，就直接是"标签名"，第二个参数是标签的属性字典
   ⑵SubElement()方法：用于创建某个标签下的子标签，因此它的第一个参数时"父标签名"，第二个参数才是要创建的标签名，第三个参数时标签的属性字典
   ⑶可以使用Element对象的text属性来为标签对添加值(标签对之间的数据)
   ⑷注：SubElement()方法的第一个参数必须是一个Element对象
   ⑸使用Element()方法和SubElement()方法创建一个标签后返回的都是一个Element对象，可以使用这个标签对象来创建其的子标签

例10：

from xml.etree import ElementTree
from xml.dom import minidom

#生成跟节点
root = ElementTree.Element("MSG",attrib={"xmlns:xsd":"http://www.w3.org/2001/XMLSchema"})
# 生成第一个子节点 head
print(root)
meta = ElementTree.SubElement(root, "META") #在"MSG"标签下创建一个子节点
print(meta)
xml_type = ElementTree.SubElement(meta,"TYPE")#在"META"标签下创建一个子节点
xml_type.text = "LADC"  #使用text属性来为标签对添加值

data = ElementTree.SubElement(root, "data") 
time = ElementTree.SubElement(data,"time")
time.text = "20200706"

country = ElementTree.SubElement(data,"country",attrib={"name":"Liechtenstein"})
rank = ElementTree.SubElement(country, "rank")
rank.text = "1" #值只能用字符串型的数字

country2 = ElementTree.SubElement(data,"country")
year = ElementTree.SubElement(country2, "year").text = "2011"#也可以链式赋值


#tree = ElementTree.ElementTree(root)
#tree.write('result.xml', encoding='utf-8') #将生成的XML写入文件
xml_string = ElementTree.tostring(root,short_empty_elements=True)
print(xml_string)
#直接将生成的Element对象转为字符串的话，不会有xml的头部""，因此需要minidom模块
tree = minidom.parseString(xml_string)
xml_string = tree.toxml()
print(xml_string)

"""


b'LLDM2020070612011'
LLDM2020070612011
"""

例10_1：

from xml.etree import ElementTree
from xml.dom import minidom
import json

class CreateXMLMsg():
    def __init__(self):
        pass

    def CreateRootTag(self,tagName="MSG"):
        """
        创建根节点
        :param tagName:根节点名称
        :param tagAttrib: 根节点属性
        :return: 根节点Element对象
        """
        root = ElementTree.Element(tagName)
        return root

    def CreateSecondFloorTag(self,parentTag,childTags):
        """
        一次性的创建同一层的xml标签：用于创建第二层标签
        :param parentTag:父节点的Element对象：CreateRootTag()方法返回的root
        :param childTags:子节点的标签名、值(标签对之间的数据)，以字典形式传入(标签名:标签值)
        :return:None
        """
        for childTagName, childTagValue in childTags.items():
            childTag = ElementTree.SubElement(parentTag, childTagName)
            childTag.text = childTagValue
        return None

    def CreateThirdFloorTag(self,root,tagName,childTags,index=0):
        """
        创建某一个标签下的子标签：用于创建第三层及其之后的标签,并返回其父标签的Element对象
        :param root:要创建的标签的父标签的Element对象
        :param tagName:在哪个标签下创建子标签(标签名字符串)
        :param childTags: 子标签名和值，以字典形式传入(标签名:标签值)
        :param index:当存在多个相同标签对时，用于索引出想要的标签
        :return:创建的节点的父节点的Element对象，用于继续创建下一层标签
        """
        tag = root.findall(tagName)[index] #查找要创建的节点的父节点的Element对象
        for childTagName, childTagValue in childTags.items():
            childTag = ElementTree.SubElement(tag, childTagName)
            childTag.text = childTagValue
        return tag

    def SetAttrib(self,root,tagName,tagAttrib,index=0):
        """
        设置标签属性
        :param root: 已存在的Element对象(CreateRootTag()方法返回的root)
        :param tagName: 给哪个标签设置属性(标签名字符串)
        :param tagAttrib: 标签属性字典(属性名:值)
        :param index: 当存在多个相同标签对时，用于索引出想要的标签
        :return: None
        """
        tag = root.findall(tagName)[index]
        for attribKey, attribValue in tagAttrib.items():
            tag.set(attribKey, attribValue )
        return None

    def XmlToString(self,root):
        """
        将创建的Element对象对象转为字符串
        :param root:
        :return:
        """
        xml_string = ElementTree.tostring(root,encoding="unicode")
        tree = minidom.parseString(xml_string)
        xml_string = tree.toxml()
        return xml_string

if __name__ == "__main__":
    createMsg = CreateXMLMsg()

例10_2：

from demo.AOC.Common.CreateMsg import CreateXMLMsg
from xml.etree import ElementTree
import datetime

createXml = CreateXMLMsg()

#创建根节点(第一层节点)
root = createXml.CreateRootTag("MSG")

#创建第二层节点
secondTag = {"Header":None,"Body":None}
createXml.CreateSecondFloorTag(root,secondTag)

#创建第三层节点：其父节点"Body"是第二层(在根节点下一层)，因此使用findall()方法时可以直接找到
flightDate = datetime.datetime.now().strftime("%Y/%m/%d")
thirdTag = {"NUMBER":"HJ222","Date":flightDate,"Dep":"TGH","Arr":"EFG","ProcessNode":None}
tag_Body = createXml.CreateThirdFloorTag(root,"Body",thirdTag)
print(tag_Body.tag)

#创建第四层节点：其父节点是"ProcessNode",位于第三层，因此需要先找到第二层的节点才能找到它。第二层的Element对象通过CreateThirdFloorTag()方法返回
fourthTag= {"Node1":None}
tag_ProcessNode = createXml.CreateThirdFloorTag(tag_Body,"ProcessNode",fourthTag)

#创建第五层节点：其父节点是"Node1",位于第四层，因此需要先找到第三层的节点才能找到它。第三层的Element对象通过CreateThirdFloorTag()方法返回
fifthTag = {"ProcessNodeName":"垃圾车","ProcessNodeTime":None}
tag_Node1 = createXml.CreateThirdFloorTag(tag_ProcessNode,"Node1",fifthTag)

#创建第六层节点
sixTag = {"data1":None}
tag_ProcessNodeTime = createXml.CreateThirdFloorTag(tag_Node1,"ProcessNodeTime",sixTag)

#创建第七层节点
time = datetime.datetime.now().strftime("%Y/%m/%d %H:%M:%S")
sevenTag = {"time":time}
tag_data1 = createXml.CreateThirdFloorTag(tag_ProcessNodeTime,"data1",sevenTag)

#输出创建的xml字符串
xml = createXml.XmlToString(root)
print(xml)

注：
ElementTree模块还有很多方法，这里只是介绍了其中很少的一部分

你可能感兴趣的:(python3)

Python多版本管理与pip升级全攻略：解决冲突与高效实践码界奇点 Python python pip 开发语言 python3.11 源代码管理虚拟现实依赖倒置原则
引言Python作为最流行的编程语言之一，其版本迭代速度与生态碎片化给开发者带来了巨大挑战。据统计，超过60%的Python开发者需要同时维护基于Python3.6+和Python2.7的项目。本文将系统解决以下核心痛点：如何安全地在同一台机器上管理多个Python版本pip依赖冲突的根治方案符合PEP标准的生产环境最佳实践第一部分：Python多版本管理核心方案1.1系统级多版本共存方案Wind
Ubuntu基础（Python虚拟环境和Vue） aaiier ubuntu python linux
Python虚拟环境sudoaptinstallpython3python3-venv进入项目目录cdXXX创建虚拟环境python3-mvenvvenv激活虚拟环境sourcevenv/bin/activate退出虚拟环境deactivateVue安装Node.js和npm#安装Node.js和npm（Ubuntu默认仓库可能版本较旧，适合入门）sudoaptinstallnodejsnpm#验
Python3 内置函数 AI老李 python python
关键要点Python3的内置函数是解释器直接提供的，无需导入即可使用，涵盖数据类型转换、数学操作、序列处理等多种功能。推荐使用官方文档、菜鸟教程和腾讯云开发者社区的中文资源，适合初学者和中级学习者。资源提供详细解释和示例，学习时可结合实际项目实践。简介Python3的内置函数是编程中常用的工具，方便用户快速实现各种操作。以下是几个主要资源，帮助您学习这些函数的用法。资源推荐Python官方文档：内
安装uwsgi
安装uWSGIpip3installuwsgi启动命令/usr/local/python3/bin/uwsgi--socket0.0.0.0:8889--workersrun_server:app_server--master--processes4--threads2--stats0.0.0.0:9191在项目目录下新建[uwsgi]#web应用的入口模块名称module=run_server:
vllm本地部署bge-reranker-v2-m3模型API服务实战教程雷电法王大模型部署 linux python vscode language model
文章目录一、说明二、配置环境2.1安装虚拟环境2.2安装vllm2.3对应版本的pytorch安装2.4安装flash_attn2.5下载模型三、运行代码3.1启动服务3.2调用代码验证一、说明本文主要介绍vllm本地部署BAAI/bge-reranker-v2-m3模型API服务实战教程本文是在Ubuntu24.04+CUDA12.8+Python3.12环境下复现成功的二、配置环境2.1安装虚
三网BGP服务器——CDN加速的底层基石群联云防护小杜安全问题汇总服务器 python 运维游戏安全自动化网络
为什么跨网访问会成为业务性能杀手？场景痛点当电信用户访问联通机房的资源时，平均延迟高达120ms以上，而跨网丢包率可达15%。传统单线机房导致30%的用户体验直接下降。BGP协议的核心价值#三网路由优化模拟器（Python3）importrandomdefbgp_route_selection(user_isp,cdn_nodes):#用户ISP：1=电信2=移动3=联通#节点示例：{'node1
Mac 电脑crontab执行定时任务【Python 实战】 qifengle2014 Linux Docker Java Python技术分享合集 macos python 开发语言
1、crontab-e编辑定时任务列表crontab-e查看当前定时任务列表，长按i编辑，编辑完之后按esc退出编辑，然后输入:wq保存并提出。如下：(base)charles@zl~%crontab-e5815***/Library/Frameworks/Python.framework/Versions/3.8/bin/python3/Users/charles/Documents/first
Ubuntu系统下pip install的accelerate包没有安装至conda环境下，而是错误放入.local文件中
服务器上跑模型时莫名报了一个没有‘torch’包的错误Traceback(mostrecentcalllast):File"/home/ubuntu/.local/bin/accelerate",line5,infromaccelerate.commands.accelerate_cliimportmainFile"/home/ubuntu/.local/lib/python3.10/site-p
Python核心编程-语法范式与高阶应用实践 Stara-AI Python 装饰器内存管理机制 PEP8工程规范
一、Python基础语法、变量、列表、字典等运用1.运行python程序的两种方式1.交互式即时得到程序的运行结果2.脚本方式把程序写到文件里(约定俗称文件名后缀为.py),然后用python解释器解释执行其中的内容2.python程序运行的三个步骤python3.8C:\a\b\c.py1.先启动python3.8解释器,此时相当于启动了一个文本编辑器2.解释器会发送系统调用，把c.py的内容从
Python 3.9.0 64位：完整安装与配置教程 D哥有个初二君
本文还有配套的精品资源，点击获取简介：Python3.9.064位安装包为Windows系统上的Python最新版本，特别适用于数据处理、Web开发及自动化脚本等领域。本教程介绍了如何在HarmonyOS开发环境中安装并配置Python3.9.064位版本，包括系统兼容性、下载安装、环境变量配置、安装验证及pip更新。同时提供了Python基础知识，如基础语法、模块导入、面向对象编程、异常处理和文
快速了解python中的库小王爱学人工智能 python 开发语言
一、标准库1.标准库的介绍标准库是Python自带的库，无须下载，可直接使用。我们可以通过以下代码获取标准库的目录地址：importsysprint(sys.exec_prefix)此代码中的sys.exec_prefix可用于获取当前python的安装目录地址（即根目录）。执行结果：C:\Users\XY\AppData\Local\Programs\Python\Python39不同的操作系统
python虚拟环境
#列出虚拟环境列表python3-mvenv--list#创建python虚拟环境python3-mvenv虚拟环境名称#激活ptyhon虚拟环境source虚拟环境名称/bin/activate#python虚拟环境配置pip源vim虚拟环境名称/pip.conf[global]index-url=http://mirrors.aliyun.com/pypi/simple/[install]tr
XSStrike 进行 XSS 漏洞测试
XSStrike是一个功能强大的XSS漏洞测试工具，专为检测、验证和利用反射型、存储型、DOM型XSS漏洞而设计，适合配合手工测试，也可用于自动化发现。️1.安装XSStrike确保系统中有Python3和git：gitclonehttps://github.com/s0md3v/XSStrike.gitcdXSStrikepip3install-rrequirements.txt2.基本用法✅测
本地Qwen中医问诊小程序系统开发 Kelaru AI大模型小程序 AI python flask project
一、后端API（Flask+Qwen）1.环境准备1.1安装Python3（如未安装）```bashbrewinstallpython```1.2创建虚拟环境并激活python3-mvenvqwen_envsourceqwen_env/bin/activate1.3安装依赖bashpipinstalltorchtransformersflaskflask-cors2.编写后端API代码新建`app
python2.7和python3的区别-Python2.7与Python3之间的主要区别 weixin_39989215
1.使用__future__模块Python3.X引入了一些与Python2不兼容的关键字和特性。在Python2中，可以通过内置的__future__模块导入这些新内容。如果你希望在Python2中写的代码也可以在Python3.X中运行，那么建议使用__fufure__模块。2.print函数虽然print语法是Python3中一个很小的改动，但是依然值得提一下：Python2中的print语
python2.7与3.7区别_python2.7与python3.7的区别是什么 weixin_39977642 python2.7与3.7区别
python2.7与python3.7的区别：1、print语法的使用规则不同；2、“raw_input()”和“input()”方法的使用方式不同；3、cmp()函数的用途不同；4、string的使用方式不同。区别一:print语法使用Python2.7print语法使用>>>print"HelloPython"Python3.7print语法使用>>>print("HelloPython")例
【零基础学AI】第36讲：GPT模型原理 1989 0基础学AI 人工智能 gpt lstm rnn YOLO 目标检测
本节课你将学到理解GPT模型的基本原理掌握Transformer解码器的工作机制实现一个简单的文本生成应用开始之前环境要求Python3.8+安装包：pipinstalltransformerstorch硬件：CPU即可运行（GPU可加速）前置知识了解基本的神经网络概念（第23讲内容）熟悉Python编程基础核心概念什么是GPT？GPT（GenerativePre-trainedTransform
【零基础学AI】第31讲：目标检测 - YOLO算法 1989 0基础学AI 人工智能目标检测 YOLO rnn lstm tensorflow
本节课你将学到YOLO算法的核心思想和工作原理如何使用YOLO进行物体检测构建一个简单的物体检测系统开始之前环境要求Python3.8+需要安装的包：opencv-python,numpy,matplotlib硬件要求：推荐使用GPU（非必须）前置知识基本Python编程能力了解卷积神经网络（CNN）的基本概念（第24讲内容）核心概念什么是目标检测？目标检测就像教计算机"看"图片中的物体。它不仅要
python易错题赴335 python 开发语言
1.下列不属于IPO程序编写的方法是：（c）A:inputB:processC:programD:output程序的编写方法IPO指input(输入)、process(处理)、output(输出)2.下面哪个不是python的编程方式：（A）A：自然语言B:面向过程C:面向对象D:语句Python是目前最接近自然语言的编程语言，但是不属于自然语言3.关于Python2.x版本和Python3.x版
asyncio.to_thread() Python同步代码异步化工具 serve the people 日常琐问 python 网络服务器
asyncio.to_thread()是Python3.9+引入的异步执行同步代码的工具，它通过线程池将同步操作转为异步执行，避免阻塞事件循环。其机制与async/await有本质区别，但可以结合使用。一、核心机制对比特性async/await原生异步机制asyncio.to_thread()线程池机制执行环境单线程，事件循环调度协程交替执行多线程，将同步任务放入线程池执行阻塞风险仅在await处
Ubuntu基础（监控重启和查找程序） aaiier ubuntu 服务器 linux
查看是否启动psaux|grepserver.py使用find命令全局搜索sudofind/-name"server.py"2>/dev/null直接在终端启动（前台运行）sudopython3/root/server.py后台运行（使用nohup）sudonohuppython3/root/server.py>/var/log/server.log2>&1&使用systemd管理（推荐方案）先查
python玛丽冒险游戏开发详解
一、游戏运行环境《玛丽冒险》运行环境要求：Python3.xPygame库（安装命令：pipinstallpygame）PyCharmIDE（或其他PythonIDE）二、核心类解析1.地图滚动类（MyMap）classMyMap():def__init__(self,x,y):self.bg=pygame.image.load("image/bg.png").convert_alpha()sel
在Windows系统中配置Python 3.11环境安装教程俊星学长 windows python3.11
在Windows系统中配置Python3.11环境安装教程是一个相对直接且简单的过程，但为了确保所有步骤都被详细覆盖，我将分步介绍，并提供必要的背景信息和注意事项。以下是详细的安装教程：一、下载Python3.11首先，需要从Python的官方网站下载Python3.11的安装包。请按照以下步骤操作：访问Python官方网站：打开浏览器，访问Python的官方网站。在网站首页，找到并点击“Down
MCP Streamable HTTP 样例（qbit） pythonagent
前言模型上下文协议（ModelContextProtocol，MCP），是由Anthropic推出的开源协议，旨在实现大语言模型与外部数据源和工具的集成，用来在大模型和数据源之间建立安全双向的连接。本文代码技术栈Python3.11.8FastMCP2.10.3MCP的传输机制StandardInput/Output(stdio)StreamableHTTPServer-SentEvents(SS
Python爬虫实战：爬取ETF基金持仓变化 Python爬虫项目 python 爬虫开发语言信息可视化数据分析
1.项目背景ETF（Exchange-TradedFund，交易型开放式指数基金）作为一种在交易所上市交易的基金，其持仓信息对于投资者具有重要参考价值。了解ETF的持仓变化，可以帮助投资者判断市场趋势和资金流向。本文将通过Python爬虫技术，自动化地获取ETF基金的持仓变化数据，进行存储和分析。2.技术选型与环境准备2.1技术选型编程语言：Python3.8+爬虫框架：Scrapy数据解析：Be
python 包管理工具uv
uv--versionuvpythonfinduvpythonlistexportUV_DEFAULT_INDEX="https://mirrors.tuna.tsinghua.edu.cn/pypi/web/simple"#换成私有的repoexportUV_HTTP_TIMEOUT=120uvpythoninstall3.12uvvenvmyenv--python3.12--seeduvhtt
python爬取头条视频_Python爬虫：爬取某日头条某瓜视频，有/无水印两种方法孤灯苦狗 python爬取头条视频
前言本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理。以下文章来源于青灯编程，作者：清风Python爬虫、数据分析、网站开发等案例教程视频免费在线观看https://space.bilibili.com/523606542基本开发环境Python3.6Pycharm相关模块的使用importtimeimportosimportreimportreq
AttributeError: module ‘distutils‘ has no attribute ‘version‘ 吴闹闹(●'◡'●) python 深度学习开发语言
错误：File"/root/miniconda3/envs/vidar/lib/python3.8/sitepackages/torch/utils/tensorboard/__init__.py",line4,inLooseVersion=distutils.version.LooseVersionAttributeError:module'distutils'hasnoattribute've
【零基础学AI】第30讲：生成对抗网络(GAN)实战 - 手写数字生成 1989 0基础学AI 人工智能生成对抗网络神经网络 python 机器学习近邻算法深度学习
本节课你将学到GAN的基本原理和工作机制使用PyTorch构建生成器和判别器DCGAN架构实现技巧训练GAN模型的实用技巧开始之前环境要求Python3.8+需要安装的包：pipinstalltorchtorchvisionmatplotlibnumpyGPU推荐（可大幅加速训练）前置知识第21讲TensorFlow基础第23讲神经网络原理基本PyTorch使用经验核心概念什么是GAN？GAN就像
基于流量特征分析的DDoS实时检测与缓解实战
问题场景当Web服务器突发大量SYNFlood攻击时，传统防火墙难以区分真实用户与伪造流量，导致业务中断。解决方案核心：动态流量指纹识别通过统计学习建立正常流量基线，实时拦截异常连接。#DDoS流量检测脚本（Python3+Scapy）fromscapy.allimport*fromcollectionsimportdefaultdictimporttimeTHRESHOLD=1000#每秒SYN
ios内付费 374016526 ios 内付费
近年来写了很多IOS的程序，内付费也用到不少，使用IOS的内付费实现起来比较麻烦，这里我写了一个简单的内付费包，希望对大家有帮助。具体使用如下: 这里的sender其实就是调用者，这里主要是为了回调使用。 [KuroStoreApi kuroStoreProductId:@"产品ID" storeSender:self storeFinishCallBa
20 款优秀的 Linux 终端仿真器 brotherlamp linux linux视频 linux资料 linux自学 linux教程
终端仿真器是一款用其它显示架构重现可视终端的计算机程序。换句话说就是终端仿真器能使哑终端看似像一台连接上了服务器的客户机。终端仿真器允许最终用户用文本用户界面和命令行来访问控制台和应用程序。（LCTT 译注：终端仿真器原意指对大型机-哑终端方式的模拟，不过在当今的 Linux 环境中，常指通过远程或本地方式连接的伪终端，俗称“终端”。）你能从开源世界中找到大量的终端仿真器，它们
Solr Deep Paging(solr 深分页) eksliang solr深分页 solr分页性能问题
转载请出自出处：http://eksliang.iteye.com/blog/2148370 作者：eksliang(ickes) blg:http://eksliang.iteye.com/ 概述长期以来，我们一直有一个深分页问题。如果直接跳到很靠后的页数，查询速度会比较慢。这是因为Solr的需要为查询从开始遍历所有数据。直到Solr的4.7这个问题一直没有一个很好的解决方案。直到solr
数据库面试题 18289753290 面试题数据库
1.union ,union all 网络搜索出的最佳答案： union和union all的区别是,union会自动压缩多个结果集合中的重复结果，而union all则将所有的结果全部显示出来，不管是不是重复。 Union：对两个结果集进行并集操作，不包括重复行，同时进行默认规则的排序； Union All：对两个结果集进行并集操作，包括重复行，不进行排序； 2.索引有哪些分类？作用是
Android TV屏幕适配酷的飞上天空 android
先说下现在市面上TV分辨率的大概情况两种分辨率为主 1.720标清，分辨率为1280x720. 屏幕尺寸以32寸为主，部分电视为42寸 2.1080p全高清，分辨率为1920x1080 屏幕尺寸以42寸为主，此分辨率电视屏幕从32寸到50寸都有适配遇到问题，已1080p尺寸为例：分辨率固定不变，屏幕尺寸变化较大。如：效果图尺寸为1920x1080，如果使用d
Timer定时器与ActionListener联合应用永夜-极光 java
功能:在控制台每秒输出一次代码: package Main; import javax.swing.Timer; import java.awt.event.*; public class T { private static int count = 0; public static void main(String[] args){
Ubuntu14.04系统Tab键不能自动补全问题解决随便小屋 Ubuntu 14.04
Unbuntu 14.4安装之后就在终端中使用Tab键不能自动补全，解决办法如下： 1、利用vi编辑器打开/etc/bash.bashrc文件（需要root权限） sudo vi /etc/bash.bashrc 接下来会提示输入密码 2、找到文件中的下列代码 #enable bash completion in interactive shells #if
学会人际关系三招轻松走职场 aijuans 职场
要想成功，仅有专业能力是不够的，处理好与老板、同事及下属的人际关系也是门大学问。如何才能在职场如鱼得水、游刃有余呢？在此，教您简单实用的三个窍门。　　第一，多汇报最近，管理学又提出了一个新名词“追随力”。它告诉我们，做下属最关键的就是要多请示汇报，让上司随时了解你的工作进度，有了新想法也要及时建议。不知不觉，你就有了“追随力”，上司会越来越了解和信任你。　　第二，勤沟通团队的力
《O2O：移动互联网时代的商业革命》读书笔记 aoyouzi 读书笔记
移动互联网的未来：碎片化内容+碎片化渠道=各式精准、互动的新型社会化营销。 O2O：Online to OffLine 线上线下活动 O2O就是在移动互联网时代，生活消费领域通过线上和线下互动的一种新型商业模式。手机二维码本质：O2O商务行为从线下现实世界到线上虚拟世界的入口。线上虚拟世界创造的本意是打破信息鸿沟，让不同地域、不同需求的人
js实现图片随鼠标滚动的效果百合不是茶 JavaScript 滚动属性的获取图片滚动属性获取页面加载
1,获取样式属性值 top 与顶部的距离 left 与左边的距离 right 与右边的距离 bottom 与下边的距离 zIndex 层叠层次例子:获取左边的宽度,当css写在body标签中时 <div id="adver" style="position:absolute;top:50px;left:1000p
ajax同步异步参数async bijian1013 jquery Ajax async
开发项目开发过程中，需要将ajax的返回值赋到全局变量中，然后在该页面其他地方引用，因为ajax异步的原因一直无法成功，需将async:false，使其变成同步的。格式： $.ajax({ type: 'POST', ur
Webx3框架（1） Bill_chen eclipse spring maven 框架 ibatis
Webx是淘宝开发的一套Web开发框架，Webx3是其第三个升级版本；采用Eclipse的开发环境，现在支持java开发；采用turbine原型的MVC框架，扩展了Spring容器，利用Maven进行项目的构建管理，灵活的ibatis持久层支持，总的来说，还是一套很不错的Web框架。 Webx3遵循turbine风格，velocity的模板被分为layout/screen/control三部
【MongoDB学习笔记五】MongoDB概述 bit1129 mongodb
MongoDB是面向文档的NoSQL数据库，尽量业界还对MongoDB存在一些质疑的声音，比如性能尤其是查询性能、数据一致性的支持没有想象的那么好，但是MongoDB用户群确实已经够多。MongoDB的亮点不在于它的性能，而是它处理非结构化数据的能力以及内置对分布式的支持(复制、分片达到的高可用、高可伸缩)，同时它提供的近似于SQL的查询能力，也是在做NoSQL技术选型时，考虑的一个重要因素。Mo
spring/hibernate/struts2常见异常总结白糖_ Hibernate
Spring ①ClassNotFoundException: org.aspectj.weaver.reflect.ReflectionWorld$ReflectionWorldException 缺少aspectjweaver.jar，该jar包常用于spring aop中 ②java.lang.ClassNotFoundException: org.sprin
jquery easyui表单重置(reset)扩展思路 bozch form jquery easyui reset
在jquery easyui表单中尚未提供表单重置的功能，这就需要自己对其进行扩展。扩展的时候要考虑的控件有： combo,combobox,combogrid,combotree,datebox,datetimebox 需要对其添加reset方法，reset方法就是把初始化的值赋值给当前的组件，这就需要在组件的初始化时将值保存下来。在所有的reset方法添加完毕之后，就需要对fo
编程之美-烙饼排序 bylijinnan 编程之美
package beautyOfCoding; import java.util.Arrays; /* *《编程之美》的思路是：搜索+剪枝。有点像是写下棋程序：当前情况下，把所有可能的下一步都做一遍；在这每一遍操作里面，计算出如果按这一步走的话，能不能赢（得出最优结果）。 *《编程之美》上代码有很多错误，且每个变量的含义令人费解。因此我按我的理解写了以下代码： */
Struts1.X 源码分析之ActionForm赋值原理 chenbowen00 struts
struts1在处理请求参数之前，首先会根据配置文件action节点的name属性创建对应的ActionForm。如果配置了name属性，却找不到对应的ActionForm类也不会报错，只是不会处理本次请求的请求参数。如果找到了对应的ActionForm类，则先判断是否已经存在ActionForm的实例，如果不存在则创建实例，并将其存放在对应的作用域中。作用域由配置文件action节点的s
[空天防御与经济]在获得充足的外部资源之前,太空投资需有限度 comsci 资源
这里有一个常识性的问题: 地球的资源,人类的资金是有限的,而太空是无限的..... 就算全人类联合起来,要在太空中修建大型空间站,也不一定能够成功,因为资源和资金,技术有客观的限制.... &
ORACLE临时表—ON COMMIT PRESERVE ROWS daizj oracle 临时表
ORACLE临时表转临时表：像普通表一样，有结构，但是对数据的管理上不一样，临时表存储事务或会话的中间结果集，临时表中保存的数据只对当前会话可见，所有会话都看不到其他会话的数据，即使其他会话提交了，也看不到。临时表不存在并发行为，因为他们对于当前会话都是独立的。创建临时表时，ORACLE只创建了表的结构（在数据字典中定义），并没有初始化内存空间，当某一会话使用临时表时，ORALCE会
基于Nginx XSendfile+SpringMVC进行文件下载 denger 应用服务器 Web nginx 网络应用 lighttpd
在平常我们实现文件下载通常是通过普通 read-write方式，如下代码所示。 @RequestMapping("/courseware/{id}") public void download(@PathVariable("id") String courseID, HttpServletResp
scanf接受char类型的字符 dcj3sjt126com c
/* 2013年3月11日22:35:54 目的：学习char只接受一个字符 */ # include <stdio.h> int main(void) { int i; char ch; scanf("%d", &i); printf("i = %d\n", i); scanf("%
学编程的价值 dcj3sjt126com 编程
发一个人会编程, 想想以后可以教儿女, 是多么美好的事啊, 不管儿女将来从事什么样的职业, 教一教, 对他思维的开拓大有帮助像这位朋友学习: http://blog.sina.com.cn/s/articlelist_2584320772_0_1.html VirtualGS教程 (By @林泰前): 几十年的老程序员，资深的
二维数组（矩阵）对角线输出飞天奔月二维数组
今天在BBS里面看到这样的面试题目, 1，二维数组（N*N），沿对角线方向，从右上角打印到左下角如N=4： 4*4二维数组 { 1 2 3 4 } { 5 6 7 8 } { 9 10 11 12 } {13 14 15 16 } 打印顺序 4 3 8 2 7 12 1 6 11 16 5 10 15 9 14 13 要
Ehcache（08）——可阻塞的Cache——BlockingCache 234390216 并发 ehcache BlockingCache 阻塞
可阻塞的Cache—BlockingCache 在上一节我们提到了显示使用Ehcache锁的问题，其实我们还可以隐式的来使用Ehcache的锁，那就是通过BlockingCache。BlockingCache是Ehcache的一个封装类，可以让我们对Ehcache进行并发操作。其内部的锁机制是使用的net.
mysqldiff对数据库间进行差异比较 jackyrong mysqld
mysqldiff该工具是官方mysql-utilities工具集的一个脚本，可以用来对比不同数据库之间的表结构，或者同个数据库间的表结构如果在windows下，直接下载mysql-utilities安装就可以了，然后运行后，会跑到命令行下： 1）基本用法 mysqldiff --server1=admin:12345
spring data jpa 方法中可用的关键字 lawrence.li java spring
spring data jpa 支持以方法名进行查询/删除/统计。查询的关键字为find 删除的关键字为delete/remove (>=1.7.x) 统计的关键字为count (>=1.7.x) 修改需要使用@Modifying注解 @Modifying @Query("update User u set u.firstna
Spring的ModelAndView类 nicegege spring
项目中controller的方法跳转的到ModelAndView类，一直很好奇spring怎么实现的？ /* * Copyright 2002-2010 the original author or authors. * * Licensed under the Apache License, Version 2.0 (the "License"); * yo
搭建 CentOS 6 服务器(13) - rsync、Amanda rensanning centos
（一）rsync Server端 # yum install rsync # vi /etc/xinetd.d/rsync service rsync { disable = no flags = IPv6 socket_type = stream wait
Learn Nodejs 02 toknowme nodejs
（1）npm是什么 npm is the package manager for node 官方网站：https://www.npmjs.com/ npm上有很多优秀的nodejs包，来解决常见的一些问题，比如用node-mysql，就可以方便通过nodejs链接到mysql，进行数据库的操作在开发过程往往会需要用到其他的包，使用npm就可以下载这些包来供程序调用 &nb
Spring MVC 拦截器 xp9802 spring mvc
Controller层的拦截器继承于HandlerInterceptorAdapter HandlerInterceptorAdapter.java 1 public abstract class HandlerInterceptorAdapter implements HandlerIntercep