Python教程33:urllib.parse.urlparse用法

urllib.parse.urlparse 是 Python 的一个内置函数,用于解析 URL 并返回一个 URL 对象。这个对象包含 URL 的各个组成部分。

#我的Python教程
#官方微信公众号:wdPython

urlparse会返回一个ParseResult` 对象,这个对象包含以下属性:

scheme:URL 的协议部分(例如 ‘http’ 或 ‘https’)。
netloc:网络位置,通常是主机名和端口号(如果有的话)。
path:URL 路径。
params:参数,在 URL 路径中的分号分隔的键值对。
query:查询字符串,在 URL 中的问号之后的部分。
fragment:URL 的片段(也称为锚点),在 URL 中的井号之后的部分。

from urllib.parse import urlparse

url = urlparse('http://www.example.com/path?param=value#anchor')
print(url.scheme)  # 输出:'http'
print(url.netloc)  # 输出:'www.example.com'
print(url.path)    # 输出:'/path'
print(url.params)  # 输出:'',因为没有参数
print(url.query)   # 输出:'param=value'
print(url.fragment)# 输出:'anchor'

你还可以使用 geturl() 方法来获取完整的 URL 字符串:

print(url.geturl())  # 输出:'http://www.example.com/path?param=value#anchor'

你可能感兴趣的:(我的Python教程,python,Python教程)