一个简单的Python爬虫程序-实现输入网址自动保存页面文本内容到txt

,使用requests和BeautifulSoup库,可以输入当前网页地址,自动保存当前页面的文字为本地txt文件,并保持原来的文本段落格式不变。

import requests
from bs4 import BeautifulSoup

# 输入网页地址
url = input("请输入网页地址:")

# 发送请求并获取响应
response = requests.get(url)

# 解析HTML内容
soup = BeautifulSoup(response.content, "html.parser")

# 提取文本内容
text = soup.get_text()

# 保存为本地txt文件
with open("output.txt", "w", encoding="utf-8") as f:
    f.write(text)

print("已保存为本地txt文件:output.txt")

你可能感兴趣的:(技术文章,python,爬虫,开发语言)