乘凉者栽树人

python爬虫从入门到放弃，含案例分析，超详细讲解（一）

Python爬虫

1、认识爬虫

1.1、概述

网络爬虫（又称为网页蜘蛛，网络机器人，在FOAF社区中间，更经常的称为网页追逐者）

按照一定规律，自动地抓取万维网信息的程序或者脚本。

1.2、应用场景

爬取网页优秀的图片信息
爬取劲爆视频的弹幕信息
爬取优秀的歌声以及曲目

1.3、爬虫和python

爬虫只能用python写吗？其实不然，用Java，c都能写，只不过python对于小白上手快，就像吃饭一般，筷子、勺子、甚至用手抓，他都是可以的，但是大家也都知道筷子勺子吃又优美雅观而且干净。

1.4、爬虫合法吗？

合法！他就像是小刀的存在，小刀可以给人类带来便利，带来一点点危害，也可能会带来很大的危害，没有什么物品是错误的，有的是使用的人，怎么使用，这是关键！

善意的爬虫：不破坏网站的资源
恶意的爬虫：影响网站的正常运行

1.5、第一个简单的爬虫

from urllib.request import urlopen

url="http://www.baidu.com"#获取网站的地址
resp=urlopen(url)#响应地址打开

with open("baidu.html",mode="w",encoding="utf-8") as f:#open方法，文件输出，mode写操作用法，编码格式encoding
    f.write(resp.read().decode("utf-8"))#响应并读写到指定文件
    print("over!")

2、web请求过程解析

服务器渲染：在服务器那边会把数据和HTML整合到一起，统一返回给浏览器页面中即可看到数据
客户端渲染：第一次请求只要一个HTML骨架，第二次请求拿到数据进行数据展示

我们在请求页面的时候，第一次的请求往往是只有一个骨架

需要二次请求，才能得到其中的数据，这个看我如下操作

3、HTTP协议

3.1、概述

超文本传输协议（Hypertext Transfer Protocol，HTTP）是一个简单的请求-响应协议

它指定了客户端可能发送给服务器什么样的消息以及得到什么样的响应。

请求和响应消息的头以ASCII形式给出；而消息内容则具有一个类似MIME的格式。

3.2、HTTP协议把消息分为三大块内容

请求
- 请求行：请求方式（get/post）请求url 协议
- 请求头：放一些服务器要使用的附加信息
- 请求体：一般放一些请求参数
响应
- 状态行：协议状态码
- 响应头：放一些客户端要使用的一些附加信息
- 响应体：服务器返回真正客户端的内容（html,json）

3.3、爬虫常见的重要信息

请求头
- User-Agent:请求载体的身份标识（用啥发送的请求）
- Referer:防盗链（这次请求从哪个页面来的，反爬常用）
- cookie:本地字符串数据信息（用户登录信息，反爬的token）
响应头
- cookie:本地字符串数据信息（用户登录，反爬的token）
- 各种神奇莫名其妙的字符串（一般都是token字样，防止各种攻击和反爬）

4、Requests入门

安装requests第三方库

或者使用国内源，搜索清华源

https://mirrors.tuna.tsinghua.edu.cn/

语法：pip install -i https://pypi.tuna.tsinghua.edu.cn/simple 要下载的库

4.1、爬取网页名字信息

使用requests（手写一个小爬虫）

import requests

query=input("输入一个名字：")
url=f"https://www.baidu.com/s?ie=UTF-8&wd={query}"

dic={
    "User-Agent":"Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/90.0.4430.212 Safari/537.36"
}#拿到头文件，模拟浏览器
resp=requests.get(url,headers=dic)#处理小爬虫

print(resp.text)

4.2、爬取百度翻译

找到相对应需要爬取的数据url，然后进行爬虫

import requests

url="https://fanyi.baidu.com/sug"

s=input("请输入需要翻译的单词")

dat={
    "kw":s
}

# 发送post请求,发送的数据必须放在字典中，通过打他参数进行传递
resp=requests.post(url,data=dat)
# print(resp.text)这个是输出乱码，因此直接使用json
# 将服务器返回内容直接处理成json()=>dict
print(resp.json())

4.3、豆瓣信息爬取

import requests

url="https://movie.douban.com/j/search_subjects"

# 封装参数
param={
"type": "movie",
"tag": "日本",
"sort": "recommend",
"page_limit": 20,
"page_start": 0,
}

headers={
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/90.0.4430.212 Safari/537.36"
}

resp=requests.get(url=url,params=param,headers=headers)
print(resp.json())

resp.close()#关闭resp

5、数据解析

三种解析方式：

re解析
bs4解析
xpath解析

5.1、RE解析

5.1.1、正则表达式

常见的元字符

\d 表示所有的字数
\w 表示大小写字符、数字、下划线
\s 表示空白、空格、换行符、制表符
\t 匹配制表符
\n 匹配换行符
\D 表示所有的非数字
\W 表示除数字字符下划线之外的所有字符
\S 表示非空白
. 表示除了换行符之外的任意内容
[ ]字符组：只要在中括号内的所有字符都是符合规则的字符
[^ ]非字符组：只要在中括号内的所有字符都是不符合规则的字符
^ 表示一个字符的开始
$ 表示一个字符的结束
 | 表示"或"，注意，如果两规则有重叠部分，总是长得在前面，短的在后面
()表示分组，给一部分正规则为一组，|这个符号的作用域就可以缩小了
[\d\D] [\w\W] [\s\S] 匹配一切字符

多多使用正则表达式工具测试

https://c.runoob.com/front-end/854

量词

{n} 表示只能出现n次
{n，} 表示至少出现n次
{n，m}表示至少出现n次，至多出现m次
？表示匹配0次或者1次，表示可有可无 但是只能有一个，比如小数点
+表示匹配1次多着或者多次
*表示匹配0次或者多次，表示可有可无，但是有可以有多个，比如小数点后n位

贪婪匹配和惰性匹配

.*    贪婪匹配
.*？  惰性匹配 //爬虫常用

5.1.2、python运用re模块

findall查询所有，返回list
search会进行匹配，但是如果匹配到了第一结果就会返回，反之
match只能从字符串的开头进行匹配
finditer和findall雷同，差别是findall是迭代器

import re

# findall匹配字符串中所有符合的内容
lst=re.findall(r"\d+","我的密码是：100100，女朋友的密码：100180")
print(lst)

# finditer匹配字符串中所有的内容[返回的是迭代器]，从迭代器中拿到内容需要.group()
it=re.finditer(r"\d+","我的密码是：100100，女朋友的密码：100180")
for i in it:
    print(i.group())

# search,找到一个结果就返回，返回的是match对象，拿数据需要.group()
s=re.search(r"\d+","我的密码是：100100，女朋友的密码：100180")
print(s.group())

# match是从头开始匹配,注意此时我
h=re.match(r"\d+","100100，女朋友的密码：100180")
print(h.group())

# 预加载正则表达式
m=re.compile(r"\d+")
result=m.findall("我的密码是：100100，女朋友的密码：100180")
print(result)

5.1.3、爬取网页独有信息

s="""
语文
数学
英语
生物
"""
# ?P<任意>:作为一种标识，最后输出
h=re.compile(r"(?P.*?)
")

result=h.finditer(s)
for i in result:
    # 根据上方定义取出
    print(i.group("class"))

5.1.4、爬取豆瓣电影实战

import requests
import re
import csv

url="https://movie.douban.com/chart"

headers={
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/90.0.4430.212 Safari/537.36"
}

resp=requests.get(url,headers=headers)
page_context=resp.text
s=re.compile('
.*?title="(?P.*?)">.*?(?P.*?).*?"pl">(?P.*?)',re.S)

result=s.finditer(page_context)
f=open("data.csv",mode="w",encoding="utf-8")
csvwrite=csv.writer(f)
for it in result:
    dic=it.groupdict()
    csvwrite.writerow(dic.values())
  # print(it.group("score","score1","num"))

5.1.5、爬取屠戮电影实战

import requests
import re

domain="https://www.dytt89.com/"

resp=requests.get(domain)
resp.encoding="gb2312"
# print(resp.text)

obj1=re.compile(r'(?P.*?)',re.S)
obj2=re.compile(r",re.S)
obj3=re.compile(r'◎片　　名(?P.*?)magnet',re.S)
result1=obj1.finditer(resp.text)
num=[]
for i in result1:
    h=i.group("m_name")
    # print(h)

    result2=obj2.finditer(h)
    for l in result2:
        # ,拼接子页面的url地址：域名+子页面地址
        load = domain+l.group("load").strip("/")
        # print(load)
        num.append(load)  #保存起来


        # 提取子页面的内容
        for m in num:
            m_name2=requests.get(load)
            m_name2.encoding='gb2312'
            result3=obj3.search(m_name2.text)
            print(result3.group("m_name2"))
            print(result3.group("down"))

5.2、BS4解析

5.2.1、爬取北京菜市价

import requests
from bs4 import BeautifulSoup

url="http://www.bjtzh.gov.cn/bjtz/home/jrcj/index.shtml"
resp=requests.get(url)
resp.encoding="utf-8"

# 解析数据
# 把数据变为bs4数据处理，生成bs对象
page=BeautifulSoup(resp.text,"html.parser")
# print(page)
# 从bs4对象中查询数据
# find（标签，属性=值）
# find_all（标签，属性=值）
table=page.find("table",style="margin: 0px auto; width: 588px; height: 847px; border-collapse: collapse;")
# table=page.find("table",align="center")
# print(table)
# 拿到所有的数据行
trs=table.find_all("tr")[1:]
for tr in trs:
    tds=tr.find_all("td")#拿到所有的td
    name=tds[0].text
    # kinds=tds[1].text
    maxPrice=tds[1].text
    avgPrice=tds[2].text
    print(name,maxPrice,avgPrice)

5.2.2、爬取网上图片

# 找到页面源代码，然后提取到子页面的链接地址，href
# 通过href拿到子页面内容，从子页面找到图片下载地址

import requests
from bs4 import BeautifulSoup

url="https://www.umei.net/weimeitupian/"
resp=requests.get(url)
resp.encoding="utf-8" #乱码处理
# print(resp.text)
# 数据处理
page=BeautifulSoup(resp.text,"html.parser")
alist=page.find("div",class_="TypeList").find_all("a")
# print(alist)
href=[]
for a in alist:
    load=url+a.get('href').strip("/weimeitupian")+"tm"
    # print(load)
    href.append(load)#保存到容器中
    # href=a.get(load)#直接通过get爬取属性的值
    # 拿到源代码
    for page_img in href:
        child_img=requests.get(load)
        child_img.encoding='utf-8'
        child_text=child_img.text
        # print(child_img.text)
        # 拿到图片的下载路径
        page_img=BeautifulSoup(child_text,"html.parser")
        p=page_img.find("p",align="center")
        img=p.find("img")
        src=img.get("src")
    # page_resp=requests.get(href)
    # page_resp.encoding='utf-8'
    # print(page_resp.text)
    # page_text=page_resp.text
    # img=page_2("img")
    # src=img.get("src")
    # 下载图片
    img=requests.get(src)
    img_name=src.split("/")[-1]#拿到url中最后/一个内容
    with open("img/"+img_name,mode="wb")as f:
        f.write(img.content)#拿到图片字节，并写入文件

6、Xpath解析

6.1、初识Xpath

Xpath是在xml文档中搜索内容的一门语言

html是xml的一个子集

安装xpath：pip install lxml

准备一个xml文件

xml="""
<book>
    <id>1id>
    <name>加油别放弃name>
    <arice>1.123arice>
    <nick>加油nick>
    <author>
        <nick id="199">别放弃nick>
        <nick id="139">别nick>
        <nick class="jos">放nick>
        <nick class="da">弃nick>
        <div>
            <nick>你懂nick>
        div>
    author>
    <partner>
        <nick id="12">胖乎乎nick>
        <nick id="12asd">胖乎asd乎nick>
    partner>
book>
"""

from lxml import etree

xml="""将上方文件放入其中"""

tree=etree.XML(xml)
# result=tree.xpath("/book")
# result=tree.xpath("/book/name")
# result=tree.xpath("/book/name/text()")#text()获取其中的文本
# result=tree.xpath("/book/author//nick/text()")#//代表的是父节点下的所有子节点都可以被包含
# result=tree.xpath("/book/author/*/nick/text()")//*是通配符，代表任意一个节点
result=tree.xpath("/book//nick/text()")
print(result)

6.2、Xpath实现对HTML的小爬虫

首先准备一个HTML文件，注意要在meta加上/作为标签结束，否则报错

成功后的效果图如下

from lxml import etree

tree=etree.parse("xml.html")#获取HTML文本，读取数据
# 括号里面的标签意思：<>内容，读取表亲啊中间的所有内容
# result=tree.xpath("/html")#将HTML标签中的所有东西整理
# result=tree.xpath("/html/body//author/nick/text()")
# result=tree.xpath("/html/body//author/nick[1]/text()")#需要注意的是，xpath的顺序是从1开始的

kind=tree.xpath("/html/body//author")

for i in kind:
    #从每一个nick里拿到文字信息
    # result=i.xpath("./id/text()")#./是绝对路径
    result=i.xpath("./nick/@id")
    print(result)

6.3、xpath实战（猪八戒网爬虫）

#获取网站地址
# 数据分析
import requests
from lxml import etree
url="https://foshan.zbj.com/search/f/?kw=%E5%95%86%E6%A0%87%E8%AE%BE%E8%AE%A1&fr=zbj.sy.zyyw_1st.lv3"
resp=requests.get(url)
# print(resp.text)

# 数据解析
html=etree.HTML(resp.text)

kinds=html.xpath("/html/body/div[6]/div/div/div[3]/div[5]/div[1]/div")#获取到网站中的每一个产品的xpath
for i in kinds:#包含每一个商品的的用户信息
    # price=i.xpath("./div/div/a/div[2]/div[1]/span[1]/text()")[0].strip("¥")
    text="logo".join(i.xpath("./div/div/a/div[2]/div[2]/p/text()"))#join可以拼接产品中的黄色标签
    # print(price)
    print(text)

7、Requests进阶

7.1、登录网站爬虫

首先，准备一个自己写的网页，如果没有，我可以分享一份，登录时候，可以发现，用户名和密码已经存在cookie

# 登录得到cookie
# 带着cookie去请求用户列表url

# 必须把上面两个操作连接起来
# 我们可以使用session请求，在这个过程中，cookie不会消失
import requests

session=requests.session()
data={
"userCode": "admin",
"userPassword": "123456",
}

# 一、通过用户名密码抓取数据
# # 1、登录
# url="http://localhost:8080/login.do"
# session.post(url,data=data)
# # print(resp.text)
#
# #2、拿到用户列表信息
# # session已经是存在cookie的，以此，我们可以直接获取
# resp=session.get('http://localhost:8080/jsp/user.do?method=query')
# print(resp.text)

#二、通过cookie来爬取
resp=requests.get('http://localhost:8080/jsp/user.do?method=query',headers={
"Cookie": "Pycharm-9b2f2c98=1ec03cda-8466-40b0-9ece-535dc5b71cd4; JSESSIONID=9A7B386209342505265729B2B5E1D0F9"
})
print(resp.text)

7.2、防盗链（梨视频爬虫）

视频爬虫原理

# 1.拿到contId
# 2.拿到videoStatus返回的json->srcURL
# 3.srcURL里面的内容进行修正
# 4.下载视频
import requests

url="https://www.pearvideo.com/video_1731807"
contId=url.split("_")[1]#_前面的为[0]，_后面的为[1]

videoStatus=f"https://www.pearvideo.com/videoStatus.jsp?contId={contId}&mrd=0.014195653140843811"
resp=requests.get(videoStatus)
print(resp.text)

出现以上这种情况是因为在防盗链的作用下，我们就应该还给他一个溯源

# 1.拿到contId
# 2.拿到videoStatus返回的json->srcURL
# 3.srcURL里面的内容进行修正
# 4.下载视频
import requests

url="https://www.pearvideo.com/video_1731807"
contId=url.split("_")[1]#_前面的为[0]，_后面的为[1]

videoStatus=f"https://www.pearvideo.com/videoStatus.jsp?contId={contId}&mrd=0.014195653140843811"
headers={
    #防盗链，当前请求的上一级是谁
    "Referer": url #"https://www.pearvideo.com/video_1731807"
}
resp=requests.get(videoStatus,headers=headers)
dic=resp.json()
srcUrl=dic['videoInfo']['videos']['srcUrl']
systemTime=dic['systemTime']
srcUrl=srcUrl.replace(systemTime,f"cont-{contId}")
print(srcUrl)

# 下载视频
with open("a.mp4",mode="wb")as f:
    f.write(requests.get(srcUrl).content)

7.3、代理

#原理：通过第三方的一个机器请求
# 慎用代理，不必时尽量不用
import requests

proxies={
    "https": "https://122.51.207.244:8888"#此处为代理的IP地址
}

resp=requests.get("https://www.baidu.com",proxies=proxies)
resp.encoding="utf-8"
print(resp.text)

从代码到终端部署：Prompt如何颠覆传统DevOps流程 LCG元工具运维 prompt devops 运维
文章目录基于Prompt工程的DevOps架构重构实践一、架构演进与技术对比1.1架构演进路径1.2核心流程对比二、核心实现方案2.1Prompt解析引擎实现（Python）2.2Kubernetes集成部署（YAML模板）三、生产部署实践3.1安全增强方案3.2性能优化数据四、技术前瞻与演进4.1未来三年技术路线图五、完整技术图谱六、核心代码实现（TypeScript前端）七、部署验证测试基于P
解锁Prompt+DevOps新姿势：终端系统重塑的三大核心策略
文章目录引言：Prompt驱动的DevOps范式迁移核心策略一：智能决策流水线构建横向架构对比纵向实现流程Python实现示例核心策略二：自适应终端部署体系TypeScript客户端实现YAML部署配置模板核心策略三：智能运维闭环构建安全审计实现方案性能对比分析技术前瞻性分析附录：完整技术图谱技术架构部署验证引言：Prompt驱动的DevOps范式迁移在云原生与AI工程化交汇的今天，Prompt技
高并发解决方案：SpringBoot+Redis分布式缓存实战 fanxbl957 Web 缓存 spring boot redis
博主介绍：Java、Python、js全栈开发“多面手”，精通多种编程语言和技术，痴迷于人工智能领域。秉持着对技术的热爱与执着，持续探索创新，愿在此分享交流和学习，与大家共进步。DeepSeek-行业融合之万象视界(附实战案例详解100+)全栈开发环境搭建运行攻略：多语言一站式指南(环境搭建+运行+调试+发布+保姆级详解)感兴趣的可以先收藏起来，希望帮助更多的人高并发解决方案：SpringBoot
SpringBoot缓存技术全解析：Redis+Caffeine二级缓存架构 fanxbl957 Web 缓存 spring boot redis
博主介绍：Java、Python、js全栈开发“多面手”，精通多种编程语言和技术，痴迷于人工智能领域。秉持着对技术的热爱与执着，持续探索创新，愿在此分享交流和学习，与大家共进步。DeepSeek-行业融合之万象视界(附实战案例详解100+)全栈开发环境搭建运行攻略：多语言一站式指南(环境搭建+运行+调试+发布+保姆级详解)感兴趣的可以先收藏起来，希望帮助更多的人SpringBoot缓存技术全解析：
后端开发：Spring Boot 的分布式缓存方案大厂资深架构师 Spring Boot 开发实战 spring boot 分布式缓存 ai
后端开发：SpringBoot的分布式缓存方案关键词：SpringBoot、分布式缓存、Redis、Caffeine、缓存策略、缓存失效摘要：本文深入探讨了在SpringBoot后端开发中分布式缓存方案的相关技术。首先介绍了分布式缓存在现代应用中的重要性及本文的研究范围，接着阐述了核心概念如分布式缓存的原理与架构，详细讲解了常用的核心算法原理及具体操作步骤，包括使用Python代码示例说明。通过数
上位机知识篇---Prompt&PowerShell Prompt Atticus-Orion 上位机知识篇 prompt powershell
在Anaconda环境中，AnacondaPrompt和AnacondaPowerShellPrompt是两个常用的命令行工具，它们的核心功能都是为了方便管理Python环境和执行相关命令，但底层依赖的命令行解释器不同，因此在使用场景和语法上存在一些区别。下面详细介绍两者的差异：1.底层依赖的命令行解释器不同这是两者最根本的区别，决定了它们的语法规则和功能范围：AnacondaPrompt基于Wi
virtualenv 小小怪吃吃吃
virtualenv就是用来为一个应用创建一套“隔离”的Python运行环境。(1)用pip安装virtualenv:pip3installvirtualenv(2)创建开发项目目录:mkdirprojectcdproject/(3)创建一个独立的Python运行环境，命名为venv:virtualenv--no-site-packagesvenv命令virtualenv就可以创建一个独立的Pyt
VSCode使用Jupyter完整指南配置机器学习环境 z日火校招学习日记 vscode jupyter 机器学习
接下来开始机器学习部分第一步配置环境：VSCode使用Jupyter完整指南1.安装必要的扩展打开VSCode，按Ctrl+Shift+X打开扩展市场，搜索并安装以下扩展：必装扩展：Python(Microsoft官方)-Python语言支持Jupyter(Microsoft官方)-Jupyternotebook支持Pylance(Microsoft官方)-Python智能提示和语法检查推荐扩展：
python虚拟环境打包_python项目打包虚拟环境 weixin_39933356 python虚拟环境打包
python项目打包时，需要将虚拟环境与python自身安装路径下的lib包整合在一起，将该文件保存为packvenv.sh，放入虚拟环境目录下，chmod+xpackvenv.sh，./packvenv.sh执行即可#!/bin/bashPYTHON_PATH=/usr/local/python2.7VENV_PATH=~/.virtualenvs/venv-linux6VENV_NAME=`b
python连接数据库的方法,Python 连接数据库的多种方法 AI MIU python连接数据库的方法
JZGKCHINAPython是一种计算机程序设计语言，它是一种动态的、面向对象的脚本语言。它是一种跨平台的，可以运行在Windows，Mac和Linux/Unix系统上。在日常使用中需要对大量数据进行数据分析，那么就必然用到数据库，我们常用的数据库有SQLServer,MySQL,Oracle,DB2,SQLite，Hive，PostgreSQL,MongoDB还有其他常用的MicrosoftA
pycharm2023，修改文件夹路径，venv解释器无法新增 day_323 python pycharm
pycharm2023，修改文件夹路径，venv解释器无法新增1问题描述2处理方法1问题描述我的pycharm版本为2023.1.2。原有代码所在文件夹路径变更后，再用pycharm打开代码，然后进入setting-pythoninterpreter中，新增venv虚拟环境，pycharm无反应，venv环境一直无法新增。2处理方法1关闭pycharm。然后进入代码文件夹，删除.idea文件夹和v
python 连接数据库小鱼拉灯 mysql 数据库 python
一.连接MYSQL1.下载PyMySql模块2.在MYSQL中创建数据库并连接importpymysqlconn=pymysql.connect(host='localhost',user='root',password='123456',database='ikun',charset='utf8',port=3306)3.创建表importpymysqlconn=pymysql.connect(
养老院管理系统基于SpringBoot的养老院管理系统系统设计与实现（源码+论文+部署讲解等）
博主介绍：✌全网粉丝60W+,csdn特邀作者、Java领域优质创作者、csdn/掘金/哔哩哔哩/知乎/道客/小红书等平台优质作者，计算机毕设实战导师，目前专注于大学生项目实战开发,讲解,毕业答疑辅导，欢迎高校老师/同行前辈交流合作✌技术栈范围：SpringBoot、Vue、SSM、Jsp、HLMT、Nodejs、Python、爬虫、数据可视化、小程序、安卓app、大数据、物联网、机器学习、单片机
python基础笔记大大的大大笔记 python 前端数据库
输入就是print()；#括号里面双引号(“xxxx”)=单引号('xxxx')必须在一行；但是三引号"""xxxx"""='''xxx'''可以换行输出；#'''xxxnnn'''xx=open(('C:\py\py笔记.txt','a+')print('hello',file=xx)xx.close()可以在python中新建文本文本档等(看后缀)："xx"=open('C:\py\py笔记.
python venv不适合变更路径（路径变更）的几种解决方案（venvpack、pip download、pip install --no-index --find-links=packages）
文章目录**为什么会出现路径问题？**1.**`pyvenv.cfg`文件**：该文件记录了虚拟环境的Python解释器路径（`home`字段）。如果源和目标机器的Python安装路径不一致，虚拟环境将无法找到正确的解释器。2.**脚本路径硬编码**：虚拟环境中的激活脚本（如`activate`）和可执行文件（如`python`）可能包含绝对路径或硬编码的相对路径，导致路径不匹配时失效。**解决方
python-程序编程-实例“温度转换”
实例：温度刻画的两种不同的体系。摄氏度、华氏度需求：将两种不同的摄氏度进行转换。问题分析：输入：输入一个华氏度的温度或者摄氏度的温度值处理：根据温度标志进行温度转换。输出：输出一个带华氏度或者摄氏度的温度值。(f代表华氏度，c代表是摄氏度)c=(f-32)/1.8f=c*1.8+32代码如下：temp=input("请输入有符号的温度值")iftemp[-1]in['f','F']:c=(eval
基于Docker构建Python后端项目落地总结
Docker使用总结基于Dockerfile的镜像构建示例dockerfile解析#加载centos7的最小镜像源FROMcentos:7RUNyumcleanallRUNyum-yupdate#修改时区RUNln-sf/usr/share/zoneinfo/Asia/Shanghai/etc/localtime&&echo"Asia/Shanghai">/etc/timezone#安装中文支持R
python集合常用函数 Lo-Y-eH python
Python集合是一种无序、可变且不重复的数据类型，常用于处理一组唯一的数据。下面是常用的Python集合函数及其用法：add()：向集合添加一个元素。s=set()s.add(1)s.add(2)s.add(3)print(s)#输出{1,2,3}clear()：移除集合中的所有元素。s=set([1,2,3])s.clear()print(s)#输出set()copy()：返回集合的一个浅拷贝
【NLP舆情分析】基于python微博舆情分析可视化系统(flask+pandas+echarts) 视频教程 - 基于wordcloud库实现词云图
大家好，我是java1234_小锋老师，最近写了一套【NLP舆情分析】基于python微博舆情分析可视化系统(flask+pandas+echarts)视频教程，持续更新中，计划月底更新完，感谢支持。今天讲解基于wordcloud库实现词云图视频在线地址：2026版【NLP舆情分析】基于python微博舆情分析可视化系统(flask+pandas+echarts+爬虫)视频教程（火爆连载更新中..
Python领域制造业的Python应用 Python编程之道 Python编程之道 python 开发语言 ai
Python在制造业中的应用：从自动化到智能制造关键词：Python、制造业、工业自动化、数据分析、机器学习、物联网、智能制造摘要：本文深入探讨Python编程语言在制造业中的广泛应用。从基础的自动化脚本到复杂的智能制造系统，Python凭借其丰富的库生态系统和易用性，正在重塑现代制造业。我们将分析Python在制造业中的核心应用场景，包括设备监控、质量控制、预测性维护和供应链优化等，并通过实际案
Python 爬虫实战：自动化获取学术会议数据（会议安排、论文提交等） Python爬虫项目 python 爬虫自动化智能家居数据分析开发语言运维
1.引言学术会议是研究人员获取最新科研成果、发表论文、交流思想的重要平台。对于研究者而言，掌握最新的会议安排、论文提交截止日期、会议议程以及演讲嘉宾等信息至关重要。然而，学术会议信息通常分散在不同的官方网站上，人工查找和整理这些数据既费时又容易遗漏。为了提高效率，我们可以使用Python爬虫自动化获取学术会议数据，包括：会议名称、日期、地点论文提交截止日期会议议程及嘉宾信息论文录用结果重要通知及相
Python条件语句(if-elif-else)的完整用法与嵌套技巧梦幻南瓜 python python 网络服务器
引言条件语句是编程中最基础也是最重要的控制结构之一，它使程序能够根据不同条件执行不同的代码路径。Python中的条件语句以if、elif和else关键字实现，语法简洁但功能强大。本文将全面介绍Python条件语句的各种用法，从基础语法到高级嵌套技巧，通过大量代码示例、对比表格和实际应用场景，帮助你掌握条件语句的精髓。1.条件语句基础1.1基本语法结构Python条件语句的基本结构如下：if条件1:
Python特性：装饰器解决数据库长时间断连问题超龄超能程序猿数据库 python
前言在基于Python的Web应用开发里，数据库连接是极为关键的一环。不过，像网络波动、数据库服务器维护这类因素，都可能造成数据库长时间断连，进而影响应用的正常运作。本文将详细介绍怎样运用retry_on_failure装饰器来解决数据库长时间断连的难题一问题背景在实际开发场景中，应用和数据库之间的连接可能会由于各种缘由中断（长时间系统无人访问，再次访问，数据库连接超时）。当应用尝试执行数据库操作
Python 字符串前缀详解
Python提供了多种字符串前缀，用于改变字符串的创建方式和行为。下面我将全面汇总并详细解释每种字符串前缀的特性、用途和示例。1.原始字符串(RawString)-r前缀语法:r'...'或r"..."作用:禁用字符串中的转义字符反斜杠\被视为普通字符特别适合处理包含大量反斜杠的字符串适用场景:文件路径(特别是Windows路径)正则表达式需要保留反斜杠的任何情况示例:#普通字符串中的转义path
Python中的条件语句：if-else使用指南 AI软件改变生活 Python 数据库前端 python
在编程中，条件语句是控制程序流程的核心工具之一，它允许程序根据不同的条件执行不同的代码块。Python提供了简洁而强大的条件语句语法，其中最常用的就是if-else语句。本文将详细介绍Python中if-else的使用方法、常见用法以及一些高级技巧。1.基本语法if-else语句的基本结构如下：Python复制if条件表达式:#如果条件表达式为True，执行这里的代码块passelse:#如果条件
这么简单的从零到一做HTML 网页，你确定不来看看吗？ paid槮 html 服务器前端
HTML网页的介绍HTML(HypertextMarkupLanguage,超文本标记语言)是一种用于创建网页的标准标记语言,是一种与Python不同的编程语言。网页文件的扩展名通常为,html或.htm,这两种扩展名都可使用,并不会影响文件内容简单的HTML网页框架每一个HTML网页都包含一个基础框架，其他的内容都是在基础框架内进行扩充的。示例代码:这里是标题在这里填入正文这是一个较为基础的HT
Python 2和Python 3的区别？山禾家的猫
Python社区，有这么个怪问题：“学Python到底是学2还是学3？”这个问题就像月经一样每隔断时间就出现在你面前，也成了很多初学者的选择困惑，这个问题的“始作俑者”当然是Python它爹，大家众说纷纭，有说Python2是主流，大公司都在用，你应该学2。也有说Python3才是未来主流，大多数第三方框架已基本支持Python3。个人看法是Python2还会存在很长一段时间（只要那些用Pytho
Python基础和高级【抽取复习】斟的是酒中桃 python 学习
1.Python的深拷贝和浅拷贝有什么区别？浅拷贝【ls.copy()】：将列表的不可变对象【值】复制一份，同时引用其中的可变对象【列表】，共用一个内存地址深拷贝【ls=copy.deepcopy(list)】：完全的复制原可变对象，生成新的可变对象，两个对象互相独立2.列表和元组的区别是什么？1.列表概念：有序序列，使用[]定义，元素之间用，隔开有序序列增删改操作：可以增删改列表的任意元素不可变
[Python]Python中if-else的语法，用法示例 LN花开富贵 Python python 学习笔记嵌入式单片机 opencv
Python中多条件判断通过if-elif-else结构实现，elif是elseif的缩写。一、基础语法结构if条件1:#条件1为真时执行的代码块elif条件2:#条件2为真时执行的代码块elif条件3:#条件3为真时执行的代码块else:#所有条件均不满足时执行的代码块顺序判断，当第一个条件满足时其对应的代码块会被执行，后续elif的条件不在检查，如果都是if语句，那么执行完第一个if后后面的i
python源码下载
python源码下载(2010-12-1823:11)不知道python.org一直被堵在墙外…1、http://ftp.python.org/ftp/python/2、http://www.python.org/ftp/python/
Algorithm 香水浓 java Algorithm
冒泡排序 public static void sort(Integer[] param) { for (int i = param.length - 1; i > 0; i--) { for (int j = 0; j < i; j++) { int current = param[j]; int next = param[j + 1];
mongoDB 复杂查询表达式开窍的石头 mongodb
1:count Pg: db.user.find().count(); 统计多少条数据 2:不等于$ne Pg: db.user.find({_id:{$ne:3}},{name:1,sex:1,_id:0}); 查询id不等于3的数据。 3：大于$gt $gte(大于等于) &n
Jboss Java heap space异常解决方法, jboss OutOfMemoryError : PermGen space 0624chenhong jvm jboss
转自 http://blog.csdn.net/zou274/article/details/5552630 解决办法： window->preferences->java->installed jres->edit jre 把default vm arguments 的参数设为-Xms64m -Xmx512m ----------------
文件上传下载解析相对路径不懂事的小屁孩文件上传
有点坑吧，弄这么一个简单的东西弄了一天多，身边还有大神指导着，网上各种百度着。下面总结一下遇到的问题：文件上传，在页面上传的时候，不要想着去操作绝对路径，浏览器会对客户端的信息进行保护，避免用户信息收到攻击。在上传图片，或者文件时，使用form表单来操作。前台通过form表单传输一个流到后台，而不是ajax传递参数到后台，代码如下: <form action=&
怎么实现qq空间批量点赞换个号韩国红果果 qq
纯粹为了好玩！！逻辑很简单 1 打开浏览器console；输入以下代码。先上添加赞的代码 var tools={}; //添加所有赞 function init(){ document.body.scrollTop=10000; setTimeout(function(){document.body.scrollTop=0;},2000);//加
判断是否为中文灵静志远中文
方法一： public class Zhidao { public static void main(String args[]) { String s = "sdf灭礌 kjl d{';\fdsjlk是"; int n=0; for(int i=0; i<s.length(); i++) { n = (int)s.charAt(i); if((
一个电话面试后总结 a-john 面试
今天，接了一个电话面试，对于还是初学者的我来说，紧张了半天。面试的问题分了层次，对于一类问题，由简到难。自己觉得回答不好的地方作了一下总结：在谈到集合类的时候，举几个常用的集合类，想都没想，直接说了list,map。然后对list和map分别举几个类型： list方面：ArrayList,LinkedList。在谈到他们的区别时，愣住了
MSSQL中Escape转义的使用 aijuans MSSQL
IF OBJECT_ID('tempdb..#ABC') is not null drop table tempdb..#ABC create table #ABC ( PATHNAME NVARCHAR(50) ) insert into #ABC SELECT N'/ABCDEFGHI' UNION ALL SELECT N'/ABCDGAFGASASSDFA' UNION ALL
一个简单的存储过程 asialee mysql 存储过程构造数据批量插入
今天要批量的生成一批测试数据，其中中间有部分数据是变化的，本来想写个程序来生成的，后来想到存储过程就可以搞定，所以随手写了一个，记录在此： DELIMITER $$ DROP PROCEDURE IF EXISTS inse
annot convert from HomeFragment_1 to Fragment 百合不是茶 android 导包错误
创建了几个类继承Fragment, 需要将创建的类存储在ArrayList<Fragment>中; 出现不能将new 出来的对象放到队列中,原因很简单; 创建类时引入包是:import android.app.Fragment; 创建队列和对象时使用的包是:import android.support.v4.ap
Weblogic10两种修改端口的方法 bijian1013 weblogic 端口号配置管理 config.xml
一.进入控制台进行修改 1.进入控制台: http://127.0.0.1:7001/console 2.展开左边树菜单域结构->环境->服务器-->点击AdminServer(管理) &
mysql 操作指令征客丶 mysql
一、连接mysql 进入 mysql 的安装目录； $ bin/mysql -p [host IP 如果是登录本地的mysql 可以不写 -p 直接 -u] -u [userName] -p 输入密码，回车，接连；二、权限操作［如果你很了解mysql数据库后，你可以直接去修改系统表，然后用 mysql> flush privileges; 指令让权限生效］ 1、赋权 mys
【Hive一】Hive入门 bit1129 hive
Hive安装与配置 Hive的运行需要依赖于Hadoop，因此需要首先安装Hadoop2.5.2，并且Hive的启动前需要首先启动Hadoop。 Hive安装和配置的步骤 1. 从如下地址下载Hive0.14.0 http://mirror.bit.edu.cn/apache/hive/ 2.解压hive，在系统变
ajax 三种提交请求的方法 BlueSkator Ajax jqery
1、ajax 提交请求 $.ajax({ type:"post", url : "${ctx}/front/Hotel/getAllHotelByAjax.do", dataType : "json", success : function(result) { try { for(v
mongodb开发环境下的搭建入门 braveCS 运维
linux下安装mongodb 1）官网下载mongodb-linux-x86_64-rhel62-3.0.4.gz 2）linux 解压 gzip -d mongodb-linux-x86_64-rhel62-3.0.4.gz; mv mongodb-linux-x86_64-rhel62-3.0.4 mongodb-linux-x86_64-rhel62-
编程之美-最短摘要的生成 bylijinnan java 数据结构算法编程之美
import java.util.HashMap; import java.util.Map; import java.util.Map.Entry; public class ShortestAbstract { /** * 编程之美最短摘要的生成 * 扫描过程始终保持一个[pBegin,pEnd]的range,初始化确保[pBegin,pEnd]的ran
json数据解析及typeof chengxuyuancsdn js typeof json解析
// json格式 var people='{"authors": [{"firstName": "AAA","lastName": "BBB"},' +' {"firstName": "CCC&
流程系统设计的层次和目标 comsci 设计模式数据结构 sql 框架脚本
流程系统设计的层次和目标
RMAN List和report 命令 daizj oracle list report rman
LIST 命令使用RMAN LIST 命令显示有关资料档案库中记录的备份集、代理副本和映像副本的信息。使用此命令可列出： • RMAN 资料档案库中状态不是AVAILABLE 的备份和副本 • 可用的且可以用于还原操作的数据文件备份和副本 • 备份集和副本，其中包含指定数据文件列表或指定表空间的备份 • 包含指定名称或范围的所有归档日志备份的备份集和副本 • 由标记、完成时间、可
二叉树:红黑树 dieslrae 二叉树
红黑树是一种自平衡的二叉树,它的查找,插入,删除操作时间复杂度皆为O(logN),不会出现普通二叉搜索树在最差情况时时间复杂度会变为O(N)的问题. 红黑树必须遵循红黑规则,规则如下 1、每个节点不是红就是黑。 2、根总是黑的 &
C语言homework3，7个小题目的代码 dcj3sjt126com c
1、打印100以内的所有奇数。 # include <stdio.h> int main(void) { int i; for (i=1; i<=100; i++) { if (i%2 != 0) printf("%d ", i); } return 0; } 2、从键盘上输入10个整数，
自定义按钮, 图片在上, 文字在下, 居中显示 dcj3sjt126com 自定义
#import <UIKit/UIKit.h> @interface MyButton : UIButton -(void)setFrame:(CGRect)frame ImageName:(NSString*)imageName Target:(id)target Action:(SEL)action Title:(NSString*)title Font:(CGFloa
MySQL查询语句练习题，测试足够用了 flyvszhb sql mysql
http://blog.sina.com.cn/s/blog_767d65530101861c.html 1.创建student和score表 CREATE TABLE student ( id INT(10) NOT NULL UNIQUE PRIMARY KEY , name VARCHAR
转：MyBatis Generator 详解 happyqing mybatis
MyBatis Generator 详解 http://blog.csdn.net/isea533/article/details/42102297 MyBatis Generator详解 http://git.oschina.net/free/Mybatis_Utils/blob/master/MybatisGeneator/MybatisGeneator.
让程序员少走弯路的14个忠告 jingjing0907 工作计划学习
无论是谁，在刚进入某个领域之时，有再大的雄心壮志也敌不过眼前的迷茫：不知道应该怎么做，不知道应该做什么。下面是一名软件开发人员所学到的经验，希望能对大家有所帮助 1.不要害怕在工作中学习。只要有电脑，就可以通过电子阅读器阅读报纸和大多数书籍。如果你只是做好自己的本职工作以及分配的任务，那是学不到很多东西的。如果你盲目地要求更多的工作，也是不可能提升自己的。放
nginx和NetScaler区别流浪鱼 nginx
NetScaler是一个完整的包含操作系统和应用交付功能的产品，Nginx并不包含操作系统，在处理连接方面，需要依赖于操作系统，所以在并发连接数方面和防DoS攻击方面，Nginx不具备优势。 2.易用性方面差别也比较大。Nginx对管理员的水平要求比较高，参数比较多，不确定性给运营带来隐患。在NetScaler常见的配置如健康检查，HA等，在Nginx上的配置的实现相对复杂。 3.策略灵活度方
第11章动画效果（下） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
FAQ - SAP BW BO roadmap blueoxygen BO BW
http://www.sdn.sap.com/irj/boc/business-objects-for-sap-faq Besides, I care that how to integrate tightly. By the way, for BW consultants, please just focus on Query Designer which i
关于java堆内存溢出的几种情况 tomcat_oracle java jvm jdk thread
【情况一】：　　 java.lang.OutOfMemoryError: Java heap space：这种是java堆内存不够，一个原因是真不够，另一个原因是程序中有死循环；　　如果是java堆内存不够的话，可以通过调整JVM下面的配置来解决：　　<jvm-arg>-Xms3062m</jvm-arg> 　　<jvm-arg>-Xmx
Manifest.permission_group权限组阿尔萨斯 Permission
结构继承关系 public static final class Manifest.permission_group extends Object java.lang.Object android. Manifest.permission_group 常量 ACCOUNTS 直接通过统计管理器访问管理的统计 COST_MONEY可以用来让用户花钱但不需要通过与他们直接牵涉的权限 D