知行流浪

Python网络爬虫基础及Requests库入门

Robots协议

网络爬虫的问题

在讲python网络爬虫之前，先来看看网络爬虫的一些问题以及robots协议。首先python爬虫功能主要使用的库有Requests库和Scrapy库。他们的区别如下：

正常情况下Web服务器默认接收人类访问，受限于编写水平和目的，网络爬虫将会带来一些问题：

1、性能骚扰：为Web服务器带来巨大的资源开销；

2、法律风险：服务器上的数据有产权归属网络爬虫获取数据后牟利将带来法律风险；

3、隐私泄露：网络爬虫可能具备突破简单访问控制的能力，获得被保护数据从而泄露个人隐私。

网络爬虫的限制

1、来源审查：判断User‐Agent进行限制。检查来访HTTP协议头的User‐Agent域，只响应浏览器或友好爬虫的访问。

2、发布公告：Robots协议。告知所有爬虫网站的爬取策略，要求爬虫遵守。

Robots协议：Robots Exclusion Standard，网络爬虫排除标准。作用：网站告知网络爬虫哪些页面可以抓取，哪些不行。形式：在网站根目录下的robots.txt文件。

例如下面一些真实的robots协议文件：

http://www.baidu.com/robots.txt

http://news.sina.com.cn/robots.txt

http://www.qq.com/robots.txt

http://www.moe.edu.cn/robots.txt (页面不存在，表示带网站没有robots协议，所以它对爬虫默认没有任何限制)。

我们访问http://www.jd.com/robots.txt，可以得到如下的内容:

User‐agent: *

Disallow: /?*

Disallow: /pop/*.html

Disallow: /pinpai/*.html?*

User‐agent: EtaoSpider

Disallow: /

User‐agent: HuihuiSpider

Disallow: /

User‐agent: GwdangSpider

Disallow: /

User‐agent: WochachaSpider

Disallow: /

Robots协议基本语法：

# 注释，*代表所有，/代表根目录

User‐agent: *

Disallow: /

那么在实际的应用中，我们该如何使用robots协议呢？网络爬虫首先应该自动或人工识别robots.txt，再进行内容爬取。需要注意的是：robots协议的约束性：Robots协议是建议但非约束性，网络爬虫可以不遵守，但可能存在法律风险。下面的使用原则可以参考：

Http协议

我们要进行网络内容的获取，必须首先对HTTP协议有一个简单的了解。HTTP，Hypertext Transfer Protocol，超文本传输协议。HTTP是一个基于“请求与响应”模式的、无状态的应用层协议。HTTP协议采用URL作为定位网络资源的标识，URL格式如下：

http://host[:port][path]。

host: 合法的Internet主机域名或IP地址；

port: 端口号，缺省端口为80；

path: 请求资源的路径。

HTTP URL实例：

http://www.bit.edu.cn

http://220.181.111.188/duty

HTTP URL的理解：URL是通过HTTP协议存取资源的Internet路径，一个URL对应一个数据资源。

HTTP协议对资源的操作主要有如下几个方法：

GET：请求获取URL位置的资源；

HEAD：请求获取URL位置资源的响应消息报告，即获得该资源的头部信息；

POST：请求向URL位置的资源后附加新的数据；

PUT：请求向URL位置存储一个资源，覆盖原URL位置的资源；

PATCH：请求局部更新URL位置的资源，即改变该处资源的部分内容；

DELETE：请求删除URL位置存储的资源。

其中PATCH和PUT的区别需要注意：假设URL位置有一组数据UserInfo，包括UserID、UserName等20个字段。现在的需求是：用户修改了UserName，其他字段不变。

1、采用PATCH，仅向URL提交UserName的局部更新请求；

2、采用PUT，必须将所有20个字段一并提交到URL，未提交字段被删除。

因此PATCH的最主要好处：节省网络带宽。

关于HTTP协议更加详细的信息：HTTP协议详解

Requests库入门

首先Requests库的安装使用python自带的工具pip即可：pip install requests。

pip工具在python的：D:\ProgramFiles (x86)\Python36\Scripts目录下。

Requests库基于Http协议实现，可以很方便的实现http对url的各种请求，同时可以很方便得处理http的返回结果。因此Requests库的功能基本上和Http的操作对应。如下表是Requests库的7个主要方法。

Requests库的7个主要方法

方法	说明
requests.request()	构造一个请求，支撑以下各方法的基础方法
requests.get()	获取HTML网页的主要方法，对应于HTTP的GET
requests.head()	获取HTML网页头信息的方法，对应于HTTP的HEAD
requests.post()	向HTML网页提交POST请求的方法，对应于HTTP的POST
requests.put()	向HTML网页提交PUT请求的方法，对应于HTTP的PUT
requests.patch()	向HTML网页提交局部修改请求，对应于HTTP的PATCH
requests.delete()	向HTML页面提交删除请求，对应于HTTP的DELETE

上述的7个方法中除了requests.request()方法，其余六个都和HTTP协议的操作方法对于，而request()方法正是其它6个方法的基础，其他方法都调用了request()方法来具体实现。所以首先来看看request()方法：

requests.request(method, url,**kwargs)

1、method：请求方式，对应get/put/post等7种；

2、url：拟获取页面的url链接；

3、**kwargs：控制访问的参数，共13个。

**kwargs: 控制访问的参数，均为可选项，下面逐个介绍：

(1)、Params：字典或字节序列，作为参数增加到url中。

kv = {'key1': 'value1', 'key2': 'value2'}

r = requests.request('GET', 'http://python123.io/ws', params=kv)

print(r.url)

http://python123.io/ws?key1=value1&key2=value2

(2)、data：字典、字节序列或文件对象，作为Request的内容。

kv = {'key1': 'value1', 'key2': 'value2'}

r = requests.request('POST', 'http://python123.io/ws', data=kv)

body = '主体内容'

r = requests.request('POST', 'http://python123.io/ws',data=body)

(3)、json：JSON格式的数据，作为Request的内容。

kv = {'key1': 'value1'}

r = requests.request('POST', 'http://python123.io/ws', json=kv)

(4)、headers：字典，HTTP定制头。

hd = {'user‐agent':'Chrome/10'}

r = requests.request('POST', 'http://python123.io/ws',headers=hd)

(5)、files：字典类型，传输文件。

fs = {'file': open('data.xls', 'rb')}

r = requests.request('POST', 'http://python123.io/ws', files=fs)

(6)、timeout：设定超时时间，秒为单位。

r = requests.request('GET', 'http://www.baidu.com', timeout=10)

(7)、proxies：字典类型，设定访问代理服务器，可以增加登录认证。

pxs = { 'http': 'http://user:[email protected]:1234' 'https': 'https://10.10.10.1:4321' }

r = requests.request('GET', 'http://www.baidu.com', proxies=pxs)

(8)、cookies：字典或CookieJar，Request中的cookie。

(9)、auth：元组，支持HTTP认证功能。

(10)、allow_redirects：True/False，默认为True，重定向开关。

(11)、stream：True/False，默认为True，获取内容立即下载开关。

(12)、verify：True/False，默认为True，认证SSL证书开关。

(13)、cert：本地SSL证书路径。

可以简单理解Requests库中的其他方法，其参数为url和**kwargs，其意义和request方法完全一样。其中具体的方法可能会将kwargs中常用的参数拿出来单独最为一个参数，例如：requests.put(url,data=None, **kwargs)。在具体使用中，由于13个**kwargs参数都是可选的，所以具体给值的时候要将参数名称带上，例如timeout=10。

Response对象

首先我们来看一个小程序：

#coding=utf-8
'''
Created on 2017年10月13日
 
@author: Administrator
'''
importrequests
 
r = requests.get("http://www.baidu.com");
 
# 打印Http协议返回的状态码
print(r.status_code);
 
# Response对象包含服务器返回的所有信息，也包含请求的Request信息
print(type(r));
 
print(r.headers);

程序输出的内容如下：

200

{'Server': 'bfe/1.0.8.18', 'Date':'Fri, 13 Oct 2017 09:51:10 GMT', 'Content-Type': 'text/html', 'Last-Modified':'Mon, 23 Jan 2017 13:27:36 GMT', 'Transfer-Encoding': 'chunked', 'Connection':'Keep-Alive', 'Cache-Control': 'private, no-cache, no-store, proxy-revalidate,no-transform', 'Pragma': 'no-cache', 'Set-Cookie': 'BDORZ=27315; max-age=86400;domain=.baidu.com; path=/', 'Content-Encoding': 'gzip'}

从上面的代码中可以看到requests.get()方法返回的类型是：Response对象。可以这样理解Request库中的方法是构造一个向服务器请求资源的Request对象，而方法的返回就是一个包含服务器资源的Response对象。Response对象包含爬虫返回的内容， Response对象包含服务器返回的所有信息，也包含请求的Request信息。

Response对象的属性

属性	说明
r.status_code	HTTP请求的返回状态，200表示连接成功，404表示失败
r.text	HTTP响应内容的字符串形式，即，url对应的页面内容
r.encoding	从HTTP header中猜测的响应内容编码方式
r.apparent_encoding	从内容中分析出的响应内容编码方式（备选编码方式）
r.content	HTTP响应内容的二进制形式

理解Response编码

看下面的例子：

#coding=utf-8
'''
Created on 2017年10月13日
 
@author: Administrator
'''
importrequests
 
r = requests.get("http://www.baidu.com");
 
# 打印Http协议返回的状态码
print(r.status_code);
 
# 从HTTP header中猜测的响应内容编码方式
print(r.encoding);
# 输出网页的内容
print(r.text);
 
 
# 根据网页内容分析出的编码方式，可以看作是r.encoding的备选
print(r.apparent_encoding);
r.encoding = "utf-8";
# r.encoding = r.apparent_encoding
# 输出网页的内容
print(r.text);

程序结果：

从上面的结果可以看出，我们直接输出get方法返回的内容会出现乱码现象。那是因为r.text是以r.encoding来编码来显示网页内容的，r.encoding：从HTTP header中猜测的响应内容编码方式，如果header中不存在charset，则认为编码为ISO‐8859‐1。所以这里的编码方法不一样，导致了乱码。r.apparent_encoding：根据网页内容分析出的编码方式，将r.encoding修改为utf-8编码，或者直接修改为r.apparent_encoding，即可以正确显示内容。或者可以使用content返回的二进制内容，对其进行编码：response.content.decode("utf-8")，所以这样也可以解决乱码问题。

Request库的异常处理

网络连接有风险，异常处理很重要。从上面的例子我们可以看到get方法返回的Response对象有status_code属性，该属性表示HTTP请求的状态。而HTTP请求并不一定都是成功的。常见的HTTP请求状态码有如下一些：

200 OK //客户端请求成功

400 Bad Request //客户端请求有语法错误，不能被服务器所理解

401 Unauthorized //请求未经授权，这个状态代码必须和WWW-Authenticate报头域一起使用

403 Forbidden //服务器收到请求，但是拒绝提供服务

404 Not Found //请求资源不存在，eg：输入了错误的URL

500 Internal Server Error //服务器发生不可预期的错误

503 Server Unavailable //服务器当前不能处理客户端的请求，一段时间后可能恢复正常

针对不同的返回状态，Requests库也定义了一些相应的异常。

异常	说明
requests.ConnectionError	网络连接错误异常，如DNS查询失败、拒绝连接等
requests.HTTPError	HTTP错误异常
requests.URLRequired	URL缺失异常
requests.TooManyRedirects	超过最大重定向次数，产生重定向异常
requests.ConnectTimeout	连接远程服务器超时异常
requests.Timeout	请求URL超时，产生超时异常

所以在使用Requests库方法时，需要首先判断其返回的Response的状态，即只有r.status_code的值为200时才能进行后面的一系列操作。为了简便操作，Response对象中r.raise_for_status()在方法内部判断r.status_code是否等于200，不需要增加额外的if语句，该语句便于利用try‐except进行异常处理。raise_for_status()方法：如果状态码不是200，则产生异常 requests.HTTPError。所以一般通用的网络爬虫代码框架如下：

#coding=utf-8
'''
Created on 2017年10月13日
 
@author: Administrator
'''
importrequests
 
def getHtmlText(url):
   try:
        r = requests.get(url, timeout=30);
        r.raise_for_status(); # 如果状态码不是200，则产生异常 requests.HTTPError。
        r.encoding = r.apparent_encoding
        return r.text;
   
   except:
        return "发生异常";
 
if__name__ == "__main__":
   # 正常爬取
   url = "http://www.baidu.com";
   print(getHtmlText(url));
   
   # 发生异常
   url1 = "www.baidu.com";
    print(getHtmlText(url1));

爬虫小实例

1、实例1：京东商品页面的爬取

#coding=utf-8
'''
Created on 2017年10月13日
 
@author: Administrator
'''
importrequests
 
def getHtmlText(url):
   try:
        r = requests.get(url, timeout=30);
        r.raise_for_status(); # 如果状态码不是200，则产生异常 requests.HTTPError。
        r.encoding = r.apparent_encoding
        return r.text[:1000];
   
   except:
        return "发生异常";
 
if__name__ == "__main__":
   url = "https://item.jd.com/2967929.html";
    print(getHtmlText(url));

2、实例2：亚马逊商品页面的爬取

#coding=utf-8
'''
Created on 2017年10月13日
 
@author: Administrator
'''
importrequests
 
def getHtmlText(url):
   try:
        r = requests.get(url, timeout=30);
        r.raise_for_status(); # 如果状态码不是200，则产生异常 requests.HTTPError。
        r.encoding = r.apparent_encoding
        return r.text[:1000];
   
   except:
        return "发生异常";
 
if__name__ == "__main__":
   # 这是一个有效的亚马逊商品链接，但是爬取的时候发生异常
   # url ="https://www.amazon.cn/gp/product/B01M8L5Z3Y";
   # print(getHtmlText(url));
   
   # 发生异常的原因在于亚马逊会检测 HTTP请求的头部，来判断是否是爬虫，所以我们需要通过修改HTTP请求的头部
   try:
        kv = {'user-agent':'Mozilla/5.0'}; # 告诉服务器，其实我是一个浏览器的访问
        r = requests.get("https://www.amazon.cn/gp/product/B01M8L5Z3Y", headers=kv);
        r.raise_for_status(); # 如果状态码不是200，则产生异常 requests.HTTPError。
        r.encoding = r.apparent_encoding
        print(r.text[:]);
   
   except:
        print("发生异常");

3、实例3：百度/360搜索关键字提交

#coding=utf-8
'''
Created on 2017年10月13日
 
@author: Administrator
'''
importrequests
 
if__name__ == "__main__":
   # 百度的关键词接口：http://www.baidu.com/s?wd=keyword
   # 360的关键词接口：http://www.so.com/s?q=keyword
   
   keyword = 'python';
   try:
        kv = {'wd':keyword};
        #params参数：作为参数增加到url中
        r = requests.get("http://www.baidu.com/s", params=kv);
        print(r.url);
        r.raise_for_status(); # 如果状态码不是200，则产生异常 requests.HTTPError。
        r.encoding = r.apparent_encoding
        print(r.text[:]);
   
   except:
        print("发生异常");
       
   try:
        kv = {'q':keyword};
        #params参数：作为参数增加到url中
        r1 = requests.get("http://www.so.com/s", params=kv);
        print(r1.url);
        r1.raise_for_status(); # 如果状态码不是200，则产生异常 requests.HTTPError。
        r1.encoding = r1.apparent_encoding
        print(r1.text[:]);
   
   except:
        print("发生异常");

4、实例4：网络图片的爬取和存储

#coding=utf-8
'''
Created on 2017年10月13日
 
@author: Administrator
'''
importrequests
importos
 
if__name__ == "__main__":
   # 一个图片的url：http://image.nationalgeographic.com.cn/2017/1009/20171009021008825.jpg，将它爬取下来
   url = "http://image.nationalgeographic.com.cn/2017/1009/20171009021008825.jpg";
   
   path = url.split("/")[-1]; #保存在当前目录下
   
   try:
        if notos.path.exists(path):
            r = requests.get(url);
            with open(path, 'wb')as f:
                f.write(r.content);
                f.close();
                print("文件保存成功");
           
        else:
            print("文件已经存在");
   
    except:
        print("爬取失败");

5、实例5：IP地址归属地的自动查询

#coding=utf-8
'''
Created on 2017年10月13日
 
@author: Administrator
'''
importrequests
 
if__name__ == "__main__":
   # 一个查询IP地址归属的url
   url = "http://www.ip138.com/ips138.asp?ip=";
 
   try:
        r = requests.get(url+"202.204.80.112");
        r.raise_for_status();
        r.encoding = r.apparent_encoding;
        print(r.text);
   
   except:
        print("爬取失败");

你可能感兴趣的:(Python,Python数据分析,python,网络爬虫,http协议,requests库,response)

Python - 数据分析三剑客之Pandas MinggeQingchun Python Python Pandas
阅读前可参考NumPy文章https://blog.csdn.net/MinggeQingchun/article/details/148253682https://blog.csdn.net/MinggeQingchun/article/details/148253682‌Pandas是Python中一个强大的开源数据分析库，专门用于处理结构化数据（如表格、时间序列等），其核心数据结构为Seri
Java 领域 MyBatis 与数据库连接池的搭配使用 Java技术栈实战 java mybatis 数据库 ai
Java领域MyBatis与数据库连接池的搭配使用关键词：MyBatis、数据库连接池、Java持久层、性能优化、Druid、HikariCP、Spring集成摘要：本文深入探讨Java领域中MyBatis框架与数据库连接池的搭配使用原理和实践。文章从基础概念入手，详细分析MyBatis的工作原理和数据库连接池的核心机制，重点讲解两者如何协同工作以提升应用性能。通过源码解析、性能对比和实际项目案例
全局 WAF 规则：构筑 Web 安全的坚固防线 2501_91022519 安全网络
定义：全局WAF（Web应用防火墙）规则是指在WAF系统中对所有受保护的Web应用或整个网络环境生效的通用防护策略，旨在覆盖常见的Web攻击向量、合规要求及基础安全基线，减少重复配置并确保整体防护的一致性。配置原则：最小权限：仅允许必要的请求行为（如默认阻断所有不常见HTTP方法），减少攻击面。动态更新：定期根据新漏洞（如Log4j、Spring漏洞）、攻击趋势更新规则库（如新增对特定EXP的检测
Java实现端到端加密终极指南：密钥管理与分发的深度解析墨夶 Java学习资料4 java python 开发语言
一、为什么选择Java实现端到端加密？企业级可靠性：Java生态提供BouncyCastle等成熟加密库，支持国密SM2/SM4及国际标准算法。全栈可控：从密钥生成到存储、分发、销毁，全程代码可审计，符合GDPR等安全规范。扩展性强：可集成HSM硬件安全模块，支持密钥轮换策略与前向安全性设计。二、核心代码实战：密钥管理与分发全流程2.1密钥生成与存储（国密SM2算法）importorg.bounc
python网络爬虫(第一章/共三章：网络爬虫库、robots.txt规则（防止犯法）、查看获取网页源代码)
python网络爬虫(第一章/共三章：网络爬虫库、robots.txt规则（防止犯法）、查看获取网页源代码)学习python网络爬虫的完整路径：（第一章即此篇文章）（第二章）python网络爬虫(第二章/共三章：安装浏览器驱动，驱动浏览器加载网页、批量下载资源)-CSDN博客https://blog.csdn.net/2302_78022640/article/details/149431071?
mac mlx大模型框架的安装和使用 liliangcsdn python java 前端人工智能 macos
mlx是apple平台的大模型推理框架，对macm1系列处理器支持较好。这里记录mlx安装和运行示例。1安装mlx框架condacreate-nmlxpython=3.12condaactivatemlxpipinstallmlx-lm2运行mlx测试例以下是测试程序，使用方法和hf、vllm等推理框架基本一致。importosos.environ['HF_ENDPOINT']="https://
【MySQL基础】MySQL事务详解：原理、特性与实战应用 GG Bond.ฺ MySQL学习 mysql 数据库
MySQL学习：https://blog.csdn.net/2301_80220607/category_12971838.html?spm=1001.2014.3001.5482前言：事务是数据库管理系统的核心概念之一，它确保了数据库操作的可靠性和一致性。本文将深入探讨MySQL事务的各个方面，包括基本概念、ACID特性、隔离级别、锁机制以及实战应用。目录一、事务的基本概念1.1什么是事务？1.
系统学习Python——并发模型和异步编程：进程、线程和GIL
分类目录：《系统学习Python》总目录在文章《并发模型和异步编程：基础知识》我们简单介绍了Python中的进程、线程和协程。本文就着重介绍Python中的进程、线程和GIL的关系。Python解释器的每个实例都是一个进程。使用multiprocessing或concurrent.futures库可以启动额外的Python进程。Python的subprocess库用于启动运行外部程序（不管使用何种
Flask框架入门：快速搭建轻量级Python网页应用「已注销」 python-AI python基础网站网络 python flask 后端
转载：Flask框架入门：快速搭建轻量级Python网页应用1.Flask基础Flask是一个使用Python编写的轻量级Web应用框架。它的设计目标是让Web开发变得快速简单，同时保持应用的灵活性。Flask依赖于两个外部库：Werkzeug和Jinja2，Werkzeug作为WSGI工具包处理Web服务的底层细节，Jinja2作为模板引擎渲染模板。安装Flask非常简单，可以使用pip安装命令
Python Flask 框架入门：快速搭建 Web 应用的秘诀 Python编程之道 Python人工智能与大数据 Python编程之道 python flask 前端 ai
PythonFlask框架入门：快速搭建Web应用的秘诀关键词Flask、微框架、路由系统、Jinja2模板、请求处理、WSGI、Web开发摘要想快速用Python搭建一个灵活的Web应用？Flask作为“微框架”代表，凭借轻量、可扩展的特性，成为初学者和小型项目的首选。本文将从Flask的核心概念出发，结合生活化比喻、代码示例和实战案例，带你一步步掌握：如何用Flask搭建第一个Web应用？路由
k8s:安装 Helm 私有仓库ChartMuseum、helm-push插件并上传、安装Zookeeper 云游 docker helm helm-push
ChartMuseum是Kubernetes生态中用于存储、管理和发布HelmCharts的开源系统，主要用于扩展Helm包管理器的功能核心功能‌集中存储‌：提供中央化仓库存储Charts，支持版本管理和权限控制。‌‌跨集群部署‌：支持多集群环境下共享Charts，简化部署流程。‌‌离线部署‌：适配无网络环境，可将Charts存储在本地或局域网内。‌‌HTTP接口‌：通过HTTP协议提供服务，用户
Guava LoadingCache sqyaa. java并发编程 Java知识 jvm 缓存 guava
LoadingCache是GoogleGuava库提供的一个高级缓存实现，它通过自动加载机制简化了缓存使用模式。核心特性自动加载机制当缓存未命中时，自动调用指定的CacheLoader加载数据线程安全：并发请求下，相同key只会加载一次灵活的过期策略支持基于写入时间(expireAfterWrite)和访问时间(expireAfterAccess)的过期可设置最大缓存大小，基于LRU策略淘汰丰富的
python_虚拟环境阿_焦 python
第一、配置虚拟环境：virtualenv（1）pipvirtualenv>安装虚拟环境包（2）pipinstallvirtualenvwrapper-win>安装虚拟环境依赖包（3）c盘创建虚拟目录>C:\virtualenv>配置环境变量【了解一下】：（1）如何使用virtualenv创建虚拟环境a、cd到C:\virtualenv目录下：b、mkvirtualenvname>创建虚拟环境nam
Android 开源组件和第三方库汇总 gyyzzr Android Android 开源框架
转载1、github排名https://github.com/trending,github搜索：https://github.com/search2、https://github.com/wasabeef/awesome-android-ui目录UIUI卫星菜单节选器下拉刷新模糊效果HUD与Toast进度条UI其它动画网络相关响应式编程地图数据库图像浏览及处理视频音频处理测试及调试动态更新热更新
Python爱心光波
系列文章序号直达链接Tkinter1Python李峋同款可写字版跳动的爱心2Python跳动的双爱心3Python蓝色跳动的爱心4Python动漫烟花5Python粒子烟花Turtle1Python满屏飘字2Python蓝色流星雨3Python金色流星雨4Python漂浮爱心5Python爱心光波①6Python爱心光波②7Python满天繁星8Python五彩气球9Python白色飘雪10Pyt
Python流星雨 Want595 python 开发语言
文章目录系列文章写在前面技术需求完整代码代码分析1.模块导入2.画布设置3.画笔设置4.颜色列表5.流星类(Star)6.流星对象创建7.主循环8.流星运动逻辑9.视觉效果10.总结写在后面系列文章序号直达链接表白系列1Python制作一个无法拒绝的表白界面2Python满屏飘字表白代码3Python无限弹窗满屏表白代码4Python李峋同款可写字版跳动的爱心5Python流星雨代码6Python
Python之七彩花朵代码实现 PlutoZuo Python python 开发语言
Python之七彩花朵代码实现文章目录Python之七彩花朵代码实现下面是一个简单的使用Python的七彩花朵。这个示例只是一个简单的版本，没有很多高级功能，但它可以作为一个起点，你可以在此基础上添加更多功能。importturtleastuimportrandomasraimportmathtu.setup(1.0,1.0)t=tu.Pen()t.ht()colors=['red','skybl
Python 脚本最佳实践2025版
前文可以直接把这篇文章喂给AI,可以放到AI角色设定里,也可以直接作为提示词.这样,你只管提需求,写脚本就让AI来.概述追求简洁和清晰：脚本应简单明了。使用函数(functions)、常量(constants)和适当的导入(import)实践来有逻辑地组织你的Python脚本。使用枚举(enumerations)和数据类(dataclasses)等数据结构高效管理脚本状态。通过命令行参数增强交互性
（Python基础篇）了解和使用分支结构 EternityArt 基础篇 python
目录一、引言二、Python分支结构的类型与语法（一）if语句（单分支）（二）if-else语句（双分支）（三）if-elif-else语句（多分支）三、分支结构的应用场景（一）提示用户输入用户名，然后再提示输入密码，如果用户名是“admin”并且密码是“88888”则提示正确，否则，如果用户名不是admin还提示用户用户名不存在,（二）提示用户输入用户名，然后再提示输入密码，如果用户名是“adm
（Python基础篇）循环结构 EternityArt 基础篇 python
一、什么是Python循环结构？循环结构是编程中重复执行代码块的机制。在Python中，循环允许你：1.迭代处理数据：遍历列表、字典、文件内容等。2.自动化重复任务：如批量处理数据、生成序列等。3.控制执行流程：根据条件决定是否继续或终止循环。二、为什么需要循环结构？假设你需要打印1到100的所有偶数：没有循环：需手动编写100行print()语句。print(0)print(2)print(4)
（Python基础篇）字典的操作 EternityArt 基础篇 python 开发语言
一、引言在Python编程中，字典（Dictionary）是一种极具灵活性的数据结构，它通过“键-值对”（key-valuepair）的形式存储数据，如同现实生活中的字典——通过“词语（键）”快速查找“释义（值）”。相较于列表和元组的有序索引访问，字典的优势在于基于键的快速查找，这使得它在处理需要频繁通过唯一标识获取数据的场景中极为高效。掌握字典的操作，能让我们更高效地组织和管理复杂数据，是Pyt
Python七彩花朵 Want595 python 开发语言
系列文章序号直达链接Tkinter1Python李峋同款可写字版跳动的爱心2Python跳动的双爱心3Python蓝色跳动的爱心4Python动漫烟花5Python粒子烟花Turtle1Python满屏飘字2Python蓝色流星雨3Python金色流星雨4Python漂浮爱心5Python爱心光波①6Python爱心光波②7Python满天繁星8Python五彩气球9Python白色飘雪10Pyt
CentOS7环境卸载MySQL5.7 Hadoop_Liang mysql 数据库 mysql
备份重要数据切记，卸载之前先备份mysql重要的数据。备份一个数据库例如：备份名为mydatabase的数据库到backup.sql的文件中mysqldump-uroot-ppassword123mydatabase>backup.sql备份所有数据库mysqldump-uroot-ppassword123--all-databases>all_databases_backup.sql注意：-p后
php SPOF 贵哥的编程之路(热爱分享为后来者) PHP语言经典程序100题 php 开发语言
1.什么是单点故障（SPOF）？单点故障指的是系统中某个组件一旦失效，整个系统或服务就会不可用。常见的单点有：数据库、缓存、Web服务器、负载均衡、网络设备等。2.常见单点故障场景只有一台数据库服务器，宕机后所有业务不可用只有一台Redis缓存，挂掉后缓存全部失效只有一台Web服务器，挂掉后网站无法访问只有一个负载均衡节点，挂掉后流量无法分发只有一条网络链路，断开后所有服务失联3.消除单点故障的主
用OpenCV标定相机内参应用示例（C++和Python）
下面是一个完整的使用OpenCV进行相机内参标定（CameraCalibration）的示例，包括C++和Python两个版本，基于棋盘格图案标定。一、目标：相机标定通过拍摄多张带有棋盘格图案的图像，估计相机的内参：相机矩阵（内参）K畸变系数distCoeffs可选外参（R,T）标定精度指标（如重投影误差）二、棋盘格参数设置（根据自己的棋盘格设置）：棋盘格角点数：9x6（内角点，9列×6行）；每个
centos7安装 mysql5.7(安装包) heiPony linux mysql mariadb centos mysql
一.卸载centos7自带数据库查看系统自带的Mariadbrpm-qa|grepmariadbmariadb-libs-5.5.44-2.el7.centos.x86_64卸载rpm-e--nodepsmariadb-libs-5.5.44-2.el7.centos.x86_64删除etc目录下的my.cnfrm/etc/my.cnf二.检查mysql是否存在(有就卸载,删除相关文件)rpm-q
Anaconda 详细下载与安装教程
Anaconda详细下载与安装教程1.简介Anaconda是一个用于科学计算的开源发行版，包含了Python和R的众多常用库。它还包括了conda包管理器，可以方便地安装、更新和管理各种软件包。2.下载Anaconda2.1访问官方网站首先，打开浏览器，访问Anaconda官方网站。2.2选择适合的版本在页面中，你会看到两个主要的下载选项：AnacondaIndividualEdition：适用于
MySQL Explain 详解：从入门到精通，让你的 SQL 飞起来
引言：为什么Explain是SQL优化的“照妖镜”？在Java开发中，我们常常会遇到数据库性能瓶颈的问题。一条看似简单的SQL语句，在数据量增长到一定规模后，可能会从毫秒级响应变成秒级甚至分钟级响应，直接拖慢整个应用的性能。此时，你是否曾困惑于：为什么这条SQL突然变慢了？索引明明建了，为什么没生效？到底是哪里出了问题？答案就藏在MySQL的EXPLAIN命令里。EXPLAIN就像一面“照妖镜”，
python中 @注解及内置注解的使用方法总结以及完整示例慧一居士 Python python
在Python中，装饰器（Decorator）使用@符号实现，是一种修改函数/类行为的语法糖。它本质上是一个高阶函数，接受目标函数作为参数并返回包装后的函数。Python也提供了多个内置装饰器，如@property、@staticmethod、@classmethod等。一、核心概念装饰器本质：@decorator等价于func=decorator(func)执行时机：在函数/类定义时立即执行装饰
Python中的静态方法和类方法详解
在Python中，`@staticmethod`和`@classmethod`是两种装饰器，它们用于定义类中的方法，但是它们的行为和用途有所不同。###@staticmethod`@staticmethod`装饰器用于定义一个静态方法。静态方法不接收类或实例的引用作为第一个参数，因此它不能访问类的状态或实例的状态。静态方法可以看作是与类关联的普通函数，但它们可以通过类名直接调用。classMath
JAVA中的Enum 周凡杨 java enum 枚举
Enum是计算机编程语言中的一种数据类型---枚举类型。在实际问题中，有些变量的取值被限定在一个有限的范围内。例如，一个星期内只有七天我们通常这样实现上面的定义： public String monday; public String tuesday; public String wensday; public String thursday
赶集网mysql开发36条军规 Bill_chen mysql 业务架构设计 mysql调优 mysql性能优化
(一)核心军规 (1)不在数据库做运算 cpu计算务必移至业务层； (2)控制单表数据量 int型不超过1000w，含char则不超过500w；合理分表；限制单库表数量在300以内； (3)控制列数量字段少而精，字段数建议在20以内
Shell test命令 daizj shell 字符串 test 数字文件比较
Shell test命令 Shell中的 test 命令用于检查某个条件是否成立，它可以进行数值、字符和文件三个方面的测试。数值测试参数说明 -eq 等于则为真 -ne 不等于则为真 -gt 大于则为真 -ge 大于等于则为真 -lt 小于则为真 -le 小于等于则为真实例演示： num1=100 num2=100if test $[num1]
XFire框架实现WebService(二) 周凡杨 java webservice
有了XFire框架实现WebService(一)，就可以继续开发WebService的简单应用。 Webservice的服务端(WEB工程)：两个java bean类： Course.java package cn.com.bean; public class Course { private
重绘之画图板朱辉辉33 画图板
上次博客讲的五子棋重绘比较简单，因为只要在重写系统重绘方法paint（）时加入棋盘和棋子的绘制。这次我想说说画图板的重绘。画图板重绘难在需要重绘的类型很多，比如说里面有矩形，园，直线之类的，所以我们要想办法将里面的图形加入一个队列中，这样在重绘时就
Java的IO流西蜀石兰 java
刚学Java的IO流时，被各种inputStream流弄的很迷糊，看老罗视频时说想象成插在文件上的一根管道，当初听时觉得自己很明白，可到自己用时，有不知道怎么代码了。。。每当遇到这种问题时，我习惯性的从头开始理逻辑，会问自己一些很简单的问题，把这些简单的问题想明白了，再看代码时才不会迷糊。 IO流作用是什么？答：实现对文件的读写，这里的文件是广义的； Java如何实现程序到文件
No matching PlatformTransactionManager bean found for qualifier 'add' - neither 林鹤霄
java.lang.IllegalStateException: No matching PlatformTransactionManager bean found for qualifier 'add' - neither qualifier match nor bean name match! 网上找了好多的资料没能解决，后来发现：项目中使用的是xml配置的方式配置事务，但是
Row size too large (> 8126). Changing some columns to TEXT or BLOB aigo column
原文：http://stackoverflow.com/questions/15585602/change-limit-for-mysql-row-size-too-large 异常信息： Row size too large (> 8126). Changing some columns to TEXT or BLOB or using ROW_FORMAT=DYNAM
JS 格式化时间 alxw4616 JavaScript
/** * 格式化时间 2013/6/13 by 半仙 [email protected] * 需要 pad 函数 * 接收可用的时间值. * 返回替换时间占位符后的字符串 * * 时间占位符:年 Y 月 M 日 D 小时 h 分 m 秒 s 重复次数表示占位数 * 如 YYYY 4占4位 YY 占2位<p></p> * MM DD hh mm
队列中数据的移除问题百合不是茶队列移除
队列的移除一般都是使用的remov();都可以移除的,但是在昨天做线程移除的时候出现了点问题,没有将遍历出来的全部移除, 代码如下; // package com.Thread0715.com; import java.util.ArrayList; public class Threa
Runnable接口使用实例 bijian1013 java thread Runnable java多线程
Runnable接口 a. 该接口只有一个方法：public void run(); b. 实现该接口的类必须覆盖该run方法 c. 实现了Runnable接口的类并不具有任何天
oracle里的extend详解 bijian1013 oracle 数据库 extend
扩展已知的数组空间，例： DECLARE TYPE CourseList IS TABLE OF VARCHAR2(10); courses CourseList; BEGIN -- 初始化数组元素，大小为3 courses := CourseList('Biol 4412 ', 'Psyc 3112 ', 'Anth 3001 '); --
【httpclient】httpclient发送表单POST请求 bit1129 httpclient
浏览器Form Post请求浏览器可以通过提交表单的方式向服务器发起POST请求，这种形式的POST请求不同于一般的POST请求 1. 一般的POST请求，将请求数据放置于请求体中，服务器端以二进制流的方式读取数据，HttpServletRequest.getInputStream()。这种方式的请求可以处理任意数据形式的POST请求，比如请求数据是字符串或者是二进制数据 2. Form
【Hive十三】Hive读写Avro格式的数据 bit1129 hive
1. 原始数据 hive> select * from word; OK 1 MSN 10 QQ 100 Gtalk 1000 Skype 2. 创建avro格式的数据表 hive> CREATE TABLE avro_table(age INT, name STRING)STORE
nginx+lua+redis自动识别封解禁频繁访问IP ronin47
在站点遇到攻击且无明显攻击特征，造成站点访问慢，nginx不断返回502等错误时，可利用nginx+lua+redis实现在指定的时间段内，若单IP的请求量达到指定的数量后对该IP进行封禁，nginx返回403禁止访问。利用redis的expire命令设置封禁IP的过期时间达到在指定的封禁时间后实行自动解封的目的。一、安装环境： CentOS x64 release 6.4(Fin
java-二叉树的遍历-先序、中序、后序（递归和非递归）、层次遍历 bylijinnan java
import java.util.LinkedList; import java.util.List; import java.util.Stack; public class BinTreeTraverse { //private int[] array={ 1, 2, 3, 4, 5, 6, 7, 8, 9 }; private int[] array={ 10,6,
Spring源码学习-XML 配置方式的IoC容器启动过程分析 bylijinnan java spring IOC
以FileSystemXmlApplicationContext为例，把Spring IoC容器的初始化流程走一遍： ApplicationContext context = new FileSystemXmlApplicationContext ("C:/Users/ZARA/workspace/HelloSpring/src/Beans.xml&q
[科研与项目]民营企业请慎重参与军事科技工程 comsci 企业
军事科研工程和项目并非要用最先进，最时髦的技术，而是要做到“万无一失” 而民营科技企业在搞科技创新工程的时候，往往考虑的是技术的先进性，而对先进技术带来的风险考虑得不够，在今天提倡军民融合发展的大环境下，这种“万无一失”和“时髦性”的矛盾会日益凸显。。。。。。所以请大家在参与任何重大的军事和政府项目之前，对
spring 定时器-两种方式 cuityang spring quartz 定时器
方式一：间隔一定时间运行 <bean id="updateSessionIdTask" class="com.yang.iprms.common.UpdateSessionTask" autowire="byName" /> <bean id="updateSessionIdSchedule
简述一下关于BroadView站点的相关设计 damoqiongqiu view
终于弄上线了，累趴，戳这里http://www.broadview.com.cn 简述一下相关的技术点前端：jQuery+BootStrap3.2+HandleBars，全站Ajax（貌似对SEO的影响很大啊！怎么破？），用Grunt对全部JS做了压缩处理，对部分JS和CSS做了合并（模块间存在很多依赖，全部合并比较繁琐，待完善）。后端：U
运维 PHP问题汇总 dcj3sjt126com windows2003
1、Dede(织梦)发表文章时,内容自动添加关键字显示空白页解决方法：后台>系统>系统基本参数>核心设置>关键字替换（是/否），这里选择“是”。后台>系统>系统基本参数>其他选项>自动提取关键字，这里选择“是”。 2、解决PHP168超级管理员上传图片提示你的空间不足网站是用PHP168做的，反映使用管理员在后台无法
mac 下安装php扩展 - mcrypt dcj3sjt126com PHP
MCrypt是一个功能强大的加密算法扩展库，它包括有22种算法，phpMyAdmin依赖这个PHP扩展，具体如下：下载并解压libmcrypt-2.5.8.tar.gz。在终端执行如下命令： tar zxvf libmcrypt-2.5.8.tar.gz cd libmcrypt-2.5.8/ ./configure --disable-posix-threads --
MongoDB更新文档 [四] eksliang mongodb Mongodb更新文档
MongoDB更新文档转载请出自出处：http://eksliang.iteye.com/blog/2174104 MongoDB对文档的CURD，前面的博客简单介绍了，但是对文档更新篇幅比较大，所以这里单独拿出来。语法结构如下： db.collection.update( criteria, objNew, upsert, multi) 参数含义参数
Linux下的解压，移除，复制，查看tomcat命令 y806839048 tomcat
重复myeclipse生成webservice有问题删除以前的，干净 1、先切换到：cd usr/local/tomcat5/logs 2、tail -f catalina.out 3、这样运行时就可以实时查看运行日志了 Ctrl+c 是退出tail命令。有问题不明的先注掉 cp /opt/tomcat-6.0.44/webapps/g
Spring之使用事务缘由(3-XML实现) ihuning spring
用事务通知声明式地管理事务事务管理是一种横切关注点。为了在 Spring 2.x 中启用声明式事务管理，可以通过 tx Schema 中定义的 <tx:advice> 元素声明事务通知，为此必须事先将这个 Schema 定义添加到 <beans> 根元素中去。声明了事务通知后，就需要将它与切入点关联起来。由于事务通知是在 <aop:
GCD使用经验与技巧浅谈啸笑天 GC
前言 GCD(Grand Central Dispatch)可以说是Mac、iOS开发中的一大“利器”，本文就总结一些有关使用GCD的经验与技巧。 dispatch_once_t必须是全局或static变量这一条算是“老生常谈”了，但我认为还是有必要强调一次，毕竟非全局或非static的dispatch_once_t变量在使用时会导致非常不好排查的bug，正确的如下： 1
linux（Ubuntu）下常用命令备忘录1 macroli linux 工作 ubuntu
在使用下面的命令是可以通过--help来获取更多的信息1,查询当前目录文件列表：ls ls命令默认状态下将按首字母升序列出你当前文件夹下面的所有内容，但这样直接运行所得到的信息也是比较少的，通常它可以结合以下这些参数运行以查询更多的信息： ls / 显示/.下的所有文件和目录 ls -l 给出文件或者文件夹的详细信息 ls -a 显示所有文件，包括隐藏文
nodejs同步操作mysql qiaolevip 学习永无止境每天进步一点点 mysql nodejs
// db-util.js var mysql = require('mysql'); var pool = mysql.createPool({ connectionLimit : 10, host: 'localhost', user: 'root', password: '', database: 'test', port: 3306 });
一起学Hive系列文章 superlxw1234 hive Hive入门
[一起学Hive]系列文章目录贴，入门Hive，持续更新中。 [一起学Hive]之一—Hive概述，Hive是什么 [一起学Hive]之二—Hive函数大全-完整版 [一起学Hive]之三—Hive中的数据库(Database)和表(Table) [一起学Hive]之四-Hive的安装配置 [一起学Hive]之五-Hive的视图和分区 [一起学Hive
Spring开发利器：Spring Tool Suite 3.7.0 发布 wiselyman spring
Spring Tool Suite(简称STS)是基于Eclipse，专门针对Spring开发者提供大量的便捷功能的优秀开发工具。在3.7.0版本主要做了如下的更新：将eclipse版本更新至Eclipse Mars 4.5 GA Spring Boot(JavaEE开发的颠覆者集大成者，推荐大家学习)的配置语言YAML编辑器的支持(包含自动提示，