brucewong0516

【python】详解urllib库的操作，requests，error，parse模块

urllib 是python内置的http请求库，内置的主要是以下几个模块：

urllib.request :请求模块
urllib.error :异常处理模块
urllib.parse :url解析模块
urllib.robotparer :robot.txt解析模块

1、urllib实现get或者post请求

urllib.request.urlopen(url,data = None,[timeout,],cafile = None,capath = None,cadefualt = False,context = None)

urllib.requests.urlopen --get实例如下：

import urllib.request
response = urllib.request.urlopen('http://www.baidu.com')
# response得到的是网页的内容，bytes类型的数据，需要用utf-8转为字符串格式
print(response.read().decode('utf-8'))

使用post请求需要传入data，urllib.requests.urlopen --post实例如下：

import urllib.parse
import urllib.request
# 传入的data参数需要bytes类型
data = bytes(urllib.parse.urlencode({'word': 'hello'}), encoding='utf8')
response = urllib.request.urlopen('http://httpbin.org/post', data=data)
print(response.read())

所以，对于get和post请求的方式，只需要传入data就可以进行区分。

timeout 参数

import urllib.request
import urllib.parse
import urllib.error
import socket

#url = 'https://python.org/'
url = 'http://httbin.org/get'
data = bytes(urllib.parse.urlencode({'hello':'world'}),encoding = 'utf8')
try:
    
    res = urllib.request.urlopen(url,timeout = 0.1)
except urllib.error.URLError as e:
    if isinstance(e.reason,socket.timeout):
        print('TIMEOUT')
# 最终会因为timeout而执行print('TIMEOUT')

2、urllib.requests.Request方法

前文直接用URLopen请求网页，但是不方便添加header之类的信息，因此需要Request来构建。

Request：urllib.request.Request(url, data=None, headers={}, origin_req_host=None, unverifiable=False, method=None)

url:必选参数，传入需要请求的链接
data:如果要传，必选是bytes（字节流）的类型。如果是参数字典，需要parse解析的urlencode编码为字符串
headers:请求头；可以直接添加到Request实例中，或者通过add_headers的方式添加；添加请求头最常用的方法就是通过修改User_Agent来伪装浏览器，python默认的是python-urllib，我们可以通过修改它来伪装浏览器，比如伪装Google浏览器，设置为"User-Agent",“Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36”
origin_req_host:请求方的host名称或者IP地址
unverifiable:表示这个请求是否无法验证，默认是False，意思是请求权限不够。
method:用来指示请求的方法，比如GET、POST、PUT

通过Request构建的请求对象传入urllib.request.urlopen( )打开，如下：

import urllib.request
import urllib.parse
import urllib.error
import socket

#url = 'https://python.org/'
url = 'http://httbin.org/post'

data = bytes(urllib.parse.urlencode({'hello':'world'}),encoding = 'utf8')

headers = {"User-Agent":"Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36"}

req = urllib.request.Request(url,headers = headers,data = data,method = 'POST')
try:    
    res = urllib.request.urlopen(req,timeout = 1)
    print(res.read().decode('utf-8'))
    print('OJBK')
except urllib.error.URLError as e:
    if isinstance(e.reason,socket.timeout):
        print('TIMEOUT')

输出结果是：OJBK

2.1、Handler：更加复杂的方法

首先是urllib.request的BaseHandler类，他是所有其他handler的父类，提供最基本的方法，如default_open( )、protocol_request( )等。

其次，各种常用的子类继承这个BaseHandler类：

HTTPHandler() 通过HTTP打开URL
CacheFTPHandler() 具有持久FTP连接的FTP处理程序
FileHandler() 打开本地文件
FTPHandler() 通过FTP打开URL
HTTPBasicAuthHandler() 通过HTTP验证处理
HTTPCookieProcessor() 处理HTTP cookie
HTTPDefaultErrorHandler() 通过引发HTTPError异常处理HTTP错误
HTTPDigestAuthHandler() HTTP摘要验证处理
HTTPRedirectHandler() 处理HTTP重定向
HTTPSHandler() 通过安全HTTP重定向
ProxyHandler() 通过代理重定向请求
ProxyBasicAuthHandler 基本的代理验证
ProxyDigestAuthHandler 摘要代理验证
UnknownHandler 处理所有未知URL的处理程序

另一个比较实用的类就是OpenerDirector，可以称之为Opener，我们可以利用handler来构建Opener。

ProxyHandler

import urllib.request
from urllib.request import build_opener
proxy_handler = urllib.request.ProxyHandler({
    'http':'http://127.0.0.1:9743',
    'https':'https://127.0.0.1.9743'
})
opener = build_opener(proxy_handler)
response = opener.open('http://www.baidu.com')
print(response.read())

在这里用代理会出错：。
一般的代理没什么卵用，代理的研究还有待深入研究，目前较方便的处理的方法是去掉代理即可。

HTTPBasicAuthHandler：

import urllib.request
import urllib.parse
import urllib.error
import socket
from urllib.request import HTTPPasswordMgrWithDefaultRealm,HTTPBasicAuthHandler,build_opener

username = 'username'
password = 'password'

#url = 'https://python.org/'
url = 'http://localhost:5000'

p = HTTPPasswordMgrWithDefaultRealm()
p.add_password(None,url,username,password)
auth_handler = HTTPBasicAuthHandler(p)
opener = build_opener(auth_handler)

cookies：

首先声明一个Cookiejar对象，，接下来就用HTTPCookieProcessor来构建一个Handler，最后利用build_opener方法构建出Opener，执行open( )函数就可以。

import http.cookiejar, urllib.request
filename = "cookie.txt"
cookie = http.cookiejar.CookieJar()
handler = urllib.request.HTTPCookieProcessor(cookie)
opener = urllib.request.build_opener(handler)
response = opener.open("http://www.baidu.com")
for item in cookie:
    print(item.name+"="+item.value)
    
BAIDUID=A2894B5224134AF4A6C1E1DD34FD2DAE:FG=1
BIDUPSID=A2894B5224134AF4A6C1E1DD34FD2DAE
H_PS_PSSID=1459_25810_21095_26350_27245
PSTM=1538480633
delPer=0
BDSVRTM=0
BD_HOME=0

如果是需要保存cookie到本地文件，需要将CookieJar 换成MozillaCookieJar或者LWPCookieJar，这两者仅是保存的文件类型略有差异。

import urllib.request
import urllib.parse
import urllib.error
import socket
import http.cookiejar, urllib.request
filename = "cookie.txt"

# 保存cooki为文本
# 保存类型有很多种
## 类型1
cookie = http.cookiejar.MozillaCookieJar(filename)
### 类型2
#cookie = http.cookiejar.LWPCookieJar(filename)

handler = urllib.request.HTTPCookieProcessor(cookie)
opener = urllib.request.build_opener(handler)
response = opener.open("http://www.baidu.com")


cookie.save(ignore_discard = True,ignore_expires = True)
# Netscape HTTP Cookie File
# http://curl.haxx.se/rfc/cookie_spec.html
# This is a generated file!  Do not edit.

.baidu.com	TRUE	/	FALSE	3685964435	BAIDUID	4708EE5A13C2728EFED018DB3ACE432B:FG=1
.baidu.com	TRUE	/	FALSE	3685964435	BIDUPSID	4708EE5A13C2728EFED018DB3ACE432B
.baidu.com	TRUE	/	FALSE		H_PS_PSSID	1450_21112_26350_27245_20927
.baidu.com	TRUE	/	FALSE	3685964435	PSTM	1538480809
.baidu.com	TRUE	/	FALSE		delPer	0
www.baidu.com	FALSE	/	FALSE		BDSVRTM	0
www.baidu.com	FALSE	/	FALSE		BD_HOME	0

如何读取，调用load（）方法来读取本地的Cookie文件，注意的是之前使用的MozillaCookieJar的方法储存的，后期需要声明同样的MozillaCookieJar的方法才能Load。然后通过调用handler的方法和opener的方法完成网页请求。

# 使用相应的方法读取
import http.cookiejar, urllib.request
cookie = http.cookiejar.MozillaCookieJar()
cookie.load('cookie.txt',ignore_discard=True,ignore_expires=True)
handler = urllib.request.HTTPCookieProcessor(cookie)
opener = urllib.request.build_opener(handler)
response = opener.open("http://www.baidu.com")

print(response.read().decode('utf-8')0

3、处理异常

urllib的error模块定义了由urllib.request请求产生的异常。如果请求失败，urllib.request便会抛出error模块的异常。

URLError
URLError类来自urllib的error模块，是继承OSError模块，是异常模块的基类，具有属性reason，即返回错误原因。

from urllib import request,error

try:
    res = request.urlopen('https://cuiiqngcai.com/index.html')
except error.URLError as e:
    print(e.reason)
    
[Errno 11001] getaddrinfo failed

HTTPError
它是URLError的子类，专门用来处理HTTP请求错误，具备三个属性：

1、code：返回HTTP状态码
2、reason：异常原因
3、headers：请求头

try:
    res = request.urlopen('https://cuiqingcai.com/index.html')
except error.HTTPError as e:
    print(e.reason,e.code,e.headers)
    
Not Found 
404 
Server: nginx/1.10.3 (Ubuntu)
Date: Tue, 02 Oct 2018 12:09:55 GMT
Content-Type: text/html; charset=UTF-8
Transfer-Encoding: chunked
Connection: close
Vary: Cookie
Expires: Wed, 11 Jan 1984 05:00:00 GMT
Cache-Control: no-cache, must-revalidate, max-age=0
Link: ; rel="https://api.w.org/"

将URLError和HTTPError结合才进行异常处理，首先通过子类HTTPERror来捕获它的错误状态码、原因、headers等信息。如果不是HTTPError，然后捕获URLError，输出错误原因，最后是else来处理正常的逻辑。

import urllib.parse
from urllib import request,error
import socket


try:
    res = request.urlopen('https://cuiqingcai.com/index.html',timeout = 0.1)
except error.HTTPError as e:
    print(e.reason,e.code,e.headers)
except error.URLError as e:
    print(e.reason)
    if isinstance(e.reason,socket.timeout):
        print('TIMEOUT')
else:
    print('ok')

4、解析链接

urllib库里还有parse模块，定义了处理URL的标准接口，例如实现URL各部分的抽取、合并以及链接转换。

urlparse：实现URL的识别和分段

from urllib.parse import urlparse

result = urlparse('http://www.baidu.com/index.html;user?id=5#comment')

print(type(result),result)
 ParseResult(scheme='http', netloc='www.baidu.com', path='/index.html', params='user', query='id=5', fragment='comment')

解析的时候有特定的分隔符，?/ 前面就是scheme，代表协议；第一个 / 符号前面就是netloc，即域名；
后面是path，即访问路径；分号；前面是params，代表参数；问号？后面是查询条件query，一般作为GET类型的URL，#后面是锚点，用于直接定位页面内部的下拉位置。

所以可以得出一个标准的链接格式：

scheme://netloc/path;params?query#fragment

一般的标准URL都会符合上述规则，利用urlparse方法将它分拆开来。除了这种最基本的解析方式之外，就是通过API用法：

--	urlstring，必填项；即待解析的URL
--	scheme：默认（https,http）协议。假如这个链接没有带协议信息，会将传入的scheme作为默认的协议；

res = urlparse('http://www.baidu.com/index.html;user?id=5#comment',scheme='https')
res
Out[36]: ParseResult(scheme='http', netloc='www.baidu.com', path='/index.html', params='user', query='id=5', fragment='comment')
# 如果url含有scheme信息，则会返回url里面的值，而不是参数scheme传进去的值

res = urlparse('www.baidu.com/index.html;user?id=5#comment',scheme='https')
res
Out[38]: ParseResult(scheme='https', netloc='', path='www.baidu.com/index.html', params='user', query='id=5', fragment='comment')
#可以发现，如果URL没有包含scheme信息，那么我们传进去的值就会被使用，同时域名会加载path里；

--	allow_fragements：锚点；如果设置为False，fragment就会被忽略，它会被解析为path、parameters或者query的一部分。

urlunparse

合成url的函数，必须传入6个参数，可以是元组或者是参数列表的形式：

data = ['https','www.baidu.com','/index.html','user','id=5','comment']
from urllib.parse import urlunparse

urlunparse(data)
Out[41]: 'https://www.baidu.com/index.html;user?id=5#comment'

urlsplit

这个方法和urlparse很像，只返回5个值，它不再单独解析出params，会将params合并到path中去：

urlsplit('http://www.baidu.com/index.html;user?id=5#comment')
Out[43]: SplitResult(scheme='http', netloc='www.baidu.com', path='/index.html;user', query='id=5', fragment='comment')

可以通过属性或者索引来获取值：
res = urlsplit('http://www.baidu.com/index.html;user?id=5#comment')
res.path
Out[46]: '/index.html;user'
res[1]
Out[47]: 'www.baidu.com'

urlunsplit

与urlunparse相似，传入的参数也是一个列表或者元组这类可迭代对象，唯一的区别也是长度，必须是传入5个参数

data = ['https','www.baidu.com','/index.html?user','id=5','comment']
from urllib.parse import urlunsplit

urlunsplit(data)
Out[50]: 'https://www.baidu.com/index.html?user?id=5#comment'

urljoin
对于urlunsplit和urlunparse方法，可以完成链接的合并，不过必须长度是特定的，链接的每一部分都要清晰分开。通过urljoin，可以提供一个base_url作为第一个参数，新的链接作为第二个参数，该方法会分析base_url 的scheme、netloc和path这三个内容对新链接缺失的部分进行补充。

from urllib.parse import urljoin

print(urljoin('http://www.baidu.com','FAQ.html'))
http://www.baidu.com/FAQ.html

print(urljoin('http://www.baidu.com','https://cuiqingcai.com/FAQ.html'))
https://cuiqingcai.com/FAQ.html      #如果scheme、netloc、path在新的链接存在，就使用新的链接内容

print(urljoin('http://www.baidu.com/about.html','https://cuiqingcai.com/FAQ.html'))
https://cuiqingcai.com/FAQ.html     #base_url的params、query、fragment是不起作用

print(urljoin('http://www.baidu.com/about.html','https://cuiqingcai.com/FAQ.html?question=2'))
https://cuiqingcai.com/FAQ.html?question=2

print(urljoin('http://www.baidu.com/about.html','?category=2#comment'))
http://www.baidu.com/about.html?category=2#comment   #如果上述三项在新的链接里不存在，就予以补充

print(urljoin('www.baidu.com/about.html','?category=2#comment'))
www.baidu.com/about.html?category=2#comment

#可以得出如果base_url提供了三项内容scheme、netloc、path。如果上述三项在新的链接里不存在，就予以补充。如果在新的链接存在，就使用新的链接内容。而base_url的params、query、fragment是不起作用。

urlencode

对于构造GET请求参数时非常有用，首先声明一个字典将参数表示出来，然后调用urlencode的方法将其序列化为GET请求参数。

from urllib.parse import urlencode

params = {'name':'bruce','age':20}
base_url = 'http://baidu.com?'
base_url + urlencode(params) 
Out[67]: 'http://baidu.com?name=bruce&age=20'

parse_qs

反序列化，将GET请求的参数解析出来

parse_qs('name=bruce&age=20')
Out[72]: {'age': ['20'], 'name': ['bruce']}

parse_qsl

将参数转化为元组组成的列表

from urllib.parse import parse_qsl

parse_qsl('name=bruce&age=20')
Out[74]: [('name', 'bruce'), ('age', '20')]

quote

该方法将内容转化为URL编码格式，此方法可以将中文字符串转化为URL编码

from urllib.parse import quote

keyword = '大锤'

url = 'http://www.baidu.com?s?wd =' +quote(keyword)

url
Out[78]: 'http://www.baidu.com?s?wd =%E5%A4%A7%E9%94%A4'

unquote
利用unquote进行还原

from urllib.parse import unquote

unquote(url)
Out[80]: 'http://www.baidu.com?s?wd =大锤'

Python 网络爬虫进阶：动态网页爬取与反爬机制应对 Milk夜雨 python python 爬虫
在上一篇文章中，我们学习了如何使用Python构建一个基本的网络爬虫。然而，在实际应用中，许多网站使用动态内容加载或实现反爬机制来阻止未经授权的抓取。因此，本篇文章将深入探讨以下进阶主题：如何处理动态加载的网页内容应对常见的反爬机制爬虫性能优化通过具体实例，我们将探讨更复杂的网络爬虫开发技巧。一、动态网页爬取现代网页通常通过JavaScript加载动态内容。直接使用requests获取的HTML可
python多线程编程可可西里 python
python多线程1.线程的基础概念-线程：线程是程序执行的最小单位同属一个进程的多个线程共享进程所拥有所有资源一.线程的创建步骤1.导入线程模块importthreading2.通过线程类创建线程对象#线程对象=threading.Thread(target=任务名)thread=threading.Thread(target=work)3.启动线程执行任务#线程对象.start()thread
Python酷库之旅-第三方库Pandas(138) 神奇夜光杯 python pandas 开发语言人工智能标准库及第三方库 excel 学习与成长
目录一、用法精讲621、pandas.plotting.lag_plot方法621-1、语法621-2、参数621-3、功能621-4、返回值621-5、说明621-6、用法621-6-1、数据准备621-6-2、代码示例621-6-3、结果输出622、pandas.plotting.parallel_coordinates方法622-1、语法622-2、参数622-3、功能622-4、返回值62
使用飞书群机器人监控服务器GPU使用率 sunrise_ccx 服务器飞书
目标：如果服务器GPU空置，可以及时推送消息到飞书群。其他类似的监控目标也可以修改代码实现。步骤：(1)首先在群聊设置加入机器人，复制webhook_url(2)在服务器后台运行如下代码。注意替换webhook_url"""nohuppythonmonitor_gpu.pymy_server>monitor_gpu.log2>&1&"""importsysimportsubprocessimpor
使用 Python 和 scikit-learn 实现 KNN 分类：以鸢尾花数据集为例弥树子 python scikit-learn 分类
在机器学习的世界里，K-NearestNeighbors（KNN）算法是一种简单而强大的分类方法。它基于一个直观的想法：相似的数据点往往属于同一类别。本文将通过Python的scikit-learn库实现KNN分类，以经典的鸢尾花数据集为例，展示从数据加载到模型评估的完整流程。1.KNN算法简介KNN是一种监督学习算法，主要用于分类和回归任务。它的工作原理非常简单：对于一个新的数据点，算法会查找训
【编程小白必看】Python编程练习题元组操作秘籍一文全掌握 6个q python习题集 python 网络开发语言
【编程小白必看】Python编程练习题元组操作秘籍一文全掌握文章目录前言一、练习题精选1.创建一个空元组2.创建一个单元素元组3.创建一个包含多个元素的元组4.访问元组中的第一个元素5.访问元组中的最后一个元素6.访问元组中的多个元素7.元组拼接8.元组重复9.获取元组的长度10.检查元素是否在元组中11.检查元素是否不在元组中12.计算元组中元素出现的次数13.获取元组中元素的索引14.获取元组
【编程小白必看】Python 开发工具操作秘籍一文全掌握 6个q python基础知识 python 开发语言
【编程小白必看】Python开发工具操作秘籍一文全掌握文章目录前言一、什么是Python开发工具？二、环境搭建三、常用开发工具介绍1.PyCharm2.VisualStudioCode(VSCode)3.JupyterNotebook4.Spyder5.SublimeText五、常见问题与解决方法1.缺少依赖库2.编辑器卡顿3.代码提示不准确总结前言嘿，小伙伴们！今天我们要一起走进Python开发
Python 虚拟环境搭建 tigercat920 python 开发语言
虚拟环境1.为什么要搭建虚拟环境?在开发过程中,当需要使用python的某些工具包/框架时需要联网安装比如联网安装Django框架django的2.2.5版本sudopipinstalldjango==2.2.5提示：使用如上命令,会将Django安装到/usr/local/lib/python版本号/dist-packages路径下问题：如果在一台电脑上,想开发多个不同的项目,需要用到同一个包的
linux lamp 山客泛舟游Y linux php apache
linuxlamp1.lamp简介有了前面学习的知识的铺垫，今天可以来学习下第一个常用的web架构了。所谓lamp，其实就是由Linux+Apache+Mysql/MariaDB+Php/Perl/Python的一组动态网站或者服务器的开源软件，除Linux外其它各部件本身都是各自独立的程序，但是因为经常被放在一起使用，拥有了越来越高的兼容度，共同组成了一个强大的Web应用程序平台。LAMP指的是
python绘图实例 charlie_wang007 python python
pythonPlt实例背景：业务的健身数据，有一个字段是其他附加信息，格式是json，需要查出该字段，解出json，拿到目标数据，按要求聚合，如燃脂是0.25的有几个目的：要验证运营页面的概览数据是否正确策略：从表中查出数据，格式化，用plt绘制，与被测页面的图形数据对比代码如下：#coding:utf8importMySQLdbimportjsonimportpandasaspdimportnu
python精彩编程200例-编程语言入门经典100例【Python版】 weixin_37988176
无论学习哪门计算机语言，只要把100例中绝大部分题目都做一遍，就基本掌握该语言的语法了。【程序1】题目：有1、2、3、4个数字，能组成多少个互不相同且无重复数字的三位数？都是多少？#Filename:001.pycnt=0#countthesumofresultforiinrange(1,5):forjinrange(1,5):forkinrange(1,5):ifi!=jandi!=kandj!
Python简单Web开发 patrick_wang_bigdata python
WSGI介绍HTTP协议和HTML的介绍不在这里说明，可以去看廖雪峰老师的教程了解这方面内容。一个web应用的本质是：浏览器发送一个HTTP请求服务器收到请求，生成一个HTML文档服务器把HTML文档作为HTTP响应的Body发送给浏览器浏览器收到HTTP响应，从HTTP响应Body中取出HTML并显示最简单的web应用就是先把HTML保存好，然后需要时直接响应给HTTP请求。对Python而言，
LSTM的推导与实现 YZXnuaa NLP Python库
最近在看CS224d，这里主要介绍LSTM(LongShort-TermMemory)的推导过程以及用Python进行简单的实现。LSTM是一种时间递归神经网络，是RNN的一个变种，非常适合处理和预测时间序列中间隔和延迟非常长的事件。假设我们去试着预测‘IgrewupinFrance...（很长间隔）...IspeakfluentFrench’最后的单词，当前的信息建议下一个此可能是一种语言的名字
【环境配置】已解决 | python conda环境下安装GDAL库报错乐蕴 python conda 开发语言
GDAL库安装报错安装命令：pipinstallGDAL报错内容：CollectingGDALUsingcachedgdal-3.9.1.tar.gz(840kB)Installingbuilddependencies...errorerror:subprocess-exited-with-error×pipsubprocesstoinstallbuilddependenciesdidnotrun
Python绘图案例 Adiga无线丢人
importmatplotlib.pyplotasplt#构建数据x_data=['2012','2013','2014','2015','2016','2017','2018']y_data=[58000,60200,63000,71000,84000,90500,107000]y_data2=[52000,54200,51500,58300,56800,59500,62700]#绘图plt.b
Python 自动玩谷歌浏览器“恐龙小游戏” 程序员-夏天 Python python chrome 开发语言
相信在座的各位小伙伴对GoogleChrome浏览器中的一个游戏彩蛋恐龙小游戏(ChromeDino)不陌生吧。在断开网络连接，我们访问网站的时候，就会出现一个小霸王龙，在我们再按下空格键后，即可开始这个游戏，或者在谷歌浏览器的地址栏输入chrome://dino/,按下空格键，也可这个开始游戏。这是一个简单的无限跑步游戏，它会让你跳过仙人掌，并闪避障碍物，游戏控制也很简单，按空格键开始游戏，按空
python all函数用法 Danker01 python all函数
python的内置函数有很多，高级函数也有很多，今天讲一个小小的例子，因为之前没有用过，所以在这里记录一下。使用场景：给出一个由字符串组成的列表，怎么取判断每一个字符串里是不是包含共同的一个部分，例如下面：str_list=['//img14.360buyimg.com/n5/s85x85_jfs/t1/7121/5/4850/249681/5bdc086dE0d08ee7e/65767cb85c
all()是python内置函数吗_Python all() 函数 weixin_39790168
Pythonall()函数描述all()函数用于判断给定的可迭代参数iterable中的所有元素是否都为TRUE，如果是返回True，否则返回False。元素除了是0、空、None、False外都算True。函数等价于：defall(iterable):forelementiniterable:ifnotelement:returnFalsereturnTruePython2.5以上版本可用。语法
超简洁 100行Javascript代码实现2048游戏，浏览器可玩入职啦 100行实战项目 javascript 游戏开发语言
本文发表于入职啦(公众号:ruzhila)大家可以访问入职啦学习更多的编程实战。完全用Javascript的Canvas实现2048游戏，打开浏览器就可以玩项目地址代码已经开源，2048-js欢迎Star代码运行效果：所有的项目都在github上开源：100-line-code欢迎Star用100行代码的不同语言（Java、Python、Go、Javascript、Rust）实现项目，通过讲解项目
Python 3.9它来啦！！！ python程序员小'鹏 python 编程语言经验分享程序人生
Python3.9，来了！小编本身就是一名python开发工程师，我自己花了三天时间整理了一套python学习教程，从最基础的python脚本到web开发，爬虫，数据分析，数据可视化，机器学习，等，这些资料有想要的小伙伴"点击"即可领取过去一年，来自世界各地的开发者们一直在致力于Python3.8的改进。Python3.9beta版本已经存在了一段时间，第一个正式版本于2020年10月5日发布。每
python3基础-17 内建函数 doker_p python基础
内置函数abs()dict()help()min()setattr()all()dir()hex()next()slice()any()divmod()id()object()sorted()ascii()enumerate()input()oct()staticmethod()bin()eval()int()open()str()bool()exec()isinstance()ord()sum(
python all 函数_Python all（）函数 cunchi4221 列表 python javascript java 编程语言 ViewUI
pythonall函数Pythonall()functionisoneofthebuilt-infunctions.IttakesiterableasanargumentandreturnsTrueifallelementsoftheiterablearetrueorit’sempty.Pythonall（）函数是内置函数之一。它以iterable作为参数，如果iterable的所有元素均为tru
java 高级工程师面试题集锦,持续更新~ aifans_bert java学习 java 开发语言后端
找大厂面试题,看套路!Java面试题及答案及面试解析说到找工作,你认为现在最重要的事情是什么?当然找大厂面试题,看套路!以下面试题就是小编为大家准备的,希望对大家有用!1.面向对象的特征请阅读严宏博士的Java模式或设计模式解释中的桥梁模式)。封装:一般认为封装是将数据和操作数据的方法绑定起来,数据的访问只能通过定义。吐血总结!50道Python面试题集锦(附答案)这些面试题涉及Python基础知
python谷歌浏览器dino游戏，完整开源代码 terryzhang404 python chrome pygame 游戏 pycharm
观前提示：本文选自作者个人博客，为获得更好观感，请访问博主博客得到更好体验）说到googlechrome，很多人都会想到它标志性的断网小游戏——chromedino，今日，我们利用python还原并将代码开源，欢迎随时取用。话不多说，直接进入正题实现效果第一部分:配置环境编译器：pycharm社区版2024.1插件：pygame导入所用库,没有的可以去下载，具体方法不多赘述，网上有importpy
2024年Python最全用Python制作一个自动抢票脚本_python抢票脚本，Python面试项目全代码 Android失眠夜程序员 python 学习面试
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化学习资料的朋友，可以戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！classConcert:def__init__(
AI软件外包需要注意什么外包开发AI软件的关键因素是什么如何选择AI外包开发语言北京动点飞扬软件 AI外包
1.定义目标与需求首先，要明确你希望AI智能体做什么。是自动化任务、数据分析、自然语言处理，还是其他功能？明确目标可以帮助你选择合适的技术和方法。2.选择开发平台与工具开发AI智能体的软件时，你需要选择适合的编程语言、框架和工具。例如：编程语言：Python是最常用的语言，因为它有强大的AI/ML库，如TensorFlow、PyTorch、scikit-learn等。开发平台：你可以使用本地环境、
【python】all()函数介绍叶阿猪 python python 开发语言
一、说明Python中的all()函数是一个内置函数，用于判断一个可迭代对象（如列表、元组、字符串等）中的所有元素是否都为True（或者更准确地说，是否都等价于True）。二、基本语法all(iterable)iterable：一个可迭代对象。返回值：返回True或者返回False三、工作原理如果可迭代对象为空（例如空列表、空元组或空字符串），则all()返回True。否则，all()会迭代可迭代
Python & NumPy & Matplotlib 版本依赖小猪快跑爱摄影 Python python numpy matplotlib
文章目录相关文献依赖项版本列表相关文献官网版本依赖链接依赖项版本列表以下列表显示了Python和NumPy依赖项的最低版本对于不同版本的Matplotlib。点击链接获取完整内容依赖项的规范。MatplotlibPythonNumPy3.93.91.23.03.83.91.21.03.73.81.20.03.63.81.19.03.53.71.17.03.43.71.16.03.33.61.15.
-bash: ./****.py: /usr/bin/python^M: bad interpreter: No such file or directory GeoWin_CAU GeoPython Spatial Big Data（空间大数据）python linux windows
在windows系统下写的python脚本，在linux下赋予权限chmod+xxxx.py以后，执行./xxx.py运行提示：bash:/usr/bin/autocrorder:/usr/bin/python^M:badinterpreter:Nosuchfileordirectory更多文章请点击我
批量复制--python代码爱理科的小王子 python 开发语言
importos#定义文件夹路径xml_folder='path/to/xml_folder'jpg_folder='path/to/jpg_folder'#获取文件夹中的文件列表xml_files=sorted(os.listdir(xml_folder))jpg_files=sorted(os.listdir(jpg_folder))#检查文件数量是否一致iflen(xml_files)!=l
Spring4.1新特性——综述 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
Schema与数据类型优化 annan211 数据结构 mysql
目前商城的数据库设计真是一塌糊涂，表堆叠让人不忍直视，无脑的架构师，说了也不听。在数据库设计之初，就应该仔细揣摩可能会有哪些查询，有没有更复杂的查询，而不是仅仅突出很表面的业务需求，这样做会让你的数据库性能成倍提高，当然，丑陋的架构师是不会这样去考虑问题的。选择优化的数据类型 1 更小的通常更好更小的数据类型通常更快，因为他们占用更少的磁盘、内存和cpu缓存，
第一节 HTML概要学习 chenke html Web css
第一节 HTML概要学习 1. 什么是HTML HTML是英文Hyper Text Mark-up Language(超文本标记语言)的缩写，它规定了自己的语法规则，用来表示比“文本”更丰富的意义，比如图片，表格，链接等。浏览器（IE,FireFox等）软件知道HTML语言的语法，可以用来查看HTML文档。目前互联网上的绝大部分网页都是使用HTML编写的。打开记事本输入一下内
MyEclipse里部分习惯的更改 Array_06 eclipse
继续补充中---------------------- 1.更改自己合适快捷键windows-->prefences-->java-->editor-->Content Assist--> Activation triggers for java的右侧“.”就可以改变常用的快捷键选中 Text
近一个月的面试总结 cugfy 面试
本文是在学习中的总结，欢迎转载但请注明出处：http://blog.csdn.net/pistolove/article/details/46753275 前言打算换个工作，近一个月面试了不少的公司，下面将一些面试经验和思考分享给大家。另外校招也快要开始了，为在校的学生提供一些经验供参考，希望都能找到满意的工作。
HTML5一个小迷宫游戏 357029540 html5
通过《HTML5游戏开发》摘抄了一个小迷宫游戏，感觉还不错，可以画画，写字，把摘抄的代码放上来分享下，喜欢的同学可以拿来玩玩！ <html> <head> <title>创建运行迷宫</title> <script type="text/javascript"
10步教你上传githib数据张亚雄 git
官方的教学还有其他博客里教的都是给懂的人说得，对已我们这样对我大菜鸟只能这么来锻炼，下面先不玩什么深奥的，先暂时用着10步干净利索。等玩顺溜了再用其他的方法。操作过程（查看本目录下有哪些文件NO.1）ls （跳转到子目录NO.2）cd+空格+目录（继续NO.3）ls （匹配到子目录NO.4）cd+ 目录首写字母+tab键+（首写字母“直到你所用文件根就不再按TAB键了”）（查看文件
MongoDB常用操作命令大全 adminjun mongodb 操作命令
成功启动MongoDB后，再打开一个命令行窗口输入mongo，就可以进行数据库的一些操作。输入help可以看到基本操作命令，只是MongoDB没有创建数据库的命令，但有类似的命令如：如果你想创建一个“myTest”的数据库，先运行use myTest命令，之后就做一些操作（如：db.createCollection('user')）,这样就可以创建一个名叫“myTest”的数据库。一
bat调用jar包并传入多个参数 aijuans
下面的主程序是通过eclipse写的： 1.在Main函数接收bat文件传递的参数（String[] args）如： String ip =args[0]; String user=args[1]; &nbs
Java中对类的主动引用和被动引用 ayaoxinchao java 主动引用对类的引用被动引用类初始化
在Java代码中，有些类看上去初始化了，但其实没有。例如定义一定长度某一类型的数组，看上去数组中所有的元素已经被初始化，实际上一个都没有。对于类的初始化，虚拟机规范严格规定了只有对该类进行主动引用时，才会触发。而除此之外的所有引用方式称之为对类的被动引用，不会触发类的初始化。虚拟机规范严格地规定了有且仅有四种情况是对类的主动引用，即必须立即对类进行初始化。四种情况如下：1.遇到ne
导出数据库提示 outfile disabled BigBird2012 mysql
在windows控制台下，登陆mysql，备份数据库： mysql>mysqldump -u root -p test test > D:\test.sql 使用命令 mysqldump 格式如下： mysqldump -u root -p *** DBNAME > E:\\test.sql。注意：执行该命令的时候不要进入mysql的控制台再使用，这样会报
Javascript 中的 && 和 || bijian1013 JavaScript &&||
准备两个对象用于下面的讨论 var alice = { name: "alice", toString: function () { return this.name; } } var smith = { name: "smith",
[Zookeeper学习笔记之四]Zookeeper Client Library会话重建 bit1129 zookeeper
为了说明问题，先来看个简单的示例代码： package com.tom.zookeeper.book; import com.tom.Host; import org.apache.zookeeper.WatchedEvent; import org.apache.zookeeper.ZooKeeper; import org.apache.zookeeper.Wat
【Scala十一】Scala核心五：case模式匹配 bit1129 scala
package spark.examples.scala.grammars.caseclasses object CaseClass_Test00 { def simpleMatch(arg: Any) = arg match { case v: Int => "This is an Int" case v: (Int, String)
运维的一些面试题 yuxianhua linux
1、Linux挂载Winodws共享文件夹 mount -t cifs //1.1.1.254/ok /var/tmp/share/ -o username=administrator,password=yourpass 或 mount -t cifs -o username=xxx,password=xxxx //1.1.1.1/a /win
Java lang包-Boolean BrokenDreams boolean
Boolean类是Java中基本类型boolean的包装类。这个类比较简单，直接看源代码吧。 public final class Boolean implements java.io.Serializable,
读《研磨设计模式》-代码笔记-命令模式-Command bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.Collection; import java.util.List; /** * GOF 在《设计模式》一书中阐述命令模式的意图：“将一个请求封装
matlab下GPU编程笔记 cherishLC matlab
不多说，直接上代码 gpuDevice % 查看系统中的gpu,,其中的DeviceSupported会给出matlab支持的GPU个数。 g=gpuDevice(1); %会清空 GPU 1中的所有数据,,将GPU1 设为当前GPU reset(g) %也可以清空GPU中数据。 a=1; a=gpuArray(a); %将a从CPU移到GPU中 onGP
SVN安装过程 crabdave SVN
SVN安装过程 subversion-1.6.12 ./configure --prefix=/usr/local/subversion --with-apxs=/usr/local/apache2/bin/apxs --with-apr=/usr/local/apr --with-apr-util=/usr/local/apr --with-openssl=/
sql　行列转换 daizj sql 行列转换行转列列转行
行转列的思想是通过case when 来实现列转行的思想是通过union all 来实现下面具体例子：假设有张学生成绩表(tb)如下: Name Subject Result 张三语文　　74 张三数学　　83 张三物理　　93 李四语文　　74 李四数学　　84 李四物理　　94 */ /* 想变成姓名 &
MySQL--主从配置 dcj3sjt126com mysql
linux下的mysql主从配置：说明：由于MySQL不同版本之间的(二进制日志)binlog格式可能会不一样，因此最好的搭配组合是Master的MySQL版本和Slave的版本相同或者更低， Master的版本肯定不能高于Slave版本。（版本向下兼容） mysql1 : 192.168.100.1 //master mysq
关于yii 数据库添加新字段之后model类的修改 dcj3sjt126com Model
rules: array('新字段','safe','on'=>'search') 1、array('新字段', 'safe')//这个如果是要用户输入的话，要加一下， 2、array('新字段', 'numerical'),//如果是数字的话 3、array('新字段', 'length', 'max'=>100),//如果是文本 1、2、3适当的最少要加一条，新字段才会被
sublime text3 中文乱码解决 dyy_gusi Sublime Text
sublime text3中文乱码解决原因：缺少转换为UTF-8的插件目的：安装ConvertToUTF8插件包第一步：安装能自动安装插件的插件，百度“Codecs33”，然后按照步骤可以得到以下一段代码： import urllib.request,os,hashlib; h = 'eb2297e1a458f27d836c04bb0cbaf282' + 'd0e7a30980927
概念了解：CGI，FastCGI，PHP-CGI与PHP-FPM geeksun PHP
CGI CGI全称是“公共网关接口”(Common Gateway Interface)，HTTP服务器与你的或其它机器上的程序进行“交谈”的一种工具，其程序须运行在网络服务器上。 CGI可以用任何一种语言编写，只要这种语言具有标准输入、输出和环境变量。如php,perl,tcl等。 FastCGI FastCGI像是一个常驻(long-live)型的CGI，它可以一直执行着，只要激活后，不
Git push 报错 "error: failed to push some refs to " 解决 hongtoushizi git
Git push 报错 "error: failed to push some refs to " . 此问题出现的原因是：由于远程仓库中代码版本与本地不一致冲突导致的。由于我在第一次git pull --rebase 代码后，准备push的时候，有别人往线上又提交了代码。所以出现此问题。解决方案： 1： git pull 2：
第四章 Lua模块开发 jinnianshilongnian nginx lua
在实际开发中，不可能把所有代码写到一个大而全的lua文件中，需要进行分模块开发；而且模块化是高性能Lua应用的关键。使用require第一次导入模块后，所有Nginx 进程全局共享模块的数据和代码，每个Worker进程需要时会得到此模块的一个副本（Copy-On-Write），即模块可以认为是每Worker进程共享而不是每Nginx Server共享；另外注意之前我们使用init_by_lua中初
java.lang.reflect.Proxy liyonghui160com
1.简介 Proxy 提供用于创建动态代理类和实例的静态方法（1）动态代理类的属性代理类是公共的、最终的，而不是抽象的未指定代理类的非限定名称。但是，以字符串 "$Proxy" 开头的类名空间应该为代理类保留代理类扩展 java.lang.reflect.Proxy 代理类会按同一顺序准确地实现其创建时指定的接口
Java中getResourceAsStream的用法 pda158 java
1.Java中的getResourceAsStream有以下几种： 1. Class.getResourceAsStream(String path) ： path 不以’/'开头时默认是从此类所在的包下取资源，以’/'开头则是从ClassPath根下获取。其只是通过path构造一个绝对路径，最终还是由ClassLoader获取资源。　　2. Class.getClassLoader.get
spring 包官方下载地址（非maven） sinnk spring
SPRING官方网站改版后，建议都是通过 Maven和Gradle下载，对不使用Maven和Gradle开发项目的，下载就非常麻烦，下给出Spring Framework jar官方直接下载路径: http://repo.springsource.org/libs-release-local/org/springframework/spring/ s
Oracle学习笔记(7) 开发PLSQL子程序和包 vipbooks oracle sql 编程
哈哈，清明节放假回去了一下，真是太好了，回家的感觉真好啊！现在又开始出差之旅了，又好久没有来了，今天继续Oracle的学习！这是第七章的学习笔记，学习完第六章的动态SQL之后，开始要学习子程序和包的使用了……，希望大家能多给俺一些支持啊！编程时使用的工具是PLSQL