意必固我_LRL

零基础：21天搞定Python爬虫视屏学习笔记

昨天，刷知乎。我大概明白为何我总有那么多的迷茫。也明白为何我那么讨厌别人讲人生是一个过程，明白为何同学对讲我：“幸福不是得到你想要的，而是享受你所拥有的”。你努力，会不自觉的提高自己的预期，你努力，就越想得到及时的良好的刺激(有助于激励你的信息反馈)，但总在舒适区之外待着的你，意志力是短期内会用完的精神能量，还要面对那些期望落差，以及没有那么多的正能量信息反馈的自我孤独，所以我会有那么多的迷茫，那么多的怀疑，所以，对于努力这件事，不能太用力的努力，我现在所要做的是把短期的过度努力变成长期的恰到好处的喜欢和投入。或许，那些迷茫就会离我而去吧，我想。

-----------与Z信里讲到的话 2019. 8.28

第二章，网络请求

一些函数

#网络请求
from urllib import request
#url解析分割编码
from urllib import parse
#获取网页源码，读取
resp = request.urlopen("http://www.baidu.com")
print(resp.read())
#下载网页信息.，图片
request.urlretrieve('https://timgsa.baidu.com/timg?image&quality=80&size=b9999_10000&sec=1566922204525&di=339e9c960befadd84bbc2f2069ebdfd6&imgtype=0&src=http%3A%2F%2Fn1.itc.cn%2Fimg8%2Fwb%2Frecom%2F2016%2F02%2F05%2F145464426598286455.JPEG'
                   ,'深海泰坦.png')
#urlencode 将字典数据转化为url编码顺序
param = {"name":"张山","age":18}
result = parse.urlencode(param)
print(result)

#parse_qs函数的用法，对url字符串进行解码
params = {'name':'张三', 'age':18, 'greet':'hello world'}
qs = parse.urlencode(params)
print(qs)
print(parse.parse_qs(qs))
#urlparse和urlsplit 对url进行分割。urlsplit没有params.一般不用。
url = 'http://www.baidu.com/s;hello?wd=dfdgdfgdfgd&user=dfgfdj&n=df#1'
result = parse.urlparse(url)
result = parse.urlsplit(url)
print(result)
print('sheme:',result.scheme)
print('netloc:', result.netloc)
#request.Request类。在请求首部中增加请求头，User-Agent = http客户端程序信息
url = 'https://www.csdn.net/'
resp = request.urlopen(url)
headers = { 'User-Agent':"Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/74.0.3729.131 Safari/537.36"}
 data = {
    'first':'true',
     'pn':1,
 }
resp = request.Request(url, headers=headers)
resp = request.urlopen(resp)
print(resp.read())
#ProxyHandler处理器
#IP地址被禁的机制，使用代理服务器，通过代理转发请求。

#没有使用代理
url = "https://www.baidu.com"
resp = request.urlopen(url)
print(resp.read())
#使用代理
print('使用代理的方式！！')
#使用一个ProxyHandler传入一个handler
handler = request.ProxyHandler({'http':"163.204.244.166:9999"})
#使用上面的创建的handle构建一个opener
opener  = request.build_opener(handler)
# 使用opener去发送一个请求
resp = opener.open(url)
print(resp.read())

ProxyHandler处理器(处理)：

代理的原理：在请求目的服务器之前，先请求代理服务器，然后让代理服务器去请求目的服务器。
代理服务器拿到目的网站的数据后，在转发给我们的代码。
http://httpbin.orp:这个网站可以方便的查看http请求信息
在代码中使用代理
1. 使用urllib.request.ProxyHandlerchua()传入一个代理，代理一般为字典
2. 字典的key依赖于代理服务器能够接受的类型，一般为http、https，值为”ip:port
3. 使用上一步创建的hendler已及request.build_opener创建一个opener
4. 使用上一步创建的opener，调用open函数发起请求。

Cookie的使用：

NAME	cookie的名字
VALUE	cookie的值
Expires	cookie的过期时间
Path	cookie作用的路径
Domain	cookie作用的域名
SECUER	是否只在https协议下起作用

cookie的基本模块：

CookieJar基本类：管理HTTP cookie的值，存储http请求生成的Cookie，向传入的http请求添加cookie的对象，整个Cookie都存储在内存中。
FileCookieJar：将cookie 信息存储到文件里。Filename是存储Cookie的文件名。delayload为Ture时延迟访问文件。
MozillaCookieJar：创建与火狐浏览器Cookie.txt兼容的FileCookie实例。
LwPCookieJar：从FileCookieJar派生而来，创建Set-Cookie文件

使用Cookie登录

#使用cookie实现登录
from urllib import request
from http.cookiejar import CookieJar
from  urllib import parse
#不使用Cookie去请求主页
liruilong_url = "http://www.renren.com/441992574/profile"
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/74.0.3729.131 Safari/537.36'
    ,"Cookie":"anonymid=jzuwr9qvhzckya; depovince=GW; _r01_=1; JSESSIONID=abck6aHRYaKfhbTelbxZw; ick_login=933914fc-d2dc-4ad9-bc04-984b44895554; jebe_key=e592ad6f-ac4f-4c45-b82d-bd993b4700fb%7C98c73539fee1cffb5f9cc1945695ee9a%7C1566975619199%7C1%7C1566975619913; wp_fold=0; jebecookies=ce08c92d-fd6b-423b-a48a-3c3b5135e94f|||||; _de=A4BF4EA119AD552CA61D7350ED501D1C6DEBB8C2103DE356; p=59e59693e5f9e9e207fbea357eb1229c4; ap=441992574; first_login_flag=1; [email protected]; ln_hurl=http://hdn.xnimg.cn/photos/hdn421/20130209/1700/h_main_Ty4X_277a00000280111a.jpg; t=8c790067f935cd2df3f28ffc41d798934; societyguester=8c790067f935cd2df3f28ffc41d798934; id=441992574; xnsid=28f8b7e9; ver=7.0; loginfrom=null; jebe_key=e592ad6f-ac4f-4c45-b82d-bd993b4700fb%7C3290e3689bd6952d3672b3892c4aa0ca%7C1566976101710%7C1%7C1566976102421"
}
req = request.Request(url=liruilong_url, headers=headers)
resp = request.urlopen(req)
#print(resp.read().decode('utf-8'))
with open('renre.html','w', encoding='utf-8') as fp:
    #wtite函数必须写入一个Str的数据类型
    #resp.read()读出来是一个byte类型的数据。
    #byes - > decode -> str
    #str - > encode -> bytes
    fp.write(resp.read().decode('utf-8'))

自动化登录

#导入模块
from urllib import request
from http.cookiejar import CookieJar
from urllib import parse


headers = {
            'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/74.0.3729.131 Safari/537.36'
        }

def get_opener():
    #登录
    #1，创建一个Cookiejar对象
    cookiejar = CookieJar();
    #2，使用CookieJar创建一个HttpCookieProcess对象
    handler = request.HTTPCookieProcessor(cookiejar)
    #3，使用上一步创建的handler创建一个opener
    opener = request.build_opener(handler)
    return opener

#4，使用opener发送登录的请求(用户名和密码)
def log_renren(opener):

    data = {
        "email":"[email protected]",
        "password":"liruilong,1008"
           }
    login_url = "http://www.renren.com/PLogin.do"
    req = request.Request(login_url, data= parse.urlencode(data).encode('utf-8'),headers=headers)
    opener.open(req)

def visit_profile(opener):
    #5，访问个人主页
    liruilong_url = "http://www.renren.com/441992574/profile"
    #获取个人主页的时候不要新建一个opener，要使用之前的那一个
    #因为之前哪一个已经包含登录所需要的Cookie信息
    req = request.Request(liruilong_url, headers =headers)
    resp = opener.open(req)
    with open("renren.html", 'w', encoding='utf-8') as fp:
        fp.write(resp.read().decode('utf-8'))

if __name__ == '__main__':
    opener = get_opener()
    log_renren(opener)
    visit_profile(opener)

保存Cookie到本地：

可以使用cookiejar的save方法。并且保存到本地。

#encoding utf-8

from urllib import request
from http.cookiejar import MozillaCookieJar
#该位置指定了文件名，，save就不需要指定了，反之
cookiejar = MozillaCookieJar('cookie.txt')
cookiejar.load(ignore_discard=True)
handler = request.HTTPCookieProcessor(cookiejar)
opener = request.build_opener(handler)
resp = opener.open('https://blog.csdn.net/sanhewuyang/article/list/1?')
#保存Cookie信息
cookiejar.save()
cookiejar.save(ignore_discard=True)

for cookie in cookiejar:
    print(cookie)

request库：

一，发送GET请求，

#encoding :utf-8
import  requests
reponse = requests.get("https://www.baidu.com")
print(type(reponse.text))
#自己猜测的解码方式
print(reponse.text)
print(type(reponse.content))
print(reponse.content)
#指定解码方式
print(reponse.content.decode('utf-8'))
#返回当前请求的url
print(reponse.url)
#字符编码
print(reponse.encoding)
#状态码
print(reponse.status_code)

二，添加header和查询参数：

如果想要添加headers，可以传入hanfers参数来增加请求头中的请求首部。

发送get请求，直接rquests.get（url)方法实现
requests的一些属性，requests.content是直接从网络上抓取数据，没有进过解码，所以是一个bytes类型。
rquests.text；与context类似，requests会根据自己的猜测进行解码，乱码的时候一般使用requests.content.decode('utf-8)
发送post请求，requests.post(url),传入data数据，不需要编码，可以直接传递。
入如果返回的是json数据，那么可以调用 response.json方法。


import requests



headers = {
    #告知服务器请求的原始资源的URI
'Referer':'https://www.lagou.com/jobs/list_python?labelWords=&fromSearch=true&suginput='
    #HTTP客户端程序信息，伪装成客户端请求
,'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/74.0.3729.131 Safari/537.36'
}
date = {
    'first':'true'
    #页数
    ,'pn':'1'
    #关键字
    ,'kd':'python'
}
reponse = requests.post("https://www.lagou.com/jobs/positionAjax.json?city=%E5%8C%97%E4%BA%AC&needAddtionalResult=false",\
#传输 的数据和首部字段
data=date,headers=headers)
print(reponse.json())
print(reponse.text)

三，使用代理：

使用requests添加代理，只要在请求的方法传递proxies参数就可以了。

import requests

proxy = {
    'http':'115.211.43.6:9000'
}
#使用代理
response = requests.get("http://www.baidu.com",proxies=proxy)
print(response.text)

requests处理Cookie信息

import requests

#获取当前请求的Cookie
pesponse = requests.get("https://www.baidu.com")
print(pesponse.cookies.get_dict())
#session

处理cookie：

如果想要在多次请求中处理Cookie，那么应该使用session，

import requests

data = {
        "email":"[email protected]",
        "password":"liruilong,1008"
        }
headers = {
            'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/74.0.3729.131 Safari/537.36'
        }

login_url = "http://www.renren.com/PLogin.do"
#创建一个session对象
session = requests.session()
#由session对象发出post请求把Cookie信息传递过去
session.post(login_url, data=data, headers=headers)
#由session对象发出get请求获取登录后的页面信息。
response = session.get("http://www.renren.com/441992574/profile")

with open('renrens.html', 'w', encoding='utf-8') as fp:
    fp.write(response.text)

处理不信任的ssl证书，

import requests
#处理不信任的ssl证书
rept = requests.get('https://www.12306.cn/index/',verify=False)
print(rept.content.decode('utf-8'))

第三章，数据分析

xPath语法：

nodename：选取次节点的所有子节点，
/ 选取根节点下的元素，选择某节点下的某个元素，
// : //div 从全局节点中选择节点，随便找那个位置
@ : //div[@id] 选取某个节点的属性
谓词：
//body/div[1] 获取body的第一个元素， [<3]，[last()]倒数第二个元素，
[@name]拥有指定属性的元素，
[@name ='12']选取所有属性等于123的name元素。
[@class,'''sw']：模糊匹配，选取Class文件中sw字段的属性
//body[*] ：div下的所有元素
contains：有时候某个元素包含多个值，那么可以使用‘contains’函数，//div[contains(@class,'job_detail')]
下标是从零开始的，不是从一开始的。

lxml库：

是一个html、xml解析器，用来解析和获取html/xml.

使用html类去解析html文档。以字符串的方式：使用etree.HTML()

text = """ html文本"""
htmlelement = etree.HTML(text)
#打印html,使用html类去解析html文档。
print(etree.tostring(htmlelement, encoding='utf-8').decode('utf-8'))

从文件中读取html代码：

# 从文件中解析
def para():
    # 有可能解析不成功，指定解析器
    parser = etree.HTMLParser(encoding='utf-8')
    htmlelement = etree.parse("baidu.html", parser=parser)
    print(etree.tostring(htmlelement, encoding='utf-8').decode('utf-8'))

从lxml中使用XPath语法：

from lxml import etree

# 构造解析器
paeser = etree.HTMLPullParser(encoding="utf-8")
html = etree.parse("renre.html",parser=paeser)
# 获取指定的所有标签。
# xpath函数的返回的是列表
trs = html.xpath("//link")
for link in trs:
    print(etree.tostring(link, encoding='utf-8').decode('utf-8'))

#获取指定索引的指定标签
link = html.xpath('//link[2]')[0]
print(etree.tostring(link, encoding='utf-8').decode('utf-8'))

#获取所有指定属性的所有标签
lis = html.xpath("//li[@class='fd-nav-item']")
for link in lis:
    print(etree.tostring(link, encoding='utf-8').decode('utf-8'))

# 获取所有a标签中的href属性值
#因为是获取值。
atag = html.xpath("//a[@href]")
atag = html.xpath('//a/@href')
for link in atag:
    print(link)

#获取所有的文本信息
trs = html.xpath("//div[position()>1]")
for tr in trs:
    # 在当前标签下获取子孙标签，用xpath函数，
    #因该在// 之前加 点，代表当前元素下获取。
    ul = tr.xpath(".//ul/@class")
    # 获取li的所有文本
    title=  tr.xpath('.//li/text()')
    print(title)
    break

python学习第七节：正则表达式一只会敲代码的小灰灰 python学习 python 学习正则表达式
python学习第七节：正则表达式正则表达式基本上在所有开发语言中都会使用到，在python中尤为重要。当我们使用python开发爬虫程序将目标网页扒下来之后我们要从网页中解析出我们想要的信息，这个时候就需要正则表达式去进行匹配。importrere的常量re模块中有9个常量，常量的值都是int类型！（知道就行）修饰符描述re.l使匹配对大小写不敏感re.L做本地化识别(locale-aware)
Python学习指南——1.常用库说明 r135792uuuu python-机器学习 python
说在前面在开发之前，要去python库官网上查看是否有帮助的库。结合百度和pypi.org网站直接寻找需要的库。库安装方法：1pip安装2.文件安装：UCI页面需要https://www.lfd.uci.edu/~gohlke/pythonlibs或者conda提供的那些网站也行。文件安装：下载UCI、whl文件之后，又要使用pipinstall文件来安装放到lib文件夹vscode特殊：通常把要
Python学习笔记-Day05 snape00
Python学习笔记Day_05-构造程序逻辑作者的话学完前面的几个章节后，我觉得有必要在这里带大家做一些练习来巩固之前所学的知识，虽然迄今为止我们学习的内容只是Python的冰山一角，但是这些内容已经足够我们来构建程序中的逻辑。对于编程语言的初学者来说，在学习了Python的核心语言元素（变量、类型、运算符、表达式、分支结构、循环结构等）之后，必须做的一件事情就是尝试用所学知识去解决现实中的问题
小猿圈python学习-内置函数小猿圈IT教育
Python的len为什么你可以直接用？肯定是解释器启动时就定义好了内置参数详解https://docs.python.org/3/library/functions.html?highlight=built#ascii每个函数的作用我都帮你标好了abs#求绝对值all#ReturnTrueifbool(x)isTrueforallvaluesxintheiterable.Iftheiterabl
python学习笔记第5节-类和函数梁鋐俐
我们在前面的学习中学会了一个叫type（）的函数，用它来判断变量的类型，变量和它当下存储的数据绑定在一起。例如a=[4,5,6,7]print(type(a)）输出a=range（10，20，2）print（type（a））输出a=Trueprint（type（a））输出a={‘a54’：56}print（type（a））输出a={‘a54’，56}print（type（a））输出a=‘tyuio
Python学习笔记--列表、字典、集合、元组小黄酥 Python python 学习笔记
Python学习笔记43-列表#列表主要是用来存储多个数据.列表是有序的集合list_1=[]#创建一个空的列表list_2=[12,34,56,True,'abc']#创建一个列表#列表的访问，通过下标访问列表中的元素，下标默认从0开始，0表示第一个元素，-1表示最后一个元素list_3=[1,2,3,False,True,'abc']print(list_3[0])#1print(list_3
「python学习——小白篇」python函数中不定长参数的写法小天真_5eeb
那么作为新手该如何上手这门语言？一切不敲代码的学编程手段都是扯淡先来给大家来一个福利吧！python语法入门视频免费共享出来加q-u-n--227+435+450获取
python学习——conda install Python库时报PackagesNotFoundError:的错误的解决方案，很实用 _Oak_Tree_ python基础 python
安装完成Anaconda之后，我们可以在AnacondaPrompt交互式窗口中通过“condainstall库名称”实现Python库的安装，但是有时候在运用该命令进行安装时会提示PackagesNotFoundError:Thefollowingpackagesarenotavailablefromcurrentchannels:的错误，现在以Pydap库的安装为例，提供在Windows系统下
Python学习：执行系统shell命令 chaos-god python python shell
1.问题python可以作为shell替代，代码比较直观，易于维护。python支持调用外部shell命令。不过，这个问题没有看上去简单，要完美的解决此问题，比较复杂，就连标准库也不见得处理得很好。2.方案2.1.方案一首先最简单的方法就是调用system方法，直接执行系统shell命令，代码如下：importosos.system('ls-l')system主要问题，就是无法获取shell命令的
25道Python练手题（附详细答案），赶紧收藏！Python入门|Python学习豆本-豆豆奶 python 学习数据挖掘开发语言爬虫人工智能
题目1：水仙花数水仙花数（Narcissisticnumber）也被称为超完全数字不变数（pluperfectdigitalinvariant,PPDI）、自恋数、自幂数、阿姆斯壮数或阿姆斯特朗数（Armstrongnumber）水仙花数是指一个3位数，它的每个位上的数字的3次幂之和等于它本身。例如：1^3+5^3+3^3=153。foriinrange(100,1000):i1=i//100#取
python学习笔记08_赋值运算、逻辑运算、表达式、短路原则 flamingocc
python笔记081.赋值运算符num+=1等价于num=num+1num-=1等价于num=num-1num*=1等价于num=num*1num/=1等价于num=num/1num//2等价于num=num//2num%=2等价于num/2的余数num**2等价于num=num*num2.逻辑运算符逻辑运算符包含：not、and、or2.1and的用法：(且、并且)写法：条件1and条件2eg
Python学习笔记（三）：列表的定义、访问及修改 RANDY_Sw Python入门 python
今天学习了有关列表的定义、访问及修改的方法，在此整理一下。列表的定义与访问name_list=['zhangsan','lisi','wangwu']#创建一个列表name_list[0]='xiaobai'#修改列表中的单个元素print(name_list)#遍历的方式打印列表1foriteminname_list:print(item)#遍历的方式打印列表2i=0foriinrange(le
Python学习2：一定要注意用pycharm创建Python package和Pythonfile而不是普通路径和文件土小帽软件测试 Python学习
2019年5月7日23:30:02今天久违地再续上断了好久差点又半途而废的Python基础，结果跟着写继承，明明引入了父类，可还是运行报错，下面父类是Person，子类是Student，模块文件名小写。person文件：classPerson(object):def__init__(self,name,age):self.name=nameself.age=agedefrun(self):prin
Linux中检查网络问题的常用命令程序员喵哥 Linux 网络 linux php 服务器运维
更多Python学习内容：ipengtao.com在Linux系统中，网络问题是常见的挑战之一。无论是服务器管理员还是普通用户，都可能遇到各种网络故障，如连接问题、DNS解析问题、网络延迟等。为了快速诊断和解决这些问题，掌握一些常用的网络故障排查命令是至关重要的。本文将介绍一些在Linux系统中常用的网络故障排查命令，并提供详细的示例代码，方便更好地理解和应用这些命令。ping命令ping命令是最
python安全渗透笔记红云谈安全 python编程学习 python 安全
Python学习python常见错误UnicodeDecodeError:‘gbk’codeccan’tdecodebyte0x8cinposition22:illegalmultibytesequence//打开的文件未编码encoding='UTF-8'expectedanindentedblock未缩进，ifforcontinue又进入一次新的循环%将其他变量置入字符串特定位置以生成新字符串
Pyhton抓取BOSS直聘职位描述和数据清洗，很简单没有那么难嗨学编程
一、抓取详细的职位描述信息详情页分析Python学习资料或者需要代码、视频加Python学习群：960410445在详情页中，比较重要的就是职位描述和工作地址这两个由于在页面代码中岗位职责和任职要求是在一个div中的，所以在抓的时候就不太好分，后续需要把这个连体婴儿，分开分析。爬虫用到的库使用的库有：requestsBeautifulSoup4pymongoPython代码代码easy，初学者都能
Python基础（十二）：字典的详细讲解 m0_60707685 程序员 python 学习面试
感谢每一个认真阅读我文章的人，看着粉丝一路的上涨和关注，礼尚往来总是要有的：①2000多本Python电子书（主流和经典的书籍应该都有了）②Python标准库资料（最全中文版）③项目源码（四五十个有趣且经典的练手项目及源码）④Python基础入门、爬虫、web开发、大数据分析方面的视频（适合小白学习）⑤Python学习路线图（告别不入流的学习）网上学习资料一大堆，但如果学到的知识不成体系，遇到问题
Python基础（十五）：推导式的讲解_python基础(十五) 推导式的讲解 m0_60707685 程序员 python 学习面试
（1）Python所有方向的学习路线（新版）这是我花了几天的时间去把Python所有方向的技术点做的整理，形成各个领域的知识点汇总，它的用处就在于，你可以按照上面的知识点去找对应的学习资源，保证自己学得较为全面。最近我才对这些路线做了一下新的更新，知识体系更全面了。（2）Python学习视频包含了Python入门、爬虫、数据分析和web开发的学习视频，总共100多个，虽然没有那么全面，但是对于入门
socket网络编程python_python学习-socket网络编程张文岳
作业：多用户在线的FTP程序要求：用户加密认证允许同时多用户登录每个用户有自己的家目录，且只能访问自己的家目录对用户进行磁盘配额，每个用户的可用空间不同允许用户在ftpserver上随意切换目录允许用户查看当前目录下文件允许上传和下载文件，保证文件一致性文件传输过程中显示进度条附加功能：支持文件的断点续传(仅下载)README###功能实现作业：开发一个支持多用户在线的FTP程序要求：用户加密认证
python学习第六节：使用python制作九九乘法表和学生管理系统一只会敲代码的小灰灰经验总结 python 学习开发语言 pycharm
python学习第六节：使用python制作九九乘法表和学生管理系统通过前面五节的了解，已经大概知道python的语法以及基础函数，下面是简单的两个小程序。不会做没关系，看得懂就可以了，如果能够自己加工举一反三那就更好了。ps:前面五节只是简单讲解了python的基础语法和函数，也就是混个脸熟，没有进行深入讲解，如果展开来讲的话每一个单独的语法和函数都能将几大章，而很多语法和函数的用法我们根本用不
python函数全局变量和局部变量_Python学习（六）—— 函数、全局变量与局部变量... weixin_39654917
函数函数的定义1deftest(x):2"Thefunctiondefinition"3x+=14returnxdef：定义函数的关键字test：函数名()：内可定义形参“”：文档描述，非必要，但添加后可使得函数更易理解x+=1：泛指代码块或程序处理逻辑，最好不要过多，让函数的功能简洁明了return：定义返回值调用运行：可以带参数也可以不带函数名()1deftest(x):2"Thefuncti
python学习12：对txt/text类型的文件进行读写一名在八月份找工作的测试员前端 linux javascript
1.对txt类型的文件进行读写1）对text文件的操作打开文件-读/写文件-关闭文件1.1)打开文件open()1.2)读/写文件读:read(),readline(),rendlines()写:write()1.3)关闭文件close()#案例1:(读):mode='r'#filename='test004.txt'#同一个文件夹filename=r'D:\stdutyZiLiao\python
Python学习日记（Page.8）空手套不到_白狼学习 pycharm python
今日整理以便日后查看。如有错误欢迎指出。今天聊一下while循环语句。格式：while条件:条件满足时，做的事情1条件满足时，做的事情2条件满足时，做的事情3......案例：题目为求1累计加到100的和i＝1sum＝0whilei＜＝100sum+＝ii+＝1print("1到100的和为：%d"%sum)
基于python的游戏玩家行为数据分析与预测_python有付费数据如何做简单预测(1) 2401_84538391 程序员 python 游戏数据分析
学好Python不论是就业还是做副业赚钱都不错，但要学会Python还是要有一个学习规划。最后大家分享一份全套的Python学习资料，给那些想学习Python的小伙伴们一点帮助！一、Python所有方向的学习路线Python所有方向路线就是把Python常用的技术点做整理，形成各个领域的知识点汇总，它的用处就在于，你可以按照上面的知识点去找对应的学习资源，保证自己学得较为全面。二、学习软件工欲善其
Python常用的10个自动化脚本（附详细源码）！进击的六角龙 Python python 自动化自动化办公开发语言
前言Python是一种强大的编程语言，非常适合自动化各种任务。以下列出了Python常用于自动化的10个脚本示例，涵盖了文件管理、网络操作、数据处理等多个方面（文末附python学习资料）。1.文件备份脚本这个脚本可以定期备份指定目录下的所有文件到另一个位置。importshutilimportosimportdatetimedefbackup_files(src,dst):timestamp=d
Python递归爬取今日头条指定用户一个月内发表的所有文章，视频，微头条(2) 2401_84139095 程序员 python 开发语言
感谢每一个认真阅读我文章的人，看着粉丝一路的上涨和关注，礼尚往来总是要有的：①2000多本Python电子书（主流和经典的书籍应该都有了）②Python标准库资料（最全中文版）③项目源码（四五十个有趣且经典的练手项目及源码）④Python基础入门、爬虫、web开发、大数据分析方面的视频（适合小白学习）⑤Python学习路线图（告别不入流的学习）网上学习资料一大堆，但如果学到的知识不成体系，遇到问题
周报 | 24.8.26-24.9.1文章汇总双木的木 python拓展学习深度学习拓展阅读目标检测人工智能 python 计算机视觉 gpt transformer stable diffusion
为了更好地整理文章和发表接下来的文章，以后每周都汇总一份周报。周报|24.8.19-24.8.25文章汇总-CSDN博客python|提升代码迭代速度的Python重载方法-CSDN博客机器学习算法与Python学习|黑匣子被打开了？能玩的Transformer可视化解释工具！_研究别人的黑盒算法机器学习python-CSDN博客极市平台|语言图像模型大一统！Meta将Transformer和Di
Python学习日记（Pag.7）空手套不到_白狼学习 python pycharm
拿猜数字的案例说一下判断语句的嵌套。如有错误欢迎指正。题目：要求如下：1.数字随机产生，范围为1-102.有3次机会猜测数字，通过三层嵌套判断实现3.每次都猜不中的话，会提示猜大了还是小了示例：importrandomnum=random.randint(1,10)#随机生成1-10以内的数字guess_num=int(input("您所猜测的数字是:"))ifguess_num==num:pri
Python学习日志（1）—— IDE Strawberry96 python 学习 ide python
IDE，集成开发环境，帮助我们进行高效的开发。Python开发——IDE应用场景选择：适合本地开发：VSCode：适合初学者，轻量级PyCharm：适合有经验的程序员，多人合作，重量级适合远程开发：Jupter：适合数学科学家，AI开发VSCode和PyCharm的安装比较简单。Jupter是第一次听说，在进行AI的开发或者是图片处理之类的，可以在远程开发。安装Jupter//3.12是对应的py
Python学习和面试中的常见问题及答案写代码的M教授 Python学习计划 python 学习面试
整理了一些关于Python和机器学习算法的高级问题及其详细答案。这些问题涵盖了多个方面，包括数据处理、模型训练、评估、优化和实际应用。一、Python编程问题解释Python中的装饰器（Decorators）是什么？它们的作用是什么？答案：装饰器是一种高阶函数，能够在不修改函数定义的情况下扩展或修改函数的行为。它们通常用于日志记录、权限验证、缓存等场景。使用@decorator_name语法将装饰
jdk tomcat 环境变量配置 Array_06 java jdk tomcat
Win7 下如何配置java环境变量 1。准备jdk包，win7系统，tomcat安装包（均上网下载即可） 2。进行对jdk的安装，尽量为默认路径（但要记住啊！！以防以后配置用。。。） 3。分别配置高级环境变量。电脑-->右击属性-->高级环境变量-->环境变量。分别配置 : path &nbs
Spring调SDK包报java.lang.NoSuchFieldError错误 bijian1013 java spring
在工作中调另一个系统的SDK包，出现如下java.lang.NoSuchFieldError错误。 org.springframework.web.util.NestedServletException: Handler processing failed; nested exception is java.l
LeetCode[位运算] - #136 数组中的单一数 Cwind java 题解位运算 LeetCode Algorithm
原题链接：#136 Single Number 要求：给定一个整型数组，其中除了一个元素之外，每个元素都出现两次。找出这个元素注意：算法的时间复杂度应为O(n)，最好不使用额外的内存空间难度：中等分析：题目限定了线性的时间复杂度，同时不使用额外的空间，即要求只遍历数组一遍得出结果。由于异或运算 n XOR n = 0, n XOR 0 = n，故将数组中的每个元素进
qq登陆界面开发 15700786134 qq
今天我们来开发一个qq登陆界面，首先写一个界面程序，一个界面首先是一个Frame对象，即是一个窗体。然后在这个窗体上放置其他组件。代码如下： public class First { public void initul(){ jf=ne
Linux的程序包管理器RPM 被触发 linux
在早期我们使用源代码的方式来安装软件时，都需要先把源程序代码编译成可执行的二进制安装程序，然后进行安装。这就意味着每次安装软件都需要经过预处理-->编译-->汇编-->链接-->生成安装文件--> 安装，这个复杂而艰辛的过程。为简化安装步骤，便于广大用户的安装部署程序，程序提供商就在特定的系统上面编译好相关程序的安装文件并进行打包，提供给大家下载，我们只需要根据自己的
socket通信遇到EOFException 肆无忌惮_ EOFException
java.io.EOFException at java.io.ObjectInputStream$PeekInputStream.readFully(ObjectInputStream.java:2281) at java.io.ObjectInputStream$BlockDataInputStream.readShort(ObjectInputStream.java:
基于spring的web项目定时操作知了ing java Web
废话不多说，直接上代码，很简单配置一下项目启动就行 1，web.xml <?xml version="1.0" encoding="UTF-8"?> <web-app xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns="h
树形结构的数据库表Schema设计矮蛋蛋 schema
原文地址： http://blog.csdn.net/MONKEY_D_MENG/article/details/6647488 程序设计过程中，我们常常用树形结构来表征某些数据的关联关系，如企业上下级部门、栏目结构、商品分类等等，通常而言，这些树状结构需要借助于数据库完成持久化。然而目前的各种基于关系的数据库，都是以二维表的形式记录存储数据信息，
maven将jar包和源码一起打包到本地仓库 alleni123 maven
http://stackoverflow.com/questions/4031987/how-to-upload-sources-to-local-maven-repository <project> ... <build> <plugins> <plugin> <groupI
java IO操作与 File 获取文件或文件夹的大小，可读，等属性！！！百合不是茶
类 File File是指文件和目录路径名的抽象表示形式。 1，何为文件：标准文件（txt doc mp3...）目录文件（文件夹）虚拟内存文件 2，File类中有可以创建文件的 createNewFile（）方法,在创建新文件的时候需要try{} catch(）{}因为可能会抛出异常；也有可以判断文件是否是一个标准文件的方法isFile();这些防抖都
Spring注入有继承关系的类（2） bijian1013 java spring
被注入类的父类有相应的属性，Spring可以直接注入相应的属性，如下所例：1.AClass类 package com.bijian.spring.test4; public class AClass { private String a; private String b; public String getA() { retu
30岁转型期你能否成为成功人士 bijian1013 成长励志
很多人由于年轻时走了弯路，到了30岁一事无成，这样的例子大有人在。但同样也有一些人，整个职业生涯都发展得很优秀，到了30岁已经成为职场的精英阶层。由于做猎头的原因，我们接触很多30岁左右的经理人，发现他们在职业发展道路上往往有很多致命的问题。在30岁之前，他们的职业生涯表现很优秀，但从30岁到40岁这一段，很多人
【Velocity四】Velocity与Java互操作 bit1129 velocity
Velocity出现的目的用于简化基于MVC的web应用开发，用于替代JSP标签技术，那么Velocity如何访问Java代码.本篇继续以Velocity三http://bit1129.iteye.com/blog/2106142中的例子为基础， POJO package com.tom.servlets; public
【Hive十一】Hive数据倾斜优化 bit1129 hive
什么是Hive数据倾斜问题操作：join,group by,count distinct 现象：任务进度长时间维持在99%（或100%），查看任务监控页面，发现只有少量（1个或几个）reduce子任务未完成；查看未完成的子任务，可以看到本地读写数据量积累非常大，通常超过10GB可以认定为发生数据倾斜。原因：key分布不均匀倾斜度衡量：平均记录数超过50w且
在nginx中集成lua脚本：添加自定义Http头，封IP等 ronin47 nginx lua csrf
Lua是一个可以嵌入到Nginx配置文件中的动态脚本语言，从而可以在Nginx请求处理的任何阶段执行各种Lua代码。刚开始我们只是用Lua 把请求路由到后端服务器，但是它对我们架构的作用超出了我们的预期。下面就讲讲我们所做的工作。强制搜索引擎只索引mixlr.com Google把子域名当作完全独立的网站，我们不希望爬虫抓取子域名的页面，降低我们的Page rank。 location /{
java-3.求子数组的最大和 bylijinnan java
package beautyOfCoding; public class MaxSubArraySum { /** * 3.求子数组的最大和题目描述：输入一个整形数组，数组里有正数也有负数。数组中连续的一个或多个整数组成一个子数组，每个子数组都有一个和。求所有子数组的和的最大值。要求时间复杂度为O(n)。例如输入的数组为1, -2, 3, 10, -4,
Netty源码学习-FileRegion bylijinnan java netty
今天看org.jboss.netty.example.http.file.HttpStaticFileServerHandler.java 可以直接往channel里面写入一个FileRegion对象，而不需要相应的encoder： //pipeline（没有诸如“FileRegionEncoder”的handler）： public ChannelPipeline ge
使用ZeroClipboard解决跨浏览器复制到剪贴板的问题 cngolon 跨浏览器复制到粘贴板 Zero Clipboard
Zero Clipboard的实现原理 Zero Clipboard 利用透明的Flash让其漂浮在复制按钮之上，这样其实点击的不是按钮而是 Flash ，这样将需要的内容传入Flash，再通过Flash的复制功能把传入的内容复制到剪贴板。 Zero Clipboard的安装方法首先需要下载 Zero Clipboard的压缩包，解压后把文件夹中两个文件：ZeroClipboard.js
单例模式 cuishikuan 单例模式
第一种（懒汉，线程不安全）： public class Singleton { 2 private static Singleton instance; 3 pri
spring+websocket的使用 dalan_123
一、spring配置文件 <?xml version="1.0" encoding="UTF-8"?><beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http://www.w3.or
细节问题：ZEROFILL的用法范围。 dcj3sjt126com mysql
1、zerofill把月份中的一位数字比如1，2，3等加前导0 mysql> CREATE TABLE t1 (year YEAR(4), month INT(2) UNSIGNED ZEROFILL, -> day
Android开发10——Activity的跳转与传值 dcj3sjt126com Android开发
Activity跳转与传值，主要是通过Intent类，Intent的作用是激活组件和附带数据。一、Activity跳转方法一Intent intent = new Intent(A.this, B.class); startActivity(intent) 方法二Intent intent = new Intent();intent.setCla
jdbc 得到表结构、主键 eksliang jdbc 得到表结构、主键
转自博客：http://blog.csdn.net/ocean1010/article/details/7266042 假设有个con DatabaseMetaData dbmd = con.getMetaData(); rs = dbmd.getColumns(con.getCatalog(), schema, tableName, null); rs.getSt
Android 应用程序开关GPS gqdy365 android
要在应用程序中操作GPS开关需要权限： <uses-permission android:name="android.permission.WRITE_SECURE_SETTINGS" /> 但在配置文件中添加此权限之后会报错，无法再eclipse里面正常编译，怎么办？ 1、方法一：将项目放到Android源码中编译； 2、方法二：网上有人说cl
Windows上调试MapReduce zhiquanliu mapreduce
1.下载hadoop2x-eclipse-plugin https://github.com/winghc/hadoop2x-eclipse-plugin.git 把 hadoop2.6.0-eclipse-plugin.jar 放到eclipse plugin 目录中。 2.下载 hadoop2.6_x64_.zip http://dl.iteye.com/topics/download/d2b
如何看待一些知名博客推广软文的行为？ justjavac 博客
本文来自我在知乎上的一个回答：http://www.zhihu.com/question/23431810/answer/24588621 互联网上的两种典型心态：当初求种像条狗，如今撸完嫌人丑当初搜贴像条犬，如今读完嫌人软你为啥感觉不舒服呢？难道非得要作者把自己的劳动成果免费给你用，你才舒服？就如同 Google 关闭了 Gooled Reader，那是
sql优化总结 macroli sql
为了是自己对sql优化有更好的原则性，在这里做一下总结，个人原则如有不对请多多指教。谢谢！要知道一个简单的sql语句执行效率，就要有查看方式，一遍更好的进行优化。一、简单的统计语句执行时间 declare @d datetime ---定义一个datetime的变量set @d=getdate() ---获取查询语句开始前的时间select user_id
Linux Oracle中常遇到的一些问题及命令总结超声波 oracle linux
1.linux更改主机名 (1)#hostname oracledb　　　　临时修改主机名 (2) vi /etc/sysconfig/network 　　修改hostname (3) vi /etc/hosts　　　　　　　　修改IP对应的主机名 2.linux重启oracle实例及监听的各种方法（注意操作的顺序应该是先监听，后数据库实例） &nbs
hive函数大全及使用示例 superlxw1234 hadoop hive函数
具体说明及示例参见附件文档。文档目录：目录一、关系运算： 4 1. 等值比较: = 4 2. 不等值比较: <> 4 3. 小于比较: < 4 4. 小于等于比较: <= 4 5. 大于比较: > 5 6. 大于等于比较: >= 5 7. 空值判断: IS NULL 5
Spring 4.2新特性-使用@Order调整配置类加载顺序 wiselyman spring 4
4.1 @Order Spring 4.2 利用@Order控制配置类的加载顺序 4.2 演示两个演示bean package com.wisely.spring4_2.order; public class Demo1Service { } package com.wisely.spring4_2.order; public class