VisionaryX

day063 urllib2库的进阶使用及requests库的使用

urllib2 模块可以伪装成普通web客户端，发送请求，爬取数据，今天进一步了解一下这个模块的使用。如果会使用了，那就不要用它了，因为有更加简单好用的requests 模块。但是学习使用urllib2模块的使用，会加深你对爬虫过程的理解，还是要好好学。

主要内容

urllib2 get请求 json数据

一般网页都会使用ajax请求加载网页内的数据，因为可以在不用刷新网页
爬取数据时，要明确自己爬取的目标，不必要每次都把整个页面的数据爬下来，学会使用浏览器的检查功能（如chrome）,的抓包功能，查看到具体的某个目标Ajax请求，然后进行数据爬取。
实例：爬取豆瓣电影的电影排行数据
步骤：
1. 找到具体的更新排行页数据的ajax请求，明确目标url
2. 设置好headers（User-Agent）
3. 使用urllib.urlopen()，发送请求，返回响应对象
4. 将数据保存到本地
代码

# -*- coding:utf-8 -*-
import urllib2, urllib


# 抓取豆瓣电影电影排行的一页json数据
class Douban_Spider(object):
    def __init__(self):
        self.base_url = 'https://movie.douban.com/j/chart/top_list?'
        self.headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64; Trident/7.0; rv:11.0) like Gecko"}

    # 发送请求
    def send_request(self, params):
        # 拼接完整的url
         # 将字典形式的参数转换为可以拼接的字符串形式
        params_str = urllib.urlencode(params)
        complete_url = self.base_url + params_str
        print complete_url

        # 创建并且设置好请求报文
        request = urllib2.Request(complete_url, headers=self.headers)
        # 发送请求
        response = urllib2.urlopen(request)
        data = response.read()
        return data

    # 保存数据
    def save_data(self, data):
        with open('02_douban_ajax_get_top_list.json', 'w') as f:
            f.write(data)

    # 主逻辑
    def start_spider(self,params):


        # 发送请求
        data = self.send_request(params)

        # 保存数据
        self.save_data(data)


if __name__ == '__main__':

    # 创建爬虫队对象
    douban_spider = Douban_Spider()

    # 创建网页的参数
    params={
        "type": "17",
        "interval_id": "100:90",
        "action": "",
        "start": "80",
        "limit": "20",
    }
    # 开始爬虫
    douban_spider.start_spider(params)

结果
- mac可在终端中用 open 02_requests_douban_ajax_get_json.json在浏览器查看
- linux 的命令为 xdg-open 02_requests_douban_ajax_get_json.json

urllib2 post请求添加参数

post 需要提供参数，格式为dict,注意需要用urllib.urlencode()进行转码后再传参
若获取参数为json数据，需要用json.loads()转换为dict后使用

实例：抓取百度翻译汉->英的结果

步骤：
- 1.明确url(这里注意，因为百度翻译网页版在请求里进行了js验证处理，所以要使用手机端的请求方式)
- 2.创建headers(注意User-Agent要使用手机端的信息)
- 3.明确要传递的参数
- 4.创建request对象，传入url,headers
- 5.发送请求，返回响应对象
- 6.读取对象内容，转换成字典形式
- 7.定位到想要的结果，输出
代码：

# -*- coding:utf-8 -*-
import urllib2, urllib, json

# 输入中文，爬取百度翻译返回的响应英文结果（汉－英翻译小程序）
class Fanyi_Baidu_Spider(object):
    def __init__(self):
        self.base_url = 'http://fanyi.baidu.com/basetrans'
        self.headers = {
            'User-Agent': 'Mozilla/5.0 (iPhone; CPU iPhone OS 11_0 like Mac OS X) AppleWebKit/604.1.38 (KHTML, like Gecko) Version/11.0 Mobile/15A372 Safari/604.1'
        }
    # 发送请求
    def send_request(self, form_data):
        # 创建并且设置好请求报文
        request = urllib2.Request(self.base_url, data=form_data, headers=self.headers)
        # 发送请求
        response = urllib2.urlopen(request)
        # 读取响应对象的内容，为json
        res_json = response.read()
        # print res_json
        # 将json类型转换为字典类型并返回
        res_dict = json.loads(res_json)
        # print res_dict
        return res_dict

    # 保存数据
    def print_res(self, res_dict):
        # 取出字典中需要的翻译结果值
        res = res_dict['trans'][0]["result"][0][1]
        # 输出结果
        print res

    # 主逻辑
    def start_spider(self,form_data):
        # 发送post请求
        res_dict = self.send_request(form_data)

        # 输出结果
        self.print_res(res_dict)


if __name__ == '__main__':

    # 创建爬虫队对象
    fanyi_baidu_spider = Fanyi_Baidu_Spider()

    # 创建post的表单数据
    form_data = {
        "query":raw_input("请输入要翻译的中文单词"),
        "from": "zh",
        "to": "en",
    }
    # 因为有中文，将参数转译
    form_data = urllib.urlencode(form_data)

    # 开始爬虫，并且输出翻译后的结果
    fanyi_baidu_spider.start_spider(form_data)

结果：

urllib2 忽略ssl认证

对于网站协议为’https’的，跟’http’相比，是一种更安全的方式，因为进行了ssl认证。
在访问没有ssl认证的网站时，使用协议’https’就会报错。如果想要忽略这种错误，就需要进行忽略ssl的设置
在python爬虫中，使用ssl模块处理

实例：用’https’协议访问12306网站（12306网站没有进行SSL认证，它是其他的认证方式）

步骤：

1.明确url,创建headers
2.创建request对象，传入url, headers
3.使用ssl模块，ssl._create_unverified_context()创建忽略ssl认证的上下文context
4.发送请求，返回响应对象
5.将数据转码后存储到本地

代码：

# -*- coding:utf-8 -*-

import urllib2

# 1.导入ssl模块
import ssl


# 使用ssl模块来设置忽略ssl认证（１，２，３个步骤）
class IgnoreSSLVerify(object):
    # 　初始化
    def __init__(self):
        self.base_url = 'https://www.12306.cn/mormhweb/'
        self.headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64; Trident/7.0; rv:11.0) like Gecko"}

    # 发送请求
    def send_request(self):
        # 创建并设置request对象
        request = urllib2.Request(self.base_url, headers=self.headers)

        # 应当在发送请求之前设置忽略ssl认证
         # 2.创建忽略认证上下文
        context = ssl._create_unverified_context()

        # 发送请求(3.将忽略认证上下文以参数形式传给urllib2.urlopen()方法)
        response = urllib2.urlopen(request, context=context)
        # 读取响应对象的内容并返回
        data = response.read()
        return data

    # 保存数据到本地
    def save_data(self, data):
        with open('04_12306_ignore_ssl_verify.html', 'w') as f:
            f.write(data)

    # 主逻辑
    def ignore_SSL_verify_spider(self):
        # 发送请求
        data = self.send_request()
        # 保存数据到本地
        self.save_data(data)


if __name__ == '__main__':
    # 实例化爬虫类
    ignore_SSL_verify = IgnoreSSLVerify()

    # 开始爬
    ignore_SSL_verify.ignore_SSL_verify_spider()

结果：
- 可以使用open命令在浏览器中查看

urllib2 底层控制器的选择

urllib2的urlopen()方法虽然可以发送一般的请求。但是当有更多的需求时，它就满足不了了。如需要带着cookie进行发送请求，代理请求，web验证。
此时就需要使用urllib2的底层类和方法，需要自定义选择需要的控制器handler，然后创建响应功能的opener进行发送请求
这种控制器包括，但不限于：
- urllib2.HTTPCookieProcessor(),用来携带cookie，需要跟cookiejia模块配合使用
- urllib2.ProxyHandler()，用来处理代理功能
- urllib2.HTTPBasicAuthHandler()，用来创建认证控制器，需要和urllib2.HTTPPasswordMgrWithDefaultRealm()，密码管理器配合使用

自动保存cookie

许多页面是必须要求用户用户登陆后，才能查看的。如人人网的好友信息页面。这种时候，一般的处理方法是先登录后抓取到生成的cookie值，然后拼接到headers中再访问需要登录后查看的页面。比较麻烦。
简单一点，就是使用代码进行登录，用携带着cookie的opener进行抓取需要登录的网页，这个时候就需要用到urllib2.HTTPCookieProcessor()控制器

实例：抓取人人网某个好友的个人信息页面

步骤：
- 1.确定登录的url，创建headers，确定账户账号密码
- 2.创建cookiejar对象，用来存储cookie
- 3.创建HTTPCookieProcessor，传入cookiejar对象
- 4.创建opner对象
- 5.发送请求，完成登录，在opener中存储到cookie
- 6.确定好友信息页面url
- 7.用保存了cookie信息的opener发送请求，返回响应对象
- 8.读取响应数据，保存到本地

代码：

# -*- coding:utf-8 -*-
import urllib2, urllib
import cookielib


# 通过用代码登陆，获取登陆后的cookie后爬取人人网好友页面
def AutoLoginToSpiderRenren():
    # 创建cookiejar, 用来存储cookie
    cookiejar = cookielib.CookieJar()
    # 定义cookie控制器
    handler = urllib2.HTTPCookieProcessor(cookiejar)
    # 创建opener
    cookiejar_opener = urllib2.build_opener(handler)

    # 用自定义的opener来登陆
     # 帐户名，密码
    formdata = {
        "email": "[email protected]",
        "password": "alarmchime"
    }
    formdata_str = urllib.urlencode(formdata)
     # 登陆
    url ="http://www.renren.com/PLogin.do"# 在html代码中找到这个url
    headers = {
        "User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/59.0.3071.86 Safari/537.36"}
    request = urllib2.Request(url,data=formdata_str, headers=headers)
    cookiejar_opener.open(request)# 此时，opener中已经存储好了cookie

    # 带着cookie访问好友主页
    prifle_url = 'http://www.renren.com/963916023/profile'
    profile_request = urllib2.Request(prifle_url, headers=headers)
    try:
        response = cookiejar_opener.open(profile_request)
        data = response.read()
        # 保存数据
        with open('08_autologin_to_spider_renren_profile.html', 'w') as f:
            f.write(data)
    except Exception, err:
        print err


if __name__ == '__main__':
    AutoLoginToSpiderRenren()

结果：
- 可以使用open命令在浏览器中查看

proxy设置

如果同一个ip在短时间内访问同一个一个网站过多次，那么就会引起这个网站的运营人员的注意，一般就会认为是程序在访问，会采取封IP等方式进行处理。
解决这个问题的方法是–使用代理
urllib2的底层控制器中就有可以定义代理的：urllib2.ProxyHandler（）

实例：使用其他的代理访问百度首页，返回页面信息

步骤：

1.创建代理，格式：{‘协议’：’ip:port’}
2.创建urllib2.ProxyHandler()控制器对象，将代理传入
3.创建有代理功能的opener
4.使用有代理功能的opnener进行百度首页的请求

代码

# -*- coding:utf-8 -*-
import urllib2


# 使用代理发送请求

def proxy_request():
    # 需要设置代理ip时，使用proxyhandler
    headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/59.0.3071.86 Safari/537.36"}
    url = 'http://www.baidu.com'
    request =  urllib2.Request(url, headers=headers)

    # 设置代理ip
    # 免费代理ip: {"协议":"ip:port"}
    proxy = {"http":"221.8.165.231:8060"}
    # 收费的代理ip:{"协议":"username:pwd@ip:port"}
    proxy = {'http': 'mr_mao_hacker:[email protected]:16816'}


    # 1.创建proxy控制器
    proxy_handler = urllib2.ProxyHandler(proxies=proxy)

    # 2.创建opener，将proxy_handler传入
    proxy_opener = urllib2.build_opener(proxy_handler)

    # 3.使用proxy_opener发送请求
    response = proxy_opener.open(request)

    print response.read()


if __name__ == '__main__':
    proxy_request()

结果：

web 验证

有时候，网站会有一些弹窗验证页面，需要输入账号密码后才能继续访问，此时需要使用urllib的web验证控制器：urllib2.HTTPBasicAuthHandler()
注意要先创建密码管理器：urllib2.HTTPPasswordMgrWithDefaultRealm()
注意web验证和需要登陆后访问的区别，web验证是，只要输入了账号密码，验证通过就可以继续访问，不需要设置cookie,而登陆后才能继续访问，实质上是需要携带cookie信息访问

实例：自动验证通过一个需要web验证的小程序，请求网页的内容
- 步骤：
- 1. 创建密码管理器，传入账号密码
- 2. 创建web验证控制器，传入密码管理器
- 3. 创建可以自动通过web验证的opener
- 4. 使用这个opener进行网页内容的请求，返回响应对象
- 5. 读取内容输出

代码：

import urllib2


# 当需要web认证时，可以自定义web认证控制器，然后再爬取网页
def web_auth():
    # 要爬取的网页
    url = 'http://60.205.187.28/login.php'

    # 认证需要的帐户名，密码
    # account={
    #     'user_name':'admin',
    #     'pwd':'admin'
    # }
    # 密码管理器
    pwd_manager = urllib2.HTTPPasswordMgrWithDefaultRealm()
    # 需要传入的参数
    # realm=None # None
    # uri=url  # 就是要爬取的网页url
    # user='admin' # 用户名
    # passwd='admin'# 密码
    pwd_manager.add_password(None, uri=url, user='admin', passwd='admin')

    # 创建认证控制器
    web_auth_handler = urllib2.HTTPBasicAuthHandler(pwd_manager)
    # 创建opener
    web_auth_opener = urllib2.build_opener(web_auth_handler)

    # 请求网页，返回数据
    response = web_auth_opener.open(url)

    print response.read()


if __name__ == '__main__':
    web_auth()

结果：

正常请求，需要验证

自动web验证后，直接获取到结果

requests模块

如果觉得之前的urllib2的访问太繁琐，那么request模块就是为你为准备的
它的slogen是：HTTP for human ,可见是很友好的
简单用法如下：

# -*- coding:utf-8 -*-
import requests


# requests:HTTP for humen,更加方便快捷的完成之前的所有功能
def requests_base_use():
    url = 'http://www.baidu.com'
    headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/59.0.3071.86 Safari/537.36"}

    # 1. get请求　可以将参数和设置的头文件信息一并当参数传给函数,参数可以自动转码，一步搞定
    # params = {}
    # response = requests.get(url, params=params, headers=headers)
    # # print response.text # 这里是unicode编码 可以用type()查看
    # print response.content # 这里是　str，可以用type()查看

    # 2.post请求　和get一样，formdata也是可以直接当参数传入,自动转码，一步搞定
    # formdata = {}
    # response = requests.post(url=url, data=formdata, headers=headers)
    # # print response.text
    # print response.content

    # 3.ssl
    # response = requests.get(url, verify=False)

    # 4. proxy
    # proxy = {}
    # response = requests.get(url, proxies=proxy)

    # 5. cookie
    session = requests.session()
    # 通过session对象可以自动记录cookie
    # form_data={user_name:xxx, pwd:xxxx}
    # 登陆，记录session
    # session.post(url, data=form_data)
    # 用带cookie的session再次发送请求，就不会跳转到登陆页了
    # response = session.get(url)

    # 6.web auth
    auth =('username', 'pwd')
    requests.get(url, auth=auth)

可以发现，同样的满足功能，requests对象，要简单许多，以下是满足之前的实例相同的功能，requests模块的代码：
爬取豆瓣电影的电影排行数据

import requests
# 需要的参数：1.url 2.get请求的参数　3.headers设置项
url = 'https://movie.douban.com/j/chart/top_list?'
headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64; Trident/7.0; rv:11.0) like Gecko"}
params = {
    "type": "17",
    "interval_id": "100:90",
    "action": "",
    "start": "80",
    "limit": "20",
}
# 爬取网页，返回数据
response = requests.get(url=url, params=params, headers=headers)

# 保存数据到本地
with open('02_requests_douban_ajax_get_json.json', 'w') as f:
    f.write(response.content)

抓取百度翻译汉->英的结果

import requests
import json

# 需要的参数:
url = 'http://fanyi.baidu.com/basetrans'
headers = {'User-Agent': 'Mozilla/5.0 (iPhone; CPU iPhone OS 11_0 like Mac OS X) AppleWebKit/604.1.38 (KHTML, like Gecko) Version/11.0 Mobile/15A372 Safari/604.1'}
form_data = {
        "query":raw_input("请输入要翻译的中文单词"),
        "from": "zh",
        "to": "en",
    }

# 发送请求，返回结果
response = requests.post(url=url, data=form_data, headers=headers)

# 处理返回结果，输出
res_dict = json.loads(response.content)
print res_dict['trans'][0]["result"][0][1]

用’https’协议访问12306网站

import requests


# 需要的参数
url = 'https://www.12306.cn/mormhweb/'
headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64; Trident/7.0; rv:11.0) like Gecko"}

# 发送请求返回响应
response = requests.get(url=url, headers=headers, verify=False)

# 输出响应数据
print response.content

抓取人人网某个好友的个人信息页面

import requests


# 需要的参数
login_url = "http://www.renren.com/PLogin.do"
headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/59.0.3071.86 Safari/537.36"}
formfata = {
    "email": "[email protected]",
    "password": "alarmchime"
}

# 创建session对象，可以存储cookie
session = requests.session()

# 使用session对象登陆网页，会自动存储cookie数据
session.post(url=login_url, data=formfata, headers=headers)

# 使用存储了cookie的session对象，访问好友主页
profile_url = 'http://www.renren.com/963916023/profile'
response = session.get(url=profile_url, headers=headers)

# 存储／输出结果
print response.content

使用其他的代理访问百度首页，返回页面信息

import requests


# 参数
url = 'http://www.baidu.com'
headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/59.0.3071.86 Safari/537.36"}
proxy = {'http':'221.8.165.231:8060'}

# 发送请求，返回响应
response = requests.get(url=url, headers=headers, proxies=proxy)

# 输出结果
print response.content

自动验证通过一个需要web验证的小程序，请求网页的内容

import requests


# 需要的参数
url = 'http://60.205.187.28/login.php'
auth = ('admin', 'admin')

# 请求，返回响应对象
response = requests.get(url=url, auth=auth)

# 输出结果
print response.content

总结

疯狂python讲义学习日志06——异常处理静笃归心方得平和心气 Python学习日志异常处理 python学习 python笔记 python速成
疯狂python讲义学习日志06——异常处理引言1异常处理机制1.1使用try...except处理异常1.2异常类的继承体系1.3多异常捕获1.4访问异常信息1.5else块1.6使用finally回收资源2使用raise处理异常2.1引发异常2.2自定义异常类2.3except和raise同时使用3.python的异常传播轨迹4.异常处理规则4.1不要过度使用异常4.2不要忽略异常引言异常机制
Python学习日志3-复合类型可惜还不下雨学习
python支持多种复合类型，可以将不同的值组合在一起一、列表列表（list）是用方括号标注、逗号隔开的一组值，可以包含不同类型的元素（但最好不要这么做），列表有以下特点：列表内的顺序有先后顺序列表的值可变1.创建列表列表有两种创建方式，一是直接用方括号把表达式括起来，而是用构造函数list()表达式list1=[]#创建了一个空列表list2=["a","b","c"]#创建了一个字符串列表li
UE学习日志#14 GAS--ASC源码简要分析10 GC相关学游戏开发的 UE学习日志学习游戏引擎 unreal engine 笔记
注：1.这个分类是按照源码里的注释分类的2.本篇是通读并给出一些注释形式的，并不涉及结构性的分析3.看之前要对UE的GAS系统的定义有初步了解4.因为都是接口函数，有些没细看的研究那一部分的时候会细看1一些接口函数，但是注释说不要直接调用要通过GameplayCueManager调用//Donotcallthesefunctionsdirectly,callthewrappersonGamepla
【个人学习日志-前端】浏览器窗口大小改变后，超出视窗部分的导航栏div标签背景色丢失问题雲海夢学习 css html vscode 前端
项目场景：复刻小米商城前端html。问题描述浏览器窗口宽度改变后，导航栏div标签超出视图的部分背景色丢失。问题如图：原因分析：导航栏的宽度是基于其子元素的宽度计算的，当窗口宽度较小时，子元素可能会换行或超出视窗，导致背景色无法覆盖整个导航栏。如果导航栏的布局没有正确处理响应式设计，当窗口宽度较小时，布局可能会塌陷，导致背景色丢失。min-width属性用于设置元素的最小宽度，确保元素在窗口宽度较
UE学习日志#23 C++笔记#9 编码风格学游戏开发的 C++UE学习日志学习笔记 c++
注：此文章为学习笔记，只记录个人不熟悉或备忘的内容1为代码编写文档1.1使用注释的原因1.说明用途的注释应该注释的信息：输入，输出含义，参数的类型含义，错误条件和处理，预期用途，性能保证。一些明显能看出的信息不必加到注释。2.用来说明复杂代码的注释一些算法的用途，具体一行的作用等等。例如，一些复杂代码的循环不变量，比如插入排序中要一直保证当前遍历索引i之前的数组元素是有序的。3.传递元信息的注释例
UE学习日志#9 GAS--ASC源码简要分析7 GameplayEffects: Primary outward facing API for other systems P3 学游戏开发的 UE学习日志学习游戏引擎
注：1.这个分类是按照源码里的注释分类的2.本篇是通读并给出一些注释形式的，并不涉及结构性的分析3.看之前要对UE的GAS系统的定义有初步了解4.因为都是接口函数，有些没细看的研究那一部分的时候会细看15GetGameplayEffectMagnitude注释的大致翻译：原始访问器，用于查询游戏效果的强度，但结果并不总是准确的。外部代码（如UI等）如何询问类似“这个游戏效果会将我的伤害修改多少”这
inux学习日志前传_基础命令 stevenux Linux入门-自学 Linux
Linux学习日志_基础命令Linux哲学：测试shell脚本是否有语法错误bash单步执行脚本hwclock（一般使用：hwclock-r读取硬件时间）文件系统：rm:删除cp:copy（默认只复制文件）mv:moveinstall:（复制后有执行权限）cut:文本排序：sort（不影响源文件，只影响显示）文本统计：wc(wordcount)字符处理：tr转换或删除字符bash及其特性:练习：用
UE学习日志#21 C++笔记#7 基础复习7 string和string_view1 学游戏开发的 UE学习日志 C++学习 c++笔记 unreal engine 游戏引擎
注：本文内容来自《C++20高级编程》，作为笔记1动态字符串1.1C风格的字符串1.C语言中，字符串的最后一个字符是null字符（\0），官方将这个null字符定义为NUL，只有一个L。2.中，strlen()返回的是字符串的长度，而不是实际内存的长度，实际内存在字符串长度的基础上加1，因为结尾的'\0'。3.若char[]的字符串，sizeof()返回实际内存大小，而char*存储的字符串siz
UE学习日志#19 C++笔记#5 基础复习5 引用1 学游戏开发的 C++UE学习日志学习 c++笔记 unreal engine 游戏引擎
C++中的引用（reference）是另一个变量的别名。对引用的所有修改都会更改其引用的变量的值。可以将引用视为隐式指针，它省去了获取变量地址和解引用指针的麻烦。另外，可以将引用视为原始变量的另一个名称。可以创建独立的引用变量，在类中使用引用数据成员，接受引用作为函数和方法的参数，并从函数和方法返回引用。1引用变量1.1引用变量必须总是在创建时被初始化引用变量必须在创建时被初始化，例如：intx{
UE学习日志#18 C++笔记#4 基础复习4 指派初始化器和指针学游戏开发的 UE学习日志 C++学习 c++笔记
1指派初始化器C++20引入了指派初始化器，以使用他们的名称初始化所谓聚合的数据成员。聚合类型是满足以下限制的数组类型的对象或结构或类的对象：1.仅public数据成员，2.无用户声明或继承的构造函数，3.无虚函数和无虚基类、private或protected的基类指派初始化的顺序必须与声明顺序相同，不允许混合使用指派初始化器和非指派初始化器。未使用指派初始化器初始化的任何数据成员都将使用其默认值
学习日志009--面向对象的编程 Z211613347 python
一、面向对象面向对象编程（Object-OrientedProgramming，简称OOP）是一种编程范式，它使用“对象”来设计应用程序和计算机程序。它利用了抽象、封装、继承和多态这些概念。一、面向对象编程的核心概念封装（Encapsulation）封装是面向对象编程的一个主要特征，它将对象的数据（属性）和操作这些数据的方法（行为）结合在一起，形成一个独立的对象。这样做的好处是可以隐藏内部的复杂性
学习日志011--模块，迭代器与生成器，正则表达式 Z211613347 python
一、python模块在之前学习c语言时，我们学了分文件编辑，那么在python中是否存在类似的编写方式？答案是肯定的。python中同样可以实现分文件编辑。甚至还有更多的好处：‌提高代码的可维护性‌：当代码被分成多个文件时，每个文件可以专注于实现特定的功能或模块。这使得查找和修复错误变得更加容易。可以更方便地对代码进行局部修改，而不需要浏览整个项目的代码。‌增强代码的可读性‌：分文件编程允许开发者
2022-02-09大数据学习日志——PySpark——Spark快速入门&Standalone集群王络不稳定 spark big data 大数据
第一部分Spark快速入门01_Spark快速入门【Anaconda软件安装】[掌握]使用Python编写Spark代码，首先需要安装Python语言包，此时安装Anaconda科学数据分析包。Anaconda指的是一个开源的Python发行版本，其包含了conda、Python等180多个科学包及其依赖项。Anaconda是跨平台的，有Windows、MacOS、Linux版本。#下载地址：ht
SQL记录学习日志柠檬无糖可乐 sql 学习数据库
删除表DROPTABLE：彻底删除表和其数据，无法恢复。DROPTABLEIFEXISTS：在删除之前检查表是否存在。TRUNCATETABLE：删除所有数据，但保留表的结构。DELETE：删除表中的所有数据，但保留表的结构和约束。
UE学习日志#8 GAS--ASC源码简要分析5 GameplayEffects: Primary outward facing API for other systems P2 学游戏开发的 UE学习日志学习游戏引擎
注：1.这个分类是按照源码里的注释分类的2.本篇是通读并给出一些注释形式的，并不涉及结构性的分析3.看之前要对UE的GAS系统的定义有初步了解4.因为都是接口函数，有些没细看的研究那一部分的时候会细看8OnPredictiveGameplayCueCatchupCall预测性添加的GC，移除标签并尝试InvokeGC事件ByTag/**Calledforpredictivelyaddedgamep
大一软件工程学习日志3 自由-之翼学习
哈哈ヾﾉ≧∀≦)o，考完离散了，挺简单的，而且是老师手改，知道成分了吧今天熬了一个通宵，五点睡得，十一点起的。实话实说离散数学期末花个一两天就行了。主要是做题，而且是一种只要一道例题就可以记得方法的科目。加油✊，持续更新
UE学习日志#2 GAS--GA中的Tag2 学游戏开发的 UE学习日志学习
3用标签阻止能力BlockAbilitiesWithTag这个翻译还是比较准确的（我觉得），跟前面的取消同理，而且本类的调用都在写在了同一个函数里，就是前边的那个ApplyAbilityBlockAndCancelTags，还有一个尖锐的问题：我自己阻塞自己会怎么样，哎这个问题还得看调用的流程，留个坑之后研究运行流程会补。定义：/**Abilitieswiththesetagsareblocked
2020-07-20【阅读营·习惯力】1-1 开营 s萤火虫之光
【✨大师姐自荐✨】当崔律讲到“看到如此复杂的规则玩法时，你是如何想的？”时候，你有被戳中吗？看看我在这个过程中的心路历程，你是否也有同款呢？欢迎留言碰撞呦【精时力学习日志】本训练营：阅读营·习惯力今日主题：1-1开营学习日期：2020年7月20日1、[我学]今天在课程中的收获：本营的三本书籍：《如何想到又做到》、《坚持，一种可以养成的习惯》《习惯的力量》1.1习惯是什么？《习惯的力量》告诉我们，所
机械学习—零基础学习日志（概率论总笔记5）学长小陈来帮你学习笔记概率论算法深度学习机器学习
引言——“黑天鹅”要获得95%以上置信度的统计结果，需要被统计的对象出现上千次，但是如果整个样本只有几千字，被统计的对象能出现几次就不错了。这样得到的数据可能和真实的概率相差很远。怎么避免“黑天鹅”？古德-图灵折扣估计法在词语统计中，有点词语虽然是出现0次，但是实际的出现概率并不是永远不可能的零。那需要把一些概率转移给到这些词语。古德的做法实际上就是把出现1次的单词的总量，给了出现0次的，出现2次
2020-02-24【高效在家办公】2.1在家办公着装 s萤火虫之光
【精时力学习日志】•本期专栏：高效在家办公/学习的21节课•本节主题：2.1在家办公着装•学习日期：2020年2月24日1.[知识]我在课程中的收获：1.1温故（1）小伙伴提到，有崔律在前面领路，感觉心里很踏实，确实有同感，或许这就是榜样的力量。我的思考：崔律做精时力伙伴的领路人，那我可以做谁的领路人呢？可以是家人的，比如孩子、老公，也可以是天津精时力小伙伴的，所以精时力学院天津站，要搞起来~（2
HCIA学习日志-eNSP学习小记不渡云山 eNSP HCIA 学习
eNSP配置一、配置视图配置视图大概可以分四类（不是）：用户视图、系统视图、接口视图、路由视图用户视图：:#用户视图系统视图：:system-view/sys#用户视图进系统视图[Huawei]:#系统视图接口视图：:system-view/sys#用户视图进系统视图[Huawei]:interface/intEthernet0/0/1#系统视图进接口视图[Huawei-Ethernet0/0/1
天妈内驱力训练营二阶段俏丫头悄悄
亲子日志4.10日田青昨天晚上，妹妹8点就睡了，9点我们都躺在床上，我在写学习日志，没有到读书的点，儿子翻来覆去的，想要把妹妹弄醒陪他疯一会，我阻止他，建议睡不着做点什么吧！读书？不想。玩具，看了看也不想玩儿，最后我拿了周末要做的练习册（自己买的）建议把很有把握的题划掉，只做还不是很熟练的，这个立马来了兴趣（这是一个育儿课的方法），12个题的一套期中测试题，划了前十个，我看了以后问了两题，确实都会
Day80：2019-07-11【100天崔律阅读营·Day80-12.4日志迷猴桃sally
【100天崔律阅读营·Day80-12.4日志】这是2019年7月11日“100天崔律阅读营”之“整理术对比阅读：《怦然心动》+《断舍离》”2.4整理家人的物品的学习日志。1.我今日的收获：《断舍离》『不要轻易扔掉他人物品』不同的人对于同一件事物的看法会不同，因此，有些东西我们看做无用的、垃圾，有些人则可能会认为是无价之宝，所以，不要轻易扔掉别人的物品，我们要尽量克制这点。『不要归责他人』当出现问
2020-05-16 一节木頭
【精时力学习日志·预习版】本训练营：阅读营·清单力学习日期：2020年5月16日预习主题：3.1礼物清单1.[预习]我的阅读理解：送礼要送到人的心坎里去，让人不论是因为什么场合收礼，都能收得很开心很满意，送对礼物是一种特别的体验，除了收女人会非常开心，那送礼的人也可以表达关心。送礼也是可以有清单可循的：①送礼物要尽早开始挑选做到未雨绸缪，提前预留出两个月左右的时间进行选购礼物。预留时间来挑选礼物，
8-3[白天]摒弃随时在线孔雀勇士
【精时力学习日志】本训练营：100天精时力训练营（2020年版）今日主题：8-3[白天]摒弃随时在线学习日期：2020年11月11日1、[进步]今天在课程中的我学+我思+我行：——暖场——①【我学】莹瑜说培养孩子一次只做一件事，grace分享在通勤录上用来思考，可能会带来更大的收获，优美感悟到通过一次只做一件事，浮躁的心终于渐渐平静了。【我思】今天在家一直践行一次，只做一件事情，听课认真听课，写日
三篇学习日志（立志、勤学、自省）涛声依旧纽约客
（一）今日再读《示弟立志说》，颇有感慨。夫学，莫先于立志。夫志，气之帅也，人之命也，水之源也。君子之学，无时无处而不以立志为事。志不立则气昏。读每一句，都戳着心，我思忖着即使过了知天命之年，仍需要志向的鞭策。那么个人的志向是什么？绝非浪得虚名或一己私利，那需要实实在在的明理明道，有圣人圣贤的志向。“人心惟危，道心惟微，惟精惟一，允执厥中”。圣贤千言万语，阳明先生进一步强调“明天理、灭人欲。”我个人
【精时力学习日志-日清单】海南冰青
【精时力学习日志】本训练营：日清单今日主题：1-3重复任务学习日期：2020年4月1日1.[知识]我在课程中的收获：【学习方式】含有两大部分温故-新知每天重复这两大部分内容，今天温故昨天的新知，结合自己昨天对新知部分内容的实践，自己对刚学的知识点有了进一步的思考，同时结合今天温故部分看优秀小伙伴的日志，再重温昨天的内容，可以复盘自己哪部分做的好，哪一部分做的不好，有哪一些可以改进的地方，小伙伴的做
学习日志6 Simon#0209 学习
关于量子强化学习：论文Variational_Quantum_Circuits_for_Deep_Reinforcement_Learning：变分量子电路在深度强化学习中的应用论文主要内容：将经典深度强化学习算法（如经验重放和目标网络）重塑为变分量子电路的表示摘要当前最先进的机器学习方法基于经典冯·诺伊曼计算架构，并在许多工业和学术领域得到广泛应用。随着量子计算的发展，研究人员和技术巨头们试图为
STM32学习日志 2020/10/29 曾经有个曾学习历程 stm32
STM32学习日志2020/10/29写在前面part1part2学习目标：学习内容：学习时间：学习产出：技术文档：第一课学习其他学习思路今日复盘写在前面博主今年大二，电赛降至，自己的电子设计领域知识极其匮乏，又甚是想去参加电赛，同时记录下自己学习经历，方便自我回顾和帮后来者踩坑。part1第一次正经写博客，想到哪写到哪，希望各位不要见怪。写作动机：除了记录学习经历之外，另外一个就是自我督促。我一
学习日志31 Simon#0209 学习量子计算
本源量子计算平台体验frompyqpandaimport*importnumpyasnp#通过QCloud()创建量子云虚拟机QCM=QCloud()#通过传入当前用户的token来初始化QCM.init_qvm("304102010030130607299538cd7ed/33683")qlist=QCM.qAlloc_many(6)clist=QCM.cAlloc_many(6)measure
Java开发中，spring mvc 的线程怎么调用？小麦麦子 spring mvc
今天逛知乎，看到最近很多人都在问spring mvc 的线程http://www.maiziedu.com/course/java/ 的启动问题，觉得挺有意思的，那哥们儿问的也听仔细，下面的回答也很详尽，分享出来，希望遇对遇到类似问题的Java开发程序猿有所帮助。问题：在用spring mvc架构的网站上，设一线程在虚拟机启动时运行，线程里有一全局
maven依赖范围 bitcarter maven
1.test 测试的时候才会依赖，编译和打包不依赖，如junit不被打包 2.compile 只有编译和打包时才会依赖 3.provided 编译和测试的时候依赖，打包不依赖，如：tomcat的一些公用jar包 4.runtime 运行时依赖，编译不依赖 5.默认compile 依赖范围compile是支持传递的，test不支持传递 1.传递的意思是项目A，引用
Jaxb org.xml.sax.saxparseexception : premature end of file darrenzhu xml premature JAXB
如果在使用JAXB把xml文件unmarshal成vo(XSD自动生成的vo)时碰到如下错误： org.xml.sax.saxparseexception : premature end of file 很有可能时你直接读取文件为inputstream，然后将inputstream作为构建unmarshal需要的source参数。InputSource inputSource = new In
CSS Specificity 周凡杨 html 权重 Specificity css
有时候对于页面元素设置了样式，可为什么页面的显示没有匹配上呢？ because specificity CSS 的选择符是有权重的，当不同的选择符的样式设置有冲突时，浏览器会采用权重高的选择符设置的样式。规则： HTML标签的权重是1 Class 的权重是10 Id 的权重是100
java与servlet g21121 servlet
servlet 搞java web开发的人一定不会陌生，而且大家还会时常用到它。下面是java官方网站上对servlet的介绍： java官网对于servlet的解释写道 Java Servlet Technology Overview Servlets are the Java platform technology of choice for extending and enha
eclipse中安装maven插件 510888780 eclipse maven
1.首先去官网下载 Maven： http://www.apache.org/dyn/closer.cgi/maven/binaries/apache-maven-3.2.3-bin.tar.gz 下载完成之后将其解压，我将解压后的文件夹：apache-maven-3.2.3，并将它放在 D:\tools目录下，即 maven 最终的路径是：D:\tools\apache-mave
jpa@OneToOne关联关系布衣凌宇 jpa
Nruser里的pruserid关联到Pruser的主键id，实现对一个表的增删改，另一个表的数据随之增删改。 Nruser实体类 //***************************************************************** @Entity @Table(name="nruser") @DynamicInsert @Dynam
我的spring学习笔记11-Spring中关于声明式事务的配置 aijuans spring 事务配置
这两天学到事务管理这一块，结合到之前的terasoluna框架，觉得书本上讲的还是简单阿。我就把我从书本上学到的再结合实际的项目以及网上看到的一些内容，对声明式事务管理做个整理吧。我看得Spring in Action第二版中只提到了用TransactionProxyFactoryBean和<tx:advice/>,定义注释驱动这三种，我承认后两种的内容很好，很强大。但是实际的项目当中
java 动态代理简单实现 antlove java handler proxy dynamic service
dynamicproxy.service.HelloService package dynamicproxy.service; public interface HelloService { public void sayHello(); } dynamicproxy.service.impl.HelloServiceImpl package dynamicp
JDBC连接数据库百合不是茶 JDBC编程 JAVA操作oracle数据库
如果我们要想连接oracle公司的数据库，就要首先下载oralce公司的驱动程序，将这个驱动程序的jar包导入到我们工程中; JDBC链接数据库的代码和固定写法; 1,加载oracle数据库的驱动; &nb
单例模式中的多线程分析 bijian1013 java thread 多线程 java多线程
谈到单例模式，我们立马会想到饿汉式和懒汉式加载，所谓饿汉式就是在创建类时就创建好了实例，懒汉式在获取实例时才去创建实例，即延迟加载。饿汉式： package com.bijian.study; public class Singleton { private Singleton() { } // 注意这是private 只供内部调用 private static
javascript读取和修改原型特别需要注意原型的读写不具有对等性 bijian1013 JavaScript prototype
对于从原型对象继承而来的成员，其读和写具有内在的不对等性。比如有一个对象A，假设它的原型对象是B，B的原型对象是null。如果我们需要读取A对象的name属性值，那么JS会优先在A中查找，如果找到了name属性那么就返回；如果A中没有name属性，那么就到原型B中查找name，如果找到了就返回；如果原型B中也没有
【持久化框架MyBatis3六】MyBatis3集成第三方DataSource bit1129 dataSource
MyBatis内置了数据源的支持，如： <environments default="development"> <environment id="development"> <transactionManager type="JDBC" /> <data
我程序中用到的urldecode和base64decode,MD5 bitcarter c MD5 base64decode urldecode
这里是base64decode和urldecode，Md5在附件中。因为我是在后台所以需要解码： string Base64Decode(const char* Data,int DataByte,int& OutByte) { //解码表 const char DecodeTable[] = { 0, 0, 0, 0, 0, 0
腾讯资深运维专家周小军：QQ与微信架构的惊天秘密 ronin47
社交领域一直是互联网创业的大热门，从PC到移动端，从OICQ、MSN到QQ。到了移动互联网时代，社交领域应用开始彻底爆发，直奔黄金期。腾讯在过去几年里，社交平台更是火到爆，QQ和微信坐拥几亿的粉丝，QQ空间和朋友圈各种刷屏，写心得，晒照片，秀视频，那么谁来为企鹅保驾护航呢？支撑QQ和微信海量数据背后的架构又有哪些惊天内幕呢？本期大讲堂的内容来自今年2月份ChinaUnix对腾讯社交网络运营服务中心
java-69-旋转数组的最小元素。把一个数组最开始的若干个元素搬到数组的末尾，我们称之为数组的旋转。输入一个排好序的数组的一个旋转，输出旋转数组的最小元素 bylijinnan java
public class MinOfShiftedArray { /** * Q69 旋转数组的最小元素 * 把一个数组最开始的若干个元素搬到数组的末尾，我们称之为数组的旋转。输入一个排好序的数组的一个旋转，输出旋转数组的最小元素。 * 例如数组{3, 4, 5, 1, 2}为{1, 2, 3, 4, 5}的一个旋转，该数组的最小值为1。 */ publ
看博客，应该是有方向的 Cb123456 反省看博客
看博客，应该是有方向的: 我现在就复习以前的，在补补以前不会的，现在还不会的，同时完善完善项目，也看看别人的博客. 我刚突然想到的: 1.应该看计算机组成原理，数据结构，一些算法，还有关于android,java的。 2.对于我，也快大四了，看一些职业规划的，以及一些学习的经验，看看别人的工作总结的. 为什么要写
[开源与商业]做开源项目的人生活上一定要朴素,尽量减少对官方和商业体系的依赖 comsci 开源项目
为什么这样说呢？因为科学和技术的发展有时候需要一个平缓和长期的积累过程，但是行政和商业体系本身充满各种不稳定性和不确定性，如果你希望长期从事某个科研项目，但是却又必须依赖于某种行政和商业体系，那其中的过程必定充满各种风险。。。所以，为避免这种不确定性风险，我
一个 sql优化（[精华] 一个查询优化的分析调整全过程！很值得一看） cwqcwqmax9 sql
见 http://www.itpub.net/forum.php?mod=viewthread&tid=239011 Web翻页优化实例提交时间: 2004-6-18 15:37:49 回复发消息环境： Linux ve
Hibernat and Ibatis dashuaifu Hibernate ibatis
Hibernate VS iBATIS 简介 Hibernate 是当前最流行的O/R mapping框架，当前版本是3.05。它出身于sf.net，现在已经成为Jboss的一部分了 iBATIS 是另外一种优秀的O/R mapping框架，当前版本是2.0。目前属于apache的一个子项目了。相对Hibernate“O/R”而言，iBATIS 是一种“Sql Mappi
备份MYSQL脚本 dcj3sjt126com mysql
#!/bin/sh # this shell to backup mysql #[email protected] (QQ:1413161683 DuChengJiu) _dbDir=/var/lib/mysql/ _today=`date +%w` _bakDir=/usr/backup/$_today [ ! -d $_bakDir ] && mkdir -p
iOS第三方开源库的吐槽和备忘 dcj3sjt126com ios
转自 ibireme的博客做iOS开发总会接触到一些第三方库，这里整理一下，做一些吐槽。目前比较活跃的社区仍旧是Github，除此以外也有一些不错的库散落在Google Code、SourceForge等地方。由于Github社区太过主流，这里主要介绍一下Github里面流行的iOS库。首先整理了一份 Github上排名靠
html wlwmanifest.xml eoems html xml
所谓优化wp_head()就是把从wp_head中移除不需要元素，同时也可以加快速度。步骤：加入到function.php remove_action('wp_head', 'wp_generator'); //wp-generator移除wordpress的版本号，本身blog的版本号没什么意义，但是如果让恶意玩家看到，可能会用官网公布的漏洞攻击blog remov
浅谈Java定时器发展 hacksin java 并发 timer 定时器
java在jdk1.3中推出了定时器类Timer,而后在jdk1.5后由Dou Lea从新开发出了支持多线程的ScheduleThreadPoolExecutor，从后者的表现来看，可以考虑完全替代Timer了。 Timer与ScheduleThreadPoolExecutor对比： 1. Timer始于jdk1.3,其原理是利用一个TimerTask数组当作队列
移动端页面侧边导航滑入效果 ini jquery Web html5 css javascirpt
效果体验：http://hovertree.com/texiao/mobile/2.htm可以使用移动设备浏览器查看效果。效果使用到jquery-2.1.4.min.js，该版本的jQuery库是用于支持HTML5的浏览器上，不再兼容IE8以前的浏览器，现在移动端浏览器一般都支持HTML5，所以使用该jQuery没问题。HTML文件代码： <!DOCTYPE html> <h
AspectJ+Javasist记录日志 kane_xie aspectj javasist
在项目中碰到这样一个需求，对一个服务类的每一个方法，在方法开始和结束的时候分别记录一条日志，内容包括方法名，参数名+参数值以及方法执行的时间。 @Override public String get(String key) { // long start = System.currentTimeMillis(); // System.out.println("Be
redis学习笔记 MJC410621 redis NoSQL
1)nosql数据库主要由以下特点：非关系型的、分布式的、开源的、水平可扩展的。 1，处理超大量的数据 2，运行在便宜的PC服务器集群上， 3，击碎了性能瓶颈。 1)对数据高并发读写。 2)对海量数据的高效率存储和访问。 3)对数据的高扩展性和高可用性。 redis支持的类型： Sring 类型 set name lijie get name lijie set na
使用redis实现分布式锁 qifeifei
在多节点的系统中，如何实现分布式锁机制，其中用redis来实现是很好的方法之一，我们先来看一下jedis包中，有个类名BinaryJedis,它有个方法如下： public Long setnx(final byte[] key, final byte[] value) { checkIsInMulti(); client.setnx(key, value); ret
BI并非万能，中层业务管理报表要另辟蹊径张老师的菜大数据 BI 商业智能信息化
BI是商业智能的缩写，是可以帮助企业做出明智的业务经营决策的工具，其数据来源于各个业务系统，如ERP、CRM、SCM、进销存、HER、OA等。 BI系统不同于传统的管理信息系统，他号称是一个整体应用的解决方案，是融入管理思想的强大系统：有着系统整体的设计思想，支持对所有
安装rvm后出现rvm not a function 或者ruby -v后提示没安装ruby的问题 wudixiaotie function
1.在~/.bashrc最后加入 [[ -s "$HOME/.rvm/scripts/rvm" ]] && source "$HOME/.rvm/scripts/rvm" 2.重新启动terminal输入： rvm use ruby-2.2.1 --default 把当前安装的ruby版本设为默