LZDCQU

网络爬虫：基于有道的文本翻译

参考书籍：《零基础入门学习Python》小甲鱼编著

1.下载网络上图片

现要在百度上下载一张图片，直接给出Python代码：

import urllib.request
#图片的网络地址
url = "https://timgsa.baidu.com/timg?image&quality=80&size=b9999_10000&sec=1504341479&\
di=dd995208aedd77555292d2752ffcd5d8&imgtype=jpg&er=1&src=http%3A%2F%2Fimg.taopic.com%2Fuploads%2Fallimg%2F140606%2F318757-1406060S35991.jpg"
response = urllib.request.urlopen(url)
img = response.read()
with open('img.jpg','wb') as f:
    f.write(img)

代码运行后，代码所在的文件夹中出现了img.jpg这张图片:

图 1

代码分析：

1）、python访问互联网可通过urllib模块实现，具体的，可通过urllib.request.urlopen()函数访问网页；

urlopen函数原型为：urllib.request.urlopen(url, data=None, [timeout, ]*, cafile=None, capath=None, cadefault=False, context=None)

2）、urllib.request.urlopen()函数的url参数即可以是一个字符串（如上面的代码），也可以是Request对象，如果传入一个字符串，那么python会默认先将目标字符串转换成Requset对象，然后再传给urlopen函数。

因此，这一行代码：

response = urllib.request.urlopen(url)

可以改为：

req = urllib.request.Request(url)
response = urllib.request.urlopen(req)

urlopen的函数原型为：urllib.request.Request(url, data=None, headers={}, origin_req_host=None, unverifiable=False, method=None)，是一个抽象的URL请求。

3）、response实际返回时一个类文件对象，因此可以用read()方法来读取内容。

2.基于有道的文本翻译

2.1 翻译文本

2.2.1 前期准备

首先进入有道翻译官网（http://www.youdao.com），在浏览器右击，选择“审查元素”（或“审查”，各浏览器不一样）命令，切换到NetWork窗口，如下图所示：

图 2

图 3

图 4

2.1.2 代码编写

import urllib.request #导入模块
import urllib.parse
import json
url = "http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule&sessionFrom="
def main():
    while True:
        content = input("请输出需要翻译的内容(退出输入q)：")
        if content == 'q':
            break
    
        data = {};
        data['i'] = content
        data['from'] = 'AUTO'
        data['to'] = 'AUTO'
        data['smartresult'] = 'dict'
        data['client'] = 'fanyideskweb'
        data['salt'] = '1503581407033'
        data['sign'] = '67472a1b3638989677f7aca9af3be0aa'
        data['doctype'] = 'json'
        data['version'] = '2.1'
        data['keyfrom'] = 'fanyi.web'
        data['action'] = 'FY_BY_CLICKBUTTION'
        data['typoResult'] = 'true'
        data = urllib.parse.urlencode(data).encode('utf-8')
        
        response = urllib.request.urlopen(url,data)
        html = response.read().decode('utf-8')
        tar = json.loads(html)
        print("翻译结果是：%s"%tar['translateResult'][0][0]['tgt'])

if __name__=="__main__":
    main()

运行结果如下：

图 5

2.1.3 代码分析

1）在客户端和服务器之间进行请求-响应时，最常被用到的方法是GET和POST。通常，GET是从指定的服务器请求数据，而POST是向指定的服务器提交要被处理的数据。上述点击“自动翻译”按钮后，使用了POST方法提交数据；

2）urlopen( )函数有一个data参数。如果给这个参数赋值，那么HTTP的请求是使用POST方式；如果data的值是NULL（也即默认值），那么HTTP的请求的是GET方式。这里需要指出的是，这个data参数的值必须符合application/x-www-form-urlencoded的格式，而我们可以使用urllib.parse.urlencode()函数将字符串转换为这个格式；

data = urllib.parse.urlencode(data).encode('utf-8')

3）data为一个字典，其中的数据来自于图3中的From Data中数据；

4）Python爬取的对象是以utf-8编码的bytes对象，要还原为带中文的html代码，需要对其进行解码，将它变成Unicode编码。代码27行得到的html是字符串形式：

>>> print(html)

{"type":"EN2ZH_CN","errorCode":0,"elapsedTime":8,"translateResult":[[{"src":"life is short, you need Python!","tgt":"生命是短暂的,你需要Python !"}]]}

#判断html类型
>>> type(html)

字符串在python内部的表示是Unicode编码，因此，在进行编码转换时，通常需要以Unicode作为中间编码，即先将返回的bytes对象的数据解码（decode）成Unicode。

得到的字符串是一个JSON格式的字符串（JOSN是一种轻量级的数据交换格式），因此需要对这个JOSN格式的字符串进行解析：

>>> import json
>>> tar = json.loads(html)
>>> print(tar)

{'type': 'EN2ZH_CN', 'errorCode': 0, 'elapsedTime': 8, 'translateResult': [[{'src': 'life is short, you need Python!', 'tgt': '生命是短暂的,你需要Python !'}]]}

查看tar的类型：

>>> type(tar)

可以看出，html经过处理后已变成了一个字典格式，因此现在只需要按照字典格式操作方式取出所需数据即可：

>>> tar['translateResult'][0][0]['tgt']

'生命是短暂的,你需要Python !'

5）URL格式一定要正确，我在浏览器得到的URL为：

http://fanyi.youdao.com/translate_o?smartresult=dict&smartresult=rule&sessionFrom=

但将该URL复制到浏览器，显示{"errorCode":50}错误。

图 6

经过尝试发现，将"translate_o"中“_o”去掉即可，即修改后的URL为:

url = "http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule&sessionFrom="

2.2 隐藏

图 3中，Request headers是客户端发送请求的Header，这个常常被服务器端用来判断是否来自于“非人类”的访问。“非人类”的访问会给服务器其造成一定的压力，因此服务器会对“非人类”访问进行一定的限制。

一般是通过User-Agent来识别，普通浏览器会通过该内容向访问网站提供你所使用的浏览器类型、操作系统、浏览器内核等信息标识：

User-Agent:

Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/59.0.3071.115 Safari/537.36

而使用Python访问的话，User-Agent会被定义为Python-urllib/3.6（3.6为所使用的Python版本号）。因此2.1.2中的代码在实际运用过程存在一个问题，即服务器通过识别User-Agent来源于“非人类”，它就很容易把你屏蔽。

如何对代码进行“隐藏”操作，让其看起来更象普通人通过普通浏览器的正常点击？自然想到的方法是修改 User-Agent。

2.2.1 修改 User-Agent

通过 urllib.request.Request函数对User-Agent进行设置。Request函数有个headers参数，通过设置这个参数，你可以伪造浏览器访问。设置这个headers参数的路径有两个：

1）实例化Request对象的时候将headers参数传入；

2）通过add_headers()方法往Request对象添加headers。

import urllib.request
import urllib.parse
import json
url = "http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule&sessionFrom="
def main():
    while True:
        content = input("请输出需要翻译的内容(退出输入q)：")
        if content == 'q':
            break
    
        data = {};
        data['i'] = content
        data['from'] = 'AUTO'
        data['to'] = 'AUTO'
        data['smartresult'] = 'dict'
        data['client'] = 'fanyideskweb'
        data['salt'] = '1503581407033'
        data['sign'] = '67472a1b3638989677f7aca9af3be0aa'
        data['doctype'] = 'json'
        data['version'] = '2.1'
        data['keyfrom'] = 'fanyi.web'
        data['action'] = 'FY_BY_CLICKBUTTION'
        data['typoResult'] = 'true'
        data = urllib.parse.urlencode(data).encode('utf-8')

        ##第一种方法
        #headers = {};
        #headers['Referer']  = 'http://fanyi.youdao.com'
        #headers["User-Agent"] = "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/59.0.3071.115 Safari/537.36  "
        #req = urllib.request.Request(url,data,headers)#创建Request对象时将headers参数传入

        ##第二种方法，Requset对象生成之后通过add_header()方法添加
        req = urllib.request.Request(url,data)
        req.add_header('User-Agent','Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/59.0.3071.115 Safari/537.36')
    
        response = urllib.request.urlopen(req)
    
        html = response.read().decode('utf-8')
        tar = json.loads(html)
        print("翻译结果是：%s"%tar['translateResult'][0][0]['tgt'])
if __name__=="__main__":
    main()

通过修改User-Agent实现隐藏是最简单的方法。但用于抓取网页的爬虫如果是只使用这种方式，那么一个IP地址在短时间内连续进行网页访问，会不符合普通人类的行为标准，同时也会对服务器造成压力。因此，服务器只需记录每个IP地址的访问频率，在单位时间内，如果访问频率超过一个阈值，便认为该IP地址很有可能是爬虫，于是可以跳出一个验证码页面，要求用户填写验证码，通过这种方式可简单的规避掉爬虫访问。

怎么避免因单位时间内访问频率过高被服务器规避掉呢？同样有两种方法：1）使用定时器；2）使用IP地址代理，即使用不同的IP地址进行访问。

2.2.2 延时提交数据

延时提交的时间，这个比较简单，使用time模块即可。如下面代码，5s提交一次数据。但是通过延时的方式，会降低程序的工作效率。

import urllib.request
import urllib.parse
import json
import time  #导入time模块
url = "http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule&sessionFrom="
def main():
    while True:
        content = input("请输出需要翻译的内容(退出输入q)：")
        if content == 'q':
            break
    
        data = {};
        data['i'] = content
        data['from'] = 'AUTO'
        data['to'] = 'AUTO'
        data['smartresult'] = 'dict'
        data['client'] = 'fanyideskweb'
        data['salt'] = '1503581407033'
        data['sign'] = '67472a1b3638989677f7aca9af3be0aa'
        data['doctype'] = 'json'
        data['version'] = '2.1'
        data['keyfrom'] = 'fanyi.web'
        data['action'] = 'FY_BY_CLICKBUTTION'
        data['typoResult'] = 'true'
        data = urllib.parse.urlencode(data).encode('utf-8')

        ##第二种方法，Requset对象生成之后通过add_header()方法添加
        req = urllib.request.Request(url,data)
        req.add_header('User-Agent','Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/59.0.3071.115 Safari/537.36')
    
        response = urllib.request.urlopen(req)
    
        html = response.read().decode('utf-8')
        tar = json.loads(html)
        print("翻译结果是：%s"%tar['translateResult'][0][0]['tgt'])
        time.sleep(5) #延时5s
    
if __name__=="__main__":
    main()

2.2.3 使用代理

可以查找免费代理IP:

图 7

使用的代理步骤如下：

1） proxy_support = urllib.request.ProxyHandler({ })

参数是一个字典，字典的键是处理的类型，例如http、ftp或https，字典的值就是代理的IP地址和对应的端口号。
2） opener = urllib.request.build_opener(proxy_support)

当使用urlopen()函数打开一个网页时，是使用默认的opener在工作。但这个opener是可以定制的，例如给它定制特殊的headers，或者给它定制指定的代理IP。

3）urllib.request.install_opener(opener)

将定制好的opener安装到系统中，是一劳永逸的方法。因为在此之后，只需要调用普通的urlopen()函数，就是以定制好的opener进行工作。
这里需要指出的是，安装后会替换掉默认的opener。如果你不想替换默认的opener，你可以在每次特殊需要的时候，用opener.open()的方法打开网页：

req = urllib.request.Request(url,data)
response = opener.open(req)

使用代理的访问网页代码如下：

import urllib.request
import urllib.parse
import json
import time  #导入time模块
url = "http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule&sessionFrom="
def main():
    while True:
        content = input("请输出需要翻译的内容(退出输入q)：")
        if content == 'q':
            break
    
        data = {};
        data['i'] = content
        data['from'] = 'AUTO'
        data['to'] = 'AUTO'
        data['smartresult'] = 'dict'
        data['client'] = 'fanyideskweb'
        data['salt'] = '1503581407033'
        data['sign'] = '67472a1b3638989677f7aca9af3be0aa'
        data['doctype'] = 'json'
        data['version'] = '2.1'
        data['keyfrom'] = 'fanyi.web'
        data['action'] = 'FY_BY_CLICKBUTTION'
        data['typoResult'] = 'true'
        data = urllib.parse.urlencode(data).encode('utf-8')

        proxy_support = urllib.request.ProxyHandler({"https": "222.161.16.10:9999"})
        opener = urllib.request.build_opener(proxy_support)
        opener.addheaders = [('User-Agent','Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/59.0.3071.115 Safari/537.36')]
        urllib.request.install_opener(opener)
        
        req = urllib.request.Request(url,data)
        #req.add_header('User-Agent','Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/59.0.3071.115 Safari/537.36')
        response = urllib.request.urlopen(req)
    
        html = response.read().decode('utf-8')
        tar = json.loads(html)
        print("翻译结果是：%s"%tar['translateResult'][0][0]['tgt'])
    
if __name__=="__main__":
    main()

Python学习day14 BBS功能和聊天室 weixin_30725467 json 数据库前端 ViewUI
Createdon2017年5月15日@author:louts第1课作业讲解及装饰器使用28minutesdefcheck(func):defrec(request,*args,**kargs):returnfunc(request,*args,**kargs)returnrec@checkdefindex(request,):printrequest第2课自定义装饰器扩展使用18minutes
Python学习笔记 | 类与对象 MUYUN友逹 Python学习笔记类与对象
基于Python3版本的学习。初识概念：类(class)与对象(object)生活中我们所说的类，是物以类聚的类，是分门别类的类，是多个类似事物组成的群体的统称。而在Python中我们所遇到的类（class），比如整数、字符串、浮点数等，不同的数据类型就属于不同的类。准确来说，它们的全名是整数类、字符串类、浮点数类。每一个类之下都包含无数相似的不同个例。在Python的术语里，我们把类的个例就叫做
Python学习路线 Python_JC python
Python是一门易学易用的编程语言，广泛应用于数据处理、Web开发、人工智能、自动化运维、游戏开发等领域。本篇文章将介绍Python的学习路线以及一些值得参考的书籍。Python学习路线Python的学习路线主要包括以下几个方面：掌握Python基础知识：了解变量、数据类型、表达式、流程控制、函数、模块等基础概念。学习Python面向对象编程：学习类、对象、继承、多态等面向对象编程的概念和技术。
Python globals 函数 - Python零基础入门教程苹果酱0567 面试题汇总与解析课程设计 spring boot layui 毕业设计 java
目录一.Pythonglobals函数语法二.Pythonglobals函数使用三.猜你喜欢零基础Python学习路线推荐:Python学习目录>>Python基础入门在前面我们讲解了Python内置函数locals，内置函数locals直接以字典的形式返回当前位置的所有局部变量，今天需要介绍的是另外一个Python内置函数globals，该函数直接以字典dict的形式返回当前位置的所有全局变量；
python学习笔记浅夏入秋^_^ Python 编程语言 python 学习开发语言
python学习笔记第1-3章基础知识https://www.jetbrains.com/help/pycharm/小技巧：如果在编辑器中未选择任何内容，按⌘C可将文本光标处的整行复制到剪贴板。按两次⌃Space可调用代码补全功能的特殊变体，这样您可以从没有在当前文件中声明的命名空间补全XML标记名称。如果命名空间尚未声明，则会自动生成声明。使用代码|检查代码可对整个项目或自定义范围运行代码分析，
Python学习（十七）——re类与正则表达式阿卡蒂奥 Python python 正则表达式
re.match()匹配尝试在字符串的起始处应用该模式，返回一个匹配对象，如果没有找到匹配项，则返回一个对象。re.match().start()返回子串匹配组的开始索引printre.match('Hello','Hello,World!').start()输出：0re.match().end()返回子串匹配组的结束索引printre.match('Hello','Hello,World!').
[Python学习笔记1]——列表的简单操作秋风、萧瑟 python 学习笔记
目录1.列表的定义2.访问列表元素3.列表的改、增、删3.1列表元素的修改3.2列表元素的添加3.2.1使用方法append()在列表末尾添加元素3.2.2使用方法insert()在列表中插入元素3.3在列表中删除元素3.3.1使用del语句删除元素（根据索引删除）3.3.2使用pop()方法删除元素（根据索引删除，可将删除值再利用）3.3.3使用remove()方法删除元素（根据值删除元素）4.
Python学习笔记——面向对象 xueyueQQ Python Python 面向对象
本学习笔记基于Bilibili视频网站up主—黑马程序员的Python视频教程链接：https://www.bilibili.com/video/av14184325面向对象1类和对象1.类和对象的关系2.类的设计2面向对象基础语法1.dir内置函数2.定义简单的类3.方法中的self参数4.初始化方法在初始化方法内部定义属性初始化方法的改造——初始化的同时设置初始值5.内置方法和属性3面向对象封
数据分析案例-二手车用户数据可视化分析艾派森数据可视化数据分析信息可视化数据分析数据挖掘 python
‍♂️个人主页：@艾派森的个人主页✍作者简介：Python学习者希望大家多多支持，我们一起进步！如果文章对你有帮助的话，欢迎评论点赞收藏加关注+目录1.项目背景2.数据集介绍
python学习第七节：正则表达式一只会敲代码的小灰灰 python学习 python 学习正则表达式
python学习第七节：正则表达式正则表达式基本上在所有开发语言中都会使用到，在python中尤为重要。当我们使用python开发爬虫程序将目标网页扒下来之后我们要从网页中解析出我们想要的信息，这个时候就需要正则表达式去进行匹配。importrere的常量re模块中有9个常量，常量的值都是int类型！（知道就行）修饰符描述re.l使匹配对大小写不敏感re.L做本地化识别(locale-aware)
Python学习指南——1.常用库说明 r135792uuuu python-机器学习 python
说在前面在开发之前，要去python库官网上查看是否有帮助的库。结合百度和pypi.org网站直接寻找需要的库。库安装方法：1pip安装2.文件安装：UCI页面需要https://www.lfd.uci.edu/~gohlke/pythonlibs或者conda提供的那些网站也行。文件安装：下载UCI、whl文件之后，又要使用pipinstall文件来安装放到lib文件夹vscode特殊：通常把要
Python学习笔记-Day05 snape00
Python学习笔记Day_05-构造程序逻辑作者的话学完前面的几个章节后，我觉得有必要在这里带大家做一些练习来巩固之前所学的知识，虽然迄今为止我们学习的内容只是Python的冰山一角，但是这些内容已经足够我们来构建程序中的逻辑。对于编程语言的初学者来说，在学习了Python的核心语言元素（变量、类型、运算符、表达式、分支结构、循环结构等）之后，必须做的一件事情就是尝试用所学知识去解决现实中的问题
小猿圈python学习-内置函数小猿圈IT教育
Python的len为什么你可以直接用？肯定是解释器启动时就定义好了内置参数详解https://docs.python.org/3/library/functions.html?highlight=built#ascii每个函数的作用我都帮你标好了abs#求绝对值all#ReturnTrueifbool(x)isTrueforallvaluesxintheiterable.Iftheiterabl
python学习笔记第5节-类和函数梁鋐俐
我们在前面的学习中学会了一个叫type（）的函数，用它来判断变量的类型，变量和它当下存储的数据绑定在一起。例如a=[4,5,6,7]print(type(a)）输出a=range（10，20，2）print（type（a））输出a=Trueprint（type（a））输出a={‘a54’：56}print（type（a））输出a={‘a54’，56}print（type（a））输出a=‘tyuio
Python学习笔记--列表、字典、集合、元组小黄酥 Python python 学习笔记
Python学习笔记43-列表#列表主要是用来存储多个数据.列表是有序的集合list_1=[]#创建一个空的列表list_2=[12,34,56,True,'abc']#创建一个列表#列表的访问，通过下标访问列表中的元素，下标默认从0开始，0表示第一个元素，-1表示最后一个元素list_3=[1,2,3,False,True,'abc']print(list_3[0])#1print(list_3
「python学习——小白篇」python函数中不定长参数的写法小天真_5eeb
那么作为新手该如何上手这门语言？一切不敲代码的学编程手段都是扯淡先来给大家来一个福利吧！python语法入门视频免费共享出来加q-u-n--227+435+450获取
python学习——conda install Python库时报PackagesNotFoundError:的错误的解决方案，很实用 _Oak_Tree_ python基础 python
安装完成Anaconda之后，我们可以在AnacondaPrompt交互式窗口中通过“condainstall库名称”实现Python库的安装，但是有时候在运用该命令进行安装时会提示PackagesNotFoundError:Thefollowingpackagesarenotavailablefromcurrentchannels:的错误，现在以Pydap库的安装为例，提供在Windows系统下
Python学习：执行系统shell命令 chaos-god python python shell
1.问题python可以作为shell替代，代码比较直观，易于维护。python支持调用外部shell命令。不过，这个问题没有看上去简单，要完美的解决此问题，比较复杂，就连标准库也不见得处理得很好。2.方案2.1.方案一首先最简单的方法就是调用system方法，直接执行系统shell命令，代码如下：importosos.system('ls-l')system主要问题，就是无法获取shell命令的
25道Python练手题（附详细答案），赶紧收藏！Python入门|Python学习豆本-豆豆奶 python 学习数据挖掘开发语言爬虫人工智能
题目1：水仙花数水仙花数（Narcissisticnumber）也被称为超完全数字不变数（pluperfectdigitalinvariant,PPDI）、自恋数、自幂数、阿姆斯壮数或阿姆斯特朗数（Armstrongnumber）水仙花数是指一个3位数，它的每个位上的数字的3次幂之和等于它本身。例如：1^3+5^3+3^3=153。foriinrange(100,1000):i1=i//100#取
python学习笔记08_赋值运算、逻辑运算、表达式、短路原则 flamingocc
python笔记081.赋值运算符num+=1等价于num=num+1num-=1等价于num=num-1num*=1等价于num=num*1num/=1等价于num=num/1num//2等价于num=num//2num%=2等价于num/2的余数num**2等价于num=num*num2.逻辑运算符逻辑运算符包含：not、and、or2.1and的用法：(且、并且)写法：条件1and条件2eg
Python学习笔记（三）：列表的定义、访问及修改 RANDY_Sw Python入门 python
今天学习了有关列表的定义、访问及修改的方法，在此整理一下。列表的定义与访问name_list=['zhangsan','lisi','wangwu']#创建一个列表name_list[0]='xiaobai'#修改列表中的单个元素print(name_list)#遍历的方式打印列表1foriteminname_list:print(item)#遍历的方式打印列表2i=0foriinrange(le
Python学习2：一定要注意用pycharm创建Python package和Pythonfile而不是普通路径和文件土小帽软件测试 Python学习
2019年5月7日23:30:02今天久违地再续上断了好久差点又半途而废的Python基础，结果跟着写继承，明明引入了父类，可还是运行报错，下面父类是Person，子类是Student，模块文件名小写。person文件：classPerson(object):def__init__(self,name,age):self.name=nameself.age=agedefrun(self):prin
Linux中检查网络问题的常用命令程序员喵哥 Linux 网络 linux php 服务器运维
更多Python学习内容：ipengtao.com在Linux系统中，网络问题是常见的挑战之一。无论是服务器管理员还是普通用户，都可能遇到各种网络故障，如连接问题、DNS解析问题、网络延迟等。为了快速诊断和解决这些问题，掌握一些常用的网络故障排查命令是至关重要的。本文将介绍一些在Linux系统中常用的网络故障排查命令，并提供详细的示例代码，方便更好地理解和应用这些命令。ping命令ping命令是最
python安全渗透笔记红云谈安全 python编程学习 python 安全
Python学习python常见错误UnicodeDecodeError:‘gbk’codeccan’tdecodebyte0x8cinposition22:illegalmultibytesequence//打开的文件未编码encoding='UTF-8'expectedanindentedblock未缩进，ifforcontinue又进入一次新的循环%将其他变量置入字符串特定位置以生成新字符串
Pyhton抓取BOSS直聘职位描述和数据清洗，很简单没有那么难嗨学编程
一、抓取详细的职位描述信息详情页分析Python学习资料或者需要代码、视频加Python学习群：960410445在详情页中，比较重要的就是职位描述和工作地址这两个由于在页面代码中岗位职责和任职要求是在一个div中的，所以在抓的时候就不太好分，后续需要把这个连体婴儿，分开分析。爬虫用到的库使用的库有：requestsBeautifulSoup4pymongoPython代码代码easy，初学者都能
Python基础（十二）：字典的详细讲解 m0_60707685 程序员 python 学习面试
感谢每一个认真阅读我文章的人，看着粉丝一路的上涨和关注，礼尚往来总是要有的：①2000多本Python电子书（主流和经典的书籍应该都有了）②Python标准库资料（最全中文版）③项目源码（四五十个有趣且经典的练手项目及源码）④Python基础入门、爬虫、web开发、大数据分析方面的视频（适合小白学习）⑤Python学习路线图（告别不入流的学习）网上学习资料一大堆，但如果学到的知识不成体系，遇到问题
Python基础（十五）：推导式的讲解_python基础(十五) 推导式的讲解 m0_60707685 程序员 python 学习面试
（1）Python所有方向的学习路线（新版）这是我花了几天的时间去把Python所有方向的技术点做的整理，形成各个领域的知识点汇总，它的用处就在于，你可以按照上面的知识点去找对应的学习资源，保证自己学得较为全面。最近我才对这些路线做了一下新的更新，知识体系更全面了。（2）Python学习视频包含了Python入门、爬虫、数据分析和web开发的学习视频，总共100多个，虽然没有那么全面，但是对于入门
socket网络编程python_python学习-socket网络编程张文岳
作业：多用户在线的FTP程序要求：用户加密认证允许同时多用户登录每个用户有自己的家目录，且只能访问自己的家目录对用户进行磁盘配额，每个用户的可用空间不同允许用户在ftpserver上随意切换目录允许用户查看当前目录下文件允许上传和下载文件，保证文件一致性文件传输过程中显示进度条附加功能：支持文件的断点续传(仅下载)README###功能实现作业：开发一个支持多用户在线的FTP程序要求：用户加密认证
python学习第六节：使用python制作九九乘法表和学生管理系统一只会敲代码的小灰灰经验总结 python 学习开发语言 pycharm
python学习第六节：使用python制作九九乘法表和学生管理系统通过前面五节的了解，已经大概知道python的语法以及基础函数，下面是简单的两个小程序。不会做没关系，看得懂就可以了，如果能够自己加工举一反三那就更好了。ps:前面五节只是简单讲解了python的基础语法和函数，也就是混个脸熟，没有进行深入讲解，如果展开来讲的话每一个单独的语法和函数都能将几大章，而很多语法和函数的用法我们根本用不
python函数全局变量和局部变量_Python学习（六）—— 函数、全局变量与局部变量... weixin_39654917
函数函数的定义1deftest(x):2"Thefunctiondefinition"3x+=14returnxdef：定义函数的关键字test：函数名()：内可定义形参“”：文档描述，非必要，但添加后可使得函数更易理解x+=1：泛指代码块或程序处理逻辑，最好不要过多，让函数的功能简洁明了return：定义返回值调用运行：可以带参数也可以不带函数名()1deftest(x):2"Thefuncti
ztree设置禁用节点 3213213333332132 JavaScript ztree json setDisabledNode Ajax
ztree设置禁用节点的时候注意，当使用ajax后台请求数据,必须要设置为同步获取数据，否者会获取不到节点对象，导致设置禁用没有效果。 $(function(){ showTree(); setDisabledNode(); });
JVM patch by Taobao bookjovi java HotSpot
在网上无意中看到淘宝提交的hotspot patch，共四个，有意思，记录一下。 7050685：jsdbproc64.sh has a typo in the package name 7058036：FieldsAllocationStyle=2 does not work in 32-bit VM 7060619：C1 should respect inline and
将session存储到数据库中 dcj3sjt126com sql PHP session
CREATE TABLE sessions ( id CHAR(32) NOT NULL, data TEXT, last_accessed TIMESTAMP NOT NULL, PRIMARY KEY (id) ); <?php /** * Created by PhpStorm. * User: michaeldu * Date
Vector 171815164 vector
public Vector<CartProduct> delCart(Vector<CartProduct> cart, String id) { for (int i = 0; i < cart.size(); i++) { if (cart.get(i).getId().equals(id)) { cart.remove(i);
各连接池配置参数比较 g21121 连接池
排版真心费劲，大家凑合看下吧，见谅~ Druid DBCP C3P0 Proxool 数据库用户名称 Username Username User 数据库密码 Password Password Password 驱动名
[简单]mybatis insert语句添加动态字段 53873039oycg mybatis
mysql数据库,id自增,配置如下： <insert id="saveTestTb" useGeneratedKeys="true" keyProperty="id" parameterType=&
struts2拦截器配置云端月影 struts2拦截器
struts2拦截器interceptor的三种配置方法方法1. 普通配置法 <struts> <package name="struts2" extends="struts-default"> &
IE中页面不居中，火狐谷歌等正常 aijuans IE中页面不居中
问题是首页在火狐、谷歌、所有IE中正常显示，列表页的页面在火狐谷歌中正常，在IE6、7、8中都不中，觉得可能那个地方设置的让IE系列都不认识，仔细查看后发现，列表页中没写HTML模板部分没有添加DTD定义，就是<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3
String,int,Integer,char 几个类型常见转换 antonyup_2006 html sql .net
如何将字串 String 转换成整数 int? int i = Integer.valueOf(my_str).intValue(); int i=Integer.parseInt(str); 如何将字串 String 转换成Integer ? Integer integer=Integer.valueOf(str); 如何将整数 int 转换成字串 String ? 1.
PL/SQL的游标类型百合不是茶显示游标(静态游标)隐式游标游标的更新和删除 %rowtype ref游标(动态游标)
游标是oracle中的一个结果集,用于存放查询的结果; PL/SQL中游标的声明; 1,声明游标 2,打开游标(默认是关闭的); 3,提取数据 4,关闭游标注意的要点:游标必须声明在declare中,使用open打开游标,fetch取游标中的数据,close关闭游标隐式游标:主要是对DML数据的操作隐
JUnit4中@AfterClass @BeforeClass @after @before的区别对比 bijian1013 JUnit4 单元测试
一.基础知识 JUnit4使用Java5中的注解（annotation），以下是JUnit4常用的几个annotation： @Before：初始化方法对于每一个测试方法都要执行一次（注意与BeforeClass区别，后者是对于所有方法执行一次）@After：释放资源对于每一个测试方法都要执行一次（注意与AfterClass区别，后者是对于所有方法执行一次
精通Oracle10编程SQL(12)开发包 bijian1013 oracle 数据库 plsql
/* *开发包 *包用于逻辑组合相关的PL/SQL类型（例如TABLE类型和RECORD类型）、PL/SQL项（例如游标和游标变量）和PL/SQL子程序（例如过程和函数） */ --包用于逻辑组合相关的PL/SQL类型、项和子程序，它由包规范和包体两部分组成 --建立包规范：包规范实际是包与应用程序之间的接口，它用于定义包的公用组件，包括常量、变量、游标、过程和函数等 --在包规
【EhCache二】ehcache.xml配置详解 bit1129 ehcache.xml
在ehcache官网上找了多次，终于找到ehcache.xml配置元素和属性的含义说明文档了，这个文档包含在ehcache.xml的注释中！ ehcache.xml ： http://ehcache.org/ehcache.xml ehcache.xsd ： http://ehcache.org/ehcache.xsd ehcache配置文件的根元素是ehcahe ehcac
java.lang.ClassNotFoundException: org.springframework.web.context.ContextLoaderL 白糖_ java eclipse spring tomcat Web
今天学习spring+cxf的时候遇到一个问题：在web.xml中配置了spring的上下文监听器： <listener> <listener-class>org.springframework.web.context.ContextLoaderListener</listener-class> </listener> 随后启动
angular.element boyitech AngularJS AngularJS API angular.element
angular.element 描述: 包裹着一部分DOM element或者是HTML字符串，把它作为一个jQuery元素来处理。（类似于jQuery的选择器啦）如果jQuery被引入了，则angular.element就可以看作是jQuery选择器，选择的对象可以使用jQuery的函数；如果jQuery不可用，angular.e
java-给定两个已排序序列，找出共同的元素。 bylijinnan java
import java.util.ArrayList; import java.util.Arrays; import java.util.List; public class CommonItemInTwoSortedArray { /** * 题目：给定两个已排序序列，找出共同的元素。 * 1.定义两个指针分别指向序列的开始。 * 如果指向的两个元素
sftp 异常，有遇到的吗？求解 Chen.H java jcraft auth jsch jschexception
com.jcraft.jsch.JSchException: Auth cancel at com.jcraft.jsch.Session.connect(Session.java:460) at com.jcraft.jsch.Session.connect(Session.java:154) at cn.vivame.util.ftp.SftpServerAccess.connec
[生物智能与人工智能]神经元中的电化学结构代表什么? comsci 人工智能
我这里做一个大胆的猜想,生物神经网络中的神经元中包含着一些化学和类似电路的结构,这些结构通常用来扮演类似我们在拓扑分析系统中的节点嵌入方程一样,使得我们的神经网络产生智能判断的能力,而这些嵌入到节点中的方程同时也扮演着"经验"的角色.... 我们可以尝试一下...在某些神经
通过LAC和CID获取经纬度信息 dai_lm lac cid
方法1：用浏览器打开http://www.minigps.net/cellsearch.html，然后输入lac和cid信息(mcc和mnc可以填0)，如果数据正确就可以获得相应的经纬度方法2：发送HTTP请求到http://www.open-electronics.org/celltrack/cell.php?hex=0&lac=<lac>&cid=&
JAVA的困难分析 datamachine java
前段时间转了一篇SQL的文章（http://datamachine.iteye.com/blog/1971896），文章不复杂，但思想深刻，就顺便思考了一下java的不足，当砖头丢出来，希望引点和田玉。 -----------------------------------------------------------------------------------------
小学5年级英语单词背诵第二课 dcj3sjt126com english word
money 钱 paper 纸 speak 讲，说 tell 告诉 remember 记得，想起 knock 敲，击，打 question 问题 number 数字，号码 learn 学会，学习 street 街道 carry 搬运，携带 send 发送，邮寄，发射 must 必须 light 灯，光线，轻的 front
linux下面没有tree命令 dcj3sjt126com linux
centos p安装 yum -y install tree mac os安装 brew install tree 首先来看tree的用法 tree 中文解释：tree 功能说明：以树状图列出目录的内容。语　　法：tree [-aACdDfFgilnNpqstux][-I <范本样式>][-P <范本样式
Map迭代方式，Map迭代，Map循环蕃薯耀 Map循环 Map迭代 Map迭代方式
Map迭代方式，Map迭代，Map循环 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年
Spring Cache注解+Redis hanqunfeng spring
Spring3.1 Cache注解依赖jar包：  <dependency> <groupId>org.springframework.data</groupId> <artifactId>spring-data-redis</artifactId>
Guava中针对集合的 filter和过滤功能 jackyrong filter
在guava库中，自带了过滤器(filter)的功能，可以用来对collection 进行过滤，先看例子： @Test public void whenFilterWithIterables_thenFiltered() { List<String> names = Lists.newArrayList("John"
学习编程那点事 lampcy 编程 android PHP html5
一年前的夏天，我还在纠结要不要改行，要不要去学php？能学到真本事吗？改行能成功吗？太多的问题，我终于不顾一切，下定决心，辞去了工作，来到传说中的帝都。老师给的乘车方式还算有效，很顺利的就到了学校，赶巧了，正好学校搬到了新校区。先安顿了下来，过了个轻松的周末，第一次到帝都，逛逛吧！接下来的周一，是我噩梦的开始，学习内容对我这个零基础的人来说，除了勉强完成老师布置的作业外，我已经没有时间和精力去
架构师之流处理---------bytebuffer的mark,limit和flip nannan408 ByteBuffer
1.前言。如题，limit其实就是可以读取的字节长度的意思，flip是清空的意思，mark是标记的意思。 2.例子. 例子代码: String str = "helloWorld"; ByteBuffer buff = ByteBuffer.wrap(str.getBytes()); Sy
org.apache.el.parser.ParseException: Encountered " ":" ": "" at line 1, column 1 Everyday都不同 $转义 el表达式
最近在做Highcharts的过程中，在写js时，出现了以下异常：严重: Servlet.service() for servlet jsp threw exception org.apache.el.parser.ParseException: Encountered " ":" ": "" at line 1,
用Java实现发送邮件到163 tntxia java实现
/* 在java版经常看到有人问如何用javamail发送邮件？如何接收邮件？如何访问多个文件夹等。问题零散，而历史的回复早已经淹没在问题的海洋之中。本人之前所做过一个java项目，其中包含有WebMail功能，当初为用java实现而对javamail摸索了一段时间，总算有点收获。看到论坛中的经常有此方面的问题，因此把我的一些经验帖出来，希望对大家有些帮助。此篇仅介绍用
探索实体类存在的真正意义 java小叶檀 POJO
一. 实体类简述实体类其实就是俗称的POJO,这种类一般不实现特殊框架下的接口，在程序中仅作为数据容器用来持久化存储数据用的 POJO（Plain Old Java Objects）简单的Java对象它的一般格式就是 public class A{ private String id; public Str