E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
python--爬虫学习
初学
python--
认识装饰器
目录:0x00写在最前面0x01装饰器的作用,应用场景0x02函数的定义,使用,嵌套,传参0x03闭包的概念与理解0x04装饰器引入:通过函数嵌套和显示调用说明,装饰器调用过程0x05装饰器简单实例,语法糖@,说明装饰器怎么用0x06多个装饰器调用顺序0x07带参装饰器0x08装饰器作用于类中函数0x09类装饰器0x0a几个实用的装饰器0x0b参考文章、资料正文:0x00写在最前面刚开始学装饰器,
ZKeeer
·
2020-06-27 05:31
初学python
原创
Python
爬虫学习
笔记(一)
Python
爬虫学习
笔记(一)最近在学python爬虫,顺便把一些学习记录记下来,可能还有些表述不到位的地方,所以请大家指正下,一起学习,一起进步吧。
い莫失、莫忘
·
2020-06-27 02:43
python爬虫学习笔记
python
爬虫学习
4_模拟用户登录和代理设置
python
爬虫学习
4_模拟用户登录和代理设置模拟用户登录为了尽量模仿用户登录,我们需要在head中设置UserAgent常见的UserAgentAndroidMozilla/5.0(Linux;Android4.1.1
huhanghao
·
2020-06-27 01:59
Python学习
python--
查看微信好友是否删除自己
#weixin.py#coding:utf-8#!/usr/bin/envpython#coding=utf-8#通过该程序可以发现被删除的好友importosimporturllib,urllib2importreimportcookielibimporttimeimportxml.dom.minidomimportjsonimportsysimportmathDEBUG=FalseMAX_GR
zyf_andy
·
2020-06-26 23:48
Python实践应用
python--
计算字符串中出现最多次数的字符
看了网上挺多写的方法都没达到我所需要的效果,我干脆自己写了个方法共享给大家ee='aa111(((bbhhhhhh%jjjjjj%(ccc((vvvv22'cc='11222333'defmax_letter_count(n):list4=[]list1=[]list2=[]foriinn:list3=[]count_max=n.count(i)list3.append(i)list3.appen
u010266579
·
2020-06-26 21:43
python
Python
爬虫学习
笔记一:模拟登录(人工输入简单验证码)
#-*-coding:utf-8-*-importrequests,base64,refromPILimportImagefromioimportBytesIOdeflogon():loginUrl='http://############/login.do?method=enterbs'#登陆提交地址imgUrl='http://############/form/digitalverify.j
TypeCool
·
2020-06-26 21:37
Python
python--
关于defaultdict()函数
最初使用字典的时候,只是简单实用dict(),但是如果键不存在,就会报错显示keyerror,此时可以考虑使用defaultdict()函数。如何使用KeyErrorfromcollectionsimportdefaultdicta=defaultdict(int)#或者是importcollectionsa=collections.defaultdict(int)defaultdict()和di
全麦吐司chengym
·
2020-06-26 18:46
python
关于python的基础知识15 -- 语法错误和异常
Python中的语法错误和异常
python--
包括其它的程序语言,如java--中的程序错误,出现在程序运行前的编译过程和程序实际运行时,包括语法错误和异常(程序中的“异常”是指,程序运行过程中发生的错误
sunhy_csdn
·
2020-06-26 15:15
pyhton
爬虫学习
(八):线程和队列的使用
上一篇我们写了python实现图片爬取的实例,有兴趣可以看看地址:https://blog.csdn.net/stonezry/article/details/106072145我们还是实现和上面相同的功能,只是这里我们运用了线程和队列进行实现。python的线程创建方法,这里有两种方法。1.将要执行的方法作为参数传给Thread的构造方法target传递方法名字,args传递方法参数。如下#!/
史蒂文周
·
2020-06-26 14:19
python
python
爬虫学习
(二):python基础
1.关于python一些基础的语法,想要相对系统的学习的话,这里推荐这个比较好的网上学习教程:廖雪峰的python学习教程菜鸟教程python3看完这两个教程,对python的基本操作应该就没有问题了。另外也可以下载下列提供的某个电子书资源进行基础学习。下载地址https://pan.baidu.com/s/1OpFsXkwv991cuELAbVDqUA密码:bnrg在命令行通过命令运行pytho
史蒂文周
·
2020-06-26 14:18
python
python
Python爬虫之路(一) 代理ip的获取与检测
最近,为了加强自己的数据获取以及分析能力,迈入了
爬虫学习
之路。在网上找了一些教程,以及翻阅了一些参考书(推荐《Python网络数据采集》)之后,成功的写出了一段高可用的python爬虫代码。
liuyushuang
·
2020-06-26 12:05
爬虫学习
-scrapy爬取豆瓣电影top250
scrapy爬取豆瓣电影top250学习一下爬虫,在网上看了几个教程,毕竟实践后理解才更深,遂自己跑一下。工具和环境scrapy1.5.0python3.5chromescrapy的简单认识scrapy的数据流图引擎打开一个网站(openadomain),找到处理该网站的Spider并向该spider请求第一个要爬取的URL(s)。引擎从Spider中获取到第一个要爬取的URL并在调度器(Sche
sxtian__
·
2020-06-26 08:33
Python
python
爬虫
python--
小数点位数
a=7.346b=5.000#方法一round(a,2)#a--小数,2--想保留的小数位数#输入结果:7.35round(b,2)#这里发现不能完全保留两位小数#输出结果:5.0#方法二-----格式化后从数值型变为了字符串'%.2f'%a#输出结果:'7.35'c=5float('%.2f'%c)#不可以输出两位数#输出结果:5.0#方法三fromdecimalimportDecimalDec
cure_py
·
2020-06-26 06:50
python3
爬虫学习
之beautifulsoup实战
记录一下beaautifulsoup的使用和信息提取规则,并运用在实战中,学习课程时做的案例爬取中国天气网所有城市的最低气温并排出10大气温最低城市,实战中会有大大小小的误区及需要注意的地方,下面会一一列举上代码importrequestsfrombs4importBeautifulSoup#frompyechartsimportBarcities_temp=[]#处理抓取页面defparse_u
s_kangkang_A
·
2020-06-26 06:50
python3爬虫基础
基于python的网络爬虫初探
@TOC基于python的网络
爬虫学习
笔记1网络爬虫概述网络爬虫主要包含两个任务:1.下载目标网页;2.从目标网页提取需要的数据。
shlay
·
2020-06-26 06:22
爬虫
python--
双十一淘宝商家营销策略分析
importpandasaspdimportnumpyasnpimportmatplotlib.pyplotaspltimportwarnings#忽略红色的警告warnings.filterwarnings("ignore")frombokeh.plottingimportfigure,show,output_filefrombokeh.modelsimportColumnDataSource#
rong_king_
·
2020-06-26 06:08
python
爬虫学习
教程,爬取千万淘宝商品的脚本
分享之前爬虫爬到的1000万条淘宝商品信息。平衡涵盖各种分类,包括商品名、卖家id、地区、价格等信息,json格式。源码展示:importtimeimportleveldbfromurllib.parseimportquote_plusimportreimportjsonimportitertoolsimportsysimportrequestsfromqueueimportQueuefromth
Python新手学习之家
·
2020-06-26 03:56
python爬虫
1.零基础系统学习Python爬虫之request库
Python博客☜☜☜Python爬虫之request库request库的get()方法request的重要对象——Reponserequest的使用流程==**文章导航:==**从这个文章开始我将写一个关于
爬虫学习
的系列文章
James Bin
·
2020-06-26 03:34
Python爬虫
Python
爬虫学习
基础——5分钟学会爬取B站视频日播放量排行
Python
爬虫学习
基础——5分钟学会爬取B站视频日播放量排行基础包含requestspyquery进入正题基础包含这也是我当初第一次学习爬虫时做的练习,感觉给初学者练笔挺不错的。
ℳ๓₯㎕℡ 桜
·
2020-06-26 03:52
爬虫
Python
Python爬虫scrapy框架实践
爬取湖北工业大学宣讲会信息
爬虫学习
(开发使用的是Python2.7版本,这里采用scrapy框架)之前尝试直接爬取,但是速度远不及scrapy框架。
伊小小小凡
·
2020-06-26 02:31
爬虫
python--
千库网素材爬取
'''搞事情!千库网圣诞素材图片抓取(仅一页,其他自己循环)'''importrequests#requests请求模块importre#re正则匹配模块importrandom#随机数字模块response=requests.get('http://588ku.com/png-zt/68.html')#访问千库网站后去响应;index=response.text#获取到响应的文件;url=re.
狠卟乖
·
2020-06-26 02:06
python
Python大佬总结的超级详细的Python
爬虫学习
清单送给你
0.Python基础先放上Python3的官方文档:https://docs.python.org/3/(看文档是个好习惯)关于Python3基础语法方面的东西,网上有很多,大家可以自行查找.一.最简单的爬取程序爬取百度首页源代码:来看上面的代码:Theurllib.requestmoduledefinesfunctionsandclasseswhichhelpinopeningURLs(most
孤傲帝
·
2020-06-26 01:55
Python
Python开发
web开发
【
python--
爬虫】彼岸图网高清壁纸爬虫
前言你还在为壁纸太过老土被盆友嘲笑而苦恼吗?你还在为找不到高清壁纸而烦恼吗?你还在为壁纸网站的收费而感到囊中羞涩吗?NO,NO,NO!!!人生苦短,山东数十萌新变身高富帅的梦想,你可以复制!是时候换个壁纸啦!展示一张天依小可爱的壁纸前提准备本次我们要爬取的网站是彼岸图网,网址链接:http://pic.netbian.com。需要各位读者大大提前准备好以下环境:1.python3.7(版本为3的就
猫先生的早茶
·
2020-06-26 01:39
python
【
python--
爬虫】千图网高清背景图片爬虫
最近有读者反映想要下载千图网的高清背景图片,但是需要会员才能下载,而且需要的量非常大,问博主有没有办法能免费下载这些图片。付费,不存在的o( ̄▽ ̄)o!,博主今天讲解如何通过python爬取千图网的高清背景图片。快,快,坐好小板凳,拿好小瓜子,听博主吹牛,额,是讲课,讲课!╰( ̄ω ̄o)编写环境为了完美食用本篇教程贴,搭建好如下环境可以上互联网的win7或win10电脑一台火狐浏览器(版本无要求)
猫先生的早茶
·
2020-06-26 01:07
python
【
python--
教程】pyautogui图形自动化,击败重复性办公任务。
pyautogui一个神奇的图像自动化库,学会之后无所不能。上能挂机刷宝箱,下能自动写文档。(>人<;)让我装个逼,别锤我,谢谢!安装这个pyautogui在win10上的安装挺坑的,当初第一次安装时出现了好几次错误(┬┬﹏┬┬)安装命令如下:pipinstall-ihttps://pypi.tuna.tsinghua.edu.cn/simplepyautogui导入模块在安装好这个模块后我们还需
猫先生的早茶
·
2020-06-26 01:37
python
【
python--
爬虫】豆瓣读书用户评分爬虫
豆瓣读书用户评分爬虫最近有好友不会做豆瓣读书的评论和评分的爬虫求助博主,博主做完后发给了该好友,本着造福小白的心理,博主在这里给大家分享自己写的豆瓣爬虫。1.分析网页这里我们先随便打开一本书的评论,由于通过csdn访问豆瓣时会自动添加referer,请手动复制网址在新标签页中打开(https://book.douban.com/subject/30442488/comments/)在页面源代码中查
猫先生的早茶
·
2020-06-26 01:37
python
python xpath用法
xpath在Python的
爬虫学习
中,起着举足轻重的地位,对比正则表达式re两者可以完成同样的工作,实现的功能也差不多,但xpath明显比re具有优势,在网页分析上使re退居二线。
qq_42603652
·
2020-06-26 00:03
爬虫学习
笔记(一):爬取书籍信息
爬取爬虫练习网站的书籍信息专门供爬虫初学者训练爬虫技术的网站(http://books.toscrape.com)我使用的浏览器是GoogleChrome浏览器1.创建项目首先,我们要创建一个Scrapy项目,在shell中使用scrapystartproject命令:$scrapystartprojectSpider_name创建成功:2.分析页面网站首页如下图所示:接着将鼠标停在第一本书的图片
二浩啊二浩
·
2020-06-25 23:29
python爬虫
Python
爬虫学习
记录——18.58同城出租信息抓取
文章目录爬虫整体流程实战爬虫整体流程实战58同城抓取流程进入成都小区页面(https://cd.58.com/xiaoqu/),确定抓取目标观察页面,获取各行政区的链接分行政区抓取各小区的URL进入各小区详情页面,抓取名字、价格、地址、年份等信息抓取小区二手房页面第一页的价格,在管道中求该小区房价的平均价格抓取小区出租房页面第一页的URL,进入详情页抓取名称、价格、房型等信息需要抓取的有:各行政区
赈川
·
2020-06-25 19:25
Scrapy
Python--
基于卷积神经网络的图像分类
基于卷积神经网络的图像分类什么是过拟合什么是数据增强python代码在小数据集上从头训练convnet深度学习与小数据问题的相关性下载数据建立我们的网络数据预处理使用数据扩充什么是过拟合过拟合是指为了得到一致假设而使假设变得过度严格。避免过拟合是分类器设计中的一个核心任务。通常采用增大数据量和测试样本集的方法对分类器性能进行评价。定义给定一个假设空间H,一个假设h属于H,如果存在其他的假设h’属于
三分奶茶七分糖丶
·
2020-06-25 18:32
神经网络
深度学习
python--
编程练习(字节跳动 2019-3-16)
本篇是笔试时编写保存在pycharm上的代码,标注有子集容易出错的地方,笔试题目共有4道,以下是前2道。字节跳动的题目,有算法复杂度和内存要求,除此外在编写代码时要考虑输入格式,这是笔试编程与平时编写最大的差别。**题目1:**找零钱Z国货币包含面值为1元、4元、16元和64元4种硬币,只有一种面值为1024元的纸币。小Y用一张1024元的纸币买一件N元商品,问:最后找零最少他会收到多少硬币?##
qq_38077075
·
2020-06-25 13:44
Python 3
爬虫学习
笔记 9 存储链接至mysql并检索任意两个链接之间的路径
此学习笔记整理于RyanMitchellWebScrapingwithPython-CollectingDatafromtheModernWeb(2015)Chapter8Readingandwritingnaturallanguages天啦噜!这个笔记真是让人兴奋不已啊!代码写得太好了作者。不多说了,上代码和解释。1,首先,新建database,这一段代码直接在mysql里写的。值得学习的地方有
懒大
·
2020-06-25 13:15
爬虫学习
之路
爬虫学习
之路爬虫爬虫1-cookie爬虫2-代理设置爬虫3-不信任的ssh证书爬虫4-模拟登陆爬虫爬虫1-cookiecookie的使用:#Authorlpf#usr/bin/src'''1、利用cookies
@~~~~小飞
·
2020-06-25 12:53
python
爬虫学习之路
Python--
文件读写操作
文章目录
Python--
文件读写操作文件访问模式的汇总Python–文件读写操作程序执行都是在内存中进行操作的,如果需要落盘就需要单独的执行文件写操作直接使用下面的模式打开文件的时候需要单独进行文件的关闭操作
南风依旧
·
2020-06-25 10:08
Python
Scrapy-Redis分布式
爬虫学习
Scrapy-Redis分布式爬虫组件scrapy是一个框架,它本身不支持分布式的。如果我们想要做分布式的爬虫,就需要借助一个组件叫做Scrapy-Redis,这个组件正是利用了Redis可以分布式的功能,集成到Scrapy框架中,使得爬虫进行分布式。可以充分的利用资源(多个ip、更多带宽、同步爬取)来提高爬虫的爬行效率。分布式爬虫的优点:可以充分利用多台机器的带宽。可以充分利用多台机器的ip地址
Yustin-z
·
2020-06-25 09:28
python
twitter
爬虫学习
记录
学习数据获取的时候,看了很多的帖子,但是自己还未成功,现在根据师姐的指导,记录下自己的学习过程,避免忘记。1.在Twitter上新建应用网址:https://apps.twitter.com/app/new创建好之后的网址(记录下,自己总是创建完就找不到了):https://apps.twitter.com/app/15264546创建好了就可以获取应用的信息,包括Consumerkey和Cons
左小慢
·
2020-06-25 07:03
机器学习
Scrapy框架学习(八)----Scrapy-redis分布式
爬虫学习
Scrapy框架学习(八)—-Scrapy-redis分布式
爬虫学习
Scrapy-redis分布式爬虫框架,是在Scrapy爬虫框架的基础上进行改进的,通过Redis来进行数据的缓存,可以在多台机器上运行爬虫程序
张行之
·
2020-06-25 07:01
Python
Scrapy学习
Python
爬虫学习
笔记(selenium+Headless)
selenium目前抛弃了之前使用的phantomanJS,改用Selenium+Headless的组合,解决JS渲染问题,不会有浏览器窗口弹出并且提升了执行速度,同时可以尽量规避网站对爬虫的审查(建议添加cookie并使用代理池)。使用时,首先应当安装selenium和webdriver,webdriver应当与当前Chrome浏览器版本一致才能正常使用,二者都建议使用最新版本。下载webdri
二叉叔
·
2020-06-25 06:46
Python爬虫
Python
爬虫
selenium
Headless
Python
爬虫学习
笔记(安装redis-dump ERROR:While executing gem ... (Gem::RemoteFetcher::FetchError) ****)
背景:windows10OS64位Ruby、gem已经安装完成问题:CMD执行命令:geminstallredis-dump下载中断并报错:Whileexecutinggem...(Gem::RemoteFetcher::FetchError)toomanyconnectionresets(https://api.rubygems.org/gems/yajl-ruby-1.4.1.gem)原因:R
二叉叔
·
2020-06-25 06:45
Python爬虫
Python
爬虫学习
笔记(开发者工具中的Ajax+实例:爬取个人微博主页)
Ajax文件的Type是xhr,点击浏览器的开发者工具中NetWork选项下的XHR就可以筛选出所有的ajax请求,RequestHeader中有一个信息为X-Requestsed-with:XMLHttpRequest,意思代表此请求是ajax请求爬取个人微博主页前10条微博的ID、内容、点赞数、评论数、转发数存入MongoDB数据库fromurllib.parseimporturlencode
二叉叔
·
2020-06-25 06:45
Python爬虫
Python
爬虫学习
笔记(实例:股票信息定向爬虫及优化)
#要求URL对应的股票数据显性的填充在HTML代码中importrequestsfrombs4importBeautifulSoupimporttracebackimportredefgetHTMLText(url,code="utf-8"):try:r=requests.get(url)r.raise_for_status()r.encoding=codereturnr.textexcept:r
二叉叔
·
2020-06-25 06:45
Python爬虫
java网络
爬虫学习
记录(一)概述
在学习爬虫之前首先得了解爬虫,爬虫是什么,爬虫就是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。注:下面的内容转自教程中老师的笔记一、网络爬虫原理1.1等同于浏览器访问网页的原理(1)真人行为驱动(2)浏览器自动执行人为的动作,即将动作自动程序化。1.2网络爬虫就是将浏览器访问网页的过程,再次抽像成程序。二、网络爬虫分类2.1按链接的访问层次的先后来分宽度优先和深度优先。宽度优先:即在下
memoryCoderC
·
2020-06-25 03:54
java爬虫
爬虫学习
——批量在geoserver发布矢量数据
前提:数据样式格式一致工具:selenium+Chromedriver;本次代码主要依靠selenium+Python,浏览器我用的是Chrome浏览器以及相应的驱动Chromedriver,selenium可以通过pip安装,Chromedriver要去网上下载与浏览器版本一致的安装包,具体安装过程自行百度。数据前期准备:Python代码:importtimefromseleniumimport
八千鸟羽
·
2020-06-25 01:16
小白的Python学习
非计算机专业小白自学爬虫全指南(附资源)
本文推荐的资源就是以项目练习带动
爬虫学习
,囊括了大部分爬虫工程师要求的知识点。爬虫工程师要求知识点1、python入门和进阶(进阶的包括多进程等等)2、HTTP知识(因为要爬
q7695650
·
2020-06-24 21:13
python--
爬虫--获取和解析存储网页内容--以薄荷网为例
如需转载请注明出处:python–爬虫–获取和解析存储网页内容–以薄荷网为例我们在之前的文章中已经学习了如何进行数据抓包和截取以及分析访问网页。例如:抓取app数据教程–fiddler抓包数据截取-薄荷app为例本章主要学习怎么获取分析出来的链接地址的内容,进行解析和进行保存。分析网页或者手机APP请求地址通过观察fiddler中的请求可以发现我们需要抓取的地址。详情可参考Fiddler介绍和安装
张小凡vip
·
2020-06-24 21:43
python
数据采集
python
爬虫
获取
解析
存储
遇到问题--
python--
爬虫--urllib的post参数类型错误--传输json格式
情况使用代码deffetch_raw_post_meitu(link,data):proxy_support=urllib.request.ProxyHandler({'https':'192.168.11.195:8888'})opener=urllib.request.build_opener(proxy_support)urllib.request.install_opener(opener
张小凡vip
·
2020-06-24 21:11
python
数据采集
遇到问题解决方案集锦
数据采集
python--
积累--带有用户认证Authorization的post请求
class.py如下:importsslssl._create_default_https_context=ssl._create_unverified_contextimportjsonimporturllibimporturllib.requestimportbase64fromapi_module.loggerimportloggerclassProductRequestFactory:de
张小凡vip
·
2020-06-24 21:33
python
python
authorization
post
用户
认证
Python--
魔术方法--上下文管理
魔术方法上下文管理上下文管理对象上下文管理的安全性with语句方法的参数练习装饰器实现上下文实现可调用对象实现上下文应用场景contextlib.contextmanager总结上下文管理文件IO操作可以对文件对象使用上下文管理,使用with..as语法withopen('test')asf:pass仿照上例写一个自己的类,实现上下文管理classPoint:passwithPoint()asp:
鹿夏
·
2020-06-24 21:37
python 爬虫破解字体加密反爬技术(大众点评为例)
大家好,我是python小白,今天记录一下我的
爬虫学习
之路,在爬取大众点评网站的时候遇到的问题。
python_HJC
·
2020-06-24 21:03
python
爬虫学习
:抓取智联招聘网站职位信息(二)
在第一篇文章(python
爬虫学习
:抓取智联招聘网站职位信息(一))中,我们介绍了爬取智联招聘网站上基于岗位关键字,及地区进行搜索的岗位信息,并对爬取到的岗位工资数据进行统计并生成直方图展示;同时进入每个职位明细页面提取出职位要求部分的页面内容
JordanPanther
·
2020-06-24 20:06
Python
爬虫
python
数据分析
上一页
31
32
33
34
35
36
37
38
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他