E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
python爬虫模拟登录
Python爬虫
--- 2.1 Scrapy 爬虫框架的安装与基本介绍
这次介绍一个及其强大的爬虫框架---Scrapy,Scrapy由Python编写,是一个快速、高层次的屏幕抓取和web抓取框架,用于抓取web站点并从页面中提取结构化的数据。Scrapy用途广泛,可以用于数据挖掘、监测和自动化测试。Srapy框架的安装:无论是在windows还是mac以及linux下,都可以是用pip工具进行快速安装:$pipinstallscrapy这里推荐一个非常好用的Pyt
緣來
·
2023-12-26 05:52
selenium
模拟登录
京东M站
最近几天在研究如果
模拟登录
京东m站,主要难点是如何识别验证码。在现有的图像识别库的基础上做了些工作,最终能够100%识别验证码。这里有以下几点体会:在做一件事之前,要研究这件事的可行性。
Judy警官
·
2023-12-26 04:04
python爬虫
二十六:css反爬及文字混淆
1、爬取自如网价格①网址:自如网点击查看,进入后点击租房,接下来就是爬取房价信息,以及其它想要提取的数据②分析流程:他所有的内容均在网页源代码中,不用去寻找api接口,皆大欢喜,但它的价格是css加密过的,即点击styles中的不显示红框中的内容,它的价格就会发生变化,复制它的url地址,会发现是一张雪碧图(爬取的价格图片背景像雪碧,所以叫做雪碧图),它的价格是根据像素点的变化,定位雪碧图的不同数
慢羊羊6379.*?
·
2023-12-25 23:54
python爬虫学习
python爬虫
入门(六)------正则表达式学习
文章目录正则表达式的介绍正则表达式:用于表达一组字符串的方式(简洁)经典实例在python中使用re库函数match对象:Re库的另一种等价用法:正则表达式的介绍正则表达式:用于表达一组字符串的方式(简洁)例如:'pn''pyn''pytn''pythn''python'对应正则表达式:p(y|yt|yth|ytho)?n正则表达式的常用操作符.表示任何单个字符;[]字符集,对单个字符给出取值范围
Soul酒吧
·
2023-12-25 22:39
python之爬虫的学习
python
正则表达式
Python爬虫
山东重庆各地区天气预报
天气数据获取工具简单的Python脚本用于从中国天气网(http://www.weather.com.cn/textFC/chongqing.shtml)获取天气数据,并将数据保存到Excel文件中。运行效果功能输入中文省份名称,获取该省份下所有城市的天气数据。数据保存到指定文件夹中,文件名格式为:时间_省份_城市.xlsx。使用方法安装必要的库pipinstall-rrequirements.t
Wcowin
·
2023-12-25 22:17
pip
爬虫
算法
Python爬虫
使用代理IP的实现动态页面抓取
目录一、引言二、代理IP的基本概念三、代理IP的选择四、代理IP的设置和使用五、案例分析六、注意事项七、总结一、引言随着互联网的普及,数据获取变得越来越重要。Python作为一种强大的编程语言,在数据获取方面具有广泛的应用。然而,许多网站为了防止恶意爬虫,采取了反爬虫机制。为了绕过这些机制,我们可以使用代理IP。代理IP可以隐藏我们的真实IP地址,提高爬虫的效率和成功率。本文将详细介绍如何在Pyt
小小卡拉眯
·
2023-12-25 21:51
python小知识
认识代理IP
python
爬虫
tcp/ip
Python网络爬虫(五)——获取代理IP
设置代理IP的原因如果我们使用
Python爬虫
爬取一个网站时,并且需要频繁访问该网站。假如一个网站它会检测某一段时间某个IP的访问次数,如果访问次数过多,它会禁止你的访问。
AI阿聪
·
2023-12-25 21:51
Python爬虫
Python
网络爬虫
获取代理IP
Python 爬虫之下载视频(三)
注意:分上下两篇来写,请先看
Python爬虫
之下载视频(二)。一、基本思路第一步:根据上篇找到的视频链接,打开它,会转到一个新的页
因果尽加吾身
·
2023-12-25 14:45
Python
爬虫
python
爬虫
开发语言
Python爬虫
---解析---JSONPath
Xpath可以解析本地文件和服务器响应的文件,JSONPath只能解析本地文件1.安装jsonpath:pipinstalljsonpath注意:需要安装在python解释器相同的位置,例如:D:\ProgramFiles\Python3.11.4\Scripts2.使用步骤2.1导入:importjsonpath2.2使用:示例1:#导包importjsonpathimportjsonobj=j
velpro_!
·
2023-12-25 13:23
python
开发语言
听说房子降价了,用
python爬虫
看一下数据!
本文将介绍如何使用
Python爬虫
技术来获取最新的兰州房价信息。一、爬虫原理爬虫本质上是一种网络爬行技术,通过模拟网络浏览器的行为,自动抓取网页信息,并进行数据处理。
柑橘乌云a
·
2023-12-25 12:52
python
爬虫
开发语言
爬虫抓取链家二手房数据
使用
Python爬虫
库完成链家二手房(https://bj.lianjia.com/ershoufang/rs/)房源信息抓取,包括楼层、区域、总价、单价等信息。
qwy715229258163
·
2023-12-25 11:57
python
爬虫
爬虫
python
python爬虫
之selenium模拟浏览器
1.前言之前在异步加载(AJAX)网页爬虫的时候提到过,爬取这种ajax技术的网页有两种办法:一种就是通过浏览器审查元素找到包含所需信息网页的真实地址,另一种就是通过selenium模拟浏览器的方法[1]。当时爬的是豆瓣,比较容易分析出所需信息的真实地址,不过一般大点的网站像淘宝这种是不好分析的,所以利用selenium模拟浏览器的行为来爬取数据是一个比较可行的办法。2.selenium基础Sel
爱编程的鱼
·
2023-12-25 06:40
python入门教程
python
爬虫
开发语言
c语言
算法
借势API,电商如何进行电商平台数据采集汇总分析?
电商数据采集的网页抓取数据、淘宝、天猫、京东等平台的电商数据抓取,网页爬虫、采集网站数据、网页数据采集软件、
python爬虫
、HTM网页提取、APP数据抓包、APP数据采集、一站式网站采集技术、BI数据的数据分析
懂电商API接口的Jennifer
·
2023-12-25 00:47
淘宝API接口
1688
API
接口
servlet
爬虫
网络爬虫
开发语言
java
数据库
python爬虫
二十二:使用weditor定位app控件(二)
1、weditor1.1什么是weditor定位app控件的一种工具,相当于selenium,可以快速定位app以及清晰的看到他们之间的层级关系,抓取app数据之前可以通过它先了解app的结构以及一些信息(就相当于饭前洗手虽然没有必要关联,但是有助于你的健康)它虽然对抓取app数据没太大相关,但可以帮助了解app的组成以及实现它的逻辑1.2怎么使用weditor①安装adb②安装uiautomat
慢羊羊6379.*?
·
2023-12-24 16:04
python爬虫学习
python爬虫
练习系列之一:获取csdn文章列表(含执行js脚本)
【目标】无需登录,直接获取博客下所有文章列表,包括:地址、标题、阅读数、点赞数等,供后续下载之用。采用python加selenium实现。中间会执行js脚本范例,去掉部分影响页面显示效果的元素。【范例】#pipinstallseleniumfromseleniumimportwebdriverfromselenium.webdriver.chrome.optionsimportOptionsfro
小白用python
·
2023-12-24 15:36
爬虫
python
python爬虫
练习系列之二:下载B站视频
【思路】1.下载文件用requests库最方便,因为可以获取错误码,可以自定义保存文件名,且不用判断文件是否已经下载完成。2.解析需要下载的地址,得到视频和音频文件下载地址3.合成视频和音频,得到最终mp4文件。本次涉及视频操作,故需要安装如下库:pipinstallrequestsmoviepy【范例代码】importrequestsimportjsonimportrefrommoviepy.v
小白用python
·
2023-12-24 15:36
python
python
开发语言
python爬虫
练习系列之三:下载某站文档资料
【目标】下载某网站https://www.pcac.org.cn/eportal/ui?pageId=595055拟获取列表中文档数据。先获取总页数,如下图:然后逐步翻页获取每个页面链接。有些链接指向.pdf文档,可以直接下载;有些链接指向html文件,直接保存;有些有一个附件,直接下载;有些有多个附件,建立目录后保存。【优化细节】若文件已经下载过,则自动跳过;若获取某个文件下载出错,则自动跳过进
小白用python
·
2023-12-24 15:36
python
爬虫
爬虫 mysql mongodb_
Python爬虫
-MongoDB
Python爬虫
-MongoDB前言如果仅考虑自己爬虫自己使用,我是推崇MongoDB的——暴力直接。一个字典insert下去,世界从混沌归于一片宁静。
绘本馆里的红猴子
·
2023-12-24 12:15
爬虫
mysql
mongodb
一步步实现对API的访问限制(节流)
一步步实现对API的访问限制(节流)如果客户端很频繁的请求服务器,会给给服务器造成很大的压力,需要对客户端对API的请求,做一些限制,如
Python爬虫
对服务器API的请求,对API的请求限制也是反爬虫的一个手段之一
CoderMiner
·
2023-12-23 23:30
Python爬虫
的9个具体应用场景!爬虫的用处分析
文章目录前言一、新闻采集二、数据挖掘三、网站监测四、舆情分析五、爬虫定制化开发六、数据采集与处理七、网络安全八、网络营销九、自动化测试总结
Python爬虫
技术资源分享1、Python所有方向的学习路线2
只存在于虚拟的King
·
2023-12-23 20:56
python
爬虫
开发语言
计算机
计算机网络
程序人生
经验分享
python爬虫
入门,零基础适用
文章目录什么是爬虫?它能解决什么问题?爬虫的分类:通用网络爬虫:聚焦网络爬虫:企业获取数据的方式:Python做爬虫的优势:爬虫违法么?http与https协议:什么是协议:Http协议又是个啥?Http的特点:Http的请求与响应:Http报文的组成:请求报文首部的结构:响应报文首部的结构:报文主体部分:什么是Https?http与https的区别小结:拓展:**URL**:(UniformRe
只存在于虚拟的King
·
2023-12-23 20:24
python
爬虫
开发语言
计算机网络
学习
学习方法
经验分享
Python爬虫
:绘图matplotlib与词云
1绘制条形图Python学习资料或者需要代码、视频加Python学习群:9604104452绘制智联招聘职位岗位数量图3词云“词云”这个概念由美国西北大学新闻学副教授、新媒体专业主任里奇·戈登(RichGordon)提出。“词云”就是对网络文本中出现频率较高的“关键词”予以视觉上的突出,形成“关键词云层”或“关键词渲染”,从而过滤掉大量的文本信息,使浏览网页者只要一眼扫过文本就可以领略文本的主旨。
嗨学编程
·
2023-12-23 17:01
Python爬虫
尝试——爬取文本信息
前序最近想起来CSDN,便坚持着分享一些近期的实践吧今天开篇前,分享一句话心之所安,便是归处爬虫分享言归正传,下面谈一谈爬虫的信息爬虫是一种自动化的程序,它模拟用户的行为,对网页发出请求,自动化地获取我们所需要的信息,对于信息检索十分重要,也比较便利。它的步骤大概如下:发送网络请求。笔者通常借助Python的库使用request实现,请求可以是POST/GET,视需求而定;网页解析。获取到网页的内
fancymeng
·
2023-12-23 17:51
爬虫
python
爬虫
Python爬虫
教程:入门级爬取网页数据
1.遵守法律法规爬虫在获取网页数据时,需要遵守以下几点,以确保不违反法律法规:1.不得侵犯网站的知识产权:爬虫不得未经授权,获取和复制网站的内容,这包括文本、图片、音频、视频等。2.不得违反网站的使用条款:爬虫在获取网页数据时,需要仔细阅读网站的使用条款和隐私政策,确保不违反其中的规定。3.不得干扰网站的正常运行:爬虫不得对网站的服务器、网络带宽等资源造成过大的负荷,以免影响网站的正常运行。4.不
认真写程序的强哥
·
2023-12-23 15:40
python
爬虫
开发语言
Python爬虫
Python学习
爬虫工作量由小到大的思维转变---<第二十一章 Scrapy日志设置与Python的logging模块对比>
Scrapy是一个强大的
Python爬虫
框架,提供了自己的日志设置功能。然而,与Python的标准库logging模块相比,Scrapy的日志设置有其独特的优势和用法。
大河之J天上来
·
2023-12-23 15:08
15天玩转高级python
爬虫
scrapy
python
Python爬虫
系列——(一)发起HTTP请求/解析数据
(一)发起HTTP/HTTPS请求方法一:urlliburllib是python内置的HTTP请求库,无需安装即可使用,它包含了4个模块:request:它是最基本的http请求模块,用来模拟发送请求error:异常处理模块,如果出现错误可以捕获这些异常parse:一个工具模块,提供了许多URL处理方法,如:拆分、解析、合并等robotparser:主要用来识别网站的robots.txt文件,然后
Chestimouse
·
2023-12-23 09:29
Python爬虫
python
json
Python爬虫
(使用Bs4爬取、保存csv、excel、数据库)
1、爬虫爬取的内容:爬取豆瓣图书的主要字段为:书名、作者、出版社、出版年、定价、评分爬取的页面:爬取前3页的内容url:主要是start={}这里面的内容不一致,修改这里面的数据就可以爬取多页第一页:https://book.douban.com/tag/%E7%BC%96%E7%A8%8B?start=0&type=T第二页:https://book.douban.com/tag/%E7%BC%
小逗号L
·
2023-12-23 02:17
python爬虫
python
爬虫
开发语言
python爬虫
进阶篇:Scrapy中使用Selenium模拟Firefox火狐浏览器爬取网页信息
一、前言接着上一篇的笔记,Scrapy爬取普通无反爬、静态页面的网页时可以顺利爬取我们要的信息。但是大部分情况下我们要的数据所在的网页它是动态加载出来的(ajax请求后传回前端页面渲染、js调用function等)。这种情况下需要使用selenium进行模拟人工操作浏览器行为,实现自动化采集动态网页数据。二、环境搭建Scrapy框架的基本依赖包(前几篇有记录)selenium依赖包pipinsta
code_space
·
2023-12-23 00:44
python
编程工具
爬虫
python
爬虫
scrapy
python爬虫
进阶篇:用Scrapy框架进行百度搜索并爬取搜索结果进行持久化
一、前言接着上篇记录的爬虫应用,这次来试下百度搜索的爬虫应用。百度的很多搜索结果可以为我们的行业挣得信息差,并且统计数据后可以发现规律,根据规律寻找盈利点。所以我们先来试下小demo来尝试爬取百度的搜索结果。二、需求分析提供关键词后搜索结果从搜索结果中提取标题链接描述来源存为csv文件或者数据库三、代码实现设置爬取的网址(关键词为“python入门到放弃”,百度链接需要将中文转码)defstart
code_space
·
2023-12-23 00:43
python
爬虫
编程工具
python
爬虫
scrapy
python爬虫
入门篇:使用requests发送POST请求提交表单
一、定义post()方法将携带某些数据的POST请求发送到指定的URL二、应用场景提交表单所涉及到的增删改操作。调用API,例如百度云的文字识别接口、阿里云的常用支付接口,都需要用POST请求。发送/上传图片、音视频等文件资源。三、使用方法1)导入模块importrequests2)封装数据将要发送的数据封装到data中,封装形式可以是字典、json、元组等。#发送字典post_dict={'ke
code_space
·
2023-12-23 00:43
爬虫
python
开发语言
后端
爬虫
request
python爬虫
进阶篇:Scrapy中使用Selenium+Firefox浏览器爬取沪深A股股票行情
一、前言上篇记录了Scrapy搭配selenium的使用方法,有了基本的了解后我们可以将这项技术落实到实际需求中。目前很多股票网站的行情信息都是动态数据,我们可以用Scrapy+selenium对股票进行实时采集并持久化,再进行数据分析、邮件通知等操作。二、环境搭建详情请看上篇笔记三、代码实现itemsclassStockSpiderItem(scrapy.Item):#definethefiel
code_space
·
2023-12-23 00:11
python
编程工具
爬虫
python
爬虫
scrapy
【
Python爬虫
】第四课 动态爬取数据
#首先通过审查元素找到动态网站请求地址#通过requests访问该地址#再使用Json对这些数据进行解析importrequestsimportjson#访问的请求地址url="https://www.ptpress.com.cn/hotBook/getHotBookList?parentTagId=75424c57-6dd7-4d1f-b6b9-8e95773c0593&rows=18&page
笔触狂放
·
2023-12-22 21:27
Python爬虫
python
爬虫
java
Python爬虫
案例2:爬取前程无忧网站数据
1爬虫技术介绍Python中有许多模块可以用于编写爬虫程序,常用的有urllib2、requests、selenium模块等,本文选取的是selenium模块,selenium是一个Web的自动化测试工具,最初是为网站自动化测试而开发的,完全由JavaScript编写,因此可以用于任何支持JavaScript的浏览器上。选取其是基于以下原因:selenium模块本质是通过驱动浏览器、完全模拟浏览器
VIV-
·
2023-12-22 20:34
python
爬虫
开发语言
Python爬虫
案例1:爬取淘宝网页数据
1网络爬虫与反爬虫介绍网络爬虫是一种按照一定的规则自动地抓取万维网信息的程序或者脚本,被广泛应用于搜索引擎、数据挖掘、价格比较、新闻聚合等应用程序中。网络爬虫可以通过HTTP协议访问网站,并根据预定义的规则和算法来抓取网页内容,并将抓取的数据存储在数据库或文件中。网络爬虫的应用越来越广泛,但也存在一些问题,如隐私问题、版权问题和网络安全问题等。因此,网络爬虫的使用需要遵守相关法律法规和道德规范。随
VIV-
·
2023-12-22 20:04
python
爬虫
开发语言
【RocketMQ系列九】SpringCloudStream整合RocketMQ
❤️3.
Python爬虫
专栏,系统性的学习爬虫的知识点。9.9元买不了吃亏,买不了上当。
python爬虫
入门进阶❤️4.Ceph实战,从原理到实战应有尽有。Ceph实战
码农飞哥
·
2023-12-22 20:14
RocketMQ
rocketmq
消息队列
中间件
Python爬虫
爬取图片
Python爬虫
爬取网站指定图片(多个网站综合经验结论分享)我想以这篇文章来记录自己学习过程以及经验感受,因为我也是个初学者。接下来我将分享几个我爬取过的图片网站,给大家们分享下自己的方法经验。嘿嘿!
_WJL_
·
2023-12-22 18:22
python爬虫
网易云音乐(js逆向)
目录前言接口分析整理JS代码整理python代码前言最近在学习
python爬虫
,拿网易云音乐练练手。本文章不贴js逆向分析了,不会的可以看我QQ音乐那偏文章。
oO小明.同学Oo
·
2023-12-22 17:40
python爬虫
爬虫
python
前端
python最新QQ音乐sign参数加密分析
1.前言最近正在学习
python爬虫
,刚好拿QQ音乐练手。
oO小明.同学Oo
·
2023-12-22 17:38
python爬虫
python
开发语言
爬虫
玩转 Scrapy 框架 (一):Scrapy 框架介绍及使用入门
目录一、Scrapy框架介绍二、Scrapy入门一、Scrapy框架介绍简介:Scrapy是一个基于Python开发的爬虫框架,可以说它是当前
Python爬虫
生态中最流行的爬虫框架,该框架提供了非常多爬虫的相关组件
Amo Xiang
·
2023-12-22 12:17
Scrapy
框架的使用
scrapy
python爬虫
小案例:获取B*站视频数据
嗨喽,大家好呀~这里是爱看美女的茜茜呐第三方模块:requests>>>pipinstallrequests如何安装python第三方模块:win+R输入cmd点击确定,输入安装命令pipinstall模块名(pipinstallrequests)回车在pycharm中点击Terminal(终端)输入安装命令环境介绍:python3.8解释器pycharm编辑器ffmpeg.exe更多精彩机密、教
茜茜是帅哥
·
2023-12-22 10:19
python爬虫
python
爬虫
音视频
学习
pycharm
技术泛舟 | Python开发者10篇热文
《从零开始的
Python爬虫
速成指南》本文主要内容为以最短的时间写一个最简单的爬虫,可以抓取论坛的帖子标题和帖子内容等。还没写过爬虫的萌新们可以看过来咯~《Python与Ja
路西同学
·
2023-12-22 10:37
Python爬虫
动态IP代理防止被封的方法
目录前言一、使用代理池二、使用IP轮换三、设置请求头信息总结前言随着互联网的发展,很多网站对爬虫程序进行了限制,常见的限制方式包括IP封禁、验证码识别等。为了解决这些问题,我们可以使用动态IP代理来进行爬虫,以避免被封禁。本文将介绍如何使用Python实现动态IP代理,以及防止被封禁的一些方法。一、使用代理池代理池是一种管理大量代理IP地址的工具,可以从多个渠道获取代理IP,并提供接口供爬虫程序使
卑微阿文
·
2023-12-22 07:52
python
爬虫
tcp/ip
python爬虫
---结合urllib.request与xpath下载网页图片
#网页地址:https://sc.chinaz.com/#1)请求对象的定制中#(2)获取网页的源码#(3)下载#需求:下载的前十页的图片#第一页页码和其他页码不一样#https://sc.chinaz.com/tupian/dahaitupian.html#https://sc.chinaz.com/tupian/dahaitupian_2.htmlimporturllib.requestfro
velpro_!
·
2023-12-21 21:50
python
爬虫
开发语言
Python爬虫
练习-Xpath解析批量爬取PPT
批量爬取PPT,分页爬取importosimportrequestsfromlxmlimportetreeif__name__=='__main__':#UA伪装headers={'User-Agent':'Mozilla/5.0(WindowsNT6.1;Win64;x64)AppleWebKit/537.36(KHTML,likeGecko)Chrome/92.0.4515.70Safari/
零源
·
2023-12-21 21:19
Python爬虫
爬虫
python
开发语言
Python爬虫
---解析---xpath
1.1安装xpath:点击安装Xpath1.2将安装好的程序解压,打开浏览器,找到程序扩展,把解压好的程序托进来,如下图所示:1.3设置快捷键:打开/关闭xpath1.4成功后的图例:按刚刚设置的快捷键ctrl+shift+x使用例子:在QUERY里输入xpath语法(下文有讲解),RESULTS(1)可以校验是否正确2.1安装lxml库:pipinstalllxml-ihttps://pypi.
velpro_!
·
2023-12-21 21:19
python
爬虫
开发语言
python爬虫
-网页解析beautifulSoup&XPath
前面已经了解过,爬虫具有两大难点:一是数据的获取,二是采集的速度,因为会有很多的反爬(js)措施,导致爬虫并没有想象中那么容易。在python中,我们使用requests库作为核心,谷歌浏览器的检查工具作为辅助,学习如何编写爬虫。既然我们爬取的对象是网页,那自然少不了对网页的解析这一个关键阶段。所以我们接下来将学习解析网页的python库。BeautifulSoupBeautifulSoup是一个
Hascats
·
2023-12-21 21:19
python爬虫
Jetbrains PyCharm2019 安装激活及汉化方法
Pycharm是一款很好用的python开发工具,开发
Python爬虫
和Pythonweb方面都很不错。
浮生若梦198933
·
2023-12-21 21:30
计算机毕业设计hadoop+spark+hive直播可视化分析大屏 直播推荐系统 数据仓库 体育赛事分析 足球分析 推荐系统 体育赛事推荐系统 大数据毕业设计
开发技术:selenium(
Python爬虫
)、spark、hadoop、scala、hive、sqoop、Flask、echarts、mysql分析流程:python爬取直播数据存到.csv文件、mysql
计算机毕业设计大神
·
2023-12-21 19:26
Python爬虫
教程:Selenium
模拟登录
1.引入SeleniumSelenium(本文基于python3.8)是一个功能强大的自动化测试工具,它可以用于模拟用户在浏览器中的行为,比如点击、输入、滚动等等,也可用于
模拟登录
网站并进行爬虫操作。
bagell
·
2023-12-21 18:06
python
爬虫
selenium
开发语言
学习
测试工具
人工智能
在scrapy 使用selenium
模拟登录
获取cookie
前言最近有一点点爬虫需求,想总结一下scrapy框架的一些基本使用方法,加深印象,自己一直习惯使用一些脚本文件运行爬虫,面对数据量非常大,稳定性要求比较高的,效率需求比较高的情况下还是用scrapy较为合适,scrapy是一个异步的框架,所有的请求都是阻塞的,虽然在单文件脚本中也可以实现,但是代码就非常的难看,难以维护,过了几天就会忘记复杂的流程,调试起来就非常的困难,scrapy我自己用得也不多
软件测试潇潇
·
2023-12-21 18:29
软件测试
scrapy
selenium
测试工具
软件测试
功能测试
自动化测试
程序人生
上一页
12
13
14
15
16
17
18
19
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他