Python爬虫学了几个月感觉没用?过来人的经验总结收好!

前几天有刷到一个提问:爬虫学了几个月了却还是不敢上手去接单,爬虫接单靠不靠谱?

有些新手心里会犯嘀咕,怕不小心就踩了红线。作为过来人也接过不少单,来浅聊一下我的经验。

这篇所说的经验总结可能更适合爬虫新手,爬虫大佬可以忽略。

此篇小结

  • Python爬虫学到怎么样可以接单?
  • 可爬与不可爬的问题
  • 哪里接单?
  • 什么单不接?
  • 注意事项
    Python爬虫学了几个月感觉没用?过来人的经验总结收好!_第1张图片

一、Python爬虫学到怎么样可以接单?

想要上手爬虫,基本知识和工具的熟练使用是必须要具备的;

首先Python的一些语言基础肯定要有,爬虫大部分是用python写的,基本的语法、数据结构、函数等要熟练。

比如:

  • List dict:用来序列化你爬的东西
  • 切片:用来对爬取的内容进行分割、生成
  • 条件判断(if等):用来解决爬虫过程中哪些要哪些不要的问题
  • 循环和迭代(for while):用来循环、重复爬虫动作
  • 文件读写操作:用来读取参数、保存趴下来的内容等

其次Python爬虫主要用到的库就是request库,这个库是必须要学习的,获取到的数据还需要你自行处理,通过数据筛选规则,正则表达式等等技术进行筛选。

还有就是知道如何应付反爬;现在很多网站都开发了属于自己的反爬机制,所以一些常见的反爬措施是需要学习掌握的,否则无法顺利爬取到想要的数据。

需要补充学习的部分:

  • 大致了解网络协议:HTTP/HTTPS 协议、tcp-ip协议;
  • 了解HTML 、CSS、等前端基础;
  • 理解网站的POST GET的一些相关概念,JS的一些基本内容,方便理解动态网页。

总结一下:

想要自己写一个Python爬虫程序,必须学会Python基础,包括环境安装、基础语法、字典、正则匹配、还有一些数据处理技术等等。

其次就是模拟请求的库request以及解析库的使用,还有一些反爬技术和前端基础。

二、关于爬虫可爬与不可爬的问题

其实我们生活中几乎每天都在爬虫应用,如百度,你在百度中搜索到的内容几乎都是爬虫采集下来的,(百度自营的产品除外,如百度知道、百科等)。

网络爬虫作为一门技术,技术本身是不违法的。

但是!记住重点!也不是网站的所有内容想爬就爬!随便你爬的!

以下情况需要注意,爬虫有可能违法:

(1)爬虫程序规避网站经营者设置的反爬虫措施或者破解服务器防抓取措施,也就是非法获取相关信息。

(2)爬取网上公开信息不犯法,但如果大量开启爬虫导致对方服务器崩溃,这属于暴力攻击的范畴了,肯定不可以的。

(3)爬虫采集的信息属于公民个人信息,不能涉及到个人的隐私问题,如果涉及了并通过非法途径收益了,那肯定是违法行为咯。

所以在接单的时候保持适当的严谨是有必要的,哪些单子能接,哪些不能接自己心里得有个判断和分寸。

不要为一些明显是做灰黑产的人或者公司写代码,最好的避免违法的办法就是明显觉得不太好的事情就不要去碰,不要抱侥幸心理。

Python爬虫学了几个月感觉没用?过来人的经验总结收好!_第2张图片

三、如何接单

(1)怎么接单?

一般而言,对于刚刚开始接单的人而言,很难接到大单,基本上都是一些比较小的单。

但是没有关系啊,正好可以练手!

这些小单是可以提供一个很好的锻炼以及实践的机会,所以不要害怕接。

接单新手基本上接的都是网络爬虫、数据分析等这类的单,当然也可能有一些自动化运维之类的,但是都比较少。

个人做的话不太建议去抢一些几千元一个的项目,难度比较大,交付时间又紧,有些还是团对作战在抢单,这类单子要做的话难度高。

一般我们向甲方提供爬虫、数据分析、数据清洗这样的服务。

一开始也不要想着一口塞进个包子,慢慢来,等到技术提升之后可以去接一些开发之类的活,像APP开发、小程序开发都是几千的单子。

通过接单平台赚外快是个直接快速的方法,不同的任务需求难度不同,报酬在一两百、几千上万都有,具体能赚多少,看自己的技术水平。

接单报价方式:

简单公式:项目工时*日薪+紧急程度+报价

小tip:记得留个bug,防止不给尾款;

(2)什么单不接?

接单的时候自己掂量一下,有的单不建议接,因为可能对你没有太大的好处。

加急单不接!

程序在写的时候你也不会清楚会遇到什么样的问题,可能你需要调试好久,调试也需要不少时间,最后做出来客户会不会满意也是个未知数,因此不建议接急单。

不给定金的单不接!

定金很重要,一般会要10%左右的总金额最为定金吧,可能因人而异,但是建议是需要给定金的。

私人单尽量少接!

因为风险大,正规平台的单相对安全一些,也不是说完全不要接,熟人介绍的有保障的还是可以接,只是说要谨慎,一般陌生私人的单我是不接的。

不接繁杂的单!

有些单看上去很简单,但实际上要操作的东西很多,这样的单很耗时间,但是又不会有太多的报酬,比较浪费时间。就是钱少事多,这样的单一定要了解清楚再接。

(3)注意事项

1)文明爬虫,不做违法的爬虫!(重点)

2)接单时谨慎,避免被骗!(重点)

3)价钱一定要事先谈好(搞清楚客户所说的价格是税后价格还是税前价格),然后再开始做;

4)没有金刚钻,就别揽瓷器活,接单一定要在自己能力范围内接;

5)在边学边接单的时候,要注意时间,不能按时完工的单还是不要接;

6)需求和要求一定要在做之前跟客户沟通好,了解清楚之后再做;

7)对于大项目,可以请求客户先付一部分押金,时间最好跟客户沟通一下留有时间余地,程序修改也很费时间。

8)如果客户让你报价,要适当合理的综合考虑代码复杂程度、完成所需要的时间等等多种因素;

9)好好检查你自己的代码和一些操作的算法实现的过程是不是完全正确的,千万不要犯低级的错误,否则会影响顾客对你的评价的。

如果你也想通过python做副业兼职赚钱的话,可以试试我的这份Python学习资料哦!希望可以帮到你们。

关于python技术储备

想赚钱学好技术才是重点,学习 Python 不论是就业还是做副业都很不错。那么,对于新手小白,应该如何学习python呢?这里我免费给大家分享一份全套python学习资料,都是我自己学习python时收集的,希望能给想学习python的小伙伴们一点帮助!

一、Python所有方向的学习路线

Python所有方向路线就是把Python常用的技术点做整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。
在这里插入图片描述

二、Python学习软件

工欲善其事,必先利其器。学习Python常用的开发软件都在这里了,给大家节省了很多时间。
在这里插入图片描述

三、Python入门学习视频

我们在看视频学习的时候,不能光动眼动脑不动手,比较科学的学习方法是在理解之后运用它们,这时候练手项目就很适合了。
在这里插入图片描述

四、Python实战案例

光学理论是没用的,要学会跟着一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
在这里插入图片描述

五、Python面试资料

我们学习Python必然是为了找到高薪的工作,下面这些面试题是来自阿里、腾讯、字节等一线互联网大厂最新的面试资料,并且有阿里大佬给出了权威的解答,刷完这一套面试资料相信大家都能找到满意的工作。
在这里插入图片描述
在这里插入图片描述
需要的小伙伴可自行微信扫描下方CSDN官方认证二维码免费领取!!

你可能感兴趣的:(python,爬虫,开发语言)