java爬虫和python爬虫的区别

java爬虫与python爬虫的对比:

python做爬虫语法更简单,代码更简洁。java的语法比python严格,而且代码也更复杂

示例如下:

url请求:

java版的代码如下:

public String call (String url){

            String content = "";

            BufferedReader in = null;

            try{

                URL realUrl = new URL(url);

                URLConnection connection = realUrl.openConnection();

                connection.connect();

                in = new BufferedReader(new InputStreamReader(connection.getInputStream(),"gbk"));

                String line ;

                while ((line = in.readLine()) != null){

                    content += line + "\n";

                }

            }catch (Exception e){

                e.printStackTrace();

            }

            finally{

                try{

                    if (in != null){

                        in.close();

                    }

                }catch(Exception e2){

                    e2.printStackTrace();

                }

            }

            return content;

        }

python版的代码如下:

# coding=utf-8

import chardet

import urllib2

url = "http://www.baidu.com"

data = (urllib2.urlopen(url)).read()

charset = chardet.detect(data)

code = charset['encoding']

content = str(data).decode(code, 'ignore').encode('utf8')

print content

正则表达式

java版的代码如下:

public String call(String content) throws Exception {

            Pattern p = Pattern.compile("content\":\".*?\"");

            Matcher match = p.matcher(content);

            StringBuilder sb = new StringBuilder();

            String tmp;

            while (match.find()){

                tmp = match.group();

                tmp = tmp.replaceAll("\"", "");

                tmp = tmp.replace("content:", "");

                tmp = tmp.replaceAll("<.*>", "");

                sb.append(tmp + "\n");

            }

            String comment = sb.toString();

            return comment;

        }

    }

python的代码如下:

import repattern = re.compile(正则)

group = pattern.findall(字符串)

如果是初学python爬虫,觉得自学比较难的,那么我接下来分享的这全套 Python 学习资料一定不要错过,希望能给那些想学习 Python 的小伙伴们带来帮助!

python学习路线

环境搭建

使用 Python 首先需要搭建 Python 环境,我们直接到 Python 官网 下载自己对应平台和版本的安装包进行安装即可

python开发工具

俗话说:工欲善其事,必先利其器,Python 的学习也是一样,新手建议首选 PyCharm,可以快速上手,减少配置时间。

学习软件

工欲善其事必先利其器。学习Python常用的开发软件都在这里了,给大家节省了很多时间。

全套PDF电子书

书籍的好处就在于权威和体系健全,刚开始学习的时候你可以只看视频或者听某个人讲课,但等你学完之后,你觉得你掌握了,这时候建议还是得去看一下书籍,看权威技术书籍也是每个程序员必经之路。

在这里插入图片描述

入门学习视频

我们在看视频学习的时候,不能光动眼动脑不动手,比较科学的学习方法是在理解之后运用它们,这时候练手项目就很适合了。

实战案例

光学理论是没用的,要学会跟着一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。

五、清华编程大佬出品《漫画看学Python》

用通俗易懂的漫画,来教你学习Python,让你更容易记住,并且不会枯燥乏味。

在这里插入图片描述
配套600集视频:

在这里插入图片描述

六、面试资料

我们学习Python必然是为了找到高薪的工作,下面这些面试题是来自阿里、腾讯、字节等一线互联网大厂最新的面试资料,并且有阿里大佬给出了权威的解答,刷完这一套面试资料相信大家都能找到满意的工作。



上面这份完整版的Python全套学习资料已经上传至CSDN官方,朋友如果需要可以直接点击CSDN官方认证二维码免费领取【保证100%免费】。

你可能感兴趣的:(python,java,爬虫)