【技术笔记】阅读开源的工程代码,先从哪些地方入手

先说个人的结论,阅读开源的工程代码,先要想办法入手到这三个点

1、数据模型

    数据模型其实是对方工程对概念的一个抽象定义,另外经常会

2、外部接口

    从接口,可以看工程提供的能力和交互

3、主逻辑流程

    a)流程逻辑有哪些

    b)如何驱动的

我拿开源的一个爬虫框架webmagic举例

https://github.com/code4craft/webmagic

这里的数据模型

    us.codecraft.webmagic.Site.java

外部接口,这里有示例工程,有段代码

    OOSpider.create(Site.me(), clazzMap.get(key)).addUrl(urlMap.get(key)).addPipeline(new MultiPagePipeline()).addPipeline(new ConsolePipeline()).runAsync();

    这里的create输入是要爬取的url,pipeline是输出的位置,ConsolePipeline是控制台

 

 

未完待续。。

你可能感兴趣的:(学习笔记)