爬虫学习心得(一)


    之前没有开发经验,这次完全通过学长的帮助。所以,记录一下遇到的问题和开发过程,以便日后查看

 

目录

readme.txt的配置。

app.pro调度文件的配置

pom.txt文件的配置


 

readme.txt的配置。

1.作者

2.抓取频道的配置

3.现在默认不再采集评论,所以采集评论选项为否。


app.pro调度文件的配置



1.appname是否正确

2.调度周期(scheduleInterval)没有特殊说明,则不需要配置。

3.app路径实现路口一定要指定到源码的main类,这一步很重要。

例子:com.公司名.爬虫.应用.应用名.mian类

pom.txt文件的配置

1.

<groupId>com.公司名groupId>

<artifactId>newsappcrawler-app中文拼音artifactId>

<version>1.0version>

 

2.

package包名设置成com.公司名.newsappcrawler.apps.{appname}

3.

该爬取文件为maven项目,maven项目指定唯一依赖,要是添加其他依赖,文件部署运行可能会出现问题。

        

            com.founder

            newsappcrawler-baseapp

            1.0

        

    

4.

由于使用的eclipse,貌似没有一键将所有依赖和源码打包的选项,所以需要maven插件,打包的pom代码如下,会在target文件下生成jar-with-dependencies的后缀jar文件。

        

            

                maven-assembly-plugin

                2.5.5

                 

                                          

                        

                      com.公司名.newsappcrawler.apps.AppCrawlerTest.Main                                             

                                             

                    

                    

                        jar-with-dependencies

                    

                

            

        

    

以上就是pom readme app.proprity文件的配置了。

你可能感兴趣的:(实习,java,xml,json)