爬虫脚本
项目地址:https://github.com/specialtiger/spider
需要:python 2.7
原理:利用urllib2下载页面,然后正则匹配内容,将抓取的内容生成index.html
#novel_spider.py
设置github网页
spider项目设置github pages,小说网页托管给github
服务器定时生成页面
需要:服务器 or 一台一直开着的机器
将git上的代码迁出到服务器
#crontab设置
crontab -e
#每小时的第30分钟拉取一次页面数据
10 * * * * ./home/jinxiu/code/spider/gen.sh >> /home/jinxiu/log/spider.log
#设置crontab开机启动
systemctl status crond.service #查看crontab服务状态
systemctl enable crond.service #开机自启动
#gen.sh
pwd=`dirname $0`
cd $pwd
git pull origin master
./novel_spider.py
git commit -a -m "gen index html"
git push origin
创建app
这里用apicloud创建了app,主要是方便,不用部署android开发环境。
项目地址:https://github.com/specialtiger/NovelSpiderApp/tree/master
apicloud页面选择创建本地项目,生成的代码地址用svn工具签出
#修改config.html, 设置app自动更新
#修改index.html