原文地址:http://javaz.cn/site/javaz/site_study/info/2015/23747.html
项目地址:http://www.freeteam.cn/
数据库信息采集
从FreeCMS 2.1开始支持
通过简单配置即可抓取目标数据库信息,支持增量式采集、关键字替换、定时采集,可采集多种信息属性,可自动审核且静态化信息页面。
采集规则管理
从左侧管理菜单点击采集规则进入。
添加采集规则
在采集规则列表下方点击"添加"按钮。
填写相关属性后点击"保存"按钮即可。
采集规则属性说明
采集规则属性分为基本、设置、关键词替换。
一般情况下只要在基本选项卡填写相关属性即可完成。如果需要更多高级设置可以使用后面几个选项卡。
下面针对主要属性进行解释说明。
名称:采集规则的名称。
采集到栏目:采集的信息要添加到那个栏目。
采集调度:设置定时执行采集操作,这个设置非常重要,只有设置了采集调度系统才执行采集操作。
数据库类型:支持mysql,mssql,oracle.
IP地址或者服务器名:目标数据库的地址。
服务器端口:目标服务器提供数据库服务的端口,mysql默认为3306,mssql默认为1433,oracle默认为1521。
登录账号:登录目标数据库的用户名。
登录密码:登录目标数据库的密码。
采集数据库名称:目标数据库的名称。
采集表名称:设置好上面的属性后系统会自动连接目标数据库,并且把表和视图的名称提取出来显示在采集表名称下拉列表中,如果没有提取出数据,说明数据库配置有问题,需要检查数据库配置。
主键字段名称:设置后采集表后,系统会自动提取这个表下的字段。主键字段是为了让系统判断此条数据是否已采集过。
排序字段名称:查询数据时使用的排序字段。
排序类型:根据排序字段正序或倒序查询。
Where条件语句:可以增加查询条件过滤提取内容,在这里不需要填写where关键字,系统会自动添加。
信息属性字段:可以设置各信息属性对应目标表中那个字段,可设置标题、内容、摘要、点击量、作者、来源、添加时间。
状态:启用状态下的采集规则,系统才会执行。
自动审核通过:将采集的信息直接设置为已审核状态。
使用采集信息点击量:默认采集到的信息的点击量为0,设置此属性和内容点击量开始结束html后系统会截取目标信息的点击量,设置为采集后信息的点击量。
最多采集内容数:默认不限制,如果设置了此属性,系统会从采集记录中统计此采集规则已采集了多少条信息,如果超过最多采集内容数,系统将不再采集。
将首幅图片设为标题图片:如果信息内容中有图片,则提取第一张做为标题图片,并设置信息为图片信息。
清除内容中的html标签:将信息内容中的html标签清除,保留纯文本。
当内容为空时是否采集:可设置在内容为空时不采集此信息。
使用采集信息的添加时间:默认采集到的信息的添加时间为当前时间,设置此属性和内容添加时间开始结束html后系统会截取目标信息的添加时间,设置为采集后信息的添加时间。
采集信息添加时间格式:默认格式为yyyy-MM-dd,如果目标页面的添加时间格式不同,需要在这里设置为正确的日期格式。
采集开始时间:默认为当前时间,如果不到采集开始时间,系统是不会采集的。
采集结束时间:默认为永不结束,如果超过采集结束时间,系统是不会采集的。
通过关键词替换功能,您可以将采集到的信息里面的关键词替换为自己想要的关键词。
编辑采集规则
选择需要编辑的采集规则,然后点击"编辑"按钮。
注意:同时只能编辑一个采集规则。
填写相关属性后点击"保存"按钮即可。
采集
选择需要采集的采集规则,然后点击"采集"按钮。
注意:同时只能对一个采集规则进行采集操作。
删除采集规则
选择需要删除的采集规则,然后点击"删除"按钮。
提示:同时可以删除多个采集规则。
为了防止误操作,系统会提示用户是否删除,点击"确定"完成删除操作。
查看采集记录
从左侧管理菜单点击采集记录进入。
在这里可以查看到所有数据库采集记录,您可以删除指定的采集记录,但并不会删除已采集的信息数据,选择需要删除的采集记录,然后点击"删除"按钮。
提示:同时可以删除多个采集记录。
为了防止误操作,系统会提示用户是否删除,点击"确定"完成删除操作。