年检:各地工商采集案例

深圳:利用商事主体查询公司名https://app03.szmqs.gov.cn/xyjggs.webui/xyjggs/List.aspx?view=nbxx获取年报网址所需要的参数→直接合成年报网址采集内容。例

注意事项:

深圳的接口为模糊匹配,故年检的公司名必须与搜索公司名一致。

北京:http://qyxy.baic.gov.cn/wapqyzb/wapqyzbAction!wapbsnd.dhtml?entId=ff80808160546468016057ec2eae13df

利用网址后缀的endid合成年报列表,循环采集。(只能在服务器上运行)例:

API特点:step1需更换IP;step2需手动更换最新COOKIE

年检采集思路:北京地区与其他地区不同,因年报内容页的采集需要实时的cookie

注意事项:

北京年报的URL具有时效性,个别参数会变化导致年报网址无保存价值。(下图为年报网址的三个参数,其中前两个参数固定,第三个参数随机改变)

北京年报的请求头需实时更新,cookie同样也具有时效性。过期的cookie访问无效

(由Selenium自动化完成搜索公司名完成第一步)

广州:http://cri.gz.gov.cn/Detail/AnnualReport?zch=DF23367B523674AB8459D328EA557F6A同上不做赘述

东莞:http://qyxy.dg.cn/compub/qwjs/qyxx!qyjyxx.action?qywyh=38576bb5-0159-1000-e001-1c160a0c0115

信用东莞,利用库内标准工商网址参数挨个访问年报列表。

你可能感兴趣的:(年检:各地工商采集案例)