基于python-实现仿天眼查-企查查-完整源码

基于Python开发的实现类似天眼查、企查查的企业大数据sass功能,实现了企业68多个纬度的数据聚合采集。这是一套python源码,源码是不进行任何加密,支持二次开发。
核心代码:
get_base(soup, cid, company) # #1、基本信息数据
passmethod(get_partner(soup, cid, company)) # 2、主要成员数据
passmethod(get_gudong(soup, cid, company)) # 3、股东信息数据
passmethod(get_invest(soup, cid, company)) # 4、对外投资数据
passmethod(get_shouyi(soup, cid, company)) # 5、最终受益人
passmethod(get_kongquan(soup, cid, company)) # 6、实际控权人
passmethod(get_uplog(soup, cid, company)) # 7、变更记录数据
passmethod(get_report(soup, cid, company)) # 8、公司年报数据
passmethod(get_branch(soup, cid, company)) # 9、分支机构数据
passmethod(get_court_notice(soup, cid, company)) # 10、开庭公告数据
passmethod(get_laws(soup, cid, company)) # 11、法律诉讼数据
passmethod(get_punish(soup, cid, company)) # 12、行政处罚【工商局】
passmethod(get_punish_zg(soup, cid, company)) # 13、行政处罚【信用中国】
passmethod(get_stock_right(soup, cid, company)) # 14、股权出质
passmethod(get_rongzi(soup, cid, company)) # 15、融资历史
passmethod(get_team(soup, cid, company)) # 16、核心团队
passmethod(get_yewu(soup, cid, company)) # 17、企业业务
passmethod(get_touzhi(soup, cid, company)) # 18、投资事件数据
passmethod(get_jingpin(soup, cid, company)) # 19、竞品信息数据
passmethod(get_alicb(soup, cid, company)) # 20、行政许可【工商局】
passmethod(get_alcc(soup, cid, company)) # 21、行政许可【信用中国】
passmethod(get_swlevel(soup, cid, company)) # 22、税务评级数据
passmethod(get_spotcheck(soup, cid, company)) # 23、抽查检查
passmethod(get_certificate(soup, cid, company)) # 24、资质证书数据
passmethod(get_credit(soup, cid, company)) # 25、进出口信用数据 无
passmethod(get_tlicense(soup, cid, company)) # 26、电信许可 无
passmethod(get_trademark(soup, cid, company)) # 27、商标信息
passmethod(get_zhuanli(soup, cid, company)) # 28、专利信息
passmethod(get_soft(soup, cid, company)) # 29、软件著作权
passmethod(get_pright2(soup, cid, company)) # 30、作品著作权 无
passmethod(get_site(soup, cid, company)) # 31、网站备案数据
passmethod(get_business(soup, cid, company)) # 32、历史工商信息
passmethod(get_oldGudong(soup, cid, company)) # 33、历史股东信息 无
passmethod(get_oldinvest(soup, cid, company)) # 34、历史对外投资
passmethod(get_oldcourt_notice(soup, cid, company)) # 35、历史开庭公告
passmethod(get_oldlaws(soup, cid, company)) # 36、历史法律诉讼数据
get_doer(soup, cid, company) # 37、历史被执行人信息
get_oldpunish(soup, cid, company) # 38、历史行政处罚【工商局】
get_oldstock(soup, cid, company) # 39、历史股权出质
passmethod(get_notice(soup, cid, company)) # 40、法院公告+
passmethod(get_chattel_mortgage(soup, cid, company)) # 41、动产抵押
passmethod(get_bidding(soup, cid, company)) # 42、招投标+
passmethod(get_weixin(soup, cid, company)) # 43、微信公众号
passmethod(get_old_alicb(soup, cid, company)) # 45、历史行政许可【工商局】
passmethod(get_old_alcc(soup, cid, company)) # 46、历史行政许可【信用中国】
passmethod(get_old_notice(soup, cid, company)) # 47、历史法院公告
passmethod(get_bzxr(soup, cid, company)) # 48、被执行人
passmethod(get_fayuang(soup, cid, company)) # 49、法院公告
passmethod(get_xzchuf(soup, cid, company)) # 50、行政处罚
passmethod(get_guqchuz(soup, cid, company)) # 51、股权出质
passmethod(get_ktgoga(soup, cid, company)) # 52、开庭公告
passmethod(get_zhatbiao(soup, cid, company)) # 53、招投标
passmethod(get_zpxx(soup, cid, company)) # 54、招聘信息
passmethod(get_gdxx(soup, cid, company)) # 55、购地信息
passmethod(get_jyinyc(soup, cid, company)) # 56、经营异常
get_shifpm(soup, cid, company) # 57、司法拍卖
passmethod(get_goshicg(soup, cid, company)) # 58、公示催告
passmethod(get_zjxx(soup, cid, company)) # 59、债券信息
get_docdy(soup, cid, company) # 60、动产抵押
passmethod(get_qsggao(soup, cid, company)) # 61、欠税公告
passmethod(get_shifxz(soup, cid, company)) # 62、司法协助
get_yzwf(soup, cid, company) # 63、严重违法
passmethod(get_qsxx(soup, cid, company)) # 64、清算信息
get_guqzy(soup, cid, company) # 65、股权质押
get_limitconsume(soup, cid, company) # 67、限制消费
get_sswf(soup, cid, company) # 68、税收违法

技术架构:这是一套用python3开发的企业大数据挖掘的系统源代码,这个系统框架分为爬虫端、数据库端、API服务端、接口文档。这个系统是采用全网搜索引擎聚合技术。源码直接下载到本地电脑运行即可使用。
覆盖数据纬度:这套系统内置了企业67多个纬度解析引擎,实现的数据纬度已经超过了天眼、企查查这种数据平台,通过全网引擎技术能够采集到的数据有部分要比天眼、企查查要早1年左右。因为天眼的企业手机号码一般都是企业注册满1年后采集更新出来,这个系统通过实时搜索引擎技术,时效性比较强大,刚注册的企业一般都可以匹配搜索出来联系方式。欢迎对技术感兴趣朋友加扣扣2779571288

API接口:这个系统采用了python FLask做成了异步调取的接口服务。只要开启API服务,别人就可以通过调取您的这个接口获取它需要的数据。通过这个底层的API服务,您就可以对外提供任何的应用服务了,您可以做成sass服务,也可以做成客户端软件服务。
基于python-实现仿天眼查-企查查-完整源码_第1张图片

数据库:每个纬度的数据您可以选择采集后直接保存到数据库,也可以选择不保存到数据库,直接Api形式返回json结果,其中数据库采用的是mysql5

接口文档:这个系统写有了完整的接口api文档,源码部署到您本地后,您本地就是API服务端,不依赖任何第三方。
基于python-实现仿天眼查-企查查-完整源码_第2张图片
接口使用示例:源码代码部署到自己本地电脑后,开启API服务后,您电脑就是一个一个接口服务,用户通过传递公司名字 和需要调取的模块名 就可以自由调取任何模块的数据,可以根据模块名单独调取指定模块数据,也可以同时调取多个模块数据
基于python-实现仿天眼查-企查查-完整源码_第3张图片欢迎对技术感兴趣朋友加扣扣2779571288

你可能感兴趣的:(python,爬虫,人工智能)