95个ASP其他类别源码下载链接:https://pan.baidu.com/s/1nppT6BR-RQSs1Ml2Pcddnw?pwd=1ern
提取码:1ern
Python采集代码下载链接:采集代码.zip - 蓝奏云
我的博客地址:亚丁号-知识付费平台 支付后可见 扫码付费可见
一起玩游戏私服发布网 V2.0(SqlAcc互换版)
HzexeIISManage
在线天气预报
ASP网站QQ在线咨询插件
移动时尚生活小百科小偷
移动时尚图书配套光盘小偷
import os
import shutil
import requests
from bs4 import BeautifulSoup
from framework.base.BaseFrame import BaseFrame
from sprider.access.SpriderAccess import SpriderAccess
from sprider.plugin.SpriderTools import SpriderTools
from sprider.plugin.UserAgent import UserAgent
class CNSourceCoder:
base_url = "http://www.downcode.com"
max_pager = 10 # 每页的数量 影响再次采集的起始位置.
word_image_count = 5 # word插入图片数量 同时也是明细采集图片和描述的数量
page_end_number = 0
word_content_list = []
haved_sprider_count = 0 # 已经采集的数量
sprider_detail_index = 0 # 明细方法采集的数量 累加
MiniAccess Editor V1.0 P2(Access 脚本编写器)
ASP木马自动检测系统(试用版)
广西8U8影视中心
14个动易插件打包下载
求职建站直通车
心影瞬间 ASP探针 V04.06
西狐网址大全加强版
168169上网导航正式完整商业版{生成Html
IP详细地址查询系统
56770旅游区
邮政编码电话区号查询Web版V1.0
火车时刻表查询Web版V 1.0
火车时刻查询
Contnew CMS Release V1.0
品泡女人香 XI8.NET V2.0
2970.Com整站
Asp Template V1.0
怪叟网络硬盘
成语接龙比赛系统
忆风天气小偷
雅典奥运会专题(随时更新,免维护)
微软社区开发包Community Starter Kit中文版
带几十万数据库的成语查询系统
缘儿求爱复刻版
IT学习者ASP探针 V1.2
QYMANAGER(企业管理者) V1.0
正则表达式测试器 V1.0
中国娱乐通网页文件生成器
OK云南多语言网站系统 Okyn2004 V4.15(免费版)
商海桥天气预报程序
随意居ASP探针 V1.0
腾讯QQ表情小偷 异域版
思易ASP木马追捕 V1.1
def sprider(self,sprider_name,sprider_count,start_number,
pager_number,sprider_type,is_show_browse,root_path,
first_column_name,second_column_name,is_record_db):
"""
http://www.downcode.com/sort/j_1_2_1.shtml
:param sprider_name:
:return:
"""
self.first_folder_name=sprider_type.upper()
self.base_path=root_path
self.first_column_name = first_column_name
self.second_column_name = second_column_name
self.sprider_start_count=start_number
self.is_record_db=is_record_db
BaseFrame().debug("开始采集[源码下载站]" + self.first_folder_name + "源码...")
BaseFrame().right("本次采集参数:sprider_count(采集数量):" + str(sprider_count) + "")
BaseFrame().right("本次采集参数:sprider_name(采集名称):" + sprider_name + "")
sprider_url = self.base_url + "/{0}/{1}_1.shtml".format(self.first_column_name, self.second_column_name)# 根据栏目构建URL
BaseFrame().debug("本次采集参数:sprider_url:" + sprider_url)
self.second_folder_name = str(sprider_count) + "个" + sprider_name # 二级目录也是wordTitle
self.merchant = int(self.sprider_start_count) // int(self.max_pager) + 1 # 起始页码用于效率采集
self.file_path = self.base_path + os.sep + self.first_folder_name + os.sep + self.second_folder_name
BaseFrame().right("本次采集参数:file_path=" + self.file_path + "")
# 浏览器的下载路径
self.down_path = self.base_path + os.sep + self.first_folder_name+ os.sep + self.second_folder_name+ "\\Temp\\"
BaseFrame().right("本次采集参数:down_path=" + self.down_path + "")
# First/PPT/88个动态PPT模板/动态PPT模板
self.save_path = self.base_path + os.sep + self.first_folder_name + os.sep + self.second_folder_name + os.sep + sprider_name
BaseFrame().right("本次采集参数:save_path=" + self.save_path + "")
if os.path.exists(self.down_path) is True:
shutil.rmtree(self.down_path)
if os.path.exists(self.down_path) is False:
os.makedirs(self.down_path)
if os.path.exists(self.save_path) is True:
shutil.rmtree(self.save_path)
if os.path.exists(self.save_path) is False:
os.makedirs(self.save_path)
response = requests.get(sprider_url, timeout=10, headers=UserAgent().get_random_header(self.base_url))
response.encoding = 'gb2312'
soup = BeautifulSoup(response.text, "html5lib")
#print(soup)
element_list = soup.find_all('div', attrs={"class": 'j_text_sort_a'})
page_end_number = 1
page_end_url = ""
page_end_title = soup.find("a", attrs={"title": '最后页'})
page_end_url = page_end_title.get("href")
if page_end_url is None or page_end_url == "":
page_end_number = 1
else:
page_end_number = (page_end_url.split(".shtml")[0].split("_")[3])
self.page_count = self.merchant
while self.page_count <= int(page_end_number): # 翻完停止
try:
if self.page_count == 1:
self.sprider_detail(element_list, page_end_number,sprider_count)
pass
else:
if int(self.haved_sprider_count) == int(sprider_count):
BaseFrame().debug("sprider采集到达数量采集停止...")
BaseFrame().debug("开始写文章...")
SpriderTools.builder_word(self.second_folder_name,
self.word_content_list,
self.file_path,
self.word_image_count,
self.first_folder_name)
SpriderTools.copy_file(self.word_content_list,
self.save_path,
self.second_folder_name,
self.file_path)
SpriderTools.gen_passandtxt(self.second_folder_name, self.word_content_list, self.file_path)
BaseFrame().debug("文件编写完毕,请到对应的磁盘查看word文件和下载文件!")
break
next_url = self.base_url + "/{0}/{1}_{2}.shtml".format(self.first_column_name,
self.second_column_name,
self.page_count)
response = requests.get(next_url, timeout=10, headers=UserAgent().get_random_header(self.base_url))
response.encoding = 'gb2312'
soup = BeautifulSoup(response.text, "html5lib")
element_list = soup.find_all('div', attrs={"class": 'j_text_sort_a'})
self.sprider_detail(element_list, page_end_number,sprider_count)
pass
self.page_count = self.page_count + 1 # 页码增加1
except Exception as e:
BaseFrame().error("sprider()执行过程出现错误:" + str(e))
ASP页面生成系统 V1.0
射日联盟自助建站系统
网墓程序单用户版
ASP探针(AspCheck) V1.1
Alexa信息小偷
动力在线IP地址与手机号码查询 V2.0
网墓程序之母亲安息 V1.0
ASP站长助手 V5.0
SOOP Portal完全汉化修改版
CMS10免费QQ插件
碧雪环境变量探针
在线修复系统
WEB在线管理系统CooSel V1.5 B3 升级补丁
思高网站HTML生成器 CycooMakeHtm
EWebSoft在线文本编辑器 V2.1.6 免费版
ASP站长助手 V4.0 功能增强版
中国秀手机之家手机原产地查询
复制网页特效 V2.0
情缘在线首页
Patron Saint Supply V1.0.0
阳春娱乐网-快捷方式(网址)
丁书记课件系统 Sovim修改版
MySQLAdmin V1.1
淮南设计 QQ在线显示面板
自动生成Html页的源代码
88638.COM专业足球资讯网
80秀精品素材栏目
张家口博菲网网吧联盟
林凡美化版 Asp 探针 V1.0
中国视觉网站测评系统(无错版12-28日修改)1.0
网友软件自动发布程序
COCOON ASP 探针 V2.8.00
ASP RunCode SCR V1.0(运行ASP代码)
ASP网络编程协会 V1.1 测试版
三维网在线自测系统 V2.1
ASP网络协会 V1.0 正式版
龙江风采电脑福利彩票P62选号机
毅仔数据库批量修改工具 V2.0
珠海机构名录网
Jk论坛插件
中国视觉网站测评品网系统精美版
天空软件站软件小偷 V1.0
IWebReport2000(Web报表)
IWebOffice2000(OCX版)
霓虹网上工具箱 V1.0
COCOON ASP系统探针 V2.7.00
E灵通考试系统 V4.0(包括补丁)
龙江汽车网新车价格查询
索引吧 V1.0(网址导航站)
回收站ASP探针 V1.0
一心在线投稿系统
因扎吉ASP探针 V1.7
驿城游戏网
邮编区号查询系统
纯真设计天空CZ V2.0
纯真设计天空CZ V2.0 有声版文件
最后送大家一首诗:
山高路远坑深,
大军纵横驰奔,
谁敢横刀立马?
惟有点赞加关注大军。