分享72个PHP源码,总有一款适合您
下面是文件的名字,我放了一些图片,文章里不是所有的图主要是放不下...,
72个PHP源码下载链接:https://pan.baidu.com/s/11BEwLdHiZF0DqB3Bhb3FaQ?pwd=joxq
提取码:joxq
Python采集代码下载链接:采集代码.zip - 蓝奏云
import os
import shutil
import time
from time import sleep
import requests
from bs4 import BeautifulSoup
from docx import Document
from docx.shared import Inches
from framework.base.BaseFrame import BaseFrame
from sprider.business.DownLoad import DownLoad
from sprider.business.SeleniumTools import SeleniumTools
from sprider.business.SpriderTools import SpriderTools
from selenium import webdriver
from selenium.webdriver.common.by import By
from sprider.model.SpriderEntity import SpriderEntity
from sprider.access.SpriderAccess import SpriderAccess
class HuaJunCode:
base_url = "https://down.chinaz.com" # 采集的网址
save_path = "D:\\Freedom\\Sprider\\ChinaZ\\"
sprider_count = 97 # 采集数量
sprider_start_count=5396#
word_content_list = []
folder_name = ""
page_end_number=0
max_pager=15 #每页的数量
haved_sprider_count =0 # 已经采集的数量
page_count = 1 # 每个栏目开始业务content="text/html; charset=gb2312"
filter_down_file=[]
def __init__(self):
pass
progress meter for PHP (AJAX上传文件PHP源码)
OpenPNE中文 v2.12.3 中文版
UCenter Home-中秋搏饼插件 v1.2 UTF8版
UCenter Home-中秋搏饼插件 v1.2 GBK版
522QQ在线电视直播程序 v1.1
php实现msn协议的类
IP地址查询(PHP+SQLITE) v1.0
南充人开源PHP文章系统 v1.0
TVBlog P1.0 bulid 080901 Beta
Simple Directory Listing v2.1 beta1 文件管理系统
Simple Directory Listing v1.0.002 文件管理系统
ZY music! v1.1.1
PHP文章系统 v1.0
kgogoprime v1.2.0
FxAsk v1.0
站长助手(WEBMASTER HELPER) v2.0
明科在线客服系统 v6.0 for php
SQLiteManager v1.2.0
Nucleus v3.33 多国语言版
Punbb v1.2.20 多国语言版
def sprider(self,title_name="NET"):
"""
采集
PHP https://down.chinaz.com/class/572_5_1.htm
NET https://down.chinaz.com/class/572_4_1.htm
ASP https://down.chinaz.com/class/572_3_1.htm
Python https://down.chinaz.com/class/604_572_1.htm
https://down.chinaz.com/class/608_572_1.htm
微信 https://down.chinaz.com/class/610_572_1.htm
Ruby https://down.chinaz.com/class/622_572_1.htm
NodeJs https://down.chinaz.com/class/626_572_1.htm
C https://down.chinaz.com/class/594_572_1.htm
:return:
"""
if title_name == "PHP":
self.folder_name = "PHP源码"
self.second_column_name = "572_5"
elif title_name == "Go":
self.folder_name = "Go源码"
self.second_column_name = "606_572"
elif title_name == "NET":
self.folder_name = "NET源码"
self.second_column_name = "572_4"
elif title_name == "ASP":
self.folder_name = "ASP源码"
self.second_column_name = "572_3"
elif title_name == "Python":
self.folder_name = "Python源码"
self.second_column_name = "604_572"
elif title_name == "JavaScript":
self.folder_name = "JavaScript源码"
self.second_column_name = "602_572"
elif title_name == "Java":
self.folder_name = "Java源码"
self.second_column_name = "572_517"
elif title_name == "HTML":
self.folder_name = "HTML-CSS源码"
self.second_column_name = "608_572"
elif title_name == "TypeScript":
self.folder_name = "TypeScript源码"
self.second_column_name = "772_572"
elif title_name == "微信小程序":
self.folder_name = "微信小程序源码"
self.second_column_name = "610_572"
elif title_name == "Ruby":
self.folder_name = "Ruby源码"
self.second_column_name = "622_572"
elif title_name == "NodeJs":
self.folder_name = "NodeJs源码"
self.second_column_name = "626_572"
elif title_name == "C++":
self.folder_name = "C++源码"
self.second_column_name = "596_572"
elif title_name == "C":
self.folder_name = "C源码"
self.second_column_name = "594_572"
#https://down.chinaz.com/class/594_572_1.htm
first_column_name = title_name # 一级目录
self.sprider_category = title_name # 一级目录
second_folder_name = str(self.sprider_count) + "个" + self.folder_name #二级目录
self.sprider_type =second_folder_name
self.merchant=int(self.sprider_start_count) //int(self.max_pager)+1 #起始页码用于效率采集
self.file_path = self.save_path + os.sep + "Code" + os.sep + first_column_name + os.sep + second_folder_name
self.save_path = self.save_path+ os.sep + "Code" + os.sep+first_column_name+os.sep + second_folder_name+ os.sep + self.folder_name
BaseFrame().debug("开始采集ChinaZCode"+self.folder_name+"...")
sprider_url = (self.base_url + "/class/{0}_1.htm".format(self.second_column_name))
down_path="D:\\Freedom\\Sprider\\ChinaZ\\Code\\"+first_column_name+"\\"+second_folder_name+"\\Temp\\"
if os.path.exists(down_path) is True:
shutil.rmtree(down_path)
if os.path.exists(down_path) is False:
os.makedirs(down_path)
if os.path.exists(self.save_path ) is True:
shutil.rmtree(self.save_path )
if os.path.exists(self.save_path ) is False:
os.makedirs(self.save_path )
chrome_options = webdriver.ChromeOptions()
diy_prefs ={'profile.default_content_settings.popups': 0,
'download.default_directory':'{0}'.format(down_path)}
# 添加路径到selenium配置中
chrome_options.add_experimental_option('prefs', diy_prefs)
chrome_options.add_argument('--headless') #隐藏浏览器
# 实例化chrome浏览器时,关联忽略证书错误
driver = webdriver.Chrome(options=chrome_options)
driver.set_window_size(1280, 800) # 分辨率 1280*800
# driver.get方法将定位在给定的URL的网页,get接受url可以是任何网址,此处以百度为例
driver.get(sprider_url)
# content = driver.page_source
# print(content)
div_elem = driver.find_element(By.CLASS_NAME, "main") # 列表页面 核心内容
element_list = div_elem.find_elements(By.CLASS_NAME, 'item')
laster_pager_ul = driver.find_element(By.CLASS_NAME, "el-pager")
laster_pager_li =laster_pager_ul.find_elements(By.CLASS_NAME, 'number')
laster_pager_url = laster_pager_li[len(laster_pager_li) - 1]
page_end_number = int(laster_pager_url.text)
self.page_count=self.merchant
while self.page_count <= int(page_end_number): # 翻完停止
try:
if self.page_count == 1:
self.sprider_detail(driver,element_list,self.page_count,page_end_number,down_path)
pass
else:
if self.haved_sprider_count == self.sprider_count:
BaseFrame().debug("采集到达数量采集停止...")
BaseFrame().debug("开始写文章...")
self.builder_word(self.folder_name, self.word_content_list)
BaseFrame().debug("文件编写完毕,请到对应的磁盘查看word文件和下载文件!")
break
#(self.base_url + "/sort/{0}/{1}/".format(url_index, self.page_count))
#http://soft.onlinedown.net/sort/177/2/
next_url = self.base_url + "/class/{0}_{1}.htm".format(self.second_column_name, self.page_count)
driver.get(next_url)
div_elem = driver.find_element(By.CLASS_NAME, "main") # 列表页面 核心内容
element_list = div_elem.find_elements(By.CLASS_NAME, 'item')
self.sprider_detail( driver, element_list, self.page_count, page_end_number, down_path)
pass
#print(self.page_count)
self.page_count = self.page_count + 1 # 页码增加1
except Exception as e:
print("sprider()执行过程出现错误:" + str(e))
sleep(1)
PHPLOVE爱墙(仿QQ爱墙) H2008
白月文章系统整合站点之电影与软件服务站 v2.0
TURF(开源)权限管理系统 v0.1 bulid 080626 Alpha
WFUpload v2.0.2 汉化版
Twinklous File Manager v1.5
YouTube RSS 小偷
白月文章系统整合站点之水电十局站 v2.0
品告CMS系统(电影版) v0.92
读吧书网 v3.5 正式版
BossEditor Ajax 在线编辑 v1.1
Tattertools v1.1.2.1 中文版
动态Q闪字程序
织梦内容管理系统DedeCms v5.1 Build 080812 UTF-8
同城苏州PHP分类信息程序 v1.0
toolxp.cn中国奖牌数量实时显示 PHP版 build 080810
DiY-Page自定制系统 v5.2.0
TurboDbAdmin v0.2.3 中文版
TurboDbAdmin v0.2.3
白月生产企业订单管理系统GBK v2.0 Build 080807
Sablog-X v1.6 build 080806
sleep(1)
def sprider_detail(self, driver,element_list,page_count,max_page,down_path):
"""
采集明细页面
:param driver:
:param element_list:
:param page_count:
:param max_page:
:param down_path:
:return:
"""
index = 0
element_array=[]
element_length=len(element_list)
for element in element_list:
url_A_obj = element.find_element(By.CLASS_NAME, 'name-text')
next_url = url_A_obj.get_attribute("href")
coder_title = url_A_obj.get_attribute("title")
e=coder_title+"$"+ next_url
element_array.append(e)
pass
if int(self.page_count) == int(self.merchant):
self.sprider_start_index = int(self.sprider_start_count) % int(self.max_pager)
index=self.sprider_start_index
while index < element_length:
if os.path.exists(down_path) is False:
os.makedirs(down_path)
if self.haved_sprider_count == self.sprider_count:
BaseFrame().debug("采集到达数量采集停止...")
break
#element = element_list[index]
element=element_array[index]
time.sleep(1)
index = index + 1
sprider_info="正在采集第"+str(page_count)+"页的第"+str(index)+"个资源,共"+str(max_page)+"页资源"
BaseFrame().debug(sprider_info)
next_url=element.split("$")[1]
coder_title=element.split("$")[0]
# next_url = element.find_element(By.TAG_NAME, 'a').get_attribute("href")
# coder_title =element.find_element(By.TAG_NAME, 'img').get_attribute("title")
driver.get(next_url) # 请求明细页面
try:
codeEntity = SpriderEntity() # 下载过的资源不再下载
codeEntity.sprider_base_url = self.base_url
codeEntity.create_datetime = SpriderTools.get_current_datetime()
codeEntity.sprider_url = next_url
codeEntity.sprider_pic_title = coder_title
codeEntity.sprider_pic_index = str(index)
codeEntity.sprider_pager_index = page_count
codeEntity.sprider_type = self.sprider_type
if SpriderAccess().query_sprider_entity_by_urlandindex(next_url, str(index)) is None:
SpriderAccess().save_sprider(codeEntity)
else:
BaseFrame().debug(coder_title+next_url + "数据采集过因此跳过")
continue
if SeleniumTools.judeg_element_isexist(driver, "CLASS_NAME", "download-item") == 3:
driver.back()
BaseFrame().debug(coder_title+"不存在源码是soft因此跳过哦....")
continue
print("准备点击下载按钮...")
driver.find_element(By.CLASS_NAME, "download-item").click() #下载源码
sleep(1)
result,message=SpriderTools.judge_file_exist(True,240,1,down_path,"zip|rar|gz|tgz")#判断源码
if result is True:
sprider_content = [coder_title, self.save_path + os.sep +"image"+ os.sep + coder_title + ".jpg"] # 采集成功的记录
self.word_content_list.append(sprider_content) # 增加到最终的数组
self.haved_sprider_count = self.haved_sprider_count + 1
BaseFrame().debug("已经采集完成第" + str(self.haved_sprider_count) + "个")
time.sleep(1)
driver.back()
coder_title = str(coder_title).replace("/", "") #去掉windows不识别的字符
files = os.listdir(down_path)
file_name = files[0] #获取默认值
if len(self.filter_down_file)>0:
for file in files:
for filter_file in self.filter_down_file:
if str(file) in str(filter_file):
BaseFrame().error(filter_file + "文件被过滤...")
pass
else:
file_name = file
srcFile = down_path + os.sep + file_name
file_ext = os.path.splitext(srcFile)[-1]
dstFile = down_path + os.sep + coder_title + file_ext
os.rename(srcFile, dstFile)
srcFile = dstFile
dstFile = self.save_path + os.sep + coder_title + file_ext
shutil.move(srcFile, dstFile) # 移动文件
else:
files = os.listdir(down_path) # 读取目录下所有文件
coder_title = str(coder_title).replace("/", "") # 去掉windows不识别的字符
try:
if str(message)=="0个文件认定是False":
BaseFrame().error(coder_title+"文件不存在...")
shutil.rmtree(down_path) # 如果没下载完是无法删除的
pass
else:
BaseFrame().error("检测下载文件出错可能原因是等待时间不够已经超时,再等待60秒...")
time.sleep(60)
shutil.rmtree(down_path) #如果没下载完是无法删除的
#清空数组
self.filter_down_file.clear()
except Exception as e:
# 使用数组append记录文件名字 移动的时候过滤
self.builder_filter_file(files)
pass
except Exception as e:
BaseFrame().error("sprider_detail()执行过程出现错误:" + str(e))
BaseFrame().error("sprider_detail()记录下载的文件名")
# 使用数组append记录文件名字 移动的时候过滤
files = os.listdir(down_path) # 读取目录下所有文件
self.builder_filter_file(files)
if(int(page_count)==int(max_page)):
self.builder_word(self.folder_name,self.word_content_list)
BaseFrame().debug("文件编写完毕,请到对应的磁盘查看word文件和下载文件!")
MooPHP站长系列工具
非常漂亮的php+ajax许愿程序
Discuz! v6.1.0 Build 080804 简体中文版 GBK
PHPWind Forums v6.3.2 build 080730 简体中文 utf-8
PHPWind Forums v6.3.2 build 080730 繁体中文 big5
PHPWind Forums v6.3.2 build 080730 简体中文 GBK
TradeSky v1.0
网络硬盘_支持1GB文件上传和续传 v1.2 无错版
同城苏州黄页系统 v1.0
md5在线加密工具 v1.0
MooPHP之网站关键字排名小工具 v1.0
QQ邮箱编辑器 v1.0 (小小菜刀PHP版)
APJE私服发布系统 v2.0 PHP版
通达采集系统 v1.1 build 080722
牛仔IIS日志蜘蛛爬行记录分析器 v1.1
文件管理器(PHP)
EasyTalk 迷你博客 v3.2
视频建站系统Pocle v2.6 简体中文 UTF-8
视频建站系统Pocle v2.6 繁体中文 UTF-8
视频建站系统Pocle v2.6 简体中文 GBK
MooPHP之搜索引擎收录与反向链接查询小工具 v1.0
Blue Smiley Organizer v5.47
隐士网在线合婚美化版 v1.0
MooPHP之网址转换成HEX编码小工具 v1.0
ECND带提取码的网络硬盘 v0.1.0 For Discuz! v6.1.0
国外流行php流量交换系统
FavShop网店系统 v1.0
PHPDug v2.0 多国语言版
ECND网络硬盘 v0.1.0 beta
在线批量生成缩略图工具
MooPHP之Alexa查询工具 v1.0
LazyCMS内容管理系统 v1.1.0.0702
LxBlog 多用户博客个人主页系统 v6.0 Build 080701 big5
LxBlog 多用户博客个人主页系统 v6.0 Build 080701 utf-8
HDWiki(For Dz 6.1) v1.51 Build 080627 UTF-8 正式版
HDWiki(For Dz 6.1) v1.51 Build 080627 GBK 正式版
1听寻址器 v1.0
多关键字排名查询 v1.0
bo-blog简易api接口通行证 for bo-blog 2.1.0
BBBC-CMS v1.0
QQ空间最近访客查看器PHP版
VeryCMS v3.3 繁体中文版 BIG5
VeryCMS v3.3 简体中文 GBK
VeryCMS v3.3 简体中文 UFT-8
PHPSPACE社交门户 v1.0 UTF8
域名管理器 v0.1
云网互动php影视系统 v1.0.1
清松网络PHP版周公解梦查询系统 v1.20
MooPHP之WhoIS查询小工具 v1.0
MooPHP通用自定义表单系统 v1.3
buscx.cn汉字拼音五笔部首速查 v1.0
爱普达(Aipuda)多语言企业网站管理系统 v6.3.0
php版查询纯真ip数据库
非主流图片小偷 php版 build 0610
phpWebSite v1.5.2
小鬼当家音乐系统iShowMusic v1.2 Build 0610
import os
from time import sleep
import time
class SpriderTools:
__doc__ = "系统工具类"
@staticmethod
def get_word_image(business_name,max_index):
"""
获取word插图
:param business_name: 图片业务 名称
:param max_index: 最大序号
:return: 图片的路径
"""
import random
key = str(random.randint(1, int(max_index)))
random_file_name = business_name + key + ".png"
random_full_file_name = business_name+"image" + os.sep + random_file_name
return random_full_file_name
@staticmethod
def get_current_datetime():
return time.strftime('%Y-%m-%d %H:%M:%S', time.localtime(time.time()))
@staticmethod
def gen_password():
"""
网站根路径
:return:
"""
import random, string
passwds = [] # 保存符合要求的密码
count = 1
i = 0 # 记录符合要求的密码个数
while i < int(count):
passwd = set(random.sample(string.ascii_letters + string.digits, 28)) # 从字母和数字中随机抽取8位生成密码
if passwd.intersection(string.ascii_uppercase) and passwd.intersection(
string.ascii_lowercase) and passwd.intersection(string.digits): # 判断密码中是否包含大小写字母和数字
passwds.append(''.join(passwd)) # 将集合转化为字符串
i += 1 # 每生成1个符合要求的密码,i加1
return (passwds)
@staticmethod
def judge_file_exist1(is_check, check_times, check_interval_sec, check_path, check_ext):
"""
检测函数
:param is_check:是否检测True表示检测False 不检查
:param check_times:检测次数
:param check_interval:检测时间间隔(默认值)
:param check_path:检测路径(默认值)
:param chedk_ext:检测扩展名(默认值)
:return:返回真假
"""
if os.path.exists(check_path) is False:
raise Exception("路径不存在...")
if str.isdigit(str(check_times)) is False:
raise Exception("检测次数不是数字...")
if is_check is False:
return True, "不进行检测" # 直接执行下一步操作
else:
for number in range(1, int(check_times)):
print("正在进行第" + str(number) + "次检测...")
files = os.listdir(check_path) # 读取目录下所有文件
file_number = len(files)
if file_number == 0:
# 不存在任何文件,休眠一会 继续执行下一次
sleep(int(check_interval_sec)) # 休眠一会
return False, "0个文件认定是False"
elif file_number == 1:
file_name = files[0]
# crdownload
file_full_name = check_path + os.sep + file_name
file_ext = os.path.splitext(file_full_name)[-1]
if "crdownload" == str(file_ext.split(".")[1]):
sleep(int(check_interval_sec)) # 休眠一会
continue
if "tmp" == str(file_ext.split(".")[1]):
sleep(int(check_interval_sec)) # 休眠一会
continue
if "exe" == str(file_ext.split(".")[1]):
os.remove(file_full_name)
print("清理exe文件")
continue
for e in check_ext.split("|"):
if e == str(file_ext.split(".")[1]):
return True, file_full_name
else:
sleep(int(check_interval_sec)) # 休眠一会
continue
else:
# 多个文件认定是False直接执行下一步操作
for file in files:
file_ext = str(os.path.splitext(file)[-1])
if file_ext == ".rar":
os.unlink(file)
if file_ext == ".zip":
os.unlink(file)
return False, "多个文件认定是False"
return False, "可能是不存在文件或者是tmp或crdownload文件"
@staticmethod
def judge_file_exist(is_check,check_times,check_interval_sec,check_path,check_ext):
"""
检测函数
:param is_check:是否检测True表示检测False 不检查
:param check_times:检测次数
:param check_interval:检测时间间隔(默认值)
:param check_path:检测路径(默认值)
:param chedk_ext:检测扩展名(默认值)
:return:返回真假
"""
if os.path.exists(check_path) is False:
raise Exception("路径不存在...")
if str.isdigit(str(check_times)) is False:
raise Exception("检测次数不是数字...")
if is_check is False:
return True,"不进行检测" #直接执行下一步操作
else:
for number in range(1,int(check_times)):
print("正在进行第"+str(number)+"次检测...")
sleep(1) #延迟1s经常检测不到
files = os.listdir(check_path) # 读取目录下所有文件
file_number=len(files)
if file_number ==0:
#不存在任何文件,休眠一会 继续执行下一次
sleep(int(check_interval_sec)) # 休眠一会
return False, "0个文件认定是False"
elif file_number==1:
file_name=files[0]
#crdownload
file_full_name=check_path+os.sep+file_name
file_ext=os.path.splitext(file_full_name)[-1]
if "crdownload"==str(file_ext.split(".")[1]):
sleep(int(check_interval_sec)) # 休眠一会
continue
if "tmp" == str(file_ext.split(".")[1]):
sleep(int(check_interval_sec)) # 休眠一会
continue
for e in check_ext.split("|"):
if e == str(file_ext.split(".")[1]):
return True,file_full_name
else:
sleep(int(check_interval_sec)) # 休眠一会
continue
else:
#多个文件认定是False直接执行下一步操作
for file in files:
file_ext = str(os.path.splitext(file)[-1])
if file_ext==".rar":
os.unlink(file)
if file_ext==".zip":
os.unlink(file)
return False,"多个文件认定是False"
return False,"可能是不存在文件或者是tmp或crdownload文件"
最后送大家一首诗:
山高路远坑深,
大军纵横驰奔,
谁敢横刀立马?
惟有点赞加关注大军。