php抓取proxycn.com数据并使用代理下载cnet软件刷下载量

由于工作需要最近写了一个php抓取proxycn.com数据并使用代理下载cnet软件刷下载量的小工具.

1、抓取代理中国代理列表数据

 
          set_time_limit(0);  
         
          /**  
         
          * @param $url   要抓取的链接地址  
         
          * @param $file  写入数据的文件名  
         
          * @return  ''  
         
          */ 
         
          function 
          FetchProxyCn( 
          $url 
          ,  
          $file 
          )  
         
          {  
         
          if 
          (! 
          empty 
          ( 
          $url 
          ))  
         
          {  
         
          $html 
          =  
          file_get_contents 
          ( 
          $url 
          );  
         
          preg_match( 
          '/<td background="img\/table_4.gif">(.*?)<td background="img\/table_5.gif">/isU' 
          ,  
          $html 
          ,  
          $list 
          );  
         
          //echo $list[1];  
         
          preg_match( 
          '/<script language="JavaScript">(.*?)<\/script>/isU' 
          ,  
          $list 
          [1],  
          $iport 
          );  
         
          $str 
          =  
          str_replace 
          ( 
          '</SCRIPT>' 
          , 
          '{SCRIPT}' 
          , 
          $iport 
          [1]);  
         
          $str 
          =  
          explode 
          ( 
          '{SCRIPT}' 
          , 
          $str 
          );  
         
          unset( 
          $str 
          [0]);  
         
          unset( 
          $str 
          [ 
          count 
          ( 
          $str 
          )]);  
         
          $str 
          =  
          array_values 
          ( 
          $str 
          );  
         
          for 
          ( 
          $i 
          = 0; 
          $i 
          <  
          count 
          ( 
          $str 
          );  
          $i 
          ++)  
         
          {  
         
          preg_match( 
          "/<TD class=\"list\">(\d{1,4})<\/TD>/isU" 
          ,  
          $str 
          [ 
          $i 
          ],  
          $port 
          );  
         
          $port 
          =  
          $port 
          [1];  
         
          preg_match( 
          "/whois=(.*) /" 
          , 
          $str 
          [ 
          $i 
          ], 
          $ip 
          );  
         
          $ip 
          =  
          $ip 
          [1];  
         
          preg_match( 
          "/HTTP<\/TD><TD class=\"list\">(.*?)<\/TD>/is" 
          ,  
          $str 
          [ 
          $i 
          ],  
          $area 
          );  
         
          $area 
          =  
          $area 
          [1];  
         
          $string 
          =  
          $ip 
          . 
          ':' 
          . 
          $port 
          . 
          ':' 
          . 
          $area 
          . 
          "\r\n" 
          ;  
         
          wfile( 
          $file 
          ,  
          $string 
          ,  
          'a' 
          );  
         
          }  
         
          }  
         
          }  
         
          /**  
         
          * 写文件  
         
          * @param    string  $file   文件路径  
         
          * @param    string  $str    写入内容  
         
          * @param    char    $mode   写入模式  
         
          */ 
         
          function 
          wfile( 
          $file 
          , 
          $str 
          , 
          $mode 
          = 
          'w' 
          )  
         
          {  
         
          $oldmask 
          = @umask(0);  
         
          $fp 
          = @ 
          fopen 
          ( 
          $file 
          , 
          $mode 
          );  
         
          @ 
          flock 
          ( 
          $fp 
          , 3);  
         
          if 
          (! 
          $fp 
          )  
         
          {  
         
          Return false;  
         
          }  
         
          else 
         
          {  
         
          @fwrite( 
          $fp 
          , 
          $str 
          );  
         
          @fclose( 
          $fp 
          );  
         
          @umask( 
          $oldmask 
          );  
         
          Return true;  
         
          }  
         
          }  
         
          $file 
          =  
          'proxycn.txt' 
          ;  
         
          if 
          (! 
          file_exists 
          ( 
          $file 
          ))  
         
          {  
         
          for 
          ( 
          $i 
          = 1;  
          $i 
          <= 116;  
          $i 
          ++)  
         
          {  
         
          $url 
          =  
          "http://www.proxycn.com/html_proxy/http-$i.html" 
          ;  
         
          FetchProxyCn( 
          $url 
          ,  
          $file 
          );  
         
          }  
         
          } 
          else 
          {  
         
          $ctime 
          =  
          filectime 
          ( 
          $file 
          );  
         
          $now 
          = time();  
         
          $timediff 
          =  
          $now 
          -  
          $ctime 
          ;  
         
          if 
          ( 
          $timediff 
          > 1)  
         
          {  
         
          unlink( 
          $file 
          );  
         
          for 
          ( 
          $i 
          = 1;  
          $i 
          <= 116;  
          $i 
          ++)  
         
          {  
         
          $url 
          =  
          "http://www.proxycn.com/html_proxy/http-$i.html" 
          ;  
         
          FetchProxyCn( 
          $url 
          ,  
          $file 
          );  
         
          }  
         
          }  
         
          }

保存代码为proxycn.php, 这段代码会抓取代理中国列表数据并且在当前目录生成名为proxycn.txt的文本文件,格式为

IP:Port:地区

2、抓取cnet页面内容,分析得到最终下载链接.

 
          header( 
          "Expires: Mon, 26 Jul 1970 05:00:00 GMT" 
          );  
         
          header( 
          "Last-Modified: " 
          .  
          gmdate 
          ( 
          "D, d M Y H:i:s" 
          ) .  
          " GMT" 
          );  
         
          header( 
          "Cache-Control: no-cache, must-revalidate" 
          );  
         
          header( 
          "Pragma: no-cache" 
          );  
         
          $ip 
          =  
          $_SERVER 
          [ 
          "REMOTE_ADDR" 
          ];  
         
          $product_name 
          =  
          $_GET 
          [ 
          'product_name' 
          ];  
         
          $product_url 
          =  
          $_GET 
          [ 
          'product_url' 
          ];  
         
          $time 
          =  
          $_GET 
          [ 
          'time' 
          ];  
         
          $proxy 
          =  
          $_GET 
          [ 
          'proxy' 
          ];  
         
          $type 
          =  
          $_GET 
          [ 
          'type' 
          ];   
          // $type == 1 开启代理否者关闭代理  
         
          $file_name 
          =  
          $product_name 
          . 
          '.txt' 
          ;  
         
          if 
          ( 
          file_exists 
          ( 
          $file_name 
          ))  
         
          {  
         
          unlink( 
          $file_name 
          );  
         
          }  
         
          /**  
         
          * Curl设置代理访问网页  
         
          * @param   sting   $url         需要通过代理访问的URL  
         
          * @param   string  $user_agent  浏览器头  
         
          * @param   string  $proxy       代理地址  
         
          */ 
         
          function 
          curl_string ( 
          $url 
          , 
          $user_agent 
          , 
          $proxy 
          )  
         
          {  
         
          $ch 
          = curl_init();  
         
          curl_setopt ( 
          $ch 
          , CURLOPT_PROXY,  
          $proxy 
          );  
         
          curl_setopt ( 
          $ch 
          , CURLOPT_URL,  
          $url 
          );  
         
          curl_setopt ( 
          $ch 
          , CURLOPT_USERAGENT,  
          $user_agent 
          );  
         
          curl_setopt ( 
          $ch 
          , CURLOPT_COOKIEJAR,  
          "c:\cookie.txt" 
          );  
         
          curl_setopt ( 
          $ch 
          , CURLOPT_HEADER, 1);  
         
          curl_setopt ( 
          $ch 
          , CURLOPT_RETURNTRANSFER, 1);  
         
          curl_setopt ( 
          $ch 
          , CURLOPT_FOLLOWLOCATION, 1);  
         
          curl_setopt ( 
          $ch 
          , CURLOPT_TIMEOUT, 120);  
         
          $result 
          = curl_exec ( 
          $ch 
          );  
         
          curl_close( 
          $ch 
          );  
         
          return 
          $result 
          ;  
         
          }  
         
          define( 
          'BAIDU_URL' 
          , 
          $product_url 
          );  
         
          if 
          (! 
          empty 
          ( 
          $product_name 
          ) && ! 
          empty 
          ( 
          $product_url 
          ))  
         
          {  
         
          // 开启代理访问  
         
          if 
          ( 
          $type 
          == 1 && ! 
          empty 
          ( 
          $proxy 
          ))  
         
          {  
         
          $user_agent 
          =  
          "Mozilla/4.0" 
          ;  
         
          $stringHtmlContent 
          = curl_string(BAIDU_URL, 
          $user_agent 
          , 
          $proxy 
          );  
         
          if 
          ( 
          empty 
          ( 
          $stringHtmlContent 
          ))  
         
          {  
         
          if 
          ( 
          file_exists 
          ( 
          $file_name 
          ))  
         
          {  
         
          unlink( 
          $file_name 
          );  
         
          }  
         
          exit 
          ( 
          '代理连接失败' 
          );  
         
          }  
         
          } 
          else 
          {  
         
          //不使用代理访问  
         
          $stringHtmlContent 
          =  
          file_get_contents 
          (BAIDU_URL);  
         
          }  
         
          preg_match( 
          "/<div class=\"dlText\">(.*?)<span class=\"dlSpywareFree\">/is" 
          , 
          $stringHtmlContent 
          , 
          $arrayHtmlContent 
          );  
         
          preg_match_all( 
          "/href=\"([^\"]+)/i" 
          ,  
          $arrayHtmlContent 
          [1],  
          $match 
          );  
         
          $str_url2 
          =  
          $match 
          [1][0];  
         
          $stringHtmlContent2 
          =  
          file_get_contents 
          ( 
          $str_url2 
          );  
         
          preg_match( 
          "/<div class=\"watchListB\">(.*?)<div id=\"contentBody\">/is" 
          , 
          $stringHtmlContent2 
          , 
          $arrayHtmlContent2 
          );  
         
          preg_match( 
          "/<script type=\"text\/javascript\">(.*?)<\/script>/is" 
          , 
          $arrayHtmlContent2 
          [1], 
          $exe 
          );  
         
          preg_match_all( 
          "/src:'(.*?)'/i" 
          ,  
          $exe 
          [1],  
          $match2 
          );  
         
          $exe_url 
          =  
          $match2 
          [1];  
         
          $urlexe 
          =  
          $exe_url 
          [0];  
         
          } 
          else 
          {  
         
          echo 
          '参数错误!' 
          ;  
         
          }  
         
          wfile( 
          $file_name 
          ,  
          $urlexe 
          );

保存代码为cnet.php,上传文件到服务器,使用客户端访问该文件,将会得到最终下载连接.

http://xiongke.info/?p=107071

你可能感兴趣的:(proxy)

服务网格和 Istio 简介蹇之途容器化微服务 istio kubernetes 服务网格微服务 service mesh
文章目录一、什么是服务网格ServiceMesh1.1主要概念1.1.1、容器组织框架(Containerorchestratiobframework)1.1.2、Service与Service实例(ServiceInstance)1.1.3、Sidecar代理(SidecarProxy)1.1.4、服务发现(Servicediscovery)1.1.5、负载均衡(Loadbalancing)1.
设计模式——代理模式（Proxy Pattern） Lucifer Zhao 设计模式代理模式
定义：代理模式是指为其他对象提供一个代理，控制对这个对象的访问，保护目标对象，增强对象功能。代理对象在目标对象和客户端之间起中介作用。属于结构型设计模式。生活中的代理模式：房产中介、快递小哥、黄牛党。适应场景：当需要保护目标对象，增强目标对象功能时需要用到代理模式。代理模式的优点：代理模式能将代理对象与真实被调用目标对象分离一定程度上降低了系统的耦合程度，易于扩展代理可以起到保护目标对象，增强目标
Android筑基——Service的启动过程之同进程启动（基于api21） willwaywang6 #Android 架构学习 android Service 启动
目录1.前言2.正文2.1ContextWrapper.startService()方法2.2ContextImpl.startService()方法2.3ContextImpl.startServiceCommon()方法2.3.1ActivityManagerNative.getDefault()方法2.4ActivityManagerProxy.startService()方法2.5Acti
MCP-Proxy：开发多LLM & 多MCP 支持并安全访问MCP Server的秘密 IT古董技术杂谈安全 MCP MCP-Proxy
在构建多模型、多协议、可控可信的大模型接入平台时，MCP-Proxy扮演着关键中枢。它不仅要支持多个LLM接入，还要保障对后端MCPServer的安全访问、请求审计、能力切换与资源隔离。什么是MCP/MCP-Proxy？MCP（ModelCapabilityProtocol）是新一代模型能力调用协议，类似于OpenAI的API，但可支持：多厂商大模型（OpenAI、DeepSeek、Yi、Chat
Nginx 核心功能 ?ccc? nginx 服务器网络
目录一：正向代理1：编译安装Nginx（1）安装支持软件（2）创建运行用户、组和日志目录（3）编译安装Nginx（4）添加Nginx系统服务2：配置正向代理二：反向代理1：配置nginx七层代理2：配置nginx四层代理三：Nginx缓存1：缓存功能的核心原理和缓存类型2：代理缓存功能设置四：Nginxrewrite和正则一：正向代理正向代理（ForwardProxy）是一种位于客户端和原始服务器
vue3教程笔记 Xaire javascript vue.js 前端
选项式的写法基本和vue2一致。组合式写法：reactive()只适用于对象（数组或者内置对象），创建的对象都是js的proxy。import{reactive}from'vue'constcounter=reactive({count:0})console.log(counter.count)//0counter.count++ref()则可以接受任何值类型，ref会返回一个包裹对象，并在.va
动态代理，JDK 动态代理和 CGlib 动态代理的区别？蒂法就是我 java 开发语言动态代理 JDK动态代理 CGlib动态代理
程序员面试资料大全｜各种技术书籍等资料-1000G一、本质区别维度JDK动态代理CGLib动态代理实现机制基于接口反射基于字节码增强（ASM操作字节码）代理目标必须实现至少一个接口可代理普通类（无需接口）生成物$Proxy0接口代理类TargetClass$$EnhancerByCGLIB子类方法拦截原理InvocationHandler.invoke()MethodInterceptor.int
Vue 3 组合式API深度剖析：工具函数详解 aike13ky vue.js javascript
目录前言一、工具函数介绍1.isRef()2.unref()3.toRef()4.toValue()5.toRefs()6.isProxy()7.isReactive()8.isReadonly()前言组合式API除了为我们提供一些核心API，还为我们提供了很多工具函数。核心API详解请移步另一篇博客--->Vue3组合式API深度剖析：核心API使用指南在Vue3中，组合式API为我们提供了一种
响应式数据的判断：Vue3中的方法阿珊和她的猫 typescript javascript 前端 vue.js
前端开发工程师、技术日更博主、已过CET6阿珊和她的猫_CSDN博客专家、23年度博客之星前端领域TOP1牛客高级专题作者、打造专栏《前端面试必备》、《2024面试高频手撕题》、《前端求职突破计划》蓝桥云课签约作者、上架课程《Vue.js和Egg.js开发企业级健康管理项目》、《带你从入门到实战全面掌握uni-app》文章目录方法一：检查对象是否为Proxy方法二：使用`effect`函数方法三：
Nginx 正向代理与反向代理详解牛爷爷敲代码 nginx 运维笔记
Nginx正向代理与反向代理详解一、核心理论知识（一）正向代理（ForwardProxy）1.定义与本质代理对象：客户端（替客户端去“访问”服务器）工作原理：本质理解（类比快递代收点）正向代理就像是一个“快递代收点”：你（客户端）：想购买国外网站的商品，但无法直接访问代收点（正向代理服务器）：替你去国外网站下单购买国外商家（目标服务器）：只知道商品要寄到代收点，不知道真正的买家是你核心特征：客户端
实现在线访问OSS中的PDF、图片等文件（OSS不支持在线访问，而是默认下载）
问题分析当OSS返回的响应头中Content-Disposition设置为attachment时，浏览器会强制下载文件。要实现在线预览，需要确保：响应头Content-Disposition为inline正确设置Content-Type头（如text/html、text/css、application/javascript）处理HTML中相对路径资源的引用问题示例代码//OssProxyContr
移动应用通信协议逆向分析与防护实践群联云防护小杜安全问题汇总安全人工智能重构 ddos 服务器
一、抓包定位服务器IP的核心步骤1.环境配置#安装抓包工具adbinstallcharles-proxy-4.6.3.apk#开启透明代理iptables-tnat-AOUTPUT-ptcp--dport80-jREDIRECT--to-port88892.SSLPinning绕过（Java代码）//自定义TrustManager绕过证书校验publicstaticSSLSocketFactory
深度剖析Vue3响应式原理Proxy 冲浪的鹏多多 Vue vue.js 前端 javascript 前端框架
文章目录1.前言2.Vue2与Vue3响应式实现的差异2.1.Vue2响应式实现2.2.Vue3响应式实现3.Proxy基础3.1.Proxy的基本语法3.2.Proxy的常见拦截方法4.Vue3响应式核心-副作用函数4.1.副作用函数的收集与触发4.2.依赖收集的实现5.Vue3响应式的实现流程1.前言Vue3作为Vue框架的最新版本，对响应式系统进行了全面升级，采用Proxy替代了Vue2中的
【C++】代理模式 OpenC++ 设计模式 c++代理模式设计模式
目录一、模式核心概念与结构二、C++实现示例：图像加载代理三、代理模式的关键特性四、代理模式的常见类型五、应用场景六、代理模式与其他设计模式的关系七、C++标准库中的代理模式应用八、优缺点分析九、实战案例：数据库连接代理十、实现注意事项如果这篇文章对你有所帮助，渴望获得你的一个点赞！代理模式（ProxyPattern）是一种【结构型】设计模式，它允许通过代理对象控制对另一个对象（目标对象）的访问。
记录vue3.0+ts使用echarts的dataZoom的坑追风少年_ vue echarts vue.js javascript
错误原因：因为vue3.0使用的是proxy的模式监听响应式，this.chart会被在vue内部转换成响应式对象，从而在resize的时候获取不到coordSys.type解决办法：所以在实例化echart时，将其指定为非响应式的即可。import{markRaw}from‘vue’this.chart=markRaw(echarts.init(document.getElementById(t
前端面试专栏-主流框架：12. Vue3响应式原理与API 爱分享的程序员前端面试通关指南前端 javascript vue.js
欢迎来到前端面试通关指南专栏！从js精讲到框架到实战，渐进系统化学习，坚持解锁新技能，祝你轻松拿下心仪offer。前端面试通关指南专栏主页前端面试专栏规划详情Vue3响应式原理与API详解一、引言Vue3作为Vue.js框架的重要升级版本，带来了许多令人瞩目的新特性。其中，响应式系统的重构是Vue3最核心的改进之一。Vue3采用了Proxy对象替代了Vue2中的Object.definePrope
深度学习踩坑实践暗魂b 计算机视觉人工智能
环境导出condaactivateyour_envcondaenvexport>env.yaml创建环境condaenvcreate-fenv.yaml关于github、huggingface等远程模型下载超时问题查询代理地址echo$http_proxyecho$https_proxy设置代理os.environ["http_proxy"]="代理地址"os.environ["https_pro
Nginx-5 Nginx 的4层反向代理紫菜紫薯紫甘蓝 #Nginx nginx 运维 IP地址透传计算机网络
Nginx-5Nginx的4层反向代理Nginx的4层反向代理即指在OSI传输层（TCP、UDP）提供的反向代理。stream模块处理请求的7个阶段不过需要注意的是，这与http11个处理阶段的方式有所不同，4层反向代理中没有http中的概念，自然也无法通过header传递IP地址，以及通过limitrequest限制请求数。因此，4层反向代理使用proxyprotocal来传递IP地址。real
设计模式精讲 Day 12：代理模式（Proxy Pattern）在未来等你 23种设计模式精讲 design-patterns proxy-pattern
【设计模式精讲Day12】代理模式（ProxyPattern）文章内容在软件开发中，代理模式是一种常见的结构型设计模式，它通过引入一个代理对象来控制对真实对象的访问。这种模式不仅能够增强系统的安全性、灵活性和可扩展性，还能在不修改原有代码的基础上实现功能增强。作为“设计模式精讲”系列的第12天，我们将深入探讨代理模式（ProxyPattern）的核心思想、实现方式、适用场景以及实际应用案例。本文面
Vue2 与 Vue3 核心区别深度解析：源码级详解
总述：架构革命性升级Vue3是对Vue2的全面重构而非简单更新，核心变化可概括为：响应式系统：Object.defineProperty→Proxy重构虚拟DOM：静态标记+PatchFlag优化代码组织：OptionsAPI→CompositionAPI打包机制：支持Tree-shaking的模块化架构类型系统：全面拥抱TypeScript以下通过源码对比详细解析核心差异：一、响应式系统重构（核
Vue3 响应式原理旺代 vue.js javascript 前端
目录一、Proxy代理1.Proxy工作原理2.依赖收集系统3.ref的实现原理4.reactive的实现原理5.副作用系统（Effect）6.响应式系统的优势7.响应式流程总结二、组件触发渲染的时机1.首次挂载时2.响应式数据变更3.Props更新4.强制更新三、Vue3组件生命周期流程一、创建阶段（组件实例初始化）二、挂载阶段（DOM插入页面）三、更新阶段（响应数据变化）四、销毁阶段（移除组件
JavaScript中的反射魔法：揭秘Reflect对象的核心方法（上） coding随想 JavaScript javascript proxy模式
JavaScript中的反射魔法：揭秘Reflect对象的核心方法在JavaScript的世界中，反射（Reflection）是一种强大的机制，它允许我们以程序化的方式操作对象的属性和行为。ES6引入的Reflect对象，为开发者提供了统一的API来实现这一目标。通过Reflect，我们可以更优雅地处理对象属性的访问、修改、删除等操作，甚至与Proxy结合实现高级功能。本文将深入解析Reflect
pip apt proxy _vendor.requests.exceptions.SSLError: HTTPSConnectionPool(host=‘pypi.org‘, port=443 城俊BLOG Python 报错 Linux
1，pip死活连不上，提示没有SSL模块不指定proxy报这种：pip._vendor.requests.exceptions.SSLError:HTTPSConnectionPool(host=‘pypi.org’,port=443):Maxretriesexceededwithurl:/pypi(CausedbySSLError(“Can’tconnecttoHTTPSURLbecauseth
搭建跳板服务器的全过程
文章目录一、跳板机的作用二、搭建服务器跳板（JumpServer）1.服务器架构2.配置跳板机（JumpServer）（1）安装OpenSSH服务器CentOS系统Ubuntu系统（2）创建跳板机用户3.配置SSH免密登录（1）在客户端生成SSHKey（2）从跳板机连接目标服务器4.使用SSHProxy作为跳板（1）直接通过SSH跳板访问目标服务器5.记录SSH登录日志（1）启用SSH登录日志（2
WebFuture：nginx错误日志：an upstream response is buffered to a temporary file bbsh2099 WebFuture 常见问题 nginx java 服务器 WebFuture
问题描述：nginx的error日志中存在大量anupstreamresponseisbufferedtoatemporaryfile；后台上传文件失败解决办法：在nginx配置文件中添加如下，然后重启nginx服务proxy_bufferingon;proxy_buffer_size128k;proxy_buffers3232k;proxy_busy_buffers_size128k;proxy
PHP技术生态的深度整合与跨领域创新(2) seopthonshentong php wpf 开发语言
PHP技术生态的深度整合与跨领域创新作为本系列的最终扩展篇，我们将探索PHP技术在现代IT生态系统中的深度整合方式，以及如何通过跨领域创新开辟PHP应用的新疆界。本文适合希望将PHP技术栈与前沿领域结合的资深架构师和技术决策者。1.云原生深度集成服务网格适配层phpclassServiceMeshAdapter{private$sidecarProxy;publicfunction__constr
Nginx 缓存系统 proxy_cache详解学堂在线云计算 Linux系统 nginx 缓存运维服务器开源
系列文章目录提示：这里可以添加系列文章的所有文章的目录，目录需要自己手动添加例如：第一章Python机器学习入门之pandas的使用提示：写完文章后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录系列文章目录前言功能特点proxy_cache工作原理示意图配置文件示例参数详尽说明性能优化方案总结前言Nginx的proxy_cache模块是Nginx代理功能的一部分，它允许Nginx缓存来自
wsl 设置静态ip遇到的一些问题（安装好后不能联网）小妖666 tcp/ip 网络协议网络
今天安装完ubuntu24.04后不能联网，ping不通百度在Windows中的C:\Users目录下创建一个.wslconfig文件[wsl2]autoMemoryReclaim=gradualnetworkingMode=mirroreddnsTunneling=truefirewall=trueautoProxy=truewsl执行sudonano/etc/sudoers找到%sudoALL
Python 爬虫实战：华尔街见闻精选文章爬取（反反爬 + 投资情绪分析） Python核芯 Python爬虫实战项目 python 爬虫开发语言
一、环境配置与工具选择1.1技术栈选型本次实战采用以下技术组合：核心框架：Playwright（浏览器自动化）、Requests（HTTP请求）、BeautifulSoup（HTML解析）反反爬模块：fake-useragent（随机UA）、proxypool（代理池）、playwright-stealth（反检测）数据分析：Pandas（数据处理）、SnowNLP（情感分析）、WordCloud
Redis集群服务器重启后虚拟IP中断，应该如何处理 Jerry 二河小鱼 2025运维 nginx tomcat redis redis 服务器数据库运维 linux
Redis集群服务器重启后虚拟IP中断，应该如何处理第一步，先登录阿里云账号，然后在阿里云网站中把所有的集群服务器按照主从顺序一次停止。第二步，先把从服务器完全启动成功之后，再把主服务器完全启动成功。第三步，连接主服务器，打开主服务器的终端。先使用命令“systemctlstarthaproxy”启动haproxy服务，然后使用命令“ps-ef|grephaproxy”查看haproxy服务是否启
对于规范和实现，你会混淆吗？ yangshangchuan HotSpot
昨晚和朋友聊天，喝了点咖啡，由于我经常喝茶，很长时间没喝咖啡了，所以失眠了，于是起床读JVM规范，读完后在朋友圈发了一条信息： JVM Run-Time Data Areas：The Java Virtual Machine defines various run-time data areas that are used during execution of a program. So
android 网络百合不是茶网络
android的网络编程和java的一样没什么好分析的都是一些死的照着写就可以了,所以记录下来方便查找 , 服务器使用的是TomCat 服务器代码; servlet的使用需要在xml中注册 package servlet; import java.io.IOException; import java.util.Arr
[读书笔记]读法拉第传 comsci 读书笔记
1831年的时候,一年可以赚到1000英镑的人..应该很少的... 要成为一个科学家,没有足够的资金支持,很多实验都无法完成但是当钱赚够了以后....就不能够一直在商业和市场中徘徊......
随机数的产生沐刃青蛟随机数
c++中阐述随机数的方法有两种：一是产生假随机数（不管操作多少次，所产生的数都不会改变）这类随机数是使用了默认的种子值产生的，所以每次都是一样的。 //默认种子 for (int i = 0; i < 5; i++) { cout<<
PHP检测函数所在的文件名 IT独行者 PHP 函数
很简单的功能，用到PHP中的反射机制，具体使用的是ReflectionFunction类，可以获取指定函数所在PHP脚本中的具体位置。创建引用脚本。代码： [php] view plain copy // Filename: functions.php <?php&nbs
银行各系统功能简介文强chu 金融
银行各系统功能简介　业务系统核心业务系统业务功能包括：总账管理、卡系统管理、客户信息管理、额度控管、存款、贷款、资金业务、国际结算、支付结算、对外接口等清分清算系统以清算日期为准，将账务类交易、非账务类交易的手续费、代理费、网络服务费等相关费用，按费用类型计算应收、应付金额，经过清算人员确认后上送核心系统完成结算的过程国际结算系
Python学习1(pip django 安装以及第一个project) 小桔子 python django pip
最近开始学习python,要安装个pip的工具。听说这个工具很强大，安装了它，在安装第三方工具的话so easy!然后也下载了，按照别人给的教程开始安装，奶奶的怎么也安装不上！第一步：官方下载pip-1.5.6.tar.gz, https://pypi.python.org/pypi/pip easy! 第二部：解压这个压缩文件，会看到一个setup.p
php 数组 aichenglong PHP 排序数组循环多维数组
1 php中的创建数组 $product = array('tires','oil','spark');//array()实际上是语言结构而不是函数 2 如果需要创建一个升序的排列的数字保存在一个数组中，可以使用range()函数来自动创建数组 $numbers=range(1,10)//1 2 3 4 5 6 7 8 9 10 $numbers=range(1,10,
安装python2.7 AILIKES python
安装python2.7 1、下载可从 http://www.python.org/进行下载#wget https://www.python.org/ftp/python/2.7.10/Python-2.7.10.tgz 2、复制解压 #mkdir -p /opt/usr/python #cp /opt/soft/Python-2
java异常的处理探讨百合不是茶 JAVA异常
//java异常 /* 1，了解java 中的异常处理机制，有三种操作 a,声明异常 b,抛出异常 c,捕获异常 2，学会使用try-catch-finally来处理异常 3，学会如何声明异常和抛出异常 4，学会创建自己的异常 */ //2，学会使用try-catch-finally来处理异常
getElementsByName实例 bijian1013 element
实例1： <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/x
探索JUnit4扩展：Runner bijian1013 java 单元测试 JUnit
参加敏捷培训时，教练提到Junit4的Runner和Rule，于是特上网查一下，发现很多都讲的太理论，或者是举的例子实在是太牵强。多搜索了几下，搜索到两篇我觉得写的非常好的文章。文章地址：http://www.blogjava.net/jiangshachina/archive/20
[MongoDB学习笔记二]MongoDB副本集 bit1129 mongodb
1. 副本集的特性 1)一台主服务器(Primary),多台从服务器(Secondary) 2)Primary挂了之后，从服务器自动完成从它们之中选举一台服务器作为主服务器，继续工作，这就解决了单点故障，因此，在这种情况下，MongoDB集群能够继续工作 3)挂了的主服务器恢复到集群中只能以Secondary服务器的角色加入进来 2
【Spark八十一】Hive in the spark assembly bit1129 assembly
Spark SQL supports most commonly used features of HiveQL. However, different HiveQL statements are executed in different manners: 1. DDL statements (e.g. CREATE TABLE, DROP TABLE, etc.)
Nginx问题定位之监控进程异常退出 ronin47
nginx在运行过程中是否稳定，是否有异常退出过？这里总结几项平时会用到的小技巧。 1. 在error.log中查看是否有signal项，如果有，看看signal是多少。比如，这是一个异常退出的情况： $grep signal error.log 2012/12/24 16:39:56 [alert] 13661#0: worker process 13666 exited on s
No grammar constraints (DTD or XML schema).....两种解决方法 byalias xml
方法一：常用方法关闭XML验证工具栏：windows => preferences => xml => xml files => validation => Indicate when no grammar is specified:选择Ignore即可。方法二：（个人推荐）添加内容如下 <?xml version=
Netty源码学习-DefaultChannelPipeline bylijinnan netty
package com.ljn.channel; /** * ChannelPipeline采用的是Intercepting Filter 模式 * 但由于用到两个双向链表和内部类，这个模式看起来不是那么明显，需要仔细查看调用过程才发现 * * 下面对ChannelPipeline作一个模拟，只模拟关键代码： */ public class Pipeline {
MYSQL数据库常用备份及恢复语句 chicony mysql
备份MySQL数据库的命令，可以加选不同的参数选项来实现不同格式的要求。 mysqldump -h主机 -u用户名 -p密码数据库名 > 文件备份MySQL数据库为带删除表的格式，能够让该备份覆盖已有数据库而不需要手动删除原有数据库。 mysqldump -–add-drop-table -uusername -ppassword databasename > ba
小白谈谈云计算--基于Google三大论文 CrazyMizzz Google 云计算 GFS
之前在没有接触到云计算之前，只是对云计算有一点点模糊的概念，觉得这是一个很高大上的东西，似乎离我们大一的还很远。后来有机会上了一节云计算的普及课程吧，并且在之前的一周里拜读了谷歌三大论文。不敢说理解，至少囫囵吞枣啃下了一大堆看不明白的理论。现在就简单聊聊我对于云计算的了解。我先说说GFS &n
hadoop 平衡空间设置方法 daizj hadoop balancer
在hdfs-site.xml中增加设置balance的带宽，默认只有1M： <property> <name>dfs.balance.bandwidthPerSec</name> <value>10485760</value> <description&g
Eclipse程序员要掌握的常用快捷键 dcj3sjt126com 编程
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可以那么勤奋，每天都孜孜不倦得
Android学习之路 dcj3sjt126com Android学习
转自：http://blog.csdn.net/ryantang03/article/details/6901459 以前有J2EE基础，接触JAVA也有两三年的时间了，上手Android并不困难，思维上稍微转变一下就可以很快适应。以前做的都是WEB项目，现今体验移动终端项目，让我越来越觉得移动互联网应用是未来的主宰。下面说说我学习Android的感受，我学Android首先是看MARS的视
java 遍历Map的四种方法 eksliang java HashMap java 遍历Map的四种方法
转载请出自出处： http://eksliang.iteye.com/blog/2059996 package com.ickes; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Map.Entry; /** * 遍历Map的四种方式
【精典】数据库相关相关 gengzg 数据库
package C3P0; import java.sql.Connection; import java.sql.SQLException; import java.beans.PropertyVetoException; import com.mchange.v2.c3p0.ComboPooledDataSource; public class DBPool{
自动补全 huyana_town 自动补全
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"><html xmlns="http://www.w3.org/1999/xhtml&quo
jquery在线预览PDF文件，打开PDF文件天梯梦 jquery
最主要的是使用到了一个jquery的插件jquery.media.js，使用这个插件就很容易实现了。核心代码 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.
ViewPager刷新单个页面的方法 lovelease android viewpager tag 刷新
使用ViewPager做滑动切换图片的效果时，如果图片是从网络下载的，那么再子线程中下载完图片时我们会使用handler通知UI线程，然后UI线程就可以调用mViewPager.getAdapter().notifyDataSetChanged()进行页面的刷新，但是viewpager不同于listview，你会发现单纯的调用notifyDataSetChanged()并不能刷新页面
利用按位取反（~）从复合枚举值里清除枚举值草料场 enum
以 C# 中的 System.Drawing.FontStyle 为例。如果需要同时有多种效果，如：“粗体”和“下划线”的效果，可以用按位或（|） FontStyle style = FontStyle.Bold | FontStyle.Underline; 如果需要去除 style 里的某一种效果，
Linux系统新手学习的11点建议刘星宇编程工作 linux 脚本
　　随着Linux应用的扩展许多朋友开始接触Linux，根据学习Windwos的经验往往有一些茫然的感觉：不知从何处开始学起。这里介绍学习Linux的一些建议。　　一、从基础开始：常常有些朋友在Linux论坛问一些问题，不过，其中大多数的问题都是很基础的。例如：为什么我使用一个命令的时候，系统告诉我找不到该目录，我要如何限制使用者的权限等问题，这些问题其实都不是很难的，只要了解了 Linu
hibernate dao层应用之HibernateDaoSupport二次封装 wangzhezichuan DAO Hibernate
/** * 方法描述:sql语句查询返回List<Class> * 方法备注: Class 只能是自定义类 * @param calzz * @param sql * @return * 创建人：王川 * 创建时间：Jul