IT_lukaifang

使用java+Jsoup做简单的网络爬虫，爬取网页资源并写入数据库

使用java+Jsoup做简单的网络爬虫，爬取网页资源并写入数据库

文章目录

使用java+Jsoup做简单的网络爬虫，爬取网页资源并写入数据库

目录结构：
程序执行的顺序：
效果展示：
Jsoup文档
代码部分：

db-MyDataSource
db-MYSQLControl
main-SpiderMain
model-SpiderModel
parse-ReCordParse
util-HTTPUtils
util-URLParser
pom文件

由于工作需要，我近期使用java+Jsoup做了一个简单的网络爬虫程序，都说网络爬虫需要用到Python，但是我们大Java也是可以实现的嘛哈哈 _{（语言没有高低之分，无引战恶意，Python党请放下你们的西瓜刀哈>_<）}

闲言少叙，此次的网络爬虫主要想要做的功能是：将一些“档案类”网站上的资源（文字、图片）抓取下来，写入数据库中：

首先，我们来看一下项目的目录结构：

目录结构：

这里一共有五个包，db、main、model、parse、util。

db:主要放的是数据库操作文件，包含MyDataSource【数据库驱动注册、连接数据库的用户名、密码】，MYSQLControl【连接数据库，插入操作、更新操作、建表操作等】。
model：用来封装对象。
util：主要放的是httpclient的内容，主要作用时将main方法，传过来的url，通过httpclient相关方法，获取需要解析的html文件或者json文件等。
parse：这里面存放的是针对util获取的文件，进行解析，一般采用Jsoup解析；若是针对json数据，可采用正则表达式或者fastjson工具进行解析，建议使用fastjson，因其操作简单，快捷。
main：程序起点，也是重点，获取数据，执行数据库语句，存放数据。

程序执行的顺序：

首先，main方法，将url传给util获取响应的html文件，然后util将其获得的html文件，传给parse进行解析，获取最终数据，封装在集合中。解析完毕后，数据返回到main，接着main操作db将数据导入到mysql中。

效果展示：

源网页：http://www.jgsgmbwg.com/bwg.php?cid=6&page=1

结果展示：

Jsoup文档

使用Jsoup进行网页元素的抓取，详细操作请参考：https://www.jianshu.com/p/fd5caaaa950d

代码部分：

db-MyDataSource

package com.cesgroup.db;

import javax.sql.DataSource;
import org.apache.commons.dbcp2.BasicDataSource;
/**
 * @author ：lu.kaifang
 * @date ：Created in 2019/9/9 11:27
 * @description：用以确定此工程的数据库连接信息
 * @modified By：lu.kaifang
 * @version: 1.0
 */
public class MyDataSource {
    public static DataSource getDataSource(String connectURI){
        BasicDataSource ds = new BasicDataSource();
        //MySQL的jdbc驱动
        ds.setDriverClassName("com.mysql.jdbc.Driver");
        ds.setUsername("root");              //所要连接的数据库名
        ds.setPassword("root");                //MySQL的登陆密码
        ds.setUrl(connectURI);
        return ds;
    }
}

db-MYSQLControl

package com.cesgroup.db;

import java.sql.SQLException;
import java.util.List;
import javax.sql.DataSource;

import com.cesgroup.model.SpiderModel;
import org.apache.commons.dbutils.QueryRunner;

/**
 * @author ：lu.kaifang
 * @date ：Created in 2019/9/9 11:29
 * @description：使用QueryRunner方法操作数据库，使用时是batch方法
 * @modified By：lu.kaifang
 * @version: 1.0
 */
public class MYSQLControl {
    //根据自己的数据库地址修改
    static DataSource ds = MyDataSource.getDataSource("jdbc:mysql://127.0.0.1:3306/spider");
    static QueryRunner qr = new QueryRunner(ds);
    //第一类方法
    public static void executeUpdate(String sql){
        try {
            qr.update(sql);
        } catch (SQLException e) {
            e.printStackTrace();
        }
    }
    //第二类数据库操作方法
    public static void executeInsert(List reCordData) throws SQLException {
        /*
         * 定义一个Object数组，行列
         * 3表示列数，根据自己的数据定义这里面的数字
         * params[i][0]等是对数组赋值，
         *这里用到集合的get方法
         */
        Object[][] params = new Object[reCordData.size()][3];
        for ( int i=0; i

 
  main-SpiderMain 
  package com.cesgroup.main;

import java.util.List;
import org.apache.commons.logging.Log;
import org.apache.commons.logging.LogFactory;
import org.apache.http.client.HttpClient;
import org.apache.http.impl.client.DefaultHttpClient;
import com.cesgroup.db.MYSQLControl;
import com.cesgroup.model.SpiderModel;
import com.cesgroup.util.URLFecter;
/**
 * @author ：lu.kaifang
 * @date ：Created in 2019/9/9 11:30
 * @description：这是主程序
 * @modified By：lu.kaifang
 * @version: 1.0
 */
public class SpiderMain {
    //log4j的是使用，不会的请看之前写的文章
    static final Log logger = LogFactory.getLog(SpiderMain.class);
    public static void main(String[] args) throws Exception {
        //初始化一个httpclient
        HttpClient client = new DefaultHttpClient();
        //我们要爬取的一个地址，这里可以从数据库中抽取数据，然后利用循环，可以爬取一个URL队列
        String url="http://www.jgsgmbwg.com/bwg.php?cid=6&page=1";
        //抓取的数据
        List reCorddatas=URLFecter.URLParser(client, url);
        //循环输出抓取的数据
        for (SpiderModel re:reCorddatas) {
            logger.info("ReCordName:"+re.getReCordName()+"\t"+"ReCordData:"+re.getReCordData()+"\t"+"ReCordImg:"+re.getReCordImg());
        }
        //将抓取的数据插入数据库
        MYSQLControl.executeInsert(reCorddatas);
    }
}
 
  model-SpiderModel 
  package com.cesgroup.model;

/**
 * @author ：lu.kaifang
 * @date ：Created in 2019/9/9 11:30
 * @description：针对京东页面的实体类
 * 用来封装对象
 * @modified By：lu.kaifang
 * @version: 1.0
 */
public class SpiderModel {
    private String reCordName;
    private String reCordData;
    private String reCordImg;

    public String getReCordName() {
        return reCordName;
    }

    public void setReCordName(String reCordName) {
        this.reCordName = reCordName;
    }

    public String getReCordData() {
        return reCordData;
    }

    public void setReCordData(String reCordData) {
        this.reCordData = reCordData;
    }

    public String getReCordImg() {
        return reCordImg;
    }

    public void setReCordImg(String reCordImg) {
        this.reCordImg = reCordImg;
    }
}
 
  parse-ReCordParse 
  package com.cesgroup.parse;

import java.io.BufferedOutputStream;
import java.io.File;
import java.io.FileOutputStream;
import java.io.InputStream;
import java.net.URL;
import java.net.URLConnection;
import java.util.ArrayList;
import java.util.List;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
import com.cesgroup.model.SpiderModel;
/**
 * @author ：lu.kaifang
 * @date ：Created in 2019/9/9 11:31
 * @description：针对页面的网络爬虫
 * @modified By：lu.kaifang
 * @version: 1.0
 */
public class ReCordParse {
    public static List getData (String html) throws Exception{
        //获取的数据，存放在集合中
        List data = new ArrayList();
        //采用Jsoup解析
//        System.out.println("html是："+html);
        //定义图片存储路径
        File path = new File("E:/Img");
        if (!path.exists()){
            path.mkdirs();//若不存在则创建这个文件夹
        }
        Document doc = Jsoup.parse(html);
//		如果出现网站需要有登陆验证，则上面的url会变成登陆页面导致抓取失败，因此可以用下面两行代码代替直接写入url
//        String url = "http://www.jgsgmbwg.com/bwg.php";
//        Document doc = Jsoup.connect(url).get();
        //获取html标签中的内容
        Elements elements=doc.select("ul[class=product_list]").select("li");
        for (Element ele:elements) {
            String reCordName=ele.select("p[class=info]").select("span").text();
            String reCordData=ele.select("p[class=info]").select("a").text();
            String reCordImg = ele.select("a[class=img]").select("img").attr("src");
            //下载图片
//            Document document1 = Jsoup.connect("http://www.jgsgmbwg.com/"+bookImg).ignoreContentType(true).userAgent("Mozilla/5.0 (Windows; U; Windows NT 5.1; zh-CN; rv:1.9.2.15)").timeout(5000).get();
            String bookUrl = "http://www.jgsgmbwg.com/"+reCordImg;
            URL url = new URL(bookUrl);
            String filename = ""+System.currentTimeMillis();
            // 获得连接
            URLConnection connection = url.openConnection();
            // 设置10秒的相应时间
            connection.setConnectTimeout(10 * 1000);
            // 获得输入流
            InputStream in = connection.getInputStream();
            // 获得输出流
            BufferedOutputStream out = new BufferedOutputStream(new FileOutputStream(path+"/"+filename+".png"));
            // 构建缓冲区
            byte[] buf = new byte[1024];
            int size;
            // 写入到文件
            while (-1 != (size = in.read(buf))) {
                out.write(buf, 0, size);
            }
            out.close();
            in.close();
            //创建一个对象，这里可以看出，使用Model的优势，直接进行封装
            SpiderModel Model=new SpiderModel();
            //对象的值
            Model.setReCordName(reCordName);
            Model.setReCordData(reCordData);
            Model.setReCordImg(reCordImg);
            Model.setReCordImg("e:/Img/"+filename);
            //将每一个对象的值，保存到List集合中
            data.add(Model);
        }
        //返回数据
        return data;
    }
}
 
  util-HTTPUtils 
  package com.cesgroup.util;

import java.io.IOException;
import org.apache.http.HttpResponse;
import org.apache.http.HttpStatus;
import org.apache.http.HttpVersion;
import org.apache.http.client.HttpClient;
import org.apache.http.client.methods.HttpGet;
import org.apache.http.message.BasicHttpResponse;

/**
 * @author ：lu.kaifang
 * @date ：Created in 2019/9/9 11:32
 * @description：util中包含两个文件，URLFecter 与HTTPUtils，其中URLFecter 调用了HTTPUtils类
 * @modified By：lu.kaifang
 * @version: 1.0
 */
public class HTTPUtils {
    public static HttpResponse getRawHtml(HttpClient client, String personalUrl) {
        //获取响应文件，即html，采用get方法获取响应数据
        HttpGet getMethod = new HttpGet(personalUrl);
        HttpResponse response = new BasicHttpResponse(HttpVersion.HTTP_1_1,
                HttpStatus.SC_OK, "OK");
        try {
            //执行get方法
            response = client.execute(getMethod);
        } catch (IOException e) {
            e.printStackTrace();
        } finally {
            // getMethod.abort();
        }
        return response;
    }
}
 
  util-URLParser 
  package com.cesgroup.util;

import java.util.ArrayList;
import java.util.List;
import org.apache.http.HttpResponse;
import org.apache.http.client.HttpClient;
import org.apache.http.util.EntityUtils;
import com.cesgroup.model.SpiderModel;
import com.cesgroup.parse.ReCordParse;

/**
 * @author ：lu.kaifang
 * @date ：Created in 2019/9/9 11:32
 * @description：util中包含两个文件，URLFecter 与HTTPUtils，其中URLFecter 调用了HTTPUtils类
 * @modified By：lu.kaifang
 * @version: 1.0
 */
public class URLFecter {
    public static List URLParser (HttpClient client, String url) throws Exception {
        //用来接收解析的数据
        List JingdongData = new ArrayList();
        //获取网站响应的html，这里调用了HTTPUtils类
        System.out.println("url是："+url);
        HttpResponse response = HTTPUtils.getRawHtml(client, url);
        //获取响应状态码
        int StatusCode = response.getStatusLine().getStatusCode();
        //如果状态响应码为200，则获取html实体内容或者json文件
        if(StatusCode == 200){
            System.out.println("response.getEntity()"+response.getEntity());
            String entity = EntityUtils.toString (response.getEntity(),"utf-8");
            JingdongData = ReCordParse.getData(entity);
            System.out.println("entity为："+entity);
            EntityUtils.consume(response.getEntity());
        }else {
            //否则，消耗掉实体
            EntityUtils.consume(response.getEntity());
        }
        return JingdongData;
    }
}
 
  pom文件 
  


  4.0.0

  com.cesgroup.spider
  spider
  1.0-SNAPSHOT
  war

  spider Maven Webapp
  
  http://www.example.com

  
    UTF-8
    1.7
    1.7
  

  
    
      junit
      junit
      4.11
      test
    
    
    
      commons-dbutils
      commons-dbutils
      1.6
    
    
    
      org.apache.commons
      commons-dbcp2
      2.1.1
    
    
    
      org.apache.httpcomponents
      httpcore
      4.4.10
    
    
    
      org.apache.httpcomponents
      httpclient
      4.5.6
    
    
    
      org.jsoup
      jsoup
      1.11.3
    
    
      mysql
      mysql-connector-java
      5.1.25
    
  
  
  
    spider
    
      
        
          maven-clean-plugin
          3.1.0
        
        
        
          maven-resources-plugin
          3.0.2
        
        
          maven-compiler-plugin
          3.8.0
        
        
          maven-surefire-plugin
          2.22.1
        
        
          maven-war-plugin
          3.2.2
        
        
          maven-install-plugin
          2.5.2
        
        
          maven-deploy-plugin
          2.8.2
        
      
    
  

 
  ok，至此，这个简单的爬虫就完成了~用来爬取一些简单的（类似档案网站）网页是没有什么问题的，如果有些网站有防爬取的，就不能用这么low的方法了，不过有防爬取，就一定有防防爬取，所谓道高一尺，魔高一丈！其他的就靠大家自己去找咯！


    
        你可能感兴趣的:(开发技巧)
        
            
                
                    案例分析：如何用设计模式优化性能7
                        是小旭啊
fastapi
                        设计模式就是对常用开发技巧进行的总结，它使得程序员之间交流问题，有了更专业、便捷的方式。比如，我们在《02|理论分析：性能优化有章可循，谈谈常用的切入点》中提到，I/O模块使用的是装饰器模式，你就能很容易想到I/O模块的代码组织方式。事实上，大多数设计模式并不能增加程序的性能，它只是代码的一种组织方式。本课时，我们将一一举例讲解和性能相关的几个设计模式，包括代理模式、单例模式、享元模式、原型模式等
                    
                    前端开发这次几个非常经典的常用技巧，学会了之后事半功倍！
                        学掌门
程序员软件开发前端状态模式软件开发前端
                        对于一个刚入前端的新手来说，在前端开发过程中会遇到各种各样的麻烦和坑，这样很多时候回让开发者的信息受到打击，作为一个稍微好一点的前端菜鸟来说，今天就给刚入前端的新手们分享一些比较实用的开发技巧，让之少走一些弯路。1.如何知道iframe下载完成做数据分析，一共分几步？定时器轮询监听readyState的状态，如果是complete或者interactive说明文件加载完成。letiframe=do
                    
                    go 开发小技巧
                        卡卡舅舅
golang开发语言后端
                        一、简介本篇文章会介绍go开发小技巧。二、go开发技巧2.1SemaphoretypeSemaphorechanstruct{}funcNewSemaphore(maxCountint)Semaphore{returnmake(chanstruct{},maxCount)}func(sSemaphore)Acquire(){s<-struct{}{}}func(sSemaphore)tryAcqu
                    
                    Windows实用技巧：在Windows上模拟Unix/Linux下`nohup`命令的实战攻略
                        DTcode7
IT信息技术相关#信息化技能面试宝典#信息化人员基础技能知识windowsunixlinux技术常识面试宝典IT信息化
                        Windows实用技巧：在Windows上模拟Unix/Linux下`nohup`命令的实战攻略基本概念与作用说明nohup基础Windows上的挑战方案一：使用PowerShell的Start-Process代码示例1：基础应用代码示例2：带参数执行方案二：任务计划程序实战思路代码示例3：创建计划任务（伪代码）安全性与性能优化实际开发技巧遇到问题的排查思路结论与讨论在Unix/Linux的世界里
                    
                    如何提升PHP开发技能：从初学者到高级开发者的进阶之路
                        专家大圣
PHPphp开发语言
                        PHP作为一种流行的服务器端脚本语言，广泛用于Web开发。尽管近年来许多新兴语言如Node.js、Python等开始流行，但PHP仍然是开发动态网站和Web应用程序的主要选择之一。本文将探讨如何从基础知识到高级开发技巧，不断提升你的PHP开发技能。目录1.掌握PHP的基础知识2.理解面向对象编程（OOP）3.深入理解PHP的高级功能4.关注安全性5.学习使用框架6.探索现代开发工具和流程7.关注社
                    
                    【GameFramework框架内置模块】1、全局配置（Config）
                        恬静的小魔龙
#GameFramework框架游戏引擎编辑器
                        推荐阅读CSDN主页GitHub开源地址Unity3D插件分享简书地址大家好，我是佛系工程师☆恬静的小魔龙☆，不定时更新Unity开发技巧，觉得有用记得一键三连哦。一、前言【GameFramework框架】系列教程目录：https://blog.csdn.net/q764424567/article/details/135831551这是GameFramework框架内置模块的第一篇，全局配置Co
                    
                    java面试题/认证答辩 ---主流框架(mybatis)
                        Fuly1024
面试刷题mysql
                        掌握程度:熟悉：熟悉相关框架的基本开发技巧，能使用框架进行基本开发掌握：理解AOP，IOC等概念，熟悉相关框架的基本实现原理，能独立使用相关框架搭建中型产品和项目。精通：熟悉相关框架源代码，能够使用拦截器，AOP等技术进行系统安全和数据监控等复杂功能的开发综合应用：掌握相关框架实现原理，能够对框架进行扩展开发，有大型产品或项目框架选型和搭建经验，具有问题排查解决能力mybatis参考:https:
                    
                    Java后端开发技巧：打造稳定的房屋租赁管理系统
                        疯狂行者
Python项目Java项目毕设项目java开发语言springbootvue.jspython房屋租赁
                        作者主页：疯狂行者✌java领域优质创作者,专注于Java技术领域技术交流✌文末获取源码精彩专栏推荐订阅：在下方专栏Java精彩实战项目案例Java精彩新手项目案例Python精彩新手项目案例文章目录Java精彩实战项目案例Java精彩新手项目案例Python精彩新手项目案例引言一、系统功能1.1开发环境三、部分功能展示四、部分代码设计【代码如下（示例）：】总结源码获取：Java精彩实战项目案例J
                    
                    webpack开发部署技巧
                        f_Joyce

                        开发技巧启用source-map现在的代码是合并以后的代码，不利于排错和定位，只需要在config中添加...devtool:'eval-source-map',...这样出错以后就会采用source-map的形式直接显示你出错代码的位置。配置webpack-dev-server代理既然常用webpack做React一类的SPA，那么一个典型的例子就是前后端分离。后端是一个RESTful的serv
                    
                    SAP工具箱 通用导入程序
                        syjf1976_ABAP
javacss小程序数据可视化web
                        点击蓝字关注我们一前言数据导入,是一个简单的应用场景:用户按规定格式准备好数据文件,批量导入系统创建主数据或者单据.开发框架系列中写了一篇文章介绍了一个数据导入框架.详见链接无峰，公众号：ABAP开发技巧SAP开发框架系列之数据导入基于这个框架开发了一系列的数据导入程序,用于满足项目上的数据导入需求.如图一.所有这些数据导入程序都使用了一个核心程序ZUPLOAD_TABLE_CONTENT.本文主
                    
                    【GameFramework框架】三、快速启动
                        恬静的小魔龙
#GameFramework框架编辑器开发语言c#游戏引擎unity
                        推荐阅读CSDN主页GitHub开源地址Unity3D插件分享简书地址大家好，我是佛系工程师☆恬静的小魔龙☆，不定时更新Unity开发技巧，觉得有用记得一键三连哦。一、前言【GameFramework框架】系列教程目录：https://blog.csdn.net/q764424567/article/details/135831551这篇文章就带领大家如何快速启动GameFramework框架。二
                    
                    新书速览 | React.js+Node.js+MongoDB企业级全栈开发实践
                        全栈开发圈
react.jsnode.jsmongodb
                        详解React.js全家桶及其结合Node.js、MongoDB进行全栈开发的方法实战企业级应用系统项目开发本书内容本书系统介绍Web应用全栈开发技术，通过一个真实的企业项目，讲解如何使用React全家桶以及Node.js、MongoDB进行全栈开发，帮助开发人员快速积累开发经验，全面掌握开发技巧。读完本书相当于真实参与一个完整的全栈项目开发。本书配套示例项目源代码。本书共分27章，内容包括开发环
                    
                    【Unity3D框架】GameFramework框架完全教程《全网最全》-专栏文章目录
                        恬静的小魔龙
#GameFramework框架unity游戏引擎编辑器
                        推荐阅读CSDN主页GitHub开源地址Unity3D插件分享简书地址我的个人博客大家好，我是佛系工程师☆恬静的小魔龙☆，不定时更新Unity开发技巧，觉得有用记得一键三连哦。一、前言最近准备学习框架，了解到GameFramework框架是国产Unity3D框架，准备学习一下，但是奈何全网关于这个框架的教程实在太少。为了让自己学习方便一些，也为了让后来者乘凉。将框架以自己的理解整理目录，并且补全教
                    
                    【GameFramework框架】四、GameFramework框架内置模块
                        恬静的小魔龙
#GameFramework框架unity游戏引擎编辑器c#
                        推荐阅读CSDN主页GitHub开源地址Unity3D插件分享简书地址大家好，我是佛系工程师☆恬静的小魔龙☆，不定时更新Unity开发技巧，觉得有用记得一键三连哦。一、前言【GameFramework框架】系列教程目录：https://blog.csdn.net/q764424567/article/details/135831551【GameFramework框架】内置模块系列教程目录：【Gam
                    
                    AI应用开发-python实现redis数据存储
                        写代码的中青年
AI应用开发人工智能pythonredisscikit-learnpandas
                        AI应用开发相关目录本专栏包括AI应用开发相关内容分享，包括不限于AI算法部署实施细节、AI应用后端分析服务相关概念及开发技巧、AI应用后端应用服务相关概念及开发技巧、AI应用前端实现路径及开发技巧适用于具备一定算法及Python使用基础的人群AI应用开发流程概述VisualStudioCode及RemoteDevelopment插件远程开发git开源项目的一些问题及镜像解决办法python实现U
                    
                    Unity3D实现项目限制功能（使用次数限制和时间限制）
                        心疼你的一切
Unity工具unity游戏引擎
                        系列文章目录unity工具文章目录系列文章目录前言一、时间限制1-1、代码如下：二、次数限制2-1、在Unity项目中需要对注册表进行操作，还需要设置一下API兼容级别设置成.NETFramework2-2、设置如下图Player里面2-3、代码如下：三、同时控制时间和次数四、unity自带保存读取次数限制4-1、代码如下：4-2、效果总结前言大家好，我是心疼你的一切，不定时更新Unity开发技巧
                    
                    AI应用开发-python实现日志生成及定期清理
                        写代码的中青年
AI应用开发人工智能python开发语言
                        AI应用开发相关目录本专栏包括AI应用开发相关内容分享，包括不限于AI算法部署实施细节、AI应用后端分析服务相关概念及开发技巧、AI应用后端应用服务相关概念及开发技巧、AI应用前端实现路径及开发技巧适用于具备一定算法及Python使用基础的人群AI应用开发流程概述VisualStudioCode及RemoteDevelopment插件远程开发git开源项目的一些问题及镜像解决办法python实现U
                    
                    AI应用开发-Linux终端命令Screen常见用法
                        写代码的中青年
AI应用开发人工智能linux运维服务器
                        AI应用开发相关目录本专栏包括AI应用开发相关内容分享，包括不限于AI算法部署实施细节、AI应用后端分析服务相关概念及开发技巧、AI应用后端应用服务相关概念及开发技巧、AI应用前端实现路径及开发技巧适用于具备一定算法及Python使用基础的人群AI应用开发流程概述VisualStudioCode及RemoteDevelopment插件远程开发git开源项目的一些问题及镜像解决办法python实现U
                    
                    【Unity3D小技巧】Unity3D中UI控制解决方案
                        恬静的小魔龙
#Unity3D之小技巧uiunity游戏引擎编辑器
                        推荐阅读CSDN主页GitHub开源地址Unity3D插件分享简书地址我的个人博客大家好，我是佛系工程师☆恬静的小魔龙☆，不定时更新Unity开发技巧，觉得有用记得一键三连哦。一、前言在开发中总是会控制UI界面，如何优雅的控制UI界面是每一个Unity3D程序员的必修课。这篇文章就总结了一下博主在实际开发中用到的几种控制UI的方式，分享出来以供批评指正。在文章的最后，也根据UI控制做了一些延展，比
                    
                    【服务器搭建】快速完成幻兽帕鲁服务器的搭建及部署【零基础上手】
                        恬静的小魔龙
#云服务器服务器运维
                        推荐阅读CSDN主页GitHub开源地址Unity3D插件分享简书地址我的个人博客大家好，我是佛系工程师☆恬静的小魔龙☆，不定时更新Unity开发技巧，觉得有用记得一键三连哦。一、前言教程详戳：不需要懂技术，1分钟幻兽帕鲁服务器搭建教程。《幻兽帕鲁》是一款由Pocketpair开发的开放世界生存制作游戏。该游戏于2023年11月2日至11月5日进行了封闭网络测试，于2024年1月18日发行抢先体验
                    
                    iOS开发技巧-UIImageView 的contentMode属性说明和使用
                        Pandakingli

                        contentMode这个属性是用来设置图片的显示方式，如居中、居右，是否缩放等。苹果api里面的说明typedefNS_ENUM(NSInteger,UIViewContentMode){UIViewContentModeScaleToFill,UIViewContentModeScaleAspectFit,//contentsscaledtofitwithfixedaspect.remaind
                    
                    AI应用开发-git开源项目的一些问题及镜像解决办法
                        写代码的中青年
AI应用开发人工智能gitgithubvisualstudiovscodegitlab
                        AI应用开发相关目录本专栏包括AI应用开发相关内容分享，包括不限于AI算法部署实施细节、AI应用后端分析服务相关概念及开发技巧、AI应用后端应用服务相关概念及开发技巧、AI应用前端实现路径及开发技巧适用于具备一定算法及Python使用基础的人群AI应用开发流程概述VisualStudioCode及RemoteDevelopment插件远程开发git开源项目的一些问题及镜像解决办法文章目录AI应用开
                    
                    AI应用开发-Visual Studio Code及Remote Development插件远程开发
                        写代码的中青年
AI应用开发人工智能vscodeide编辑器
                        AI应用开发相关目录本专栏包括AI应用开发相关内容分享，包括不限于AI算法部署实施细节、AI应用后端分析服务相关概念及开发技巧、AI应用后端应用服务相关概念及开发技巧、AI应用前端实现路径及开发技巧适用于具备一定算法及Python使用基础的人群AI应用开发流程概述VisualStudioCode及RemoteDevelopment插件远程开发文章目录AI应用开发相关目录本机：win10-vscod
                    
                    AI应用开发-python实现UDP报文通信
                        写代码的中青年
AI应用开发人工智能pythonudp
                        AI应用开发相关目录本专栏包括AI应用开发相关内容分享，包括不限于AI算法部署实施细节、AI应用后端分析服务相关概念及开发技巧、AI应用后端应用服务相关概念及开发技巧、AI应用前端实现路径及开发技巧适用于具备一定算法及Python使用基础的人群AI应用开发流程概述VisualStudioCode及RemoteDevelopment插件远程开发git开源项目的一些问题及镜像解决办法python实现U
                    
                    关于KVC和KVO
                        游走的Fish

                        前言KVC/KVO在日常开发中也是经常会使用到，但是还是回到那句话，往往我们在使用一种技术时，却不知道实现原理，以及会忽略一些使用时需要注意的地方。这篇文章会对KVC/KVO做一些原理性的说明，至于使用方式，大家自行度娘，网上还是挺多了，这里就不浪费ctrl+c了。希望文章对大家有帮助，同时欢迎大家指正、交流。这篇主要说说KVO，关于KVC的相关请看这篇文章：iOS开发技巧系列---详解KVC(我
                    
                    【GameFramework框架】一、框架介绍
                        恬静的小魔龙
#GameFramework框架unity游戏引擎c#
                        推荐阅读CSDN主页GitHub开源地址Unity3D插件分享简书地址我的个人博客大家好，我是佛系工程师☆恬静的小魔龙☆，不定时更新Unity开发技巧，觉得有用记得一键三连哦。一、前言【GameFramework框架】系列教程目录：https://blog.csdn.net/q764424567/article/details/135831551这是GameFramework框架教程的第一篇，但是
                    
                    【Unity3D小功能】Unity3D中Text使用超链接并绑定点击事件
                        恬静的小魔龙
#Unity3D之日常开发#Unity3D之小功能unity游戏引擎编辑器bugc#
                        推荐阅读CSDN主页GitHub开源地址Unity3D插件分享简书地址我的个人博客大家好，我是佛系工程师☆恬静的小魔龙☆，不定时更新Unity开发技巧，觉得有用记得一键三连哦。一、前言在开发中遇到了要给Text加超链接的需求，研究了实现方式，将代码和使用方法总结出来，分享一下。二、正文2-1、实现思路主要有两种实现思路，一种是使用TextMeshPro，可以直接加入超链接，实现点击事件。另一种，就
                    
                    【Spring注解探秘】高效开发技巧与实战案例解析
                        墨苏玩电脑
springjava后端
                        让我们更深入地探讨Spring注解的特殊技巧和实际应用案例。@Component特殊技巧：使用@ComponentScan指定包路径，Spring会自动扫描并注册所有带有@Component及其衍生注解的类。结合@Lazy注解，可以实现延迟初始化，即在第一次使用时才创建bean。案例：@Configuration@ComponentScan(basePackages="com.example.my
                    
                    Pandas处理Excel文件的实用指南 - Python开发技巧XI
                        一路向东_
Pythonpythonexcel开发语言
                        处理Excel文件是数据分析师日常工作中的常见任务之一。幸运的是，Python的Pandas库提供了一套强大的工具，使得读取、处理和写入Excel文件变得既清晰又快捷。在本篇博客中，我们将探讨如何使用Pandas的read_excel方法来读取Excel文件，以及如何遍历和修改DataFrame中的数据。安装openpyxl是因为pandas读完excel需要。pipinstallopenpyxl
                    
                    java技巧提升指南
                        KingDol_MIni
数据结构和算法其他技术java开发语言
                        面向对象开发技巧指南使用工厂模式创建对象工厂模式是一种常见的设计模式，用于创建对象，提供了一种灵活、可扩展的方式来实例化类。下面是一个简单的工厂模式的示例，展示了如何通过工厂类创建不同类型的产品对象。//产品接口interfaceProduct{voiddoSomething();}//具体产品实现类AclassConcreteProductAimplementsProduct{@Override
                    
                                Nginx负载均衡
                                    510888780
nginx应用服务器
                                    Nginx负载均衡一些基础知识: 
 
nginx 的 upstream目前支持 4 种方式的分配 
1)、轮询（默认） 
      每个请求按时间顺序逐一分配到不同的后端服务器，如果后端服务器down掉，能自动剔除。 
2)、weight 
      指定轮询几率，weight和访问比率成正比
                                
                                RedHat 6.4 安装 rabbitmq
                                    bylijinnan
erlangrabbitmqredhat
                                    在 linux 下安装软件就是折腾，首先是测试机不能上外网要找运维开通，开通后发现测试机的 yum 不能使用于是又要配置 yum 源，最后安装 rabbitmq 时也尝试了两种方法最后才安装成功 
 
机器版本： 
 
[root@redhat1 rabbitmq]# lsb_release
LSB Version:    :base-4.0-amd64:base-4.0-noarch:core
                                
                                FilenameUtils工具类
                                    eksliang
FilenameUtilscommon-io
                                    转载请出自出处：http://eksliang.iteye.com/blog/2217081 一、概述 
这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。 非常的好用。 
                                
                                xml文件解析SAX
                                    不懂事的小屁孩
xml
                                    xml文件解析:xml文件解析有四种方式， 
1.DOM生成和解析XML文档(SAX是基于事件流的解析) 
2.SAX生成和解析XML文档(基于XML文档树结构的解析) 
3.DOM4J生成和解析XML文档 
4.JDOM生成和解析XML  
本文章用第一种方法进行解析，使用android常用的DefaultHandler 
 
 
import org.xml.sax.Attributes;

                                
                                通过定时任务执行mysql的定期删除和新建分区，此处是按日分区
                                    酷的飞上天空
mysql
                                    使用python脚本作为命令脚本，linux的定时任务来每天定时执行 
  
#!/usr/bin/python
# -*- coding: utf8 -*-
import pymysql
import datetime
import calendar

#要分区的表
table_name = 'my_table'
#连接数据库的信息
host,user,passwd,db = 
                                
                                如何搭建数据湖架构？听听专家的意见
                                    蓝儿唯美
架构
                                    Edo Interactive在几年前遇到一个大问题：公司使用交易数据来帮助零售商和餐馆进行个性化促销，但其数据仓库没有足够时间去处理所有的信用卡和借记卡交易数据 
 “我们要花费27小时来处理每日的数据量，”Edo主管基础设施和信息系统的高级副总裁Tim Garnto说道：“所以在2013年，我们放弃了现有的基于PostgreSQL的关系型数据库系统，使用了Hadoop集群作为公司的数
                                
                                spring学习——控制反转与依赖注入
                                    a-john
spring
                                           控制反转（Inversion of Control，英文缩写为IoC）是一个重要的面向对象编程的法则来削减计算机程序的耦合问题，也是轻量级的Spring框架的核心。 控制反转一般分为两种类型，依赖注入（Dependency Injection，简称DI）和依赖查找（Dependency Lookup）。依赖注入应用比较广泛。 
  

                                
                                用spool+unixshell生成文本文件的方法
                                    aijuans
xshell
                                    例如我们把scott.dept表生成文本文件的语句写成dept.sql,内容如下:  
　　set pages 50000; 
　　set lines 200; 
　　set trims on; 
　　set heading off; 
　　spool /oracle_backup/log/test/dept.lst; 
　　select deptno||','||dname||','||loc 
                                
                                1、基础--名词解析(OOA/OOD/OOP)
                                    asia007
学习基础知识
                                    OOA:Object-Oriented Analysis（面向对象分析方法） 
是在一个系统的开发过程中进行了系统业务调查以后，按照面向对象的思想来分析问题。OOA与结构化分析有较大的区别。OOA所强调的是在系统调查资料的基础上，针对OO方法所需要的素材进行的归类分析和整理，而不是对管理业务现状和方法的分析。 
　　OOA（面向对象的分析）模型由5个层次（主题层、对象类层、结构层、属性层和服务层）
                                
                                浅谈java转成json编码格式技术
                                    百合不是茶
json编码java转成json编码
                                    json编码;是一个轻量级的数据存储和传输的语言 
   
   在java中需要引入json相关的包,引包方式在工程的lib下就可以了 
  
JSON与JAVA数据的转换（JSON 即 JavaScript Object Natation，它是一种轻量级的数据交换格式，非 
  
常适合于服务器与 JavaScript 之间的数据的交
                                
                                web.xml之Spring配置(基于Spring+Struts+Ibatis)
                                    bijian1013
javaweb.xmlSSIspring配置
                                    指定Spring配置文件位置 
<context-param>
		<param-name>contextConfigLocation</param-name>
		<param-value>
			/WEB-INF/spring-dao-bean.xml,/WEB-INF/spring-resources.xml,
			/WEB-INF/
                                
                                Installing SonarQube（Fail to download libraries from server）
                                    sunjing
InstallSonar
                                    1.  Download and unzip the SonarQube distribution  
2.  Starting the Web Server 
The default port is "9000" and the context path is "/". These values can be changed in &l
                                
                                【MongoDB学习笔记十一】Mongo副本集基本的增删查
                                    bit1129
mongodb
                                    一、创建复本集 
  
假设mongod,mongo已经配置在系统路径变量上，启动三个命令行窗口，分别执行如下命令： 
  
mongod --port 27017 --dbpath  data1 --replSet rs0

mongod --port 27018 --dbpath  data2 --replSet rs0

mongod --port 27019 -
                                
                                Anychart图表系列二之执行Flash和HTML5渲染
                                    白糖_
Flash
                                    今天介绍Anychart的Flash和HTML5渲染功能 
  
 
 HTML5 
 
Anychart从6.0第一个版本起，已经逐渐开始支持各种图的HTML5渲染效果了，也就是说即使你没有安装Flash插件，只要浏览器支持HTML5，也能看到Anychart的图形（不过这些是需要做一些配置的）。 
这里要提醒下大家，Anychart6.0版本对HTML5的支持还不算很成熟，目前还处于
                                
                                Laravel版本更新异常4.2.8-> 4.2.9 Declaration of ... CompilerEngine ... should be compa
                                    bozch
laravel
                                    昨天在为了把laravel升级到最新的版本，突然之间就出现了如下错误： 
ErrorException thrown with message "Declaration of Illuminate\View\Engines\CompilerEngine::handleViewException() should be compatible with Illuminate\View\Eng
                                
                                编程之美-NIM游戏分析-石头总数为奇数时如何保证先动手者必胜
                                    bylijinnan
编程之美
                                    


import java.util.Arrays;
import java.util.Random;

public class Nim {

	/**编程之美 NIM游戏分析
问题：
有N块石头和两个玩家A和B，玩家A先将石头随机分成若干堆，然后按照BABA...的顺序不断轮流取石头，
能将剩下的石头一次取光的玩家获胜，每次取石头时，每个玩家只能从若干堆石头中任选一堆，
                                
                                lunce创建索引及简单查询
                                    chengxuyuancsdn
查询创建索引lunce
                                    import java.io.File;
import java.io.IOException;

import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apache.lucene.document.Docume
                                
                                [IT与投资]坚持独立自主的研究核心技术
                                    comsci
it
                                     
 
       和别人合作开发某项产品....如果互相之间的技术水平不同,那么这种合作很难进行,一般都会成为强者控制弱者的方法和手段..... 
 
 
       所以弱者,在遇到技术难题的时候,最好不要一开始就去寻求强者的帮助,因为在我们这颗星球上,生物都有一种控制其
                                
                                flashback transaction闪回事务查询
                                    daizj
oraclesql闪回事务
                                       
闪回事务查询有别于闪回查询的特点有以下3个： 
 
（1）其正常工作不但需要利用撤销数据，还需要事先启用最小补充日志。 
 
（2）返回的结果不是以前的“旧”数据，而是能够将当前数据修改为以前的样子的撤销SQL（Undo SQL）语句。 
 
（3）集中地在名为flashback_transaction_query表上查询，而不是在各个表上通过“as of”或“vers
                                
                                Java I/O之FilenameFilter类列举出指定路径下某个扩展名的文件
                                    游其是你
FilenameFilter
                                    这是一个FilenameFilter类用法的例子，实现的列举出“c:\\folder“路径下所有以“.jpg”扩展名的文件。        1   2   3   4   5   6   7   8   9   10   11   12   13   14   15   16   17   18   19   20   21   22   23   24   25   26   27   28  
                                
                                C语言学习五函数，函数的前置声明以及如何在软件开发中合理的设计函数来解决实际问题
                                    dcj3sjt126com
c
                                    # include <stdio.h>

int f(void)		//括号中的void表示该函数不能接受数据，int表示返回的类型为int类型
{
	return 10;	//向主调函数返回10
}

void g(void)	//函数名前面的void表示该函数没有返回值
{
	//return 10;	//error 与第8行行首的void相矛盾
}

in
                                
                                今天在测试环境使用yum安装，遇到一个问题： Error: Cannot retrieve metalink for repository: epel. Pl
                                    dcj3sjt126com
centos
                                    今天在测试环境使用yum安装，遇到一个问题： 
Error: Cannot retrieve metalink for repository: epel. Please verify its path and try again 
  
处理很简单，修改文件“/etc/yum.repos.d/epel.repo”， 将baseurl的注释取消， mirrorlist注释掉。即可。 
&n
                                
                                单例模式
                                    shuizhaosi888
单例模式
                                    单例模式        懒汉式 
public class RunMain {

	/**
	 * 私有构造
	 */
	private RunMain() {
	}
	
    /**
     * 内部类，用于占位，只有
     */
	private static class SingletonRunMain {
		priv
                                
                                Spring Security（09）——Filter
                                    234390216
Spring Security
                                    Filter 
目录 
1.1     Filter顺序 
1.2     添加Filter到FilterChain 
1.3     DelegatingFilterProxy 
1.4     FilterChainProxy 
1.5
                                
                                公司项目NODEJS实践0.1
                                    逐行分析JS源代码
mongodbnginxubuntunodejs
                                      
一、前言 
        前端如何独立用nodeJs实现一个简单的注册、登录功能，是不是只用nodejs+sql就可以了？其实是可以实现，但离实际应用还有距离，那要怎么做才是实际可用的。 
        网上有很多nod
                                
                                java.lang.Math
                                    liuhaibo_ljf
javaMathlang
                                    System.out.println(Math.PI); 
System.out.println(Math.abs(1.2)); 
System.out.println(Math.abs(1.2)); 
System.out.println(Math.abs(1)); 
System.out.println(Math.abs(111111111)); 
System.out.println(Mat
                                
                                linux下时间同步
                                    nonobaba
ntp
                                    今天在linux下做hbase集群的时候，发现hmaster启动成功了，但是用hbase命令进入shell的时候报了一个错误  PleaseHoldException: Master is initializing，查看了日志，大致意思是说master和slave时间不同步，没办法，只好找一种手动同步一下，后来发现一共部署了10来台机器，手动同步偏差又比较大，所以还是从网上找现成的解决方
                                
                                ZooKeeper3.4.6的集群部署
                                    roadrunners
zookeeper集群部署
                                    ZooKeeper是Apache的一个开源项目，在分布式服务中应用比较广泛。它主要用来解决分布式应用中经常遇到的一些数据管理问题，如：统一命名服务、状态同步、集群管理、配置文件管理、同步锁、队列等。这里主要讲集群中ZooKeeper的部署。 
  
1、准备工作 
我们准备3台机器做ZooKeeper集群，分别在3台机器上创建ZooKeeper需要的目录。 
  
数据存储目录
                                
                                Java高效读取大文件
                                    tomcat_oracle
java
                                    　　读取文件行的标准方式是在内存中读取，Guava 和Apache Commons IO都提供了如下所示快速读取文件行的方法：   　　Files.readLines(new File(path), Charsets.UTF_8);   　　FileUtils.readLines(new File(path));   　　这种方法带来的问题是文件的所有行都被存放在内存中，当文件足够大时很快就会导致
                                
                                微信支付api返回的xml转换为Map的方法
                                    xu3508620
xmlmap微信api
                                    举例如下： 
<xml> 
   <return_code><![CDATA[SUCCESS]]></return_code> 
   <return_msg><![CDATA[OK]]></return_msg> 
   <appid><
                                
                
            
        
    


    
        
            按字母分类：
            ABCDEFGHIJKLMNOPQRSTUVWXYZ其他
        
    


    
        
            首页 -
            关于我们 -
            站内搜索 -
            Sitemap -
            侵权投诉
        
        版权所有 IT知识库 CopyRight © 2000-2050 E-COM-NET.COM , All Rights Reserved.