PHP使用DomDocument抓取HTML内容

有时候会有需要从一个HTML页面来分离出你需要的一些数据来进行处理。

当然自己分析文件肯定可以，但是比较快速且方便的是使用正则表达式或者DOM。

鉴于正则表达式我不熟悉，所以我打算使用DOM来完成。

先谈谈我的需求，我要从一个HTML页面的一个表格中提取数据并且将这个数据整理出来加入到MySQL数据库中。

假设目标HTML中我感兴趣的Table有3列，分别是ID，Name，内容。

index.php;

 
        <?php 
       
        /* 
       
        * To change this template, choose Tools | Templates 
       
        * and open the template in the editor. 
       
        */ 
       
        $urlTarget 
        =  
        "http://www.xxxx.com/targethtmlpage.html" 
        ; 
       
        require_once 
        ( 
        'ContentManager.php' 
        ); 
       
        //建立Dom对象，分析HTML文件； 
       
        $htmDoc 
        =  
        new 
        DOMDocument; 
       
        $htmDoc 
        ->loadHTMLFile( 
        $urlTarget 
        ); 
       
        $htmDoc 
        ->normalizeDocument(); 
       
        //获得到此文档中每一个Table对象； 
       
        $tables_list 
        =  
        $htmDoc 
        ->getElementsByTagName( 
        'table' 
        ); 
       
        //测试Table Count； 
       
        $tables_count 
        =  
        $tables_list 
        ->length; 
       
        foreach 
        ( 
        $tables_list 
        as 
        $table 
        ) 
       
        { 
       
        //得到Table对象的class属性 
       
        $tableProp 
        =  
        $table 
        ->getAttribute( 
        'class' 
        ); 
       
        if 
        ( 
        $tableProp 
        ==  
        'target_table_class' 
        ) 
       
        { 
       
        $contentMgr 
        =  
        new 
        ContentManager(); 
       
        $contentMgr 
        ->ParseFromDOMElement( 
        $table 
        ); 
       
        //这里myParser就完成了分析动作。然后就可以进行需要的操作了。 
       
        //比如写入MySQL。 
       
        $contentMgr 
        ->SerializeToDB(); 
       
        } 
       
        } 
       
        ?>

ContentManager.php

 
        <?php 
       
        /* 
       
        * To change this template, choose Tools | Templates 
       
        * and open the template in the editor. 
       
        */ 
       
        /** 
       
        * Description of ContentParser 
       
        * 
       
        * @author xxxxx 
       
        */ 
       
        require_once 
        ( 
        'ContentInfo.php' 
        ); 
       
        class 
        ContentManager { 
       
        //put your code here 
       
        var 
        $ContentList 
        ; 
       
        public 
        function 
        __construct() { 
       
        $this 
        ->ContentList =  
        new 
        ArrayObject(); 
       
        } 
       
        public 
        function 
        ParseFromDOMElement(DOMElement  
        $table 
        ) 
       
        { 
       
        $rows_list 
        =  
        $fundsTable 
        ->getElementsByTagName( 
        'tr' 
        ); 
       
        $rows_length 
        =  
        $rows_list 
        ->length; 
       
        $index 
        = 0; 
       
        foreach 
        ( 
        $rows_list 
        as 
        $row 
        ) 
       
        { 
       
        $contentInfo 
        =  
        new 
        ContentInfo(); 
       
        $contentInfo 
        ->ParseFromDOMElement( 
        $row 
        ); 
       
        $this 
        ->ContentList->append ( 
        $contentInfo 
        ); 
       
        } 
       
        //test how many contents parsed. 
       
        $count 
        =  
        $this 
        ->fundsInfoArray-> 
        count 
        (); 
       
        echo 
        $count 
        ; 
       
        } 
       
        public 
        function 
        SerializeToDB() 
       
        { 
       
        //写入数据库，代码略。 
       
        } 
       
        } 
       
        ?>

contentinfo.php

 
         <?php 
        
         /* 
        
         * To change this template, choose Tools | Templates 
        
         * and open the template in the editor. 
        
         */ 
        
         /** 
        
         * Description of ContentInfo 
        
         * 
        
         * @author xxxxx 
        
         */ 
        
         class 
         ContentInfo { 
        
         //put your code here 
        
         var 
         $ID 
         ; 
        
         var 
         $Name 
         ; 
        
         var 
         $Content 
         ; 
        
         public 
         function 
         ParseFromDOMElement(DOMElement  
         $row 
         ) 
        
         { 
        
         $cells_list 
         =  
         $row 
         ->getElementsByTagName( 
         'td' 
         ); 
        
         $cells_length 
         =  
         $row 
         ->length; 
        
         $curCellIdx 
         = 0; 
        
         foreach 
         ( 
         $cells_list 
         as 
         $cell 
         ) 
        
         { 
        
         switch 
         ( 
         $curCellIdx 
         ++) 
        
         { 
        
         case 
         0: 
        
         $this 
         ->ID =  
         $cell 
         ->nodeValue; 
        
         break 
         ; 
        
         case 
         1: 
        
         $this 
         ->Name =  
         $cell 
         ->nodeValue; 
        
         break 
         ; 
        
         case 
         2: 
        
         $this 
         ->Content =  
         $cell 
         ->nodeValue; 
        
         break 
         ; 
        
         } 
        
         } 
        
         } 
        
         } 
        
         ?>

一点小心得，DOM中每个Element都可以getAttribute取出属性，这些属性可以区分你分析的DOMObject。

举例来说，比如上述我分析的Target HTML有很多表格，但是我发现目标表格的class属性和其他表格是不一样的。

所以，这个属性就可以来区分我要分析的是哪个表格。

当然更多DOM的东西，大家可以去参考PHP Manual或者是，用IDE（NetBeans7.0就可以）转到类声明，看类接口。

有方法使用说明以及参数说明。可以参考参考。

转载自：http://blog.csdn.net/xyzhaopeng/article/details/6626340

你可能感兴趣的:(document)

html 中如何使用 uniapp 的部分方法某公司摸鱼前端 html uni-app 前端
示例代码：Documentconsole.log(window);效果展示：好了，现在就可以uni.使用相关的方法了
vue+el-table 可输入表格使用上下键进行input框切换以对_ vue学习记录 vue.js javascript 前端
使用上下键进行完工数量这一列的切换-->//键盘触发事件show(ev,index){letnewIndex;letinputAll=document.querySelectorAll('.table_inputinput');//向上=38if(ev.keyCode==38){if(index==0){//如果是第一行,回到最后一个newIndex=inputAll.length-1}elsei
使用由 Python 编写的 lxml 实现高性能 XML 解析 hunyxv python 笔记 python xml
转载自：文章lxml简介Python从来不出现XML库短缺的情况。从2.0版本开始，它就附带了xml.dom.minidom和相关的pulldom以及SimpleAPIforXML(SAX)模块。从2.4开始，它附带了流行的ElementTreeAPI。此外，很多第三方库可以提供更高级别的或更具有python风格的接口。尽管任何XML库都足够处理简单的DocumentObjectModel(DOM
02-Cesium聚合分析EntityCluster完整代码 fxshy html css javascript
1.完整代码Document-->-->Cesium.Ion.defaultAccessToken='eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9.eyJqdGkiOiJhZjZkZDAwZC1mNTFhLTRhOTEtOGExNi00MzRhNGIzMDdlNDQiLCJpZCI6MTA1MTUzLCJpYXQiOjE2NjA4MDg0Njd9.qajeJtc4-kp
创建一个完整的购物商城系统是一个复杂的项目，涉及前端（用户界面）、后端（服务器逻辑）、数据库等多个部分。由于篇幅限制，我无法在这里提供一个完整的系统代码，但我可以分别给出一些关键部分的示例代码，涵盖几 uthRaman 前端 ui 服务器
前端（HTML/CSS/JavaScript）grsyzp.cnHTML页面结构（index.html）html购物商城欢迎来到购物商城JavaScript（Ajax请求商品数据，app.js）javascriptdocument.addEventListener('DOMContentLoaded',function(){fetch('/api/products').then(response=
【代码模板】可视化 xuanyu22 SOP opencv 计算机视觉人工智能
PillowDocumentdataformat-(H,W,C),RGBdatadtype-np.uint8valuerange-(0,255)fromPILimportImage#Readimagesimg=Image.open("img.png").convert('RGB')#读取RGB图像img=Image.open("img.png").convert('L')#读取灰度图像(H,W)u
JS的输出语句 3259392566 java总结笔记 java的数据类型基础总结 javascript 前端开发语言
1.//1.提示浏览器弹出一个警示框alert('你好呀！！！2109秋')//2.让计算机在页面输出一个内容//document.write()向body里面输出一个内容document.write('你好呀！！！金科')//3.向控制台输出一个内容console.log('你猜我在哪里？');2.JS的代码编写的位置①我们可以将js的代码编写道标签onclick属性中，当我们点击代码时，js代
SpringBoot 设置传入参数非必要 loveLifeLoveCoding springboot spring boot java spring
查看RequestParam源码packageorg.springframework.web.bind.annotation;importjava.lang.annotation.Documented;importjava.lang.annotation.ElementType;importjava.lang.annotation.Retention;importjava.lang.annotat
document获取元素的方法小成语 js 平时 js
js学习总结----DOM获取元素的方法（8个）DOM:documentobjectmodel文档对象模型DOM就是描述整个html页面中节点关系的图谱，可以如下图理解在DOM中，提供了很多的获取元素的方法和之间关系的属性以及操作这些元素的方法。1、获取页面中元素的方法1）、document.getElementById('元素的ID')在整个文档中，通过元素的ID获取到这个元素对象(获取的是一个
⭐Unity 安卓环境中正确地读取和处理 XML 文件惊鸿醉 Unity unity android xml
写了一个选择题Demo，电脑包和编辑器内无问题，但是打包安卓手机之后题目无法正常使用，想到的是安卓环境中正确地读取文件的问题改进方案：1.由于XmlDocument.Load方法在Android上的路径问题（由于文件位于APK内部，无法像在文件系统中那样直接访问），需要先使用UnityWebRequest来异步加载文件内容，然后再解析XML。2.异步处理：修改你的代码，以支持异步文件加载和处理，这
html ul点击删除,用原生实现点击删除点击的li weixin_39993454 html ul点击删除
简单的实现方式#button{display:inline-block;}ul{list-style:none;}li{background-color:red;display:inline-block;width:20px;padding:10px;margin-left:3px;color:white;}window.onload=function(){varoBtn1=document.ge
Linux删除监听端口进程,linux只端口监听及杀死进程探旅 Linux删除监听端口进程
itextpdf生成pdf文件一.简介itextpdf是一个开源的允许你去创建和操作PDF文档的库.它使的开发者可以提高web和其他应用来动态地生成或操作PDF文档.通过iText中的Document和PdfWriter类,...QtSizePolicy属性控件的sizePolicy说明控件在布局管理中的缩放方式.Qt提供的控件都有一个合理的缺省sizePolicy,但是这个缺省值有时不能适合所有
js原生给生成的html添加点击事件,原生js为动态元素添加监听事件习翔宇
//已存在div//创建标签functioncreatepage(){varspan=document.createElement('span')span.innerHTML=“测试span”//设置属性span.setAttribute("class","gopage");varpagenum=document.getElementById("pagenum")pagenum.appendChi
HTML添加文字若无心_. HTML html5
一、创建HTML5文档基本标签//定义文档类型//定义HTML文档//定义关于文档的信息文档标题//定义文档的标题//定义文档的字符编码//定义文档的主体二、文字相关标签1.标题文字-标签可定义标题。定义最大的标题。定义最小的标题。Document这是标题1这是标题2这是标题3这是标题4这是标题5这是标题62.文本段落Document这次会晤的主题是“金砖国家在非洲：在第四次工业革命中共谋包容增长
Jacoco的XML报告详解 CrissChan 自动化测试持续交付和持续测试 jacoco 测试
使用jacococli完成jacoco测试报告生成后，会看到有一个.xml结尾的文件，这个就是xml格式的覆盖率报告。除了xml还有csv、html格式的报告，本文进介绍xml报告。DTD文件在介绍jacoco的xml报告之前，我们应该先看一下对应的DTD文件的内容。(DTD的全称为DocumentTypeDefinition，是一种文件定义格式，它规定了XML文件结构为XML文件提供了语法与规则
python工程打包成whl文件机灵巢穴_WitNest python python 开发语言
资料：PackagingPythonProjects—PythonPackagingUserGuide6.Modules—Python3.11.4documentation步骤1.安装打包工具python3-mpipinstallsetuptoolswheeltwine2.更新pip工具python3-mpipinstall--upgradepip3.创建工程结构python_test_packa
微信分享到朋友圈,怎么自定义分享的标题,图片,内容? 八分造作
vartit=$('#wx-title').val();//标题varimg=$('#wx-img').val();//图片varcon=$('#wx-con').val();//简介varlink=$('#wx-link').val();//链接document.addEventListener('WeixinJSBridgeReady',functiononBridgeReady(){//发送
NoClassDefFoundError: org.apache.poi.POIXMLDocument问题排查解决 qinmingjun718 apache
java.lang.NoClassDefFoundError:org/apache/poi/POIXMLDocumentPart这错很明显就是没找到这个类POIXMLDocumentPart就是找不到类问题原因是大概是因为poi从3.1.X低版本版本升级到pio4.1.2高版本的后与org.apache.poi.xwpf.converter.core-1.0.6.jar不兼容问题，导致这个情况的主
【HTML】元素自定义属性设置与获取（两种方式-含data-*） Sam9029 html 前端 javascript
介绍了两种自定义属性的方式一：完全自定义二：data-*内置的自定义方式1.自定义属性名Clickme!varbtn=document.querySelector('button')console.log(btn.getAttribute('desc'))//获取属性值btn.setAttribute('tip','pleaseclickbutton')//设置属性值–2.data-*自定义属性名
redis,codis,云redis shuff1e
redis的分布式解决方式--codis（转）https://www.cnblogs.com/softidea/p/5365640.htmlhttps://help.aliyun.com/document_detail/57797.html?spm=5176.173352.925244.2.bF70Gb
5分钟熟练上手ES的具体使用佚名涙 elasticsearch jenkins 大数据学习
5分钟上手ES的具体使用相信有很多同学想要去学习elk时会使用docker等一些方式去下载相关程序，但提到真正去使用es的一系列操作时又会知之甚少。于是这一篇博客应运而生。本文就以下载好elk/efk系统后应该如何去使用为例，介绍es的具体操作。es关键字基本概念索引（Index）：类似于关系型数据库中的“数据库”，是数据存储的容器。文档（Document）：类似于关系型数据库中的“行”，是JSO
vue前端根据接口返回的url 下载图片爱心觉罗晓宇 java 前端服务器
downloadPicture(imgSrc,name){constimage=newImage();//解决跨域Canvas污染问题image.setAttribute("crossOrigin","anonymous");image.src=imgSrc;image.onload=()=>{constcanvas=document.createElement("canvas");canvas.
AI学习笔记：pdf-document-layout-analysis hillstream3 人工智能学习笔记 pdf AI编程 nlp
一直在学AI，但没有连续的时间来尝试。现在终于失业了，有大把连续的时间来动手。之前准备了一台I5-1400F+RTX360012G的电脑，现在终于派上用场了。由于一直在从事无线通信相关的工作，所以，拿到一份很长的AI可能与通信在哪些方面，能够结合的pdf文档。所以，打算从这份文档开始入手。第一个找到的项目的是这个：https://huggingface.co/HURIDOCS/pdf-docume
JavaScript 中 xml 的解析（dom4j 解析器），web前端开发规范手册 2401_84094868 程序员前端 javascript xml
创建元素：Elementschool=DocumentHelper.createElement(“school”);创建文本：school.addText(“光明小学”);指定位置添加：list.add(1,school);回写xml：和在末尾添加一样7、获取属性值attributeValue()：获取属性值publicstaticvoidmain(String[]args)throwsDocum
OpenAI gym: How to get complete list of ATARI environments 营赢盈英 AI ai deep learning openai gym reinforcement learning
题意：OpenAIGym：如何获取完整的ATARI环境列表问题背景：IhaveinstalledOpenAIgymandtheATARIenvironments.IknowthatIcanfindalltheATARIgamesinthedocumentationbutisthereawaytodothisinPython,withoutprintinganyotherenvironments(e
使用D3.js进行数据可视化环能jvav大师信息可视化前端框架 javascript 开发语言
D3.js介绍D3.js是一个流行的JavaScript数据可视化库，全称为Data-DrivenDocuments，即数据驱动文档。它以数据为核心，通过数据来驱动文档的展示和操作。D3.js提供了丰富的API和工具，使得开发者能够创建出各种交互式和动态的数据可视化效果。官方介绍网站：WhatisD3?|D3byObservableD3.js导入方式介绍在JavaScript中导入D3.js通常使
iframe 双向实时通信徐同保 javascript 前端 vue.js
父：handleAdd()">按钮{{count}}import{onMounted,ref}from"vue";constcount=ref(0);consthandleAdd=()=>{count.value++;letiframe:any=document.getElementById('m-iframe')letmessage={target:'iframe',data:'Hello,Ia
Java pdf转jpg tanzongbiao Java java eureka 开发语言
org.apache.pdfboxfontbox2.0.26org.apache.pdfboxpdfbox2.0.26PdfToJpgUtil.jpgpackagecom.qyj.utils;importorg.apache.pdfbox.pdmodel.PDDocument;importorg.apache.pdfbox.pdmodel.PDPageTree;importorg.apache.p
坑爹的 xwiki 二次开发 iamdll xwiki
boss提出一个需求，要对xwiki进行二次开发，建立一系列的模板来满足不同团队的文档需求。其中，需要在页面上实现一级tag的选择，然后根据一级tag去display二级tag，并且在将相应的tag加到tag云中。为了这件事情，我调研了2天，其中各种文档缺失--xwiki的document就是一坨乱七八糟，杂乱无章，除了不停的search，没有任何办法。调研结果：能不能做呢-肯定是可以的，好不好做
java pdf转jpg gonepoo 工具类 java pdf pdf转jpg jpg 代码
packagecom.xxx;importorg.apache.pdfbox.pdmodel.PDDocument;importorg.apache.pdfbox.pdmodel.PDPageTree;importorg.apache.pdfbox.rendering.PDFRenderer;importjavax.imageio.ImageIO;importjava.awt.image.Buff
插入表主键冲突做更新 a-john
有以下场景：用户下了一个订单，订单内的内容较多，且来自多表，首次下单的时候，内容可能会不全（部分内容不是必须，出现有些表根本就没有没有该订单的值）。在以后更改订单时，有些内容会更改，有些内容会新增。问题：如果在sql语句中执行update操作，在没有数据的表中会出错。如果在逻辑代码中先做查询，查询结果有做更新，没有做插入，这样会将代码复杂化。解决： mysql中提供了一个sql语
Android xml资源文件中@、@android:type、@*、？、@+含义和区别 Cb123456 @+@?@*
一.@代表引用资源 1.引用自定义资源。格式：@[package:]type/name android：text="@string/hello" 2.引用系统资源。格式：@android:type/name android:textColor="@android:color/opaque_red"
数据结构的基本介绍天子之骄数据结构散列表树、图线性结构价格标签
数据结构的基本介绍数据结构就是数据的组织形式，用一种提前设计好的框架去存取数据，以便更方便，高效的对数据进行增删查改。正确选择合适的数据结构，对软件程序的高效执行的影响作用不亚于算法的设计。此外，在计算机系统中数据结构的作用也是非同小可。例如常常在编程语言中听到的栈，堆等，就是经典的数据结构。经典的数据结构大致如下：一：线性数据结构 (1)：列表 a
通过二维码开放平台的API快速生成二维码一炮送你回车库 api
现在很多网站都有通过扫二维码用手机连接的功能，联图网(http://www.liantu.com/pingtai/)的二维码开放平台开放了一个生成二维码图片的Api,挺方便使用的。闲着无聊，写了个前台快速生成二维码的方法。 html代码如下:(二维码将生成在这div下) ? 1 &nbs
ImageIO读取一张图片改变大小 3213213333332132 java IO image BufferedImage
package com.demo; import java.awt.image.BufferedImage; import java.io.File; import java.io.IOException; import javax.imageio.ImageIO; /** * @Description 读取一张图片改变大小 * @author FuJianyon
myeclipse集成svn（一针见血） 7454103 eclipse SVN MyEclipse
&n
装箱与拆箱----autoboxing和unboxing darkranger J2SE
4.2　自动装箱和拆箱基本数据(Primitive)类型的自动装箱(autoboxing)、拆箱(unboxing)是自J2SE 5.0开始提供的功能。虽然为您打包基本数据类型提供了方便，但提供方便的同时表示隐藏了细节，建议在能够区分基本数据类型与对象的差别时再使用。 4.2.1　autoboxing和unboxing 在Java中，所有要处理的东西几乎都是对象(Object)
ajax传统的方式制作ajax aijuans Ajax
//这是前台的代码 <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <% String path = request.getContextPath(); String basePath = request.getScheme()+
只用jre的eclipse是怎么编译java源文件的？ avords java eclipse jdk tomcat
eclipse只需要jre就可以运行开发java程序了，也能自动编译java源代码，但是jre不是java的运行环境么，难道jre中也带有编译工具？还是eclipse自己实现的？谁能给解释一下呢问题补充：假设系统中没有安装jdk or jre，只在eclipse的目录中有一个jre，那么eclipse会采用该jre，问题是eclipse照样可以编译java源文件，为什么呢？ &nb
前端模块化 bee1314 模块化
背景：前端JavaScript模块化，其实已经不是什么新鲜事了。但是很多的项目还没有真正的使用起来，还处于刀耕火种的野蛮生长阶段。 JavaScript一直缺乏有效的包管理机制，造成了大量的全局变量，大量的方法冲突。我们多么渴望有天能像Java（import），Python (import)，Ruby(require)那样写代码。在没有包管理机制的年代，我们是怎么避免所
处理百万级以上的数据处理 bijian1013 oracle sql 数据库大数据查询
一.处理百万级以上的数据提高查询速度的方法： 1.应尽量避免在 where 子句中使用!=或<>操作符，否则将引擎放弃使用索引而进行全表扫描。 2.对查询进行优化，应尽量避免全表扫描，首先应考虑在 where 及 o
mac 卸载 java 1.7 或更高版本征客丶 java OS
卸载 java 1.7 或更高 sudo rm -rf /Library/Internet\ Plug-Ins/JavaAppletPlugin.plugin 成功执行此命令后，还可以执行 java 与 javac 命令 sudo rm -rf /Library/PreferencePanes/JavaControlPanel.prefPane 成功执行此命令后，还可以执行 java
【Spark六十一】Spark Streaming结合Flume、Kafka进行日志分析 bit1129 Stream
第一步，Flume和Kakfa对接，Flume抓取日志，写到Kafka中第二部，Spark Streaming读取Kafka中的数据，进行实时分析本文首先使用Kakfa自带的消息处理（脚本）来获取消息，走通Flume和Kafka的对接 1. Flume配置 1. 下载Flume和Kafka集成的插件，下载地址：https://github.com/beyondj2ee/f
Erlang vs TNSDL bookjovi erlang
TNSDL是Nokia内部用于开发电信交换软件的私有语言，是在SDL语言的基础上加以修改而成，TNSDL需翻译成C语言得以编译执行，TNSDL语言中实现了异步并行的特点，当然要完整实现异步并行还需要运行时动态库的支持，异步并行类似于Erlang的process（轻量级进程），TNSDL中则称之为hand，Erlang是基于vm(beam)开发，
非常希望有一个预防疲劳的java软件, 预防过劳死和眼睛疲劳,大家一起努力搞一个 ljy325 企业应用
　非常希望有一个预防疲劳的java软件，我看新闻和网站，国防科技大学的科学家累死了，太疲劳，老是加班，不休息，经常吃药，吃药根本就没用，根本原因是疲劳过度。我以前做java,那会公司垃圾，老想赶快学习到东西跳槽离开，搞得超负荷，不明理。深圳做软件开发经常累死人，总有不明理的人，有个软件提醒限制很好，可以挽救很多人的生命。相关新闻：（1）IT行业成五大疾病重灾区：过劳死平均37.9岁
读《研磨设计模式》-代码笔记-原型模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * Effective Java 建议使用copy constructor or copy factory来代替clone()方法： * 1.public Product copy(Product p){} * 2.publi
配置管理---svn工具之权限配置 chenyu19891124 SVN
今天花了大半天的功夫，终于弄懂svn权限配置。下面是今天收获的战绩。安装完svn后就是在svn中建立版本库，比如我本地的是版本库路径是C:\Repositories\pepos。pepos是我的版本库。在pepos的目录结构 pepos component webapps 在conf里面的auth里赋予的权限配置为 [groups]
浅谈程序员的数学修养 comsci 设计模式编程算法面试招聘
浅谈程序员的数学修养
批量执行 bulk collect与forall用法 daizj oracle sql bulk collect forall
BULK COLLECT 子句会批量检索结果，即一次性将结果集绑定到一个集合变量中，并从SQL引擎发送到PL/SQL引擎。通常可以在SELECT INTO、 FETCH INTO以及RETURNING INTO子句中使用BULK COLLECT。本文将逐一描述BULK COLLECT在这几种情形下的用法。有关FORALL语句的用法请参考：批量SQL之 F
Linux下使用rsync最快速删除海量文件的方法 dongwei_6688 OS
1、先安装rsync：yum install rsync 2、建立一个空的文件夹：mkdir /tmp/test 3、用rsync删除目标目录：rsync --delete-before -a -H -v --progress --stats /tmp/test/ log/这样我们要删除的log目录就会被清空了，删除的速度会非常快。rsync实际上用的是替换原理，处理数十万个文件也是秒删。
Yii CModel中rules验证规格 dcj3sjt126com rules yii validate
Yii cValidator主要用法分析： yii验证rulesit 分类： Yii yii的rules验证 cValidator主要属性 attributes ,builtInValidators,enableClientValidation,message,on,safe,skipOnError
基于vagrant的redis主从实验 dcj3sjt126com vagrant
平台: Mac 工具: Vagrant 系统: Centos6.5 实验目的: Redis主从实现思路制作一个基于sentos6.5, 已经安装好reids的box, 添加一个脚本配置从机, 然后作为后面主机从机的基础box 制作sentos6.5+redis的box mkdir vagrant_redis cd vagrant_
Memcached(二)、Centos安装Memcached服务器 frank1234 centos memcached
一、安装gcc rpm和yum安装memcached服务器连接没有找到，所以我使用的是make的方式安装，由于make依赖于gcc，所以要先安装gcc 开始安装，命令如下，[color=red][b]顺序一定不能出错[/b][/color]：建议可以先切换到root用户，不然可能会遇到权限问题：su root 输入密码...... rpm -ivh kernel-head
Remove Duplicates from Sorted List hcx2013 remove
Given a sorted linked list, delete all duplicates such that each element appear only once. For example,Given 1->1->2, return 1->2.Given 1->1->2->3->3, return&
Spring4新特性——JSR310日期时间API的支持 jinnianshilongnian spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
浅谈enum与单例设计模式 247687009 java 单例
在JDK1.5之前的单例实现方式有两种(懒汉式和饿汉式并无设计上的区别故看做一种)，两者同是私有构造器，导出静态成员变量，以便调用者访问。第一种 package singleton; public class Singleton { //导出全局成员 public final static Singleton INSTANCE = new S
使用switch条件语句需要注意的几点 openwrt c break switch
1. 当满足条件的case中没有break，程序将依次执行其后的每种条件（包括default）直到遇到break跳出 int main() { int n = 1; switch(n) { case 1: printf("--1--\n"); default: printf("defa
配置Spring Mybatis JUnit测试环境的应用上下文 schnell18 spring mybatis JUnit
Spring-test模块中的应用上下文和web及spring boot的有很大差异。主要试下来差异有：单元测试的app context不支持从外部properties文件注入属性 @Value注解不能解析带通配符的路径字符串解决第一个问题可以配置一个PropertyPlaceholderConfigurer的bean。第二个问题的具体实例是：
Java 定时任务总结一 tuoni java spring timer quartz timertask
Java定时任务总结一.从技术上分类大概分为以下三种方式： 1.Java自带的java.util.Timer类，这个类允许你调度一个java.util.TimerTask任务; 说明： java.util.Timer定时器，实际上是个线程，定时执行TimerTask类 &
一种防止用户生成内容站点出现商业广告以及非法有害等垃圾信息的方法 yangshangchuan rank 相似度计算文本相似度词袋模型余弦相似度
本文描述了一种在ITEYE博客频道上面出现的新型的商业广告形式及其应对方法，对于其他的用户生成内容站点类型也具有同样的适用性。最近在ITEYE博客频道上面出现了一种新型的商业广告形式，方法如下： 1、注册多个账号（一般10个以上）。 2、从多个账号中选择一个账号，发表1-2篇博文