troy_ld

python简易爬虫(3)--网页正文提取

目前做爬虫，大概最耗费时间的就是在写提取规则上。目前常用的工具，如bs4, xpath, regex等，此类工具对于定向垂直抓取（amazon, taobao, jd）特别适合。但如果站点超过100, 比如说各个网站的新闻内容，那么仍用精准的解析规则成本就会提高很多。

如果谷歌搜索网页正文提取，那么你可能查阅到更多通用的方案。下面我就简单谈谈目前我正在学习的基于html结构树的方案。

假设

1 同一站点下的html结构与内容都非常类似，比如广告的位置（甚至内容）
2 同一站点下的html不同之处包含时间、标题、正文段落等我们感兴趣的内容

方案

1 将html解析为dom树，并对同一站点下的html进行比较
2 遍历dom树下的节点，对于两颗树相同/相似节点的内容进行比较，如果内容相同则提取出来

以采用xpath为例，对于path可能需要做一些处理

path0  =  ‘/html/p[0]/li[2]’
path0 --> path1 = '/html/p/li'

简化之后，更关注html的整体结构，而非离散的重复序列
基于以上思路，我笔趣阁的小说为例，对于同一部小说的两章作出了对比提取，正文确实可以提出来，不过同时也提取出了部分js代码。简单粗暴不过还算有效，但值得一提的是，后期可能还是需要加入一些的过滤规则，比如将js的标签内容去掉，换行符的冗余处理。

后记：利用对比html的结构树的方案制作提取规则，不要求精准定位，但提取出来的数据可能需要后期的清洗，或者根据经验，继续完善（待续）

你可能感兴趣的:(python简易爬虫(3)--网页正文提取)

语雀编辑器内双击回车插入当前时间js脚本妄想_wangx 编辑器 javascript 开发语言
打算多记录自己的想法，或者说灵感、念头我想要的格式大概是这样的：17:06我写下第一个记录17:08又一个想法18:38又一个想法但是每次写时间都太麻烦了，想着能不能用程序或者脚本实现。最终用脚本实现了：//==UserScript==//@name语雀编辑器双回车插入时间//@namespacehttp://tampermonkey.net///@version7.0//@description
Qt之正则表达式使用示例 Qt幻想家 Qt
Qt之正则表达式使用示例概述：限定数字：0-9.h:.cpp:执行效果图：over:概述：利用正则表达式对表格框内数据输入进行限制，首相先介绍一个正则表达式的区间条件1.限定0到9可以写成【0-9】2.限定A到Z可以写成【A-Z】3.限定某些数字【110】接下来写个小案列测试一下限定数字：0-9.h:#include//QRegExp类使用正则表达式提供模式匹配privateslots:voido
Three.js入门：创建第一个3D场景薯条说影 Three.js 3D场景创建跨平台设置安全异常处理 HTML骨架搭建
背景简介Three.js是一个轻量级的3D图形库，它让Web开发者能够在浏览器中创建和显示3D图形。本章介绍如何设置环境以开始使用Three.js，包括不同操作系统下的安装步骤、安全异常处理以及基本的HTML骨架创建。安装与设置操作系统兼容性：Three.js的使用不仅限于Windows系统。对于其他操作系统，如Linux和MacOS，需要将可执行文件复制到目标目录，并通过命令行启动。无论是哪种操
Three.js入门第一步：两种方式搭建你的3D项目[特殊字符]️
上一篇我们聊了学习Three.js前的“地基”知识，现在地基牢固，该正式动工了！在创造炫酷的3D世界之前，我们得先把开发环境给搭好。官方手册提供了两种主流的安装方式，分别适用于不同场景。选对方法，事半功倍！方式一：CDN+Importmap(极速上手)这是官方最为推荐的、也是最简单的入门方式，尤其适合学习、做小练习、或者快速验证一个想法。优点：无需安装任何东西！只需要一个能联网的浏览器。操作方法：
python比java_对比java和python对比
对比java和python对比java和python2011年04月18日1.难易度而言。python远远简单于java。2.开发速度。Python远优于java3.运行速度。java远优于标准python，pypy和cython可以追赶java，但是两者都没有成熟到可以做项目的程度。4.可用资源。java一抓一大把，python很少很少，尤其是中文资源。5.稳定程度。python3和2不兼容，造
C# 反射的使用及场景灵感来自小西装 c#开发语言个人开发
1，使用反映将一个对象的同名属性赋值给另一个对象2,DataTable转换成一个实体3，使用反射动态执行方法4,根据属性信息来执行对应的方法usingSystem;usingSystem.Collections.Generic;usingSystem.ComponentModel;usingSystem.Data;usingSystem.Drawing;usingSystem.Linq;using
2020年10月18日周日漯河市晴成长俱乐部
2020年10月18日周日漯河市晴6：32正念冥想——如何开启正念的一天？对念头做正念，观察念头的出现，消失。6：48洗刷——如何开启精神饱满的一天？怎样判断一个产品可迭代？当我们刚开始做某一件事，比如，新开了一家饭店，但你发现并没有多少人来，这时你会怎么做选择？是放弃还是坚持？我们应该思考的问题，什么情况下需要坚持？人们往往会被沉默成本牵绊，只有具备成功因素的产品，才能迭代出更大的成功。当你做某
vue 组件中如何引用外部js文件中的变量或者方法一叶孤舟1990
相信很多新手小伙伴都会遇到这样一个问题，就是我如何引用一个外部文件中的变量，下面我为大家分享一下解决办法：（如果解决小伙伴的问题，请帮忙给我点个赞吧，谢谢！！！）1，首先自己创建一个js文件放到assets中：map.js2，map.js中代码如下：（data是数组，geoCoordMap是对象，这个因为太长了所以就不展开了）重点：export{//导出多个对象geoCoordMap,data}3
致自己的几句话 sundy007
图片发自App1.昨天的成功对今天的你来说，如果还是大事，说明你今天什么大事都没做！2.如果现在的你和一年前的你一样，意味着你没有成长。即使成绩依旧表现不错，让客户着迷，那依然是吃老本的行为！3.一个人最难做的是否定自己，尤其是自己过去成功的经验，如果不否定，总重复过去的套路，就没有了学习进步的空间！4.这个世界有偶然的运气，也有必然的运气。人应该追求必然的运气，通过努力踏踏实实的达到某个状态，某
《回到当下》第1天沙彩虹
问一下你的内心，感觉一下你的心，不是头脑的声音哦写出此刻最值得感恩的地方：1.好感恩，这个下午什么事情都没有必须做的，可以慵懒的，做自己想做的。2.感恩我的身体很健康的活着。3.感恩这个空间还不错，有空调，无人打扰，可以写，表达宇宙想让我做的当下214.好感恩，宇宙让我感受简单的力量，不要繁文修饰，简单的文字，表达自己。感觉到这种滋养。写出你最想体验的幸福和快乐，你最渴望的已经达成了，你的感觉和状
【8月星座运势】双子家庭为重、天秤社交鬼才、水瓶座深化合作筝筝陪你看星星
文/塔罗、星盘解读师星芒如需转载，请注明作者名字源自【星座塔罗说】本文2583字，阅读时间大约为10分钟嗨喽，欢迎来到星座塔罗说风象星座的8月运势可谓是此起彼伏呀!请同时参考你的上升星座和太阳星座~~太阳或上升双子座整体运势双子座的8月份是家庭月，8月份延续之前的忙碌，双子会花很多时间和精力在沟通交流上，同时有很多展现自我的机会，你可以多多表现自己，抓住每一个上台演讲表达的机会。上旬，满月在你的升
2 MySQL配置文件详解笑Skr人啊
Windows图片.png复制配置文件[root@rootmysql]#cp/usr/share/mysql/my-huge.cnf/etc/my.cnfcp：是否覆盖"/etc/my.cnf"？y[client]port=3306#客户端端口号socket=/data/3306/mysql.sock#socket文件是linux/unix系统特有的，用户在该环境下的客户端连接可以不通过tcp/i
2021-08-08计划实施第3天若言千金
今天主要的任务被打扫卫生所占据了，整理了衣橱，将一些长久不再穿的衣服清理了出去。阅读没有很好的完成，视频也没有看。说实话，到现在为止我并没有对递补完全死心，总觉得还有一线希望，也许这就是我无法安静的去看视频的缘故吧。虽然嘴上说着已经没有希望了，但是心却一直在渴望着。愿希望奇迹发生，如若没有奇迹，那我就努力创造奇迹。今天没有阅读，我会在明天补上。看了《法医秦明》《上游》两部电视剧，对于自己写东西的愿
博浪沙的秋天☞玉壶奇缘♥第16集司马喆嚞
第七卷总916第16集6886辛丑金牛年农历八月二十二，公元2021年9月28日，星期二。第40周。距离2022年中招仅剩270天。今日格言愿你奋力拼搏，去感受世间百态；愿你内心平静而强大，活得恣意潇洒；愿你在这鲜活而张扬的年纪，坦言不枉此生。献给在前行路上的朋友今天早上，闹钟是在5点响得，大雨仍在下，所以一直等到5点15分才起床的，下楼时己经快5:45分了。走到廊道时，发现八(3)班灯明了，甭去
不用存储过程怎么处理大批量数据？读取大批量数据 liu_111111 ASP.Net高级
解决方案一：可以从几个方面着手：第一，减少网络的数据传输量第二，减少服务器的计算时间消耗第三、使用存贮过程可以有效的减少指令的数据量。第四、没有更新冲突的需求，那么请去掉检查数据库更新冲突的选项。这样可以减少数据传输量，并能减少服务器的计算时间。解决方案二：1、建立一个临时表2、把数据插入临时表3、写一个存储过程，把对应删除老表数据后，插入临时表数据4、执行上述存储过程
阿里云服务器优惠价格199元一年2核4G5M带宽，2024年9月最新报价阿腾云
阿里云服务器优惠价格199元一年2核4G5M带宽，2024年9月最新报价，配置为ECSu1实例（企业首选），2核4G，5M固定带宽，80GESSDEntry盘，活动链接和代金券领取入口在文章底部。2024年9月最新阿里云服务器租赁价格表：一年、1个月和1小时收费标准，阿里云99元一年服务器ECS云服务器2核2G3M带宽，ECSu1实例2核4G5M带宽优惠价格199元一年，轻量应用服务器2核2G3M
2023-04-12 王松奇
京心❤️达理想城店：王松奇2023年4月12日日精进落地真经严格就是爱，放纵既是害正能量语录每一颗螺丝都有标准每一颗螺丝都是标准产值目标：13万台次目标:80台油卡目标：13张今日体验今天开数据分析会台次少保养预存一定要盯紧中间10天要努力冲刺一下
QuecPython-正则表达式移远通信正则表达式 python
该模块通过正则表达式匹配数据。目前支持的操作符较少，部分操作符暂不支持。示例：importureres='''$GNRMC,133648.00,A,3149.2969,N,11706.9027,E,0.055,,311020,,,A,V*18$GNGGA,133648.00,3149.2969,N,11706.9027,E,1,24,1.03,88.9,M,,M,,*6C$GNGLL,3149.2
第3季：《一个青年摄影师和四个文化名人》备课思考（二）谈西_
图片发自App今天感冒很难受，头昏脑涨的，不过终于还是把思考整理了一遍，今天又看了忠玉姐的《愚公移山》的设计和艳平姐的《钢铁是怎样炼成》课堂实录，很受启发。这个教学设计有很多待完善的地方，经过上课之后再来反思吧！一、导入：今天我们要认识五个人，一个是摄影师，邓伟，著名摄影家，清华大学原教授，博士生导师。出版有《中国文化人影录》《邓伟眼中的世界名人》等著作。还有四个他的拍摄对象，都是鼎鼎有名的人物：
day11 力扣150. 逆波兰表达式求值力扣239. 滑动窗口最大值力扣347.前 K 个高频元素
逆波兰表达式求值给你一个字符串数组tokens，表示一个根据逆波兰表示法表示的算术表达式。请你计算该表达式。返回一个表示表达式值的整数。注意：有效的算符为'+'、'-'、'*'和'/'。每个操作数（运算对象）都可以是一个整数或者另一个表达式。两个整数之间的除法总是向零截断。表达式中不含除零运算。输入是一个根据逆波兰表示法表示的算术表达式。答案及所有中间计算结果可以用32位整数表示。示例1：输入：t
华为牛客网python考试题库及答案 2401_86114846 服务器
亲爱的朋友们，今天我们要讨论，牛客网华为软件测试题库牛客网华为机试题答案，让我们开始吧！目录一、字符串（知识点）HJ1字符串最后一个单词的长度（简单）HJ2计算某字符出现次数（简单）HJ4字符串分隔（简单）HJ5进制转换（简单）HJ10字符个数统计（简单）HJ11数字颠倒（简单）HJ12字符串反转（简单）HJ14字符串排序（简单）HJ17坐标移动（中等）HJ18识别有效的IP地址和掩码并进行分类统
第1030天特殊疑问句 1 一青叶
要求具体回答的问句特殊疑问句的结构疑问代词+一般疑问句+?除who以外的疑问代词短语+一般疑问句+?疑问副词+一般疑问句+?Whatdoyouwant?（你要什么？）Who(m)areyoulookingfor?（你在找谁？）Whosemagazineisthis?（这是谁的杂志？）Whichclassareyouin?（你在哪班？）Whendidyougetupthismorning?（你今早什
【Python】LEGB作用域 + re模块 + 正则表达式
文章目录一LEGB作用域二re（RegularExpression）预览1.`re.match()`——从字符串开头匹配2.`re.search()`——搜索整个字符串3.`re.findall()`——返回所有匹配的字符串列表4.`re.finditer()`——返回所有匹配的迭代器5.`re.sub()`——替换匹配的字符串6.`re.split()`——按正则表达式分割字符串7.`re.co
java和ptyhon对比悟能不能悟 java 开发语言
1.语言特性对比维度JavaPython语法风格静态类型，需显式声明变量类型；代码冗长（需分号、大括号）动态类型，变量类型自动推断；简洁（缩进代替大括号，无分号）编程范式严格面向对象（OOP），强制类与对象结构多范式支持（OOP、函数式、命令式），更灵活执行方式编译型（JVM运行字节码）解释型（逐行执行）⚡2.性能与效率执行速度：Java：编译优化后运行效率高，尤其擅长高并发（如电商秒杀系统）。P
制造外力（多个受力小球）大龙10
书名：代码本色：用编程模拟自然系统作者：DanielShiffman译者：周晗彬ISBN：978-7-115-36947-5目录2.5制造外力3、示例代码2-2Mover类不同点主要集中在两个方面——质量和applyForce()函数的实现在数组中创建100个Mover对象。在setup()函数中用循环对这些对象进行初始化。在构造函数中添加几个参数，让它变得更灵活。物体的质量和初始位置就不再是硬性
2019-04-10 周加华
付出不亚于任何人的努力2.要谦虚，不要骄傲3.要每天反省4.活着，就要感谢5.积善行，思利他6.不要有感性的今天把押车的一些特例问题做了汇总，给大家统一的一个操作方案。另外看到了经典的一句话：如果没有人逼你，你都不知道自己有多优秀，潜力无限！这句话送给所有人，尤其是我们的销售伙伴们！浦东的倪姐答应我今天起全力以赴汇银通产品，期待并感谢！
高仿名牌衣服都是哪里生产的，给大家讲解下进货渠道天坛众
高仿名牌衣服的生产地点因品牌而异，但通常以下几个地区是全球知名品牌服装的主要生产地：1.中国：中国是全球最大的服装生产基地之一，尤其是广东、浙江、江苏等省份。中国拥有庞大的劳动力市场和成熟的供应链体系，能够提供高质量和竞争力的生产服务。2.意大利：意大利以其高品质的时尚和精湛的手工艺闻名于世，许多奢侈品牌如Gucci、Prada、Versace等都在意大利生产部分或全部产品。3.法国：法国也是时尚
数字图像处理与Python语言实现-Box模糊CUDA实现视觉与物联智能数字图像处理与Python实现 python 深度学习计算机视觉图像处理 CUDA
Box模糊CUDA实现文章目录Box模糊CUDA实现1、Box模糊的基本原理2、算法优化：滑动窗口技术3、参数对模糊效果的影响4、Box模糊的优缺点5、与高斯模糊的对比6、实际应用场景7、算法实现7.1PyCUDA实现7.2CuPy实现7.3C++与CUDA实现8、总结在图像处理领域，**Box模糊（方框模糊或均值模糊）**是一种基础且高效的模糊算法，其核心思想是通过对像素邻域内的颜色值取平均值来
祝天凡冷冰凝《穿成恶毒反派后，我只想离婚保平安》小说最新章节在线阅读_祝天凡冷冰凝小说免费阅读_《穿成恶毒反派后，我只想离婚保平安》祝天凡冷冰凝最新章节在线阅读蚂蚁推书
小说名：穿成恶毒反派后，我只想离婚保平安主角：祝天凡冷冰凝小说作者：祝某某状态：连载中字数：31.31万字最新章节：第269章小说简介：穿书后，我成了反派女配的舔狗老公。原剧情里，我的老婆会为了男主，把家财奉上，害死家人，最后被男主换心换肝救养妹。我嘞个豆，什么逆天剧情！不想做冤种舔狗的我只想火速离婚保平安。却没想，我的霸总老婆能听心声，咋还不让我离婚了。——精彩章节试读——“啊……老婆，你说要在
2019-01-09 娱乐1
苹果当年的旗舰已手机降至3500元，成华为实力竞争对手！手机的性能一直都是我们在关注的一个焦点，那么按照当下的一个发展情况来看，苹果机型虽然表现的很不错，但是他的情况如今已经发生了变化比较多，因此在他的优势问题上，表现的并不是那么的充分，并且按照现在的趋势来看的话，他所具备的那个优秀的能力，但是很多人对于这个品牌都发生了决定性的变化。苹果手机降至3500元，当年的旗舰已经不在，成为华为实力竞争对手
遍历dom 并且存储（将每一层的DOM元素存在数组中）换个号韩国红果果 JavaScript html
数组从0开始！！ var a=[],i=0; for(var j=0;j<30;j++){ a[j]=[];//数组里套数组，且第i层存储在第a[i]中 } function walkDOM(n){ do{ if(n.nodeType!==3)//筛选去除#text类型 a[i].push(n); //con
Android+Jquery Mobile学习系列(9)-总结和代码分享白糖_ JQuery Mobile
目录导航经过一个多月的边学习边练手，学会了Android基于Web开发的毛皮，其实开发过程中用Android原生API不是很多，更多的是HTML/Javascript/Css。个人觉得基于WebView的Jquery Mobile开发有以下优点： 1、对于刚从Java Web转型过来的同学非常适合，只要懂得HTML开发就可以上手做事。 2、jquerym
impala参考资料 dayutianfei impala
记录一些有用的Impala资料 1. 入门资料 >>官网翻译： http://my.oschina.net/weiqingbin/blog?catalog=423691 2. 实用进阶 >>代码&架构分析： Impala/Hive现状分析与前景展望：http
JAVA 静态变量与非静态变量初始化顺序之新解周凡杨 java 静态非静态顺序
今天和同事争论一问题，关于静态变量与非静态变量的初始化顺序，谁先谁后，最终想整理出来！测试代码： import java.util.Map; public class T { public static T t = new T(); private Map map = new HashMap(); public T(){ System.out.println(&quo
跳出iframe返回外层页面 g21121 iframe
在web开发过程中难免要用到iframe，但当连接超时或跳转到公共页面时就会出现超时页面显示在iframe中，这时我们就需要跳出这个iframe到达一个公共页面去。首先跳转到一个中间页，这个页面用于判断是否在iframe中，在页面加载的过程中调用如下代码： <script type="text/javascript"> //<!-- function
JAVA多线程监听JMS、MQ队列 510888780 java多线程
背景：消息队列中有非常多的消息需要处理，并且监听器onMessage（）方法中的业务逻辑也相对比较复杂，为了加快队列消息的读取、处理速度。可以通过加快读取速度和加快处理速度来考虑。因此从这两个方面都使用多线程来处理。对于消息处理的业务处理逻辑用线程池来做。对于加快消息监听读取速度可以使用1.使用多个监听器监听一个队列；2.使用一个监听器开启多线程监听。对于上面提到的方法2使用一个监听器开启多线
第一个SpringMvc例子布衣凌宇 spring mvc
第一步：导入需要的包；第二步：配置web.xml文件 <?xml version="1.0" encoding="UTF-8"?> <web-app version="2.5" xmlns="http://java.sun.com/xml/ns/javaee" xmlns:xsi=
我的spring学习笔记15-容器扩展点之PropertyOverrideConfigurer aijuans Spring3
PropertyOverrideConfigurer类似于PropertyPlaceholderConfigurer，但是与后者相比，前者对于bean属性可以有缺省值或者根本没有值。也就是说如果properties文件中没有某个bean属性的内容，那么将使用上下文（配置的xml文件）中相应定义的值。如果properties文件中有bean属性的内容，那么就用properties文件中的值来代替上下
通过XSD验证XML antlove xml schema xsd validation SchemaFactory
1. XmlValidation.java package xml.validation; import java.io.InputStream; import javax.xml.XMLConstants; import javax.xml.transform.stream.StreamSource; import javax.xml.validation.Schem
文本流与字符集百合不是茶 PrintWrite()的使用字符集名字别名获取
文本数据的输入输出; 输入;数据流,缓冲流输出;介绍向文本打印格式化的输出PrintWrite(); package 文本流; import java.io.FileNotFound
ibatis模糊查询sqlmap-mapping-**.xml配置 bijian1013 ibatis
正常我们写ibatis的sqlmap-mapping-*.xml文件时，传入的参数都用##标识，如下所示： <resultMap id="personInfo" class="com.bijian.study.dto.PersonDTO"> <res
java jvm常用命令工具——jdb命令(The Java Debugger) bijian1013 java jvm jdb
用来对core文件和正在运行的Java进程进行实时地调试，里面包含了丰富的命令帮助您进行调试，它的功能和Sun studio里面所带的dbx非常相似，但 jdb是专门用来针对Java应用程序的。现在应该说日常的开发中很少用到JDB了，因为现在的IDE已经帮我们封装好了，如使用ECLI
【Spring框架二】Spring常用注解之Component、Repository、Service和Controller注解 bit1129 controller
在Spring常用注解第一步部分【Spring框架一】Spring常用注解之Autowired和Resource注解（http://bit1129.iteye.com/blog/2114084）中介绍了Autowired和Resource两个注解的功能，它们用于将依赖根据名称或者类型进行自动的注入，这简化了在XML中，依赖注入部分的XML的编写，但是UserDao和UserService两个bea
cxf wsdl2java生成代码super出错,构造函数不匹配 bitray super
由于过去对于soap协议的cxf接触的不是很多,所以遇到了也是迷糊了一会.后来经过查找资料才得以解决. 初始原因一般是由于jaxws2.2规范和jdk6及以上不兼容导致的.所以要强制降为jaxws2.1进行编译生成.我们需要少量的修改: 我们原来的代码 wsdl2java com.test.xxx -client http://..... 修改后的代
动态页面正文部分中文乱码排障一例 ronin47
公司网站一部分动态页面，早先使用apache+resin的架构运行，考虑到高并发访问下的响应性能问题，在前不久逐步开始用nginx替换掉了apache。不过随后发现了一个问题，随意进入某一有分页的网页，第一页是正常的（因为静态化过了）；点“下一页”，出来的页面两边正常，中间部分的标题、关键字等也正常，唯独每个标题下的正文无法正常显示。因为有做过系统调整，所以第一反应就是新上
java-54- 调整数组顺序使奇数位于偶数前面 bylijinnan java
import java.util.Arrays; import java.util.Random; import ljn.help.Helper; public class OddBeforeEven { /** * Q 54 调整数组顺序使奇数位于偶数前面 * 输入一个整数数组，调整数组中数字的顺序，使得所有奇数位于数组的前半部分，所有偶数位于数组的后半
从100PV到1亿级PV网站架构演变 cfyme 网站架构
一个网站就像一个人，存在一个从小到大的过程。养一个网站和养一个人一样，不同时期需要不同的方法，不同的方法下有共同的原则。本文结合我自已14年网站人的经历记录一些架构演变中的体会。 1：积累是必不可少的架构师不是一天练成的。 1999年，我作了一个个人主页，在学校内的虚拟空间，参加了一次主页大赛，几个DREAMWEAVER的页面，几个TABLE作布局，一个DB连接，几行PHP的代码嵌入在HTM
[宇宙时代]宇宙时代的GIS是什么？ comsci Gis
我们都知道一个事实，在行星内部的时候，因为地理信息的坐标都是相对固定的，所以我们获取一组GIS数据之后，就可以存储到硬盘中，长久使用。。。但是，请注意，这种经验在宇宙时代是不能够被继续使用的宇宙是一个高维时空
详解create database命令 czmmiao database
完整命令 CREATE DATABASE mynewdb USER SYS IDENTIFIED BY sys_password USER SYSTEM IDENTIFIED BY system_password LOGFILE GROUP 1 ('/u01/logs/my/redo01a.log','/u02/logs/m
几句不中听却不得不认可的话 datageek
1、人丑就该多读书。 2、你不快乐是因为：你可以像猪一样懒，却无法像只猪一样懒得心安理得。 3、如果你太在意别人的看法，那么你的生活将变成一件裤衩，别人放什么屁，你都得接着。 4、你的问题主要在于：读书不多而买书太多，读书太少又特爱思考，还他妈话痨。 5、与禽兽搏斗的三种结局：(1)、赢了，比禽兽还禽兽。(2)、输了，禽兽不如。(3)、平了，跟禽兽没两样。结论：选择正确的对手很重要。 6
1 14:00 PHP中的“syntax error, unexpected T_PAAMAYIM_NEKUDOTAYIM”错误 dcj3sjt126com PHP
原文地址：http://www.kafka0102.com/2010/08/281.html 因为需要，今天晚些在本机使用PHP做些测试，PHP脚本依赖了一堆我也不清楚做什么用的库。结果一跑起来，就报出类似下面的错误：“Parse error: syntax error, unexpected T_PAAMAYIM_NEKUDOTAYIM in /home/kafka/test/
xcode6 Auto layout and size classes dcj3sjt126com ios
官方GUI https://developer.apple.com/library/ios/documentation/UserExperience/Conceptual/AutolayoutPG/Introduction/Introduction.html iOS中使用自动布局（一） http://www.cocoachina.com/ind
通过PreparedStatement批量执行sql语句【sql语句相同，值不同】梦见x光 sql 事务批量执行
比如说：我有一个List需要添加到数据库中，那么我该如何通过PreparedStatement来操作呢？ public void addCustomerByCommit(Connection conn , List<Customer> customerList) { String sql = "inseret into customer(id
程序员必知必会----linux常用命令之十【系统相关】 hanqunfeng Linux常用命令
一.linux快捷键 Ctrl+C : 终止当前命令 Ctrl+S : 暂停屏幕输出 Ctrl+Q : 恢复屏幕输出 Ctrl+U : 删除当前行光标前的所有字符 Ctrl+Z : 挂起当前正在执行的进程 Ctrl+L : 清除终端屏幕，相当于clear 二.终端命令 clear : 清除终端屏幕 reset : 重置视窗，当屏幕编码混乱时使用 time com
NGINX IXHONG nginx
pcre 编译安装 nginx conf/vhost/test.conf upstream admin { server 127.0.0.1:8080; } server { listen 80; &
设计模式--工厂模式 kerryg 设计模式
工厂方式模式分为三种： 1、普通工厂模式：建立一个工厂类，对实现了同一个接口的一些类进行实例的创建。 2、多个工厂方法的模式：就是对普通工厂方法模式的改进，在普通工厂方法模式中，如果传递的字符串出错，则不能正确创建对象，而多个工厂方法模式就是提供多个工厂方法，分别创建对象。 3、静态工厂方法模式：就是将上面的多个工厂方法模式里的方法置为静态，
Spring InitializingBean/init-method和DisposableBean/destroy-method mx_xiehd java spring bean xml
1.initializingBean/init-method 实现org.springframework.beans.factory.InitializingBean接口允许一个bean在它的所有必须属性被BeanFactory设置后，来执行初始化的工作，InitialzingBean仅仅指定了一个方法。通常InitializingBean接口的使用是能够被避免的，（不鼓励使用，因为没有必要
解决Centos下vim粘贴内容格式混乱问题 qindongliang1922 centos vim
有时候，我们在向vim打开的一个xml，或者任意文件中，拷贝粘贴的代码时，格式莫名其毛的就混乱了，然后自己一个个再重新，把格式排列好，非常耗时，而且很不爽，那么有没有办法避免呢？答案是肯定的，设置下缩进格式就可以了，非常简单：在用户的根目录下直接vi ~/.vimrc文件然后将set pastetoggle=<F9> 写入这个文件中，保存退出，重新登录，
netty大并发请求问题 tianzhihehe netty
多线程并发使用同一个channel java.nio.BufferOverflowException: null at java.nio.HeapByteBuffer.put(HeapByteBuffer.java:183) ~[na:1.7.0_60-ea] at java.nio.ByteBuffer.put(ByteBuffer.java:832) ~[na:1.7.0_60-ea]
Hadoop NameNode单点问题解决方案之一 AvatarNode wyz2009107220 NameNode
我们遇到的情况 Hadoop NameNode存在单点问题。这个问题会影响分布式平台24*7运行。先说说我们的情况吧。我们的团队负责管理一个1200节点的集群(总大小12PB)，目前是运行版本为Hadoop 0.20，transaction logs写入一个共享的NFS filer(注：NetApp NFS Filer)。经常遇到需要中断服务的问题是给hadoop打补丁。 DataNod

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他