秋风秋雨

python实现将html表格转换成CSV文件的方法

本文实例讲述了python实现将html表格转换成CSV文件的方法。分享给大家供大家参考。具体如下：

使用方法：python html2csv.py *.html
这段代码使用了 HTMLParser 模块

#!/usr/bin/python
# -*- coding: iso-8859-1 -*-
# Hello, this program is written in Python - http://python.org
programname = 'html2csv - version 2002-09-20 - http://sebsauvage.net'
import sys, getopt, os.path, glob, HTMLParser, re
try:  import psyco ; psyco.jit() # If present, use psyco to accelerate the program
except: pass
def usage(progname):
  ''' Display program usage. '''
  progname = os.path.split(progname)[1]
  if os.path.splitext(progname)[1] in ['.py','.pyc']: progname = 'python '+progname
  return '''%s
A coarse HTML tables to CSV (Comma-Separated Values) converter.
Syntax  : %s source.html
Arguments : source.html is the HTML file you want to convert to CSV.
      By default, the file will be converted to csv with the same
      name and the csv extension (source.html -> source.csv)
      You can use * and ?.
Examples  : %s mypage.html
      : %s *.html
This program is public domain.
Author : Sebastien SAUVAGE 
     http://sebsauvage.net
''' % (programname, progname, progname, progname)
class html2csv(HTMLParser.HTMLParser):
  ''' A basic parser which converts HTML tables into CSV.
    Feed HTML with feed(). Get CSV with getCSV(). (See example below.)
    All tables in HTML will be converted to CSV (in the order they occur
    in the HTML file).
    You can process very large HTML files by feeding this class with chunks
    of html while getting chunks of CSV by calling getCSV().
    Should handle badly formated html (missing , , ,
    extraneous , ...).
    This parser uses HTMLParser from the HTMLParser module,
    not HTMLParser from the htmllib module.
    Example: parser = html2csv()
         parser.feed( open('mypage.html','rb').read() )
         open('mytables.csv','w+b').write( parser.getCSV() )
    This class is public domain.
    Author: Sébastien SAUVAGE 
        http://sebsauvage.net
    Versions:
      2002-09-19 : - First version
      2002-09-20 : - now uses HTMLParser.HTMLParser instead of htmllib.HTMLParser.
            - now parses command-line.
    To do:
      - handle  tags
      - convert html entities (&name; and &#ref;) to Ascii.
      '''
  def __init__(self):
    HTMLParser.HTMLParser.__init__(self)
    self.CSV = ''   # The CSV data
    self.CSVrow = ''  # The current CSV row beeing constructed from HTML
    self.inTD = 0   # Used to track if we are inside or outside a ... tag.
    self.inTR = 0   # Used to track if we are inside or outside a ... tag.
    self.re_multiplespaces = re.compile('\s+') # regular expression used to remove spaces in excess
    self.rowCount = 0 # CSV output line counter.
  def handle_starttag(self, tag, attrs):
    if  tag == 'tr': self.start_tr()
    elif tag == 'td': self.start_td()
  def handle_endtag(self, tag):
    if  tag == 'tr': self.end_tr()
    elif tag == 'td': self.end_td()     
  def start_tr(self):
    if self.inTR: self.end_tr() #  implies 
    self.inTR = 1
  def end_tr(self):
    if self.inTD: self.end_td() #  implies 
    self.inTR = 0      
    if len(self.CSVrow) > 0:
      self.CSV += self.CSVrow[:-1]
      self.CSVrow = ''
    self.CSV += '\n'
    self.rowCount += 1
  def start_td(self):
    if not self.inTR: self.start_tr() #  implies 
    self.CSVrow += '"'
    self.inTD = 1
  def end_td(self):
    if self.inTD:
      self.CSVrow += '",' 
      self.inTD = 0
  def handle_data(self, data):
    if self.inTD:
      self.CSVrow += self.re_multiplespaces.sub(' ',data.replace('\t',' ').replace('\n','').replace('\r','').replace('"','""'))
  def getCSV(self,purge=False):
    ''' Get output CSV.
      If purge is true, getCSV() will return all remaining data,
      even if  or  are not properly closed.
      (You would typically call getCSV with purge=True when you do not have
      any more HTML to feed and you suspect dirty HTML (unclosed tags). '''
    if purge and self.inTR: self.end_tr() # This will also end_td and append last CSV row to output CSV.
    dataout = self.CSV[:]
    self.CSV = ''
    return dataout
if __name__ == "__main__":
  try: # Put getopt in place for future usage.
    opts, args = getopt.getopt(sys.argv[1:],None)
  except getopt.GetoptError:
    print usage(sys.argv[0]) # print help information and exit:
    sys.exit(2)
  if len(args) == 0:
    print usage(sys.argv[0]) # print help information and exit:
    sys.exit(2)    
  print programname
  html_files = glob.glob(args[0])
  for htmlfilename in html_files:
    outputfilename = os.path.splitext(htmlfilename)[0]+'.csv'
    parser = html2csv()
    print 'Reading %s, writing %s...' % (htmlfilename, outputfilename)
    try:
      htmlfile = open(htmlfilename, 'rb')
      csvfile = open( outputfilename, 'w+b')
      data = htmlfile.read(8192)
      while data:
        parser.feed( data )
        csvfile.write( parser.getCSV() )
        sys.stdout.write('%d CSV rows written.\r' % parser.rowCount)
        data = htmlfile.read(8192)
      csvfile.write( parser.getCSV(True) )
      csvfile.close()
      htmlfile.close()
    except:
      print 'Error converting %s    ' % htmlfilename
      try:  htmlfile.close()
      except: pass
      try:  csvfile.close()
      except: pass
  print 'All done. '

希望本文所述对大家的Python程序设计有所帮助。

你可能感兴趣的:(python实现将html表格转换成CSV文件的方法)

【MobaXterm】设置保持SSH连接曹瑞曹瑞 ssh 运维
1、MobaXterm那么需要在设置里点选setting>SSH>sessionssetting>勾选sshKeepalive2、SSH如果使用的是ssh则需要设定超时连接的时间/etc/ssh/sshd_config：服务器端要设置客户的超时重连：ClientAliveCountMax3#默认重连3次ClientAliveInterval30#30s重连一次客户端要设置服务器端的超时重连(use
Microsoft SQL Server 2012(附序列号) 曹瑞曹瑞
MicrosoftSQLServer2012是微软发布的新一代数据平台产品。SQLServer2012不仅延续现有数据平台的强大能力，全面支持云技术与平台，并且能够快速构建相应的解决方案实现私有云与公有云之间数据的扩展与应用的迁移。SQLServer2012提供对企业基础架构最高级别的支持—专门针对关键业务应用的多种功能与解决方案可以提供最高级别的可用性及性能。在业界领先的商业智能领领域，SQLS
修改 Docker 网桥的 IP 范围消码哥运维 docker docker
目录前言修改步骤前言有时候docker网桥ip与外部的ip相冲突时，外部ip是无法访问的，这时就需要我们修改Docker网桥的IP范围了，修改方法也很简单。修改步骤停止Docker服务sudosystemctlstopdocker编辑Docker的网络配置文件通常是/etc/docker/daemon.json，加入以下内容即可{"bip":"172.18.0.1/16",//Dockerdaem
解释 TypeScript 中的类型系统，如何定义和使用类型？程序员黄同学前端开发 JavaScript typescript ubuntu javascript
1.类型系统的核心作用TypeScript类型系统本质上是JavaScript的静态类型增强方案，提供三个核心价值：开发阶段类型检查（类似编译时eslint）更清晰的API文档（类型即文档）更好的IDE自动补全支持代码示例：//错误示范：未指定类型导致潜在隐患functionadd(a,b){returna+b;}add('hello',123);//运行时错误但编译期不报错//正确类型标注fun
怎么定义世界模型，Sora/Genie/JEPA 谁是世界模型呢？（1）周博洋K 分布式人工智能深度学习自然语言处理机器学习
说这个问题之前先看一下什么是世界模型，它的定义是什么？首先世界模型的起源是咋回事呢？其实世界模型在ML领域不是什么新概念，远远早于Transfomer这些东西被提出来，因为它最早是强化学习RL领域的，在20世纪90年代由JuergenSchmiduber实验室给提出来的。2018年被Ha和Schmiduber发表了用RNN来做世界模型的论文，相当于给他重新做了一次定义。然后就是最近跟着Sora，G
rust语言闭包trait类型编译器推导总结灵山悟空 rust 开发语言后端
Rust编译器根据闭包对捕获的外部变量的使用方式自动推断其实现的Trait类型，如：Fn,FnMut,FnOnce；而非是否捕获所有权。注意move关键字只是令闭包捕获外部变量的所有权，并非决定闭包的Trait类型为FnOnce。对捕获变量的使用方式组合：（1）捕获外部变量的所有权。（2）消耗捕获的变量，消耗：释放，杀死，清除，关闭等。（3）只读。（4）可写（变）（5）不可变借用。（6）可变借用。
用python设计一个表白灯牌噔噔噔噔@ python pygame
表白灯牌可以通过控制LED灯的颜色和亮度来实现。你可以使用树莓派或者Arduino这样的硬件平台，结合Python编程语言来控制LED灯的状态。下面是一个简单的示例代码，可以实现一个表白灯牌效果：importRPi.GPIOasGPIOimporttime#设置GPIO引脚编号模式GPIO.setmode(GPIO.BCM)#设置LED引脚编号red_pin=17green_pin=18#设置GP
“知识海洋”的探险之旅，考研复习等你来挑战闲虎考研考研复习考研经验考研
在知识的广袤天地中，我们如同勇敢的水手，驾驶着智慧的船只，穿越波涛汹涌的思想之海，探索未知的知识领域，每一次航行都是一次心灵的冒险,每一次探索都是对自我认知的深化。考研复习，就像是一场充满挑战的旅程，在这段旅途中，我们需要面对各种各样的问题和困难，需要不断地学习和提高自己的能力，正是这些挑战让我们更加坚定地追求知识,让我们更加珍惜来之不易的学习机会。我们要明确自己的目标，只有明确了目标，才能有针对
软件测试工作的必要性分析噔噔噔噔@ 压力测试功能测试
软件测试是确保软件质量的关键步骤，它的必要性体现在以下几个方面：发现和修复缺陷：软件测试可以帮助发现软件中存在的缺陷和问题，及时修复这些问题可以提高软件的稳定性和可靠性，避免用户在使用过程中遇到意外情况。提高用户满意度：经过充分测试的软件往往具有更好的性能、稳定性和易用性，用户在使用时体验更加顺畅，从而提升用户的满意度和忠诚度。节省成本：在软件开发过程中发现和解决问题的成本要低于将软件发布后再修复
从零基础到高分逆袭：考研英语备考心得分享闲虎考研考研经验考研
考研英语，对于许多考生来说，是一道关卡，也是一个挑战，尤其是对于英语基础薄弱的考生，如何在短时间内实现从零基础到高分逆袭，成为了备考的关键，本文将从备考心得、方法技巧等方面，为大家分享一些实用经验。明确目标，坚定信念1、了解考研英语考试大纲：首先要明确考研英语考试的内容、题型、分值等，这样才能有针对性地进行备考。2、制定合理的学习计划：根据自己的实际情况，制定一个切实可行的学习计划，并严格按照计划
高效备考策略：考研英语阅读理解深度剖析闲虎考研考研经验考研
随着考研竞争日益激烈，英语作为考研的重要科目，其阅读理解部分成为了考生们的难点和重点，想要在考研英语中取得高分，必须对阅读理解部分进行深入剖析，掌握高效备考策略，本文将从考研英语阅读理解的特点、技巧和方法三个方面进行详细讲解，帮助考生提高阅读理解能力。考研英语阅读理解的特点1、题材广泛：考研英语阅读理解的题材涵盖多个领域，如经济、文化、科技、环保等，考生在备考过程中，需要广泛涉猎各类文章，提高自己
UVa12303 Composite Transformations 惆怅客123 UVa部分题目解题报告计算几何 icpc UVa 仿射变换矩阵平面的一般式平面的三点式
UVa12303CompositeTransformations题目链接题意输入格式输出格式分析AC代码题目链接 UVa12303CompositeTransformations题意空间中有n个点和m个平面，你的任务是按顺序向它们施加t个变换，输出每个点的最终位置和每个平面的最终方程。一共有3种变换，如表下表所示。变换说明TRANSLATEabc点(x,y,z)变成(x+a,y+b,z+c)
UVa11604 General Sultan 惆怅客123 UVa部分题目解题报告图论 icpc UVa 图论建模有向图 dfs
UVa11604GeneralSultan题目链接题意分析AC代码题目链接 UVA-11604GeneralSultan题意给出一些0和1组成的模式串，问是否存在一个串使得有多种方案将这个串分解成模式串。给一个包含n（n≤100）个符号的二进制编码方式，是否存在一个二进制序列，存在至少两种解码方法。比如{a=01,b=001,c=01001}是有歧义的，因为01001可以解码为a+b或者
UVa10572 Black & White 惆怅客123 UVa部分题目解题报告动态规划插头dp染色模型轮廓线动态规划最小表示法
UVa10572Black&White题目链接题意输入格式输出格式分析AC代码题目链接 UVa10572Black&White题意在一个m行n列的网格中已经有一些格子涂上了黑色或者白色。你的任务是把其他格子也涂上黑色或者白色，使得任意2×2子网格不会全黑或者全白，且所有黑格四连通，所有白格也四连通。输出方案总数和其中一组方案。比如，在下图所示的4幅图中，第一幅中黑格不连通，第三幅中存在2
基于Arduino的ESP32开发环境搭建惆怅客123 嵌入式开发单片机 Arduino ESP32 VSCode
ESP32(Euno)购买链接串口驱动开发环境搭建参考自开发环境搭建_arduinoesp32_NaisuXu的博客-CSDN博客下载安装ArduinoIDE：https://www.arduino.cc/en/Main/SoftwareArduinoIDE中添加ESP32开发板数据：安装完成后选择：文件>首选项>附加开发板管理器网址中加入Arduinocoreforesp32的地址https:/
考研复习之记忆方法 herosunly 考名校研究生经验分享考研
大家好，我是herosunly。985院校硕士毕业，现担任算法研究员一职，热衷于大模型算法的研究与应用。曾担任百度千帆大模型比赛、BPAA算法大赛评委，编写微软OpenAI考试认证指导手册。曾获得阿里云天池比赛第一名，CCF比赛第二名，科大讯飞比赛第三名。授权多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法行业就业。希望和大家一起成长进步。
探索未来：FacebookResearch的JEPa项目详解瞿旺晟
探索未来：FacebookResearch的JEPa项目详解去发现同类优质开源项目:https://gitcode.com/项目简介是FacebookResearch推出的一个开源项目，全称为"JointEmbeddingofProgramsandAttributes"。它是一个用于程序理解和属性预测的深度学习框架，旨在提升代码的理解和自动化程度，为开发者提供更智能的编程辅助工具。技术分析**1.
I-JEPA：联合嵌入预测架构的自监督学习实现平奇群Derek
I-JEPA：联合嵌入预测架构的自监督学习实现I-JEPAImplementationofI-JEPAfrom"Self-SupervisedLearningfromImageswithaJoint-EmbeddingPredictiveArchitecture"项目地址:https://gitcode.com/gh_mirrors/ij/I-JEPA项目介绍欢迎来到I-JEPA，这是一个基于Se
Kotlin D3 GH小杨 kotlin 开发语言 android
KotlinD3面向对象一、课程目标本次课程旨在让学员全面且深入地了解面向对象编程的核心概念，透彻掌握类与对象之间的紧密关系，熟练运用Kotlin语言中各类常用类进行程序开发。通过理论知识的系统讲解、丰富多样的实际案例分析以及详细的代码解读，帮助学员将面向对象编程思想融入到Kotlin编程实践中，提升解决实际问题的能力，为后续开发复杂的Kotlin应用程序奠定坚实基础。二、面向对象的概念2.1什么
数据挖掘|关联分析与Apriori算法详解皖山文武数据挖掘商务智能数据挖掘关联分析 Apriori算法机器学习
数据挖掘|关联分析与Apriori算法1.关联分析2.关联规则相关概念2.1项目2.2事务2.3项目集2.4频繁项目集2.5支持度2.6置信度2.7提升度2.8强关联规则2.9关联规则的分类3.Apriori算法3.1Apriori算法的Python实现3.2基于mlxtend库的Apriori算法的Python实现1.关联分析关联规则分析（Association-rulesAnalysis）是数
C++上机实验|继承与派生编程练习皖山文武 C++语言程序设计教程 c++开发语言
1.实验目的(1)掌握派生与继承的概念与使用方法(2)运用继承机制对现有的类进行重用。(3)掌握继承中的构造函数与析构函数的调用顺序,(4)为派生类设计合适的构造函数初始化派生类。(5)深入理解继承与组合的区别。2.实验内容设计一个人员类person和一个日期类date,由人员类派生出学生类student和教师类professor,学生类和教师类的数据成员birthday为日期类。3.参考代码#i
时间序列预测之移动平均法预测模型皖山文武数据挖掘商务智能数据挖掘 python 时间序列移动平均
时间序列预测之移动平均法预测模型1.时间序列预测法概述1.1时间序列的基本特征1.2时间序列的分类1.3时间序列的影响因素分析2移动平均数预测模型2.1一次移动平均法2.2二次移动平均法2.3基于Python的移动平均法预测模型1.时间序列预测法概述时间序列，也称为时间数列、历史复数或动态数列。它是将某种统计的指标数值按照时间先后顺序排列所形成的数列。根据时间序列所反映出来的发展过程、方向和趋势，
代码随想录|二叉树|06翻转二叉树 Paper Clouds 算法数据结构 c++leetcode
leetcode:226.翻转二叉树-力扣（LeetCode）题目翻转一棵二叉树。思路整棵树以root节点所处的中轴线为轴进行翻转，我们需要做的就是翻转每一个节点的左右孩子。我们在遍历的过程中进行翻转，那么递归和迭代都是可以做的。递归法递归三部曲（1）确定递归函数的参数和返回值参数就是根节点root，返回的也是根节点，所以是TreeNode型。（2）确定终止条件当前节点为空的时候就返回。（3）递归
网站总报SSL错误？常见原因及解决方案 WoTrusSSL ssl https 网络协议
作为企业网站运营者，SSL证书就像“网络身份证”，它能加密数据、保护用户隐私，让客户放心下单。但一旦出现SSL错误，浏览器直接亮红警告，用户秒关页面，订单流失、品牌形象受损都可能发生！别慌！我们整理了企业最常见的几种SSL错误原因及解决方案，教你如何快速排查修复，让网站安全又稳定！1.证书装错了？检查配置细节！问题：SSL证书安装时，路径填错、私钥不匹配、参数设置漏了……一个小失误就能让证书“罢工
跨域JS传值时，postMessage 页面之间发送消息油盐不进的吗资料
postMessage方法使用方法：监控JS：window.addEventListener("message",function(e){},false);--------------------------------------------------------------------------------------------------------------------------
1.适配器模式油盐不进的吗适配器模式 java
概述适配器模式：将一个类的接口转换成客户希望的另一个接口，使得原本不兼容的类可以一起工作。适配器模式在业务场景中非常有用，尤其是在系统集成、接口兼容性处理以及代码复用等场景。以下是一个实际的业务场景示例：业务场景：支付系统集成假设你正在开发一个电商平台，需要集成多个第三方支付网关（如支付宝、微信支付、银联支付等）。每个支付网关的接口设计不同，但你的系统希望统一调用一个支付接口来处理所有支付请求。1
【牛客差分】值周 Liu_Meihao c++
题目值周思路和校门外的树一样，唯一不同的是本题数组要开的大一些，其他都一样。代码#includeusingnamespacestd;constintN=100000010;inta[N]={0},b[N];intmain(){std::ios::sync_with_stdio(false);intn,m;cin>>n>>m;for(inti=1;i>l>>r;b[l]=b[l]+1;b[r+1]=
【pta】1062 最简分数（涉及求最大公约数） Liu_Meihao 算法
题目1062最简分数思路分数比较大小用十字相乘比大小，先找到大于第一个分数的，再限制小于第二个分数。代码#includeusingnamespacestd;intgys(intx,inty){while(y){intt=x%y;x=y;y=t;}returnx;}intmain(){intn1,m1,n2,m2,k;scanf("%d/%d%d/%d%d",&n1,&m1,&n2,&m2,&k);
OPPO机器学习算法岗（AI智能体）内推飞300 人工智能业界资讯
专注于以端设备为中心的AI智能体研究与应用，研究方向包括但不限于智能体与多智能体框架、大模型推理与规划、大模型工具使用等。1、负责大模型驱动的AI智能体框架的实现、评估与优化，并参与构建产品原型；2、设计微调方案、适配算法和调优工程方案，结合智能体应用，实现最佳效果与性能；3、跟踪与研究AI智能体相关前沿技术，并针对大模型推理与规划、工具使用、结构化输出等提出创新性方案。推荐码：X3448036
SSE Server-Send Events适用于什么场景，有什么弊端存在 Jerome_GHW 信息与通信
Server-SentEvents(SSE)是一种用于在客户端和服务器之间实现单向实时通信的Web技术。它主要适用于需要从服务器向客户端推送实时信息的场景，例如新闻更新、股票价格变动、社交媒体通知等。SSE的优点：实时性：SSE提供了从服务器到客户端的单向实时通信，允许服务器在事件发生时向客户端推送数据。简单易用：SSE使用简单，只需使用EventSource对象在客户端监听即可。SSE的弊端：单
矩阵求逆（JAVA）利用伴随矩阵 qiuwanchi 利用伴随矩阵求逆矩阵
package gaodai.matrix; import gaodai.determinant.DeterminantCalculation; import java.util.ArrayList; import java.util.List; import java.util.Scanner; /** * 矩阵求逆(利用伴随矩阵) * @author 邱万迟
单例（Singleton）模式 aoyouzi 单例模式 Singleton
3.1 概述如果要保证系统里一个类最多只能存在一个实例时，我们就需要单例模式。这种情况在我们应用中经常碰到，例如缓存池，数据库连接池，线程池，一些应用服务实例等。在多线程环境中，为了保证实例的唯一性其实并不简单，这章将和读者一起探讨如何实现单例模式。 3.2
[开源与自主研发]就算可以轻易获得外部技术支持,自己也必须研发 comsci 开源
现在国内有大量的信息技术产品，都是通过盗版，免费下载，开源，附送等方式从国外的开发者那里获得的。。。。。。虽然这种情况带来了国内信息产业的短暂繁荣，也促进了电子商务和互联网产业的快速发展，但是实际上，我们应该清醒的看到，这些产业的核心力量是被国外的
页面有两个frame,怎样点击一个的链接改变另一个的内容 Array_06 UI XHTML
<a src="地址" targets="这里写你要操作的Frame的名字" />搜索然后你点击连接以后你的新页面就会显示在你设置的Frame名字的框那里 targerts="",就是你要填写目标的显示页面位置 ===================== 例如： <frame src=&
Struts2实现单个/多个文件上传和下载 oloz 文件上传 struts
struts2单文件上传：步骤01:jsp页面  　　<form action="fileUplo
推荐10个在线logo设计网站 362217990 logo
在线设计Logo网站。 1、http://flickr.nosv.org（这个太简单） 2、http://www.logomaker.com/?source=1.5770.1 3、http://www.simwebsol.com/ImageTool 4、http://www.logogenerator.com/logo.php?nal=1&tpl_catlist[]=2 5、ht
jsp上传文件香水浓 jsp fileupload
1. jsp上传 Notice： 1. form表单 method 属性必须设置为 POST 方法，不能使用 GET 方法 2. form表单 enctype 属性需要设置为 multipart/form-data 3. form表单 action 属性需要设置为提交到后台处理文件上传的jsp文件地址或者servlet地址。例如 uploadFile.jsp 程序文件用来处理上传的文
我的架构经验系列文章 - 前端架构 agevs JavaScript Web 框架 UI jQuer
框架层面：近几年前端发展很快，前端之所以叫前端因为前端是已经可以独立成为一种职业了，js也不再是十年前的玩具了，以前富客户端RIA的应用可能会用flash/flex或是silverlight，现在可以使用js来完成大部分的功能，因此js作为一门前端的支撑语言也不仅仅是进行的简单的编码，越来越多框架性的东西出现了。越来越多的开发模式转变为后端只是吐json的数据源，而前端做所有UI的事情。MVCMV
android ksoap2 中把XML(DataSet) 当做参数传递 aijuans android
我的android app中需要发送webservice ，于是我使用了 ksop2 进行发送，在测试过程中不是很顺利,不能正常工作.我的web service 请求格式如下 [html] view plain copy <Envelope xmlns="http://schemas.
使用Spring进行统一日志管理 + 统一异常管理 baalwolf spring
统一日志和异常管理配置好后，SSH项目中，代码以往散落的log.info() 和 try..catch..finally 再也不见踪影！统一日志异常实现类： [java] view plain copy package com.pilelot.web.util; impor
Android SDK 国内镜像 BigBird2012 android sdk
一、镜像地址： 1、东软信息学院的 Android SDK 镜像，比配置代理下载快多了。配置地址， http://mirrors.neusoft.edu.cn/configurations.we#android 2、北京化工大学的： IPV4:ubuntu.buct.edu.cn IPV4:ubuntu.buct.cn IPV6:ubuntu.buct6.edu.cn
HTML无害化和Sanitize模块 bijian1013 JavaScript AngularJS Linky Sanitize
一.ng-bind-html、ng-bind-html-unsafe AngularJS非常注重安全方面的问题，它会尽一切可能把大多数攻击手段最小化。其中一个攻击手段是向你的web页面里注入不安全的HTML，然后利用它触发跨站攻击或者注入攻击。考虑这样一个例子，假设我们有一个变量存
[Maven学习笔记二]Maven命令 bit1129 maven
mvn compile compile编译命令将src/main/java和src/main/resources中的代码和配置文件编译到target/classes中，不会对src/test/java中的测试类进行编译 MVN编译使用 maven-resources-plugin:2.6:resources maven-compiler-plugin:2.5.1:compile &nbs
【Java命令二】jhat bit1129 Java命令
jhat用于分析使用jmap dump的文件，，可以将堆中的对象以html的形式显示出来，包括对象的数量，大小等等，并支持对象查询语言。 jhat默认开启监听端口7000的HTTP服务，jhat是Java Heap Analysis Tool的缩写 1. 用法： [hadoop@hadoop bin]$ jhat -help Usage: jhat [-stack <bool&g
JBoss 5.1.0 GA:Error installing to Instantiated: name=AttachmentStore state=Desc ronin47
进到类似目录 server/default/conf/bootstrap，打开文件 profile.xml找到： Xml代码<bean name="AttachmentStore" class="org.jboss.system.server.profileservice.repository.AbstractAtta
写给初学者的6条网页设计安全配色指南 brotherlamp UI ui自学 ui视频 ui教程 ui资料
网页设计中最基本的原则之一是，不管你花多长时间创造一个华丽的设计，其最终的角色都是这场秀中真正的明星——内容的衬托我仍然清楚地记得我最早的一次美术课，那时我还是一个小小的、对凡事都充满渴望的孩子，我摆放出一大堆漂亮的彩色颜料。我仍然记得当我第一次看到原色与另一种颜色混合变成第二种颜色时的那种兴奋，并且我想，既然两种颜色能创造出一种全新的美丽色彩，那所有颜色
有一个数组，每次从中间随机取一个，然后放回去，当所有的元素都被取过，返回总共的取的次数。写一个函数实现。复杂度是什么。 bylijinnan java 算法面试
import java.util.Random; import java.util.Set; import java.util.TreeSet; /** * http://weibo.com/1915548291/z7HtOF4sx * #面试题#有一个数组，每次从中间随机取一个，然后放回去，当所有的元素都被取过，返回总共的取的次数。 * 写一个函数实现。复杂度是什么
struts2获得request、session、application方式 chiangfai application
1、与Servlet API解耦的访问方式。 a.Struts2对HttpServletRequest、HttpSession、ServletContext进行了封装，构造了三个Map对象来替代这三种对象要获取这三个Map对象，使用ActionContext类。 -----> package pro.action; import java.util.Map; imp
改变python的默认语言设置 chenchao051 python
import sys sys.getdefaultencoding() 可以测试出默认语言，要改变的话，需要在python lib的site-packages文件夹下新建： sitecustomize.py，这个文件比较特殊，会在python启动时来加载，所以就可以在里面写上： import sys sys.setdefaultencoding('utf-8') &n
mysql导入数据load data infile用法 daizj mysql 导入数据
我们常常导入数据！mysql有一个高效导入方法，那就是load data infile 下面来看案例说明基本语法： load data [low_priority] [local] infile 'file_name txt' [replace | ignore] into table tbl_name [fields [terminated by't'] [OPTI
phpexcel导入excel表到数据库简单入门示例 dcj3sjt126com PHP Excel
跟导出相对应的，同一个数据表，也是将phpexcel类放在class目录下，将Excel表格中的内容读取出来放到数据库中 <?php error_reporting(E_ALL); set_time_limit(0); ?> <html> <head> <meta http-equiv="Content-Type"
22岁到72岁的男人对女人的要求 dcj3sjt126com
22岁男人对女人的要求是：一，美丽，二，性感，三，有份具品味的职业，四，极有耐性，善解人意，五，该聪明的时候聪明，六，作小鸟依人状时尽量自然，七，怎样穿都好看，八，懂得适当地撒娇，九，虽作惊喜反应，但看起来自然，十，上了床就是个无条件荡妇。 32岁的男人对女人的要求，略作修定，是：一，入得厨房，进得睡房，二，不必服侍皇太后，三，不介意浪漫蜡烛配盒饭，四，听多过说，五，不再傻笑，六，懂得独
Spring和HIbernate对DDM设计的支持 e200702084 DAO 设计模式 spring Hibernate 领域模型
A：数据访问对象 DAO和资源库在领域驱动设计中都很重要。DAO是关系型数据库和应用之间的契约。它封装了Web应用中的数据库CRUD操作细节。另一方面，资源库是一个独立的抽象，它与DAO进行交互，并提供到领域模型的“业务接口”。资源库使用领域的通用语言，处理所有必要的DAO，并使用领域理解的语言提供对领域模型的数据访问服务。
NoSql 数据库的特性比较 geeksun NoSQL
Redis 是一个开源的使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库，并提供多种语言的API。目前由VMware主持开发工作。 1. 数据模型作为Key-value型数据库，Redis也提供了键（Key）和值（Value）的映射关系。除了常规的数值或字符串，Redis的键值还可以是以下形式之一： Lists （列表） Sets
使用 Nginx Upload Module 实现上传文件功能 hongtoushizi nginx
转载自： http://www.tuicool.com/wx/aUrAzm 普通网站在实现文件上传功能的时候，一般是使用Python，Java等后端程序实现，比较麻烦。Nginx有一个Upload模块，可以非常简单的实现文件上传功能。此模块的原理是先把用户上传的文件保存到临时文件，然后在交由后台页面处理，并且把文件的原名，上传后的名称，文件类型，文件大小set到页面。下
spring-boot-web-ui及thymeleaf基本使用 jishiweili spring thymeleaf
视图控制层代码demo如下： @Controller @RequestMapping("/") public class MessageController { private final MessageRepository messageRepository; @Autowired public MessageController(Mes
数据源架构模式之活动记录 home198979 PHP 架构活动记录数据映射
hello!架构一、概念活动记录（Active Record）：一个对象，它包装数据库表或视图中某一行，封装数据库访问，并在这些数据上增加了领域逻辑。对象既有数据又有行为。活动记录使用直截了当的方法，把数据访问逻辑置于领域对象中。二、实现简单活动记录活动记录在php许多框架中都有应用，如cakephp。 <?php /** * 行数据入口类 *
Linux Shell脚本之自动修改IP pda158 linux centos Debian 脚本
作为一名 Linux SA，日常运维中很多地方都会用到脚本，而服务器的ip一般采用静态ip或者MAC绑定，当然后者比较操作起来相对繁琐，而前者我们可以设置主机名、ip信息、网关等配置。修改成特定的主机名在维护和管理方面也比较方便。如下脚本用途为：修改ip和主机名等相关信息，可以根据实际需求修改，举一反三！ #!/bin/sh #auto Change ip netmask ga
开发环境搭建独浮云 eclipse jdk tomcat
最近在开发过程中，经常出现MyEclipse内存溢出等错误，需要重启的情况，好麻烦。对于一般的JAVA+TOMCAT项目开发，其实没有必要使用重量级的MyEclipse，使用eclipse就足够了。尤其是开发机器硬件配置一般的人。 &n

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他