小样yb

POI读取大批量数据的Excel

1. Excel2003与Excel2007

两个版本的最大行数和列数不同，2003版最大行数是65536行，最大列数是256列，2007版及以后的版本最大行数是1048576行，最大列数是16384列。

excel2003是以二进制的方式存储，这种格式不易被其他软件读取使用；而excel2007采用了基于XML的ooxml开放文档标准，ooxml使用XML和ZIP技术结合进行文件存储，XML是一个基于文本的格式，而且ZIP容器支持内容的压缩，所以其一大优势是可以大大减小文件的尺寸。

2. 大批量数据读写

2.1 大批量数据写入

对于大数据的Xlsx文件的写入，POI3.8提供了SXSSFSXSSFWorkbook类，采用缓存方式进行大批量写文件。

详情可以查看poi官网示例：http://poi.apache.org/spreadsheet/how-to.html#sxssf 或 http://blog.csdn.net/daiyutage/article/details/53010491

2.2 大批量数据读取

POI读取Excel有两种模式，一种是用户模式，一种是SAX事件驱动模式，将xlsx格式的文档转换成CSV格式后进行读取。用户模式API接口丰富，使用POI的API可以很容易读取Excel，但用户模式消耗的内存很大，当遇到很大sheet、大数据网格，假空行、公式等问题时，很容易导致内存溢出。POI官方推荐解决内存溢出的方式使用CVS格式解析，即SAX事件驱动模式。下面主要是讲解如何读取大批量数据：

pom.xml所需jar包：

 1 <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
 2   xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/maven-v4_0_0.xsd">
 3   <modelVersion>4.0.0modelVersion>
 4   <groupId>POIExcelgroupId>
 5   <artifactId>POIExcelartifactId>
 6   <packaging>warpackaging>
 7   <version>1.0-SNAPSHOTversion>
 8   <name>POIExcel Maven Webappname>
 9   <url>http://maven.apache.orgurl>
10   <dependencies>
11     <dependency>
12       <groupId>junitgroupId>
13       <artifactId>junitartifactId>
14       <version>3.8.1version>
15       <scope>testscope>
16     dependency>
17 
18     <dependency>
19       <groupId>org.apache.poigroupId>
20       <artifactId>poiartifactId>
21       <version>3.17version>
22     dependency>
23 
24     <dependency>
25       <groupId>org.apache.poigroupId>
26       <artifactId>poi-ooxmlartifactId>
27       <version>3.17version>
28     dependency>
29 
30     <dependency>
31       <groupId>org.apache.poigroupId>
32       <artifactId>poi-ooxml-schemasartifactId>
33       <version>3.17version>
34     dependency>
35 
36     <dependency>
37       <groupId>com.syncthemallgroupId>
38       <artifactId>boilerpipeartifactId>
39       <version>1.2.1version>
40     dependency>
41 
42     <dependency>
43       <groupId>xercesgroupId>
44       <artifactId>xercesImplartifactId>
45       <version>2.11.0version>
46     dependency>
47 
48     <dependency>
49       <groupId>xml-apisgroupId>
50       <artifactId>xml-apisartifactId>
51       <version>1.4.01version>
52     dependency>
53 
54     <dependency>
55       <groupId>org.apache.xmlbeansgroupId>
56       <artifactId>xmlbeansartifactId>
57       <version>2.6.0version>
58     dependency>
59 
60     <dependency>
61       <groupId>saxgroupId>
62       <artifactId>saxartifactId>
63       <version>2.0.1version>
64     dependency>
65 
66     <dependency>
67       <groupId>org.apache.commonsgroupId>
68       <artifactId>commons-lang3artifactId>
69       <version>3.7version>
70     dependency>
71 
72   dependencies>
73   <build>
74     <finalName>POIExcelfinalName>
75   build>
76 project>

POI以SAX解析excel2007文件：

解决思路：通过继承DefaultHandler类，重写process()，startElement()，characters()，endElement()这四个方法。process()方式主要是遍历所有的sheet，并依次调用startElement()、characters()方法、endElement()这三个方法。startElement()用于设定单元格的数字类型（如日期、数字、字符串等等）。characters()用于获取该单元格对应的索引值或是内容值（如果单元格类型是字符串、INLINESTR、数字、日期则获取的是索引值；其他如布尔值、错误、公式则获取的是内容值）。endElement()根据startElement()的单元格数字类型和characters()的索引值或内容值，最终得出单元格的内容值，并打印出来。

  1 package org.poi;
  2 
  3 import org.apache.poi.openxml4j.opc.OPCPackage;
  4 import org.apache.poi.ss.usermodel.BuiltinFormats;
  5 import org.apache.poi.ss.usermodel.DataFormatter;
  6 import org.apache.poi.xssf.eventusermodel.XSSFReader;
  7 import org.apache.poi.xssf.model.SharedStringsTable;
  8 import org.apache.poi.xssf.model.StylesTable;
  9 import org.apache.poi.xssf.usermodel.XSSFCellStyle;
 10 import org.apache.poi.xssf.usermodel.XSSFRichTextString;
 11 import org.xml.sax.Attributes;
 12 import org.xml.sax.InputSource;
 13 import org.xml.sax.SAXException;
 14 import org.xml.sax.XMLReader;
 15 import org.xml.sax.helpers.DefaultHandler;
 16 import org.xml.sax.helpers.XMLReaderFactory;
 17 
 18 import java.io.InputStream;
 19 import java.util.ArrayList;
 20 import java.util.List;
 21 
 22 /**
 23  * @author y
 24  * @create 2018-01-18 14:28
 25  * @desc POI读取excel有两种模式，一种是用户模式，一种是事件驱动模式
 26  * 采用SAX事件驱动模式解决XLSX文件，可以有效解决用户模式内存溢出的问题，
 27  * 该模式是POI官方推荐的读取大数据的模式，
 28  * 在用户模式下，数据量较大，Sheet较多，或者是有很多无用的空行的情况下，容易出现内存溢出
 29  *    32   34  35  36  37     41  42  43  44   46  47  48  49   51  52  53  54   56  57  58  59   61  62  63  64   66  67  68  69   71  72  73  74   76  77  78  79   81  82  83  84   86  87  88  89   91  92  93  94   96  97  98  99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240 241 242 243 244 245 246 247 248 249 250 251 252 253 254 255 256 257 258 259 260 261 262 263 264 265 266 267 268 269 270 271 272 273 274 275 276 277 278 279 280 281 282 283 284 285 286 287 288 289 290 291 292 293 294 295 296 297 298 299 300 301 302 303 304 305 306 307 308 309 310 311 312 313 314 315 316 317 318 319 320 321 322 323 324 325 326 327 328 329 330 331 332 333 334 335 336 337 338 339 340 341 342 343 344 345 346 347 348 349 350 351 352 353 354 355 356 357 358 359 360 361 362 363 364 365 366 367 368 369 370 371 372 373 374 375 376 377 378 379 380 381 382 383 384 385 386 387 388 389 390 391 392 393 394 395 396 397 398 399 400 401 402 403 404 405 406 407 408 409 410 411 412 413 414 415 416 417 
  
  * 用于解决.xlsx2007版本大数据量问题 31  **/ public class ExcelXlsxReader extends DefaultHandler { 33 /**      * 单元格中的数据可能的数据类型 */ enum CellDataType { 38         BOOL, ERROR, FORMULA, INLINESTR, SSTINDEX, NUMBER, DATE, NULL 39     } 40 /**      * 共享字符串表 */ private SharedStringsTable sst; 45 /**      * 上一次的索引值 */ private String lastIndex; 50 /**      * 文件的绝对路径 */ private String filePath = ""; 55 /**      * 工作表索引 */ private int sheetIndex = 0; 60 /**      * sheet名 */ private String sheetName = ""; 65 /**      * 总行数 */ private int totalRows=0; 70 /**      * 一行内cell集合 */ private List cellList = new ArrayList(); 75 /**      * 判断整行是否为空行的标记 */ private boolean flag = false; 80 /**      * 当前行 */ private int curRow = 1; 85 /**      * 当前列 */ private int curCol = 0; 90 /**      * T元素标识 */ private boolean isTElement; 95 /**      * 异常信息，如果为空则表示没有异常 */ private String exceptionMessage;

/**      * 单元格数据类型，默认为字符串类型 */ private CellDataType nextDataType = CellDataType.SSTINDEX;

private final DataFormatter formatter = new DataFormatter();

/**      * 单元格日期格式的索引 */ private short formatIndex;

/**      * 日期格式字符串 */ private String formatString;

//定义前一个元素和当前元素的位置，用来计算其中空的单元格数量，如A6和A8等 private String preRef = null, ref = null;

//定义该文档一行最大的单元格数，用来补全一行最后可能缺失的单元格 private String maxRef = null;

/**      * 单元格 */ private StylesTable stylesTable;

/**      * 遍历工作簿中所有的电子表格      * 并缓存在mySheetList中      *      * @param filename      * @throws Exception */ public int process(String filename) throws Exception { filePath = filename; OPCPackage pkg = OPCPackage.open(filename); XSSFReader xssfReader = new XSSFReader(pkg); stylesTable = xssfReader.getStylesTable(); SharedStringsTable sst = xssfReader.getSharedStringsTable(); XMLReader parser = XMLReaderFactory.createXMLReader("org.apache.xerces.parsers.SAXParser"); this.sst = sst; parser.setContentHandler(this); XSSFReader.SheetIterator sheets = (XSSFReader.SheetIterator) xssfReader.getSheetsData(); while (sheets.hasNext()) { //遍历sheet curRow = 1; //标记初始行为第一行 sheetIndex++; InputStream sheet = sheets.next(); //sheets.next()和sheets.getSheetName()不能换位置，否则sheetName报错 sheetName = sheets.getSheetName(); InputSource sheetSource = new InputSource(sheet); parser.parse(sheetSource); //解析excel的每条记录，在这个过程中startElement()、characters()、endElement()这三个函数会依次执行             sheet.close();         } return totalRows; //返回该excel文件的总行数，不包括首列和空行     }

/**      * 第一个执行      *      * @param uri      * @param localName      * @param name      * @param attributes      * @throws SAXException */     @Override public void startElement(String uri, String localName, String name, Attributes attributes) throws SAXException { //c => 单元格 if ("c".equals(name)) { //前一个单元格的位置 if (preRef == null) { preRef = attributes.getValue("r"); } else { preRef = ref;             }

//当前单元格的位置 ref = attributes.getValue("r"); //设定单元格类型 this.setNextDataType(attributes);         }

//当元素为t时 if ("t".equals(name)) { isTElement = true; } else { isTElement = false;         }

//置空 lastIndex = "";     }

/**      * 第二个执行      * 得到单元格对应的索引值或是内容值      * 如果单元格类型是字符串、INLINESTR、数字、日期，lastIndex则是索引值      * 如果单元格类型是布尔值、错误、公式，lastIndex则是内容值      * @param ch      * @param start      * @param length      * @throws SAXException */     @Override public void characters(char[] ch, int start, int length) throws SAXException { lastIndex += new String(ch, start, length);     }

/**      * 第三个执行      *      * @param uri      * @param localName      * @param name      * @throws SAXException */     @Override public void endElement(String uri, String localName, String name) throws SAXException {

//t元素也包含字符串 if (isTElement) {//这个程序没经过 //将单元格内容加入rowlist中，在这之前先去掉字符串前后的空白符 String value = lastIndex.trim();             cellList.add(curCol, value); curCol++; isTElement = false; //如果里面某个单元格含有值，则标识该行不为空行 if (value != null && !"".equals(value)) { flag = true;             } } else if ("v".equals(name)) { //v => 单元格的值，如果单元格是字符串，则v标签的值为该字符串在SST中的索引 String value = this.getDataValue(lastIndex.trim(), "");//根据索引值获取对应的单元格值 //补全单元格之间的空单元格 if (!ref.equals(preRef)) { int len = countNullCell(ref, preRef); for (int i = 0; i < len; i++) { cellList.add(curCol, ""); curCol++;                 }             }             cellList.add(curCol, value); curCol++; //如果里面某个单元格含有值，则标识该行不为空行 if (value != null && !"".equals(value)) { flag = true;             } } else { //如果标签名称为row，这说明已到行尾，调用optRows()方法 if ("row".equals(name)) { //默认第一行为表头，以该行单元格数目为最大数目 if (curRow == 1) { maxRef = ref;                 } //补全一行尾部可能缺失的单元格 if (maxRef != null) { int len = countNullCell(maxRef, ref); for (int i = 0; i <= len; i++) { cellList.add(curCol, ""); curCol++;                     }                 }

if (flag&&curRow!=1){ //该行不为空行且该行不是第一行，则发送（第一行为列名，不需要）                     ExcelReaderUtil.sendRows(filePath, sheetName, sheetIndex, curRow, cellList); totalRows++;                 }

                cellList.clear(); curRow++; curCol = 0; preRef = null; ref = null; flag=false;             }         }     }

/**      * 处理数据类型      *      * @param attributes */ public void setNextDataType(Attributes attributes) { nextDataType = CellDataType.NUMBER; //cellType为空，则表示该单元格类型为数字 formatIndex = -1; formatString = null; String cellType = attributes.getValue("t"); //单元格类型 String cellStyleStr = attributes.getValue("s"); // String columnData = attributes.getValue("r"); //获取单元格的位置，如A1,B1 if ("b".equals(cellType)) { //处理布尔值 nextDataType = CellDataType.BOOL; } else if ("e".equals(cellType)) {  //处理错误 nextDataType = CellDataType.ERROR; } else if ("inlineStr".equals(cellType)) { nextDataType = CellDataType.INLINESTR; } else if ("s".equals(cellType)) { //处理字符串 nextDataType = CellDataType.SSTINDEX; } else if ("str".equals(cellType)) { nextDataType = CellDataType.FORMULA;         }

if (cellStyleStr != null) { //处理日期 int styleIndex = Integer.parseInt(cellStyleStr); XSSFCellStyle style = stylesTable.getStyleAt(styleIndex); formatIndex = style.getDataFormat(); formatString = style.getDataFormatString();

if (formatString.contains("m/d/yy")) { nextDataType = CellDataType.DATE; formatString = "yyyy-MM-dd hh:mm:ss";             }

if (formatString == null) { nextDataType = CellDataType.NULL; formatString = BuiltinFormats.getBuiltinFormat(formatIndex);             }         }     }

/**      * 对解析出来的数据进行类型处理      * @param value   单元格的值，      *                value代表解析：BOOL的为0或1， ERROR的为内容值，FORMULA的为内容值，INLINESTR的为索引值需转换为内容值，      *                SSTINDEX的为索引值需转换为内容值， NUMBER为内容值，DATE为内容值      * @param thisStr 一个空字符串      * @return */ @SuppressWarnings("deprecation") public String getDataValue(String value, String thisStr) { switch (nextDataType) { // 这几个的顺序不能随便交换，交换了很可能会导致数据错误 case BOOL: //布尔值 char first = value.charAt(0); thisStr = first == '0' ? "FALSE" : "TRUE"; break; case ERROR: //错误 thisStr = "\"ERROR:" + value.toString() + '"'; break; case FORMULA: //公式 thisStr = '"' + value.toString() + '"'; break; case INLINESTR: XSSFRichTextString rtsi = new XSSFRichTextString(value.toString()); thisStr = rtsi.toString(); rtsi = null; break; case SSTINDEX: //字符串 String sstIndex = value.toString(); try { int idx = Integer.parseInt(sstIndex); XSSFRichTextString rtss = new XSSFRichTextString(sst.getEntryAt(idx));//根据idx索引值获取内容值 thisStr = rtss.toString(); rtss = null; } catch (NumberFormatException ex) { thisStr = value.toString();                 } break; case NUMBER: //数字 if (formatString != null) { thisStr = formatter.formatRawCellContents(Double.parseDouble(value), formatIndex, formatString).trim(); } else { thisStr = value;                 } thisStr = thisStr.replace("_", "").trim(); break; case DATE: //日期 thisStr = formatter.formatRawCellContents(Double.parseDouble(value), formatIndex, formatString); // 对日期字符串作特殊处理，去掉T thisStr = thisStr.replace("T", " "); break; default: thisStr = " "; break;         } return thisStr;     }

public int countNullCell(String ref, String preRef) { //excel2007最大行数是1048576，最大列数是16384，最后一列列名是XFD String xfd = ref.replaceAll("\\d+", ""); String xfd_1 = preRef.replaceAll("\\d+", "");

xfd = fillChar(xfd, 3, '@', true); xfd_1 = fillChar(xfd_1, 3, '@', true);

char[] letter = xfd.toCharArray(); char[] letter_1 = xfd_1.toCharArray(); int res = (letter[0] - letter_1[0]) * 26 * 26 + (letter[1] - letter_1[1]) * 26 + (letter[2] - letter_1[2]); return res - 1;     }

public String fillChar(String str, int len, char let, boolean isPre) { int len_1 = str.length(); if (len_1 < len) { if (isPre) { for (int i = 0; i < (len - len_1); i++) { str = let + str;                 } } else { for (int i = 0; i < (len - len_1); i++) { str = str + let;                 }             }         } return str;     }

/**      * @return the exceptionMessage */ public String getExceptionMessage() { return exceptionMessage;     } }

src="http://img.e-com-net.com/image/info8/ab544354af934f8997b79d5b4245e68a.gif" alt="复制代码" style="border:none;" width="0" height="0"> 'Segoe UI', Roboto, 'Helvetica Neue', Helvetica, 'PingFang SC', 'Hiragino Sans GB', 'Microsoft YaHei', SimSun, sans-serif;font-size:14px;text-align:left;background-color:rgb(255,255,255);">POI通过继承HSSFListener类来解决Excel2003文件：

解决思路：重写process()，processRecord()两个方法，其中processRecord是核心方法，用于处理sheetName和各种单元格数字类型。

  1 package org.poi;
  2 
  3 import org.apache.poi.hssf.eventusermodel.*;
  4 import org.apache.poi.hssf.eventusermodel.dummyrecord.LastCellOfRowDummyRecord;
  5 import org.apache.poi.hssf.eventusermodel.dummyrecord.MissingCellDummyRecord;
  6 import org.apache.poi.hssf.model.HSSFFormulaParser;
  7 import org.apache.poi.hssf.record.*;
  8 import org.apache.poi.hssf.usermodel.HSSFDataFormatter;
  9 import org.apache.poi.hssf.usermodel.HSSFWorkbook;
 10 import org.apache.poi.poifs.filesystem.POIFSFileSystem;
 11 
 12 import java.io.FileInputStream;
 13 import java.util.ArrayList;
 14 import java.util.List;
 15 
 16 /**
 17  * @author y
 18  * @create 2018-01-19 14:18
 19  * @desc 用于解决.xls2003版本大数据量问题
 20  **/
 21 public class ExcelXlsReader implements HSSFListener {
 22 
 23     private int minColums = -1;
 24 
 25     private POIFSFileSystem fs;
 26 
 27     /**
 28      * 总行数
 29      */
 30     private int totalRows=0;
 31 
 32     /**
 33      * 上一行row的序号
 34      */
 35     private int lastRowNumber;
 36 
 37     /**
 38      * 上一单元格的序号
 39      */
 40     private int lastColumnNumber;
 41 
 42     /**
 43      * 是否输出formula，还是它对应的值
 44      */
 45     private boolean outputFormulaValues = true;
 46 
 47     /**
 48      * 用于转换formulas
 49      */
 50     private EventWorkbookBuilder.SheetRecordCollectingListener workbookBuildingListener;
 51 
 52     //excel2003工作簿
 53     private HSSFWorkbook stubWorkbook;
 54 
 55     private SSTRecord sstRecord;
 56 
 57     private FormatTrackingHSSFListener formatListener;
 58 
 59     private final HSSFDataFormatter formatter = new HSSFDataFormatter();
 60 
 61     /**
 62      * 文件的绝对路径
 63      */
 64     private String filePath = "";
 65 
 66     //表索引
 67     private int sheetIndex = 0;
 68 
 69     private BoundSheetRecord[] orderedBSRs;
 70 
 71     @SuppressWarnings("unchecked")
 72     private ArrayList boundSheetRecords = new ArrayList();
 73 
 74     private int nextRow;
 75 
 76     private int nextColumn;
 77 
 78     private boolean outputNextStringRecord;
 79 
 80     //当前行
 81     private int curRow = 0;
 82 
 83     //存储一行记录所有单元格的容器
 84     private List cellList = new ArrayList();
 85 
 86     /**
 87      * 判断整行是否为空行的标记
 88      */
 89     private boolean flag = false;
 90 
 91     @SuppressWarnings("unused")
 92     private String sheetName;
 93 
 94     /**
 95      * 遍历excel下所有的sheet
 96      *
 97      * @param fileName
 98      * @throws Exception
 99      */
100     public int process(String fileName) throws Exception {
101         filePath = fileName;
102         this.fs = new POIFSFileSystem(new FileInputStream(fileName));
103         MissingRecordAwareHSSFListener listener = new MissingRecordAwareHSSFListener(this);
104         formatListener = new FormatTrackingHSSFListener(listener);
105         HSSFEventFactory factory = new HSSFEventFactory();
106         HSSFRequest request = new HSSFRequest();
107         if (outputFormulaValues) {
108             request.addListenerForAllRecords(formatListener);
109         } else {
110             workbookBuildingListener = new EventWorkbookBuilder.SheetRecordCollectingListener(formatListener);
111             request.addListenerForAllRecords(workbookBuildingListener);
112         }
113         factory.processWorkbookEvents(request, fs);
114 
115         return totalRows; //返回该excel文件的总行数，不包括首列和空行
116     }
117     
118     /**
119      * HSSFListener 监听方法，处理Record
120      * 处理每个单元格
121      * @param record
122      */
123     @SuppressWarnings("unchecked")
124     public void processRecord(Record record) {
125         int thisRow = -1;
126         int thisColumn = -1;
127         String thisStr = null;
128         String value = null;
129         switch (record.getSid()) {
130             case BoundSheetRecord.sid:
131                 boundSheetRecords.add(record);
132                 break;
133             case BOFRecord.sid: //开始处理每个sheet
134                 BOFRecord br = (BOFRecord) record;
135                 if (br.getType() == BOFRecord.TYPE_WORKSHEET) {
136                     //如果有需要，则建立子工作簿
137                     if (workbookBuildingListener != null && stubWorkbook == null) {
138                         stubWorkbook = workbookBuildingListener.getStubHSSFWorkbook();
139                     }
140 
141                     if (orderedBSRs == null) {
142                         orderedBSRs = BoundSheetRecord.orderByBofPosition(boundSheetRecords);
143                     }
144                     sheetName = orderedBSRs[sheetIndex].getSheetname();
145                     sheetIndex++;
146                 }
147                 break;
148             case SSTRecord.sid:
149                 sstRecord = (SSTRecord) record;
150                 break;
151             case BlankRecord.sid: //单元格为空白
152                 BlankRecord brec = (BlankRecord) record;
153                 thisRow = brec.getRow();
154                 thisColumn = brec.getColumn();
155                 thisStr = "";
156                 cellList.add(thisColumn, thisStr);
157                 break;
158             case BoolErrRecord.sid: //单元格为布尔类型
159                 BoolErrRecord berec = (BoolErrRecord) record;
160                 thisRow = berec.getRow();
161                 thisColumn = berec.getColumn();
162                 thisStr = berec.getBooleanValue() + "";
163                 cellList.add(thisColumn, thisStr);
164                 checkRowIsNull(thisStr);  //如果里面某个单元格含有值，则标识该行不为空行
165                 break;
166             case FormulaRecord.sid://单元格为公式类型
167                 FormulaRecord frec = (FormulaRecord) record;
168                 thisRow = frec.getRow();
169                 thisColumn = frec.getColumn();
170                 if (outputFormulaValues) {
171                     if (Double.isNaN(frec.getValue())) {
172                         outputNextStringRecord = true;
173                         nextRow = frec.getRow();
174                         nextColumn = frec.getColumn();
175                     } else {
176                         thisStr = '"' + HSSFFormulaParser.toFormulaString(stubWorkbook, frec.getParsedExpression()) + '"';
177                     }
178                 } else {
179                     thisStr = '"' + HSSFFormulaParser.toFormulaString(stubWorkbook, frec.getParsedExpression()) + '"';
180                 }
181                 cellList.add(thisColumn, thisStr);
182                 checkRowIsNull(thisStr);  //如果里面某个单元格含有值，则标识该行不为空行
183                 break;
184             case StringRecord.sid: //单元格中公式的字符串
185                 if (outputNextStringRecord) {
186                     StringRecord srec = (StringRecord) record;
187                     thisStr = srec.getString();
188                     thisRow = nextRow;
189                     thisColumn = nextColumn;
190                     outputNextStringRecord = false;
191                 }
192                 break;
193             case LabelRecord.sid:
194                 LabelRecord lrec = (LabelRecord) record;
195                 curRow = thisRow = lrec.getRow();
196                 thisColumn = lrec.getColumn();
197                 value = lrec.getValue().trim();
198                 value = value.equals("") ? "" : value;
199                 cellList.add(thisColumn, value);
200                 checkRowIsNull(value);  //如果里面某个单元格含有值，则标识该行不为空行
201                 break;
202             case LabelSSTRecord.sid: //单元格为字符串类型
203                 LabelSSTRecord lsrec = (LabelSSTRecord) record;
204                 curRow = thisRow = lsrec.getRow();
205                 thisColumn = lsrec.getColumn();
206                 if (sstRecord == null) {
207                     cellList.add(thisColumn, "");
208                 } else {
209                     value = sstRecord.getString(lsrec.getSSTIndex()).toString().trim();
210                     value = value.equals("") ? "" : value;
211                     cellList.add(thisColumn, value);
212                     checkRowIsNull(value);  //如果里面某个单元格含有值，则标识该行不为空行
213                 }
214                 break;
215             case NumberRecord.sid: //单元格为数字类型
216                 NumberRecord numrec = (NumberRecord) record;
217                 curRow = thisRow = numrec.getRow();
218                 thisColumn = numrec.getColumn();
219 
220                 //第一种方式
221                 //value = formatListener.formatNumberDateCell(numrec).trim();//这个被写死，采用的m/d/yy h:mm格式，不符合要求
222 
223                 //第二种方式，参照formatNumberDateCell里面的实现方法编写
224                 Double valueDouble=((NumberRecord)numrec).getValue();
225                 String formatString=formatListener.getFormatString(numrec);
226                 if (formatString.contains("m/d/yy")){
227                     formatString="yyyy-MM-dd hh:mm:ss";
228                 }
229                 int formatIndex=formatListener.getFormatIndex(numrec);
230                 value=formatter.formatRawCellContents(valueDouble, formatIndex, formatString).trim();
231 
232                 value = value.equals("") ? "" : value;
233                 //向容器加入列值
234                 cellList.add(thisColumn, value);
235                 checkRowIsNull(value);  //如果里面某个单元格含有值，则标识该行不为空行
236                 break;
237             default:
238                 break;
239         }
240 
241         //遇到新行的操作
242         if (thisRow != -1 && thisRow != lastRowNumber) {
243             lastColumnNumber = -1;
244         }
245 
246         //空值的操作
247         if (record instanceof MissingCellDummyRecord) {
248             MissingCellDummyRecord mc = (MissingCellDummyRecord) record;
249             curRow = thisRow = mc.getRow();
250             thisColumn = mc.getColumn();
251             cellList.add(thisColumn, "");
252         }
253 
254         //更新行和列的值
255         if (thisRow > -1)
256             lastRowNumber = thisRow;
257         if (thisColumn > -1)
258             lastColumnNumber = thisColumn;
259 
260         //行结束时的操作
261         if (record instanceof LastCellOfRowDummyRecord) {
262             if (minColums > 0) {
263                 //列值重新置空
264                 if (lastColumnNumber == -1) {
265                     lastColumnNumber = 0;
266                 }
267             }
268             lastColumnNumber = -1;
269 
270             if (flag&&curRow!=0) { //该行不为空行且该行不是第一行，发送（第一行为列名，不需要）
271                 ExcelReaderUtil.sendRows(filePath, sheetName, sheetIndex, curRow + 1, cellList); //每行结束时，调用sendRows()方法
272                 totalRows++;
273             }
274             //清空容器
275             cellList.clear();
276             flag=false;
277         }
278     }
279 
280     /**
281      * 如果里面某个单元格含有值，则标识该行不为空行
282      * @param value
283      */
284     public void checkRowIsNull(String value){
285         if (value != null && !"".equals(value)) {
286             flag = true;
287         }
288     }
289 }

辅助类ExcelReaderUtil，调用ExcelXlsReader类和ExcelXlsxReader类对excel2003和excel2007两个版本进行大批量数据读取：

 1 package org.poi;
 2 
 3 import java.util.List;
 4 
 5 /**
 6  * @author y
 7  * @create 2018-01-19 0:13
 8  * @desc
 9  **/
10 public class ExcelReaderUtil {
11     //excel2003扩展名
12     public static final String EXCEL03_EXTENSION = ".xls";
13     //excel2007扩展名
14     public static final String EXCEL07_EXTENSION = ".xlsx";
15 
16     /**
17      * 每获取一条记录，即打印
18      * 在flume里每获取一条记录即发送，而不必缓存起来，可以大大减少内存的消耗，这里主要是针对flume读取大数据量excel来说的
19      * @param sheetName
20      * @param sheetIndex
21      * @param curRow
22      * @param cellList
23      */
24     public static void sendRows(String filePath, String sheetName, int sheetIndex, int curRow, List cellList) {
25             StringBuffer oneLineSb = new StringBuffer();
26             oneLineSb.append(filePath);
27             oneLineSb.append("--");
28             oneLineSb.append("sheet" + sheetIndex);
29             oneLineSb.append("::" + sheetName);//加上sheet名
30             oneLineSb.append("--");
31             oneLineSb.append("row" + curRow);
32             oneLineSb.append("::");
33             for (String cell : cellList) {
34                 oneLineSb.append(cell.trim());
35                 oneLineSb.append("|");
36             }
37             String oneLine = oneLineSb.toString();
38             if (oneLine.endsWith("|")) {
39                 oneLine = oneLine.substring(0, oneLine.lastIndexOf("|"));
40             }// 去除最后一个分隔符
41 
42             System.out.println(oneLine);
43     }
44 
45     public static void readExcel(String fileName) throws Exception {
46         int totalRows =0;
47         if (fileName.endsWith(EXCEL03_EXTENSION)) { //处理excel2003文件
48             ExcelXlsReader excelXls=new ExcelXlsReader();
49             totalRows =excelXls.process(fileName);
50         } else if (fileName.endsWith(EXCEL07_EXTENSION)) {//处理excel2007文件
51             ExcelXlsxReader excelXlsxReader = new ExcelXlsxReader();
52             totalRows = excelXlsxReader.process(fileName);
53         } else {
54             throw new Exception("文件格式错误，fileName的扩展名只能是xls或xlsx。");
55         }
56         System.out.println("发送的总行数：" + totalRows);
57     }
58 
59     public static void main(String[] args) throws Exception {
60         String path="C:\\Users\\y****\\Desktop\\TestSample\\H_20171226_***_*****_0430.xlsx";
61         ExcelReaderUtil.readExcel(path);
62     }
63 }

转自：https://www.cnblogs.com/swordfall/p/8298386.html

github地址：https://github.com/qiushangwenyue/POIExcel

参考资料：

https://www.cnblogs.com/huangjian2/p/6238237.html

https://www.cnblogs.com/yfrs/p/5689347.html

http://blog.csdn.net/lishengbo/article/details/40711769

https://www.cnblogs.com/wshsdlau/p/5643847.html

http://blog.csdn.net/lipinganq/article/details/78775195

http://blog.csdn.net/lipinganq/article/details/53389501

http://blog.csdn.net/zmx729618/article/details/72639037

http://blog.csdn.net/daiyutage/article/details/53010491

你可能感兴趣的:(POI读取大批量数据的Excel)

斤斤计较的婚姻到底有多难？白心之岂必有为
很多人私聊我会问到在哪个人群当中斤斤计较的人最多？我都会回答他，一般婚姻出现问题的斤斤计较的人士会非常多，以我多年经验，在婚姻落的一塌糊涂的人当中，斤斤计较的人数占比在20～30%以上，也就是说10个婚姻出现问题的斤斤计较的人有2-3个有多不减。在婚姻出问题当中，有大量的心理不平衡的、尖酸刻薄的怨妇。在婚姻中仅斤斤计较有两种类型：第一种是物质上的，另一种是精神上的。在物质与精神上抠门已经严重的影响
情绪觉察日记第37天露露_e800
今天是家庭关系规划师的第二阶最后一天，慧萍老师帮我做了个案，帮我处理了埋在心底好多年的一份恐惧，并给了我深深的力量！这几天出来学习，爸妈过来婆家帮我带小孩，妈妈出于爱帮我收拾东西，并跟我先生和婆婆产生矛盾，妈妈觉得他们没有照顾好我…。今晚回家见到妈妈，我很欣赏她并赞扬她，妈妈说今晚要跟我睡我说好，当我们俩躺在床上准备睡觉的时候，我握着妈妈的手对她说:妈妈这几天辛苦你了，你看你多利害把我们的家收拾得
芦花鞋一四许叶晗
又是在一个寒冷的夏日里，青铜和葵花决定今天一起去卖芦花鞋，奶奶亲手给他们做了一碗热乎乎的粥对他们说:“就靠你们两挣生活费了这碗粥赶紧趁热喝了吧！”于是青铜和葵花喝完了奶奶给她们做的粥，就准备去镇上卖卢花鞋，这回青铜和葵花穿着新的芦花鞋来到了镇上。青铜这回看到了很多人都在卖，用手势表达对葵花说:“这回有好多人在抢我们生意呢！我们必须得吆喝起来。”葵花点了点头。可是谁知他们也大声的叫，卖芦花喽！卖芦花
QQ群采集助手，精准引流必备神器 2401_87347160 其他经验分享
功能概述微信群查找与筛选工具是一款专为微信用户设计的辅助工具，它通过关键词搜索功能，帮助用户快速找到相关的微信群，并提供筛选是否需要验证的群组的功能。主要功能关键词搜索：用户可以输入关键词，工具将自动查找包含该关键词的微信群。筛选功能：工具提供筛选机制，用户可以选择是否只显示需要验证或不需要验证的群组。精准引流：通过上述功能，用户可以更精准地找到目标群组，进行有效的引流操作。3.设备需求该工具可以
关于沟通这件事，项目经理不需要每次都面对面进行流程大师兄
很多项目经理都会遇到这样的问题，项目中由于事情太多，根本没有足够的时间去召开会议，那在这种情况下如何去有效地管理项目中的利益相关者？当然，不建议电子邮件也不需要开会的话，建议可以采取下面几种方式来形成有效的沟通，这几种方式可以帮助你努力的通过各种办法来保持和各方面的联系。项目经理首先要问自己几个问题，项目中哪些利益相关者是必须要进行沟通的？可以列出项目中所有的利益相关者清单，同时也整理出项目中哪些
机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
铭刻于星（四十二）随风至
69夜晚，绍敏同学做完功课后，看了眼房外，没听到动静才敢从书包的夹层里拿出那个心形纸团。折痕压得很深，都有些旧了，想来是已经写好很久了。绍敏同学慢慢地、轻轻地捏开折叠处，待到全部拆开后，又反复抚平纸张，然后仔细地一字字默看。只是开头的三个字是第一次看到，让她心漏跳了几拍。“亲爱的绍敏：从四年级的时候，我就喜欢你了，但是我一直不敢说，怕影响你学习。六年级的时候听说有人跟你表白，你接受了，我很难过，但
底层逆袭到底有多难，不甘平凡的你准备好了吗？让吴起给你说说造命者说
底层逆袭到底有多难，不甘平凡的你准备好了吗？让吴起给你说说我叫吴起，生于公元前440年的战国初期，正是群雄并起、天下纷争不断的时候。后人说我是军事家、政治家、改革家，是兵家代表人物。评价我一生历仕鲁、魏、楚三国，通晓兵家、法家、儒家三家思想，在内政军事上都有极高的成就。周安王二十一年（公元前381年），因变法得罪守旧贵族，被人乱箭射死。我出生在卫国一个“家累万金”的富有家庭，从年轻时候起就不甘平凡
2020-01-25 晴岚85
郑海燕坚持分享590天2020.1.24在生活中只存在两个问题。一个问题是：你知道想要达成的目标是什么，但却不知道如何才能达成；另一个问题是：你不知道你的目标是什么。前一个是行动的问题，后一个是结果的问题。通过制定具体的下一步行动，可以解决不知道如何开始行动的问题。而通过去想象结果，对结果做预估，可以解决找不着目标的问题。对于所有吸引我们注意力，想要完成的任务，你可以先想象一下，预期的结果究竟是什
随笔 | 仙一般的灵气海思沧海
仙岛今天，我看了你全部，似乎已经进入你的世界我不知道，这是否是梦幻，还是你仙一般的灵气吸引了我也许每一个人都要有一份属于自己的追求，这样才能够符合人生的梦想，生活才能够充满着阳光与快乐我不知道，我为什么会这样的感叹，是在感叹自己的人生，还是感叹自己一直没有孜孜不倦的追求只感觉虚度了光阴，每天活在自己的梦中，活在一个不真实的世界是在逃避自己，还是在逃避周围的一切有时候我嘲笑自己，嘲笑自己如此的虚无，
想家爆米花机
也许不同于大家对家乡的思念，我对家乡甚至是疯狂的不舍。还未踏出车站就感觉到幸福，我享受这里的夕阳、这里的浓烈柴火味、这里每一口家常菜。我是宅女，我贪恋家的安逸。刚刚踏出大学校门，初出茅庐，无法适应每年只能国庆和春节回家。我焦虑、失眠、无端发脾气，是无法适应工作的节奏，是无法接受我将一步步离开家乡的事实。我不想承认自己胸无大志，选择再次踏上征程。图片发自App
【iOS】MVC设计模式 Magnetic_h ios mvc 设计模式 objective-c 学习 ui
MVC前言如何设计一个程序的结构，这是一门专门的学问，叫做"架构模式"（architecturalpattern），属于编程的方法论。MVC模式就是架构模式的一种。它是Apple官方推荐的App开发架构，也是一般开发者最先遇到、最经典的架构。MVC各层controller层Controller/ViewController/VC（控制器）负责协调Model和View，处理大部分逻辑它将数据从Mod
OC语言多界面传值五大方式 Magnetic_h ios ui 学习 objective-c 开发语言
前言在完成暑假仿写项目时，遇到了许多需要用到多界面传值的地方，这篇博客来总结一下比较常用的五种多界面传值的方式。属性传值属性传值一般用前一个界面向后一个界面传值，简单地说就是通过访问后一个视图控制器的属性来为它赋值，通过这个属性来做到从前一个界面向后一个界面传值。首先在后一个界面中定义属性@interfaceBViewController:UIViewController@propertyNSSt
一百九十四章. 自相矛盾巨木擎天
唉！就这么一夜，林子感觉就像过了很多天似的，先是回了阳间家里，遇到了那么多不可思议的事情儿。特别是小伙伴们，第二次与自己见面时，僵硬的表情和恐怖的气氛，让自己如坐针毡，打从心眼里难受！还有东子，他现在还好吗？有没有被人欺负？护城河里的小鱼小虾们，还都在吗？水不会真的干枯了吧？那对相亲相爱漂亮的太平鸟儿，还好吧！春天了，到了做窝、下蛋、喂养小鸟宝宝的时候了，希望它们都能够平安啊！虽然没有看见家人，也
UI学习——cell的复用和自定义cell Magnetic_h ui 学习
目录cell的复用手动（非注册）自动（注册）自定义cellcell的复用在iOS开发中，单元格复用是一种提高表格（UITableView）和集合视图（UICollectionView）滚动性能的技术。当一个UITableViewCell或UICollectionViewCell首次需要显示时，如果没有可复用的单元格，则视图会创建一个新的单元格。一旦这个单元格滚动出屏幕，它就不会被销毁。相反，它被添
element实现动态路由+面包屑软件技术NINI vue案例 vue.js 前端
el-breadcrumb是ElementUI组件库中的一个面包屑导航组件，它用于显示当前页面的路径，帮助用户快速理解和导航到应用的各个部分。在Vue.js项目中，如果你已经安装了ElementUI，就可以很方便地使用el-breadcrumb组件。以下是一个基本的使用示例：安装ElementUI（如果你还没有安装的话）:你可以通过npm或yarn来安装ElementUI。bash复制代码npmi
10月|愿你的青春不负梦想-读书笔记-01 Tracy的小书斋
本书的作者是俞敏洪，大家都很熟悉他了吧。俞敏洪老师是我行业的领头羊吧，也是我事业上的偶像。本日摘录他书中第一章中的金句：『一个人如果什么目标都没有，就会浑浑噩噩，感觉生命中缺少能量。能给我们能量的，是对未来的期待。第一件事，我始终为了进步而努力。与其追寻全世界的骏马，不如种植丰美的草原，到时骏马自然会来。第二件事，我始终有阶段性的目标。什么东西能给我能量？答案是对未来的期待。』读到这里的时候，我便
C语言宏函数南林yan C语言 c语言
一、什么是宏函数？通过宏定义的函数是宏函数。如下，编译器在预处理阶段会将Add(x,y)替换为((x)*(y))#defineAdd(x,y)((x)*(y))#defineAdd(x,y)((x)*(y))intmain(){inta=10;intb=20;intd=10;intc=Add(a+d,b)*2;cout<
地推话术，如何应对地推过程中家长的拒绝校师学
相信校长们在做地推的时候经常遇到这种情况：市场专员反馈家长不接单，咨询师反馈难以邀约这些家长上门，校区地推疲软，招生难。为什么？仅从地推层面分析，一方面因为家长受到的信息轰炸越来越多，对信息越来越“免疫”；而另一方面地推人员的专业能力和营销话术没有提高，无法应对家长的拒绝，对有意向的家长也不知如何跟进，眼睁睁看着家长走远；对于家长的疑问，更不知道如何有技巧地回答，机会白白流失。由于回答没技巧和专业
谢谢你们，爱你们！鹿游儿
昨天家人去泡温泉，二个孩子也带着去，出发前一晚，匆匆下班，赶回家和孩子一起收拾。饭后，我拿出笔和本子（上次去澳门时做手帐的本子）写下了1\2\3\4\5\6\7\8\9,让后让小壹去思考，带什么出发去旅游呢？她在对应的数字旁边画上了，泳衣、泳圈、肖恩、内衣内裤、tapuy、拖鞋……画完后，就让她自己对着这个本子，将要带的，一一带上，没想到这次带的书还是这本《便便工厂》(晚上姑婆发照片过来，妹妹累得
C语言如何定义宏函数？小九格物 c语言
在C语言中，宏函数是通过预处理器定义的，它在编译之前替换代码中的宏调用。宏函数可以模拟函数的行为，但它们不是真正的函数，因为它们在编译时不会进行类型检查，也不会分配存储空间。宏函数的定义通常使用#define指令，后面跟着宏的名称和参数列表，以及宏展开后的代码。宏函数的定义方式：1.基本宏函数：这是最简单的宏函数形式，它直接定义一个表达式。#defineSQUARE(x)((x)*(x))2.带参
微服务下功能权限与数据权限的设计与实现 nbsaas-boot 微服务 java 架构
在微服务架构下，系统的功能权限和数据权限控制显得尤为重要。随着系统规模的扩大和微服务数量的增加，如何保证不同用户和服务之间的访问权限准确、细粒度地控制，成为设计安全策略的关键。本文将讨论如何在微服务体系中设计和实现功能权限与数据权限控制。1.功能权限与数据权限的定义功能权限：指用户或系统角色对特定功能的访问权限。通常是某个用户角色能否执行某个操作，比如查看订单、创建订单、修改用户资料等。数据权限：
理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
小丽成长记（四十三）玲玲54321
小丽发现，即使她好不容易调整好自己的心态下一秒总会有不确定的伤脑筋的事出现，一个接一个的问题，人生就没有停下的时候，小问题不断出现。不过她今天看的书，她接受了人生就是不确定的，厉害的人就是不断创造确定性，在Ta的领域比别人多的确定性就能让自己脱颖而出，显示价值从而获得的比别人多的利益。正是这样的原因，因为从前修炼自己太少，使得她现在在人生道路上打怪起来困难重重，她似乎永远摆脱不了那种无力感，有种习
学点心理知识，呵护孩子健康静候花开_7090
昨天听了华中师范大学教育管理学系副教授张玲老师的《哪里才是学生心理健康的最后庇护所，超越教育与技术的思考》的讲座。今天又重新学习了一遍，收获匪浅。张玲博士也注意到了当今社会上的孩子由于心理问题导致的自残、自杀及伤害他人等恶性事件。她向我们普及了一个重要的命题，她说心理健康的一些基本命题，我们与我们通常的一些教育命题是不同的，她还举了几个例子，让我们明白我们原来以为的健康并非心理学上的健康。比如如果
2021年12月19日，春蕾教育集团团建活动感受——黄晓丹黄错错加油
感受:1.从陌生到熟悉的过程。游戏环节让我们在轻松的氛围中得到了锻炼，也增长了不少知识。2.游戏过程中，我们贡献的是个人力量，展现的是团队的力量。它磨合的往往不止是工作的熟悉，更是观念上契合度的贴近。3.这和工作是一样的道理。在各自的岗位上，每个人摆正自己的位置、各司其职充分发挥才能，并团结一致劲往一处使，才能实现最大的成功。新知:1.团队精神需要不断地创新。过去，人们把创新看作是冒风险，现在人们
Cell Insight | 单细胞测序技术又一新发现，可用于HIV-1和Mtb共感染个体诊断尐尐呅
结核病是艾滋病合并其他疾病中导致患者死亡的主要原因。其中结核病由结核分枝杆菌（Mycobacteriumtuberculosis,Mtb）感染引起，获得性免疫缺陷综合症（艾滋病）由人免疫缺陷病毒（Humanimmunodeficiencyvirustype1,HIV-1）感染引起。国家感染性疾病临床医学研究中心/深圳市第三人民医院张国良团队携手深圳华大生命科学研究院吴靓团队，共同研究得出单细胞测序
c++ 的iostream 和 c++的stdio的区别和联系黄卷青灯77 c++算法开发语言 iostream stdio
在C++中，iostream和C语言的stdio.h都是用于处理输入输出的库，但它们在设计、用法和功能上有许多不同。以下是两者的区别和联系：区别1.编程风格iostream（C++风格）：C++标准库中的输入输出流类库，支持面向对象的输入输出操作。典型用法是cin（输入）和cout（输出），使用>操作符来处理数据。更加类型安全，支持用户自定义类型的输入输出。#includeintmain(){in
瑶池防线谜影梦蝶
冥华虽然逃过了影梦的军队，但他是一个忠臣，他选择上报战况。败给影梦后成逃兵，高层亡尔还活着，七重天失守......随便一条，即可处死冥华。冥华自然是知道以仙界高层的习性此信一发自己必死无疑，但他还选择上报实情，因为责任。同样此信送到仙宫后，知道此事的人，大多数人都认定冥华要完了，所以上到仙界高层，下到扫大街的，包括冥华自己，全都准备好迎接冥华之死。如果仙界现在还属于两方之争的话，冥华必死无疑。然而
爬山后遗症璃绛
爬山，攀登，一步一步走向制高点，是一种挑战。成功抵达是一种无法言语的快乐，在山顶吹吹风，看看风景，这是从未有过的体验。然而，爬山一时爽，下山腿打颤，颠簸的路，一路向下走，腿部力量不够，走起来抖到不行，停不下来了！第二天必定腿疼，浑身酸痛，坐立难安！
数据采集高并发的架构应用 3golden .net
问题的出发点：最近公司为了发展需要，要扩大对用户的信息采集，每个用户的采集量估计约2W。如果用户量增加的话，将会大量照成采集量成3W倍的增长，但是又要满足日常业务需要，特别是指令要及时得到响应的频率次数远大于预期。 &n
不停止 MySQL 服务增加从库的两种方式 brotherlamp linux linux视频 linux资料 linux教程 linux自学
现在生产环境MySQL数据库是一主一从，由于业务量访问不断增大，故再增加一台从库。前提是不能影响线上业务使用，也就是说不能重启MySQL服务，为了避免出现其他情况，选择在网站访问量低峰期时间段操作。一般在线增加从库有两种方式，一种是通过mysqldump备份主库，恢复到从库，mysqldump是逻辑备份，数据量大时，备份速度会很慢，锁表的时间也会很长。另一种是通过xtrabacku
Quartz——SimpleTrigger触发器 eksliang SimpleTrigger TriggerUtils quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208166 一.概述 SimpleTrigger触发器，当且仅需触发一次或者以固定时间间隔周期触发执行；二.SimpleTrigger的构造函数 SimpleTrigger(String name, String group)：通过该构造函数指定Trigger所属组和名称； Simpl
Informatica应用（1） 18289753290 sql workflow lookup 组件 Informatica
1.如果要在workflow中调用shell脚本有一个command组件，在里面设置shell的路径；调度wf可以右键出现schedule，现在用的是HP的tidal调度wf的执行。 2.designer里面的router类似于SSIS中的broadcast（多播组件）;Reset_Workflow_Var：参数重置（比如说我这个参数初始是1在workflow跑得过程中变成了3我要在结束时还要
python 获取图片验证码中文字酷的飞上天空 python
根据现成的开源项目 http://code.google.com/p/pytesser/改写在window上用easy_install安装不上看了下源码发现代码很少于是就想自己改写一下添加支持网络图片的直接解析 #coding:utf-8 #import sys #reload(sys) #sys.s
AJAX 永夜-极光 Ajax
1.AJAX功能:动态更新页面,减少流量消耗,减轻服务器负担 2.代码结构: <html> <head> <script type="text/javascript"> function loadXMLDoc() { .... AJAX script goes here ...
创业OR读研随便小屋创业
现在研一，有种想创业的想法，不知道该不该去实施。因为对于的我情况这两者是矛盾的，可能就是鱼与熊掌不能兼得。研一的生活刚刚过去两个月，我们学校主要的是
需求做得好与坏直接关系着程序员生活质量 aijuans IT 生活
这个故事还得从去年换工作的事情说起，由于自己不太喜欢第一家公司的环境我选择了换一份工作。去年九月份我入职现在的这家公司，专门从事金融业内软件的开发。十一月份我们整个项目组前往北京做现场开发，从此苦逼的日子开始了。系统背景：五月份就有同事前往甲方了解需求一直到6月份，后续几个月也完
如何定义和区分高级软件开发工程师 aoyouzi
在软件开发领域，高级开发工程师通常是指那些编写代码超过 3 年的人。这些人可能会被放到领导的位置，但经常会产生非常糟糕的结果。Matt Briggs 是一名高级开发工程师兼 Scrum 管理员。他认为，单纯使用年限来划分开发人员存在问题，两个同样具有 10 年开发经验的开发人员可能大不相同。近日，他发表了一篇博文，根据开发者所能发挥的作用划分软件开发工程师的成长阶段。　　初
Servlet的请求与响应百合不是茶 servlet get提交 java处理post提交
Servlet是tomcat中的一个重要组成,也是负责客户端和服务端的中介 1,Http的请求方式(get ,post); 客户端的请求一般都会都是Servlet来接受的,在接收之前怎么来确定是那种方式提交的,以及如何反馈,Servlet中有相应的方法, http的get方式 servlet就是都doGet(
web.xml配置详解之listener bijian1013 java web.xml listener
一.定义 <listener> <listen-class>com.myapp.MyListener</listen-class> </listener> 二.作用该元素用来注册一个监听器类。可以收到事件什么时候发生以及用什么作为响
Web页面性能优化（yahoo技术） Bill_chen JavaScript Ajax Web css Yahoo
1.尽可能的减少HTTP请求数 content 2.使用CDN server 3.添加Expires头(或者 Cache-control) server 4.Gzip 组件 server 5.把CSS样式放在页面的上方。 css 6.将脚本放在底部(包括内联的) javascript 7.避免在CSS中使用Expressions css 8.将javascript和css独立成外部文
【MongoDB学习笔记八】MongoDB游标、分页查询、查询结果排序 bit1129 mongodb
游标游标，简单的说就是一个查询结果的指针。游标作为数据库的一个对象，使用它是包括声明打开循环抓去一定数目的文档直到结果集中的所有文档已经抓取完关闭游标游标的基本用法，类似于JDBC的ResultSet(hasNext判断是否抓去完,next移动游标到下一条文档)，在获取一个文档集时，可以提供一个类似JDBC的FetchSize
ORA-12514 TNS 监听程序当前无法识别连接描述符中请求服务的解决方法白糖_ ORA-12514
今天通过Oracle SQL*Plus连接远端服务器的时候提示“监听程序当前无法识别连接描述符中请求服务”，遂在网上找到了解决方案： ①打开Oracle服务器安装目录\NETWORK\ADMIN\listener.ora文件，你会看到如下信息： # listener.ora Network Configuration File: D:\database\Oracle\net
Eclipse 问题 A resource exists with a different case bozch eclipse
在使用Eclipse进行开发的时候，出现了如下的问题： Description Resource Path Location TypeThe project was not built due to "A resource exists with a different case: '/SeenTaoImp_zhV2/bin/seentao'.&
编程之美-小飞的电梯调度算法 bylijinnan 编程之美
public class AptElevator { /** * 编程之美小飞电梯调度算法 * 在繁忙的时间，每次电梯从一层往上走时，我们只允许电梯停在其中的某一层。 * 所有乘客都从一楼上电梯，到达某层楼后，电梯听下来，所有乘客再从这里爬楼梯到自己的目的层。 * 在一楼时，每个乘客选择自己的目的层，电梯则自动计算出应停的楼层。 * 问：电梯停在哪
SQL注入相关概念 chenbowen00 sql Web 安全
SQL Injection：就是通过把SQL命令插入到Web表单递交或输入域名或页面请求的查询字符串，最终达到欺骗服务器执行恶意的SQL命令。具体来说，它是利用现有应用程序，将（恶意）的SQL命令注入到后台数据库引擎执行的能力，它可以通过在Web表单中输入（恶意）SQL语句得到一个存在安全漏洞的网站上的数据库，而不是按照设计者意图去执行SQL语句。首先让我们了解什么时候可能发生SQ
[光与电]光子信号战防御原理 comsci 原理
无论是在战场上,还是在后方,敌人都有可能用光子信号对人体进行控制和攻击,那么采取什么样的防御方法,最简单,最有效呢? 我们这里有几个山寨的办法,可能有些作用,大家如果有兴趣可以去实验一下根据光
oracle 11g新特性:Pending Statistics daizj oracle dbms_stats
oracle 11g新特性:Pending Statistics 转从11g开始，表与索引的统计信息收集完毕后，可以选择收集的统信息立即发布，也可以选择使新收集的统计信息处于pending状态，待确定处于pending状态的统计信息是安全的，再使处于pending状态的统计信息发布，这样就会避免一些因为收集统计信息立即发布而导致SQL执行计划走错的灾难。在 11g 之前的版本中，D
快速理解RequireJs dengkane jquery requirejs
RequireJs已经流行很久了，我们在项目中也打算使用它。它提供了以下功能：声明不同js文件之间的依赖可以按需、并行、延时载入js库可以让我们的代码以模块化的方式组织初看起来并不复杂。在html中引入requirejs 在HTML中，添加这样的 <script> 标签： <script src="/path/to
C语言学习四流程控制if条件选择、for循环和强制类型转换 dcj3sjt126com c
# include <stdio.h> int main(void) { int i, j; scanf("%d %d", &i, &j); if (i > j) printf("i大于j\n"); else printf("i小于j\n"); retu
dictionary的使用要注意 dcj3sjt126com IO
NSDictionary *dict = [NSDictionary dictionaryWithObjectsAndKeys: user.user_id , @"id", user.username , @"username",
Android 中的资源访问(Resource) finally_m xml android String drawable color
简单的说，Android中的资源是指非代码部分。例如，在我们的Android程序中要使用一些图片来设置界面，要使用一些音频文件来设置铃声，要使用一些动画来显示特效，要使用一些字符串来显示提示信息。那么，这些图片、音频、动画和字符串等叫做Android中的资源文件。在Eclipse创建的工程中，我们可以看到res和assets两个文件夹，是用来保存资源文件的，在assets中保存的一般是原生
Spring使用Cache、整合Ehcache 234390216 spring cache ehcache @Cacheable
Spring使用Cache 从3.1开始，Spring引入了对Cache的支持。其使用方法和原理都类似于Spring对事务管理的支持。Spring Cache是作用在方法上的，其核心思想是这样的：当我们在调用一个缓存方法时会把该方法参数和返回结果作为一个键值对存放在缓存中，等到下次利用同样的
当druid遇上oracle blob(clob) jackyrong oracle
http://blog.csdn.net/renfufei/article/details/44887371 众所周知，Oracle有很多坑, 所以才有了去IOE。在使用Druid做数据库连接池后，其实偶尔也会碰到小坑，这就是使用开源项目所必须去填平的。【如果使用不开源的产品，那就不是坑，而是陷阱了，你都不知道怎么去填坑】用Druid连接池，通过JDBC往Oracle数据库的
easyui datagrid pagination获得分页页码、总页数等信息 ldzyz007
var grid = $('#datagrid'); var options = grid.datagrid('getPager').data("pagination").options; var curr = options.pageNumber; var total = options.total; var max =
浅析awk里的数组 nigelzeng 二维数组 array 数组 awk
awk绝对是文本处理中的神器，它本身也是一门编程语言，还有许多功能本人没有使用到。这篇文章就单单针对awk里的数组来进行讨论，如何利用数组来帮助完成文本分析。有这么一组数据： abcd,91#31#2012-12-31 11:24:00 case_a,136#19#2012-12-31 11:24:00 case_a,136#23#2012-12-31 1
搭建 CentOS 6 服务器(6) - TigerVNC rensanning centos
安装GNOME桌面环境 # yum groupinstall "X Window System" "Desktop" 安装TigerVNC # yum -y install tigervnc-server tigervnc 启动VNC服务 # /etc/init.d/vncserver restart # vncser
Spring 数据库连接整理 tomcat_oracle spring bean jdbc
1、数据库连接jdbc.properties配置详解　　jdbc.url=jdbc:hsqldb:hsql://localhost/xdb 　　jdbc.username=sa 　　jdbc.password= 　　jdbc.driver=不同的数据库厂商驱动，此处不一一列举　　接下来，详细配置代码如下：　　 Spring连接池
Dom4J解析使用xpath java.lang.NoClassDefFoundError: org/jaxen/JaxenException异常 xp9802
用Dom4J解析xml,以前没注意,今天使用dom4j包解析xml时在xpath使用处报错异常栈：java.lang.NoClassDefFoundError: org/jaxen/JaxenException异常导入包 jaxen-1.1-beta-6.jar 解决; &nb

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他