Swordfall

POI读写大数据量excel，解决超过几万行而导致内存溢出的问题

1. Excel2003与Excel2007

两个版本的最大行数和列数不同，2003版最大行数是65536行，最大列数是256列，2007版及以后的版本最大行数是1048576行，最大列数是16384列。

excel2003是以二进制的方式存储，这种格式不易被其他软件读取使用；而excel2007采用了基于XML的ooxml开放文档标准，ooxml使用XML和ZIP技术结合进行文件存储，XML是一个基于文本的格式，而且ZIP容器支持内容的压缩，所以其一大优势是可以大大减小文件的尺寸。

2. 大批量数据读写

2.1 大批量数据写入

对于大数据的Xlsx文件的写入，POI3.8提供了SXSSFSXSSFWorkbook类，采用缓存方式进行大批量写文件。

详情可以查看poi官网示例：http://poi.apache.org/spreadsheet/how-to.html#sxssf 或 http://blog.csdn.net/daiyutage/article/details/53010491

2.2 大批量数据读取

POI读取Excel有两种模式，一种是用户模式，一种是SAX事件驱动模式，将xlsx格式的文档转换成CSV格式后进行读取。用户模式API接口丰富，使用POI的API可以很容易读取Excel，但用户模式消耗的内存很大，当遇到很大sheet、大数据网格，假空行、公式等问题时，很容易导致内存溢出。POI官方推荐解决内存溢出的方式使用CVS格式解析，即SAX事件驱动模式。下面主要是讲解如何读取大批量数据：

2.2.1 pom.xml所需jar包

 1 <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
 2   xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/maven-v4_0_0.xsd">
 3   <modelVersion>4.0.0modelVersion>
 4   <groupId>POIExcelgroupId>
 5   <artifactId>POIExcelartifactId>
 6   <packaging>warpackaging>
 7   <version>1.0-SNAPSHOTversion>
 8   <name>POIExcel Maven Webappname>
 9   <url>http://maven.apache.orgurl>
10   <dependencies>
11     <dependency>
12       <groupId>junitgroupId>
13       <artifactId>junitartifactId>
14       <version>3.8.1version>
15       <scope>testscope>
16     dependency>
17 
18     <dependency>
19       <groupId>org.apache.poigroupId>
20       <artifactId>poiartifactId>
21       <version>3.17version>
22     dependency>
23 
24     <dependency>
25       <groupId>org.apache.poigroupId>
26       <artifactId>poi-ooxmlartifactId>
27       <version>3.17version>
28     dependency>
29 
30     <dependency>
31       <groupId>org.apache.poigroupId>
32       <artifactId>poi-ooxml-schemasartifactId>
33       <version>3.17version>
34     dependency>
35 
36     <dependency>
37       <groupId>com.syncthemallgroupId>
38       <artifactId>boilerpipeartifactId>
39       <version>1.2.1version>
40     dependency>
41 
42     <dependency>
43       <groupId>xercesgroupId>
44       <artifactId>xercesImplartifactId>
45       <version>2.11.0version>
46     dependency>
47 
48     <dependency>
49       <groupId>xml-apisgroupId>
50       <artifactId>xml-apisartifactId>
51       <version>1.4.01version>
52     dependency>
53 
54     <dependency>
55       <groupId>org.apache.xmlbeansgroupId>
56       <artifactId>xmlbeansartifactId>
57       <version>2.6.0version>
58     dependency>
59 
60     <dependency>
61       <groupId>saxgroupId>
62       <artifactId>saxartifactId>
63       <version>2.0.1version>
64     dependency>
65 
66     <dependency>
67       <groupId>org.apache.commonsgroupId>
68       <artifactId>commons-lang3artifactId>
69       <version>3.7version>
70     dependency>
71 
72   dependencies>
73   <build>
74     <finalName>POIExcelfinalName>
75   build>
76 project>

2.2.2 POI以SAX解析excel2007文件

解决思路：通过继承DefaultHandler类，重写process()，startElement()，characters()，endElement()这四个方法。process()方式主要是遍历所有的sheet，并依次调用startElement()、characters()方法、endElement()这三个方法。startElement()用于设定单元格的数字类型（如日期、数字、字符串等等）。characters()用于获取该单元格对应的索引值或是内容值（如果单元格类型是字符串、INLINESTR、数字、日期则获取的是索引值；其他如布尔值、错误、公式则获取的是内容值）。endElement()根据startElement()的单元格数字类型和characters()的索引值或内容值，最终得出单元格的内容值，并打印出来。

  1 package org.poi;
  2 
  3 import org.apache.poi.openxml4j.opc.OPCPackage;
  4 import org.apache.poi.ss.usermodel.BuiltinFormats;
  5 import org.apache.poi.ss.usermodel.DataFormatter;
  6 import org.apache.poi.xssf.eventusermodel.XSSFReader;
  7 import org.apache.poi.xssf.model.SharedStringsTable;
  8 import org.apache.poi.xssf.model.StylesTable;
  9 import org.apache.poi.xssf.usermodel.XSSFCellStyle;
 10 import org.apache.poi.xssf.usermodel.XSSFRichTextString;
 11 import org.xml.sax.Attributes;
 12 import org.xml.sax.InputSource;
 13 import org.xml.sax.SAXException;
 14 import org.xml.sax.XMLReader;
 15 import org.xml.sax.helpers.DefaultHandler;
 16 import org.xml.sax.helpers.XMLReaderFactory;
 17 
 18 import java.io.InputStream;
 19 import java.util.ArrayList;
 20 import java.util.List;
 21 
 22 /**
 23  * @author y
 24  * @create 2018-01-18 14:28
 25  * @desc POI读取excel有两种模式，一种是用户模式，一种是事件驱动模式
 26  * 采用SAX事件驱动模式解决XLSX文件，可以有效解决用户模式内存溢出的问题，
 27  * 该模式是POI官方推荐的读取大数据的模式，
 28  * 在用户模式下，数据量较大，Sheet较多，或者是有很多无用的空行的情况下，容易出现内存溢出
 29  *    32   34  35  36  37     41  42  43  44   46  47  48  49   51  52  53  54   56  57  58  59   61  62  63  64   66  67  68  69   71  72  73  74   76  77  78  79   81  82  83  84   86  87  88  89   91  92  93  94   96  97  98  99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240 241 242 243 244 245 246 247 248 249 250 251 252 253 254 255 256 257 258 259 260 261 262 263 264 265 266 267 268 269 270 271 272 273 274 275 276 277 278 279 280 281 282 283 284 285 286 287 288 289 290 291 292 293 294 295 296 297 298 299 300 301 302 303 304 305 306 307 308 309 310 311 312 313 314 315 316 317 318 319 320 321 322 323 324 325 326 327 328 329 330 331 332 333 334 335 336 337 338 339 340 341 342 343 344 345 346 347 348 349 350 351 352 353 354 355 356 357 358 359 360 361 362 363 364 365 366 367 368 369 370 371 372 373 374 375 376 377 378 379 380 381 382 383 384 385 386 387 388 389 390 391 392 393 394 395 396 397 398 399 400 401 402 403 404 405 406 407 408 409 410 411 412 413 414 415 416 417

2.2.3 POI通过继承HSSFListen
解决思路：重写process()，proce 30 * 用于解决.xlsx2007版本大数据量问题 31 / public class ExcelXlsxReader extends DefaultHandler { 33 / * 单元格中的数据可能的数据类型 */ enum CellDataType { 38 BOOL, ERROR, FORMULA, INLINESTR, SSTINDEX, NUMBER, DATE, NULL 39 } 40 /** * 共享字符串表 */ private SharedStringsTable sst; 45 /** * 上一次的索引值 */ private String lastIndex; 50 /** * 文件的绝对路径 */ private String filePath = ""; 55 /** * 工作表索引 */ private int sheetIndex = 0; 60 /** * sheet名 */ private String sheetName = ""; 65 /** * 总行数 */ private int totalRows=0; 70 /** * 一行内cell集合 */ private List cellList = new ArrayList(); 75 /** * 判断整行是否为空行的标记 */ private boolean flag = false; 80 /** * 当前行 */ private int curRow = 1; 85 /** * 当前列 */ private int curCol = 0; 90 /** * T元素标识 */ private boolean isTElement; 95 /** * 异常信息，如果为空则表示没有异常 */ private String exceptionMessage; /** * 单元格数据类型，默认为字符串类型 */ private CellDataType nextDataType = CellDataType.SSTINDEX; private final DataFormatter formatter = new DataFormatter(); /** * 单元格日期格式的索引 */ private short formatIndex; /** * 日期格式字符串 */ private String formatString; //定义前一个元素和当前元素的位置，用来计算其中空的单元格数量，如A6和A8等 private String preRef = null, ref = null; //定义该文档一行最大的单元格数，用来补全一行最后可能缺失的单元格 private String maxRef = null; /** * 单元格 */ private StylesTable stylesTable; /** * 遍历工作簿中所有的电子表格 * 并缓存在mySheetList中 * * @param filename * @throws Exception */ public int process(String filename) throws Exception { filePath = filename; OPCPackage pkg = OPCPackage.open(filename); XSSFReader xssfReader = new XSSFReader(pkg); stylesTable = xssfReader.getStylesTable(); SharedStringsTable sst = xssfReader.getSharedStringsTable(); XMLReader parser = XMLReaderFactory.createXMLReader("org.apache.xerces.parsers.SAXParser"); this.sst = sst; parser.setContentHandler(this); XSSFReader.SheetIterator sheets = (XSSFReader.SheetIterator) xssfReader.getSheetsData(); while (sheets.hasNext()) { //遍历sheet curRow = 1; //标记初始行为第一行 sheetIndex++; InputStream sheet = sheets.next(); //sheets.next()和sheets.getSheetName()不能换位置，否则sheetName报错 sheetName = sheets.getSheetName(); InputSource sheetSource = new InputSource(sheet); parser.parse(sheetSource); //解析excel的每条记录，在这个过程中startElement()、characters()、endElement()这三个函数会依次执行 sheet.close(); } return totalRows; //返回该excel文件的总行数，不包括首列和空行 } /** * 第一个执行 * * @param uri * @param localName * @param name * @param attributes * @throws SAXException */ @Override public void startElement(String uri, String localName, String name, Attributes attributes) throws SAXException { //c => 单元格 if ("c".equals(name)) { //前一个单元格的位置 if (preRef == null) { preRef = attributes.getValue("r"); } else { preRef = ref; } //当前单元格的位置 ref = attributes.getValue("r"); //设定单元格类型 this.setNextDataType(attributes); } //当元素为t时 if ("t".equals(name)) { isTElement = true; } else { isTElement = false; } //置空 lastIndex = ""; } /** * 第二个执行 * 得到单元格对应的索引值或是内容值 * 如果单元格类型是字符串、INLINESTR、数字、日期，lastIndex则是索引值 * 如果单元格类型是布尔值、错误、公式，lastIndex则是内容值 * @param ch * @param start * @param length * @throws SAXException */ @Override public void characters(char[] ch, int start, int length) throws SAXException { lastIndex += new String(ch, start, length); } /** * 第三个执行 * * @param uri * @param localName * @param name * @throws SAXException */ @Override public void endElement(String uri, String localName, String name) throws SAXException { //t元素也包含字符串 if (isTElement) {//这个程序没经过 //将单元格内容加入rowlist中，在这之前先去掉字符串前后的空白符 String value = lastIndex.trim(); cellList.add(curCol, value); curCol++; isTElement = false; //如果里面某个单元格含有值，则标识该行不为空行 if (value != null && !"".equals(value)) { flag = true; } } else if ("v".equals(name)) { //v => 单元格的值，如果单元格是字符串，则v标签的值为该字符串在SST中的索引 String value = this.getDataValue(lastIndex.trim(), "");//根据索引值获取对应的单元格值 //补全单元格之间的空单元格 if (!ref.equals(preRef)) { int len = countNullCell(ref, preRef); for (int i = 0; i < len; i++) { cellList.add(curCol, ""); curCol++; } } cellList.add(curCol, value); curCol++; //如果里面某个单元格含有值，则标识该行不为空行 if (value != null && !"".equals(value)) { flag = true; } } else { //如果标签名称为row，这说明已到行尾，调用optRows()方法 if ("row".equals(name)) { //默认第一行为表头，以该行单元格数目为最大数目 if (curRow == 1) { maxRef = ref; } //补全一行尾部可能缺失的单元格 if (maxRef != null) { int len = countNullCell(maxRef, ref); for (int i = 0; i <= len; i++) { cellList.add(curCol, ""); curCol++; } } if (flag&&curRow!=1){ //该行不为空行且该行不是第一行，则发送（第一行为列名，不需要） ExcelReaderUtil.sendRows(filePath, sheetName, sheetIndex, curRow, cellList); totalRows++; } cellList.clear(); curRow++; curCol = 0; preRef = null; ref = null; flag=false; } } } /** * 处理数据类型 * * @param attributes */ public void setNextDataType(Attributes attributes) { nextDataType = CellDataType.NUMBER; //cellType为空，则表示该单元格类型为数字 formatIndex = -1; formatString = null; String cellType = attributes.getValue("t"); //单元格类型 String cellStyleStr = attributes.getValue("s"); // String columnData = attributes.getValue("r"); //获取单元格的位置，如A1,B1 if ("b".equals(cellType)) { //处理布尔值 nextDataType = CellDataType.BOOL; } else if ("e".equals(cellType)) { //处理错误 nextDataType = CellDataType.ERROR; } else if ("inlineStr".equals(cellType)) { nextDataType = CellDataType.INLINESTR; } else if ("s".equals(cellType)) { //处理字符串 nextDataType = CellDataType.SSTINDEX; } else if ("str".equals(cellType)) { nextDataType = CellDataType.FORMULA; } if (cellStyleStr != null) { //处理日期 int styleIndex = Integer.parseInt(cellStyleStr); XSSFCellStyle style = stylesTable.getStyleAt(styleIndex); formatIndex = style.getDataFormat(); formatString = style.getDataFormatString(); if (formatString.contains("m/d/yy")) { nextDataType = CellDataType.DATE; formatString = "yyyy-MM-dd hh:mm:ss"; } if (formatString == null) { nextDataType = CellDataType.NULL; formatString = BuiltinFormats.getBuiltinFormat(formatIndex); } } } /** * 对解析出来的数据进行类型处理 * @param value 单元格的值， * value代表解析：BOOL的为0或1， ERROR的为内容值，FORMULA的为内容值，INLINESTR的为索引值需转换为内容值， * SSTINDEX的为索引值需转换为内容值， NUMBER为内容值，DATE为内容值 * @param thisStr 一个空字符串 * @return / @SuppressWarnings("deprecation") public String getDataValue(String value, String thisStr) { switch (nextDataType) { // 这几个的顺序不能随便交换，交换了很可能会导致数据错误 case BOOL: //布尔值 char first = value.charAt(0); thisStr = first == '0' ? "FALSE" : "TRUE"; break; case ERROR: //错误 thisStr = "\"ERROR:" + value.toString() + '"'; break; case FORMULA: //公式 thisStr = '"' + value.toString() + '"'; break; case INLINESTR: XSSFRichTextString rtsi = new XSSFRichTextString(value.toString()); thisStr = rtsi.toString(); rtsi = null; break; case SSTINDEX: //字符串 String sstIndex = value.toString(); try { int idx = Integer.parseInt(sstIndex); XSSFRichTextString rtss = new XSSFRichTextString(sst.getEntryAt(idx));//根据idx索引值获取内容值 thisStr = rtss.toString(); rtss = null; } catch (NumberFormatException ex) { thisStr = value.toString(); } break; case NUMBER: //数字 if (formatString != null) { thisStr = formatter.formatRawCellContents(Double.parseDouble(value), formatIndex, formatString).trim(); } else { thisStr = value; } thisStr = thisStr.replace("_", "").trim(); break; case DATE: //日期 thisStr = formatter.formatRawCellContents(Double.parseDouble(value), formatIndex, formatString); // 对日期字符串作特殊处理，去掉T thisStr = thisStr.replace("T", " "); break; default: thisStr = " "; break; } return thisStr; } public int countNullCell(String ref, String preRef) { //excel2007最大行数是1048576，最大列数是16384，最后一列列名是XFD String xfd = ref.replaceAll("\\d+", ""); String xfd_1 = preRef.replaceAll("\\d+", ""); xfd = fillChar(xfd, 3, '@', true); xfd_1 = fillChar(xfd_1, 3, '@', true); char[] letter = xfd.toCharArray(); char[] letter_1 = xfd_1.toCharArray(); int res = (letter[0] - letter_1[0]) 26 * 26 + (letter[1] - letter_1[1]) * 26 + (letter[2] - letter_1[2]); return res - 1; } public String fillChar(String str, int len, char let, boolean isPre) { int len_1 = str.length(); if (len_1 < len) { if (isPre) { for (int i = 0; i < (len - len_1); i++) { str = let + str; } } else { for (int i = 0; i < (len - len_1); i++) { str = str + let; } } } return str; } /** * @return the exceptionMessage */ public String getExceptionMessage() { return exceptionMessage; } } er类来解决Excel2003文件

ssRecord()两个方法，其中processRecord是核心方法，用于处理sheetName和各种单元格数字类型。

  1 package org.poi;
  2 
  3 import org.apache.poi.hssf.eventusermodel.*;
  4 import org.apache.poi.hssf.eventusermodel.dummyrecord.LastCellOfRowDummyRecord;
  5 import org.apache.poi.hssf.eventusermodel.dummyrecord.MissingCellDummyRecord;
  6 import org.apache.poi.hssf.model.HSSFFormulaParser;
  7 import org.apache.poi.hssf.record.*;
  8 import org.apache.poi.hssf.usermodel.HSSFDataFormatter;
  9 import org.apache.poi.hssf.usermodel.HSSFWorkbook;
 10 import org.apache.poi.poifs.filesystem.POIFSFileSystem;
 11 
 12 import java.io.FileInputStream;
 13 import java.util.ArrayList;
 14 import java.util.List;
 15 
 16 /**
 17  * @author y
 18  * @create 2018-01-19 14:18
 19  * @desc 用于解决.xls2003版本大数据量问题
 20  **/
 21 public class ExcelXlsReader implements HSSFListener {
 22 
 23     private int minColums = -1;
 24 
 25     private POIFSFileSystem fs;
 26 
 27     /**
 28      * 总行数
 29      */
 30     private int totalRows=0;
 31 
 32     /**
 33      * 上一行row的序号
 34      */
 35     private int lastRowNumber;
 36 
 37     /**
 38      * 上一单元格的序号
 39      */
 40     private int lastColumnNumber;
 41 
 42     /**
 43      * 是否输出formula，还是它对应的值
 44      */
 45     private boolean outputFormulaValues = true;
 46 
 47     /**
 48      * 用于转换formulas
 49      */
 50     private EventWorkbookBuilder.SheetRecordCollectingListener workbookBuildingListener;
 51 
 52     //excel2003工作簿
 53     private HSSFWorkbook stubWorkbook;
 54 
 55     private SSTRecord sstRecord;
 56 
 57     private FormatTrackingHSSFListener formatListener;
 58 
 59     private final HSSFDataFormatter formatter = new HSSFDataFormatter();
 60 
 61     /**
 62      * 文件的绝对路径
 63      */
 64     private String filePath = "";
 65 
 66     //表索引
 67     private int sheetIndex = 0;
 68 
 69     private BoundSheetRecord[] orderedBSRs;
 70 
 71     @SuppressWarnings("unchecked")
 72     private ArrayList boundSheetRecords = new ArrayList();
 73 
 74     private int nextRow;
 75 
 76     private int nextColumn;
 77 
 78     private boolean outputNextStringRecord;
 79 
 80     //当前行
 81     private int curRow = 0;
 82 
 83     //存储一行记录所有单元格的容器
 84     private List cellList = new ArrayList();
 85 
 86     /**
 87      * 判断整行是否为空行的标记
 88      */
 89     private boolean flag = false;
 90 
 91     @SuppressWarnings("unused")
 92     private String sheetName;
 93 
 94     /**
 95      * 遍历excel下所有的sheet
 96      *
 97      * @param fileName
 98      * @throws Exception
 99      */
100     public int process(String fileName) throws Exception {
101         filePath = fileName;
102         this.fs = new POIFSFileSystem(new FileInputStream(fileName));
103         MissingRecordAwareHSSFListener listener = new MissingRecordAwareHSSFListener(this);
104         formatListener = new FormatTrackingHSSFListener(listener);
105         HSSFEventFactory factory = new HSSFEventFactory();
106         HSSFRequest request = new HSSFRequest();
107         if (outputFormulaValues) {
108             request.addListenerForAllRecords(formatListener);
109         } else {
110             workbookBuildingListener = new EventWorkbookBuilder.SheetRecordCollectingListener(formatListener);
111             request.addListenerForAllRecords(workbookBuildingListener);
112         }
113         factory.processWorkbookEvents(request, fs);
114 
115         return totalRows; //返回该excel文件的总行数，不包括首列和空行
116     }
117     
118     /**
119      * HSSFListener 监听方法，处理Record
120      * 处理每个单元格
121      * @param record
122      */
123     @SuppressWarnings("unchecked")
124     public void processRecord(Record record) {
125         int thisRow = -1;
126         int thisColumn = -1;
127         String thisStr = null;
128         String value = null;
129         switch (record.getSid()) {
130             case BoundSheetRecord.sid:
131                 boundSheetRecords.add(record);
132                 break;
133             case BOFRecord.sid: //开始处理每个sheet
134                 BOFRecord br = (BOFRecord) record;
135                 if (br.getType() == BOFRecord.TYPE_WORKSHEET) {
136                     //如果有需要，则建立子工作簿
137                     if (workbookBuildingListener != null && stubWorkbook == null) {
138                         stubWorkbook = workbookBuildingListener.getStubHSSFWorkbook();
139                     }
140 
141                     if (orderedBSRs == null) {
142                         orderedBSRs = BoundSheetRecord.orderByBofPosition(boundSheetRecords);
143                     }
144                     sheetName = orderedBSRs[sheetIndex].getSheetname();
145                     sheetIndex++;
146                 }
147                 break;
148             case SSTRecord.sid:
149                 sstRecord = (SSTRecord) record;
150                 break;
151             case BlankRecord.sid: //单元格为空白
152                 BlankRecord brec = (BlankRecord) record;
153                 thisRow = brec.getRow();
154                 thisColumn = brec.getColumn();
155                 thisStr = "";
156                 cellList.add(thisColumn, thisStr);
157                 break;
158             case BoolErrRecord.sid: //单元格为布尔类型
159                 BoolErrRecord berec = (BoolErrRecord) record;
160                 thisRow = berec.getRow();
161                 thisColumn = berec.getColumn();
162                 thisStr = berec.getBooleanValue() + "";
163                 cellList.add(thisColumn, thisStr);
164                 checkRowIsNull(thisStr);  //如果里面某个单元格含有值，则标识该行不为空行
165                 break;
166             case FormulaRecord.sid://单元格为公式类型
167                 FormulaRecord frec = (FormulaRecord) record;
168                 thisRow = frec.getRow();
169                 thisColumn = frec.getColumn();
170                 if (outputFormulaValues) {
171                     if (Double.isNaN(frec.getValue())) {
172                         outputNextStringRecord = true;
173                         nextRow = frec.getRow();
174                         nextColumn = frec.getColumn();
175                     } else {
176                         thisStr = '"' + HSSFFormulaParser.toFormulaString(stubWorkbook, frec.getParsedExpression()) + '"';
177                     }
178                 } else {
179                     thisStr = '"' + HSSFFormulaParser.toFormulaString(stubWorkbook, frec.getParsedExpression()) + '"';
180                 }
181                 cellList.add(thisColumn, thisStr);
182                 checkRowIsNull(thisStr);  //如果里面某个单元格含有值，则标识该行不为空行
183                 break;
184             case StringRecord.sid: //单元格中公式的字符串
185                 if (outputNextStringRecord) {
186                     StringRecord srec = (StringRecord) record;
187                     thisStr = srec.getString();
188                     thisRow = nextRow;
189                     thisColumn = nextColumn;
190                     outputNextStringRecord = false;
191                 }
192                 break;
193             case LabelRecord.sid:
194                 LabelRecord lrec = (LabelRecord) record;
195                 curRow = thisRow = lrec.getRow();
196                 thisColumn = lrec.getColumn();
197                 value = lrec.getValue().trim();
198                 value = value.equals("") ? "" : value;
199                 cellList.add(thisColumn, value);
200                 checkRowIsNull(value);  //如果里面某个单元格含有值，则标识该行不为空行
201                 break;
202             case LabelSSTRecord.sid: //单元格为字符串类型
203                 LabelSSTRecord lsrec = (LabelSSTRecord) record;
204                 curRow = thisRow = lsrec.getRow();
205                 thisColumn = lsrec.getColumn();
206                 if (sstRecord == null) {
207                     cellList.add(thisColumn, "");
208                 } else {
209                     value = sstRecord.getString(lsrec.getSSTIndex()).toString().trim();
210                     value = value.equals("") ? "" : value;
211                     cellList.add(thisColumn, value);
212                     checkRowIsNull(value);  //如果里面某个单元格含有值，则标识该行不为空行
213                 }
214                 break;
215             case NumberRecord.sid: //单元格为数字类型
216                 NumberRecord numrec = (NumberRecord) record;
217                 curRow = thisRow = numrec.getRow();
218                 thisColumn = numrec.getColumn();
219 
220                 //第一种方式
221                 //value = formatListener.formatNumberDateCell(numrec).trim();//这个被写死，采用的m/d/yy h:mm格式，不符合要求
222 
223                 //第二种方式，参照formatNumberDateCell里面的实现方法编写
224                 Double valueDouble=((NumberRecord)numrec).getValue();
225                 String formatString=formatListener.getFormatString(numrec);
226                 if (formatString.contains("m/d/yy")){
227                     formatString="yyyy-MM-dd hh:mm:ss";
228                 }
229                 int formatIndex=formatListener.getFormatIndex(numrec);
230                 value=formatter.formatRawCellContents(valueDouble, formatIndex, formatString).trim();
231 
232                 value = value.equals("") ? "" : value;
233                 //向容器加入列值
234                 cellList.add(thisColumn, value);
235                 checkRowIsNull(value);  //如果里面某个单元格含有值，则标识该行不为空行
236                 break;
237             default:
238                 break;
239         }
240 
241         //遇到新行的操作
242         if (thisRow != -1 && thisRow != lastRowNumber) {
243             lastColumnNumber = -1;
244         }
245 
246         //空值的操作
247         if (record instanceof MissingCellDummyRecord) {
248             MissingCellDummyRecord mc = (MissingCellDummyRecord) record;
249             curRow = thisRow = mc.getRow();
250             thisColumn = mc.getColumn();
251             cellList.add(thisColumn, "");
252         }
253 
254         //更新行和列的值
255         if (thisRow > -1)
256             lastRowNumber = thisRow;
257         if (thisColumn > -1)
258             lastColumnNumber = thisColumn;
259 
260         //行结束时的操作
261         if (record instanceof LastCellOfRowDummyRecord) {
262             if (minColums > 0) {
263                 //列值重新置空
264                 if (lastColumnNumber == -1) {
265                     lastColumnNumber = 0;
266                 }
267             }
268             lastColumnNumber = -1;
269 
270             if (flag&&curRow!=0) { //该行不为空行且该行不是第一行，发送（第一行为列名，不需要）
271                 ExcelReaderUtil.sendRows(filePath, sheetName, sheetIndex, curRow + 1, cellList); //每行结束时，调用sendRows()方法
272                 totalRows++;
273             }
274             //清空容器
275             cellList.clear();
276             flag=false;
277         }
278     }
279 
280     /**
281      * 如果里面某个单元格含有值，则标识该行不为空行
282      * @param value
283      */
284     public void checkRowIsNull(String value){
285         if (value != null && !"".equals(value)) {
286             flag = true;
287         }
288     }
289 }

2.2.4 辅助类ExcelReaderUtil

调用ExcelXlsReader类和ExcelXlsxReader类对excel2003和excel2007两个版本进行大批量数据读取：

 1 package org.poi;
 2 
 3 import java.util.List;
 4 
 5 /**
 6  * @author y
 7  * @create 2018-01-19 0:13
 8  * @desc
 9  **/
10 public class ExcelReaderUtil {
11     //excel2003扩展名
12     public static final String EXCEL03_EXTENSION = ".xls";
13     //excel2007扩展名
14     public static final String EXCEL07_EXTENSION = ".xlsx";
15 
16     /**
17      * 每获取一条记录，即打印
18      * 在flume里每获取一条记录即发送，而不必缓存起来，可以大大减少内存的消耗，这里主要是针对flume读取大数据量excel来说的
19      * @param sheetName
20      * @param sheetIndex
21      * @param curRow
22      * @param cellList
23      */
24     public static void sendRows(String filePath, String sheetName, int sheetIndex, int curRow, List cellList) {
25             StringBuffer oneLineSb = new StringBuffer();
26             oneLineSb.append(filePath);
27             oneLineSb.append("--");
28             oneLineSb.append("sheet" + sheetIndex);
29             oneLineSb.append("::" + sheetName);//加上sheet名
30             oneLineSb.append("--");
31             oneLineSb.append("row" + curRow);
32             oneLineSb.append("::");
33             for (String cell : cellList) {
34                 oneLineSb.append(cell.trim());
35                 oneLineSb.append("|");
36             }
37             String oneLine = oneLineSb.toString();
38             if (oneLine.endsWith("|")) {
39                 oneLine = oneLine.substring(0, oneLine.lastIndexOf("|"));
40             }// 去除最后一个分隔符
41 
42             System.out.println(oneLine);
43     }
44 
45     public static void readExcel(String fileName) throws Exception {
46         int totalRows =0;
47         if (fileName.endsWith(EXCEL03_EXTENSION)) { //处理excel2003文件
48             ExcelXlsReader excelXls=new ExcelXlsReader();
49             totalRows =excelXls.process(fileName);
50         } else if (fileName.endsWith(EXCEL07_EXTENSION)) {//处理excel2007文件
51             ExcelXlsxReader excelXlsxReader = new ExcelXlsxReader();
52             totalRows = excelXlsxReader.process(fileName);
53         } else {
54             throw new Exception("文件格式错误，fileName的扩展名只能是xls或xlsx。");
55         }
56         System.out.println("发送的总行数：" + totalRows);
57     }
58 
59     public static void main(String[] args) throws Exception {
60         String path="C:\\Users\\y****\\Desktop\\TestSample\\H_20171226_***_*****_0430.xlsx";
61         ExcelReaderUtil.readExcel(path);
62     }
63 }

github地址：

https://github.com/SwordfallYeung/POIExcel

3. 参考资料：

https://www.cnblogs.com/huangjian2/p/6238237.html

https://www.cnblogs.com/yfrs/p/5689347.html

http://blog.csdn.net/lishengbo/article/details/40711769

https://www.cnblogs.com/wshsdlau/p/5643847.html

http://blog.csdn.net/lipinganq/article/details/78775195

http://blog.csdn.net/lipinganq/article/details/53389501

http://blog.csdn.net/zmx729618/article/details/72639037

http://blog.csdn.net/daiyutage/article/details/53010491

你可能感兴趣的:(POI读写大数据量excel，解决超过几万行而导致内存溢出的问题)

【机器学习】如何在Jupyter Notebook中安装库以及简单使用Jupyter实现单变量线性回归的模型f Lossya 机器学习 jupyter 线性回归人工智能开发语言 python 学习
引言JupyterNotebook中有一些魔法指令，需要安装第三方库文章目录引言一、安装方法方法一：使用`pip`或`conda`命令方法二：在命令行（终端或命令提示符）中安装二、使用JupyterNotebook实现单变量线性回归的模型fw,bf_{w,b}fw,b2.1工具2.2问题陈述2.3创建`x_train`和`y_train`变量2.4训练示例的数量`m`2.5训练示例`x_i,y_i
搭建 PostgreSQL 阿杰技术数据库数据库 postgresql
端口：5432代理备份端口：6432下载postgresql-15.0-1-windows-x64乱码显示配置环境变量PGDATA=数据目录位置找到postgresql.conf文件，修改参数lc_messages='UTF8'max_connections=1000shared_buffers=4GBwork_mem=8MB问题：远程易掉线方案：修改配置信息tcp_keepalives_idle
【Python进阶】assert 使用 | assert触发条件，使用实践示例 Qodicat Python学习 python 开发语言
文章目录1基本介绍2其他实践示例2.1检查函数参数2.2检查输入数据是否合规2.3检查操作是否合规1基本介绍assert是Python中的一个关键字，用于在代码中进行断言检查。它的作用是在条件为False的情况下触发AssertionError异常，用于帮助开发者在程序中捕获和处理错误。assert的语法如下：assertexpression,message其中expression是要进行断言检查
SQLAlchemy ORM在Python Web开发中的核心作用探究不一样的信息安全网络杂烩 sql
摘要在PythonWeb开发领域，SQLAlchemyORM扮演着至关重要的角色。作为一种对象关系映射工具，它能够将Python类与数据库表相映射，实现数据行与Python对象之间的转换。开发者可以使用面向对象的方法操作数据库，无需直接编写SQL语句，从而大幅提升开发效率并降低出错概率。SQLAlchemyORM提供了一套强大而灵活的数据库操作方法，助力开发者快速构建和维护复杂的数据模型。关键词S
erilog 多路分支语句 2401_88127808 fpga开发
关键词：case，选择器case语句是一种多路条件分支的形式，可以解决if语句中有多个条件选项时使用不方便的问题。case语句case语句格式如下：case(case_expr)condition1:true_statement1;condition2:true_statement2;……default:default_statement;endcasecase语句执行时，如果condition1
复习c语言数组人机yu 算法数据结构排序算法
一、数组的定义和初始化1.定义数组数组的定义形式如下：类型数组名[数组长度];例如，定义一个存储5个整数的数组：intarr[5];这个定义表示arr是一个包含5个整数元素的数组。数组的索引从0开始，到数组长度减1（即从arr[0]到arr[4]）。2.初始化数组可以在定义数组时初始化数组的元素：intarr[5]={1,2,3,4,5};也可以在定义后逐个赋值：intarr[5];arr[0]=
代码架构编写规范：多线程操作与多文件、多包设计千天夜知识积累架构师转型之路开发语言 python 系统架构
在多线程编程中，代码架构的设计不仅影响系统的性能，还决定了系统的可维护性、扩展性和可调试性。在多线程环境下，设计良好的架构可以有效避免竞态条件、死锁以及其他并发问题，同时提高系统的稳定性和可扩展性。本文将聚焦于如何在多线程操作中编写规范的代码架构，涵盖多文件、多线程、多包的交互设计，并提供线程机制的规范和保活机制的实现。一、架构设计原则1.1分离关注点在进行多线程开发时，首先要遵循的原则是分离关注
COCO8 数据集上训练 YOLO11n：从入门到跑路（100 轮训练实战）星际编程喵 Python探索之旅目标跟踪人工智能计算机视觉机器学习
前言训练YOLO11n，听起来就像是给赛博世界的“战斗天使”装上双核发动机，而COCO8数据集，则是那个小小的试验场。今天，我们就要在这个数据集上训练YOLO11n模型100轮，见证它如何从一个懵懂的“AI萌新”成长为“目标检测大佬”。本篇文章将以专业又幽默的方式，带你深入了解训练流程，并提供完整代码示例，让你轻松掌握这项技术。简介YOLO（YouOnlyLookOnce）是目标检测领域的明星模型
如何激活python的虚拟环境怪咖学生 python 开发语言
要激活Python的虚拟环境，首先需要确保你已经创建了一个虚拟环境。假设你已经在项目目录中创建了一个虚拟环境，名为venv。以下是激活虚拟环境的步骤：在Windows上：打开命令提示符（CommandPrompt）。导航到包含虚拟环境的目录。输入以下命令激活虚拟环境：.\venv\Scripts\activate在macOS或Linux上：打开终端（Terminal）。导航到包含虚拟环境的目录。输
学习python你必须弄懂的 Python、Pycharm、Anaconda 三者之间的关系经纬数智 python python pycharm 开发语言 conda
Python作为深度学习和人工智能学习的热门语言，学习一门语言，除了学会其简单的语法之外还需要对其进行运行和实现，才能实现和发挥其功能和作用。下面来介绍运行Python代码常用到的工具总结。一.Python、Pycharm、Anaconda关系介绍1.PythonPython是一种跨平台的计算机程序语言。是一个高层次的结合了解释性、编译性、互动性和面向对象的脚本语言。最初被设计用于编写自动化脚本(
日志技术的使用大三小小小白笔记 java 后端
日志技术概述什么是日志？日志就好比生活中的日记，可以随时随地记录你生活中的点点滴滴。程序中的日志，是用来记录应用程序的运行信息、状态信息、错误信息的。为什么要在程序中记录日志呢？便于追踪应用程序中的数据信息、程序的执行过程。便于对应用程序的性能进行优化。便于应用程序出现问题之后，排查问题，解决问题。便于监控系统的运行状态。......之前我们编写程序时，也可以通过System.out.printl
全网最新最全AI办公工具大汇总（含13个AI办公工具）一只贴代码君人工智能 python java c语言 c++算法
AiPPT网址：https://www.aippt.cn/描述：AI快速生成高质量PPT文多多AiPPT网址：https://docmee.cn/?source=ai-bot描述：AI一键生成PPT，支持AI配图和智能资料整合美图AIPPT网址：https://www.designkit.com/ppt/?channel=ai-bot.cn描述：美图秀秀推出的免费在线AI生成PPT设计工具Gamm
【2025美赛D题】为更美好的城市绘制路线图建模｜建模过程+完整代码论文全解全析小天数模 25美赛数学建模
你是否在寻找数学建模比赛的突破点？数学建模进阶思路！作为经验丰富的美赛O奖、国赛国一的数学建模团队，我们将为你带来本次数学建模竞赛的全面解析。这个解决方案包不仅包括完整的代码实现，还有详尽的建模过程和解析，帮助你全面理解并掌握如何解决类似问题。详见文末问题一：第一步：数据整理与处理在处理数据时，可能会遇到以下问题：1.数据清洗：确保每个数据集都是干净的，删除无关的列、处理缺失值，确保数据的格式一致
Python从0到100（二十二）：用Python读写CSV文件是Dream呀 python 数据库开发语言
一、CSV文件概述CSV，即逗号分隔值（CommaSeparatedValues），是一种以纯文本形式存储表格数据的通用格式。它因其简洁和易于使用而广泛应用于数据交换，如在数据库、电子表格等应用程序中导入和导出数据。CSV文件的纯文本特性使其与操作系统和编程语言无关，大多数编程语言都提供了处理CSV文件的功能，使其在数据处理和科学领域中极为流行。CSV文件的主要特点包括：纯文本格式：使用特定字符集
Nginx配置反向代理我是小白 nginx 运维代理模式云计算
背景：现实生产环境中，部署的环境经常是离线的，通常要经过跳板机才能到生产机器上，且生产机器不带web界面，导致需要进行测试web的时候无法测试，这时候就很需要一个nginx代理机器环境：a为windows或带web的linux，充当客户端，b为跳板机，c为生产机器在线/离线安装nginx在线安装#安装所需环境[root@nginxdata]#yuminstall-yopenssl-develpcr
STM32开发内核结构且听风吟_YU 单片机 stm32 单片机内核
转载请保留原作者想讲解一下STM32的开发内核架构，说白了就是讲讲我的代码是怎么一层一层的调用一直到最底层的寄存器的.首先上图：图中已经很清晰了，我只想强调几个点：1.stm32f10x.h这个文件真是相当的吊啊，基本上所有的哭文件里都有包含这个文件，因为这个文件时间上就相当于STM32的硬件抽象，他隔绝了底层的寄存器，向上提供了各种结构体，同时这个文件定义了很多的常量，都是在使用的时候赋值给某个
Python语法学习 weixin_44256848 Python python
Python标识符Python中的标识符是区分大小写的。以下划线开头的标识符是有特殊意义的。以单下划线开头_foo的代表不能直接访问的类属性，需通过类提供的接口进行访问，不能用fromxxximport*而导入。以双下划线开头的__foo代表类的私有成员，以双下划线开头和结尾的__foo__代表Python里特殊方法专用的标识，如__init__()代表类的构造函数。Python可以同一行显示多条
破解编程语言“鄙视链”：深度剖析其成因与背后的逻辑 TravisBytes 其他网络协议网络协程 coroutine c++
在编程世界里，各种编程语言的使用者之间似乎存在着一条无形的“鄙视链”。从古老神秘的C到灵动便捷的Python，从严谨规范的Java到天马行空的Ruby，不同语言的拥趸们总是在暗自较量。这条所谓的“鄙视链”究竟源自何处？它是基于语言特性的理性分级，还是仅仅是程序员们的主观臆断？本文将深入探讨“鄙视链”的成因，揭示其背后的逻辑与动因，帮助读者全面理解这一现象。目录1.历史与传统的影响2.语言特性的差异
华为ipd项目管理流程_体系切换，华为IPD的研发管理之道（上） weixin_39849942 华为ipd项目管理流程
研发要从只对产品负责转变为端到端的负责，冲到前台的研发，应主动拉通公司上下游，向前抓需求，向后支撑可实施性、可服务性，并推动实施、服务的改进。1）研发从后台冲到前台：就是研发不再被动地接受需求、开发产品、交给市场销售，从仅对开发交付负责，变成对端到端经营负责。主动拉通公司上下游，向前抓需求，向后支撑可实施性、可服务性，并推动实施、服务的改进。在华为，研发就是产品竞争力兜底的角色，是公司的基本驱动力
灰色预测模型_预测模型——灰色模型 weixin_39548740 灰色预测模型
网上有许多大佬写的灰色预测模型，写的非常的棒，但是我个人感觉，在公式部分，许多大佬在写最小二乘法得出a，b的值的时候并不是那么细致，所以我写这一篇灰色模型既是详细介绍公式的由来，同时也是为后续我要写的组合模型，如灰色模型与神经网络的结合，灰色模型与马尔可夫链式模型的结合做一个铺垫，希望对大家有帮助。1，灰色系统介绍灰色系统是由华中科技大学的邓聚龙教授于80年代初创立，该系统作为新兴的横断学科，在短
python venv 打包发布_venv --- 创建虚拟环境 — Python 3.9.1rc1 文档 weixin_39732491 python venv 打包发布
创建虚拟环境¶通过执行venv指令来创建一个虚拟环境:python3-mvenv/path/to/new/virtual/environment运行此命令将创建目标目录(父目录若不存在也将创建)，并放置一个pyvenv.cfg文件在其中，文件中有一个home键，它的值指向运行此命令的Python安装(目标目录的常用名称是.venv)。它还会创建一个bin子目录(在Windows上是Scripts)
工作流编写教程 weixin_34363171 前端 php ViewUI
介绍ONES中使用了flowchart.js作为前端展示，并且扩展了flowchart.js的流程描述语言。flowchart.js参见：https://github.com/adrai/flowchart.js描述语言分为三部分，使用\n\n(空一行)作为分割，分别是节点定义、执行流程描述、节点权限描述节点定义eg:make_stockout=>operation:生成出库单:>m:Sale/O
华为ipd产品开发流程_IPD模式下的产品开发流程 weixin_39716105 华为ipd产品开发流程
IPD产品开发流程体系IPD产品开发流程体系来源于美国PRTM公司的《产品生命周期优化法》，该体系集成了多个迄今为止最好的产品开发实践方法，也就是其来源于实践活动，反过来去指导实践。据PRTM公司统计，通过成功实施IPD，产品投入市场时间缩短40％-60％；产品开发浪费减少50％-80％；产品开发生产力提高25％―30％；新产品收益(占全部收益的百分比)增加100％。后来该方法被IBM所采用，从流
编程语言发展史之：编程语言的未来趋势 AI天才研究院 AI大模型企业级应用开发实战大数据人工智能语言模型 Java Python 架构设计
作者：禅与计算机程序设计艺术文章目录1.简介概述计算编程语言发展的主要里程碑2.编程语言的历史2.1编程语言的出现2.2第一代编程语言——FORTRAN2.3第二代编程语言——COBOL2.4第三代编程语言——PASCAL2.5第四代编程语言——C++、Java、C#、Python、Ruby等2.6模块化编程语言2.7跨平台语言2.8编程语言的分类3.编程语言的发展阶段及其性质编程语言的发展阶段及
代码随想录算法训练营第三十九天-动态规划-337. 打家劫舍 III taoyong001 算法动态规划 c++leetcode
老师讲这是树形dp的入门题目解题思路是以二叉树的遍历（递归三部曲）再结合动规五部曲dp数组如何定义：只需要定义一个二个元素的数组，dp[0]与dp[1]dp[0]表示不偷当前节点的最大价值dp[1]表示偷当前节点后的最大价值这样可以把每个节点的状态值都表示出来但这个数组的两个值只表示当前节点的状态值递归时要使用后序遍历：使用后序遍历的原因就是要从叶子结点一层一层向上统计出来/***Definiti
【爬虫】针对FingerprintJS反爬，selenium破解策略 steamedobun 项目管理爬虫爬虫 selenium 测试工具
目录FingerprintJS原理概述Selenium基础与应对思路代码实现实战（结合Selenium和UndetectedChromedriver绕过FingerprintJS）Canvas指纹随机化FingerprintJS原理概述FingerprintJS主要通过收集浏览器的各种特征信息来生成独一无二的指纹，这些信息包括但不限于：浏览器版本信息：不同浏览器版本在处理网页元素、执行JavaSc
【SLAM】SLAM技术详解：同步定位与地图构建 steamedobun 计算机视觉 SLAM 深度学习人工智能目标检测机器学习
引言在机器人技术、自动驾驶、增强现实（AR）和无人机等前沿领域，SLAM（SimultaneousLocalizationandMapping）技术扮演着至关重要的角色。SLAM，即同时定位与地图构建，是一种通过传感器数据实时估计机器人或无人系统自身位置并构建环境地图的技术。本文将详细介绍SLAM技术的原理、应用场景、分类及其优缺点，并对SLAM技术的未来发展进行展望。SLAM技术概述定义与原理S
C、C++、Java到Python，编程入门学习什么语言好? 明天会比今天更好 C/C++编程入门编程语言程序员
最近，TIOBE更新了7月的编程语言榜单，常年霸榜的C、Java和Python依然蝉联前三位。万万没想到的是，R语言居然冲到了第八位，创下了史上最佳记录。而且后续随着业内对数据统计和挖掘需求的上涨，R语言热度颇有些势不可挡的架势。然而作为程序员吃饭的工具，编程语言之间也形成了某种鄙视链，各大论坛里弥漫着剑拔弩张的气氛，众口难调。也难怪有很多初学者会有疑惑，为什么会有这么多编程语言，我到底应该学什么
火山方舟 Python SDK豆包模型环境配置错误集锦（Mac电脑） yitahutu79 大模型运行错误集锦 python macos 开发语言
下载豆包频频出错pipinstall'volcengine-python-sdk[ark]'通过官方给的下载方式总是提示pipinstall'volcengine-python-sdk[ark]'ERROR:Cannotexecute`setup.py`sincesetuptoolsisnotavailableinthebuildenvironment.所以选择下载源码gitclonehttps:
volcengine 库装不上 #25 LiuPig刘皮哥 python
https://github.com/volcengine/volc-sdk-python/issues/25在Dockerpython3.10-slim中volcengine安装时报错,其依赖pycryptodome显示gcc相关错误调研发现pycryptodome3.19.0不会报错,volcengine依赖的pycryptodome3.9.9会报错修改方案是手动为volcengine安装依赖
Spring中@Value注解，需要注意的地方无量 spring bean @Value xml
Spring 3以后,支持@Value注解的方式获取properties文件中的配置值，简化了读取配置文件的复杂操作 1、在applicationContext.xml文件(或引用文件中)中配置properties文件 <bean id="appProperty" class="org.springframework.beans.fac
mongoDB 分片开窍的石头 mongodb
mongoDB的分片。要mongos查询数据时候先查询configsvr看数据在那台shard上，configsvr上边放的是metar信息，指的是那条数据在那个片上。由此可以看出mongo在做分片的时候咱们至少要有一个configsvr,和两个以上的shard（片）信息。第一步启动两台以上的mongo服务 &nb
OVER(PARTITION BY)函数用法 0624chenhong oracle
这篇写得很好，引自 http://www.cnblogs.com/lanzi/archive/2010/10/26/1861338.html OVER(PARTITION BY)函数用法 2010年10月26日 OVER(PARTITION BY)函数介绍开窗函数 &nb
Android开发中，ADB server didn't ACK 解决方法一炮送你回车库 Android开发
首先通知：凡是安装360、豌豆荚、腾讯管家的全部卸载，然后再尝试。一直没搞明白这个问题咋出现的，但今天看到一个方法，搞定了！原来是豌豆荚占用了 5037 端口导致。参见原文章：一个豌豆荚引发的血案——关于ADB server didn't ACK的问题简单来讲，首先将Windows任务进程中的豌豆荚干掉，如果还是不行，再继续按下列步骤排查。 &nb
canvas中的像素绘制问题换个号韩国红果果 JavaScript canvas
pixl的绘制，1.如果绘制点正处于相邻像素交叉线，绘制x像素的线宽，则从交叉线分别向前向后绘制x/2个像素，如果x/2是整数，则刚好填满x个像素，如果是小数，则先把整数格填满，再去绘制剩下的小数部分，绘制时，是将小数部分的颜色用来除以一个像素的宽度，颜色会变淡。所以要用整数坐标来画的话（即绘制点正处于相邻像素交叉线时），线宽必须是2的整数倍。否则会出现不饱满的像素。 2.如果绘制点为一个像素的
编码乱码问题灵静志远 java jvm jsp 编码
1、JVM中单个字符占用的字节长度跟编码方式有关，而默认编码方式又跟平台是一一对应的或说平台决定了默认字符编码方式；2、对于单个字符：ISO-8859-1单字节编码，GBK双字节编码，UTF-8三字节编码；因此中文平台(中文平台默认字符集编码GBK)下一个中文字符占2个字节，而英文平台(英文平台默认字符集编码Cp1252(类似于ISO-8859-1))。 3、getBytes()、getByte
java 求几个月后的日期 darkranger calendar getinstance
Date plandate = planDate.toDate(); SimpleDateFormat df = new SimpleDateFormat("yyyy-MM-dd"); Calendar cal = Calendar.getInstance(); cal.setTime(plandate); // 取得三个月后时间 cal.add(Calendar.M
数据库设计的三大范式（通俗易懂） aijuans 数据库复习
关系数据库中的关系必须满足一定的要求。满足不同程度要求的为不同范式。数据库的设计范式是数据库设计所需要满足的规范。只有理解数据库的设计范式，才能设计出高效率、优雅的数据库，否则可能会设计出错误的数据库. 目前，主要有六种范式：第一范式、第二范式、第三范式、BC范式、第四范式和第五范式。满足最低要求的叫第一范式，简称1NF。在第一范式基础上进一步满足一些要求的为第二范式，简称2NF。其余依此类推。
想学工作流怎么入手 atongyeye jbpm
工作流在工作中变得越来越重要，很多朋友想学工作流却不知如何入手。很多朋友习惯性的这看一点，那了解一点，既不系统，也容易半途而废。好比学武功，最好的办法是有一本武功秘籍。研究明白，则犹如打通任督二脉。系统学习工作流，很重要的一本书《JBPM工作流开发指南》。本人苦苦学习两个月，基本上可以解决大部分流程问题。整理一下学习思路，有兴趣的朋友可以参考下。 1 首先要
Context和SQLiteOpenHelper创建数据库百合不是茶 android Context创建数据库
一直以为安卓数据库的创建就是使用SQLiteOpenHelper创建,但是最近在android的一本书上看到了Context也可以创建数据库,下面我们一起分析这两种方式创建数据库的方式和区别,重点在SQLiteOpenHelper 一:SQLiteOpenHelper创建数据库: 1,SQLi
浅谈group by和distinct bijian1013 oracle 数据库 group by distinct
group by和distinct只了去重意义一样，但是group by应用范围更广泛些，如分组汇总或者从聚合函数里筛选数据等。譬如：统计每id数并且只显示数大于3 select id ,count(id) from ta
vi opertion 征客丶 mac opration vi
进入 command mode （命令行模式）按 esc 键再按 shift + 冒号注：以下命令中带 $ 【在命令行模式下进行】，不带 $ 【在非命令行模式下进行】一、文件操作 1.1、强制退出不保存 $ q! 1.2、保存 $ w 1.3、保存并退出 $ wq 1.4、刷新或重新加载已打开的文件 $ e 二、光标移动 2.1、跳到指定行数字
【Spark十四】深入Spark RDD第三部分RDD基本API bit1129 spark
对于K/V类型的RDD,如下操作是什么含义？ val rdd = sc.parallelize(List(("A",3),("C",6),("A",1),("B",5)) rdd.reduceByKey(_+_).collect reduceByKey在这里的操作，是把
java类加载机制 BlueSkator java 虚拟机
java类加载机制 1.java类加载器的树状结构引导类加载器 ^ | 扩展类加载器 ^ | 系统类加载器 java使用代理模式来完成类加载，java的类加载器也有类似于继承的关系，引导类是最顶层的加载器，它是所有类的根加载器，它负责加载java核心库。当一个类加载器接到装载类到虚拟机的请求时，通常会代理给父类加载器，若已经是根加载器了，就自己完成加载。虚拟机区分一个Cla
动态添加文本框 BreakingBad 文本框
<script> var num=1; function AddInput() { var str=""; str+="<input
读《研磨设计模式》-代码笔记-单例模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ public class Singleton { } /* * 懒汉模式。注意，getInstance如果在多线程环境中调用，需要加上synchronized，否则存在线程不安全问题 */ class LazySingleton
iOS应用打包发布常见问题 chenhbc ios iOS发布 iOS上传 iOS打包
这个月公司安排我一个人做iOS客户端开发，由于急着用，我先发布一个版本，由于第一次发布iOS应用，期间出了不少问题，记录于此。 1、使用Application Loader 发布时报错：Communication error.please use diagnostic mode to check connectivity.you need to have outbound acc
工作流复杂拓扑结构处理新思路 comsci 设计模式工作算法企业应用 OO
我们走的设计路线和国外的产品不太一样，不一样在哪里呢？国外的流程的设计思路是通过事先定义一整套规则(类似XPDL)来约束和控制流程图的复杂度(我对国外的产品了解不够多，仅仅是在有限的了解程度上面提出这样的看法)，从而避免在流程引擎中处理这些复杂的图的问题，而我们却没有通过事先定义这样的复杂的规则来约束和降低用户自定义流程图的灵活性，这样一来，在引擎和流程流转控制这一个层面就会遇到很
oracle 11g新特性Flashback data archive daizj oracle
1. 什么是flashback data archive Flashback data archive是oracle 11g中引入的一个新特性。Flashback archive是一个新的数据库对象，用于存储一个或多表的历史数据。Flashback archive是一个逻辑对象，概念上类似于表空间。实际上flashback archive可以看作是存储一个或多个表的所有事务变化的逻辑空间。
多叉树:2-3-4树 dieslrae 树
平衡树多叉树,每个节点最多有4个子节点和3个数据项,2,3,4的含义是指一个节点可能含有的子节点的个数,效率比红黑树稍差.一般不允许出现重复关键字值.2-3-4树有以下特征: 1、有一个数据项的节点总是有2个子节点(称为2-节点) 2、有两个数据项的节点总是有3个子节点(称为3-节
C语言学习七动态分配 malloc的使用 dcj3sjt126com c language malloc
/* 2013年3月15日15:16:24 malloc 就memory(内存) allocate(分配)的缩写本程序没有实际含义，只是理解使用 */ # include <stdio.h> # include <malloc.h> int main(void) { int i = 5; //分配了4个字节静态分配 int * p
Objective-C编码规范[译] dcj3sjt126com 代码规范
原文链接 : The official raywenderlich.com Objective-C style guide 原文作者 : raywenderlich.com Team 译文出自 : raywenderlich.com Objective-C编码规范译者 : Sam Lau
0.性能优化-目录 frank1234 性能优化
从今天开始笔者陆续发表一些性能测试相关的文章，主要是对自己前段时间学习的总结，由于水平有限，性能测试领域很深，本人理解的也比较浅，欢迎各位大咖批评指正。主要内容包括：一、性能测试指标吞吐量、TPS、响应时间、负载、可扩展性、PV、思考时间 http://frank1234.iteye.com/blog/2180305 二、性能测试策略生产环境相同基准测试预热等 htt
Java父类取得子类传递的泛型参数Class类型 happyqing java 泛型父类子类 Class
import java.lang.reflect.ParameterizedType; import java.lang.reflect.Type; import org.junit.Test; abstract class BaseDao<T> { public void getType() { //Class<E> clazz =
跟我学SpringMVC目录汇总贴、PDF下载、源码下载 jinnianshilongnian springMVC
----广告-------------------------------------------------------------- 网站核心商详页开发掌握Java技术，掌握并发/异步工具使用，熟悉spring、ibatis框架；掌握数据库技术，表设计和索引优化，分库分表/读写分离；了解缓存技术，熟练使用如Redis/Memcached等主流技术；了解Ngin
the HTTP rewrite module requires the PCRE library 流浪鱼 rewrite
./configure: error: the HTTP rewrite module requires the PCRE library. 模块依赖性Nginx需要依赖下面3个包 1. gzip 模块需要 zlib 库 ( 下载: http://www.zlib.net/ ) 2. rewrite 模块需要 pcre 库 ( 下载: http://www.pcre.org/ ) 3. s
第12章 Ajax（中） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Optimize query with Query Stripping in Web Intelligence blueoxygen BO
http://wiki.sdn.sap.com/wiki/display/BOBJ/Optimize+query+with+Query+Stripping+in+Web+Intelligence and a very straightfoward video http://www.sdn.sap.com/irj/scn/events?rid=/library/uuid/40ec3a0c-936
Java开发者写SQL时常犯的10个错误 tomcat_oracle java sql
1、不用PreparedStatements 　　有意思的是，在JDBC出现了许多年后的今天，这个错误依然出现在博客、论坛和邮件列表中，即便要记住和理解它是一件很简单的事。开发者不使用PreparedStatements的原因可能有如下几个：　　他们对PreparedStatements不了解　　他们认为使用PreparedStatements太慢了　　他们认为写Prepar
世纪互联与结盟有感阿尔萨斯
10月10日，世纪互联与（Foxcon）签约成立合资公司，有感。全球电子制造业巨头（全球500强企业）与世纪互联共同看好IDC、云计算等业务在中国的增长空间，双方迅速果断出手，在资本层面上达成合作，此举体现了全球电子制造业巨头对世纪互联IDC业务的欣赏与信任，另一方面反映出世纪互联目前良好的运营状况与广阔的发展前景。众所周知，精于电子产品制造（世界第一），对于世纪互联而言，能够与结盟