zhangyihui1986

使用 StAX 解析 XML

1、前言

本文大部分摘抄于IBM developerworks（主要是理论），详下面三篇文章，摘抄主要是为了使自己理解更深一点儿，仅当作笔记而已...也是为了以后再次使用时有个参考！摘抄并不全面，原文内容要丰富地多，详见原文。

参考文章：

使用 StAX 解析 XML，第 1 部分: Streaming API for XML (StAX) 简介：http://www.ibm.com/developerworks/cn/xml/x-stax1.html

使用 StAX 解析 XML，第 2 部分: 拉式解析和事件：http://www.ibm.com/developerworks/cn/xml/x-stax2.html

使用 StAX 解析 XML，第 3 部分: 使用定制事件和编写 XML：http://www.ibm.com/developerworks/cn/xml/x-stax3.html

2、概述

开始的时候，Java API for XML processiong（JAXP）提供了两种XML处理方式：文档对象模型（DOM）和Simple API for XML（SAX），JSR-173提出了一种面向流的新方法：Streaming API for XML（StAX）。其最终版本于 2004 年 3 月发布，并成为了 JAXP 1.4（包含在 Java 6 中）的一部分。

顾名思义，StAX把重点放在流上，StAX使应用程序能够把 XML 作为一个事件流来处理；其实SAX方式也是基于事件流的XML处理方法，但二者不同之处在于，SAX是基于观察者模式，我们需要提供事件处理程序并注册到解析器，解析器在指定事件发生时回调我们提供的程序；而StAX允许我们的程序把事件逐个”拉“出来，这样StAX就有更大的灵活性，对于我们不感兴趣的事件就没有必要将其”拉“出来处理。

StAX提供了两套API用来处理XML，分别提供了不同程度的抽象。基于指针的 API 把 XML 作为一个标记（或事件）流来处理；应用程序可以检查解析器的状态，获得解析的上一个标记的信息，然后再处理下一个标记，依此类推。这是一种低层 API，尽管效率高，但是没有提供底层 XML 结构的抽象。基于迭代器的 API 把 XML 作为一系列事件对象来处理。应用程序只需要确定解析事件的类型，将其转换成对应的具体类型，然后利用其方法获得属于该事件的信息。

3、基本原理

不管我们使用哪种API，首先要做的都是获取解析器工厂实例，然后根据需要配置该实例可设置的定制或者预先定义好的属性（其名称在类 XMLInputFactory 中定义），最后创建解析器，如下：

XMLInputFactory inputFactory = XMLInputFactory.newFactory();
XMLEventReader eventReader = inputFactory.createXMLEventReader(new FileInputStream("E:\\PDFPATH_6.xml"));

这个例子创建的是基于事件对象的解析器XMLEventReader，如果需要使用基于指针的 API，可以调用某个 createXMLStreamReader 方法获得一个 XMLStreamReader；基于事件迭代器的 API比基于指针的API 具有更多的面向对象特征，因为当前的解析器状态反映在事件对象中，所以在处理事件的时候不需要访问解析器，所需要的信息都被封装在获得的事件对象中了。

4、基于指针的 API

基于指针的 API通过在 XML 标记流中移动逻辑指针来处理 XML。基于指针的解析器实质上是一个状态机，在事件的驱动下从一个状态转移到另一个状态。这里的触发事件是随着应用程序使用适当的方法推动解析器在标记流中前进而解析出来的 XML 标记。在每个状态，都可使用一组方法获得上一个事件的信息。一般来说，并非每个状态下都能使用所有的方法。

基于指针的 API 是解析 XML 的低层方法。使用这种方法，应用程序沿着 XML 标记流移动指针，在每一步中检查解析器的状态来了解解析内容的更多信息。这种方法效率很高，特别适用于资源受限的环境。

使用基于指针的API首先必须通过调用上面创建的XMLInputFactory 实例的 createXMLStreamReader 方法从 XMLInputFactory 得到 XMLStreamReader。该方法有多个重载版本，支持不同类型的输入。

4.1、XMLStreamReader 接口

XMLStreamReader 接口基本上定义了基于指针的 API（标记常量在其超类 XMLStreamConstants 接口中定义）。之所以称为基于指针，是因为读取器就像是底层标记流上的指针。应用程序可以沿着标记流向前推进指针并分析当前指针所在位置的标记。

XMLStreamReader 提供了多种方法导航标记流。为了确定当前指针所指向的标记（或事件）的类型，应用程序可以调用 getEventType()。该方法返回接口 XMLStreamConstants 中定义的一个标记常量。移动到下一个标记，应用程序可以调用 next()。该方法也返回解析的标记的类型，如果接着调用 getEventType() 则返回的值相同。只有当方法 hasNext() 返回 true 时（就是说还有其他标记需要解析）才能调用该方法（以及其他移动读取器的方法）。

示例代码：

// create an XMLStreamReader
XMLStreamReader r = ...;
int event = r.getEventType();
while (true) {
	switch (event) {
	case XMLStreamConstants.START_DOCUMENT:
		// do something
		break;
	case XMLStreamConstants.START_ELEMENT:
		// do something
		break;
	// add cases for each event of interest
	}

	if (!r.hasNext())
		break;
 
	event = r.next();
}

还与其他几种方法可以移动 reader。 nextTag() 方法将跳过所有的空白、注释或处理指令，直到遇到 START_ELEMENT 或 END_ELEMENT。该方法在解析只含元素的内容时很有用，如果在发现标记之前遇到非空白文本（不包括注释或处理指令），就会抛出异常。getElementText() 方法返回元素的开始和关闭标签（即 START_ELEMENT 和 END_ELEMENT）之间的所有文本内容。如果遇到嵌套的元素就会抛出异常。

请注意，这里的 “标记” 和 “事件” 可以互换使用。虽然基于指针的 API 的文档说的是事件，但把输入源看成标记流很方便。而且不容易造成混乱，因为还有一整套基于事件的 API（那里的事件是真正的对象）。不过，XMLStreamReader 的事件本质上并非都是标记。比方说，START_DOCUMENT 和 END_DOCUMENT 事件不需要对应的标记。前一个事件是解析开始之前发生，后者则在没有更多解析工作要做的时候发生（比如解析完成最后一个元素的关闭标签之后，读取器处于 END_ELEMENT 状态，但是如果没有发现更多的标记需要解析，读取器就会切换到 END_DOCUMENT 状态）。

4.2、处理XML文档

创建之后，XMLStreamReader 将从 START_DOCUMENT 状态开始（即 getEventType() 返回 START_DOCUMENT）。处理标记的时候应考虑到这一点。和迭代器不同是不需要先移动指针（使用 next()）进入合法的状态。同样当读取器转换到最终状态 END_DOCUMENT 之后，应用程序也不应再移动它。在这种状态下，hasNext() 方法将返回 false。

START_DOCUMENT 事件提供了获取关于文档本身信息的方法，如 getEncoding()、getVersion() 和 isStandalone()。应用程序也可调用 getProperty(String) 获得命名属性的值，不过一些属性仅在特定状态做了定义（比方说，如果当前事件是 DTD，则属性 javax.xml.stream.notations 和 javax.xml.stream.entities 分别返回所有的符号和实体声明）。

在 START_ELEMENT 和 END_ELEMENT 事件中，可以使用和元素名称以及名称空间有关的方法（如 getName()、getLocalName()、getPrefix() 和 getNamespaceXXX()），在 START_ELEMENT 事件中还可使用与属性有关的方法（getAttributeXXX()）。

ATTRIBUTE 和 NAMESPACE 也被识别为独立的事件，虽然在解析典型的 XML 文档时不会用到。但是当 ATTRIBUTE 或 NAMESPACE 节点作为 XPath 查询结果返回时可以使用。

基于文本的事件（如 CHARACTERS、CDATA、COMMENT 和 SPACE），可使用各种 getTextXXX() 方法取得文本。可以分别使用 getPITarget() 和 getPIData() 检索 PROCESSING_INSTRUCTION 的目标和数据。ENTITY_REFERENCE 和 DTD 也支持 getText()，ENTITY_REFERENCE 还支持 getLocalName()。

解析完成后，应用程序关闭读取器并释放解析过程中获得的资源。请注意这样并没有关闭底层的输入源。

4.3、StreamFilter筛选器

通过调用 XMLInputFactory 的带有基本读取器的 createFilteredReader 方法和一个应用程序定义的筛选器（即实现 StreamFilter 的类实例），可以创建筛选过的 XMLStreamReader。导航筛选过的读取器时，读取器每次移动到下一个标记之前都会询问筛选器。如果筛选器认可了当前事件，就将其公开给筛选过的读取器。否则跳过这个标记并检查下一个，依此类推。这种方法可以让开发人员创建一个仅处理解析内容子集的基于指针的 XML 处理程序，并与针对不同的扩展的内容模型的筛选器结合使用。

5、基于事件对象的API

这种 API 以事件对象为中心。和基于指针的 API 一样也是一种基于”拉“的 XML 解析方法：应用程序使用提供的方法从解析器中拉出每个事件，按照需要处理该事件，依此类推，直到流解析完成（或者应用程序决定停止解析）。

5.1、XMLEventReader 接口简介

事件迭代器 API 的主要接口是 XMLEventReader。与 XMLStreamReader 相比它的方法要少很多。这是因为 XMLEventReader 用于迭代事件对象流（事实上 XMLEventReader 扩展了 java.util.Iterator）。关于解析事件的所有信息都封装在事件对象中而不是读取器中。

要使用基于事件迭代器的 API，应用程序首先必须从 XMLInputFactory 获得 XMLEventReader 的实例，与createXMLStreamReader 方法一样，createXMLEventReader也有多个重载版本，支持多种创建XMLEventReader 的输入源。需要注意的是createXMLEventReader方法还可以接受 XMLStreamReader 为参数创建 XMLEventReader。这种用法可以很好地说明基于事件迭代器的 API 是堆叠于基于指针的 API 之上的。事实上，实现通常要使用其他输入源创建一个 XMLStreamReader，然后再用它创建 XMLEventReader。

5.2、使用 XMLEventReader

创建 XMLEventReader 之后，应用程序可用它迭代表示底层 XML 流的 InfoSet 片段的事件。由于接口 XMLEventReader 扩展了 java.util.Iterator，可以使用标准迭代器方法如 hasNext() 和 next()。但是请注意，不支持 remove() 方法，如果调用该方法会抛出异常。

XMLEventReader 还提供了一些方便的方法来简化 XML 处理：

nextEvent() 本质上是一种等同于 Iterator 的 next() 方法的强类型方法，它返回一个 XMLEvent，它是所有事件对象的基本接口。
nextTag() 能够跳过所有无关紧要的空白直到下一个开始或结束标记。因此返回值将是 StartElement 或 EndElement 事件。该方法在处理纯元素（即文档类型声明 DTD 中声明为 EMPTY 的元素）内容时尤其有用。
getElementText() 可以访问纯文本元素的文本内容（开始标签到结束标签之间）。从 StartElement 作为下一个预期事件开始，该方法在遇到 EndElement 之前将所有字符连接起来并返回结果字符串。
peek() 可以得到迭代器将返回的下一个事件（如果有）但是不移动迭代器。

具体API请参阅JDK的API文档。

5.3、XMLEvent 的层次结构

XMLEventReader 在解析过程的每一步之后通过事件对象和应用程序通信自己的状态。整个 API 中使用的事件对象的标准类型定义在 javax.xml.stream.events 包中。接口 XMLEvent 表示类型层次结构的根，所有类型的事件必须扩展该接口。表示各种指针层事件类型（在基于指针的 API 中）定义在接口 XMLStreamConstants 中。不过，也可使用定制的接口（只要扩展了 XMLEvent）。

从解析器中检索到事件之后，应用程序通常需要将其向下转换成 XMLEvent 的子类型以便访问该特定类型的信息。XMLEvent 提供了 getEventType() 方法返回 XMLStreamConstants 中定义的事件常量，可基于该信息对事件进行向下类型转换；除此之外XMLEvent 还为此提供了布尔查询方法，比如isStartElement()返回true说明这是个StartElement ；asStartElement()、asEndElement() 和 asCharacters() 分别将相应的事件转换成 StartElement、EndElement 和 Characters。

5.4、EventFilter 筛选事件

StAX允许我们创建专门的事件读取器，即XMLEventReader 只能读取到我们指定的事件类型对象，这就需要用到EventFilter接口。只需要对 XMLInputFactory 实例调用 createXMLEventReader(XMLEventReader, EventFilter) 方法，并传递基本事件读取器和接受/拒绝从基本读取器获得的事件的简单筛选器。

比如：

eventReader = inputFactory.createFilteredReader(eventReader, new EventFilter() {
						public boolean accept(XMLEvent event) {
							int type = event.getEventType();
							return type == XMLStreamConstants.START_ELEMENT
									|| type == XMLStreamConstants.END_ELEMENT
									|| type == XMLStreamConstants.CHARACTERS;
						}
					});

如上代码我们得到的XMLEventReader就只能接受元素开始、元素结束、字符三种事件。

6、具体应用

本次关注StAX的原因是项目中需要解析大XML文件，并将内容入库。XML文件超过100M，记录超过100万，所以用传统的DOM解析不大可行，也不能一次性将文件解析成Java对象，因为那样会在内存中出现上百万的Java对象，会吃掉很大一部分内容，所以只能采用边解析边入库的方式。

下面将本次的主要应用代码贴一下，用到的是基于事件对象的API。

XML文件大体结构：

<?xml version="1.0" encoding="gbk"?>
<TRS>
	<REC>
		<PDFPATH>\\1989YY05\R15\92257X\013\002\99130.pdf</PDFPATH><br/><br/>
		<UI>1989017091</UI><br/><br/>
		<ZHONGHUA>0</ZHONGHUA><br/><br/>
	</REC>
	<REC>
		<PDFPATH>\\1989YY02\R4\94093X\004\001\184114.pdf</PDFPATH><br/><br/>
		<UI>1989019986</UI><br/><br/>
		<ZHONGHUA>0</ZHONGHUA><br/><br/>
	</REC>
	// ...很多条
</TRS>

Java解析代码（由于并没有使用，所以比较粗糙，没有再优化..）：

package com.ninemax.admin.action;

import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.util.Stack;

import javax.xml.stream.EventFilter;
import javax.xml.stream.XMLEventReader;
import javax.xml.stream.XMLInputFactory;
import javax.xml.stream.XMLStreamConstants;
import javax.xml.stream.XMLStreamException;
import javax.xml.stream.events.XMLEvent;

import org.apache.struts2.convention.annotation.Namespace;
import org.springframework.beans.factory.annotation.Autowired;

import com.ninemax.action.base.BaseActionSupport;
import com.ninemax.entity.Domain;
import com.ninemax.service.admin.IDomainService;

@Namespace("/")
public class LiteralUrlAction extends BaseActionSupport {
	public static final String ENTITY_TAG = "REC";		// 实体标记
	public static final String PATH_TAG = "PDFPATH";	// 属性标记
	public static final String UI_TAG = "UI";			// 属性标记
	public static final String FLAG_TAG = "ZHONGHUA";	// 属性标记
	
	@Autowired
	private IDomainService domainService;
	
	public String test() {
		XMLInputFactory inputFactory = XMLInputFactory.newFactory();
		Stack<Domain> stack = new Stack<Domain>();
		try {
			long s = System.currentTimeMillis();
			int i = 0;
			XMLEventReader eventReader = inputFactory.createXMLEventReader(new FileInputStream("E:\\PDFPATH_6.xml"));
			eventReader = inputFactory.createFilteredReader(eventReader, new EventFilter() {
						public boolean accept(XMLEvent event) {
							int type = event.getEventType();
							return type == XMLStreamConstants.START_ELEMENT
									|| type == XMLStreamConstants.END_ELEMENT
									|| type == XMLStreamConstants.CHARACTERS;
						}
					});
			while(eventReader.hasNext()) {
				XMLEvent event = eventReader.nextEvent();
				if (event.isStartElement()) {
					String tag = event.asStartElement().getName().getLocalPart();
					if (ENTITY_TAG.equalsIgnoreCase(tag)) {		// 如果是实体元素, 则创建一个新元素并压入栈顶
						Domain domain = new Domain();
						stack.push(domain);
					} else if (UI_TAG.equalsIgnoreCase(tag)) {		// 属性, 设置到当前实体中
						String ui = eventReader.nextEvent().asCharacters().getData();
						stack.lastElement().setUi(ui);
					} else if (PATH_TAG.equalsIgnoreCase(tag)) {	// 属性, 设置到当前实体中
						String path = eventReader.nextEvent().asCharacters().getData();
						stack.lastElement().setPath(path);
					} else if (FLAG_TAG.equalsIgnoreCase(tag)) {	// 属性, 设置到当前实体中
						String flag = eventReader.nextEvent().asCharacters().getData();
						stack.lastElement().setFlag(flag);
					}
				} else if (event.isEndElement()) {		// 元素结束事件 
					String tag = event.asEndElement().getName().getLocalPart();
					if (ENTITY_TAG.equalsIgnoreCase(tag) && stack.size() == 10000) {
						// 如果是实体元素结束事件并且栈内已达10000个实例, 进行一次入库
						domainService.saveEntity(stack);
						i += stack.size();
						stack.clear();	// 清空栈
					}
				}
			}
			if (stack.size() > 0) {		// 解析完毕后, 将剩下的入库
				domainService.saveEntity(stack);
				i += stack.size();
			}
			eventReader.close();
			System.out.println("共花费" + (System.currentTimeMillis() - s) + "毫秒时间.共" + i + "条记录");
		} catch (FileNotFoundException e) {
			e.printStackTrace();
		} catch (XMLStreamException e) {
			e.printStackTrace();
		}
		return null;
	}
}

据测，性能还可以...

documents4j 使用教程惠悦颖
documents4j使用教程documents4jdocuments4jisaJavalibraryforconvertingdocumentsintoanotherdocumentformat项目地址:https://gitcode.com/gh_mirrors/do/documents4j1.项目介绍documents4j是一个Java库，用于将文档转换为另一种文档格式。它通过委托给任何能够
深入理解JavaScript ES6 Promise基本使用和进阶讲解 ScottePerk 前端 javascript es6 前端
一项新技术的出现一定是为了解决某个痛点问题的。ES6的Promise就是为了解决ES5在处理异步任务时所存在的问题。Promise是一个异步处理框架。Promise前夕——ES5对于异步任务的处理我们先来看看ES5是怎么处理异步任务的。主要的手段就是通过回调函数。回调函数是JavaScript本身就支持的机制。可以通过回调函数实现类似下面这个的网络请求过程。虽然这个函数的实现看起来代码有点不好看，
Java使用documents4j将word和excel转pdf 药岩工作中的那些问题 java word excel
pom.xml添加documents4j依赖com.documents4jdocuments4j-local1.0.3com.documents4jdocuments4j-transformer-msoffice-word1.0.3<dependency
Python爬虫实战：研究xmltodict库相关技术 ylfhpy 爬虫项目实战 python 爬虫开发语言 xmltodict
1.引言1.1研究背景与意义气象数据在农业生产、交通规划、灾害预警等多个领域具有重要应用价值。传统的气象数据获取方式主要依赖于气象部门发布的统计信息，存在更新不及时、数据维度有限等问题。随着互联网技术的发展，气象网站提供了丰富的实时气象数据，但这些数据通常以HTML、XML等非结构化或半结构化形式存在，难以直接利用。因此，开发高效的数据采集与解析系统具有重要的现实意义。1.2国内外研究现状网络爬虫
trycatch捕获不到的错误前端javascript
在浏览器环境的JavaScript中，try...catch是处理运行时错误的常用机制，但并非所有错误都能被其捕获。以下是无法被try...catch捕获的几类错误及其原因与解决方案：⚠️1.语法错误（SyntaxErrors）原因：语法错误发生在代码解析阶段，此时代码尚未执行，try...catch无法捕获。示例：try{consta=;//缺少赋值表达式}catch(e){console.lo
.net和Java微服务框架列举及.net技术选型步、步、为营 java 微服务开发语言 .net
.NET与Java微服务框架大盘点及.NET技术选型指南前言在当今的软件开发领域，微服务架构凭借其灵活性和可扩展性，成为了众多企业构建复杂应用的首选方案。.NET和Java作为两大主流的开发平台，各自拥有丰富的微服务框架。本文将为大家详细介绍.NET和Java的一些常见微服务框架，并探讨.NET技术选型的相关要点。.NET微服务框架介绍1.ASP.NETCoreASP.NETCore是构建微服务的
Java流式处理太阳伞下的阿呆 java 生成器迭代器 stream 流式处理
在Java中，没有直接类似Python生成器的语法，但可以通过迭代器（Iterator）和流式处理（如使用Spliterator或ReactiveStreams）来实现类似生成器的功能。此外，也可以通过BlockingQueue和线程的组合实现异步文件解压流。以下是几种实现方式：**方法1：使用****Iterator**实现一个Iterator，在每次调用next()时返回解压完成的下一个文件名
JVM调优实战 Day 11：JVM参数调优最佳实践在未来等你 JVM调优实战 JVM Java 性能优化调优虚拟机
【JVM调优实战Day11】JVM参数调优最佳实践文章标签jvm,jvm调优,java性能优化,jvm参数配置,垃圾回收,JVM监控,Java开发,架构设计文章简述在Java应用的性能调优过程中，JVM参数的合理配置是影响系统稳定性和吞吐量的关键因素。本文作为“JVM调优实战”系列的第11天内容，全面讲解JVM参数调优的核心概念、技术原理与实际应用场景。文章从JVM内存模型、GC策略出发，深入分析
JVM调优实战 Day 5：内存泄漏与溢出分析在未来等你 JVM调优实战 JVM Java 性能优化调优虚拟机
【JVM调优实战Day5】内存泄漏与溢出分析文章简述在Java应用中，内存泄漏和内存溢出是常见的性能瓶颈问题。本文作为“JVM调优实战”系列的第五天内容，深入讲解了JVM中内存泄漏与溢出的基本概念、原理机制、常见问题及诊断方法。文章通过理论结合实践的方式，介绍了如何使用JVM工具如jstat、jmap、jhat等进行堆内存分析，并提供了完整的代码示例和配置参数。同时，文中还包含一个真实生产环境中的
互联网大厂Java求职面试：Spring AI最佳实践与AI应用架构设计在未来等你 Java场景面试宝典 AI 技术编程 Java Spring
互联网大厂Java求职面试：SpringAI最佳实践与AI应用架构设计引言在当前AI技术快速发展的背景下，企业对AI能力的需求日益增长。作为Java开发人员，掌握SpringAI的最佳实践和相关技术栈变得尤为重要。本文将深入探讨SpringAI的应用场景、架构设计以及实际案例，帮助读者更好地理解和应用这一前沿技术。技术总监的提问与郑薪苦的回答第一轮提问技术总监（严肃）：“郑薪苦，首先请你说说你在项
MCP+A2A：从实验室到生产环境的落地之旅 CarlowZJ AI应用落地+MCP+A2A 数据库 MCP+A2A
目录摘要一、引言二、MCP与A2A概念讲解（一）MCP（ModelContextProtocol）（二）A2A（Application-to-Application）（三）MCP与A2A的融合三、MCP+A2A技术架构图与工作流程图（一）整体架构图（二）工作流程图四、MCP+A2A代码示例（一）基于Python的MCP+A2A通信示例（二）基于Java的MCP+A2A应用集成示例五、MCP+A2A
Java Class常量池和运行时常量池的区别? java1234_小锋 java java 开发语言 jvm
大家好，我是锋哥。今天分享关于【JavaClass常量池和运行时常量池的区别?】面试题。希望对大家有帮助；JavaClass常量池和运行时常量池的区别?超硬核AI学习资料，现在永久免费了！在Java中，常量池分为类常量池和运行时常量池，它们分别用于存储不同类型的常量。下面是它们之间的主要区别：1.类常量池(ClassConstantPool)：定义：类常量池是指类加载时在.class文件中定义的常
Java GC是任意时候都能进行的吗？ java1234_小锋 java java 开发语言
大家好，我是锋哥。今天分享关于【JavaGC是任意时候都能进行的吗？】面试题。希望对大家有帮助；JavaGC是任意时候都能进行的吗？超硬核AI学习资料，现在永久免费了！Java的垃圾回收（GC）并不是任意时刻都能进行的。GC的执行有一定的规则和条件：垃圾回收的触发时机：堆内存不足：当Java堆内存空间不足时，垃圾回收会被触发，试图回收不再使用的对象来腾出内存。手动触发：可以通过System.gc(
互联网大厂Java面试指南：从基础到高阶技术栈与业务场景实战 yiiyx Java场景面试宝典 Java Spring Boot 微服务面试分布式系统
互联网大厂Java面试指南：从基础到高阶技术栈与业务场景实战场景介绍本文模拟互联网大厂高级Java工程师面试场景，涵盖JavaSE、Spring生态、微服务、数据库、缓存、消息队列等技术栈，结合音视频、电商、金融等业务场景，提供3轮渐进式提问与详细解析。技术栈核心语言与平台:JavaSE(8/11/17),JakartaEE(JavaEE),JVM构建工具:Maven,Gradle,AntWeb框
企业级RAG系统架构设计与实现指南（Java技术栈）在未来等你大模型应用开发 AI 技术编程 Java Spring
企业级RAG系统架构设计与实现指南（Java技术栈）开篇：RAG系统的基本概念与企业应用价值在当今快速发展的AI技术背景下，检索增强生成（Retrieval-AugmentedGeneration,RAG）已成为构建智能问答、知识库管理、个性化推荐等应用的核心技术之一。RAG系统通过结合信息检索与自然语言生成（NLG），能够有效提升模型对特定领域数据的适应能力，避免传统大模型在训练数据不足或数据更
现代 JavaScript (ES6+) 入门到实战（六）：异步的终极形态 - async/await 的优雅魔法程序员阿超的博客 ES6+完全进化指南：从 ES5 到现代 JS javascript es6 开发语言
在上一篇，我们用Promise把“回调地狱”改造成了优雅的链式调用。这已经是一个巨大的进步了。但是，当逻辑复杂时，一长串的.then()仍然会降低代码的可读性，我们的大脑依然需要切换到“异步模式”去理解代码。有没有一种方法，能让我们像写同步代码（一行接一行）那样去写异步代码呢？答案是肯定的！ES7(ES2017)带来了async/await，它被誉为JavaScript异步编程的“终极解决方案”。
ES6 新特性从入门到精通：100 + 代码示例带你轻松掌握（附图解教程）北泽别胡说新手保护期从0到1学前端 javascript 前端开发语言 es6
本文针对JavaScript新手系统讲解ES6核心语法，涵盖变量声明、箭头函数、解构赋值、类与继承、Promise等核心模块。通过150+行带注释代码，结合「传统写法对比」和「新手避坑指南」，帮助读者3小时掌握ES6关键特性，快速应用于项目开发。一、ES6入门：为什么必须学习ES6？1.1ES6的革命性升级代码简洁性：箭头函数、模板字符串等语法减少冗余代码逻辑清晰性：class类、模块化语法让代码
Javascript：ES6+概念详解善良的小乔人工智能 javascript es6 开发语言
Javascript：ES6+概念详解善良的小乔一.基础概念什么是ES6+？ES6+（或ES2015+）是JavaScript语言的现代版本，包含了从2015年ES6（ECMAScript2015）开始的一系列更新。这些更新引入了新的语法糖、内置对象和API，显著提升了代码的可读性、简洁性和开发效率。什么是ECMAScript？ECMAScript是JavaScript的标准化规范（由ECMA国际
Zookeeper集群永旗狍子 Linux java zookeeper 分布式
目录Zookeeper集群架构图Zookeeper集群中节点的角色Zookeeper数据同步Zookeeper选举搭建Zookeeper集群Java连接Zookeeper集群Zookeeper集群架构图Zookeeper集群中节点的角色Leader(Master)：事务请求的唯一处理者，也可以处理读请求。Follower(Slave)：可以直接处理客户端的读请求，并向客户端响应；但其不会处理事务请
OceanBase批量插入数据报错java.lang.ArrayIndexOutOfBoundsException:0 二宝哥 oceanbase java 开发语言
OceanBase数据库MySQL模式，插入数据报错，直接首先换了连接池，插入数据成功。参考文章：com.mysql.cj.jdbc.result.ResultSetMetaData.getCloumnType(ResultSetMetaData.java:188)空指针-CSDN博客批量插入数据时，报错如下：OceanBase社区中搜索批量插入报错，出现“ArrayIndexOutOfBound
可达性分析算法Test ThetaarSofVenice 算法 java jvm
可达性分析算法相对于引用计数算法而言，可达性分析算法同样具备实现简单和执行高效等特点，更重要的是，该算法可以有效地解决在引用计数算法中循环引用的问题，防止内存泄漏的发生，这个算法目前较为常用。Java语言选择使用可达性分析算法判断对象是否存活。这种类型的垃圾收集通常叫作追踪性垃圾收集(TracingGarbageCollection)，它的基本流程如下。可达性分析算法是以GCRoot（根对象）（见
【Java从入门到放弃之通用容器类】 ThetaarSofVenice #Java从入门到放弃 java python 开发语言
通用容器类通用容器类Collection接口Collection接口源码Collection接口概述List接口List接口源码List接口概述Set接口Set接口源码Set接口概述Queue接口Queue源码Queue概述Map接口Map接口源码总结通用容器类Java提供了一组丰富的通用容器类（也称为集合框架，CollectionsFramework），用于存储和管理一组对象。这些容器类提供了灵
【Java从入门到放弃之 ConcurrentModificationException】 ThetaarSofVenice #Java从入门到放弃 java 开发语言
ConcurrentModificationExceptionConcurrentModificationException探索ConcurrentModificationException解决问题总结ConcurrentModificationExceptionConcurrentModificationException是Java中的一种运行时异常，通常发生在使用迭代器遍历集合（如ArrayL
浏览器原理与API 天涯学馆 Web大前端全栈架构 javascript 前端
浏览器原理与渲染机制浏览器架构概述现代浏览器通常由以下核心组件构成：用户界面(UI)：地址栏、后退/前进按钮、书签菜单等浏览器引擎：在用户界面和渲染引擎之间架起桥梁渲染引擎：负责显示请求的内容(如Chrome的Blink、Firefox的Gecko)网络层：处理网络请求(如HTTP请求)JavaScript引擎：解释和执行JavaScript代码(如V8引擎)UI后端：绘制基本的窗口小部件(如组合
rollupOptions 详细讲解，如何优化性能东心十 vue.js
RollupOptions详细讲解与性能优化Rollup是一个JavaScript模块打包器，特别适合用于库和应用的打包。rollupOptions是在使用Vite、WMR等构建工具时配置Rollup的选项对象。下面我将详细讲解rollupOptions的各个配置项以及如何优化打包性能。核心配置项详解输入(input)javascriptrollupOptions:{input:‘src/main
java面试题墨京 java面试 java 开发语言
1.list和set的区别？list底层是数组，有序可重复，按对象进入顺序保存元素，可以有多个null元素，可以使用该iterator迭代器取出元素，也可以直接get（intindex）下标，取出元素。底层数据结构：动态数组（arraylist）或链表（Linkedlist）set底层是，无序不可重复，最多只能储存一个null元素，只能使用iterator接口取出所有元素，再逐一遍历各个元素。底层
Java+POI+EXCEL导出折线图到Excel表格中雾林小妖 java项目解决方案 excel
1、问题概述？本案例使用POI版本：5.2.3在项目中我们经常需要将项目中的数据以图标的形式导出，以下是，以JAVA+POI技术，将数据以折线图导出到Excel表格中。2、实现方式--折线图2.1、导入依赖包-案例完整pom.xml文件此处需要注意，我是用的springboot版本是2.17.6版本。同时需要注意commons-lang3的版本，版本尽量高一些，否则会报错，我使用的是3.12.0。
【小白Java进阶之路】 2024年Java小白如何成为大牛？超详细学习路线图！全栈陈序员 Java后端开发 java 学习 windows
??2024年Java小白如何成为大牛？超详细学习路线图！摘要本文为Java初学者提供了一份详细的学习路线图，旨在帮助他们从基础到进阶，最终成为Java领域的专家。文章涵盖了Java基础、进阶技术、Web开发、框架与工具、软技能等多个方面，并提供了代码示例、流程图和表格，以增强理解和实践能力。关键词Java,学习路线图,进阶,Web开发,框架,工具,软技能1.Java基础1.1语法基础变量和数据类
Java进阶学习 m0_67403013 面试学习路线阿里巴巴 android 前端后端
进阶学习过程的几个方面第一阶段的学习是java基础的学习和javaEE的学习。第二阶段就是java学习的进阶啦。主要是面试书籍，下面是书籍推荐：多线程、并发实战java高并发程序设计和java并发编程的艺术：——“java高并发程序设计”，这本书主要是为了看第二本书做铺垫，直接看第二本书可能会很吃力。实战java高并发程序设计主要看：前4章、5.1、5.2、5.3、5.10、5.11和第6章。——
JAVA进阶之路夜澜听雨声 Java Advance java 开发语言
JAVA进阶之路一、Java企业开发基础1.JavaWeb2.SSM框架3.Maven4.Springboot25.mybatis-plus6.前端学习（不算很重要）7.SpringSecurity（有时间再看，不重要）8.代码开发规范（不重要，有时间看）9.Git10.Linux（不重要，会用就行）二、Java企业开发进阶1.设计模式2.Redis（核心）3.消息队列RocketMQ(核心)4.
设计模式介绍 tntxia 设计模式
设计模式来源于土木工程师克里斯托弗亚历山大（http://en.wikipedia.org/wiki/Christopher_Alexander）的早期作品。他经常发表一些作品，内容是总结他在解决设计问题方面的经验，以及这些知识与城市和建筑模式之间有何关联。有一天，亚历山大突然发现，重复使用这些模式可以让某些设计构造取得我们期望的最佳效果。亚历山大与萨拉-石川佳纯和穆雷西乐弗斯坦合作
android高级组件使用(一) 百合不是茶 android RatingBar Spinner
1、自动完成文本框（AutoCompleteTextView） AutoCompleteTextView从EditText派生出来，实际上也是一个文本编辑框，但它比普通编辑框多一个功能：当用户输入一个字符后，自动完成文本框会显示一个下拉菜单，供用户从中选择，当用户选择某个菜单项之后，AutoCompleteTextView按用户选择自动填写该文本框。使用AutoCompleteTex
[网络与通讯]路由器市场大有潜力可挖掘 comsci 网络
如果国内的电子厂商和计算机设备厂商觉得手机市场已经有点饱和了,那么可以考虑一下交换机和路由器市场的进入问题..... 这方面的技术和知识,目前处在一个开放型的状态,有利于各类小型电子企业进入 &nbs
自写简单Redis内存统计shell 商人shang Linux shell 统计Redis内存
#!/bin/bash address="192.168.150.128:6666,192.168.150.128:6666" hosts=(${address//,/ }) sfile="staticts.log" for hostitem in ${hosts[@]} do ipport=(${hostitem
单例模式(饿汉 vs懒汉) oloz 单例模式
package 单例模式; /* * 应用场景:保证在整个应用之中某个对象的实例只有一个 * 单例模式种的《懒汉模式》 * */ public class Singleton { //01 将构造方法私有化，外界就无法用new Singleton()的方式获得实例 private Singleton(){}; //02 申明类得唯一实例 priva
springMvc json支持杨白白 json springmvc
1.Spring mvc处理json需要使用jackson的类库，因此需要先引入jackson包 2在spring mvc中解析输入为json格式的数据:使用@RequestBody来设置输入 @RequestMapping("helloJson") public @ResponseBody JsonTest helloJson() {
android播放，掃描添加本地音頻文件小桔子
最近幾乎沒有什麽事情，繼續鼓搗我的小東西。想在項目中加入一個簡易的音樂播放器功能，就像華為p6桌面上那麼大小的音樂播放器。用過天天動聽或者QQ音樂播放器的人都知道，可已通過本地掃描添加歌曲。不知道他們是怎麼實現的，我覺得應該掃描設備上的所有文件，過濾出音頻文件，每個文件實例化為一個實體，記錄文件名、路徑、歌手、類型、大小等信息。具體算法思想，
oracle常用命令 aichenglong oracle dba 常用命令
1 创建临时表空间 create temporary tablespace user_temp tempfile 'D:\oracle\oradata\Oracle9i\user_temp.dbf' size 50m autoextend on next 50m maxsize 20480m extent management local
25个Eclipse插件 AILIKES eclipse插件
提高代码质量的插件1. FindBugsFindBugs可以帮你找到Java代码中的bug，它使用Lesser GNU Public License的自由软件许可。2. CheckstyleCheckstyle插件可以集成到Eclipse IDE中去，能确保Java代码遵循标准代码样式。3. ECLemmaECLemma是一款拥有Eclipse Public License许可的免费工具，它提供了
Spring MVC拦截器+注解方式实现防止表单重复提交 baalwolf spring mvc
原理：在新建页面中Session保存token随机码，当保存时验证，通过后删除，当再次点击保存时由于服务器端的Session中已经不存在了，所有无法验证通过。 1.新建注解： ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
《Javascript高级程序设计(第3版)》闭包理解 bijian1013 JavaScript
“闭包是指有权访问另一个函数作用域中的变量的函数。”--《Javascript高级程序设计(第3版)》看以下代码： <script type="text/javascript"> function outer() { var i = 10; return f
AngularJS Module类的方法 bijian1013 JavaScript AngularJS Module
AngularJS中的Module类负责定义应用如何启动，它还可以通过声明的方式定义应用中的各个片段。我们来看看它是如何实现这些功能的。一.Main方法在哪里如果你是从Java或者Python编程语言转过来的，那么你可能很想知道AngularJS里面的main方法在哪里？这个把所
[Maven学习笔记七]Maven插件和目标 bit1129 maven插件
插件(plugin)和目标(goal) Maven，就其本质而言，是一个插件执行框架，Maven的每个目标的执行逻辑都是由插件来完成的，一个插件可以有1个或者几个目标，比如maven-compiler-plugin插件包含compile和testCompile，即maven-compiler-plugin提供了源代码编译和测试源代码编译的两个目标使用插件和目标使得我们可以干预
【Hadoop八】Yarn的资源调度策略 bit1129 hadoop
1. Hadoop的三种调度策略 Hadoop提供了3中作业调用的策略， FIFO Scheduler Fair Scheduler Capacity Scheduler 以上三种调度算法，在Hadoop MR1中就引入了，在Yarn中对它们进行了改进和完善.Fair和Capacity Scheduler用于多用户共享的资源调度 2. 多用户资源共享的调度
Nginx使用Linux内存加速静态文件访问 ronin47
Nginx是一个非常出色的静态资源web服务器。如果你嫌它还不够快，可以把放在磁盘中的文件，映射到内存中，减少高并发下的磁盘IO。先做几个假设。nginx.conf中所配置站点的路径是/home/wwwroot/res，站点所对应文件原始存储路径：/opt/web/res shell脚本非常简单，思路就是拷贝资源文件到内存中，然后在把网站的静态文件链接指向到内存中即可。具体如下：
关于Unity3D中的Shader的知识 brotherlamp unity unity资料 unity教程 unity视频 unity自学
首先先解释下Unity3D的Shader，Unity里面的Shaders是使用一种叫ShaderLab的语言编写的，它同微软的FX文件或者NVIDIA的CgFX有些类似。传统意义上的vertex shader和pixel shader还是使用标准的Cg/HLSL 编程语言编写的。因此Unity文档里面的Shader，都是指用ShaderLab编写的代码，然后我们来看下Unity3D自带的60多个S
CopyOnWriteArrayList vs ArrayList bylijinnan java
package com.ljn.base; import java.util.ArrayList; import java.util.Iterator; import java.util.List; import java.util.concurrent.CopyOnWriteArrayList; /** * 总述： * 1.ArrayListi不是线程安全的，CopyO
内存中栈和堆的区别 chicony 内存
1、内存分配方面：堆：一般由程序员分配释放，若程序员不释放，程序结束时可能由OS回收。注意它与数据结构中的堆是两回事，分配方式是类似于链表。可能用到的关键字如下：new、malloc、delete、free等等。栈：由编译器(Compiler)自动分配释放，存放函数的参数值，局部变量的值等。其操作方式类似于数据结构中
回答一位网友对Scala的提问 chenchao051 scala map
本来准备在私信里直接回复了，但是发现不太方便，就简要回答在这里。问题写道对于scala的简洁十分佩服，但又觉得比较晦涩，例如一例，Map("a" -> List(11,111)).flatMap(_._2)，可否说下最后那个函数做了什么，真正在开发的时候也会如此简洁？谢谢先回答一点，在实际使用中，Scala毫无疑问就是这么简单。
mysql 取每组前几条记录 daizj mysql 分组最大值最小值每组三条记录
一、对分组的记录取前N条记录：例如：取每组的前3条最大的记录 1.用子查询： SELECT * FROM tableName a WHERE 3> (SELECT COUNT(*) FROM tableName b WHERE b.id=a.id AND b.cnt>a. cnt) ORDER BY a.id,a.account DE
HTTP深入浅出 http请求 dcj3sjt126com http
HTTP(HyperText Transfer Protocol)是一套计算机通过网络进行通信的规则。计算机专家设计出HTTP，使HTTP客户（如Web浏览器）能够从HTTP服务器(Web服务器)请求信息和服务，HTTP目前协议的版本是1.1.HTTP是一种无状态的协议，无状态是指Web浏览器和Web服务器之间不需要建立持久的连接，这意味着当一个客户端向服务器端发出请求，然后We
判断MySQL记录是否存在方法比较 dcj3sjt126com mysql
把数据写入到数据库的时，常常会碰到先要检测要插入的记录是否存在，然后决定是否要写入。　　我这里总结了判断记录是否存在的常用方法：　　sql语句： select count ( * ) from tablename; 　　然后读取count(*)的值判断记录是否存在。对于这种方法性能上有些浪费，我们只是想判断记录记录是否存在，没有必要全部都查出来。
对HTML XML的一点认识 e200702084 html xml
感谢http://www.w3school.com.cn提供的资料 HTML 文档中的每个成分都是一个节点。节点根据 DOM，HTML 文档中的每个成分都是一个节点。 DOM 是这样规定的：整个文档是一个文档节点每个 HTML 标签是一个元素节点包含在 HTML 元素中的文本是文本节点每一个 HTML 属性是一个属性节点注释属于注释节点 Node 层次
jquery分页插件 genaiwei jquery Web 前端分页插件
//jquery页码控件// 创建一个闭包 (function($) { // 插件的定义 $.fn.pageTool = function(options) { var totalPa
Mybatis与Ibatis对照入门于学习 Josh_Persistence mybatis ibatis 区别联系
一、为什么使用IBatis/Mybatis 对于从事 Java EE 的开发人员来说，iBatis 是一个再熟悉不过的持久层框架了，在 Hibernate、JPA 这样的一站式对象 / 关系映射（O/R Mapping）解决方案盛行之前，iBaits 基本是持久层框架的不二选择。即使在持久层框架层出不穷的今天，iBatis 凭借着易学易用、
C中怎样合理决定使用那种整数类型？秋风扫落叶 c 数据类型
如果需要大数值(大于32767或小于32767), 使用long 型。否则, 如果空间很重要 (如有大数组或很多结构), 使用 short 型。除此之外, 就使用 int 型。如果严格定义的溢出特征很重要而负值无关紧要, 或者你希望在操作二进制位和字节时避免符号扩展的问题, 请使用对应的无符号类型。但是, 要注意在表达式中混用有符号和无符号值的情况。 &nbs
maven问题 zhb8015 maven问题
问题1： Eclipse 中新建maven项目无法添加src/main/java 问题 eclipse创建maevn web项目，在选择maven_archetype_web原型后，默认只有src/main/resources这个Source Floder。按照maven目录结构，添加src/main/ja
(二)androidpn-server tomcat版源码解析之--push消息处理 spjich java androdipn 推送
在 (一)androidpn-server tomcat版源码解析之--项目启动这篇中，已经描述了整个推送服务器的启动过程，并且把握到了消息的入口即XmppIoHandler这个类，今天我将继续往下分析下面的核心代码，主要分为3大块，链接创建，消息的发送，链接关闭。先贴一段XmppIoHandler的部分代码 /** * Invoked from an I/O proc
用js中的formData类型解决ajax提交表单时文件不能被serialize方法序列化的问题中华好儿孙 JavaScript Ajax Web 上传文件 FormData
var formData = new FormData($("#inputFileForm")[0]); $.ajax({ type:'post', url:webRoot+"/electronicContractUrl/webapp/uploadfile", data:formData, async: false, ca
mybatis常用jdbcType数据类型 ysj5125094 mybatis mapper jdbcType
MyBatis 通过包含的jdbcType 类型 BIT FLOAT CHAR