前言
在1-4章中,我们使用了iText7来创建PDF文档。在5-6章中,我们操作和重用了现有的PDF文档。在这些章节中我们操作的PDF文档都是在ISO 32000规范下的,是PDF文件的核心标准。ISO 32000并不是PDF的唯一ISO标准,还有很多为了特定原因创建的子标准。在本章中,我们着重关注两个:
ISO 14289,也叫做PDF/UA。UA的意思就是通用访问设计(Universal Accessibility),使用PDF/UA标准的PDF的文档,每个人都可以查看,包括那些有视觉障碍的人甚至瞎子(我天,真有这么神奇吗)
ISO 19005,也叫做PDF/A。A的意思是归档化(Archiving)。目标是文档数字化的长期存储。
在本章中,我们通过创建一系列的PDF/A和PDF//UA文件会学习PDF/A和PDF/UA相关的知识。
创建PDF/UA文档
在我们开始PDF/UA例子之前,我们来看一下我们要解决的问题。在第1章,我们已经创建了带有图片的文档,在句子"Quick brown fox jumps over the lazy dog"中,我们把"dag"和"fox"替换为相应的图片,当这个文件被读入的时候,一个机器不能知道第一张图片代码一个fox,第二张图片代表dog,因此这个文件会被认为:“Quick brown jumps over the lazy”。
在一个普通的PDF中,内容会被画入画布(canvas)中。我们可能会使用高级的对象,例如List
和Table
,但是一旦PDF被创建,这些对象不会保存。一个List
是一系列行组成的,但是在list元素中一个文本片段并不知道它是list的一部分。一个Table
由一群先和特定位置的文本组成,同样的,一个文本片段并不知道它属于特定行和列。
除非我们让一个PDF变成加带标签的PDF,否则这个文档不会包含任何的语义上的结构。当一个文档没有语义结构存储的时候,我们就说这个PDF无法感知/理解(isn’t accessible)。为了可感知/理解,这个文档需要能够能够区分一个页面上哪些部分是真实的内容,哪些部分不是真实的内容(例如页眉,页码),一行文本如果不是paragraph
的一部分的话,需要知道自己是否是一个title
,当然还有其他一些要求。我们可以通过一种方式来添加所有的信息到一个页面,这个方式就是创建结构树(structure)
和把内容定义为带标签的内容
。这个可能听起来比较复杂,但是如果我们使用iText7的高级对象,我们可以高效的使用setTagged()
来达到这一目标。 通过定义PdfDocument
为带标签的文档,List
、Table
和Paragraph
等带结构的对象被引入后,会反映在带标签的PDF中。 当然这只为了PDF感知(accessible,是实在不知道翻译成啥比较好,就暂且翻译成感知吧)的其中一个要求,下面的代码可以帮我们理解其他的要求:
PdfDocument pdf = new PdfDocument(new PdfWriter(dest, new WriterProperties().addXmpMetadata()));
Document document = new Document(pdf);
//Setting some required parameters
pdf.setTagged();
pdf.getCatalog().setLang(new PdfString("en-US"));
pdf.getCatalog().setViewerPreferences(
new PdfViewerPreferences().setDisplayDocTitle(true));
PdfDocumentInfo info = pdf.getDocumentInfo();
info.setTitle("iText7 PDF/UA example");
//Fonts need to be embedded
PdfFont font = PdfFontFactory.createFont(FONT, PdfEncodings.WINANSI, true);
Paragraph p = new Paragraph();
p.setFont(font);
p.add(new Text("The quick brown "));
Image foxImage = new Image(ImageFactory.getImage(FOX));
//PDF/UA: Set alt text
foxImage.getAccessibilityProperties().setAlternateDescription("Fox");
p.add(foxImage);
p.add(" jumps over the lazy ");
Image dogImage = new Image(ImageFactory.getImage(DOG));
//PDF/UA: Set alt text
dogImage.getAccessibilityProperties().setAlternateDescription("Dog");
p.add(dogImage);
document.add(p);
document.close();
创建一个PdfDocument
和Document
,但是这次我们使用WriterProperties
的addXmpMetadata()
来自动添加XMP元数据。在PDF/UA中,必须在PDF中以XML格式存储相同的元数据。XML可能不是压缩的。不熟悉PDF内容格式的处理者/处理程序必须能够探测这个XMP元数据并能正确处理它。一个XMP数据流会在Info字典(Info dictionary)条目中自动创建。这个Info字典是一个PDF对象,它包含诸如文档标题之类的数据。除了添加XMP数据流以后,我们还需求进行以下操作来使之符合PDF/UA标准:
把这个PdfDocument
设置为带标签的(行4)
我们添加一个语言说明符。在这个例子中,文件知道在这个文件中使用的主要语言是美国英语(行5)
更改查看器首选项,以便文档的标题始终显示在PDF查看器的顶部栏中 (行6-7)。然后我们把标题放入了文档的元数据中(行8-9)
所有的字体需要被嵌入(行11)。对于字体其实还有一些其他的要求,但是我们现在讨论还为时过早。
所有的内容需要带标签。遇到图片时,我们需要使用替代图片文字提供该图片的描述(行17和行22)
现在我们已经完成了创建PDF/UA的工作。结果如下两图1和图2所示,可能与之前的差别并不是很明显,但是如果我们打开Tags版面(一定要用Adobe Acrobat Pro,用Adobe Acrobat Reader DC不行的哟):
图1. 一个PDF/UA文档和它的结构
图2. ctrl+d文档属性
我们可以看到
标签里面有
标签,
标签由两个
和两个
组成。我们会在这章的后面创建更加复杂的PDF/UA文档,现在我们先来看看PDF/A怎么创建。
创建PDF/A文档 PDF/A-1
ISO 19005的Part 1是在2005年发布的。它在Adobe PDF 1.4声明官方中被定义(那时候这份声明并不是ISO标准)。SO 19005-1引入了一系列的义务和限制:
文档的所有资源和信息必须自己存储:所有的字体需要被嵌入;扩展的动画、视频、声音和其他二进制文件是不被允许的。
文档必须把元数据保存在XMP(eXensible Metadata Platform)格式中:ISO 16684(XMP)描述了如何把XML格式的元数据保存在一个二进制文件中,以便不知道怎么读取和解释二进制文件的软件仍然可以提取文件的元数据。
不允许一些未来(先进的,不在PDF里面声明的或未来添加的)功能:PDF不能包含JavaScript而且也不能被加密
SO 19005-1:2005 (PDF/A-1)定义了两种符合性级别:
Level B(“basic”):确保长期保存文件的视觉外观。
Level A(“accessible”):不仅确保长期保存文件的视觉外观,而且引入了结构和语义特性,这个PDF需要是带标签的PDF。(注意和PDF/UA比较类似,但是不同,原因后面例子会提及)
下面的代码展示了如何把我们之前创建的"Quick brown fox"的PDF变成符合PDF/A-1b标准:
//Initialize PDFA document with output intent
PdfADocument pdf = new PdfADocument(new PdfWriter(dest),
PdfAConformanceLevel.PDF_A_1B,
new PdfOutputIntent("Custom", "", "http://www.color.org",
"sRGB IEC61966-2.1", new FileInputStream(INTENT)));
Document document = new Document(pdf);
//Fonts need to be embedded
PdfFont font = PdfFontFactory.createFont(FONT, PdfEncodings.WINANSI, true);
Paragraph p = new Paragraph();
p.setFont(font);
p.add(new Text("The quick brown "));
Image foxImage = new Image(ImageFactory.getImage(FOX));
p.add(foxImage);
p.add(" jumps over the lazy ");
Image dogImage = new Image(ImageFactory.getImage(DOG));
p.add(dogImage);
document.add(p);
document.close();
我们可以看到,我们不再使用PdfDocument
实例,相反,我们使用的是PdfADocument
实例。首先我们创建了一个PdfADocument
实例,PdfADocument
实例构造函数第一个参数是一个PdfWriter
,第二个参数是符合性级别(在这里就是PdfAConformanceLevel.PDF_A_1B
),第三个参数是一个PdfOutpuyIntext
,这个输出意图告诉文档如何解读这个文档里面存储的颜色。在第10行,我们确保字体被嵌入。
产生的PDF的样子如下图3:
图3. 一篇PDF/A-1B标准的文档
由上图我们可以看见一个带有"这个文件符合PDF/A标准规范,且已在只读模式下打开以防被修改"的小蓝条。对此我们从两个方法来解读这句话:
这句话并不意味着这个PDF实际上是符合PDF/A标准的,它只是声明它有可能是,为了确认是否符合标准,我们需要在Adobe Acrobat中打开"标准"面板,然后点击"验证符合性``链接,Acrobat会验证这个文档是否和它声明的一样,在这个例子中,结果是“验证成功";这样,我们会最终创建PDF/A-1B标准的文档。
文档已经以只读方式打开,并不是因为不允许修改(PDF/A不能保护PDF不被修改),而是Adobe Acrobat以只读的方式显示,因为任何修改都可能会改变PDF转换为不再符合PDF/A标准的PDF。在不破坏PDF/A状态的情况下更新PDF/A是被允许的。
然后我们来看看怎么创建PDF/A-1a,代码如下:
//Initialize PDFA document with output intent
PdfADocument pdf = new PdfADocument(new PdfWriter(dest),
PdfAConformanceLevel.PDF_A_1A,
new PdfOutputIntent("Custom", "", "http://www.color.org",
"sRGB IEC61966-2.1", new FileInputStream(INTENT)));
Document document = new Document(pdf);
//Setting some required parameters
pdf.setTagged();
//Fonts need to be embedded
PdfFont font = PdfFontFactory.createFont(FONT, PdfEncodings.WINANSI, true);
Paragraph p = new Paragraph();
p.setFont(font);
p.add(new Text("The quick brown "));
Image foxImage = new Image(ImageFactory.getImage(FOX));
//Set alt text
foxImage.getAccessibilityProperties().setAlternateDescription("Fox");
p.add(foxImage);
p.add(" jumps over the lazy ");
Image dogImage = new Image(ImageFactory.getImage(DOG));
//Set alt text
dogImage.getAccessibilityProperties().setAlternateDescription("Dog");
p.add(dogImage);
document.add(p);
document.close();
让我们来解读代码,在第3行中,我们把PdfConformanceLevel.PDF_A1B
变为了PdfConformanceLevel.PDF_A1A
。在第8行中,把这个PdfADocument
变成了带标签的PDF,然后加入了图片的文字描述信息,最后结果如下图4所示:
图4. 一篇PDF/A-1A标准文档
我们打开标准面板,可以看出Adobe Acrobat Pro把这个文件认为是PDF/A-1A和PDF/UA-1,但是这次并没有验证符合性链接,所以我需要借助于印前检查工具(英文版的是Preflight,晕,中文版的找了半天才找到,我在这里就分享给大家吧,估计大家都是用的中文,具体步骤为:打开工具里面的PDF标准→印前检查(或者直接左边点击打开印前检查)→找到PDF/A规范下面的PDF/A-1b规范→分析 ),如下图5:
图5. 印前检查工具查看验证符合性连接
我们继续看英文版的那张图,可以看出来结果是没有发现任何错误。我们无法验证PDF/UA符合性,因为PDF/UA涉及一些无法通过本地计算机验证的要求。例如:如果我们将狐狸形象的描述与狗的形象描述交换,机器就不会注意到。这将使文件无法访问,因为文件会根据屏幕阅读器向人们传播虚假信息。无论如何,只需知道我们创建文档不符合PDF/UA标准,因为我们省略了一些基本要素(如语言,第一个例子里面就同时设置了语言)。
从一开始就确定ISO 19005的认可部分永远不会失效。新的,后续的部分只会定义新的有用的功能。这些后续定义的就是我们即将介绍的PDF/A-2和PDF/A-3。
创建PDF/A文档 PDF/A-2和PDF/A-3
ISO 19005-2:2011 (PDF/A-2)是根据ISO标准(而不是Adobe的PDF官方文档)被添加到PDF/A标准中的。PDF/A-2在PDF1.5,1.6.1.7中很多特性和提升:
有用的添加功能有:JPEG2000的支持,容器,对象级XMP和可选内容
有用的提升改进有:对透明、类型注释、注释和数字签名有更好的支持。
PDF/A-2在符合性方面,除了原有的Level A和Level B以外,还定义了额外的level:
Level U(“Unicode”):确保文档的视觉外贸能长久保存,并且所有的文本的存储格式为UNICODE
ISO 19005-3 :2012 (PDF/A-3)几乎与PDF/A-2一毛一样。唯一的区别就是:在PDF/A-3中,附件不需要一定是PDF/A格式的。你可以把任何格式的文件当前是PFA/A-3的附件,例如可以把一个excel格式的文件当作是这个文档用到的结果,一个word格式文件用来创建一个PDF文档,等等。文档本身需要符合PDF/A规范的所有义务和限制,但这些义务和限制不适用于其附件。
在下面的例子中,我们会创建同时符合PDF/UA和PDF/A-3A标准,我们之所以会选择PDF/A-3,是因为要用到CSV文件来创建PDF,代码如下:
PdfADocument pdf = new PdfADocument(new PdfWriter(dest),
PdfAConformanceLevel.PDF_A_3A,
new PdfOutputIntent("Custom", "", "http://www.color.org",
"sRGB IEC61966-2.1", new FileInputStream(INTENT)));
Document document = new Document(pdf, PageSize.A4.rotate());
//Setting some required parameters
pdf.setTagged();
pdf.getCatalog().setLang(new PdfString("en-US"));
pdf.getCatalog().setViewerPreferences(
new PdfViewerPreferences().setDisplayDocTitle(true));
PdfDocumentInfo info = pdf.getDocumentInfo();
info.setTitle("iText7 PDF/A-3 example");
//Add attachment
PdfDictionary parameters = new PdfDictionary();
parameters.put(PdfName.ModDate, new PdfDate().getPdfObject());
PdfFileSpec fileSpec = PdfFileSpec.createEmbeddedFileSpec(
pdf, Files.readAllBytes(Paths.get(DATA)), "united_states.csv",
"united_states.csv", new PdfName("text/csv"), parameters,
PdfName.Data, false);
fileSpec.put(new PdfName("AFRelationship"), new PdfName("Data"));
pdf.addFileAttachment("united_states.csv", fileSpec);
PdfArray array = new PdfArray();
array.add(fileSpec.getPdfObject().getIndirectReference());
pdf.getCatalog().put(new PdfName("AF"), array);
//Embed fonts
PdfFont font = PdfFontFactory.createFont(FONT, true);
PdfFont bold = PdfFontFactory.createFont(BOLD_FONT, true);
// Create content
Table table = new Table(new float[]{4, 1, 3, 4, 3, 3, 3, 3, 1});
table.setWidthPercent(100);
BufferedReader br = new BufferedReader(new FileReader(DATA));
String line = br.readLine();
process(table, line, bold, true);
while ((line = br.readLine()) != null) {
process(table, line, font, false);
}
br.close();
document.add(table);
//Close document
document.close();
让我们逐行解释代码:
行1-5:我们创建了PdfADocument
(类型为PdfAConformanceLevel.PDF_A_3A)
)和Document
行7:让PDF变成带标签的PDF——PDF/UA和PDF/A-3A标准。
行8-12:设置语言,文档标题和查看器首选项——PDF/UA标准。
行14-20:使用特定的参数来添加一个附件——PDF/A-3A标准。
行26-27:嵌入图片和字体——PDF/UA和PDF/A-3A标准。
行28-38:提取内容和我们之前第1章的代码一样的。
行30:关闭文档,保存内容
如下图6,我们可以看到我们用Table
和Cell
对象添加到文档里在标签面板里面,被保存了Table数据结构了,有点像HTML:
图6. 一篇PDF/A-3A标准的文档
同时,我们打开附件面板,我们可以看见CSV源文件,并且可以轻松提取出来,如下图7:
图7. 一篇PDF/A-3A标准文档和它的附件
通过上述的例子,与一般的PDF文件相比,我们创建符合PDF/UA或者PDF/A文档的时候需要添加另外的信息,*“我们是否能用iText改把现有的普通的PDF文档转换成符合PDF/UA或者PDF/A标准的文档呢?”*是在论坛和咨询里面问得最多的问题。我们希望通过这一章让大家明白iText是不能自动转换的,原因如下:
如果和之前一样有一个文档有一张fox和一张dog图片,iText不能自动给图片添加缺失的替换描述信息,因为iText不能准备识别这些图片的含义(说白了就是没有机器学习、人工智能模块,不能识别内容)
如果字体没有被嵌入,而且并没有提供相应的字体程序的的话,iText并不会知道字体长成什么样,也不能把字体嵌入到文档中。
当然这只是不能自动转换的两个小原因。让一个PDF展示小蓝条说这个文档貌似符合PDF/A标准是很容易,但是并不是所有的声明都是正确的。 最后,我们来看看PDF/A文档的拼接。
拼接PDF/A文档
当拼接PDF/A文件的时候,最值得我们注意的是,我们拼接的各个文档必须都是PDF/A文件,不能一个是PDF/A文件,一个是普通文件,而且PDF/A的Level也要一样,不能一个是A,一个是B,因为一个有结构树,一个没有,拼接在一起会导致结果错误。
我们把之前两个PDF/A A级的文档拼接起来,生成的文件如下图8所示:
图8. 拼接2篇PDF/A-A
通过标签面板我们看到一个
,紧接着是,如下代码展示了如何创建这个文档:
PdfADocument pdf = new PdfADocument(new PdfWriter(dest),
PdfAConformanceLevel.PDF_A_1A,
new PdfOutputIntent("Custom", "", "http://www.color.org",
"sRGB IEC61966-2.1", new FileInputStream(INTENT)));
//Setting some required parameters
pdf.setTagged();
pdf.getCatalog().setLang(new PdfString("en-US"));
pdf.getCatalog().setViewerPreferences(
new PdfViewerPreferences().setDisplayDocTitle(true));
PdfDocumentInfo info = pdf.getDocumentInfo();
info.setTitle("iText7 PDF/A-1a example");
//Create PdfMerger instance
PdfMerger merger = new PdfMerger(pdf);
//Add pages from the first document
PdfDocument firstSourcePdf = new PdfDocument(new PdfReader(SRC1));
merger.addPages(firstSourcePdf, 1, firstSourcePdf.getNumberOfPages());
//Add pages from the second pdf document
PdfDocument secondSourcePdf = new PdfDocument(new PdfReader(SRC2));
merger.addPages(secondSourcePdf, 1, secondSourcePdf.getNumberOfPages());
//Merge
merger.merge();
//Close the documents
firstSourcePdf.close();
secondSourcePdf.
整体上,这段代码可以说和之前的例子很像:
行1-11就不说了,和之前的代码没什么区别。
行12-25的话,在上一章奥斯卡奖项拼接的例子中有提及,创建PdfMerger
的时候,我们传入的是PdfADocument
对象,之后往这个PdfMerger
对象添加的是PdfDocument
类型的,如果是PdfADocument
类型的话,会检查文档的合法性。
关于PDF/UA和PDF/A标准还有很多讨论,当然还有其他子标准,例如在PDF/A-3中有一个德语发音的ZUGFeRD的标准,会在别的系列里面讲述(这个是官方文档里面说的,个人的话看需求喽,如果有时间我就开这个坑)
总结
在本章,我们探讨了符合其他PDF标准的文档的创建和拼接,学会了创建PDF/UA和PDF/A的文档,本系列也就在此结束了,当然我们还需要一些其他的系列来深入的了解iText7。
itext7学习笔记就到这里结束了,不过itext7还会出其他的系列,比如现在的itext7学习笔记杂谈系列,而且itext7官网上还有很多example和文章,同时我也会更加注重文章的格式和内容,精益求精,请大家继续支持我的itext7系列,看完文章不忘关注和点赞一波~
你可能感兴趣的:(iText,java,itext7学习笔记)
快速启动flink项目
for your wish
flink java 大数据
按照这个步骤1分钟内创建完成idea-----File----new---Project------Maven----Createfromarchetype----AddArchetype弹出框:GroupId填org.apache.flinkArtifactId填flink-quickstart-javaVersion填1.14.0选中刚刚添加的Archetype,点Next填写你要创建的这个f
SpringBoot可以同时处理多少请求?
java1234_小锋
java java 开发语言
大家好,我是锋哥。今天分享关于【SpringBoot可以同时处理多少请求?】面试题。希望对大家有帮助;SpringBoot可以同时处理多少请求?1000道互联网大厂Java工程师精选面试题-Java资源分享网SpringBoot本身并不直接限制可以处理的请求数量,能处理多少请求取决于几个因素,主要是底层的Web服务器(如嵌入式的Tomcat、Jetty或Undertow),以及服务器硬件、操作系统
说说你对Java里Integer缓存的理解?
java1234_小锋
java java 开发语言
大家好,我是锋哥。今天分享关于【说说你对Java里Integer缓存的理解?】面试题。希望对大家有帮助;说说你对Java里Integer缓存的理解?1000道互联网大厂Java工程师精选面试题-Java资源分享网Java中的Integer缓存是为了提高性能而引入的优化机制,特别是对于频繁使用的小范围整数的情况。具体来说,Integer类对从-128到127范围内的整数值做了缓存。这些整数值被缓存起
java常用数据转换
bestwinner
java python windows
1.List与数组互转ArrayListlist=newArrayListlist1=Arrays.stream(array1).collect(Collectors.toList());String[]cateArray=cateList.toArray(newString[cateList.size()]);2.new集合对像importcom.google.common.collect.Li
开发实战|commons-lang3库的字符串工具类join方法
六月暴雪飞梨花
commons-lang3 StringUtils String join
作者简介:「六月暴雪飞梨花」,专注于研究Java,就职于科技型公司后端工程师近期荣誉:华为云云享专家、阿里云专家博主、腾讯云优秀创作者、腾讯云TDP-KOL、ACDU成员、墨天轮技术专家博主三连支持:欢迎❤️关注、点赞、收藏三连,支持一下博主~文章目录引言来源StringUtils.joinString.join功能对比StringUtils.join支持原生数组支持集合支持迭代器Iterator
[解决] PDF转图片,中文乱码或显示方框的解决方案
DazedMen
开发遇到的问题 pdf java pdf转图片
在Java开发中,将PDF文件转换为图片是一项常见的需求,但过程中可能会遇到中文乱码或显示方框的问题。本文将深入探讨这一问题,并提供详细的解决方案,帮助开发者顺利地完成PDF到图片的转换。一、问题现象在使用Java库(如ApachePDFBox)将PDF转换为图片时,如果PDF文件中包含中文字符,转换后的图片中可能会出现中文乱码或显示为方框的情况。控制台日志可能会显示类似以下信息:noglyphf
MyBatis 中 resultType 的使用详解
旧故新长
windows
MyBatis中resultType的使用详解1.resultType的含义在MyBatis中,resultType指的是每一行查询结果的Java类型,而不是整个结果集的类型。常见的用法:resultType="java.lang.String":表示每一行是一个字符串。resultType="com.example.User":表示每一行是一个User对象。2.resultType与方法返回值类
java Spring Boot ruoyi-vue-pro 模型接入微软 OpenAI(chatgpt)方法
代码简单说
开发必备 2025开发必备 java若依 ruoyi教程 java spring boot vue.js ruoyi-vue-pro openai chatgpt 大模型
javaSpringBootruoyi-vue-pro模型接入微软OpenAI方法本项目基于SpringAI提供的spring-ai-azure-openai,实现与微软Azure上部署的OpenAI的接入,涵盖AI对话和AI绘画功能。1.申请密钥1.1AzureAPI申请在微软AzureAI申请。社区小伙伴提供过密钥接入,申请流程应不复杂。申请完成后会得到类似模型列表(如图)。购买完成后,在系统
13 异常处理的使用大全
希望_睿智
C++基础知识精讲 c++ windows c语言 开发语言 异常处理
概述异常是指程序在执行的过程中,没有按照预定的流程和逻辑去运行,从而导致数组越界、内存溢出、甚至程序崩溃等各种非正常的情况。在C++、Java和C#等高级语言中,都提供了对于异常的处理机制。异常处理,实际上是一种转移程序控制权的方式。当程序中抛出了异常时,我们可以捕获异常,进而进行相应的处理。处理模型一般有两种:一种是终止模型,表示该异常是致命的,无法恢复,会直接终止程序;另一种是恢复模型,表示该
Node.js 格式化时间的两种方法:原生 Date 与 npm 包 moment 详解
还是鼠鼠
node.js node.js npm 前端 javascript vscode
目录Node.js格式化时间的两种做法:内置方法与npm包1.使用JavaScript内置方法格式化时间示例:使用Date对象格式化时间运行程序示例输出原理解析2.使用npm包moment进行时间格式化安装moment示例:使用moment格式化时间运行程序示例输出原理解析3.两种方法的对比4.结论在Node.js开发中,格式化时间是一个常见的需求。例如,将时间格式化为YYYY-MM-DDHH:m
day11 学习笔记
豆豆
学习 笔记 python
文章目录前言一、类方法二、静态方法三、构造方法四、魔术方法前言通过今天的学习,我掌握了更多Python中有关面向对象编程思想中方法的概念与操作,包括类方法,静态方法,构造方法,魔术方法一、类方法类方法是属于类的行为,一般使用类而非对象进行调用类方法需要使用@classmethod装饰器定义类方法至少有一个形参用于绑定类,约定为cls类和该类的实例都可以调用类方法,但一般不用实例进行调用类方法不能访
java NIO中的FileSystems工具类可以读取本地文件系统,ZIP/JAR等,无需解压处理,还可以复制文件
爱的叹息
Java 基础整理 java nio jar
在JavaNIO(java.nio.file包)中,FileSystems是一个工具类,用于操作和管理文件系统。它提供了静态方法来获取或创建文件系统实例,并支持自定义文件系统实现。以下是其核心功能和用法:1.核心功能(1)获取默认文件系统获取当前运行环境的默认文件系统(如本地文件系统):FileSystemfileSystem=FileSystems.getDefault();(2)创建新的文件系
没有好的学历,Java开发未来的路应该怎么走?
全干程序员demo
技术热文 java 开发语言
没有好的学历,Java开发未来的路应该怎么走?在当今数字化时代,技术发展日新月异,大模型应用、鸿蒙系统等新兴技术领域正在蓬勃发展,为Java开发者带来了新的机遇和挑战。即使没有高学历,Java开发者依然可以通过以下路径在这些新兴领域找到自己的发展方向,实现职业突破。一、拥抱新兴技术,拓宽技术边界(一)大模型应用:从开发到优化大模型技术正在重塑软件开发的各个环节。对于Java开发者来说,可以从以下几
如何区别原生页面和H5页面
大汉堡玩测试
功能测试
文章目录前言原生开发特点H5开发特点混合开发怎么区别是原生还是H5总结前言软件采用混合开发的模式时,测试发现了bug找开发沟通有时会找错人,明明是H5模块的错误却找了负责原生模块的开发,显得很不专业~那在测试时该如何区分是原生的报错还是H5报错呢?原生开发原生开发(NativeApp开发),是为特定操作系统(如iOS使用Objective-C/Swift、安卓使用Java/Kotlin)专门开发的
JavaScript 中的性能优化:从基础到高级技巧
lina_mua
深入 javascript 性能优化 开发语言
1.引言1.1性能优化的重要性在现代前端开发中,性能优化是提升用户体验的关键。无论是页面加载速度、交互响应时间,还是内存占用,性能优化都能显著提升应用的流畅度和用户满意度。1.2本文的目标本文旨在深入探讨JavaScript中的性能优化,从基础到高级技巧,帮助开发者理解性能优化的核心概念,并掌握其在实际开发中的应用。2.性能优化的基础2.1什么是性能优化?性能优化是指通过改进代码、减少资源消耗、优
VsCode配置JDK\Tomcat\Maven
Yang___Xing
javascript VsCode Java java vscode tomcat
1、安装VsCode下载地址:VisualStudioCode-CodeEditing.Redefined安装提示安装完成即可2、安装JDK下载地址:JavaDownloads|Oracle选择版本:按照需求自行选择配置JAVA_HOMEMac的修改mac的打开终端,输入open~/.zshrc新增exportPATH="/yourpath/jdk-1.8.jdk/Contents/Home/bi
【JavaEE】Mybatis 简单启动
鸽鸽程序猿
JavaEE java-ee mybatis 数据库
目录一、Mybatis简介二、MyBatis⼊⻔2.1创建项目2.2准备数据2.3配置文件2.4实体类2.5执行结果一、Mybatis简介Mybatis是一个操作数据库驱动的持久层框架,用来简化JDBC操作的,SpringBoot集成了这个框架。MyBatis本是Apache的⼀个开源项⽬iBatis,2010年这个项⽬由apache迁移到了googlecode,并且改名为MyBatis。2013
JavaScript 模块化语法 import、export详解
qq39138814
javascript 开发语言 ecmascript
JavaScript模块化语法import、export详解1.为什么需要模块化?在JavaScript早期,所有代码都是写在一个全局作用域中,这样做的问题是:变量污染:所有变量、函数都是全局的,容易互相干扰。文件依赖管理困难:多个JS文件之间的依赖关系混乱,难以维护。代码复用困难:无法方便地拆分和复用代码。为了解决这些问题,模块化方案应运而生。2.JavaScript模块化的发展2.1早期的模块
SpringBoot配置文件加载优先级
不修×蝙蝠
spring boot 后端 java 优先级
在SpringBoot项目中,配置属性的优先级是一个重要的概念,它决定了当存在多个配置源时,哪个配置源的属性将被应用。以下是SpringBoot中配置属性的优先级,从最高到最低:命令行参数:命令行参数具有最高的优先级。SpringBoot项目被启动时,可以通过命令行传递参数,这些参数将覆盖其他所有配置源中的相同属性。java-jaryour-application.jar--spring.data
SpringMVC系列之整合Thymeleaf【Thymeleaf整合springmvc介绍及Thymeleaf基础概念、使用语法详解】
吕鑫洋
SpringMVC系列 java html js spring mvc
Thymeleaf是java的模板引擎,可以将动态页面静态化;目前使用较多的模板引擎:Velocity、Freemarker、Thymeleaf一、Maven依赖Thymeleaf整合springmvc共需要两个jar:1.thymeleaf2.thymeleaf-spring5org.thymeleafthymeleaf3.0.9.RELEASEorg.thymeleafthymeleaf-sp
day01-基本查询
elasticsearch
day011.index3条docPUTbooks/_doc/1{"title":"EffectiveJava","author":"JoshuaBloch","release_date":"2001-06-01","amazon_rating":4.7,"best_seller":true,"prices":{"usd":9.95,"gbp":7.95,"eur":8.95}}PUTbooks/
JavaScript对象全解析:从宿主到内置,深入理解对象分类
码农的时光故事
前端 javascript
一、JavaScript对象全景图JavaScript对象系统远比表面看起来复杂,我们可以将其分为以下五大类:类别描述示例宿主对象由运行环境提供的对象(如浏览器中的DOM)window、document固有对象标准规定随运行时自动创建的基础对象Array、Date原生对象通过内置构造器创建的特权对象newArray()、newMap()普通对象用户创建的常规对象{}、newObject()特殊行为
JAVA学习-练习试用Java实现“对大数据集中的网络日志进行解析和异常行为筛查”
守护者170
java学习 java 学习
问题:编写一个Spark程序,对大数据集中的网络日志进行解析和异常行为筛查。解答思路:下面是一个简单的Spark程序示例,用于解析网络日志并筛查异常行为。这个示例假设日志文件格式如下:timestamp,ip_address,user_id,action,event,extra_info2023-01-0112:00:00,192.168.1.1,123,login,success,none202
JAVA学习-练习试用Java实现“实现一个Spark应用,对大数据集中的文本数据进行情感分析和关键词筛选”
守护者170
java学习 java 学习
问题:实现一个Spark应用,对大数据集中的文本数据进行情感分析和关键词筛选。解答思路:要实现一个Spark应用,对大数据集中的文本数据进行情感分析和关键词筛选,需要按照以下步骤进行:1.环境准备确保的环境中已经安装了ApacheSpark。可以从[ApacheSpark官网](https://spark.apache.org/downloads.html)下载并安装。2.创建Spark应用以下是
ROS CDK魔法书:建立你的游戏王国(JavaScript篇)
阿里云CloudOps
资源编排 ROS 游戏 javascript 开发语言 阿里云 ROS CDK
引言在虚拟游戏的世界里,数字化的乐趣如同流动的音符,谱写着无数玩家的共同回忆。而在这片充满创意与冒险的乐园中,您的使命就是将独特的游戏体验与丰富的技术知识相结合,打造出令人难以忘怀的作品。当面对如何实现这一宏伟蓝图时,您或许会想:如何将一款简单而富有趣味的游戏部署到云端,使更多玩家共享这份乐趣?别担心,现在您手中握有一把开启无限可能的大门钥匙——阿里云资源编排服务(ResourceOrchestr
ActiveMQ
z小天才b
ActiveMQ java-activemq activemq spring boot
一、ActiveMQ概述1.1什么是ActiveMQ?ActiveMQ是Apache软件基金会开发的一个开源消息中间件,它完全支持JMS(Java消息服务)规范,并提供了高可用性、高性能和可扩展性。ActiveMQ允许不同的应用程序通过消息传递进行异步通信,从而实现系统解耦。1.2ActiveMQ核心特性多协议支持:支持OpenWire、STOMP、AMQP、MQTT等多种协议持久化:支持多种持久
leetcode刷题(javaScript)——栈、单调栈相关场景题总结
三月的一天
Leetcode刷题技巧总结 javascript leetcode linux
在LeetCode刷题中,栈是一个常用的数据结构,可以帮助解决很多问题。以下是一些需要使用栈的方法,以及单调栈的应用场景:栈的使用技巧:栈常用于解决与括号匹配相关的问题,如括号序列的有效性、最长有效括号等。栈也常用于解决逆波兰表达式、表达式求值等与计算相关的问题。栈可以用于解决深度优先搜索(DFS)中的回溯问题,如组合、排列等。栈还可以用于解决某些需要“后进先出”(LIFO)特性的问题,如某些遍历
JVM OOM问题如何排查和解决
昔我往昔
jvm jvm
在Java开发中,JVMOOM(OutOfMemoryError)问题通常是指程序运行时,JVM无法为对象分配足够的内存空间,导致发生内存溢出的错误。这个问题往往和内存的配置、内存泄漏、或者资源过度使用等因素有关。1.OOM错误类型JVM中的OOM错误主要包括以下几种类型:java.lang.OutOfMemoryError:Javaheapspace:堆内存不足。堆内存用于存储对象,发生此错误时
Node.js技术原理分析系列6——基于 V8 封装一个自己的 JavaScript 运行时
前端node.js
Node.js是一个开源的、跨平台的JavaScript运行时环境,它允许开发者在服务器端运行JavaScript代码。Node.js是基于ChromeV8引擎构建的,专为高性能、高并发的网络应用而设计,广泛应用于构建服务器端应用程序、网络应用、命令行工具等。本系列将分为9篇文章为大家介绍Node.js技术原理:从调试能力分析到内置模块新增,从性能分析工具perf_hooks的用法到ChromeD
使用spring data MongoDB对MongoDB进行简单CURD操作示例
其实我就是个萌新
spring mongodb java
本文章为作者个人学习笔记,仅作参考。1.application.properties配置spring.data.mongodb.database=[数据库名]spring.data.mongodb.host=localhost[主机名,本机:localhost]spring.data.mongodb.port=[数据库端口,默认:27017]2.根据数据库文档定义实体类:@RequiredArgs
Java实现的基于模板的网页结构化信息精准抽取组件:HtmlExtractor
yangshangchuan
信息抽取 HtmlExtractor 精准抽取 信息采集
HtmlExtractor是一个Java实现的基于模板的网页结构化信息精准抽取组件,本身并不包含爬虫功能,但可被爬虫或其他程序调用以便更精准地对网页结构化信息进行抽取。
HtmlExtractor是为大规模分布式环境设计的,采用主从架构,主节点负责维护抽取规则,从节点向主节点请求抽取规则,当抽取规则发生变化,主节点主动通知从节点,从而能实现抽取规则变化之后的实时动态生效。
如
java编程思想 -- 多态
百合不是茶
java 多态详解
一: 向上转型和向下转型
面向对象中的转型只会发生在有继承关系的子类和父类中(接口的实现也包括在这里)。父类:人 子类:男人向上转型: Person p = new Man() ; //向上转型不需要强制类型转化向下转型: Man man =
[自动数据处理]稳扎稳打,逐步形成自有ADP系统体系
comsci
dp
对于国内的IT行业来讲,虽然我们已经有了"两弹一星",在局部领域形成了自己独有的技术特征,并初步摆脱了国外的控制...但是前面的路还很长....
首先是我们的自动数据处理系统还无法处理很多高级工程...中等规模的拓扑分析系统也没有完成,更加复杂的
storm 自定义 日志文件
商人shang
storm cluster logback
Storm中的日志级级别默认为INFO,并且,日志文件是根据worker号来进行区分的,这样,同一个log文件中的信息不一定是一个业务的,这样就会有以下两个需求出现:
1. 想要进行一些调试信息的输出
2. 调试信息或者业务日志信息想要输出到一些固定的文件中
不要怕,不要烦恼,其实Storm已经提供了这样的支持,可以通过自定义logback 下的 cluster.xml 来输
Extjs3 SpringMVC使用 @RequestBody 标签问题记录
21jhf
springMVC使用 @RequestBody(required = false) UserVO userInfo
传递json对象数据,往往会出现http 415,400,500等错误,总结一下需要使用ajax提交json数据才行,ajax提交使用proxy,参数为jsonData,不能为params;另外,需要设置Content-type属性为json,代码如下:
(由于使用了父类aaa
一些排错方法
文强chu
方法
1、java.lang.IllegalStateException: Class invariant violation
at org.apache.log4j.LogManager.getLoggerRepository(LogManager.java:199)at org.apache.log4j.LogManager.getLogger(LogManager.java:228)
at o
Swing中文件恢复我觉得很难
小桔子
swing
我那个草了!老大怎么回事,怎么做项目评估的?只会说相信你可以做的,试一下,有的是时间!
用java开发一个图文处理工具,类似word,任意位置插入、拖动、删除图片以及文本等。文本框、流程图等,数据保存数据库,其余可保存pdf格式。ok,姐姐千辛万苦,
php 文件操作
aichenglong
PHP 读取文件 写入文件
1 写入文件
@$fp=fopen("$DOCUMENT_ROOT/order.txt", "ab");
if(!$fp){
echo "open file error" ;
exit;
}
$outputstring="date:"." \t tire:".$tire."
MySQL的btree索引和hash索引的区别
AILIKES
数据结构 mysql 算法
Hash 索引结构的特殊性,其 检索效率非常高,索引的检索可以一次定位,不像B-Tree 索引需要从根节点到枝节点,最后才能访问到页节点这样多次的IO访问,所以 Hash 索引的查询效率要远高于 B-Tree 索引。
可能很多人又有疑问了,既然 Hash 索引的效率要比 B-Tree 高很多,为什么大家不都用 Hash 索引而还要使用 B-Tree 索引呢
JAVA的抽象--- 接口 --实现
百合不是茶
抽象 接口 实现接口
//抽象 类 ,方法
//定义一个公共抽象的类 ,并在类中定义一个抽象的方法体
抽象的定义使用abstract
abstract class A 定义一个抽象类 例如:
//定义一个基类
public abstract class A{
//抽象类不能用来实例化,只能用来继承
//
JS变量作用域实例
bijian1013
作用域
<script>
var scope='hello';
function a(){
console.log(scope); //undefined
var scope='world';
console.log(scope); //world
console.log(b);
TDD实践(二)
bijian1013
java TDD
实践题目:分解质因数
Step1:
单元测试:
package com.bijian.study.factor.test;
import java.util.Arrays;
import junit.framework.Assert;
import org.junit.Before;
import org.junit.Test;
import com.bijian.
[MongoDB学习笔记一]MongoDB主从复制
bit1129
mongodb
MongoDB称为分布式数据库,主要原因是1.基于副本集的数据备份, 2.基于切片的数据扩容。副本集解决数据的读写性能问题,切片解决了MongoDB的数据扩容问题。
事实上,MongoDB提供了主从复制和副本复制两种备份方式,在MongoDB的主从复制和副本复制集群环境中,只有一台作为主服务器,另外一台或者多台服务器作为从服务器。 本文介绍MongoDB的主从复制模式,需要指明
【HBase五】Java API操作HBase
bit1129
hbase
import java.io.IOException;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.hbase.HBaseConfiguration;
import org.apache.hadoop.hbase.HColumnDescriptor;
import org.apache.ha
python调用zabbix api接口实时展示数据
ronin47
zabbix api接口来进行展示。经过思考之后,计划获取如下内容: 1、 获得认证密钥 2、 获取zabbix所有的主机组 3、 获取单个组下的所有主机 4、 获取某个主机下的所有监控项  
jsp取得绝对路径
byalias
绝对路径
在JavaWeb开发中,常使用绝对路径的方式来引入JavaScript和CSS文件,这样可以避免因为目录变动导致引入文件找不到的情况,常用的做法如下:
一、使用${pageContext.request.contextPath}
代码” ${pageContext.request.contextPath}”的作用是取出部署的应用程序名,这样不管如何部署,所用路径都是正确的。
Java定时任务调度:用ExecutorService取代Timer
bylijinnan
java
《Java并发编程实战》一书提到的用ExecutorService取代Java Timer有几个理由,我认为其中最重要的理由是:
如果TimerTask抛出未检查的异常,Timer将会产生无法预料的行为。Timer线程并不捕获异常,所以 TimerTask抛出的未检查的异常会终止timer线程。这种情况下,Timer也不会再重新恢复线程的执行了;它错误的认为整个Timer都被取消了。此时,已经被
SQL 优化原则
chicony
sql
一、问题的提出
在应用系统开发初期,由于开发数据库数据比较少,对于查询SQL语句,复杂视图的的编写等体会不出SQL语句各种写法的性能优劣,但是如果将应用系统提交实际应用后,随着数据库中数据的增加,系统的响应速度就成为目前系统需要解决的最主要的问题之一。系统优化中一个很重要的方面就是SQL语句的优化。对于海量数据,劣质SQL语句和优质SQL语句之间的速度差别可以达到上百倍,可见对于一个系统
java 线程弹球小游戏
CrazyMizzz
java 游戏
最近java学到线程,于是做了一个线程弹球的小游戏,不过还没完善
这里是提纲
1.线程弹球游戏实现
1.实现界面需要使用哪些API类
JFrame
JPanel
JButton
FlowLayout
Graphics2D
Thread
Color
ActionListener
ActionEvent
MouseListener
Mouse
hadoop jps出现process information unavailable提示解决办法
daizj
hadoop jps
hadoop jps出现process information unavailable提示解决办法
jps时出现如下信息:
3019 -- process information unavailable3053 -- process information unavailable2985 -- process information unavailable2917 --
PHP图片水印缩放类实现
dcj3sjt126com
PHP
<?php
class Image{
private $path;
function __construct($path='./'){
$this->path=rtrim($path,'/').'/';
}
//水印函数,参数:背景图,水印图,位置,前缀,TMD透明度
public function water($b,$l,$pos
IOS控件学习:UILabel常用属性与用法
dcj3sjt126com
ios UILabel
参考网站:
http://shijue.me/show_text/521c396a8ddf876566000007
http://www.tuicool.com/articles/zquENb
http://blog.csdn.net/a451493485/article/details/9454695
http://wiki.eoe.cn/page/iOS_pptl_artile_281
完全手动建立maven骨架
eksliang
java eclipse Web
建一个 JAVA 项目 :
mvn archetype:create
-DgroupId=com.demo
-DartifactId=App
[-Dversion=0.0.1-SNAPSHOT]
[-Dpackaging=jar]
建一个 web 项目 :
mvn archetype:create
-DgroupId=com.demo
-DartifactId=web-a
配置清单
gengzg
配置
1、修改grub启动的内核版本
vi /boot/grub/grub.conf
将default 0改为1
拷贝mt7601Usta.ko到/lib文件夹
拷贝RT2870STA.dat到 /etc/Wireless/RT2870STA/文件夹
拷贝wifiscan到bin文件夹,chmod 775 /bin/wifiscan
拷贝wifiget.sh到bin文件夹,chm
Windows端口被占用处理方法
huqiji
windows
以下文章主要以80端口号为例,如果想知道其他的端口号也可以使用该方法..........................1、在windows下如何查看80端口占用情况?是被哪个进程占用?如何终止等. 这里主要是用到windows下的DOS工具,点击"开始"--"运行",输入&
开源ckplayer 网页播放器, 跨平台(html5, mobile),flv, f4v, mp4, rtmp协议. webm, ogg, m3u8 !
天梯梦
mobile
CKplayer,其全称为超酷flv播放器,它是一款用于网页上播放视频的软件,支持的格式有:http协议上的flv,f4v,mp4格式,同时支持rtmp视频流格 式播放,此播放器的特点在于用户可以自己定义播放器的风格,诸如播放/暂停按钮,静音按钮,全屏按钮都是以外部图片接口形式调用,用户根据自己的需要制作 出播放器风格所需要使用的各个按钮图片然后替换掉原始风格里相应的图片就可以制作出自己的风格了,
简单工厂设计模式
hm4123660
java 工厂设计模式 简单工厂模式
简单工厂模式(Simple Factory Pattern)属于类的创新型模式,又叫静态工厂方法模式。是通过专门定义一个类来负责创建其他类的实例,被创建的实例通常都具有共同的父类。简单工厂模式是由一个工厂对象决定创建出哪一种产品类的实例。简单工厂模式是工厂模式家族中最简单实用的模式,可以理解为是不同工厂模式的一个特殊实现。
maven笔记
zhb8015
maven
跳过测试阶段:
mvn package -DskipTests
临时性跳过测试代码的编译:
mvn package -Dmaven.test.skip=true
maven.test.skip同时控制maven-compiler-plugin和maven-surefire-plugin两个插件的行为,即跳过编译,又跳过测试。
指定测试类
mvn test
非mapreduce生成Hfile,然后导入hbase当中
Stark_Summer
map hbase reduce Hfile path实例
最近一个群友的boss让研究hbase,让hbase的入库速度达到5w+/s,这可愁死了,4台个人电脑组成的集群,多线程入库调了好久,速度也才1w左右,都没有达到理想的那种速度,然后就想到了这种方式,但是网上多是用mapreduce来实现入库,而现在的需求是实时入库,不生成文件了,所以就只能自己用代码实现了,但是网上查了很多资料都没有查到,最后在一个网友的指引下,看了源码,最后找到了生成Hfile
jsp web tomcat 编码问题
王新春
tomcat jsp pageEncode
今天配置jsp项目在tomcat上,windows上正常,而linux上显示乱码,最后定位原因为tomcat 的server.xml 文件的配置,添加 URIEncoding 属性:
<Connector port="8080" protocol="HTTP/1.1"
connectionTi