http://www.yeeach.com/2008/05/19/htmlparser%E4%BD%BF%E7%94%A8%E6%8C%87%E5%8D%97/
HTML Parser is a Java library used to parse HTML in either a linear or nested fashion. Primarily used for transformation or extraction, it features filters, visitors, custom tags and easy to use JavaBeans. It is a fast, robust and well tested package.
The two fundamental use-cases that are handled by the parser are extraction and transformation (the syntheses use-case, where HTML pages are created from scratch, is better handled by other tools closer to the source of data). While prior versions concentrated on data extraction from web pages, Version 1.4 of the HTMLParser has substantial improvements in the area of transforming web pages, with simplified tag creation and editing, and verbatim toHtml() method output.
研究的重点还是extraction的使用,有空再研究transformation的使用。
1、htmlparser对html页面处理的数据结构
如图所示,HtmlParser采用了经典的Composite模式,通过RemarkNode、TextNode、TagNode、AbstractNode和Tag来描述HTML页面各元素。
Node接口定义了进行树形结构节点操作的各种典型操作方法,包括:
节点到html文本、text文本的方法 :toPlainTextString、toHtml
典型树形结构遍历的方法 :getParent、getChildren、getFirstChild、getLastChild、getPreviousSibling、getNextSibling、getText
获取节点对应的树形结构结构的顶级节点Page对象方法 :getPage
获取节点起始位置的方法 :getStartPosition、getEndPosition
Visitor方法遍历节点时候方法 :accept (NodeVisitor visitor)
Filter方法 :collectInto (NodeList list, NodeFilter filter)
Object方法 :toString、clone
org.htmlparser.nodes.AbstractNode :
AbstractNode是形成HTML树形结构抽象基类,实现了Node接口。
在htmlparser中,Node分成三类:
RemarkNode :代表Html中的注释
TagNode :标签节点。
TextNode :文本节点
这三类节点都继承AbstractNode。
org.htmlparser.nodes.TagNode:
TagNode包含了对HTML处理的核心的各个类,是所有TAG的基类,其中有分为包含其他TAG的复合节点ComositeTag和不包含其他TAG的叶子节点Tag。
复合节点CompositeTag:
AppletTag,BodyTag,Bullet,BulletList,DefinitionList,DefinitionListBullet,Div,FormTag,FrameSetTag,HeadingTag,
HeadTag,Html,LabelTag,LinkTag,ObjectTag,ParagraphTag,ScriptTag,SelectTag,Span,StyleTag,TableColumn,
TableHeader,TableRow,TableTag,TextareaTag,TitleTag
叶子节点TAG:
BaseHrefTag,DoctypeTag,FrameTag,ImageTag,InputTag,JspTag,MetaTag,ProcessingInstructionTag,
2、htmlparser对html页面处理的算法
主要是如下几种方式
try { Parser parser = new Parser(); parser.setURL(”http://www.google.com”); parser.setEncoding(parser.getEncoding()); NodeVisitor visitor = new NodeVisitor() { public void visitTag(Tag tag) { logger.fatal(”testVisitorAll() Tag name is :” + tag.getTagName() + ” /n Class is :” + tag.getClass()); }
};
parser.visitAllNodesWith(visitor); } catch (ParserException e) { e.printStackTrace(); }
try {
NodeFilter filter = new NodeClassFilter(LinkTag.class); Parser parser = new Parser(); parser.setURL(”http://www.google.com”); parser.setEncoding(parser.getEncoding()); NodeList list = parser.extractAllNodesThatMatch(filter); for (int i = 0; i < list.size(); i++) { LinkTag node = (LinkTag) list.elementAt(i); logger.fatal(”testLinkTag() Link is :” + node.extractLink()); } } catch (Exception e) { e.printStackTrace(); }
另外htmlparser 还在org.htmlparser.beans中对一些常用的方法进行了封装,以简化操作,例如:
Parser parser = new Parser();
LinkBean linkBean = new LinkBean(); linkBean.setURL(”http://www.google.com”); URL[] urls = linkBean.getLinks();
for (int i = 0; i < urls.length; i++) { URL url = urls[i]; logger.fatal(”testLinkBean() -url is :” + url); }
3、htmlparser关键包结构说明
htmlparser其实核心代码并不多,好好研究一下其代码,弥补文档不足的问题。同时htmlparser的代码注释和单元测试用例还是很齐全的,也有助于了解htmlparser的用法。
3.1、org.htmlparser
定义了htmlparser的一些基础类。其中最为重要的是Parser类。
Parser是htmlparser的最核心的类,其构造函数提供了如下:Parser.createParser (String html, String charset)、 Parser ()、Parser (Lexer lexer, ParserFeedback fb)、Parser (URLConnection connection, ParserFeedback fb)、Parser (String resource, ParserFeedback feedback)、 Parser (String resource)
各构造函数的具体用法及含义可以查看其代码,很容易理解。
Parser常用的几个方法:
Parser parser = new Parser (”http://www.google.com”); for (NodeIterator i = parser.elements (); i.hasMoreElements (); ) processMyNodes (i.nextNode ());
parse (NodeFilter filter):通过NodeFilter方式获取
visitAllNodesWith (NodeVisitor visitor):通过Nodevisitor方式
extractAllNodesThatMatch (NodeFilter filter):通过NodeFilter方式
3.2、org.htmlparser.beans
对Visitor和Filter的方法进行了封装,定义了针对一些常用html元素操作的bean,简化对常用元素的提取操作。
包括:FilterBean、HTMLLinkBean、HTMLTextBean、LinkBean、StringBean、BeanyBaby等。
3.3、org.htmlparser.nodes
定义了基础的node,包括:AbstractNode、RemarkNode、TagNode、TextNode等。
3.4、org.htmlparser.tags
定义了htmlparser的各种tag。
3.5、org.htmlparser.filters
定义了htmlparser所提供的各种filter,主要通过extractAllNodesThatMatch (NodeFilter filter)来对html页面指定类型的元素进行过滤,包括:AndFilter、CssSelectorNodeFilter、 HasAttributeFilter、HasChildFilter、HasParentFilter、HasSiblingFilter、 IsEqualFilter、LinkRegexFilter、LinkStringFilter、NodeClassFilter、 NotFilter、OrFilter、RegexFilter、StringFilter、TagNameFilter、XorFilter
3.6、org.htmlparser.visitors
定义了htmlparser所提供的各种visitor,主要通过visitAllNodesWith (NodeVisitor visitor)来对html页面元素进行遍历,包括:HtmlPage、LinkFindingVisitor、NodeVisitor、 ObjectFindingVisitor、StringFindingVisitor、TagFindingVisitor、 TextExtractingVisitor、UrlModifyingVisitor
3.7、org.htmlparser.parserapplications
定义了一些实用的工具,包括LinkExtractor、SiteCapturer、StringExtractor、WikiCapturer,这几个类也可以作为htmlparser使用样例。
3.8、org.htmlparser.tests
对各种功能的单元测试用例,也可以作为htmlparser使用的样例。
4、htmlparser的使用样例
import java.net.URL;
import junit.framework.TestCase;
import org.apache.log4j.Logger; import org.htmlparser.Node; import org.htmlparser.NodeFilter; import org.htmlparser.Parser; import org.htmlparser.Tag; import org.htmlparser.beans.LinkBean; import org.htmlparser.filters.NodeClassFilter; import org.htmlparser.filters.OrFilter; import org.htmlparser.filters.TagNameFilter; import org.htmlparser.tags.HeadTag; import org.htmlparser.tags.ImageTag; import org.htmlparser.tags.InputTag; import org.htmlparser.tags.LinkTag; import org.htmlparser.tags.OptionTag; import org.htmlparser.tags.SelectTag; import org.htmlparser.tags.TableColumn; import org.htmlparser.tags.TableRow; import org.htmlparser.tags.TableTag; import org.htmlparser.tags.TitleTag; import org.htmlparser.util.NodeIterator; import org.htmlparser.util.NodeList; import org.htmlparser.util.ParserException; import org.htmlparser.visitors.HtmlPage; import org.htmlparser.visitors.NodeVisitor; import org.htmlparser.visitors.ObjectFindingVisitor;
public class ParserTestCase extends TestCase {
private static final Logger logger = Logger.getLogger(ParserTestCase.class);
public ParserTestCase(String name) { super(name); } /* * 测试ObjectFindVisitor的用法 */ public void testImageVisitor() { try { ImageTag imgLink; ObjectFindingVisitor visitor = new ObjectFindingVisitor( ImageTag.class); Parser parser = new Parser(); parser.setURL(”http://www.google.com”); parser.setEncoding(parser.getEncoding()); parser.visitAllNodesWith(visitor); Node[] nodes = visitor.getTags(); for (int i = 0; i < nodes.length; i++) { imgLink = (ImageTag) nodes[i]; logger.fatal(”testImageVisitor() ImageURL = ” + imgLink.getImageURL()); logger.fatal(”testImageVisitor() ImageLocation = ” + imgLink.extractImageLocn()); logger.fatal(”testImageVisitor() SRC = ” + imgLink.getAttribute(”SRC”)); } } catch (Exception e) { e.printStackTrace(); } } /* * 测试TagNameFilter用法 */ public void testNodeFilter() { try { NodeFilter filter = new TagNameFilter(”IMG”); Parser parser = new Parser(); parser.setURL(”http://www.google.com”); parser.setEncoding(parser.getEncoding()); NodeList list = parser.extractAllNodesThatMatch(filter); for (int i = 0; i < list.size(); i++) { logger.fatal(”testNodeFilter() ” + list.elementAt(i).toHtml()); } } catch (Exception e) { e.printStackTrace(); }
} /* * 测试NodeClassFilter用法 */ public void testLinkTag() { try {
NodeFilter filter = new NodeClassFilter(LinkTag.class); Parser parser = new Parser(); parser.setURL(”http://www.google.com”); parser.setEncoding(parser.getEncoding()); NodeList list = parser.extractAllNodesThatMatch(filter); for (int i = 0; i < list.size(); i++) { LinkTag node = (LinkTag) list.elementAt(i); logger.fatal(”testLinkTag() Link is :” + node.extractLink()); } } catch (Exception e) { e.printStackTrace(); }
} /* * 测试 用法 */ public void testLinkCSS() { try {
Parser parser = new Parser(); parser .setInputHTML(”
Link Test ”
+ “
”
+ “
”
+ “” + “”);
parser.setEncoding(parser.getEncoding());
NodeList nodeList = null;
for (NodeIterator e = parser.elements(); e.hasMoreNodes();) { Node node = e.nextNode(); logger .fatal(”testLinkCSS()” + node.getText() + node.getClass());
} } catch (Exception e) { e.printStackTrace(); } } /* * 测试OrFilter的用法 */ public void testOrFilter() { NodeFilter inputFilter = new NodeClassFilter(InputTag.class); NodeFilter selectFilter = new NodeClassFilter(SelectTag.class); Parser myParser; NodeList nodeList = null;
try { Parser parser = new Parser(); parser .setInputHTML(”
OrFilter Test ”
+ “
”
+ “
”
+ “”
+ “”
+ “
”
+ “
”
+ “
1 2 ”
+ “
yeeach.com ”
+ “”);
parser.setEncoding(parser.getEncoding()); OrFilter lastFilter = new OrFilter(); lastFilter.setPredicates(new NodeFilter[] { selectFilter, inputFilter }); nodeList = parser.parse(lastFilter); for (int i = 0; i <= nodeList.size(); i++) { if (nodeList.elementAt(i) instanceof InputTag) { InputTag tag = (InputTag) nodeList.elementAt(i); logger.fatal(”OrFilter tag name is :” + tag.getTagName() + ” ,tag value is:” + tag.getAttribute(”value”)); } if (nodeList.elementAt(i) instanceof SelectTag) { SelectTag tag = (SelectTag) nodeList.elementAt(i); NodeList list = tag.getChildren();
for (int j = 0; j < list.size(); j++) { OptionTag option = (OptionTag) list.elementAt(j); logger .fatal(”OrFilter Option” + option.getOptionText()); }
} }
} catch (ParserException e) { e.printStackTrace(); } } /* * 测试对
的解析
*/
public void testTable() {
Parser myParser;
NodeList nodeList = null;
myParser = Parser.createParser(” ” + “
” + “1-11 1-12 1-13 ” + “1-21 1-22 1-23 ” + “1-31 1-32 1-33
”
+ “
” + “2-11 2-12 2-13 ” + “2-21 2-22 2-23 ” + “2-31 2-32 2-33
”
+ “”, “GBK”);
NodeFilter tableFilter = new NodeClassFilter(TableTag.class);
OrFilter lastFilter = new OrFilter();
lastFilter.setPredicates(new NodeFilter[] { tableFilter });
try {
nodeList = myParser.parse(lastFilter);
for (int i = 0; i <= nodeList.size(); i++) {
if (nodeList.elementAt(i) instanceof TableTag) {
TableTag tag = (TableTag) nodeList.elementAt(i);
TableRow[] rows = tag.getRows();
for (int j = 0; j < rows.length; j++) { TableRow tr = (TableRow) rows[j]; TableColumn[] td = tr.getColumns(); for (int k = 0; k < td.length; k++) { logger.fatal(”
” + td[k].toPlainTextString()); }
}
} }
} catch (ParserException e) { e.printStackTrace(); } } /* * 测试NodeVisitor的用法,遍历所有节点 */ public void testVisitorAll() { try { Parser parser = new Parser(); parser.setURL(”http://www.google.com”); parser.setEncoding(parser.getEncoding()); NodeVisitor visitor = new NodeVisitor() { public void visitTag(Tag tag) { logger.fatal(”testVisitorAll() Tag name is :” + tag.getTagName() + ” /n Class is :” + tag.getClass()); }
};
parser.visitAllNodesWith(visitor); } catch (ParserException e) { e.printStackTrace(); } } /* * 测试对指定Tag的NodeVisitor的用法 */ public void testTagVisitor() { try {
Parser parser = new Parser( “
dddd ” + “ ” + “ ” + “” + “” + “yeeach.com ” + “”); NodeVisitor visitor = new NodeVisitor() { public void visitTag(Tag tag) { if (tag instanceof HeadTag) { logger.fatal(”visitTag() HeadTag : Tag name is :” + tag.getTagName() + ” /n Class is :” + tag.getClass() + “/n Text is :” + tag.getText()); } else if (tag instanceof TitleTag) { logger.fatal(”visitTag() TitleTag : Tag name is :” + tag.getTagName() + ” /n Class is :” + tag.getClass() + “/n Text is :” + tag.getText());
} else if (tag instanceof LinkTag) { logger.fatal(”visitTag() LinkTag : Tag name is :” + tag.getTagName() + ” /n Class is :” + tag.getClass() + “/n Text is :” + tag.getText() + ” /n getAttribute is :” + tag.getAttribute(”href”)); } else { logger.fatal(”visitTag() : Tag name is :” + tag.getTagName() + ” /n Class is :” + tag.getClass() + “/n Text is :” + tag.getText()); }
}
};
parser.visitAllNodesWith(visitor); } catch (Exception e) { e.printStackTrace(); } } /* * 测试HtmlPage的用法 */ public void testHtmlPage() { String inputHTML = “” + “
” + “Welcome to the HTMLParser website ” + “” + “” + “Welcome to HTMLParser” + “” + “1-11 1-12 1-13 ” + “1-21 1-22 1-23 ” + “1-31 1-32 1-33
” + “” + “2-11 2-12 2-13 ” + “2-21 2-22 2-23 ” + “2-31 2-32 2-33
” + “” + “”; Parser parser = new Parser(); try { parser.setInputHTML(inputHTML); parser.setEncoding(parser.getURL()); HtmlPage page = new HtmlPage(parser); parser.visitAllNodesWith(page); logger.fatal(”testHtmlPage -title is :” + page.getTitle()); NodeList list = page.getBody();
for (NodeIterator iterator = list.elements(); iterator .hasMoreNodes();) { Node node = iterator.nextNode(); logger.fatal(”testHtmlPage -node is :” + node.toHtml()); }
} catch (ParserException e) { // TODO Auto-generated catch block e.printStackTrace(); } } /* * 测试LinkBean的用法 */ public void testLinkBean() { Parser parser = new Parser();
LinkBean linkBean = new LinkBean(); linkBean.setURL(”http://www.google.com”); URL[] urls = linkBean.getLinks();
for (int i = 0; i < urls.length; i++) { URL url = urls[i]; logger.fatal(”testLinkBean() -url is :” + url); }
}
}
5、相关的项目
nekohtml :评价比htmlparser好,把html正规化标准的xml文档,用xerces处理,但文档较少。
mozilla htmlparser:http://www.dapper.net/网站采用的html解析器,开源了,基于mozilla的解析器,值得研究一下。
http://jerichohtml.sourceforge.net/
http://htmlcleaner.sourceforge.net/
http://html.xamjwg.org/cobra.jsp
http://jrex.mozdev.org/
https://xhtmlrenderer.dev.java.net
其他一些html parser可以参考相关的汇总文章:
http://www.manageability.org/blog/stuff/screen-scraping-tools-written-in-java/view
http://java-source.net/open-source/html-parsers
http://www.open-open.com/30.htm
6、参考文档
http://www.blogjava.net/lostfire/archive/2006/07/02/56212.html
http://blog.csdn.net/scud/archive/2005/08/11/451397.aspx
http://chasethedevil.blogspot.com/2006/05/java-html-parsing-example-with.html
http://javaboutique.internet.com/tutorials/HTMLParser/
你可能感兴趣的:(JAVA,stylesheet,filter,transformation,exception,html,table)
【python】pip 国内镜像源
叶阿猪
python python pip 开发语言
使用pip下载安装python第三方库的时候,经常会很慢,甚至报错。如下:pip._vendor.urllib3.exceptions.ReadTimeoutError:HTTPSConnectionPool(host='f而使用Python的镜像源(也称为国内安装源或PyPI镜像源)可以提高Python包(如numpy、pandas等)的安装速度和稳定性。Python的镜像源是在国内设置的代理服
Java中的异常及异常处理
Y1_again_0_again
Java java 开发语言
异常的概念异常是指在程序运行过程中发生的不正常事件,它会中断程序的正常执行流程。Java中的异常机制提供了一种结构化的方法来处理运行时错误,使程序能够优雅地处理错误情况而不是直接崩溃。例如,当试图访问空对象的成员时,会抛出NullPointerException;当数组索引超出范围时,会抛出ArrayIndexOutOfBoundsException。异常分类运行时异常(RuntimeExcept
Java 自定义函数详解
Y1_again_0_again
Java java 开发语言
基本概念Java自定义函数是指开发者根据特定需求自行编写的函数(也称为方法)。这些函数可以封装特定的功能逻辑,提高代码的复用性和可维护性。自定义函数是面向对象编程的核心组成部分。函数定义语法访问修饰符static函数返回值类型函数名(参数列表){函数体return返回值;//当函数返回值类型为void(表示返回值为空)时可以不写返回}主要组成部分访问修饰符:控制函数的可见性public:对所有类可
Java 数组的创建、取值、赋值
Y1_again_0_again
Java java 开发语言
一、一维数组1.1什么是一维数组一维数组是指仅包含一个维度的数据集合,类似于Excel表格中的单行数据,例如{1,2,3}。1.2在元素已知的情况下创建一维数组语法格式:数据类型[]数组名={值1,值2,值3,...};元素访问:通过数组下标获取元素,格式为数组名[数组下标]。需要注意的是,数组下标从0开始计数,即a[0]表示数组a的第一个元素,依此类推。示例1:创建一个整型一维数组,并输出其第1
微软商店中的工具合集应用
BinField
windows microsoft
ToolsSet是微软商店中的一款包含近百种实用工具的工具集合应用,细分功能达到数百种,详细功能列表及使用方法可以查看以下链接:Windows应用ToolsSet介绍https://iceskydev.github.io/AppDoc/tools/zh/ToolsSet.html工具主要分为六类:数值类、文本类、日期类、媒体类、其他类、在线工具数值类数值类功能包括:进制转换、数字和文本互转、单位转
ZooKeeper的使用和基于Curator的JavaAPI操作
Ruined_ofJoker
java-zookeeper zookeeper 数据库
Docker下使用ZooKeeper在/usr/local/zookeeper目录下保存ZooKeeper数据与数据卷卷cd/usr/local&&mkdirzookeeper&&cdzookeepermkdirdata开始部署部署命令dockerrun-d-eTZ="Asia/Shanghai"-p2181:2181-v$PWD/data:/data--namezookeeper--restar
互联网大厂Java求职面试:从虚拟线程到服务网格的架构演进与实战
在未来等你
Java场景面试宝典 Java 虚拟线程 Project Loom 直播架构 LangChain4j Spring AI 低代码平台
互联网大厂Java求职面试:从虚拟线程到服务网格的架构演进与实战面试现场:郑薪苦的技术冒险之旅面试官(推了推眼镜):郑先生,听说你对Java并发编程很有研究?能说说虚拟线程和ProjectLoom的关系吗?郑薪苦(挠头):啊,这个嘛…就像我打游戏时开了多开挂,一个账号能同时操作多个角色!虚拟线程就是让Java也能这样,用更少的系统资源跑更多的任务。面试官(嘴角抽搐):嗯…比喻倒是挺形象。那具体说说
Appcelerator打包ipa有哪些优势
咕噜企业签名分发-大圣
数据仓库
Appcelerator打包ipa的优势主要包括以下几点:一、跨平台开发能力Appcelerator为开发者提供了一种独特的跨平台开发解决方案,允许他们使用统一的JavaScript代码库来构建适用于iOS和Android等多个平台的应用程序。这种开发模式不仅大大简化了开发流程,还显著减少了开发时间和成本。开发者无需为每个平台分别编写和维护代码,从而避免了重复劳动和潜在的错误。此外,跨平台开发还意
互联网大厂Java面试实战:严肃面试官与搞笑谢飞机的三轮提问
Fu Dun Yao
Java场景面试宝典 Java 面试 JUC JVM 多线程 线程池 HashMap
互联网大厂Java面试实战:严肃面试官与搞笑谢飞机的三轮提问本文通过一个面试故事,展示了互联网大厂Java求职者与严肃面试官的对话。面试官就Java核心技术、JUC、JVM、多线程、线程池、HashMap、ArrayList、Spring及相关框架、分布式技术、消息队列、中间件、数据库、Linux、Docker、设计模式及DDD等多个技术点,分三轮提问。求职者谢飞机偶尔能准确回答简单问题获得认可,
互联网大厂Java求职面试:Java虚拟线程实战
在未来等你
Java场景面试宝典 AI 技术 编程 Java Spring
互联网大厂Java求职面试:Java虚拟线程实战文章内容开篇:技术总监与程序员郑薪苦的三轮对话在一场紧张而严肃的Java工程师面试中,技术总监张工正对候选人郑薪苦进行深入提问。郑薪苦虽然性格幽默,但对技术有着扎实的理解。今天的面试主题是Java虚拟线程(VirtualThreads),这是ProjectLoom项目的重要组成部分,也是当前Java并发模型的一次重大革新。第一轮提问:基础概念与核心思
java 2 图形设计卷i awt_JAVA2图形设计卷I:AWT 源代码 zip
尹云亮
java 2 图形设计卷i awt
【实例简介】JAVA2图形设计卷I:AWT源代码zip是机械工业出版社的那本书的源代码非常难得是时候拿点好的东西给大家分享了【实例截图】【核心代码】JAVA2图形设计卷I:AWT(原代码)└──SourceCode├──partFive│├──animation││├──BackingStore.class││├──BackingStore.java││├──BulletinLayout.clas
阿里云API网关签名后端示例项目教程
廉艳含
阿里云API网关签名后端示例项目教程api-gateway-demo-sign-backend-java项目地址:https://gitcode.com/gh_mirrors/ap/api-gateway-demo-sign-backend-java项目介绍阿里云API网关签名后端示例项目(api-gateway-demo-sign-backend-java)是一个开源的Java项目,旨在帮助开发
安卓App中调用升级接口并实现版本检查和升级功能的完整方案
胡子洲
Android android
以下是安卓App中调用升级接口并实现版本检查和升级功能的完整方案,包含网络请求、版本解析、下载安装等核心逻辑:一、定义数据实体类(解析接口返回)//CheckUpgradeResponse.javapublicclassCheckUpgradeResponse{privateintcode;privateStringmsg;privateUpgradeDatadata;privateMapmap;
无路可逃java攻略_《生化危机2:重制版》幽灵生还者无路可逃流程攻略
捡钱花
无路可逃java攻略
《生化危机2:重制版》的幽灵生还者DLC中,当玩家通关了前面的三章之后就能解锁第四章——无路可逃,这个关卡需要解决100个丧尸,难度十分之高,下面小编就为大家带来一篇“lu_mkⅡ”分享的幽灵生还者无路可逃流程攻略。幽灵生还者无路可逃流程攻略1、打到40波和85波各为一个分水岭。2、先说40波40店门口会出现第一个火焰喷射器的背包丧尸,也是头40个敌人熬出头的时候,前期子弹不合理安排或者运气不好丧
html5-video标签做视频加密的方法
视频砖家
HTML5 视频加密 视频安全 视频加密 文件加密 视频安全
html5-video标签做视频加密的方法/**在这里可以进行权限验证等操作*///创建文件对象Filef=newFile("E:\\test.mp4");//获取文件名称StringfileName=f.getName();//导出文件Stringagent=getRequest().getHeader("User-Agent").toUpperCase();InputStreamfis=nul
视频云平台HTML5播放器使用文档(CuPlayer平台)
阿酷tony
酷播云(免费云存储) 音视频 html5 前端
视频云平台HTML5播放器使用文档(CuPlayer平台)varplayer=polyvPlayer({wrap:'#player',width:800,height:533,vid:'88083abbf5535a4d7b4d8614427559e0_8',});选项参数类型默认值说明wrapstring/HTMLElement-页面上存在需要载入播放器的DOM元素或css选择器widthnumb
Html5播放器禁止拖动播放器进度条(教学场景)
禁用视频课程进度条的拖动功能,主要是为了强制学员按照课程设计的顺序观看内容,防止跳过关键知识点,从而保证学习效果和课程的完整性。这在以下几种教育场景中尤为常见和有意义。演示地址:禁用拖动视频进度条01.防止应试作弊:在一些需要观看视频才能解锁下一章节或完成测试的场景中,禁用拖动能确保学员真正观看了教学内容,而不是仅仅为了完成任务而快进。02.强制观看基础知识:对于那些知识点层层递进的课程(例如编程
大模型的“Tomcat”:一文读懂AI推理引擎(Inference Engine)
人工智能
本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续!魔都架构师|全网30W技术追随者大厂分布式系统/数据中台实战专家主导交易系统百万级流量调优&车联网平台架构AIGC应用开发先行者|区块链落地实践者以技术驱动创新,我们的征途是改变世界!实战干货:编程严选网1推理引擎是啥?从熟悉的“服务器”说起,想象你用Java写好了一个业务应用,如订单处理服务,打成一个JAR或WAR包。这包能直接
在vue3中通过jspdf+html2canvas实现导出页面pdf功能
落晓星
pdf vue.js 前端 ruoyi
一、安装依赖npminstallhtml2canvasjspdf二、创建Vue组件下载文件importhtml2canvasfrom'html2canvas';importjsPDFfrom'jspdf';constroute=useRoute();//当前idconstpolicyExplainId=ref(route.params.id);constloading=ref(false);//详
【北上广深杭大厂编程面试题】C++篇...这里介绍C++是如何实现多态的?(三)
努力毕业的小土博^_^
计算机基础知识和编程 c++ 面试 java 开发语言 职场和发展
【北上广深杭大厂编程面试题】C++篇…这里介绍C++是如何实现多态的?(三)【北上广深杭大厂编程面试题】C++篇…这里介绍C++是如何实现多态的?(三)文章目录【北上广深杭大厂编程面试题】C++篇...这里介绍C++是如何实现多态的?(三)前言3.纯虚函数与抽象类示例代码:纯虚函数与抽象类输出:4.虚函数的动态绑定与vtablevtable工作原理:总结欢迎铁子们点赞、关注、收藏!祝大家逢考必过!
鹅厂JS面试题——0.1+0.2=0.3吗?
孤舟蓑影
JavaScript javascript 开发语言 ecmascript 前端 学习
首先公布答案:在JavaScript中,0.1+0.2≠0.3为什么?JavaScript中的数字使用IEEE754标准的双精度浮点数(64位)进行表示。这种表示方式在处理十进制小数时,不能精确地表示某些数字。比如0.1和0.2这样的十进制小数,在转换成二进制浮点数时会产生无限循环的小数,导致它们在内存中只能近似表示。0.1在二进制中表示为一个近似值:0.000110011001100110011
在 Logstash 中使用 Ruby 脚本
Elastic 中国社区官方博客
Logstash Elastic 大数据 elasticsearch 搜索引擎 ruby 全文检索 logstash
作者:来自ElasticDaiSugimori了解LogstashRubyfilter插件,在你的Logstashpipeline中进行高级数据转换。更多阅读:Logstash:使用Ruby过滤器了解将数据导入Elasticsearch的不同方式,并深入实际示例,尝试一些新方法。Elasticsearch拥有丰富的新功能,帮助你为你的使用场景构建最佳的搜索解决方案。立即开始免费试用。Logstas
国产操作系统编译统信uos(linux)编译Sqlite3.3
不行人视
环境踩坑 linux sqlite 笔记
文章目录一、下载源码二、编译步骤1.解压2.构建3.编译下载三、检查安装是否成功一、下载源码链接:https://www.sqlite.org/index.html二、编译步骤1.解压tar-xvfsqlite-autoconf-3460000.tar.gz新建一个文件夹用来存放编译下载的文件mkdirset_sql进入解压的文件夹cdcdsqlite-autoconf-3460000/2.构建构
MySQL(105) 如何进行数据库分片?
辞暮尔尔-烟火年年
MySQL 数据库 mysql
数据库分片(Sharding)是一种将数据库表的数据分布到多个物理数据库实例上的技术,以提高数据库的性能和可扩展性。下面将详细介绍如何在Java中实现数据库分片,包括分片策略、分片管理和数据访问。1.环境准备假设我们使用SpringBoot和MySQL,并且需要分片的表是users表。2.分片策略常见的分片策略有哈希分片(HashSharding)、范围分片(RangeSharding)和列表分片
Java代理模式之静态代理
爪哇手记
# Java知识点 代理模式 笔记 java 设计模式 学习
一、静态代理的定义与核心原理静态代理是代理模式的一种实现方式,其核心思想是通过代理类与目标类实现相同的接口,在代理类中调用目标类的方法,并在方法调用前后添加额外功能(如日志、权限校验、性能监控等)。代理类与目标类的关系在编译时已确定,代理类需手动编写。核心原理:接口统一:代理类和目标类实现相同的接口,确保客户端通过接口调用时透明。委托调用:代理类内部持有一个目标对象的引用,通过调用目标对象的方法实
Windows如何安装ComfyUI
俊偉
stable diffusion agi comfyui
ComfyUI是一个用于生成和管理文本到图像(Text-to-Image)的开源项目,基于StableDiffusion模型。它提供了图形用户界面(GUI),使得使用AI生成图像变得更加简单和直观。要在Windows上安装ComfyUI,你可以按照以下步骤进行操作。前提条件1.Python3.10+:ComfyUI需要Python3.10或更高版本。你可以从Python官方网站下载并安装最新版本的
LeetCode Hot100(二分)
asom22
LeetCode Hot100 题解 leetcode 算法 职场和发展
35.搜索插入位置题意给定一个排序数组和一个目标值,在数组中找到目标值,并返回其索引。如果目标值不存在于数组中,返回它将会被按顺序插入的位置。请必须使用时间复杂度为O(logn)的算法。题解首先理解二分的做法,我们对于一个有序的序列,每一次都查询他中间的位置,如果当前位置大于他,那就肯定在大于他的那侧,反之就在他小于他的那侧,代码实现如下代码importjava.util.ArrayList;im
技术实录-从 MySQL 启动失败到大小写兼容恢复:一次完整故障排查复盘20250614
Narutolxy
智浪初航 技术干货分享 mysql adb android
技术实录|从MySQL启动失败到大小写兼容恢复:一次完整故障排查复盘作者:Narutolxy|日期:2025-06-14|标签:MySQL、权限修复、大小写敏感、数据迁移引言:一次意外引发的MySQL修复实践在一次对客户MySQL数据库进行表迁移和大小写兼容性调整的过程中,我遇到了一个典型但复杂的问题——MySQL配置了lower_case_table_names=1后无法启动,root用户密码遗
用IDEA内置的AI通义灵码,开发效率直接起飞!
作为老Java开发,在用上IDEA内置的通义灵码插件,真的有种"回不去了"的感觉。这玩意儿不是简单的代码补全工具,简直就是个24小时待命的编程助手,让我来唠唠它到底有多香。但是仅供参考,对于一些初学者或者对代码还不是很熟悉的伙伴,不建议使用ai,尽量自己手敲,还能提高代码熟悉度,出了bug还能自己找出来问题所在,ai只能作为辅助我们进行学习和开发1.写代码像聊天一样自然以前写代码最烦的就是那些模板
LeetCode Hot100(回溯)
asom22
LeetCode Hot100 题解 leetcode 算法 职场和发展
46.全排列题意给定一个不含重复数字的数组nums,返回其所有可能的全排列。你可以按任意顺序返回答案。题解因为是所有的排列组合,我们每一个位置都取一遍数组的所有元素看看有没有重复的即可代码importjava.util.*;publicclassSolution{publicstaticvoidmain(String[]args){int[]nums={1,2,3};permute(nums);}
knob UI插件使用
换个号韩国红果果
JavaScript jsonp knob
图形是用canvas绘制的
js代码
var paras = {
max:800,
min:100,
skin:'tron',//button type
thickness:.3,//button width
width:'200',//define canvas width.,canvas height
displayInput:'tr
Android+Jquery Mobile学习系列(5)-SQLite数据库
白糖_
JQuery Mobile
目录导航
SQLite是轻量级的、嵌入式的、关系型数据库,目前已经在iPhone、Android等手机系统中使用,SQLite可移植性好,很容易使用,很小,高效而且可靠。
因为Android已经集成了SQLite,所以开发人员无需引入任何JAR包,而且Android也针对SQLite封装了专属的API,调用起来非常快捷方便。
我也是第一次接触S
impala-2.1.2-CDH5.3.2
dayutianfei
impala
最近在整理impala编译的东西,简单记录几个要点:
根据官网的信息(https://github.com/cloudera/Impala/wiki/How-to-build-Impala):
1. 首次编译impala,推荐使用命令:
${IMPALA_HOME}/buildall.sh -skiptests -build_shared_libs -format
2.仅编译BE
${I
求二进制数中1的个数
周凡杨
java 算法 二进制
解法一:
对于一个正整数如果是偶数,该数的二进制数的最后一位是 0 ,反之若是奇数,则该数的二进制数的最后一位是 1 。因此,可以考虑利用位移、判断奇偶来实现。
public int bitCount(int x){
int count = 0;
while(x!=0){
if(x%2!=0){ /
spring中hibernate及事务配置
g21121
Hibernate
hibernate的sessionFactory配置:
<!-- hibernate sessionFactory配置 -->
<bean id="sessionFactory"
class="org.springframework.orm.hibernate3.LocalSessionFactoryBean">
<
log4j.properties 使用
510888780
log4j
log4j.properties 使用
一.参数意义说明
输出级别的种类
ERROR、WARN、INFO、DEBUG
ERROR 为严重错误 主要是程序的错误
WARN 为一般警告,比如session丢失
INFO 为一般要显示的信息,比如登录登出
DEBUG 为程序的调试信息
配置日志信息输出目的地
log4j.appender.appenderName = fully.qua
Spring mvc-jfreeChart柱图(2)
布衣凌宇
jfreechart
上一篇中生成的图是静态的,这篇将按条件进行搜索,并统计成图表,左面为统计图,右面显示搜索出的结果。
第一步:导包
第二步;配置web.xml(上一篇有代码)
建BarRenderer类用于柱子颜色
import java.awt.Color;
import java.awt.Paint;
import org.jfree.chart.renderer.category.BarR
我的spring学习笔记14-容器扩展点之PropertyPlaceholderConfigurer
aijuans
Spring3
PropertyPlaceholderConfigurer是个bean工厂后置处理器的实现,也就是BeanFactoryPostProcessor接口的一个实现。关于BeanFactoryPostProcessor和BeanPostProcessor类似。我会在其他地方介绍。
PropertyPlaceholderConfigurer可以将上下文(配置文件)中的属性值放在另一个单独的标准java
maven 之 cobertura 简单使用
antlove
maven test unit cobertura report
1. 创建一个maven项目
2. 创建com.CoberturaStart.java
package com;
public class CoberturaStart {
public void helloEveryone(){
System.out.println("=================================================
程序的执行顺序
百合不是茶
JAVA执行顺序
刚在看java核心技术时发现对java的执行顺序不是很明白了,百度一下也没有找到适合自己的资料,所以就简单的回顾一下吧
代码如下;
经典的程序执行面试题
//关于程序执行的顺序
//例如:
//定义一个基类
public class A(){
public A(
设置session失效的几种方法
bijian1013
web.xml session失效 监听器
在系统登录后,都会设置一个当前session失效的时间,以确保在用户长时间不与服务器交互,自动退出登录,销毁session。具体设置很简单,方法有三种:(1)在主页面或者公共页面中加入:session.setMaxInactiveInterval(900);参数900单位是秒,即在没有活动15分钟后,session将失效。这里要注意这个session设置的时间是根据服务器来计算的,而不是客户端。所
java jvm常用命令工具
bijian1013
java jvm
一.概述
程序运行中经常会遇到各种问题,定位问题时通常需要综合各种信息,如系统日志、堆dump文件、线程dump文件、GC日志等。通过虚拟机监控和诊断工具可以帮忙我们快速获取、分析需要的数据,进而提高问题解决速度。 本文将介绍虚拟机常用监控和问题诊断命令工具的使用方法,主要包含以下工具:
&nbs
【Spring框架一】Spring常用注解之Autowired和Resource注解
bit1129
Spring常用注解
Spring自从2.0引入注解的方式取代XML配置的方式来做IOC之后,对Spring一些常用注解的含义行为一直处于比较模糊的状态,写几篇总结下Spring常用的注解。本篇包含的注解有如下几个:
Autowired
Resource
Component
Service
Controller
Transactional
根据它们的功能、目的,可以分为三组,Autow
mysql 操作遇到safe update mode问题
bitray
update
我并不知道出现这个问题的实际原理,只是通过其他朋友的博客,文章得知的一个解决方案,目前先记录一个解决方法,未来要是真了解以后,还会继续补全.
在mysql5中有一个safe update mode,这个模式让sql操作更加安全,据说要求有where条件,防止全表更新操作.如果必须要进行全表操作,我们可以执行
SET
nginx_perl试用
ronin47
nginx_perl试用
因为空闲时间比较多,所以在CPAN上乱翻,看到了nginx_perl这个项目(原名Nginx::Engine),现在托管在github.com上。地址见:https://github.com/zzzcpan/nginx-perl
这个模块的目的,是在nginx内置官方perl模块的基础上,实现一系列异步非阻塞的api。用connector/writer/reader完成类似proxy的功能(这里
java-63-在字符串中删除特定的字符
bylijinnan
java
public class DeleteSpecificChars {
/**
* Q 63 在字符串中删除特定的字符
* 输入两个字符串,从第一字符串中删除第二个字符串中所有的字符。
* 例如,输入”They are students.”和”aeiou”,则删除之后的第一个字符串变成”Thy r stdnts.”
*/
public static voi
EffectiveJava--创建和销毁对象
ccii
创建和销毁对象
本章内容:
1. 考虑用静态工厂方法代替构造器
2. 遇到多个构造器参数时要考虑用构建器(Builder模式)
3. 用私有构造器或者枚举类型强化Singleton属性
4. 通过私有构造器强化不可实例化的能力
5. 避免创建不必要的对象
6. 消除过期的对象引用
7. 避免使用终结方法
1. 考虑用静态工厂方法代替构造器
类可以通过
[宇宙时代]四边形理论与光速飞行
comsci
从四边形理论来推论 为什么光子飞船必须获得星光信号才能够进行光速飞行?
一组星体组成星座 向空间辐射一组由复杂星光信号组成的辐射频带,按照四边形-频率假说 一组频率就代表一个时空的入口
那么这种由星光信号组成的辐射频带就代表由这些星体所控制的时空通道,该时空通道在三维空间的投影是一
ubuntu server下python脚本迁移数据
cywhoyi
python Kettle pymysql cx_Oracle ubuntu server
因为是在Ubuntu下,所以安装python、pip、pymysql等都极其方便,sudo apt-get install pymysql,
但是在安装cx_Oracle(连接oracle的模块)出现许多问题,查阅相关资料,发现这边文章能够帮我解决,希望大家少走点弯路。http://www.tbdazhe.com/archives/602
1.安装python
2.安装pip、pymysql
Ajax正确但是请求不到值解决方案
dashuaifu
Ajax async
Ajax正确但是请求不到值解决方案
解决方案:1 . async: false , 2. 设置延时执行js里的ajax或者延时后台java方法!!!!!!!
例如:
$.ajax({ &
windows安装配置php+memcached
dcj3sjt126com
PHP Install memcache
Windows下Memcached的安装配置方法
1、将第一个包解压放某个盘下面,比如在c:\memcached。
2、在终端(也即cmd命令界面)下输入 'c:\memcached\memcached.exe -d install' 安装。
3、再输入: 'c:\memcached\memcached.exe -d start' 启动。(需要注意的: 以后memcached将作为windo
iOS开发学习路径的一些建议
dcj3sjt126com
ios
iOS论坛里有朋友要求回答帖子,帖子的标题是: 想学IOS开发高阶一点的东西,从何开始,然后我吧啦吧啦回答写了很多。既然敲了那么多字,我就把我写的回复也贴到博客里来分享,希望能对大家有帮助。欢迎大家也到帖子里讨论和分享,地址:http://bbs.csdn.net/topics/390920759
下面是我回复的内容:
结合自己情况聊下iOS学习建议,
Javascript闭包概念
fanfanlovey
JavaScript 闭包
1.参考资料
http://www.jb51.net/article/24101.htm
http://blog.csdn.net/yn49782026/article/details/8549462
2.内容概述
要理解闭包,首先需要理解变量作用域问题
内部函数可以饮用外面全局变量
var n=999;
functio
yum安装mysql5.6
haisheng
mysql
1、安装http://dev.mysql.com/get/mysql-community-release-el7-5.noarch.rpm
2、yum install mysql
3、yum install mysql-server
4、vi /etc/my.cnf 添加character_set_server=utf8
po/bo/vo/dao/pojo的详介
IT_zhlp80
java BO VO DAO POJO po
JAVA几种对象的解释
PO:persistant object持久对象,可以看成是与数据库中的表相映射的java对象。最简单的PO就是对应数据库中某个表中的一条记录,多个记录可以用PO的集合。PO中应该不包含任何对数据库的操作.
VO:value object值对象。通常用于业务层之间的数据传递,和PO一样也是仅仅包含数据而已。但应是抽象出的业务对象,可
java设计模式
kerryg
java 设计模式
设计模式的分类:
一、 设计模式总体分为三大类:
1、创建型模式(5种):工厂方法模式,抽象工厂模式,单例模式,建造者模式,原型模式。
2、结构型模式(7种):适配器模式,装饰器模式,代理模式,外观模式,桥接模式,组合模式,享元模式。
3、行为型模式(11种):策略模式,模版方法模式,观察者模式,迭代子模式,责任链模式,命令模式,备忘录模式,状态模式,访问者
[1]CXF3.1整合Spring开发webservice——helloworld篇
木头.java
spring webservice CXF
Spring 版本3.2.10
CXF 版本3.1.1
项目采用MAVEN组织依赖jar
我这里是有parent的pom,为了简洁明了,我直接把所有的依赖都列一起了,所以都没version,反正上面已经写了版本
<project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="ht
Google 工程师亲授:菜鸟开发者一定要投资的十大目标
qindongliang1922
工作 感悟 人生
身为软件开发者,有什么是一定得投资的? Google 软件工程师 Emanuel Saringan 整理了十项他认为必要的投资,第一项就是身体健康,英文与数学也都是必备能力吗?来看看他怎么说。(以下文字以作者第一人称撰写)) 你的健康 无疑地,软件开发者是世界上最久坐不动的职业之一。 每天连坐八到十六小时,休息时间只有一点点,绝对会让你的鲔鱼肚肆无忌惮的生长。肥胖容易扩大罹患其他疾病的风险,
linux打开最大文件数量1,048,576
tianzhihehe
c linux
File descriptors are represented by the C int type. Not using a special type is often considered odd, but is, historically, the Unix way. Each Linux process has a maximum number of files th
java语言中PO、VO、DAO、BO、POJO几种对象的解释
衞酆夼
java VO BO POJO po
PO:persistant object持久对象
最形象的理解就是一个PO就是数据库中的一条记录。好处是可以把一条记录作为一个对象处理,可以方便的转为其它对象。可以看成是与数据库中的表相映射的java对象。最简单的PO就是对应数据库中某个表中的一条记录,多个记录可以用PO的集合。PO中应该不包含任何对数据库的操作。
BO:business object业务对象
封装业务逻辑的java对象