iteye_14050

Mozilla FireFox Gecko内核源代码解析(2.nsTokenizer)

Mozilla FireFox Gecko内核源代码解析

(1.nsTokenizer)

中科院计算技术研究所网络数据科学与工程研究中心

信息抽取小组

耿耘

前面我们大体介绍了nsParser的主控流程(nsParser.cpp)，可知HTML解析一般分为两个阶段，即文法阶段的分词操作，和语法阶段的解析操作，前者一般来讲就是将HTML的标签分开，分成一个个的Token，而在Mozilla Firefox中，这个工作的主要流程是由nsHTMLTokenizer（分词器）控制下的nsHTMLToken来完成的。nsHTMLTokenizer负责响应nsParser传输过来的分析请求，并调用相应的nsHTMLToken，具体的词法，属性分析等都是放在后者nsHTMLTokens中完成的。其中还要用到对字符串进行流式扫描和读取进行支持的nsScanner。

值得注意的是nsHTMLTokenizer继承自nsITokenizer接口，实际上Mozilla还针对将来可能出现的其他XML格式文档进行了接口的制定，也许是说如过HTML5，6,7出来后，我们依然可以复用一部分接口来制定新的Tokenizer。

而目前我们主要使用的就是HTMLTokenizer，它主要针对各种HTML的标签进行解析，它将HTML的标签划分为了13类(实际上没这么多)，这在一个叫做eHTMLTokenTypes的枚举类型中进行了定义，我们在之后的nsHTMLToken分析中会详细进行解析，这里我们为了助于理解Tokenizer的工作原理，先来看一下这个类型的集合：

eHTMLTokenTypes
enumeHTMLTokenTypes { eToken_unknown=0, eToken_start=1,eToken_end,eToken_comment,eToken_entity, eToken_whitespace,eToken_newline,eToken_text,eToken_attribute, eToken_instruction,eToken_cdatasection, eToken_doctypeDecl, eToken_markupDecl, eToken_last //make sure this stays the lasttoken... };

可以看到，其中eToken_last，eToken_unknow等是为了进行一些其他处理而存在的。其他的就是我们Mozilla中队常用的HTML标签的类型进行的分类。

观察头文件可以看出，它主要的方法是以ConsumeXXX()的样式来命名的方法，并可以看出，所有方法的参数中都要添加nsScanner类型的参数，这其实潜在地表示，Tokenizer和Scanner不必一对一配套使用。

它还提供了一个很重要的ScanDocStructure()方法，通过一个栈来对文档中所有Tokens的良构性进行一个判断，即基本的文法正确性检查。

首先，我们来看它的头文件：

nsTokenizer.h
#ifndef__NSHTMLTOKENIZER #define__NSHTMLTOKENIZER #include "nsISupports.h" #include "nsITokenizer.h" #include "nsIDTD.h" #include "prtypes.h" #include "nsDeque.h" #include "nsScanner.h" #include "nsHTMLTokens.h" #include "nsDTDUtils.h" /************************************************************* Notes: ************************************************************/ #ifdef_MSC_VER #pragma warning( disable :4275 ) #endif classnsHTMLTokenizer : public nsITokenizer { public: NS_DECL_ISUPPORTS //之前构件代码中#Define的方法 NS_DECL_NSITOKENIZER nsHTMLTokenizer(nsDTDMode aParseMode = eDTDMode_quirks, //构造方法 eParserDocType aDocType =eHTML_Quirks, eParserCommands aCommand =eViewNormal, PRUint32 aFlags = 0); virtual ~nsHTMLTokenizer(); //析构方法 static PRUint32 GetFlags(constnsIContentSink aSink); //获取本Tokenizer的标示位 protected: //下面的方法都是针对不同的HTMl词条类型来进行解析处理的 nsresult ConsumeTag(PRUnichar aChar,CToken& aToken,nsScanner&aScanner,PRBool& aFlushTokens); nsresult ConsumeStartTag(PRUnichar aChar,CToken&aToken,nsScanner& aScanner,PRBool& aFlushTokens); nsresult ConsumeEndTag(PRUnichar aChar,CToken&aToken,nsScanner& aScanner); nsresult ConsumeAttributes(PRUnichar aChar, CToken aToken,nsScanner& aScanner); nsresult ConsumeEntity(PRUnichar aChar,CToken&aToken,nsScanner& aScanner); nsresult ConsumeWhitespace(PRUnichar aChar,CToken&aToken,nsScanner& aScanner); nsresult ConsumeComment(PRUnichar aChar,CToken&aToken,nsScanner& aScanner); nsresult ConsumeNewline(PRUnichar aChar,CToken&aToken,nsScanner& aScanner); nsresult ConsumeText(CToken& aToken,nsScanner& aScanner); nsresult ConsumeSpecialMarkup(PRUnichar aChar,CToken&aToken,nsScanner& aScanner); nsresult ConsumeProcessingInstruction(PRUnichar aChar,CToken&aToken,nsScanner& aScanner); //这个方法是对当前词条队列中所有词条进行良构分析的方法 nsresult ScanDocStructure(PRBool aIsFinalChunk); //添加新的Token到队列中去 static void AddToken(CToken& aToken,nsresultaResult,nsDeque* aDeque,nsTokenAllocator* aTokenAllocator); nsDeque mTokenDeque; //存放Token的队列 PRPackedBool mIsFinalChunk; //标注是否是最后一个数据块 nsTokenAllocator*mTokenAllocator; //这个是用来分配Token的Allocator，在Mozilla中，为了节省内存资源，对于Token我们都是通过TokenAllocator进行分配的，这个我们在相应代码的解析之中会进行分析的 // This variable saves the position of the last tag weinspected in // ScanDocStructure. We start scanning the generalwell-formedness of the // document starting at this position each time. //下面这个变量记录了我们在ScanDocStructure中所处理到的最后一个tag的位置。我们每次对文档进行良构性扫描的时候都会从这个位置开始。 PRInt32 mTokenScanPos; //下面这个变量是用来记录分词器状态的标示位 PRUint32 mFlags; }; #endif

以上就是nsHTMLTokenizer的头文件，下面我们就来看其cpp文件的真正实现部分。

这主要是对nsITokenizer接口的实现。这个文件包含了一个对HTML文档进行分词的分词器的实现。它尝试在对老版本的解析器的兼容性和对SGML标准的支持之上进行这些工作。注意到，大部分真正的“分词”过程是在nsHTMLTokens.cpp中进行的。

nsTokenizer.cpp

#include "nsIAtom.h"

#include "nsHTMLTokenizer.h"

#include "nsScanner.h"

#include "nsElementTable.h"

#include "nsReadableUtils.h"

#include "nsUnicharUtils.h"

/************************************************************************

And now for the main class --nsHTMLTokenizer...

************************************************************************/

/**

* Satisfy the nsISupports interface.

//下面这个主要是为了实现nsISupports接口，具体实现在之前的#Define中实现了

NS_IMPL_ISUPPORTS1(nsHTMLTokenizer,nsITokenizer)

//下面是nsHTMLTokenizer的默认构造方法：

/**

* Default constructor

* @paramaParseMode The current mode the document is in (quirks, etc.)

* @param aDocType Thedocument type of the current document

* @param aCommand Whatwe are trying to do (view-source, parse a fragment, etc.)

nsHTMLTokenizer::nsHTMLTokenizer(nsDTDModeaParseMode,

eParserDocTypeaDocType,

eParserCommands aCommand,

PRUint32aFlags)

: mTokenDeque(0), mFlags(aFlags)

//构造方法，初始化两个变量，清空Token存放队列，并用aFlags设置Tokenizer的状态位

{

//首先，要根据aParseMode来设置mFlags

if (aParseMode == eDTDMode_full_standards ||

aParseMode == eDTDMode_almost_standards) {

mFlags |= NS_IPARSER_FLAG_STRICT_MODE;

} else if(aParseMode == eDTDMode_quirks) {

mFlags |= NS_IPARSER_FLAG_QUIRKS_MODE;

} else if(aParseMode == eDTDMode_autodetect) {

mFlags |= NS_IPARSER_FLAG_AUTO_DETECT_MODE;

} else {

mFlags |= NS_IPARSER_FLAG_UNKNOWN_MODE;

}

//之后还要根据aDocType来对mFlags进行设置

if (aDocType == ePlainText) {

mFlags |= NS_IPARSER_FLAG_PLAIN_TEXT;

} else if(aDocType == eXML) {

mFlags |= NS_IPARSER_FLAG_XML;

} else if(aDocType == eHTML_Quirks ||

aDocType == eHTML_Strict) {

mFlags |= NS_IPARSER_FLAG_HTML;

}

//根据aCommand来设置mFlag标示位是VIEW_SOURCE或VIEW_NORMAL

mFlags |= aCommand == eViewSource

? NS_IPARSER_FLAG_VIEW_SOURCE

: NS_IPARSER_FLAG_VIEW_NORMAL;

//判断，不能为XML模式，而且必须为VIEW_SOURCE模式？

NS_ASSERTION(!(mFlags & NS_IPARSER_FLAG_XML) ||

(mFlags &NS_IPARSER_FLAG_VIEW_SOURCE),

"Whyisn't this XML document going through our XML parser?");

//初始化，清空另两个数据成员变量

mTokenAllocator = nsnull;

mTokenScanPos = 0;

}

//下面是nsHTMLTokenizer默认的析构方法，注意到里面需要用到一个叫做ArenaPool的内存分配机制，这个机制是Mozilla中推出的一种内存分配机制，具体的方法我们在其他的代码解析文档中会说，有兴趣的读者也可以自己去看一下。就是为了尽可能减少内存碎片而设计的一种机制，FireFox的JSEngine即SpiderMonkey中也用到了这个机制。

/**

* The destructor ensures that we don't leakany left over tokens.

nsHTMLTokenizer::~nsHTMLTokenizer()

{

if (mTokenDeque.GetSize()) { //如果当前的Token队列存在

CTokenDeallocator theDeallocator(mTokenAllocator->GetArenaPool()); //获取对应的Deallocator

mTokenDeque.ForEach(theDeallocator); //对每个mTokenDeque里的Token运行theDeallocator

}

//获取nsHTMLTokenizer的mFlag标示位。

/*static*/PRUint32

nsHTMLTokenizer::GetFlags(const nsIContentSink* aSink)

{

PRUint32 flags = 0;

nsCOMPtr sink = //这种构建方法需要了解

do_QueryInterface(const_cast(aSink));

if (sink) { //如果获取Sink成功

PRBool enabled = PR_TRUE; //申请一个BOOL变量enabled，默认为为TRUE

sink->IsEnabled(eHTMLTag_frameset, &enabled); //获取sink是否启用了Tag_frameset的标示

if (enabled) { //如果启用了

flags |= NS_IPARSER_FLAG_FRAMES_ENABLED; //设置相应的标示位

}

sink->IsEnabled(eHTMLTag_script, &enabled); //获取sink是否启用了Tag_sript的标示

if (enabled) { //如果启用了

flags |= NS_IPARSER_FLAG_SCRIPT_ENABLED; //设置相应的标示位

}

return flags;

}

//上面一些方法都是对分词过程进行支持的，下面我们来看看真正的分词方法。

/*******************************************************************

Here begins the real working methods for thetokenizer.

*******************************************************************/

/**

* Adds a token onto the end of the deque ifaResult is a successful result.

* Otherwise, this function frees aToken andsets it to nsnull.

* @param aToken The token that wants to beadded.

* @param aResult The error code that will beused to determine if we actually

* want to push this token.

* @param aDeque The deque we want to pushaToken onto.

* @param aTokenAllocator The allocator we useto free aToken in case aResult

* is not a success code.

/* static */

//AddToken顾名思义，就是添加一个新的Token到存放Tokens的队列尾部。其他情况下，即如果不成功的话(aResult不为TRUE)，则我们会释放aToken并将其设置为nsnull。

void

nsHTMLTokenizer::AddToken(CToken*& aToken,

nsresult aResult,

nsDeque* aDeque,

nsTokenAllocator*aTokenAllocator)

{

if (aToken && aDeque) {

if (NS_SUCCEEDED(aResult)) { //首先判断aResult是否成功

aDeque->Push(aToken); //将aToken推入队列

} else { //其他情况下，即aResult不成功

IF_FREE(aToken, aTokenAllocator); //释放aToken

}

//以上方法和接下来的几个方法需要注意到的是，aToken是存放在一中叫做nsDeque的队列型数据结构中的，因此其会提供相应的push()，peek()方法等，具体的可以去看具体的数据结构，我们这里只需要调用该数据结构提供的方法即可。

/**

* Retrieve a pointer to the global tokenrecycler...

* @return Pointer to recycler (or null)

nsTokenAllocator* //获取全局的token回收器

nsHTMLTokenizer::GetTokenAllocator()

{

return mTokenAllocator; //返回mTokenAllocator

}

//查看队列头部Token的PeekToken方法

/**

* This method provides access to the topmosttoken in the tokenDeque.

* The token is not really removed from thelist.

* @return Pointer to token

CToken*

nsHTMLTokenizer::PeekToken()

{

return (CToken*)mTokenDeque.PeekFront(); //查看队列头部的Token，该Token不会出队

}

//获取队列头部Token，并将其出队的PopToken方法

/**

* This method provides access to the topmosttoken in the tokenDeque.

* The token is really removed from the list;if the list is empty we return 0.

* @return Pointer to token or NULL

CToken*

nsHTMLTokenizer::PopToken()

{

return (CToken*)mTokenDeque.PopFront(); //直接获取头部Token，如果是空的队列，则会返回0

}

//将Token压入到队列的头部，并且返回这个Token（我个人感觉应当返回压入操作的成功与否）

/**

* Pushes a token onto the front of our dequesuch that the next call to

* PopToken() or PeekToken() will return thattoken.

* @param theToken The next token to beprocessed

* @return theToken

CToken*

nsHTMLTokenizer::PushTokenFront(CToken*theToken)

{

mTokenDeque.PushFront(theToken); //压入操作

return theToken; //返回该Token

}

//将Token压入队列的尾部，并返回相应的Token（操作结果就不判断了么？）

/**

* Pushes a token onto the front of our dequesuch that the next call to

* PopToken() or PeekToken() will return thattoken.

* @param theToken The next token to beprocessed

* @return theToken

CToken*

nsHTMLTokenizer::PushTokenFront(CToken*theToken)

{

mTokenDeque.PushFront(theToken); //压入操作

return theToken; //返回该Token

}

//返回队列的大小

/**

* Returns the size of the deque.

* @return The number of remaining tokens.

PRInt32

nsHTMLTokenizer::GetCount()

{

return mTokenDeque.GetSize(); //获取该deque的大小

}

//获取队列中相应位置的Token

/**

* Allows access to an arbitrary token in thedeque. The accessed token is left

* in the deque.

* @param anIndex The index of the targettoken. Token 0 would be the same as

* the result of a call toPeekToken()

* @return The requested token.

CToken*

nsHTMLTokenizer::GetTokenAt(PRInt32anIndex)

{

return (CToken*)mTokenDeque.ObjectAt(anIndex); //类似数组，获取下标为anIndex的元素，注意这里的ObjectAt方法，是构件方法

}

//下面，我们来看看更分词操作有关的一系列动作操作：

首先来看很经典的三部曲操作中用来初始化的Will系列操作（对应的还有本体操作和收尾用的Did系列操作）

/**

* This method is part of the"sandwich" that occurs when we want to tokenize

* a document. This prepares us to be able totokenize properly.

* @param aIsFinalChunk Whether this is thelast chunk of data that we will

* get to see.

* @param aTokenAllocator The token allocatorto use for this document.

* @return Our success in setting up.

//本操作主要在进行分词操作之前进行操作，这会让我们做一些初始化操作，使分词器能够正常地运行并进行操作

nsresult

nsHTMLTokenizer::WillTokenize(PRBoolaIsFinalChunk,

nsTokenAllocator*aTokenAllocator)

{

mTokenAllocator = aTokenAllocator; //通过参数设置mTokenAllocator

mIsFinalChunk = aIsFinalChunk; //通过参数设置mIsFinalChunk

// Cause ScanDocStructure to search from here for newtokens...

mTokenScanPos = mTokenDeque.GetSize(); //获取TokenDeque的大小，并设置当前位置，也就是说新到来的Token将会从这个位置开始放入队列，也就为后面会介绍到的ScanDocStructrue方法提供了支持。该方法会从此位置往后的Token们进行词法判断。

return NS_OK;

}

/**

* Pushes all of the tokens in aDeque onto thefront of our deque so they

* get processed before any other tokens.

* @param aDeque The deque with the tokens init.

//这个方法就是将存在于另一个队列aDeque中的所有Token，按序插入到我们的队列中的最前面

void

nsHTMLTokenizer::PrependTokens(nsDeque&aDeque)

{

PRInt32 aCount = aDeque.GetSize(); //获取aDeque的大小

for (PRInt32 anIndex = 0; anIndex < aCount;++anIndex) { //遍历所有元素，进行插入

CToken* theToken = (CToken*)aDeque.Pop(); //获取当前位置的元素

PushTokenFront(theToken); //插入到当前队列中

}

//下面这个方法，是用来将另一个Tokenizer的状态拷贝到当前Tokenizer中来，即相当于还原另一个Tokenizer的解析状态（解析上下文）。这主要是为document.write()所准备的，后面大家可以了解到，这个Javascript的语句导致了很多问题的产生。

/**

* Copies the state flags from aTokenizer intothis tokenizer. This is used

* to pass information around between the maintokenizer and tokenizers

* created for document.write() calls.

* @param aTokenizer The tokenizer with moreinformation in it.

* @return NS_OK

//拷贝状态，很简单只需要拷贝Tokenizerz的mFlags即可，这主要是用来在主Tokenizer和被document.write()调用所创建的Tokenizer的之间传递信息的。

nsresult

nsHTMLTokenizer::CopyState(nsITokenizer*aTokenizer)

{

if (aTokenizer) {

mFlags = ((nsHTMLTokenizer*)aTokenizer)->mFlags; //获取该Tokenizer的mFlags

}

return NS_OK;

}

//下面我们会介绍一个ScanDocStructure方法，这是一个文法正确性监测的方法。他会去检查当前已经解析的Tokens中的所有Token，并修正一些文法上的错误，比如

等明显错误的文法。

//不同的浏览器内核中（如Webkit）都对文法错误编写了大量的代码对其进行修正。然而对于同样的文法错误，可能会出现不同的处理，这样会明显导致一些相同的网页在不同的浏览器上出现不同的显示结果。

//然而这并不是检查的全部，比如诸如

等语法错误是不会在这里检查出来的，那些会根据具体的DTD进行不同的区分和检查，我们在后面的文档中会详细解释这一点，目前我们先来看看文法监测的方法。

//这个文法监测主要是通过一个栈来进行监测的，类似于大多数表达式处理法。在这个方法中我们实际上并不只是将出错的节点标示位进行一下标示，并不删除该节点。

//首先先是一个为了给文法监测提供支持的方法，这个方法很简单，就是根据给定的Tag名，找到并返回当前Tag栈中的（第一个）符合标准的元素的位置。这个位置可以提供给组件访问方法ObjectAt()来使用。

/**

* This is a utilty method forScanDocStructure, which finds a given

* tag in the stack. The return value is meantto be used with

* nsDeque::ObjectAt() on aTagStack.

* @paramaTag -- the ID of the tag we're seeking

* @paramaTagStack -- the stack to be searched

* @returnindex position of tag in stack if found, otherwise kNotFound

staticPRInt32

FindLastIndexOfTag(eHTMLTags aTag,nsDeque &aTagStack)

{

PRInt32 theCount = aTagStack.GetSize(); //首先获取栈的大小

while (0 < theCount) { //循环从栈顶开始依次遍历栈中的元素

CHTMLToken* theToken = (CHTMLToken*)aTagStack.ObjectAt(--theCount);

if (theToken) { //如果获取成功

eHTMLTags theTag = (eHTMLTags)theToken->GetTypeID(); //获取其类型

if (theTag == aTag) { //进行判断，如果相等

return theCount; //那么就返回它的下标

}

return kNotFound; //运行到这说明没有找到，则返回404…

}

//好了，下面我们就来看真正进行文法监测的ScanDocStructure方法

/**

* This method scans the sequence of tokens todetermine whether or not the

* tag structure of the document is wellformed. In well formed cases, we can

* skip doing residual style handling and allowinlines to contain block-level

* elements.

* @param aFinalChunk Is unused.

* @return Success (currently, this functioncannot fail).

//这个方法扫描tokens的队列来决定该文档的结构是否是良构的。良构的情况下，我们可以不考虑其他样式的处理等，inlines等标签包含block级别的元素等问题。

nsresultnsHTMLTokenizer::ScanDocStructure(PRBool aFinalChunk)

{

nsresult result = NS_OK;

if (!mTokenDeque.GetSize()) { //首先需要判断队列不为空

return result;

}

CHTMLToken* theToken = (CHTMLToken*)mTokenDeque.ObjectAt(mTokenScanPos); //获取当前位置的Token

// Start by finding the first start tag that hasn't beenreviewed.

//首先我们需要从当前位置开始，向前寻找到第一个没有被处理过的起始类型标签，如还没有遇到的

标签等，这主要是为了继承上次ScanDocStructure的工作往下做

while (mTokenScanPos > 0) {

if (theToken) {

eHTMLTokenTypes theType =eHTMLTokenTypes(theToken->GetTokenType());

if (theType == eToken_start && //如果类型为eToken_start，即起始类型标签

theToken->GetContainerInfo() == eFormUnknown) { //通过GetContainerInfo来判断其是否已经遇到了对应的结束类型标签

break;

}

theToken = (CHTMLToken*)mTokenDeque.ObjectAt(--mTokenScanPos); //寻找下一个标签

} //如果循环结束还未找到，那么说明从mTokenScanPos开始进行解析就可以

// Now that we know where to start, let's walk through the

// tokens to see which are well-formed. Stop when you runout

// of fresh tokens.

//现在我们知道了应当从哪里开始进行解析，我们只需要遍历所有的Tokens来看看哪个是良构的即可。循环直到我们没有了新的tokens为止。

//申请两个栈，数据类型不用那么严格可用nsDeque的数据结构，我们只对其进行栈式操作即可

nsDeque theStack(0);

nsDeque tempStack(0);

PRInt32 theStackDepth = 0;

// Don't bother if we get ridiculously deep.

//注意到，如果我们的tag嵌套层数超过了200层，那么我们就不需要再继续进行解析了，直接忽略后面的tag，这也就是说，如果你的HTMl文件中有201个

，之后再接201个

，那么最后一个

会直接被忽略掉，因为FireFox最多支持200层嵌套。

static const PRInt32 theMaxStackDepth = 200;

while (theToken && theStackDepth

eHTMLTokenTypes theType = eHTMLTokenTypes(theToken->GetTokenType());

eHTMLTags theTag = (eHTMLTags)theToken->GetTypeID();

if (nsHTMLElement::IsContainer(theTag)) { // Bug 54117

//貌似是为了修正某个bug而推出的，首先设置两个BOOL位来判断其是否是Block或inline元素，主要是为了下面判断该Tag

PRBool theTagIsBlock =gHTMLElements[theTag].IsMemberOf(kBlockEntity);

PRBool theTagIsInline = theTagIsBlock

? PR_FALSE

:gHTMLElements[theTag].IsMemberOf(kInlineEntity);

//判断当前tag是否是inline类，或block类，或

if (theTagIsBlock || theTagIsInline ||eHTMLTag_table == theTag) {

switch(theType) {

case eToken_start: //如果是起始型Token

{

//下面这个ShouldVerifyHierarchy方法用来检测该元素是否且不能被包含在同类型的其他元素中

if(gHTMLElements[theTag].ShouldVerifyHierarchy()) {

PRInt32 earlyPos =FindLastIndexOfTag(theTag, theStack);

if(earlyPos != kNotFound) {

//如果到了此处，说明我们找到了一个不应当被包含的元素。我们需要标记这个错误的父元素，以及该元素下的所有节点为“出错类型”，比如

，那么我们需要标记最外层的节点为错误类型节点，以及其所有的子元素全部为错误类型节点。

//Uh-oh, we've found a tag that is not allowed to nest at

//all. Mark the previous one and all of its children as

//malformed to increase our chances of doing RS handling

//on all of them. We want to do this for cases such as:

//Note that we have to iterate through all of the chilren

// of theoriginal malformed tag to protect against:

,so that the

//is allowed to contain the

//XXX What about , where the second closes

//the ?

//需要注意的是，我们必须检查原来错误类型父节点的所有子节点里防止类似

的情况，因为节点是允许包含

节点的（而

节点又允许包含节点），然而它们实际上都处在出现了错误的根节点中。

nsDequeIterator it(theStack,earlyPos), end(theStack.End());

//下面我们需要遍历从出错节点位置，直到栈顶的所有元素，并将他们全部标记为eMalformed，即说明该节点的结构有错误

while(it < end) {

CHTMLToken*theMalformedToken =

static_cast(it++);

theMalformedToken->SetContainerInfo(eMalformed);

}

theStack.Push(theToken); //将当前token入栈

++theStackDepth; //增加栈的深度

}

break;

//前面我们对开始型节点进行了分析，下面我们将对结束型节点进行处理

case eToken_end: //判断如果是结束型节点，我们需要寻找它对应的起始节点，如果不出意外的话，该起始节点就应当位于当前的栈顶，否则就说明格式有错误

{

CHTMLToken *theLastToken = //获取栈顶元素

static_cast(theStack.Peek());

if(theLastToken) { //如果栈顶元素存在

if(theTag == theLastToken->GetTypeID()) { //找到该节点

theStack.Pop(); // Yank it for real //注意这里我们真正地将其从栈中移除了

theStackDepth--; //减低栈的深度

theLastToken->SetContainerInfo(eWellFormed); //设置其为格式正确

//This token wasn't what we expected it to be! We need to

//go searching for its real start tag on our stack. Each

//tag in between the end tag and start tag must be malformed

//其他情况下，说明当前栈顶元素并不是我们想要的，我们需要去我们的栈中找到其真正对应的开始型节点，此时在开始和结束节点之间的所有节点实际上此时都应是malformed，即结构有问题的，我们需要将所有这些节点进行设置。（如果该结束型Tag根本没有对应的起始节点的情况是什么处理都不用做，因为结束型节点实际上并不存储，其作用只是“关闭”起始型节点，也就是说不考虑上下文的情况下

abc

和

abc

的显示是一样的，后者不会导致什么文法错误，后两个

被自动地忽略了）

if(FindLastIndexOfTag(theTag, theStack) != kNotFound) {

//从栈中找到该节点的起始节点，如果能够找到的话我们就将这两个节点进行close并且出栈，并将其路途中的所有元素设置为malformed，并不进行其他操作，以保持文档整体结构不受影响

//Find theTarget in the stack, marking each (malformed!)

//tag in our way.

//将栈顶元素出栈

theStack.Pop(); // Pop off theLastToken for real.

do{

theLastToken->SetContainerInfo(eMalformed); //设置该元素为eMalformed

//并且将其压入到我们临时设定的栈（其实此处用作队列了）中

tempStack.Push(theLastToken);

//取出下一个栈顶元素

theLastToken = static_cast(theStack.Pop());

//这样循环，直到找到一个和该end类型节点类型相同的起始节点为止

} while(theLastToken && theTag != theLastToken->GetTypeID());

//XXX The above test can confuse two different userdefined

//tags.

//判断theLastToken是否为空，如果为空，说明前面出错误了，即虽然findLastIndexOfTag找到了，但是遍历了整个栈却没找到

NS_ASSERTION(theLastToken,

"FindLastIndexOfTag lied to us!"

" We couldn't find theTag on theStack");

theLastToken->SetContainerInfo(eMalformed);

//Great, now push all of the other tokens back onto the

//stack to preserve the general structure of the document.

//Note that we don't push the target token back onto the

//the stack (since it was just closed).

while(tempStack.GetSize() != 0) {

theStack.Push(tempStack.Pop());

}

break;

default:

break;

}

theToken = (CHTMLToken*)mTokenDeque.ObjectAt(++mTokenScanPos); //获取下一个token

}

return result;

}

//下面这个方法DidTokenize()是Mozilla经典的三部曲方法中的最后一步Did方法，主要进行一些收尾工作，可见其只是单纯地调用了刚才我们的ScanDocStructure()

/**

* This method is called after we're donetokenizing a chunk of data.

* @param aFinalChunk Tells us if this was thelast chunk of data.

* @return Error result.

nsresult

nsHTMLTokenizer::DidTokenize(PRBoolaFinalChunk)

{

return ScanDocStructure(aFinalChunk);

}

//下面的ConsumeToken方法则是真正的对Token进行处理的方法，即其将调用Scanner，判断接下来的Token是什么类型的Token，并且调用处理相应Token类型的处理函数进行处理。

/**

* This method is repeatedly called by thetokenizer.

* Each time, we determine the kind of tokenwe're about to

* read, and then we call the appropriatemethod to handle

* that token type.

* @paramaScanner The source of our input.

* @paramaFlushTokens An OUT parameter to tell the caller whether it should

* process our queued tokensup to now (e.g., when we

* reach a

你可能感兴趣的:(c/c++,数据结构与算法,javascript)

前端小食堂 | Day17 - 前端安全の金钟罩喵爪排序前端安全状态模式
️今日盾牌：XSS/CSRF攻防全解析1.XSS防御の三重结界//危险操作：直接渲染未过滤内容document.getElementById('content').innerHTML=userInput;//✅安全姿势一：文本转义constescapeHTML=(str)=>{constmap={'&':'&','':'>','"':'"',"'":'''};ret
阻止 Mac 在运行任务时进入休眠状态好好学习 666 macos
掌握`Caffeinate`命令：让您的Mac保持清醒以完成关键任务开发人员经常发现自己在Mac上运行持续时间较长的进程。无论是大量文件上传、广泛的数据分析脚本，还是复杂的构建过程，我们最不希望的就是我们的机器在任务中途进入睡眠状态。输入`caffeinate`命令–macOS的内置解决方案，可在您最需要时保持系统唤醒。##睡眠困境MacOS在设计时考虑了电源效率，这对电池寿命非常有用，但在运行时
Python异步编程：从基础到高级 CarlowZJ python 网络数据库
前言在现代软件开发中，异步编程已经成为一种必不可少的技能。Python的异步编程模型（基于asyncio）为开发者提供了一种高效的方式来处理高并发任务，而无需依赖多线程或多进程。异步编程不仅可以提高程序的性能，还能简化并发代码的复杂性。本文将带你从异步编程的基础概念出发，逐步深入到高级应用，帮助你掌握Python异步编程的核心技能。一、异步编程的基础概念1.1什么是异步编程？异步编程是一种编程范式
国内高防加速CDN内容分发服务详细接入教程网友阿贵网站运维 web安全安全性测试安全威胁分析
CDN功能与接入指南CDN（内容分发网络）是一种集安全防护和内容加速于一体的网络解决方案，适用于需要兼顾安全性和访问速度的业务场景。以下是其主要功能与接入步骤：核心功能：免费SSL证书：支持一键申请SSL证书，确保数据传输安全。Web攻击防护：集成WAF防火墙，防御SQL注入、XSS等常见攻击。CC攻击防御：智能识别并拦截恶意请求，保护网站稳定运行。BOT机器人分析：自动识别并管理机器人流量，优化
深度解读 C 语言运算符：编程运算的核心工具烂蜻蜓 C语言 c语言 java 前端
一、引言在C语言的编程世界中，运算符是构建逻辑与运算的基石，它如同一位指挥家，精准地协调着程序中各种数据的操作与处理。C语言丰富多样的运算符涵盖了算术、关系、逻辑、位运算、赋值以及其他杂项运算等多个领域，为开发者提供了强大而灵活的编程手段。深入理解和熟练运用这些运算符，对于编写高效、准确的C语言代码至关重要。接下来，让我们一同走进C语言运算符的精彩世界，探寻其奥秘与应用。二、算术运算符：数值运算的
Mysql 报错: (1364, “Field ‘id‘ doesn‘t have a default value“) Lonelypatients° MySQL mysql
主要原因:在于主键表Id没有设置自增而报错,解决办法:设置主键自增会诱发另一个错误:Cannotchangecolumn'id':usedinaforeignkeyconstraint在于主键id已存在外键关系,不允许随意修改主键的属性值,所以我们须得先把外键关联删除之后,在更改主键,主键更改完毕后,加入外键,就好了
【Q&A】装饰模式在Qt中有哪些运用？浅慕Antonio Q&A qt 数据库服务器
在Qt框架中，装饰模式（DecoratorPattern）主要通过继承或组合的方式实现，常见于IO设备扩展和图形渲染增强场景。以下是Qt原生实现的装饰模式典型案例：一、QIODevice装饰体系（继承方式）场景为基础IO设备（如文件、缓冲区）添加数据格式解析、缓冲优化等功能。类图（Mermaid）«abstract»QIODevice+readData()+writeData()QFileQBuf
聚焦热点 | ISC 2022软件供应链安全治理与运营论坛圆满落幕悬镜安全荣誉资质网络安全行业动态安全 DevSecOps 网络安全软件供应链安全积极防御
“软件供应链的开源化使得软件供应链的各个环节都不可避免地受到开源应用的影响。尤其是开源应用的安全性，将直接影响着软件供应链的安全性。除开源应用开发者在开发过程中引入安全缺陷之外，也可能会存在开发者有目的性地预留的安全缺陷，甚至存在攻击者将含有隐藏性恶意功能的异常行为代码上传到上游开源代码托管平台，以便实施定向软件供应链攻击的安全风险。上述开源应用中存在的众多安全问题，都将导致软件供应链安全隐患大大
Android Google Pay接入 2401_87017192 android windows
//TheBillingClientisready.Youcanquerypurchaseshere.}}@OverridepublicvoidonBillingServiceDisconnected(){//Trytorestarttheconnectiononthenextrequestto//GooglePlaybycallingthestartConnection()method.}});
python实现接口自动化一只小H呀の python 自动化开发语言
代码实现自动化相关理论代码编写脚本和工具实现脚本区别是啥?代码：优点：代码灵活方便缺点：学习成本高工具：优点：易上手缺点：灵活度低，有局限性。总结：功能脚本：工具自动化脚本：代码代码接口自动化怎么做的？第一步：python+request+unittest;具体描述？第二步：封装、调用、数据驱动、日志、报告;详细举例:第三步：api\scripts\data\log\report\until…脚本
前端面试请叫我子鱼编程语言笔试面试程序员 web interview
前端面试之道JS基础知识点及常考面试题原始（Primitive）类型面试题：原始类型有哪几种？null是对象嘛？在JS中，存在着6种原始值，分别是：booleannullundefinednumberstringsymbol首先原始类型存储的都是值，是没有函数可以调用的对象（Object）类型面试题：对象类型和原始类型的不同之处？函数参数是对象会发生什么问题？在JS中，除了原始类型那么其他的都是对
[项目]基于FreeRTOS的STM32四轴飞行器: 十.检测遥控器嵌入式T90S stm32 嵌入式硬件单片机
基于FreeRTOS的STM32四轴飞行器:十.检测遥控器一.检测遥控器连接逻辑二.遥控器的解锁情况三.遥控器控制飞机运转一.检测遥控器连接逻辑判断是否进入定高模式：根据返回值判断遥控器的连接情况：实现检测函数：因为该函数在通信任务中调度6ms一次，可以使用cnt进行计时，判断是否失联：开头初始化cnt为200可以防止一启动没有连接显示连接成功的问题。/***@description:用来检测遥控
C语言 - getchar() 和 getch() 的区别 Peter_Deng. c语言算法
getchar()和getch()都是用于读取单个字符的函数，但它们有一些关键区别，主要涉及缓冲区、回显和移植性。1.getchar()特点头文件：#include从标准输入（stdin）读取一个字符，需要按下Enter才能生效。带缓冲（Buffered）：用户输入的内容会先存入缓冲区，只有按下Enter之后，getchar()才会从缓冲区读取数据。回显（Echo）：输入的字符会显示在屏幕上。代码
chokidar - chokidar 初识（初识案例演示、初识案例解读、初识案例测试）我命由我12345 Node.js 简化库编程 node.js js javascript 前端框架前端 npm html5
一、chokidar1、chokidar概述chokidar是一个用于监视文件系统变化的Node.js库chokidar提供了一种简单、高效的方式来监视文件和目录的创建、修改、删除等操作chokidar是是fs.watch和fs.watchFile方法的增强版，解决了它们在一些平台上的不一致性和局限性2、chokidar的特点跨平台的支持：chokidar在Windows、Linux、macOS上
探索Python中的集成方法：Stacking Echo_Wish Python 笔记 Python 算法 python 开发语言
在机器学习领域，Stacking是一种高级的集成学习方法，它通过将多个基本模型的预测结果作为新的特征输入到一个元模型中，从而提高整体模型的性能和鲁棒性。本文将深入介绍Stacking的原理、实现方式以及如何在Python中应用。什么是Stacking？Stacking，又称为堆叠泛化（StackedGeneralization），是一种模型集成方法，与Bagging和Boosting不同，它并不直
Vue前端实现多个条件表格搜索 1724580787 前端 vue.js javascript
文章目录操作实现效果测试json数据搜索栏条件过滤完成搜索表格栏完整代码操作实现效果在vue文件中通过js代码完成多条件搜索符合条件的table数据，本文使用了element-ui组件创建表格。效果如下图所示：测试json数据[{"test1":"","test2":"","test3":"","test4":""}...//这里只展示一条数据]搜索栏条件过滤完成搜索computed计算方法监视t
【Python】 Stacking: 强大的集成学习方法音乐学家方大刚 Python python 集成学习开发语言
我们都找到天使了说好了心事不能偷藏着什么都一起做幸福得没话说把坏脾气变成了好沟通我们都找到天使了约好了负责对方的快乐阳光下的山坡你素描的以后怎么抄袭我脑袋想的薛凯琪《找到天使了》在机器学习中，单一模型的性能可能会受到其局限性和数据的影响。为了解决这个问题，我们可以使用集成学习（EnsembleLearning）方法。集成学习通过结合多个基模型的预测结果，来提高整体模型的准确性和稳健性。Stacki
MiniMind：3小时完全从0训练一个仅有26M的小参数GPT，最低仅需2G显卡即可推理训练！哈罗·沃德 LLM gpt
MiniMind：3小时完全从0训练一个仅有26M的小参数GPT，最低仅需2G显卡即可推理训练！概述MiniMind是一个开源的微型语言模型，它的设计目标是让个人GPU用户也能够快速推理甚至训练语言模型。它的体积仅为26M，大约是GPT3的1/7000，非常适合快速部署和实验。https://github.com/user-attachments/assets/88b98128-636e-43bc
llama源码学习·model.py[3]ROPE旋转位置编码(2)旋转角度生成代码小杜不吃糖 llama
一、源码注释defprecompute_freqs_cis(dim:int,end:int,theta:float=1000.0):'''预先计算频率和复数的cosine和sine值，用于后续的PositionalEncodingdim:维度end:一个序列的最大长度或位置的最大值theta:用于计算频率的超参数，默认值为1000.0'''#生成一个等比数列，即频率（frequencies），这种
跟着黑马学MySQL基础篇笔记(1)-概述与SQL 小杜不吃糖 mysql 笔记 sql
03.安装与启动启动netstartmysql80netstopmysql80客户端连接mysql[-h127.0.0.1][-P3306]-uroot-p04.mysql数据模型关系型数据库RDBMS05.通用语法及分类DDL：数据定义语言，用来定义数据库对象（数据库，表，字段）DML：数据操作语言，用来对数据库表中的数据进行增删改DQL：数据查询语言，用来查询数据库中表的记录DCL：数据控制语
PostgreSQL_数据使用与日数据分享程序猿与金融与科技数据库 postgresql
目录前置：1使用1.1获取前复权因子1.2查询股票的纵向数据1.3查询股票的横向数据2日数据分享（截止至：2025-03-21）总结前置：本博文是一个系列。在本人“数据库专栏”-》“PostgreSQL_”开头的博文。本文为该系列最后一篇。1使用1.1获取前复权因子访问优矿官网ticker_list=[]field_list=['secID','tradeDate','accumAdjFactor
（链表）19. 删除链表的倒数第 N 个结点蹉跎x 力扣链表数据结构算法
给你一个链表，删除链表的倒数第n个结点，并且返回链表的头结点。示例1：输入：head=[1,2,3,4,5],n=2输出：[1,2,3,5]示例2：输入：head=[1],n=1输出：[]示例3：输入：head=[1,2],n=1输出：[1]提示：链表中结点的数目为sz1next=head;intcnt=-1;ListNode*cur=dummyhead;while(cur!=nullptr){c
hadoop3.x--搭建hadoop高可用集群（HA模式）运维小菜 hadoop hadoop hdfs
hadoop高可用集群（HA模式）一、安装前1.集群规划2.安装前配置3.安装jdk与hadoop4.克隆虚拟机与互信配置5.搭建zookeeper集群二、HDFS1.配置hdfs2.初始化启动hdfs集群三、MapReduce与Yarn1.配置MapReduce2.配置yarn3.启动yarn四、验证1.查看java进程2.hdfs与yarn前台页面一、安装前1.集群规划hostnameipNN
minimind2学习：（1）训练溯源006 minimind学习学习深度学习生成模型
1、数据下载参考：https://github.com/jingyaogong/minimind/tree/master2、预训练训练6个epochspythontrain_pretrain.py--epochs6训练过程：LLM总参数量：25.830百万Epoch:[1/6](0/11040)loss:8.940lr:0.000550000000epoch_Time:106.0min:Epoch
DPO 核心理论推导：参考策略距离约束下的最优策略 + 损失函数设计 iiiiii11 机器学习人工智能论文阅读笔记语言模型深度学习
Rafailov,Rafael,etal.“Directpreferenceoptimization:Yourlanguagemodelissecretlyarewardmodel.”AdvancesinNeuralInformationProcessingSystems36(2023):53728-53741.本文整理了DPO论文中两个核心结论的推导，包括参考策略距离约束下的最优策略的形式，以及
llama-factory 微调 Qwen2.5-3B-Instruct coco_1998_2 llama factory fine tune
0、资源链接官方readme:https://github.com/hiyouga/LLaMA-Factory/blob/v0.9.1/README_zh.md官方文档:https://llamafactory.readthedocs.io/zh-cn/latest/官方推荐的知乎教程：https://zhuanlan.zhihu.com/p/6952876071、安装LLaMAFactorygi
Stacking算法：集成学习的终极武器 civilpy 算法集成学习机器学习
Stacking算法：集成学习的终极武器在机器学习的竞技场中，集成学习方法以其卓越的性能而闻名。其中，Stacking（堆叠泛化）作为一种高级集成技术，更是被誉为“集成学习的终极武器”。本文将带你深入了解Stacking算法的原理和实现，并提供一些实战技巧和最佳实践。1.Stacking算法原理探秘Stacking算法的核心思想是训练多个不同的基模型，并将它们的预测结果作为新模型的输入特征，以此来
Android 车联网——汽车系统介绍（附2） c小旭 Android 车联网 android 车联网
汽车系统指的是由多个模块或组件组成的系统，如发动机系统、制动系统、空调系统等，这些系统通常由多个ECU协同工作来完成特定的任务。一、汽车系统1、防抱死制动系统ABS（Anti-lockBrakingSystem，防抱死制动系统）是一项重要的汽车安全技术，其主要功能是在车辆紧急制动时防止车轮完全锁死（抱死）。ABS系统通过自动控制制动力，使得车轮在制动过程中仍然能够保持一定的转动，从而避免因车轮抱死
直方图梯度提升：大数据时代的极速决策引擎万事可爱^ 大数据机器学习深度学习直方图梯度提升 GBDT 算法
一、为什么需要直方图梯度提升？在Kaggle竞赛的冠军解决方案中，超过70%的获奖方案都使用了梯度提升算法。但当数据量突破百万级时，传统梯度提升树（GBDT）面临三大致命瓶颈：训练耗时剧增：每个特征的分割点计算都需要全量数据排序内存消耗爆炸：存储排序后的特征值需要额外空间处理效率低下：无法有效利用现代CPU的多核特性而梯度提升决策树（GBDT）作为集成学习的代表算法，通过迭代构建决策树实现预测能力
StarRocks 排查单副本表 Shyllin StarRocks StarRocks
文章目录StarRocks排查单副本表方式1查询元数据，检查分区级的副本数方式2SHOWPARTITIONS命令查看ReplicationNum修改副本数命令StarRocks排查单副本表方式1查询元数据，检查分区级的副本数#方式一查询元数据，检查分区级的副本数withv_tmp1as(selectTABLE_ID,PARTITION_ID,tablet_id,count(*)ascntfromi
ASM系列五利用TreeApi 解析生成Class lijingyao8206 ASM 字节码动态生成 ClassNode TreeAPI
前面CoreApi的介绍部分基本涵盖了ASMCore包下面的主要API及功能，其中还有一部分关于MetaData的解析和生成就不再赘述。这篇开始介绍ASM另一部分主要的Api。TreeApi。这一部分源码是关联的asm-tree-5.0.4的版本。在介绍前，先要知道一点， Tree工程的接口基本可以完
链表树——复合数据结构应用实例 bardo 数据结构树型结构表结构设计链表菜单排序
我们清楚：数据库设计中，表结构设计的好坏，直接影响程序的复杂度。所以，本文就无限级分类（目录）树与链表的复合在表设计中的应用进行探讨。当然，什么是树，什么是链表，这里不作介绍。有兴趣可以去看相关的教材。需求简介：经常遇到这样的需求，我们希望能将保存在数据库中的树结构能够按确定的顺序读出来。比如，多级菜单、组织结构、商品分类。更具体的，我们希望某个二级菜单在这一级别中就是第一个。虽然它是最后
为啥要用位运算代替取模呢 chenchao051 位运算哈希汇编
在hash中查找key的时候，经常会发现用&取代%，先看两段代码吧， JDK6中的HashMap中的indexFor方法： /** * Returns index for hash code h. */ static int indexFor(int h, int length) {
最近的情况麦田的设计者生活感悟计划软考想
今天是2015年4月27号整理一下最近的思绪以及要完成的任务 1、最近在驾校科目二练车，每周四天，练三周。其实做什么都要用心，追求合理的途径解决。为
PHP去掉字符串中最后一个字符的方法 IT独行者 PHP 字符串
今天在PHP项目开发中遇到一个需求，去掉字符串中的最后一个字符原字符串1,2,3,4,5,6, 去掉最后一个字符","，最终结果为1,2,3,4,5,6 代码如下： $str = "1,2,3,4,5,6,"; $newstr = substr($str,0,strlen($str)-1); echo $newstr;
hadoop在linux上单机安装过程 _wy_ linux hadoop
1、安装JDK jdk版本最好是1.6以上，可以使用执行命令java -version查看当前JAVA版本号，如果报命令不存在或版本比较低，则需要安装一个高版本的JDK，并在/etc/profile的文件末尾，根据本机JDK实际的安装位置加上以下几行： export JAVA_HOME=/usr/java/jdk1.7.0_25
JAVA进阶----分布式事务的一种简单处理方法无量多系统交互分布式事务
每个方法都是原子操作：提供第三方服务的系统，要同时提供执行方法和对应的回滚方法 A系统调用B,C,D系统完成分布式事务 =========执行开始======== A.aa(); try { B.bb(); } catch(Exception e) { A.rollbackAa(); } try { C.cc(); } catch(Excep
安墨移动广告：移动DSP厚积薄发引领未来广告业发展命脉矮蛋蛋 hadoop 互联网
　　“谁掌握了强大的DSP技术，谁将引领未来的广告行业发展命脉。”2014年，移动广告行业的热点非移动DSP莫属。各个圈子都在纷纷谈论，认为移动DSP是行业突破点，一时间许多移动广告联盟风起云涌，竞相推出专属移动DSP产品。　　到底什么是移动DSP呢? 　　DSP(Demand-SidePlatform)，就是需求方平台，为解决广告主投放的各种需求，真正实现人群定位的精准广
myelipse设置 alafqq IP
在一个项目的完整的生命周期中，其维护费用，往往是其开发费用的数倍。因此项目的可维护性、可复用性是衡量一个项目好坏的关键。而注释则是可维护性中必不可少的一环。注释模板导入步骤安装方法：打开eclipse/myeclipse 选择 window-->Preferences-->JAVA-->Code-->Code
java数组百合不是茶 java数组
java数组的声明创建初始化； java支持C语言数组中的每个数都有唯一的一个下标一维数组的定义声明： int[] a = new int[3];声明数组中有三个数int[3] int[] a 中有三个数，下标从0开始，可以同过for来遍历数组中的数
javascript读取表单数据 bijian1013 JavaScript
利用javascript读取表单数据，可以利用以下三种方法获取： 1、通过表单ID属性：var a = document.getElementByIdx_x_x("id"); 2、通过表单名称属性：var b = document.getElementsByName("name"); 3、直接通过表单名字获取：var c = form.content.
探索JUnit4扩展：使用Theory bijian1013 java JUnit Theory
理论机制（Theory）一.为什么要引用理论机制（Theory）当今软件开发中，测试驱动开发（TDD — Test-driven development）越发流行。为什么 TDD 会如此流行呢？因为它确实拥有很多优点，它允许开发人员通过简单的例子来指定和表明他们代码的行为意图。 TDD 的优点： &nb
[Spring Data Mongo一]Spring Mongo Template操作MongoDB bit1129 template
什么是Spring Data Mongo Spring Data MongoDB项目对访问MongoDB的Java客户端API进行了封装，这种封装类似于Spring封装Hibernate和JDBC而提供的HibernateTemplate和JDBCTemplate，主要能力包括 1. 封装客户端跟MongoDB的链接管理 2. 文档-对象映射，通过注解:@Document(collectio
【Kafka八】Zookeeper上关于Kafka的配置信息 bit1129 zookeeper
问题： 1. Kafka的哪些信息记录在Zookeeper中 2. Consumer Group消费的每个Partition的Offset信息存放在什么位置 3. Topic的每个Partition存放在哪个Broker上的信息存放在哪里 4. Producer跟Zookeeper究竟有没有关系？没有关系！！！ //consumers、config、brokers、cont
java OOM内存异常的四种类型及异常与解决方案 ronin47 java OOM 内存异常
　OOM异常的四种类型：　　　　　一：　StackOverflowError ：通常因为递归函数引起（死递归，递归太深）。-Xss 128k 一般够用。　二：　out Of memory: PermGen Space：通常是动态类大多，比如web 服务器自动更新部署时引起。-Xmx
java-实现链表反转-递归和非递归实现 bylijinnan java
20120422更新：对链表中部分节点进行反转操作，这些节点相隔k个： 0->1->2->3->4->5->6->7->8->9 k=2 8->1->6->3->4->5->2->7->0->9 注意1 3 5 7 9 位置是不变的。解法：将链表拆成两部分： a.0-&
Netty源码学习-DelimiterBasedFrameDecoder bylijinnan java netty
看DelimiterBasedFrameDecoder的API，有举例：接收到的ChannelBuffer如下： +--------------+ | ABC\nDEF\r\n | +--------------+ 经过DelimiterBasedFrameDecoder(Delimiters.lineDelimiter())之后，得到： +-----+----
linux的一些命令 -查看cc攻击-网口ip统计等 hotsunshine linux
Linux判断CC攻击命令详解 2011年12月23日 ⁄ 安全 ⁄ 暂无评论查看所有80端口的连接数 netstat -nat|grep -i '80'|wc -l 对连接的IP按连接数量进行排序 netstat -ntu | awk '{print $5}' | cut -d: -f1 | sort | uniq -c | sort -n 查看TCP连接状态 n
Spring获取SessionFactory ctrain sessionFactory
String sql = "select sysdate from dual"; WebApplicationContext wac = ContextLoader.getCurrentWebApplicationContext(); String[] names = wac.getBeanDefinitionNames(); for(int i=0; i&
Hive几种导出数据方式 daizj hive 数据导出
Hive几种导出数据方式 1.拷贝文件如果数据文件恰好是用户需要的格式，那么只需要拷贝文件或文件夹就可以。 hadoop fs –cp source_path target_path 2.导出到本地文件系统 --不能使用insert into local directory来导出数据，会报错 --只能使用
编程之美 dcj3sjt126com 编程 PHP 重构
我个人的 PHP 编程经验中，递归调用常常与静态变量使用。静态变量的含义可以参考 PHP 手册。希望下面的代码，会更有利于对递归以及静态变量的理解 header("Content-type: text/plain"); function static_function () { static $i = 0; if ($i++ < 1
Android保存用户名和密码 dcj3sjt126com android
转自：http://www.2cto.com/kf/201401/272336.html 我们不管在开发一个项目或者使用别人的项目，都有用户登录功能，为了让用户的体验效果更好，我们通常会做一个功能，叫做保存用户，这样做的目地就是为了让用户下一次再使用该程序不会重新输入用户名和密码，这里我使用3种方式来存储用户名和密码 1、通过普通的txt文本存储 2、通过properties属性文件进行存
Oracle 复习笔记之同义词 eksliang Oracle 同义词 Oracle synonym
转载请出自出处：http://eksliang.iteye.com/blog/2098861 1.什么是同义词同义词是现有模式对象的一个别名。概念性的东西，什么是模式呢？创建一个用户，就相应的创建了一个模式。模式是指数据库对象，是对用户所创建的数据对象的总称。模式对象包括表、视图、索引、同义词、序列、过
Ajax案例 gongmeitao Ajax jsp
数据库采用Sql Server2005 项目名称为:Ajax_Demo 1.com.demo.conn包 package com.demo.conn; import java.sql.Connection;import java.sql.DriverManager;import java.sql.SQLException; //获取数据库连接的类public class DBConnec
ASP.NET中Request.RawUrl、Request.Url的区别 hvt .net Web C#asp.net hovertree
如果访问的地址是：http://h.keleyi.com/guestbook/addmessage.aspx?key=hovertree%3C&n=myslider#zonemenu那么Request.Url.ToString() 的值是：http://h.keleyi.com/guestbook/addmessage.aspx?key=hovertree<&
SVG 教程（七）SVG 实例，SVG 参考手册天梯梦 svg
SVG 实例在线实例下面的例子是把SVG代码直接嵌入到HTML代码中。谷歌Chrome，火狐，Internet Explorer9，和Safari都支持。注意：下面的例子将不会在Opera运行，即使Opera支持SVG - 它也不支持SVG在HTML代码中直接使用。 SVG 实例 SVG基本形状一个圆矩形不透明矩形一个矩形不透明2 一个带圆角矩
事务管理 luyulong java spring 编程事务
事物管理 spring事物的好处为不同的事物API提供了一致的编程模型支持声明式事务管理提供比大多数事务API更简单更易于使用的编程式事务管理API 整合spring的各种数据访问抽象 TransactionDefinition 定义了事务策略 int getIsolationLevel()得到当前事务的隔离级别 READ_COMMITTED
基础数据结构和算法十一：Red-black binary search tree sunwinner Algorithm Red-black
The insertion algorithm for 2-3 trees just described is not difficult to understand; now, we will see that it is also not difficult to implement. We will consider a simple representation known
centos同步时间 stunizhengjia linux 集群同步时间
做了集群，时间的同步就显得非常必要了。以下是查到的如何做时间同步。在CentOS 5不再区分客户端和服务器，只要配置了NTP，它就会提供NTP服务。 1)确认已经ntp程序包： # yum install ntp 2)配置时间源（默认就行，不需要修改） # vi /etc/ntp.conf server pool.ntp.o
ITeye 9月技术图书有奖试读获奖名单公布 ITeye管理员 ITeye
ITeye携手博文视点举办的9月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 9月试读活动回顾：http://webmaster.iteye.com/blog/2118112本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《NFC：Arduino、Andro

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他