iteye_14050

Mozilla FireFox Gecko内核源代码解析(1.nsParser)

Mozilla FireFox Gecko内核源代码解析

(1.nsParser)

中科院计算技术研究所网络数据科学与工程研究中心-信息抽取小组

耿耘

前言:

在Web信息抽取的工作过程中，我们主要处理的都是经过各种处理HTML格式文档，而无论是DOM方式还是视觉方式的信息抽取，都需要对HTML进行解析，而最标准的解析器莫过于浏览器内核引擎，因此，对于浏览器内核进行研究会对我们的工作和学习带来很大的帮助。

Mozilla FireFox浏览器的内核Gecko是一款非常成功的开源浏览器内核引擎，但其公认的弊病是XPCOM和XUL复杂的体系让许多开发人员望而却步，本系列文档主要针对Gecko内核工作原理和工作方式进行了逐行代码的详细解析，从工作流程上来讲就是从负责HTML分析的代码开始，直到渲染视觉模型模块为止。

本文档单纯地对源代码进行了注释型解释，并在适当位置加入了一些说明信息，其中不包括浏览器的整体结构等信息，在阅读本文档前，读者可以先对MDN，Bugzilla等网站上的文档进行阅读和调研，大体掌握Gecko以及FireFox浏览器的工作原理，以及一些基本的XPCOM组件知识(类似于微软的COM)，这样会对理解本文档带来很大帮助。同时本文档的编码中使用了大量的类型名都是经过重定义的，如nsresult实际上是int，以及Int32，nsCOMPtr等，我在相应的地方加上了一些定义它们的.h文件的名称，希望能帮助大家理解。

请注意本文档只包括Gecko代码的解析，不包括：网络通讯模块Necko，浏览器界面生成组件XULRunner，构件支持模块XPCOM，JS引擎SpiderMonkey等非内核模块等。

本系列文档代码针对Mozilla 1.8.2版本。

如果您在阅读过程中发现了什么问题，请您联系[email protected]，十分感谢。

简介：

在Gecko中，包含了一个对于HTML文档进行解析并生成DOM树（Gecko中称为内容模型ContentModel）的模块，这个模块可以统称为nsHTMLParser，它由多个组件构成，如负责字符串扫描的nsScanner，负责分词的nsTokenizer，负责语法检查的DTD，以及负责建立DOM树的ContentSink等。我们这篇文档首先针对其主要的流程控制文件nsParser.h(.cpp)进行解析。

读者在刚开始上手理解HtmlParser的时候，可能会比较困难，因为它和其他的模块进行了很密切的交互和耦合，这篇文档希望能够帮助读者更加容易地理解parser的结构和行为，当读者了解了其他模块后，再去理解这个模块可能就会容易很多。

在阅读Mozilla源代码的时候，需要注意它为了跨硬件跨平台的考虑，重新定义了许多数据类型，如32位机器下的int，会被定义为PRInt32等。以及一些对变量进行Bool结果判断的NS_FAILED()，NS_ASSERTION()等。这些函数最好的了解方式是去看.h文件中的声明，如prtype.h，nscore.h等。

Mozilla FireFox的前身是Netscape浏览器，大部分核心代码都是Netscape的代码，因此大部分代码前面都有ns字样，而接口类型的类则一般声明为nsI字样。

源代码解析：

如果想快速地了解Parser的使用流程，可以查看parser/htmlparser/tests/html下的TestParser.cpp文件。这个文件实际上是用来测试Parser模块功能的。

该模块通过用户输入的参数，单纯地读取某个Html文件并进行解析。需要注意的是，标准的Html解析并不是仅仅打开一个文件或者获取一个输入流并进行解析这么简单，不过这个我们放在后面进行解释。

这里我们先通过分析这部分源代码进行一下大体了解。首先从其主函数入手：

TestParser
nsresult ParseData(char* anInputStream,charanOutputStream) { NS_ENSURE_ARG_POINTER(anInputStream); //确保anInputStream参数正确 NS_ENSURE_ARG_POINTER(anOutputStream); //确保anOutputStream参数正确 nsresult result = NS_OK; //nsresult数据类型和NS_OK数据类型都是ns中自定义的数据类型，请参考nscore.h // Create a parser nsCOMPtr parser(do_CreateInstance(kParserCID,&result)); //创建一个parser if (NS_FAILED(result)) { //如果创建Parser失败 printf("\nUnable to create aparser\n"); //弹出错误信息 return result; } // Create a sink nsCOMPtr sink(do_CreateInstance(kLoggingSinkCID,&result)); //创建一个LoggingSink if (NS_FAILED(result)) { //如果创建Sink失败 printf("\nUnable to create asink\n"); //弹出错误信息 return result; } int main(int argc, charargv) { if (argc < 3) { //如果参数数量小于3，说明输入错误 printf("\nUsage: \n"); //提示用户参数输入方式 return -1; } nsresult rv = NS_InitXPCOM2(nsnull, nsnull, nsnull); //这里测试一下NS的组件机制是否能够正确初始化 if (NS_FAILED(rv)) { //如果不能 printf("NS_InitXPCOM2 failed\n"); //报错 return -1; } ParseData(argv[1],argv[2]); //这是解析函数的主体，并将用户输入的第一个和第二个参数传递给函数。 return 0; } PRFileDesc out = PR_Open(anOutputStream, PR_CREATE_FILE\|PR_TRUNCATE\|PR_RDWR, 0777); if (!out) { //如果无法打开输出流 printf("\nUnableto open output file - %s\n", anOutputStream); //则报错 returnresult; } nsString stream; charbuffer[1024] = {0}; // XXX Yikes! //用来存放读取的Html流 PRBool done = PR_FALSE; PRInt32 length = 0; while(!done){ //循环地将html字段都写入stream中，每次只读1024字节，可能为了模拟缓冲区大小吧 length = PR_Read(in, buffer, sizeof(buffer)); //读取参数 if (length!= 0) { //如果确实读进来了字节 stream.Append(NS_ConvertUTF8toUTF16(buffer, length)); // } else { //如果读进来的是空内容 done=PR_TRUE; //说明全部读取完毕，退出循环 } } sink->SetOutputStream(out); //设置输出流 parser->SetContentSink(sink); //为parser设置配合其工作的contentsink result = parser->Parse(stream, 0,NS_LITERAL_CSTRING("text/html"),PR_TRUE); //这句就是调用Parser::Parse()方法执行解析的语句了，具体方法我们放在后面进行分析。 PR_Close(in); //关闭输入流 PR_Close(out); //关闭输出流 returnresult; }

因为每一个HtmlParser都要有一个ContentSink来接收输出，这里创建的LoggingSink实际上就是ContentSink，只不过将ContentSink的输出改为直接输出消息到输出流中，而不是标准地输入到后面的模块，这是专门为测试而建立的Sink，具体可见nsILoggingSink.h的代码说明。

下面我们分析重要的htmlparser部分代码。

打开htmlparser文件夹，可以看到很清晰的三个文件夹：public，src，tests。其中public中包含的大部分是公用的一些头文件，以及一些parser所引用的其他模块的头文件，如nsIContentSink.h等。而tests中则是一些测试用的相关内容，包括了一个随机的html文件生成器，一些html测试用例页面，以及一些测试结果等。开源代码的作者很有意思，自己的很多工作痕迹都上传在SVN上，我们可以利用这些结果去帮助我们进行分析。

Parser类说明：

首先我们可以看一下nsParser.h的开头注释，可知Parser类主要提供两项主要功能：

1)它遍历在分词过程(tokenization process)中产生的词条(tokens)，识别出各个元素的起始和结束（进行验证和标准化）。

2)它控制并协调一个IContentSink的接口，来产生内容模型(content model)。

这个类在解析Html的时候，不会默认Html文档是有结构的（即不会认为Html文档一定包含BODY，HEAD等模块内容），因此也就不包含一些类似DoBody()，DoHead()之类的方法。

另外，为了让我们的解析过程能够自后向前兼容（即是说和Html流的顺序无关），我们必须扫描每个Token并且实施以下一些基本操作：

1)确定每个Token的类型（这个很简单，因为每个Token中就包含了这个信息）

2)确定每个Token所应当处在Html文档中的哪个位置（是在BODY，HEAD，还是FRAMESET等）

3)将解析好的Content通过ContentSink插入到Document的合适位置。

4)对于属于BODY部分的tags，我们必须确保通过Document的状态能够确定出正确的解析上下文。即是说，比如我们看到了一个标签，那么我们必须确定我们的Document中包含了一个table，能够让该正确地插入进去。这潜在地起到了“容器”的作用，即保证我们的Html是结构正确的。

我们首先来分析nsParser.h(.cpp)。该类是解析器的主体类。

nsParser.h
#ifndefNS_PARSER__ #defineNS_PARSER__ #include "nsIParser.h" #include "nsDeque.h" #include "nsParserNode.h" #include "nsIURL.h" #include "CParserContext.h" #include "nsParserCIID.h" #include "nsITokenizer.h" #include "nsHTMLTags.h" #include "nsDTDUtils.h" #include "nsTimer.h" #include "nsThreadUtils.h" #include "nsIContentSink.h" #include "nsIParserFilter.h" #include "nsCOMArray.h" #include "nsIUnicharStreamListener.h" #include "nsCycleCollectionParticipant.h" classnsICharsetConverterManager; classnsICharsetAlias; classnsIDTD; classnsScanner; classnsSpeculativeScriptThread; classnsIThreadPool; #ifdef_MSC_VER #pragma warning( disable :4275 ) #endif //这段代码主要是一些头文件包含声明，以及一些前置声明。我们跳过这段代码直接看后面的 classnsParser : public nsIParser, publicnsIStreamListener { //nsParser继承自两个基类：nsIParser，nsIStreamListener，前者是基本接口，而后者则是为了和Necko进行通讯所用的基类。 public: /** * Called on module init / static nsresult Init(); //初始化的方法 /* * Called on module shutdown / static void Shutdown(); //关闭方法 NS_DECL_CYCLE_COLLECTING_ISUPPORTS //这两个是在前面的nsISupportImpl.h中#Define过的，主要定义了一些接口 NS_DECL_CYCLE_COLLECTION_CLASS_AMBIGUOUS(nsParser, nsIParser) /* * default constructor * @update gess5/11/98 / nsParser(); //构造方法 /* * Destructor * @update gess5/11/98 / virtual ~nsParser(); //析构方法 /* * Select given content sink into parserfor parser output * @update gess5/11/98 * @paramaSink is the new sink to be used by parser * @returnold sink, or NULL / NS_IMETHOD_(void)SetContentSink(nsIContentSink aSink); //为该Parser设置对应的ContentSink，ContentSink就是用来建立DOM树所用到的模块 /** * retrive the sink set into the parser * @update gess5/11/98 * @paramaSink is the new sink to be used by parser * @returnold sink, or NULL / NS_IMETHOD_(nsIContentSink)GetContentSink(void); //获取该Parser所对应的ContentSink /** Call this method once you've created a parser, and want to instruct it about the command which caused the parser to be constructed. Forexample, this allows us to select a DTD which can do, say, view-source. @update gess 3/25/98 @param aCommand -- ptrs tostring that contains command @return nada / NS_IMETHOD_(void)GetCommand(nsCString& aCommand); //获取当前Parser的指令方式 NS_IMETHOD_(void) SetCommand(const charaCommand); //为当前的Parser进行指令设置 NS_IMETHOD_(void)SetCommand(eParserCommands aParserCommand); //同上，形参不同 //根据程序注释，这里主要是设定Parser的工作方式，解析器有多种工作模式，HTML模式，查看源代码模式，这里可以对其进行设置，还有可以对后面我们会用到的DTD进行设置，Parser在对不同的Html文档进行解析时需要进行不同的操作，这些我们后面再进行解释。 /* Call this method once you've created a parser, and want to instruct it about what charset to load * @update ftang 4/23/99 @param aCharset- the charset ofa document @param aCharsetSource- thesource of the charset @return nada / NS_IMETHOD_(void) SetDocumentCharset(const nsACString& aCharset, PRInt32 aSource); //设置Parser进行文档解析时使用的字符集 NS_IMETHOD_(void) GetDocumentCharset(nsACString& aCharset,PRInt32& aSource) //获取Parser进行文档解析时使用的字符集 { aCharset = mCharset; aSource = mCharsetSource; } NS_IMETHOD_(void) SetParserFilter(nsIParserFilter aFilter); //为Parser设置过滤器 /** * Cause parser to parse input from givenURL * @update gess5/11/98 * @paramaURL is a descriptor for source document * @paramaListener is a listener to forward notifications to * @returnTRUE if all went well -- FALSE otherwise / NS_IMETHOD Parse(nsIURI aURL, nsIRequestObserveraListener = nsnull, voidaKey = 0, nsDTDMode aMode =eDTDMode_autodetect); //这个方法能够从给定的URL参数中，获取Html文档并进行解析 /** * @update gess5/11/98 * @paramanHTMLString contains a string-full of real HTML * @paramappendTokens tells us whether we should insert tokens inline, or appendthem. * @returnTRUE if all went well -- FALSE otherwise / NS_IMETHOD Parse(const nsAString&aSourceBuffer, voidaKey, constnsACString& aContentType, PRBool aLastCall, nsDTDMode aMode =eDTDMode_autodetect); //这个方法能够从给定的aSourceBuffer中获取Html文档并进行解析 NS_IMETHOD_(void ) GetRootContextKey(); //获取位于根部的ParseContext的Key，ParserContext是解析上下文，在解析的过程中为解析提供支持所用的 //以上两个Parser方法有很大不同，虽然都是对Html流进行解析，但是还是有很多区别，这个在对该方法进行解析的时候会进行说明。而对于GetRootContextKey()方法，由于我们的ParserContext们采用的是栈式数据结构，并且用链表方式进行存储，且每个Context都有一个唯一的Key，这个GetRootContextKey()主要是为了获取栈底元素的Key值。 /* * This method needs documentation / NS_IMETHOD ParseFragment(constnsAString& aSourceBuffer, void aKey, nsTArray& aTagStack, PRBool aXMLMode, const nsACString& aContentType, nsDTDMode aMode =eDTDMode_autodetect); NS_IMETHOD ParseFragment(constnsAString& aSourceBuffer, nsISupportsaTargetNode, nsIAtomaContextLocalName, PRInt32aContextNamespace, PRBool aQuirks); //上面这两个方法是主要针对HTML FRAGMENT进行解析的，也就是进行一些简单的HTML TO DOM的解析。其中，第一个方法还可以用来解析XML文档，而第二个方法在目前版本的FireFox里还没有实现。 /** * This method gets called when the tokenshave been consumed, and it's time * to build the model via the content sink. * @update gess5/11/98 * @returnYES if model building went well -- NO otherwise. / NS_IMETHOD BuildModel(void); //上面这个方法是在分词过程结束后，需要调用ContentSink进行输出和建立Content Model的时候调用的方法。 /* Call this when you want control whether or not the parser will parse and tokenize input (TRUE), or whether it just caches input to be parsed later (FALSE). @update gess 9/1/98 @param aState determines whetherwe parse/tokenize or just cache. @return current state / NS_IMETHODContinueParsing(); //让parser继续工作 NS_IMETHODContinueInterruptedParsing(); //让被打断的Parser继续工作 NS_IMETHOD_(void) BlockParser(); //阻塞parser的工作 NS_IMETHOD_(void) UnblockParser(); //解除parser的阻塞 NS_IMETHOD Terminate(void); //结束parser工作 //这几个方法主要是对Parser进行控制的，从字面就很好理解他们的作用。其中parser的阻塞原因可能有很多种，如时间过长等 /** * Call this to query whether the parser isenabled or not. * @update vidur 4/12/99 @return current state / NS_IMETHOD_(PRBool) IsParserEnabled(); //返回paser是否当前可用 /* * Call this to query whether the parserthinks it's done with parsing. * @update rickg 5/12/01 @return complete state / NS_IMETHOD_(PRBool) IsComplete(); //返回paser是否认为自己完成了工作 //需要注意的是，IsComplete()返回的只是从parser本身出发认为自己是否完成了工作。 /* This rather arcane method (hack) is used as a signal between the DTD and the parser. It allows the DTD to tell the parser that content that comes through (parser::parser(string)) but not consumed should propagate into the next string based parse call. * @update gess 9/1/98 @paramaState determines whether we propagate unused string content. @return current state / void SetUnusedInput(nsString&aBuffer); //这个方法主要是设置一个字符串，该字符串中存放的是当前还未处理的字符流，这些字符流只有在下一个parser的调用中才能够被解析 /** * This method gets called (automatically)during incremental parsing * @update gess5/11/98 * @returnTRUE if all went well, otherwise FALSE / virtual nsresult ResumeParse(PRBoolallowIteration = PR_TRUE, PRBool aIsFinalChunk = PR_FALSE, PRBoolaCanInterrupt = PR_TRUE); //这个方法是在进行增量式解析的时候自动被调用的(其实在其他地方也有调用)。 //****************************************** // These methods are callback methods used by // net lib to let us know about ourinputstream. //******************************************* // nsIRequestObserver methods: NS_DECL_NSIREQUESTOBSERVER // nsIStreamListener methods: NS_DECL_NSISTREAMLISTENER //以上两个方法是预先#define好的，用来提供parser的输入用的，让Necko可以通过调用这两个模块来提醒parser有新的输入流了。 void PushContext(CParserContext&aContext); //将Context压栈 CParserContext* PopContext(); //将Context出栈 CParserContext* PeekContext() {return mParserContext;} //查看栈顶的Context //这三个方法很显然是对栈进行操作，而栈中的元素则是Context，我们前面提到过ParserContext是以栈的形式存放的，用来对解析的过程进行支持。 /** * Get the channel associated with thisparser * @update harishd,gagan 07/17/01 * @param aChannel out param that willcontain the result * @return NS_OK if successful / NS_IMETHOD GetChannel(nsIChannel* aChannel); //获取该Parser的数据通道，这个方法主要是获取和该Parser相连的Channel，该Channel是parser获取输入流的来源。 /** * Get the DTD associated with this parser * @update vidur 9/29/99 * @param aDTD out param that will containthe result * @return NS_OK if successful,NS_ERROR_FAILURE for runtime error / NS_IMETHOD GetDTD(nsIDTD* aDTD); //获取该Parser的DTD。 /** * Detects the existence of a META tag withcharset information in * the given buffer. / PRBool DetectMetaTag(const char aBytes, PRInt32 aLen, nsCString&oCharset, PRInt32&oCharsetSource); //在给定的缓冲字符串中寻找标签，返回是否找到 void SetSinkCharset(nsACString&aCharset); //为Sink设置让其使用的字符集 /** Removes continue parsing events @update kmcclusk 5/18/98 / NS_IMETHODIMP CancelParsingEvents(); //删除解析结束时所触发的事件(其实就是清空当前parser里mContinueEvent的值) /* Indicates whether the parser is in a state where it can be interrupted. @return PR_TRUE if parser can be interrupted, PR_FALSE if it can not beinterrupted. @update kmcclusk 5/18/98 / virtual PRBool CanInterrupt(); //返回该parser在解析的时候是否能够被外来事件打断。返回TRUE表示能，返回FALSE表示不能。 /* Set to parser state to indicate whether parsing tokens can beinterrupted @param aCanInterrupt PR_TRUE if parser can be interrupted, PR_FALSE ifit can not be interrupted. @update kmcclusk 5/18/98 / voidSetCanInterrupt(PRBool aCanInterrupt); //设置该parser在进行解析的时候能否被外来事件打断。 /** * This is called when the final chunk hasbeen * passed to the parser and the contentsink has * interrupted token processing. Itschedules * a ParserContinue PL_Event which will askthe parser * to HandleParserContinueEvent when it ishandled. * @update kmcclusk6/1/2001 / nsresult PostContinueEvent(); //触发让parser继续的Event //需要注意的是，上面PostContinueEvent()只能在两种情况下被调用，一个是当所有的数据都输入完毕的时候，还有就是在Parser已经被ContentSink因为处理时间过长而阻塞的时候。 /* Fired when the continue parse event is triggered. @update kmcclusk 5/18/98 / voidHandleParserContinueEvent(classnsParserContinueEvent ); //这个是在上面那个nsContinueEvent被触发的时候进行调用的，具体请见nsContinueEvent的类定义 /** * Called by top-level scanners when datafrom necko is added to * the scanner. * //下面这些代码是为了给高层的扫描器提供一个借口，当数据从necko传输到扫描器的时候被调用 nsresultDataAdded(const nsSubstring& aData,nsIRequest aRequest); //aData是数据，aRequest是数据的请求 staticnsCOMArray sParserDataListeners; //建立一组数据监听器 static nsICharsetAliasGetCharsetAliasService() { return sCharsetAliasService; } //获取字符集编码设置等值 staticnsICharsetConverterManager GetCharsetConverterManager() { return sCharsetConverterManager; } //获取字符集编码转换等功能的服务器 virtual voidReset() { Cleanup(); Initialize(); } //通过调用Cleanup()来清除解析器状态，并通过调用Initialize()来初始化解析器，用来重设解析器的值 nsIThreadPool* ThreadPool() { return sSpeculativeThreadPool; } //这个SpeculativeThread是用来进行预读取用的线程，当Gecko的Html解析被打断时，这个线程会自动地并行去读取HTML文档中以src = URL形式给出的一些应当会用到的CSS，脚本语言文件等数据，这样来提高运行效率 PRBool IsScriptExecuting() { return mSink &&mSink->IsScriptExecuting(); } //通过调用当前解析器所属的ContentSink的IsScriptExecuting()方法来判断是否该ContentSink是否正在进行脚本解析 //下面是protected的一些方法： protected: void Initialize(PRBoolaConstructor = PR_FALSE); //初始化方法 void Cleanup(); //清除解析器状态的方法 /** * * @update gess5/18/98 * @param * @return / nsresult WillBuildModel(nsString& aFilename); //在解析器即将调用ContentSink进行ContentModel建模之前进行调用，做一些准备工作，Mozilla中经常可见这种三部曲式的代码，即以WillDoSomething-DoSomething-DidDoSomething的形式和顺序出现，用来进行运行准备，运行，运行收尾的三步工作。 /* * * @update gess5/18/98 * @param * @return / nsresult DidBuildModel(nsresult anErrorCode); //调用ContentSink进行ContentModel的建立。 void SpeculativelyParse(); //并行进行读取解析 //下面是一些private的分词(tokenization)方法： private: /**************************************** These are the tokenization methods... ***************************************/ / Part of the code sandwich, this gets called right before the tokenization process begins. The main reason for this call is to allow the delegate to do initialization. @update gess 3/25/98 @param @return TRUE if it's ok toproceed / PRBool WillTokenize(PRBool aIsFinalChunk = PR_FALSE); //这个是在进行分词之前进行准备工作的方法 /** This is the primary control routine. It iteratively consumes tokens until an error occurs or you run out of data. @update gess 3/25/98 @return error code / nsresult Tokenize(PRBool aIsFinalChunk = PR_FALSE); //这个就是进行分词的操作，它会不断地对tokens进行处理，直到出错或者处理完毕 /* This is the tail-end of the code sandwich for the tokenization process. It gets called once tokenziation has completed. @update gess 3/25/98 @param @return TRUE if all went well / PRBoolDidTokenize(PRBool aIsFinalChunk = PR_FALSE); //这个是在tokenize处理之后进行收尾的操作 //最后，我们来看一下parser的全部数据成员，对这些数据成员的理解可以帮助我们去分析parser的结构。 protected: //******************************************* // And now, some data members... //******************************************* CParserContext* mParserContext; //用来存放解析的上下文，注意这些上下文之间是以链表的方式进行存储的 nsCOMPtr mDTD; //用来存放一个指向当前所用DTD对象的指针 nsCOMPtrmObserver; //用来观察并接收nsIRequest的监听器 nsCOMPtr mSink; //当前parser所用的ContentSink nsIRunnablemContinueEvent; // weak ref //设置一个指向nsIRunnable类型的指针，该指针指向的函数就是当解析结束的时候所要执行的函数。 nsRefPtrmSpeculativeScriptThread; //当前负责进行资源预读取的线程 nsCOMPtrmParserFilter; //设置一个指针，指向当前解析器的Filter nsTokenAllocatormTokenAllocator; //当前解析器的Token分配器 eParserCommands mCommand; //当前解析器的指令 nsresultmInternalState; //当前解析器的(内部)状态 PRInt32 mStreamStatus; //当前解析器解析流的状态 PRInt32mCharsetSource; //当前的字符集类型(来源) PRUint16 mFlags; //用于对解析器进行一些设置的标志位，如是否启用了Observer等，在后面的函数中会用到，主要是进行一些bit位操作，注意是PRUint16，该类型不同机器下不一样，一般使用unsigned short，也就是占2个字节，16位。 nsString mUnusedInput; //未解析的字符串 nsCString mCharset; //当前解析器的字符集 nsCString mCommandStr; //当前解析器的指令字符 static nsICharsetAlias sCharsetAliasService; //解析器所用的字符集 static nsICharsetConverterManagersCharsetConverterManager; //解析器所用的字符集类型转换器 static nsIThreadPool sSpeculativeThreadPool; //并行预读取资源线程的线程池 enum { kSpeculativeThreadLimit = 15, //设置线程池的上限 kIdleThreadLimit = 0, //设置空闲线程的上限 kIdleThreadTimeout = 50 //设置空闲线程超时的上限阈值 }; public: //设置几个计时器，因为Mozilla Firefox是一款注重人机交互的软件，它非常注重程序的响应时间，因此设置了一些计时器 MOZ_TIMER_DECLARE(mParseTime) //用来测量解析时间 MOZ_TIMER_DECLARE(mDTDTime) //用来测量DTD的处理时间 MOZ_TIMER_DECLARE(mTokenizeTime) //用来测量Tokenize分词过程的处理时间 };

以上就是nsParser.h的代码，下面我们来看nsParser.cpp的代码。

nsParser.cpp
//我们省略它的#include部分 #defineNS_PARSER_FLAG_PARSER_ENABLED0x00000002 #defineNS_PARSER_FLAG_OBSERVERS_ENABLED0x00000004 #defineNS_PARSER_FLAG_PENDING_CONTINUE_EVENT 0x00000008 #defineNS_PARSER_FLAG_CAN_INTERRUPT0x00000010 #defineNS_PARSER_FLAG_FLUSH_TOKENS0x00000020 #defineNS_PARSER_FLAG_CAN_TOKENIZE0x00000040 //首先它定义了几个全局用的值，仔细看可以发现，前三个分别是二进制的第1,2,3位为1，其他位为零，也就是说这几个值不会互相干涉，这也是一种常用的比特标志位赋值方法，用它就可以对我们前面的mFlag标志位进行标示，来标示parser的一些基本状态。而至于这几个16进制值，读者可以自己观察他们的特点和之间的关系。 staticNS_DEFINE_IID(kISupportsIID, NS_ISUPPORTS_IID); staticNS_DEFINE_CID(kCParserCID, NS_PARSER_CID); staticNS_DEFINE_IID(kIParserIID, NS_IPARSER_IID); //以上这三个方法是在nsID.h中定义的多重#DEFINE的方法，读者可以自己去看一下很简单，另外需要注意NS_ISUPPORTS_IID，NS_PARSER_CID和NS_IPARSER_IID的值的特点。 //------------------------------------------------------------------- nsCOMArraynsParser::sParserDataListeners; //这个方法声明了Parser的sParserDataListener指向一个流监听器类型 //源文件中接下来有一段很长的关于nsParser的注释说明，介绍了Parser工作原理的特点。这里对其进行翻译并加以解释一下： //Parser可以被在执行BuildModel()方法时所返回的NS_ERROR_HTMLPARSER_INTERRUPTED值所打断。这会使得Parser停止对当前内容的解析并返回到原先的事件循环中去。此时，Parser中所剩下的未解析的字符串则会被保留下来，直到下一次网络模块的OnDataAvailable()（即有新的数据被接收到时）被调用时再继续解析。然而，如果当所有的Html数据流都已经被接收到，那么则不会再产生新的OnDataAvailable()事件（此时如果parser被打断且还有剩下的未处理数据则会出现问题），因此Parser会设置一个nsParserContinueEvent，这个事件将会在Parser被打断并返回原先的时间循环后被再次调用（使得Parser能够继续处理未处理的数据），而如果此时Parser再次被打断，则他会再给自己加一个nsParserContinueEvent。这一过程会一直持续，直到以下两个情况之一发生为止： // 1)所有剩下的数据能够不被打断地处理到结束 // 2) Parser被撤销 //这一功能目前在CNavDTD和nsHTMLContentSink中所使用。当新的数据块到达并需要进行处理的时候，nsHTMLSink是由CNavDTD进行通知的。当开始进行处理时，nsHTML content sink会记录下开始处理的时间，并且如果处理的时间超过了一个叫做最大tokenizing时间的阈值的话，则会返回一个NS_ERROR_HTMLPARSER_INTERRUPTED的错误。这将允许content sink对一个chunk中一次处理多少数据进行限定，从而也就限定了在事件循环之外的处理最多能耗费多少时间。处理小数据块同样可以减少在低层的reflows(浏览器回流操作，后面会介绍)操作的时间耗费。 //这一功能在读取大文件的时候作用尤其明显。如果最大tokenizing时间设置的足够小，那么浏览器在处理文档时候就能够始终保持和用户的可交互性。 //然而这一功能的一个副作用就是：当最后一部分数据传输到OnDataAvailable()的时候，文件读取工作还没有结束，因为parser可能在最后一部分数据传输到的时候被打断。文档只有在所有的token都被处理过，并且也没有等待处理的nsParserContinueEvents时才算被处理完毕。如果一些应用程序认为它能够通过监视文档的读取请求来判断文档是否读取结束的话，会造成不小的问题。这种问题在Mozilla里就会发生。当所有的文档读取请求都已经被满足时，文档就被认为已经全部读取完毕了。为了拖延文档读取直到所有的解析工作完毕，nsHTMLContentSink加入了一个很笨的解析器读取请求，这个请求始终不会被满足，直到nsHTMLContentSink的DidBuildModel方法被调用了为止。而CNavDTD则能够保证直到最后一块数据通过OnDataAvailable()被传输到解析器中，并且没有任何等待满足的nsParserContinueEvent时，才会去调用DidBuildModel。 //目前Parser在处理script的时候会屏蔽所有中断的请求。这是因为JavaScript修改DOM树的document.write()方法如果被打断，则可能会出现一些错误。 //如果想得到更多的信息，请访问bugzilla76772。 //下面，我们就开始分析nsParser代码的逻辑实体部分，首先是声明前面提到过的nsParserContinueEvent。 classnsParserContinueEvent : public nsRunnable { public: nsRefPtr mParser; //关联性指针，指向该Event所关联的Parser。 nsParserContinueEvent(nsParser aParser) //初始化方法，将mParser赋值 : mParser(aParser) {} NS_IMETHOD Run() //该Event的运行方法 { mParser->HandleParserContinueEvent(this); //调用关联的Parser的方法进行处理 return NS_OK; //返回成功的正确值 } }; //下面是个模板类Holder，用来存放classType的，并提供了一个GET方法返回存放的值，其析构方法就是使用Reaper定义的值进行替代，很简单的实现，主要为主函数提供支持。 template classHolder { public: typedef void(Reaper)(Type ); //定义一个函数指针类型reaper，该类型指针指向void function(Type )类型的函数 Holder(Reaper aReaper) //构造方法 : mHoldee(nsnull), mReaper(aReaper) //将mReaper赋初值 { } ~Holder() { //析构方法 if (mHoldee) { mReaper(mHoldee); //将mReaper里赋上mHoldee的值，即用mHoldee的值去替换当前mReaper所指向的值 } } Type get() { return mHoldee; //返回mHoldee的值 } const Holder &operator=(Type aHoldee) { //重载操作符 if (mHoldee && aHoldee !=mHoldee) { //如果mHoldee不为空且和新的Holdee不同 mReaper(mHoldee); //则mReaper赋值为原先的Holdee } mHoldee = aHoldee; //用新的aHoldee代替原来的mHoldee return this; //将本Holder返回 } private: //前面用到的两个数据成员 Type mHoldee; Reaper mReaper; }; //下面，是预读取资源的解析线程的类声明部分： classnsSpeculativeScriptThread : public nsIRunnable{ //注意它也是继承自nsIRunnable public: nsSpeculativeScriptThread() //构造方法，将各个数据成员赋初值 : mLock(nsAutoLock::DestroyLock), mCVar(PR_DestroyCondVar), mKeepParsing(PR_FALSE), mCurrentlyParsing(PR_FALSE), mNumConsumed(0), mContext(nsnull), mTerminated(PR_FALSE) { } ~nsSpeculativeScriptThread() { //析构方法 NS_ASSERTION(NS_IsMainThread() \|\| !mDocument, //确保不是主线程或解析文档为空 "Destroyingthe document on the wrong thread"); } NS_DECL_ISUPPORTS //详见nsISupportsImpl.h文件 NS_DECL_NSIRUNNABLE nsresult StartParsing(nsParser aParser); //开始进行解析 void StopParsing(PRBool aFromDocWrite); //停止进行解析 enum PrefetchType { NONE, SCRIPT, STYLESHEET, IMAGE};//枚举类型，定义预读取数据的类型 struct PrefetchEntry { //定义一个结构体，为解析过程使用，主要是为了存放一些需要预先读取的数据内容 PrefetchType type; nsString uri; nsString charset; nsString elementType; }; nsIDocument GetDocument() { //私有成员变量访问接口，获取该Thread所关联的Document NS_ASSERTION(NS_IsMainThread(), "Potentialthreadsafety hazard"); return mDocument; } PRBool Parsing() { //私有成员变量访问接口，获取该Thread是否正在Parsing return mCurrentlyParsing; } CParserContext Context() { //私有成员变量访问接口，获取该Thread的ParserContext return mContext; } typedef nsDataHashtable PreloadedType; //定义一个Hashtable类型 PreloadedType& GetPreloadedURIs() { //定义一个获取该Hashtable的GET方法 return mPreloadedURIs; //返回mPreloadedURIs } void Terminate() { //销毁Thread mTerminated = PR_TRUE; //设置销毁标志位 StopParsing(PR_FALSE); //停止解析 } PRBool Terminated() { //获取当前Thread是否处于销毁状态 return mTerminated; } //下面是私有部分 private: void ProcessToken(CToken aToken); //处理Token void AddToPrefetchList(constnsAString &src, //将一个新的需要进行预读取的URL添加到mURLs中去 const nsAString &charset, const nsAString &elementType, PrefetchType type); void FlushURIs(); //将当前缓冲区内的所有的URI数据传输到主线程中进行处理 // These members are only accessed on the speculativelyparsing thread. nsTokenAllocator mTokenAllocator; //私有数据成员，当前线程的TokenAllocator // The following members are shared across the main threadand the // speculatively parsing thread. //以下这些函数会在主线程和次级线程中进行使用 HoldermLock; //同步锁 Holder mCVar; //条件变量 volatile PRBool mKeepParsing; //BOOL变量，标示是否继续进行解析 volatile PRBool mCurrentlyParsing; //BOOL变量，标示当前是否正在解析 nsRefPtr mTokenizer; //当前线程的HTML分词器 nsAutoPtr mScanner; //当前线程的HTML扫描器 enum { kBatchPrefetchURIs = 5 }; //枚举类型，设置缓冲区的大小 nsAutoTArray mURIs; //以数组形式存放当前所有的URIs // Number of characters consumed by the last speculativeparse. //用来存放上一次解析时消耗的字符数 PRUint32 mNumConsumed; // These members are only accessed on the main thread. //下面这些数据成员只有在主线程中才会被调用 nsCOMPtrmDocument; //当前线程的nsIDocument对象 CParserContext mContext; //当前线程的解析上下文mContext。 PreloadedType mPreloadedURIs; //Hash数据表，存放当前解析线程所有的URI PRBool mTerminated; //标示该线程是否被销毁 }; //下面这个CSSLoaderObserver是用来注册一个监听器来接收CSS信息，但是实际上并没有什么作用，只在没有CSS的时候才用到。(即没有CSS文件的时候,同样要实现一个CSSLoaderOberserver接口) /** * Used if we need to pass annsICSSLoaderObserver as parameter, * but don't really need its services / classnsDummyCSSLoaderObserver : publicnsICSSLoaderObserver { public: NS_IMETHOD StyleSheetLoaded(nsICSSStyleSheet aSheet, PRBool aWasAlternate,nsresult aStatus) { return NS_OK; } NS_DECL_ISUPPORTS //事先#define了一些接口的定义,参见nsISupportImpl.h }; //下面这个方法是一个很有意思的方法，通过一个定义好的构件模板，可以为某个内部类添加一个新的方法。具体方法暂不在这篇文档中介绍了，有兴趣的可以去看nsISupportImpl.h文档。 NS_IMPL_ISUPPORTS1(nsDummyCSSLoaderObserver,nsICSSLoaderObserver) //下面是对nsPreloadURIs的定义： classnsPreloadURIs : public nsIRunnable { public: //构造方法，用构造参数aURIs和aSriptThread对两个数据成员进行赋值 nsPreloadURIs(nsAutoTArray &aURIs, nsSpeculativeScriptThreadaScriptThread) : mURIs(aURIs), mScriptThread(aScriptThread) { } NS_DECL_ISUPPORTS //事先#define了一些接口的定义,参见nsISupportImpl.h NS_DECL_NSIRUNNABLE static voidPreloadURIs(const nsAutoTArray &aURIs, nsSpeculativeScriptThread aScriptThread); //读取URIs private: nsAutoTArray mURIs;//数组，存放mURIs nsRefPtr mScriptThread; //指针，指向当前解析线程 }; //下面是利用预先#define好的语句添加线程安全性的支持 NS_IMPL_THREADSAFE_ISUPPORTS1(nsPreloadURIs,nsIRunnable) //之后的Run()方法很简单，就是直接调用内部的PreloadURIs()方法。 NS_IMETHODIMP nsPreloadURIs::Run() //运行方法 { PreloadURIs(mURIs, mScriptThread); //直接调用PreloadURIs，将本身的两个成员变量作为参数传递过去 return NS_OK; //返回成功的值 } //下面我们就来看它本体调用的方法,PreloadURIs()的具体执行方法。 void nsPreloadURIs::PreloadURIs(constnsAutoTArray &aURIs, nsSpeculativeScriptThread aScriptThread) { //首先判断是否是主线程 NS_ASSERTION(NS_IsMainThread(), "Touchingnon-threadsafe objects off thread"); if (aScriptThread->Terminated()) { return; //如果当前线程已经处于销毁状态，则什么事情都不作，直接返回。 } //获取当前线程所对应得nsIDocument对象 nsIDocument doc = aScriptThread->GetDocument(); //如果读取失败,即doc对象为空则报错 NS_ASSERTION(doc, "We shouldn't havestarted preloading without a document"); // Note: Per the code in the HTML content sink, we shouldbe keeping track // of each as it comes. However, becausewe do our speculative // parsing off the main thread, this is hard to emulate.For now, just load // the URIs using the document's base URI at the potentialcost of being // wrong and having to re-load a given relative URI later. //对于HTMLcontent sink中的每一个节点代码，我们都应当跟踪所有的标签，确保基地址的正确。然后，由于我们在主线程之外进行多线程的解析，因此这个跟踪很难实现。目前，我们暂时先用文档的base URI进行其他URIs的读取，虽然这样做可能会出错，我们只能够在出错之后重新再读取相应的相对URI地址。 //首先获取当前doc的BaseURI nsIURI base = doc->GetBaseURI(); //获取文档的编码集 const nsCString &charset = doc->GetDocumentCharacterSet(); //用一个指针的形式，获取当前线程的PreloadedURIs的地址 nsSpeculativeScriptThread::PreloadedType &alreadyPreloaded = aScriptThread->GetPreloadedURIs(); //获取需要preload的URI //对于每一个参数传递进来的URIs进行处理 for (PRUint32 i = 0, e = aURIs.Length(); i < e;++i) { //获取该数据类型的起始地址 constnsSpeculativeScriptThread::PrefetchEntry &pe = aURIs[i]; //一个指向nsIURI类型的指针 nsCOMPtruri; //建立一个新的uri，并调用IO模块去进行读取 nsresult rv = NS_NewURI(getter_AddRefs(uri), pe.uri, charset.get(),base); if (NS_FAILED(rv)) { //如果读取失败 NS_WARNING("Failed to create aURI"); //则报错 continue; //执行下一个循环 } nsCAutoString spec; //新申请一个字符串 uri->GetSpec(spec); //调用GetSpec，获取其URL scheme并将其添加至spec字符串之前 PRBoolanswer; //从当前的alreadyPreloaded的hash列表中查找该spec的URI，是否已经被读取了，如果是则不用再次读取（比如页面上有两张一样的图片，那么只需要读取一次） if (alreadyPreloaded.Get(spec,&answer)) { // Already preloaded. Don't preload again. continue; } //将spec放入已经读取的hash表中，记录其已经被读取 alreadyPreloaded.Put(spec, PR_TRUE); //根据pe的类型，进行不同的读取 switch (pe.type) { case nsSpeculativeScriptThread::SCRIPT: //如果类型是SCRIPT doc->ScriptLoader()->PreloadURI(uri, pe.charset, pe.elementType); //调用doc对象的ScriptLoader对其进行读取 break; case nsSpeculativeScriptThread::IMAGE: //如果是IMAGE doc->MaybePreLoadImage(uri); //调用MaybePreLoadImage（怪不得图像不一定显示出来呢） break; casensSpeculativeScriptThread::STYLESHEET: { //如果是STYLESHEET类型 nsCOMPtr obs = newnsDummyCSSLoaderObserver(); //还记得前面的nsDummyCSSLoaderOberver么？ doc->CSSLoader()->LoadSheet(uri, doc->NodePrincipal(), NS_LossyConvertUTF16toASCII(pe.charset), obs); //调用doc对象的CSSLoader对该uri进行读取 break; } case nsSpeculativeScriptThread::NONE: //如果是空类型（这种情况不应当发生） NS_NOTREACHED("Uninitialized preloadentry?"); //则报错 break; } } } //以上代码主要用来对文档中需要进行预读取的图像，Script代码，CSS格式表等URL进行读取的处理函数。下面，我们来看nsSpeculativeScriptThread的一些具体方法。首先是调用构件的方法，为该线程提供一些线程安全的支持。 NS_IMPL_THREADSAFE_ISUPPORTS1(nsSpeculativeScriptThread,nsIRunnable) //之后是该线程的运行方法Run() NS_IMETHODIMP nsSpeculativeScriptThread::Run() { //判断，预读取行为不能够在主线程上进行 NS_ASSERTION(!NS_IsMainThread(), "Speculativeparsing on the main thread?"); //初始化当前已经解析的数目为0 mNumConsumed = 0; //调用mTokenizer的初始化方法，进行一些初始化 mTokenizer->WillTokenize(PR_FALSE, &mTokenAllocator); //通过对mKeepParsing进行判断，逐步地进行分词，也就是说通过设置这个变量可以打断分词的过程 while (mKeepParsing) { PRBool flushTokens = PR_FALSE; //设置一个布尔变量 nsresult rv = mTokenizer->ConsumeToken(mScanner, flushTokens); //调用ConsumeToken对词条进行读取处理，注意传递进去的参数，一个为使用的扫描器，一个为刚刚设置的FALSE的变量 if (NS_FAILED(rv)) { //如果分词失败 break; //则跳出while循环 } mNumConsumed += mScanner->Mark(); //获取当前已经分词过的词条数 // TODO Don't pop the tokens. CTokentoken; //当mKeepParsing为真并且 while (mKeepParsing && (token =mTokenizer->PopToken())) { //逐token读取 ProcessToken(token); //对token进行处理，后面有详细解析 } } mTokenizer->DidTokenize(PR_FALSE); //分词结束，调用DidTokenize进行一些收尾工作 if (mKeepParsing) { // Ran out of room in this part of thedocument -- flush out the URIs we // gathered so far so we don't end up waitingfor the parser's current // load to finish. //Doucment的当前这部分已经没有剩余空间了---将我们所收集来的URIs传递出去，以便我们不用一直等到parser的当前读取过程完成。 if (!mURIs.IsEmpty()) { //如果当前URIs不为空 FlushURIs(); //传递出去URIs } } { nsAutoLock al(mLock.get()); //获取互斥锁 mCurrentlyParsing = PR_FALSE; //设置标示当前正在处理的变量为FALSE PR_NotifyCondVar(mCVar.get()); //通知正在当前条件变量上等待的线程 } return NS_OK; } //下面是开始进行处理的函数start()方法: nsresult nsSpeculativeScriptThread::StartParsing(nsParseraParser) { //判断当前线程是否是主要线程，如果是则报错，因为这是次级线程 NS_ASSERTION(NS_IsMainThread(), "Calledon the wrong thread"); //判断当前线程是否已经开始处理，如果是则报错 NS_ASSERTION(!mCurrentlyParsing, "Badrace happening"); if (!aParser->ThreadPool()) { //如果作为参数传递进来的parser根本没有线程池 return NS_OK; //则返回 } //获取参数传递进来的parser的contentSink nsIContentSink sink = aParser->GetContentSink(); if (!sink) { //如果获取不到 return NS_OK; //则返回 } nsCOMPtr doc =do_QueryInterface(sink->GetTarget()); //获取该sink的所关联的文档对象mDoucment if (!doc) { //如果获取不到 return NS_OK; //则返回 } nsAutoString toScan; CParserContext context = aParser->PeekContext(); //获取当前parser中位于栈顶的context if (!mLock.get()) { //如果当前没有获取到异步锁，应该说明没有其他线程正在解析 mLock = nsAutoLock::NewLock("nsSpeculativeScriptThread::mLock"); //则申请一个锁 if (!mLock.get()) { //如果申请失败 return NS_ERROR_OUT_OF_MEMORY; //估计是没内存了 } mCVar = PR_NewCondVar(mLock.get()); //申请一个新的条件变量，锁和条件变量需配合使用 if (!mCVar.get()) { //如果申请失败 return NS_ERROR_OUT_OF_MEMORY; } //估计是没内存了 if (!mPreloadedURIs.Init(15)) { //尝试初始化一下mPreloadedURIs的hashtable return NS_ERROR_OUT_OF_MEMORY; //失败估计是没有内存了 } //申请一个新的分词器，使用当前的Context的数据作为初始化参数 mTokenizer = newnsHTMLTokenizer(context->mDTDMode, context->mDocType, context->mParserCommand, 0); if (!mTokenizer) { //如果申请失败 return NS_ERROR_OUT_OF_MEMORY; //估计是没有内存了 } mTokenizer->CopyState(context->mTokenizer); //将该context所对应的Tokenizer中的mFlag，即状态标示变量拷贝过来，拷到现在所新申请的Tokenizer中 context->mScanner->CopyUnusedData(toScan); //并且将改context中未解析完的数据拷贝到toScan变量中 if (toScan.IsEmpty()) { //如果toScan为空，说明要么拷贝失败，要么已经没有未拷贝数据 return NS_OK; } } else if(context == mContext) { //如果获取到了锁，并且当前线程的context等于parser栈顶的Context // Don't parse the same part of the document twice. //避免重复解析 nsScannerIteratorend; context->mScanner->EndReading(end); //获取当前Scanner的结尾位置，并赋值给end nsScannerIterator start; context->mScanner->CurrentPosition(start); //获取当前Scanner的当前位置，并赋值给start if (mNumConsumed >context->mNumConsumed) { // We consumed more the last time we triedspeculatively parsing than we // did the last time we actually parsed. //如果判定成功，说明上次我们读取的数据多于我们上次实际解析了的数据 PRUint32distance = Distance(start, end); //计算start和end之间的距离，并放到distance中 start.advance(PR_MIN(mNumConsumed - context->mNumConsumed,distance)); //将start前进一段距离，这个距离取distance和上次读取数据和上次解析数据之差的最小值 } if (start == end) { //如果start和end相等，说明现在已经解析完毕了，返回即可 // We're at the end of this context's buffer,nothing else to do. return NS_OK; } //将start和end之间的这段数据拷贝至toScan字符串 CopyUnicodeTo(start, end, toScan); }else { // Grab all of the context. //将mScanner中所有未使用的数据拷贝至toScan中 context->mScanner->CopyUnusedData(toScan); if (toScan.IsEmpty()) { // Nothing to parse, don't do anything. //如果此时toScan还为空，那么说明待解析的内容一点也没有了，直接返回 return NS_OK; } } nsCAutoString charset; PRInt32 source; aParser->GetDocumentCharset(charset, source); //获取doucment的字符集 mScanner = new nsScanner(toScan,charset, source); //申请一个新的scanner if (!mScanner) { //如果失败 return NS_ERROR_OUT_OF_MEMORY; //估计是内存不够 } mScanner->SetIncremental(PR_TRUE); //将mScaaner的mIncremental的值设置为TRUE，增量式扫描 mDocument.swap(doc); //交换指针，将doc的值赋值给mDocument mKeepParsing = PR_TRUE; //设置持续解析为TRUE mCurrentlyParsing = PR_TRUE; //设置当前正在解析为TRUE mContext = context; //设置当前线程的mContext为context return aParser->ThreadPool()->Dispatch(this, NS_DISPATCH_NORMAL); //调用组件，将当前线程放入解析器的线程池 } //下面是让解析线程停止的StopParsing()方法。 void nsSpeculativeScriptThread::StopParsing(PRBool/aFromDocWrite/) { //判断是否是主线程，如果是则报错 NS_ASSERTION(NS_IsMainThread(), "Can'tstop parsing from another thread"); //如果获取不到当前的锁变量 if (!mLock.get()) { // If we bailed early out of StartParsing,don't do anything. return; //直接返回 } { nsAutoLock al(mLock.get()); //获取锁 mKeepParsing = PR_FALSE; //设置继续解析位为FALSE if (mCurrentlyParsing) { //如果当前正在解析 PR_WaitCondVar(mCVar.get(), PR_INTERVAL_NO_TIMEOUT); //在条件变量上等待 NS_ASSERTION(!mCurrentlyParsing, "Didn'tactually stop parsing?"); //如果当前不是正在进行解析，则报错 } } // The thread is now idle. if (mTerminated) { //如果设置了销毁标示位 // If we're terminated, then we need to ensurethat we release our document // and tokenizer here on the main thread sothat our last reference to them // isn't our alter-ego rescheduled on another thread. //如果销毁了，我们必须要清空我们的分词器，文档引用对象，这样我们就不会错误地引用他们。 mDocument = nsnull; mTokenizer = nsnull; mScanner = nsnull; } else if(mURIs.Length()) { //如果mURIs的长度不为空 // Note: Don't do this if we're terminated. //读取当前已经解析出来的URIs nsPreloadURIs::PreloadURIs(mURIs,this); //清空当前已经解析出来的URIs mURIs.Clear(); } // Note: Currently, we pop the tokens off (see the commentin Run) so this // isn't a problem. If and when we actually use the tokenscreated // off-thread, we'll need to use aFromDocWrite for real. //因为目前我们是将词条们采用出栈的方式进行处理，因此目前这样做(指以上的操作)不会产生什么问题。但是如果我们想使用多线程情况下产生的tokens的话，就需要使用aFromDocWrite了。 } //下面我们来看一下前面用到过的，对词条进行处理的ProcessToken()方法。 void nsSpeculativeScriptThread::ProcessToken(CTokenaToken) { // Only called on the speculative script thread. //这个方法只会在非主线程中被调用 CHTMLToken token = static_cast(aToken); //首先将该词条进行一个强制类型转换，转换为HTML词条类型 //之后获取该词条的类型，同样需要进行一下强制类型转换 switch (static_cast(token->GetTokenType())){ case eToken_start: { //如果是开始型词条，比如等，结束型为 ,为其设置一个指针 CStartToken start = static_cast(aToken); //获取该词条的类型ID nsHTMLTag tag = static_cast(start->GetTypeID()); //获取该词条的属性总数 PRInt16 attrs = start->GetAttributeCount(); PRInt16 i = 0; //申请几个字符串变量，从变量名应该就能看出是用来存放什么的 nsAutoString src; nsAutoString elementType; nsAutoString charset; nsAutoString href; nsAutoString rel; //申请一个prefetchType类型 PrefetchType ptype = NONE; //下面根据tagID进行判断 switch (tag) { case eHTMLTag_link: //如果是eHTMLTag_link ptype = STYLESHEET; //将前面申请的ptype设置为STYLESHEET，即样式表 break; case eHTMLTag_img: //如果是Tag_img ptype = IMAGE; //将ptype设置为IMAGE break; case eHTMLTag_script: //如果是Tag_script ptype = SCRIPT; //将ptype设置为SCRIPT break; default: //其他情况下不需做这种prefetch的处理 break; } // We currently handle the followingelement/attribute combos : // // 你可能感兴趣的:(Mozilla FireFox Gecko内核源代码解析(1.nsParser)) Python教程：一文了解使用Python处理XPath 旦莫 Python进阶 python 开发语言目录1.环境准备1.1安装lxml1.2验证安装2.XPath基础2.1什么是XPath？2.2XPath语法2.3示例XML文档3.使用lxml解析XML3.1解析XML文档3.2查看解析结果4.XPath查询4.1基本路径查询4.2使用属性查询4.3查询多个节点5.XPath的高级用法5.1使用逻辑运算符5.2使用函数6.实战案例6.1从网页抓取数据6.1.1安装Requests库6.1.2代 python八股文面试题分享及解析(1) Shawn________ python #1.'''a=1b=2不用中间变量交换a和b'''#1.a=1b=2a,b=b,aprint(a)print(b)结果：21#2.ll=[]foriinrange(3):ll.append({'num':i})print(11)结果:#[{'num':0},{'num':1},{'num':2}]#3.kk=[]a={'num':0}foriinrange(3):#0,12#可变类型，不仅仅改变【JS】执行时长(100分) \|思路参考+代码解析（C++） l939035548 JS 算法数据结构 c++ 题目为了充分发挥GPU算力，需要尽可能多的将任务交给GPU执行，现在有一个任务数组，数组元素表示在这1秒内新增的任务个数且每秒都有新增任务。假设GPU最多一次执行n个任务，一次执行耗时1秒，在保证GPU不空闲情况下，最少需要多长时间执行完成。题目输入第一个参数为GPU一次最多执行的任务个数，取值范围[1,10000]第二个参数为任务数组长度，取值范围[1,10000]第三个参数为任务数组，数字范围 ARM中断处理过程落汤老狗嵌入式linux 一、前言本文主要以ARM体系结构下的中断处理为例，讲述整个中断处理过程中的硬件行为和软件动作。具体整个处理过程分成三个步骤来描述：1、第二章描述了中断处理的准备过程2、第三章描述了当发生中的时候，ARM硬件的行为3、第四章描述了ARM的中断进入过程4、第五章描述了ARM的中断退出过程本文涉及的代码来自3.14内核。另外，本文注意描述ARM指令集的内容，有些sourcecode为了简短一些，删除了T 【华为OD技术面试真题 - 技术面】- python八股文真题题库（4) 算法大师华为od 面试 python 华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.Python中的`with`用途和功能自动资源管理示例：文件操作上下文管理协议示例代码工作流程解析优点2.\_\_new\_\_和\_\_init\_\_区别__new____init__区别总结3.切片（Slicing）操作基本切片语法 Python爬虫解析工具之xpath使用详解 eqa11 python 爬虫开发语言文章目录Python爬虫解析工具之xpath使用详解一、引言二、环境准备1、插件安装2、依赖库安装三、xpath语法详解1、路径表达式2、通配符3、谓语4、常用函数四、xpath在Python代码中的使用1、文档树的创建2、使用xpath表达式3、获取元素内容和属性五、总结Python爬虫解析工具之xpath使用详解一、引言在Python爬虫开发中，数据提取是一个至关重要的环节。xpath作为一门 18、架构-可观测性之聚合度量大树~~ 架构 java python 后端架构聚合度量聚合度量是指对系统运行时产生的各种指标数据进行收集、聚合和分析，以了解系统的健康状况和性能表现。聚合度量是可观测性的关键组成部分，通过对度量数据的分析，可以及时发现系统中的异常和瓶颈。以下是对聚合度量各个方面的详细解析，并结合具体的数据案例和技术支撑。指标收集收集系统运行时产生的各种指标数据是聚合度量的基础。常见的指标包括CPU使用率、内存使用率、请求处理时间、请求数、错误率等。以下是指标简介Shell、zsh、bash zhaosuningsn Shell zsh bash shell linux bash Shell是Linux和Unix的外壳，类似衣服，负责外界与Linux和Unix内核的交互联系。例如接收终端用户及各种应用程序的命令，把接收的命令翻译成内核能理解的语言，传递给内核，并把内核处理接收的命令的结果返回给外界，即Shell是外界和内核沟通的桥梁或大门。Linux和Unix提供了多种Shell，其中有种bash，当然还有其他好多种。Mac电脑中不但有bash，还有一个zsh，预装的，据说如何选择最适合你的项目研发管理软件？TAPD卓越版全面解析北京云巴巴信息技术有限公司产品经理需求分析在当今快速发展的科技时代，项目研发管理软件已成为企业不可或缺的重要工具。面对市场上琳琅满目的产品，如何选择一款适合自己团队的项目研发管理软件呢？本文将围绕项目研发管理软件的选择标准，重点介绍TAPD卓越版的特点、优势以及使用体验，让你更好地理解和选择适合自己的项目研发管理软件。项目研发管理软件的选择标准在选择项目研发管理软件时，我们需要考虑以下几个方面的因素：功能全面性：软件是否覆盖了从需求管理、剧本杀《鲸鱼马戏团》剧本杀剧透+真相答案复盘解析攻略 VX搜_奶茶剧本杀本文为剧本杀《鲸鱼马戏团》剧本杀测评+部分真相复盘，获取完整真相复盘只需两步：①、关注微信公众号【奶茶剧本杀】→②、回复剧本杀《鲸鱼马戏团》即可获取查看剧本杀《鲸鱼马戏团》剧本杀真相答案复盘+凶手剧透：以下是玩家评测+部分关键证据，凶手，时间线，复盘解析，推理逻辑-------------------------------------------------------------------- ArrayList 源码解析程序猿进阶 Java基础 ArrayList List java 面试性能优化架构设计 idea ArrayList是Java集合框架中的一个动态数组实现，提供了可变大小的数组功能。它继承自AbstractList并实现了List接口，是顺序容器，即元素存放的数据与放进去的顺序相同，允许放入null元素，底层通过数组实现。除该类未实现同步外，其余跟Vector大致相同。每个ArrayList都有一个容量capacity，表示底层数组的实际大小，容器内存储元素的个数不能多于当前容量。当向容器中添 Kafka是如何保证数据的安全性、可靠性和分区的喜欢猪猪 kafka 分布式 Kafka作为一个高性能、可扩展的分布式流处理平台，通过多种机制来确保数据的安全性、可靠性和分区的有效管理。以下是关于Kafka如何保证数据安全性、可靠性和分区的详细解析：一、数据安全性SSL/TLS加密：Kafka支持SSL/TLS协议，通过配置SSL证书和密钥来加密数据传输，确保数据在传输过程中不会被窃取或篡改。这一机制有效防止了中间人攻击，保护了数据的安全性。SASL认证：Kafka支持多种 Java爬虫框架（一）--架构设计狼图腾-狼之传说 java 框架 java 任务 html解析器存储电子商务一、架构图那里搜网络爬虫框架主要针对电子商务网站进行数据爬取，分析，存储，索引。爬虫：爬虫负责爬取，解析，处理电子商务网站的网页的内容数据库：存储商品信息索引：商品的全文搜索索引Task队列：需要爬取的网页列表Visited表：已经爬取过的网页列表爬虫监控平台：web平台可以启动，停止爬虫，管理爬虫，task队列，visited表。二、爬虫1.流程1)Scheduler启动爬虫器，TaskMast 光盘文件系统 (iso9660) 格式解析穷人小水滴光盘文件系统 iso9660 deno GNU/Linux javascript 越简单的系统,越可靠,越不容易出问题.光盘文件系统(iso9660)十分简单,只需不到200行代码,即可实现定位读取其中的文件.参考资料:https://wiki.osdev.org/ISO_9660相关文章:《光盘防水嘛?DVD+R刻录光盘泡水实验》https://blog.csdn.net/secext2022/article/details/140583910《光驱的内部结构及日常使用》ht Spring MVC 全面指南：从入门到精通的详细解析一杯梅子酱技术栈学习 spring mvc java 引言：SpringMVC，作为Spring框架的一个重要模块，为构建Web应用提供了强大的功能和灵活性。无论是初学者还是有一定经验的开发者，掌握SpringMVC都将显著提升你的Web开发技能。本文旨在为初学者提供一个全面且易于理解的学习路径，通过详细的知识点分析和实际案例，帮助你快速上手SpringMVC，让学习过程既深刻又高效。一、SpringMVC简介1.1什么是SpringMVC？Spri 崩坏星穹铁道哪个角色值得培养崩坏星穹铁道新手角色优先级教学会飞滴鱼儿崩坏星穹铁道新手角色培养攻略：哪些角色值得投资？在《崩坏星穹铁道》中，角色的强度和培养一直是玩家们关心的焦点。要想体验更爽快的游戏过程，选对角色至关重要。那么，哪些角色值得投资培养呢?本篇教学文章将针对新手玩家，从T0到T1强度的角色中为你做出详尽解析。游戏豹官网现在的手游平台很多，但是在游戏界有这么一个传说：“喜欢肝的玩家不如氪金玩家，氪金玩家不如内部福利玩家”，这就是游戏界可悲的生物链，很多平 WebMagic：强大的Java爬虫框架解析与实战 Aaron_945 Java java 爬虫开发语言文章目录引言官网链接WebMagic原理概述基础使用1.添加依赖2.编写PageProcessor高级使用1.自定义Pipeline2.分布式抓取优点结论引言在大数据时代，网络爬虫作为数据收集的重要工具，扮演着不可或缺的角色。Java作为一门广泛使用的编程语言，在爬虫开发领域也有其独特的优势。WebMagic是一个开源的Java爬虫框架，它提供了简单灵活的API，支持多线程、分布式抓取，以及丰富的【2022 CCF 非专业级别软件能力认证第一轮（CSP-J1）入门级 C++语言试题及解析】汉子萌萌哒 CCF noi 算法数据结构 c++ 一、单项选择题(共15题，每题2分，共计30分；每题有且仅有一个正确选项)1.以下哪种功能没有涉及C++语言的面向对象特性支持：()。A.C++中调用printf函数B.C++中调用用户定义的类成员函数C.C++中构造一个class或structD.C++中构造来源于同一基类的多个派生类题目解析【解析】正确答案:AC++基础知识，面向对象和类有关，类又涉及父类、子类、继承、派生等关系，printf 绝招曝光！3小时高效利用ChatGPT写出精彩论文 kkai人工智能 chatgpt 人工智能 ai 学习媒体在这份指南中，我将深入解析如何利用ChatGPT4.0的高级功能，指导整个学术研究和写作过程。从初步探索研究主题，到撰写结构严谨的学术论文，我将一步步展示如何在每个环节中有效运用ChatGPT。如果您还未使用PLUS版本，可以参考相关教程。初步探索与主题的确定起初，我处于庞大的知识领域中，寻找一个可深入研究的领域。ChatGPT如同灯塔，通过深入分析最新研究趋势和领域热点，帮助我在广阔的学 ERP企业资源规划系统点滴~ 教育电商 ERP企业资源规划系统ERP（EnterpriseResourcePlanning）企业资源规划系统是一种综合性的管理信息系统，旨在通过信息技术手段实现对企业内部资源的全面规划、管理和控制。以下是对ERP企业资源规划系统的详细解析：一、定义与核心思想ERP系统建立在信息技术基础上，以系统化的管理思想，为企业决策层及员工提供决策运行手段的管理平台。它不仅仅是一个软件，更重要的是一个管理思想，实现了企使用由 Python 编写的 lxml 实现高性能 XML 解析 hunyxv python 笔记 python xml 转载自：文章lxml简介Python从来不出现XML库短缺的情况。从2.0版本开始，它就附带了xml.dom.minidom和相关的pulldom以及SimpleAPIforXML(SAX)模块。从2.4开始，它附带了流行的ElementTreeAPI。此外，很多第三方库可以提供更高级别的或更具有python风格的接口。尽管任何XML库都足够处理简单的DocumentObjectModel(DOM 每日OJ_牛客_马戏团（模拟最长上升子序列） GR鲸鱼 c++算法开发语言牛客数据结构目录牛客_马戏团（模拟最长上升子序列）解析代码牛客_马戏团（模拟最长上升子序列）马戏团__牛客网搜狐员工小王最近利用假期在外地旅游，在某个小镇碰到一个马戏团表演，精彩的表演结束后发现团长正和大伙在帐篷前激烈讨论，小王打听了下了解到，马戏团正打算出一个新节目“最高罗汉塔”，即马戏团员叠罗汉表演。考虑到安全因素，要求叠罗汉过程中，站在某个人肩上的人应该既比自己矮又比自己瘦，或相等。团长想要本次节目中的 APQP，ASPICE，敏捷，功能安全，预期安全，这些汽车行业的一堆标准二大宝贝安全架构前言APQP,ASPICE,敏捷，功能安全，预期安全，PMP，PRICE2汽车行业的有这样一堆标准。我是半路出家来到汽车行业做项目经理的，对几个标准的感觉是，看了文档和各种解析之后还是一头雾水，不知道到底说了个啥，别人问我还是一脸懵逼。APQP（TS16949的最重要工具），ASPICE（软件）这些是质量标准，是优化整个公司体系的，但这套体系对项目管理有要求；敏捷，PMP这些是项目管理的标准；项目 C++常见知识掌握 nfgo c++开发语言 1.Linux软件开发、调试与维护内核与系统结构Linux内核是操作系统的核心，负责管理硬件资源，提供系统服务，它是系统软件与硬件之间的桥梁。主要组成部分包括：进程管理：内核通过调度器分配CPU时间给各个进程，实现进程的创建、调度、终止等操作。使用进程描述符（task_struct）来存储进程信息，包括状态（就绪、运行、阻塞等）、优先级、内存映射等。内存管理：包括物理内存和虚拟内存管理。通过页表映 Shell脚本中sed使用 jcrhl321 linux 目录一、sed编辑器1、sed概述2、sed的工作流程3、sed命令的常见格式4、sed命令常用操作二、sed常用命令使用1、sed打印2、sed删除3、sed替换4、sed插入与增加4、sed剪切粘贴与复制粘贴一、sed编辑器sed（StreamEDitor）是一个强大而简单的文本解析转换工具，可以读取文本，并根据指定的条件对文本内容进行编辑（删除、替换、添加、移动等），最后输出所有行或者仅输出使用selenium调用firefox提示Profile Missing的问题解决歪歪的酒壶 selenium 测试工具 python 在Ubuntu22.04环境中，使用python3运行selenium提示ProfileMissing，具体信息为：YourFirefoxprofilecannotbeloaded.Itmaybemissingorinaccessible在这个问题的环境中firefox浏览器工作正常。排查中，手动在命令行执行firefox可以打开浏览器，但是出现如下提示Gtk-Message:15:32:09.9 “无”，有大用我若盛开 2021/7/7日更36/100网图，侵删《道德经》节选解析“三十辐，共一毂；当其无，有车之用。埏埴以为器，当其无，有器之用。凿户牖以为室，当其无，有室之用。故有之以为利，无之以为用。”译文：三十根辐条汇集到一根毂的孔洞当中，有了车毂中空的地方，才有车的作用。揉和陶土做成器皿，有了器具中空的地方，才有器皿的作用。开凿门窗建造房屋，有了门窗四壁内的空虚部分，才有房屋的作用。所以，“有”只是提供了条件打造专业投票评选平台：创建大型活动的完整指南口碑信息传播者在数字化时代，打造专业的投票评选平台成为举办大型活动的不可或缺的一环。本指南将深入探讨如何创建一个高效、安全、用户友好的投票平台，旨在帮助您成功举办大型投票评选活动。从平台的设计和功能规划到活动的推广和安全性保障，每个步骤都将得到详细解析。第一部分：构建投票平台的基础在创建投票平台之前，首先需要明确平台的基础构建要素：1.投票平台的定义和关键功能：确定您的平台将提供的服务和功能，包括投票方 KVM虚拟机源代码分析【转】 xidianjiapei001 #虚拟化技术 1.KVM结构及工作原理1.1KVM结构KVM基本结构有两部分组成。一个是KVMDriver，已经成为Linux内核的一个模块。负责虚拟机的创建，虚拟内存的分配，虚拟CPU寄存器的读写以及虚拟CPU的运行等。另外一个是稍微修改过的Qemu，用于模拟PC硬件的用户空间组件，提供I/O设备模型以及访问外设的途径。KVM基本结构如图1所示。其中KVM加入到标准的Linux内核中，被组织成Linux中标准 Istio pilot-discovery服务发现源码解析（1.13版本） xidianjiapei001 #Istio istio 云原生服务发现 Istiopilot-discovery服务发现介绍工作机制初始化初始化Config控制器初始化Service控制器controller初始化NamespaceServiceNodePodPilotDiscovery各组件启动流程DiscoveryServer接收Envoy的gRPC连接请求流程Config变化后向Envoy推送更新的流程总结参考介绍IstioPilot的代码分为Pilot-Dis jquery实现的jsonp掉java后台知了ing java jsonp jquery 什么是JSONP？先说说JSONP是怎么产生的：其实网上关于JSONP的讲解有很多，但却千篇一律，而且云里雾里，对于很多刚接触的人来讲理解起来有些困难，小可不才，试着用自己的方式来阐释一下这个问题，看看是否有帮助。 1、一个众所周知的问题，Ajax直接请求普通文件存在跨域无权限访问的问题，甭管你是静态页面、动态网页、web服务、WCF，只要是跨域请求，一律不准； 2、 Struts2学习笔记 caoyong struts2 SSH : Spring + Struts2 + Hibernate 三层架构(表示层,业务逻辑层,数据访问层) MVC模式 (Model View Controller) 分层原则:单向依赖，接口耦合 1、Struts2 = Struts + Webwork 2、搭建struts2开发环境 a>、到www.apac SpringMVC学习之后台往前台传值方法满城风雨近重阳 springMVC springMVC控制器往前台传值的方法有以下几种： 1.ModelAndView 通过往ModelAndView中存放viewName：目标地址和attribute参数来实现传参： ModelAndView mv=new ModelAndView(); mv.setViewName="success WebService存在的必要性？一炮送你回车库 webservice 做Java的经常在选择Webservice框架上徘徊很久，Axis Xfire Axis2 CXF ，他们只有一个功能，发布HTTP服务然后用XML做数据传输。是的，他们就做了两个功能，发布一个http服务让客户端或者浏览器连接，接收xml参数并发送xml结果。当在不同的平台间传输数据时，就需要一个都能解析的数据格式。但是为什么要使用xml呢？不能使json或者其他通用数据 js年份下拉框 3213213333332132 java web ee <div id="divValue">test...</div>测试 //年份 <select id="year"></select> <script type="text/javascript"> window.onload = 简单链式调用的实现技术归来朝歌方法调用链式反应编程思想在编程中，我们可以经常遇到这样一种场景：一个实例不断调用它自身的方法，像一条链条一样进行调用这样的调用你可能在Ajax中，在页面中添加标签： $("<p>").append($("<span>").text(list[i].name)).appendTo("#result"); 也可能在HQ JAVA调用.net 发布的webservice 接口 darkranger webservice /* * @Title: callInvoke * @Description: TODO(调用接口公共方法) * @param @param url 地址 * @param @param method 方法 * @param @param pama 参数 * @param @return * @param @throws BusinessException Javascript模糊查找 \| 第一章循环不能不重视。 aijuans Way 最近受我的朋友委托用js+HTML做一个像手册一样的程序，里面要有可展开的大纲，模糊查找等功能。我这个人说实在的懒，本来是不愿意的，但想起了父亲以前教我要给朋友搞好关系，再加上这也可以巩固自己的js技术，于是就开始开发这个程序，没想到却出了点小问题，我做的查找只能绝对查找。具体的js代码如下： function search(){ var arr=new Array("my 狼和羊，该怎么抉择 atongyeye 工作狼和羊，该怎么抉择在做一个链家的小项目，只有我和另外一个同事两个人负责，各负责一部分接口，我的接口写完，并全部测联调试通过。所以工作就剩下一下细枝末节的，工作就轻松很多。每天会帮另一个同事测试一些功能点，协助他完成一些业务型不强的工作。今天早上到公司没多久，领导就在QQ上给我发信息，让我多协助同事测试，让我积极主动些，有点责任心等等，我听了这话，心里面立马凉半截，首先一个领导轻易说读取android系统的联系人拨号百合不是茶 android sqlite数据库内容提供者系统服务的使用联系人的姓名和号码是保存在不同的表中,不要一下子把号码查询来,我开始就是把姓名和电话同时查询出来的,导致系统非常的慢关键代码: 1, 使用javabean操作存储读取到的数据 package com.example.bean; /** * * @author Admini ORACLE自定义异常 bijian1013 数据库自定义异常实例： CREATE OR REPLACE PROCEDURE test_Exception ( ParameterA IN varchar2, ParameterB IN varchar2, ErrorCode OUT varchar2 --返回值,错误编码 ) AS /以下是一些变量的定义/ V1 NUMBER; V2 nvarc 查看端号使用情况征客丶 windows 一、查看端口在windows命令行窗口下执行： >netstat -aon\|findstr "8080" 显示结果： TCP 127.0.0.1:80 0.0.0.0:0 & 【Spark二十】运行Spark Streaming的NetworkWordCount实例 bit1129 wordcount Spark Streaming简介 NetworkWordCount代码 /* * Licensed to the Apache Software Foundation (ASF) under one or more * contributor license agreements. See the NOTICE file distributed with Struts2 与 SpringMVC的比较 BlueSkator struts2 spring mvc 1. 机制：spring mvc的入口是servlet，而struts2是filter，这样就导致了二者的机制不同。 2. 性能：spring会稍微比struts快。spring mvc是基于方法的设计，而sturts是基于类，每次发一次请求都会实例一个action，每个action都会被注入属性，而spring基于方法，粒度更细，但要小心把握像在servlet控制数据一样。spring Hibernate在更新时，是可以不用session的update方法的(转帖） BreakingBad Hibernate update 地址：http://blog.csdn.net/plpblue/article/details/9304459 public void synDevNameWithItil() {Session session = null;Transaction tr = null;try{session = HibernateUtil.getSession();tr = session.beginTran 读《研磨设计模式》-代码笔记-观察者模式 bylijinnan java 设计模式声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; import java.util.Observable; import java.util.Observer; /** * “观重置MySQL密码 chenhbc mysql 重置密码忘记密码如果你也像我这么健忘，把MySQL的密码搞忘记了，经过下面几个步骤就可以重置了（以Windows为例，Linux/Unix类似）： 1、关闭MySQL服务 2、打开CMD，进入MySQL安装目录的bin目录下，以跳过权限检查的方式启动MySQL mysqld --skip-grant-tables 3、新开一个CMD窗口，进入MySQL mysql -uroot 再谈系统论，控制论和信息论 comsci 设计模式生物能源企业应用领域模型再谈系统论，控制论和信息论偶然看 oracle moving window size与 AWR retention period关系 daizj oracle 转自： http://tomszrp.itpub.net/post/11835/494147 晚上在做11gR1的一个awrrpt报告时,顺便想调整一下AWR snapshot的保留时间,结果遇到了ORA-13541这样的错误.下面是这个问题的发生和解决过程. SQL> select * from v$version; BANNER ------------------- Python版B树 dieslrae python 话说以前的树都用java写的,最近发现python有点生疏了,于是用python写了个B树实现,B树在索引领域用得还是蛮多了,如果没记错mysql的默认索引好像就是B树... 首先是数据实体对象,很简单,只存放key,value class Entity(object): '''数据实体''' def __init__(self,key,value) C语言冒泡排序 dcj3sjt126com 算法代码示例： # include <stdio.h> //冒泡排序 void sort(int * a, int len) { int i, j, t; for (i=0; i<len-1; i++) { for (j=0; j<len-1-i; j++) { if (a[j] > a[j+1]) // >表示升序自定义导航栏样式 dcj3sjt126com 自定义 -(void)setupAppAppearance { [[UILabel appearance] setFont:[UIFont fontWithName:@"FZLTHK—GBK1-0" size:20]]; [UIButton appearance].titleLabel.font =[UIFont fontWithName:@"FZLTH 11.性能优化-优化-JVM参数总结 frank1234 jvm参数性能优化 1.堆 -Xms --初始堆大小 -Xmx --最大堆大小 -Xmn --新生代大小 -Xss --线程栈大小 -XX:PermSize --永久代初始大小 -XX:MaxPermSize --永久代最大值 -XX:SurvivorRatio --新生代和suvivor比例,默认为8 -XX:TargetSurvivorRatio --survivor可使用 nginx日志分割 for linux HarborChung nginx linux 脚本 nginx日志分割 for linux 默认情况下，nginx是不分割访问日志的，久而久之，网站的日志文件将会越来越大，占用空间不说，如果有问题要查看网站的日志的话，庞大的文件也将很难打开，于是便有了下面的脚本使用方法，先将以下脚本保存为 cutlog.sh，放在/root 目录下，然后给予此脚本执行的权限复制代码代码如下: chmo Spring4新特性——泛型限定式依赖注入 jinnianshilongnian spring spring4 泛型式依赖注入 Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新 centOS安装GCC和G++ liuxihope centos gcc Centos支持yum安装，安装软件一般格式为yum install .......，注意安装时要先成为root用户。按照这个思路，我想安装过程如下：安装gcc：yum install gcc 安装g++： yum install g++ 实际操作过程发现，只能有gcc安装成功，而g++安装失败，提示g++ command not found。上网查了一下，正确安装应该第13章 Ajax进阶（上） onestopweb Ajax index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/ How to determine BusinessObjects service pack and fix pack blueoxygen BO http://bukhantsov.org/2011/08/how-to-determine-businessobjects-service-pack-and-fix-pack/ The table below is helpful. Reference BOE XI 3.x 12.0.0. y BOE XI 3.0 12.0. x. y BO Oracle里的自增字段设置 tomcat_oracle oracle 　大家都知道吧，这很坑，尤其是用惯了mysql里的自增字段设置，结果oracle里面没有的。oh，no 　　我用的是12c版本的，它有一个新特性，可以这样设置自增序列，在创建表是，把id设置为自增序列 create table t ( id 　　　　 number generated by default as identity (start with 1 increment b Spring Security（01）——初体验 yang_winnie spring Security Spring Security（01）——初体验博客分类： spring Security Spring Security入门安全认证首先我们为Spring Security专门建立一个Spring的配置文件，该文件就专门用来作为Spring Security的配置按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他首页 - 关于我们 - 站内搜索 - Sitemap - 侵权投诉版权所有 IT知识库 CopyRight © 2000-2050 E-COM-NET.COM , All Rights Reserved.

Mozilla FireFox Gecko内核源代码解析(1.nsParser)

你可能感兴趣的:(Mozilla FireFox Gecko内核源代码解析(1.nsParser))