ictextr9

Mozilla FireFox Gecko内核源代码解析(3.nsScanner)

Mozilla FireFox Gecko内核源代码解析

(3.nsScanner)

中科院计算技术研究所网络数据科学与工程研究中心

信息抽取小组

耿耘

[email protected]

前面我们介绍了nsParser，nsTokenizer，它们之上都需要调用nsScanner获取基本的字符串信息，这里我们来介绍一下这个nsScanner。

nsScanner是一个为了给nsParser以及一些上层服务提供支持的底层类，它是一个功能完善，十分经典的字符串扫描器。它能够接受一个字符流（内部字符流），并且提供一些经典的扫描器方法，如readUntil()，以及SkipWhitespace()之类。说白了，它主要就是提供了一个可控制的字符串获取器，对HTML流进行逐字符的解析。

首先我们来看一下nsScanner.h的源代码

[cpp]  view plain copy 
     
    
 #include "nsCOMPtr.h"  
 #include "nsString.h"  
 #include "nsIParser.h"  
 #include "prtypes.h"  
 #include "nsIUnicodeDecoder.h"  
 #include "nsScannerString.h"  
 classnsParser;  
 classnsReadEndCondition {  
 public:  
   const PRUnichar *mChars;  
  PRUnichar mFilter;  
  //构造参数的显式转换，nsReadEndCondition = (PRUnichar)  
   explicit nsReadEndCondition(constPRUnichar* aTerminateChars);  
 private:  
      //这种通过把相应的构造方法和运算符设置为私有变量的方法，可以防止从外部调用该方法，也就禁止了使用同类型变量对其进行拷贝，或使用=运算符对其进行赋值的操作  
  nsReadEndCondition(constnsReadEndCondition& aOther); // No copying  
   void operator=(const nsReadEndCondition& aOther); // No assigning  
 };  
 classnsScanner {  
   public:  
      /** 
        * Use this constructor if you want i/o to be based on 
        * a single string you hand in during construction. 
        * This short cut was added for Javascript. 
        * 
        * @update  ftang 3/02/99 
        * @param   aCharset charset 
        * @param   aCharsetSource - wherethe charset info came from 
        * @param   aMode represents theparser mode (nav, other) 
        * @return  
        */  
      nsScanner(const nsAString&anHTMLString, const nsACString& aCharset,PRInt32 aSource);      //构造方法nsScanner，这个构造方法可以让你的I/O基于一个固定的字符串  
    
      /** 
        * Use this constructor if you want i/o to be based on 
        * a file (therefore a stream) or just data you provide via Append(). 
        * 
        * @update  ftang 3/02/99 
        * @param   aCharset charset 
        * @param   aCharsetSource - wherethe charset info came from 
        * @param   aMode represents theparser mode (nav, other) 
        * @return  
        */  
       //构造方法，如果你希望你的I/O基于一个文件(实际上就是流)，或者是基于使用Append()，即不断加入新字符的情况下，可以使用这个构造方法  
      nsScanner(nsString& aFilename,PRBool aCreateStream, const nsACString& aCharset, PRInt32 aSource);  
    
      ~nsScanner(); //析构方法  
    
      /** 
        * retrieve next char from internal input stream 
        *  
        * @update  gess 3/25/98 
        * @param   ch is the char to acceptnew value 
        * @return  error code reflectingread status 
        */  
       //从输入的字符流中，获取下一个字节  
      nsresult GetChar(PRUnichar& ch);  
    
      /** 
        * peek ahead to consume next char from scanner's internal 
        * input buffer 
        *  
        * @update  gess 3/25/98 
        * @param   ch is the char to acceptnew value 
        * @return  error code reflectingread status 
        */  
       //从输入流中通过只读方式获取下一个字节  
      nsresult Peek(PRUnichar& ch, PRUint32 aOffset=0);  
    
       //从输入流中通过只读方式获取下一个字节  
      nsresult Peek(nsAString& aStr, PRInt32 aNumChars, PRInt32 aOffset =0);  
      /** 
        * Skip over chars as long as they equal given char 
        *  
        * @update  gess 3/25/98 
        * @param   char to be skipped 
        * @return  error code 
        */  
       //跳过接下来的字符，只要找到第一个字符和参数给定的字符不同为止  
      nsresult SkipOver(PRUnichar aSkipChar);  
    
      /** 
        * Consume characters until you run into space, a '<', a '>', or a'/'. 
        *  
        * @param   aString - receives newdata from stream 
        * @return  error code 
        */  
       //处理字符，直到遇到了一个’<’或者’>’，或者’/’为止  
      nsresult ReadTagIdentifier(nsScannerSharedSubstring& aString);  
    
      /** 
        * Consume characters until you run into a char that's not valid in an 
        * entity name 
        *  
        * @param   aString - receives newdata from stream 
        * @return  error code 
        */  
       //持续处理字符，直到你遇到一个不为Entity的字符为止  
      nsresult ReadEntityIdentifier(nsString& aString);  
      //下面这几个也是相应的特殊的读取字符方法，我们在后面的cpp文件中会具体分析  
      nsresult ReadNumber(nsString& aString,PRInt32 aBase);  
      nsresult ReadWhitespace(nsScannerSharedSubstring& aString,  
                               PRInt32&aNewlinesSkipped,  
                               PRBool&aHaveCR);  
      nsresult ReadWhitespace(nsScannerIterator& aStart,  
                              nsScannerIterator&aEnd,  
                               PRInt32&aNewlinesSkipped);  
    
      /** 
        * Consume characters until you find the terminal char 
        *  
        * @update  gess 3/25/98 
        * @param   aString receives new datafrom stream 
        * @param   aTerminal containsterminating char 
        * @param   addTerminal tells uswhether to append terminal to aString 
        * @return  error code 
        */  
      //读取字符，直到碰到terminal字符为止  
      nsresult ReadUntil(nsAString& aString,  
                          PRUnichar aTerminal,  
                          PRBool addTerminal);  
    
      /** 
        * Consume characters until you find one contained in given 
        * terminal set. 
        *  
        * @update  gess 3/25/98 
        * @param   aString receives new datafrom stream 
        * @param   aTermSet contains set ofterminating chars 
        * @param   addTerminal tells uswhether to append terminal to aString 
        * @return  error code 
        */  
      //读取字符，直到遇到了aEndCondition其中之一为止  
      nsresult ReadUntil(nsAString& aString,  
                          const nsReadEndCondition& aEndCondition,  
                          PRBool addTerminal);  
    
      nsresult ReadUntil(nsScannerSharedSubstring& aString,  
                          const nsReadEndCondition& aEndCondition,  
                          PRBool addTerminal);  
    
      nsresult ReadUntil(nsScannerIterator& aStart,  
                          nsScannerIterator&aEnd,  
                          const nsReadEndCondition& aEndCondition,  
                          PRBool addTerminal);  
      /** 
        * Records current offset position in input stream. This allows us 
        * to back up to this point if the need should arise, such as when 
        * tokenization gets interrupted. 
        *  
        * @update  gess 5/12/98 
        * @param   
        * @return  
        */  
      //记录下当前读取的位置，这允许我们将来需要的时候可以回溯到这个位置，比如分词操作被打断的时候  
      PRInt32 Mark(void);  
    
      /** 
        * Resets current offset position of input stream to marked position. 
        * This allows us to back up to this point if the need should arise, 
        * such as when tokenization gets interrupted. 
        * NOTE: IT IS REALLY BAD FORM TO CALL RELEASE WITHOUT CALLING MARK FIRST! 
        *  
        * @update  gess 5/12/98 
        * @param   
        * @return  
        */  
      //重设当前读取的位置到之前记录(Mark)的位置。调用这个方法允许我们在需要的时候回溯到该位置，比如分词过程被打断。  
      void RewindToMark(void);  
      /** 
        *  
        *  
        * @update  harishd 01/12/99 
        * @param   
        * @return  
        */  
      //将未解析的字符串返回给aBuffer里  
      PRBool UngetReadable(constnsAString& aBuffer);  
      /** 
        *  
        *  
        * @update  gess 5/13/98 
        * @param   
        * @return  
        */  
      //在解析器所要解析的字符串后面新增新的字符串  
      nsresult Append(const nsAString&aBuffer);  
      /** 
        *  
        *  
        * @update  gess 5/21/98 
        * @param   
        * @return  
        */  
      //和上一个方法作用相同，只不过形参不一样  
      nsresult Append(const char* aBuffer, PRUint32 aLen,  
                       nsIRequest *aRequest);  
    
      /** 
        * Call this to copy bytes out of the scanner that have not yet beenconsumed 
        * by the tokenization process. 
        *  
        * @update  gess 5/12/98 
        * @param   aCopyBuffer is where thescanner buffer will be copied to 
        * @return  nada 
        */  
      //调用这个方法获取当前未被分词器分词的字符串  
      void CopyUnusedData(nsString&aCopyBuffer);  
    
      /** 
        * Retrieve the name of the file that the scanner is reading from. 
        * In some cases, it's just a given name, because the scanner isn't 
        * really reading from a file. 
        *  
        * @update  gess 5/12/98 
        * @return  
        */  
      //获取扫描器所扫描的文件名字，其实这只是个名字而已，不一定是文件名，因为扫描器实际上并不是从文件中进行读取的  
      nsString& GetFilename(void);  
    
      //一个自我测试方法  
      static voidSelfTest();  
    
      /** 
        * Use this setter to change the scanner's unicode decoder 
        * 
        * @update  ftang 3/02/99 
        * @param   aCharset a normalized(alias resolved) charset name 
        * @param   aCharsetSource- where thecharset info came from 
        * @return  
        */  
      //设置文档所使用的字符集  
      nsresult SetDocumentCharset(constnsACString& aCharset, PRInt32 aSource);  
      //获取子字符串  
      voidBindSubstring(nsScannerSubstring& aSubstring, constnsScannerIterator& aStart, constnsScannerIterator& aEnd);  
      //获取当前位置  
      voidCurrentPosition(nsScannerIterator& aPosition);  
      //设置读取末尾  
      void EndReading(nsScannerIterator&aPosition);  
      //设置当前位置  
      void SetPosition(nsScannerIterator&aPosition,  
                        PRBool aTruncate =PR_FALSE,  
                        PRBool aReverse =PR_FALSE);  
      //替换该位置的字符  
      void ReplaceCharacter(nsScannerIterator&aPosition,  
                             PRUnichar aChar);  
      /** 
        * Internal method used to cause theinternal buffer to 
        * be filled with data. 
        * 
        * @update  gess4/3/98 
        */  
      //获取是否是mIncremental即单字节模式，如果是则是按字节进行读取  
      PRBool    IsIncremental(void) {returnmIncremental;}  
      //设置mIncremental模式  
      void     SetIncremental(PRBool anIncrValue) {mIncremental=anIncrValue;}  
      /** 
        * Return the position of the firstnon-whitespace 
        * character. This is only reliablebefore consumers start 
        * reading from this scanner. 
        */  
      //获取从当前位置起第一个不为空白字符的位置。这只有在外部模块在开始从扫描器获取字符前有效  
      PRInt32 FirstNonWhitespacePosition()  
      {  
        return mFirstNonWhitespacePosition;  
      }  
      //设置该扫描器对应的解析器  
 void SetParser(nsParser*aParser)  
      {  
        mParser = aParser;  
      }  
    
      /** 
        * Override replacement character used bynsIUnicodeDecoder. 
        * Default behavior is that it usesnsIUnicodeDecoder's mapping. 
        * 
        * @param aReplacementCharacter thereplacement character 
        *       XML (expat) parser uses 0xffff 
        */  
       //重设替换用的字符  
      voidOverrideReplacementCharacter(PRUnichar aReplacementCharacter);  
    
 //下面我们看一下数据成员：  
   protected:  
      //将字符串附加到被解析的字符串上的函数  
      PRBool AppendToBuffer(nsScannerString::Buffer *, nsIRequest *aRequest,PRInt32 aErrorPos = -1);  
      PRBool AppendToBuffer(constnsAString& aStr)  
      {  
        nsScannerString::Buffer* buf =nsScannerString::AllocBufferFromString(aStr);  
        if (!buf)  
          return PR_FALSE;  
        AppendToBuffer(buf, nsnull);  
        return PR_TRUE;  
      }  
      //带解析的字符串  
      nsScannerString*            mSlidingBuffer;  
      //解析器的当前解析位置  
      nsScannerIterator           mCurrentPosition; // The position we will nextread from in the scanner buffer  
      //解析器记录的位置  
      nsScannerIterator           mMarkPosition;    // The position last marked (we may rewind to here)  
      //当前解析器字符串的结束位置  
      nsScannerIterator           mEndPosition;     // The current end of the scanner buffer  
      //第一个检测出非法字符的位置  
      nsScannerIterator           mFirstInvalidPosition; // The position of thefirst invalid character that was detected  
      //文件名，其实并不是从文件读取  
      nsString        mFilename;  
      //scanner还未读取的字符串中的剩余字节  
      PRUint32        mCountRemaining; // The number of bytes still to be read  
                                        // from the scanner buffer  
      //是否是单字节式解析  
      PRPackedBool    mIncremental;  
      PRPackedBool   mHasInvalidCharacter;    //是否有非法的字符  
      PRUnichar      mReplacementCharacter;   //替换用字符  
      PRInt32        mFirstNonWhitespacePosition; //第一个非空白字符的位置  
      PRInt32         mCharsetSource;     //字符集编号  
      nsCString       mCharset;      //字符集名称  
      nsCOMPtr<nsIUnicodeDecoder> mUnicodeDecoder; //Unicode编码器  
      nsParser        *mParser;  //当前扫描器所对应的解析器  
    
   private:  
      nsScanner &operator =(const nsScanner &); //Not implemented.  

以上就是nsScanner的头文件定义，其中的具体实现都在nsScanner.cpp文件中，下面我们来具体看看nsScanner.cpp中的具体实现：

[cpp]  view plain copy 
     
    
 //我们忽略开头的一堆include文件，直接看其有效代码  
 // We replace NUL characterswith this character.  
 //我们会使用以下字符替换NUL字符  
 staticPRUnichar sInvalid = UCS2_REPLACEMENT_CHAR;  
    
 nsReadEndCondition::nsReadEndCondition(const PRUnichar* aTerminateChars) :  
  mChars(aTerminateChars), mFilter(PRUnichar(~0)) //All bits set  
 {  
   // Build filter that will be used to filter out characterswith  
   // bits that none ofthe terminal chars have. This works very well  
   // because terminal chars often have only the last 4-6 bitsset and  
   // normal ascii letters have bit 7 set. Other letters haveeven higher  
   // bits set.  
    
   // Calculate filter  
   //注意到，这个构造方法主要是为了建立一个名为Filter的字符，该字符会用来过滤其他拥有它所没有的bit位的字符，但我们首先要先来构建这个Filter。据作者说，这个Filter的工作效果很好，因为大部分的terminal字符只有低位的第4至第6bit设置了，但是一般的ascii字符的第7位bit设置了。其他的字符可能会有更高位的bit被设置了。  
  //注意两个参数，aTerminateChars是存放terminate字符的数组，而mFilter字符各个bit位首先被置为了全1  
  //首先获取aTerminateChars数组的首地址  
   const PRUnichar *current = aTerminateChars;  
  //获取该数组地一个字符，放到terminalChar里  
  PRUnichar terminalChar = *current;  
  //当terminalChar不为空的时候，即遍历整个terminalChar数组  
   while (terminalChar) {  
    mFilter &= ~terminalChar;    //用terminalChar的反码和mFilter进行与运算，也就是说如果terminalChar的第N位为1的话，那么mFilter的第N位则会被至为0  
    ++current;     //取下一个TerminateChars数组元素的地址  
    terminalChar = *current;     //并且其赋值给terminalChar  
  }  
 }  
    
 #ifdef__INCREMENTAL   //如果设置了INCREMENTAL位  
 const int   kBufsize=1;     //设置缓冲区大小为1  
 #else  
 const int  kBufsize=64;    //否则设置为64  
 #endif  
 /** 
  *  Usethis constructor if you want i/o to be based on 
  *  asingle string you hand in during construction. 
  *  Thisshort cut was added for Javascript. 
  * 
  * @update  gess 5/12/98 
  * @param   aMode represents theparser mode (nav, other) 
  * @return  
  */  
 //如果你希望i/o基于一个在构造方法时传递过来的单独的字符串则可以使用这个方法进行构造。这个捷径主要是为了给Javascript提供支持而添加的  
 nsScanner::nsScanner(const nsAString& anHTMLString, const nsACString& aCharset,  
                      PRInt32 aSource)  
  : mParser(nsnull)  
 {  
  MOZ_COUNT_CTOR(nsScanner);  
 //以下设置几个变量的初始值  
  mSlidingBuffer = nsnull;  
  mCountRemaining = 0;  
  mFirstNonWhitespacePosition = -1;  
   if (AppendToBuffer(anHTMLString)) {     //将给定的字符串拷贝到当前要解析的buffer中  
    mSlidingBuffer->BeginReading(mCurrentPosition);     //开始解析，需要注意的是，实际上并不是从mCurrentPosition位置开始解析，而是开始解析，并把位置赋值给mCurrentPosition  
  } else {    //其他情况下，说明将字符串拷贝给buffer失败了  
    /* XXX see hack below, re: bug 182067 */  
    memset(&mCurrentPosition, 0, sizeof(mCurrentPosition));  //貌似通过内存设置方式直接将其指针置空  
    mEndPosition = mCurrentPosition; //此时这两个值都应当为0  
  }  
  mMarkPosition = mCurrentPosition;  //记录一下当前的位置  
  mIncremental = PR_FALSE;  //设置增量式解析位为FALSE  
  mUnicodeDecoder = 0; //某个变量  
  mCharsetSource = kCharsetUninitialized; //字符集变量  
  mHasInvalidCharacter = PR_FALSE;   //设置是否有非法字符  
  mReplacementCharacter = PRUnichar(0x0); //设置如果遇到非法字符的替换字符  
 }  
 //设置扫描器所用的字符集  
 nsresult nsScanner::SetDocumentCharset(const nsACString& aCharset , PRInt32 aSource)  
 {  
  //字符集是有优先级的，首先应对其进行判断，低优先级的字符集一般是高优先级的字符集子集，设置的时候需要进行判断  
   if (aSource < mCharsetSource) // priority is lower the the current one , just  
    return NS_OK;      //如果新字符集的优先级较低，直接返回  
    
  nsICharsetAlias* calias = nsParser::GetCharsetAliasService();  //获取字符集服务  
  NS_ASSERTION(calias, "Must have thecharset alias service!");  //确保获取成功  
    
  nsresult res = NS_OK;  
   if (!mCharset.IsEmpty())       //如果当前字符集不为空  
  {  
    PRBool same;  
    res = calias->Equals(aCharset, mCharset, &same);    //判断一下新字符集和当前字符集是否是同一个字符集  
    if(NS_SUCCEEDED(res) && same)    //如果两个字符集一样  
    {    //则直接返回  
      return NS_OK; //no difference, don't change it  
    }  
  }  
  //运行到此处，说明两个字符集不一样，且新字符集的优先级较高，需要进行替换  
   // different, need to change it  
  nsCString charsetName;  
  res = calias->GetPreferred(aCharset, charsetName);    //获取字符集名称  
    
   if(NS_FAILED(res) && (mCharsetSource ==kCharsetUninitialized))  
  {  //如果获取失败，且当前的字符集为空  
     // failed - unknown alias , fallback toISO-8859-1  
    mCharset.AssignLiteral("ISO-8859-1"); //那么默认使用ISO-8859-1字符集  
  }  
   else  
  {  
    mCharset.Assign(charsetName);    //获取成功，则直接使用该字符集  
  }  
  mCharsetSource = aSource;      //设置字符集源值  
  NS_ASSERTION(nsParser::GetCharsetConverterManager(),  
                "Musthave the charset converter manager!");  
  //获取UnicodeDecoder  
  res = nsParser::GetCharsetConverterManager()->  
    GetUnicodeDecoderRaw(mCharset.get(), getter_AddRefs(mUnicodeDecoder));  
   if (NS_FAILED(res))  //如果获取UnicodeDecoder失败  
  {  
    // GetUnicodeDecoderRaw can fail if thecharset has the .isXSSVulnerable  
    // flag. Try to fallback to ISO-8859-1  
    mCharset.AssignLiteral("ISO-8859-1"); //则还是默认使用ISO-8859-1字符集  
    mCharsetSource = kCharsetFromWeakDocTypeDefault;    //设置为最低优先级  
    res = nsParser::GetCharsetConverterManager()-> //获取相应的UnicodeDecoder  
      GetUnicodeDecoderRaw(mCharset.get(), getter_AddRefs(mUnicodeDecoder));  
  }  
  //如果获取成功  
   if (NS_SUCCEEDED(res) && mUnicodeDecoder)  
  {  
     // We need to detect conversion error ofcharacter to support XML  
     // encoding error.  
      //我们需要对字符转换的错误进行监测，从而支持XML编码中的错误  
     mUnicodeDecoder->SetInputErrorBehavior(nsIUnicodeDecoder::kOnError_Signal);  
      //为UnicodeDecoder进行错误行为处理设置  
  }  
    
   return res;          //返回处理结果  
 }  
 //下面是析构方法  
 /** 
  * default destructor 
  *  
  * @update  gess 3/25/98 
  * @param   
  * @return  
  */  
 nsScanner::~nsScanner() {  
    
   if (mSlidingBuffer) {      
    delete mSlidingBuffer;  //删除当前未扫描的字符串  
  }  
    
  MOZ_COUNT_DTOR(nsScanner);     //用来进行日志记录的一个构件方法，如果没有特殊#Define NS_BUILD_REFCNT_LOGGING的话，这个方法一般为空，什么都不做  
 }  
 /** 
  * default destructor 
  *  
  * @update  gess 3/25/98 
  * @param   
  * @return  
  */  
 nsScanner::~nsScanner() {  
    
   if (mSlidingBuffer) {      
    delete mSlidingBuffer;  //删除当前未扫描的字符串  
  }  
    
  MOZ_COUNT_DTOR(nsScanner);     //用来进行日志记录的一个构件方法，如果没有特殊#Define NS_BUILD_REFCNT_LOGGING的话，这个方法一般为空，什么都不做  
 }  
    
 //上面提到过了一个Mark的方法，用来提供回溯时的记录位，下面我们来看看回溯的Rewind方法，很简单的实现。  
    
 /** 
  * Resets current offset position of input stream to marked position. 
  *  Thisallows us to back up to this point if the need should arise, 
  *  suchas when tokenization gets interrupted. 
  *  NOTE:IT IS REALLY BAD FORM TO CALL RELEASE WITHOUT CALLING MARK FIRST! 
  * 
  * @update  gess 5/12/98 
  * @param   
  * @return  
  */  
 voidnsScanner::RewindToMark(void){  
   if (mSlidingBuffer) {     //如果当前存在一个mSlidingBuffer  
    mCountRemaining += (Distance(mMarkPosition, mCurrentPosition));   //修改剩余的字节数，需要加上Mark位置到当前位置的距离  
    mCurrentPosition = mMarkPosition;     //设置当前位置为Mark的位置  
  }  
 }  
    
    
 //下面是在上面方法执行之前必须进行的Mark方法。  
    
 /** 
  * Records current offset position in input stream. This allows us 
  *  toback up to this point if the need should arise, such as when 
  * tokenization gets interrupted. 
  * 
  * @update  gess 7/29/98 
  * @param   
  * @return  
  */  
 PRInt32 nsScanner::Mark() {  
  PRInt32 distance = 0;     //设置距离为0  
   if (mSlidingBuffer) {     //如果当前字符串存在  
 nsScannerIteratoroldStart;       //设置一个游标  
 mSlidingBuffer->BeginReading(oldStart);    //用该游标记录下原始的起始位置  
    distance = Distance(oldStart, mCurrentPosition);  
    mSlidingBuffer->DiscardPrefix(mCurrentPosition);    //去掉当前位置mCurrentPosition之前的字符串  
    mSlidingBuffer->BeginReading(mCurrentPosition);  //设置起始位置为mCurrentPosition  
    mMarkPosition = mCurrentPosition;     //设置mMarkPosition为mCurrentPosition  
  }  
   return distance;  
 }  
    
 //下面这个方法，主要是配合Parse中，将上一次解析时没有处理完的字符串，重新插入到当前扫描器中去的方法。  
    
 /** 
  * Insert data to our underlying input bufferas 
  * if it were read from an input stream. 
  * 
  * @update harishd 01/12/99 
  * @return error code 
  */  
 PRBool nsScanner::UngetReadable(const nsAString& aBuffer) {  
   if (!mSlidingBuffer) {    //如果当前的解析字符串不存在  
    return PR_FALSE;   //则返回  
  }  
    
  mSlidingBuffer->UngetReadable(aBuffer,mCurrentPosition);   //调用mSlidingBuffer的UngetReadable，将aBuffer插入到mCurrentPosition中去  
  //重新设置读取的起始位置和结束位置，因为插入操作会破坏我们原始的游标  
  mSlidingBuffer->BeginReading(mCurrentPosition); // Insertion invalidated our iterators  
  mSlidingBuffer->EndReading(mEndPosition);  
  //获取新插入字符串的长度  
  PRUint32 length = aBuffer.Length();  
  //在原始未解析的字符串长度上加上新插入字符串的长度  
  mCountRemaining += length; // Ref. bug 117441  
   return PR_TRUE;  
 }  
    
 //下面这几个Append方法主要是为了给普通的I/O提供服务，即将新到来的字符串附到原始待解析的字符串末尾端。  
    
 /** 
  * Append data to our underlying input bufferas 
  * if it were read from an input stream. 
  * 
  * @update gess4/3/98 
  * @return error code 
  */  
 nsresult nsScanner::Append(const nsAString& aBuffer) {  
   if (!AppendToBuffer(aBuffer))  //直接调用AppendToBuffer方法  
    return NS_ERROR_OUT_OF_MEMORY;  
   return NS_OK;  
 }  
    
    
 /** 
  *  
  *  
  * @update  gess 5/21/98 
  * @param   
  * @return  
  */  
 //对于C++中，字符型数组作为参数，除了其指针，一般都需要传递其长度  
 nsresult nsScanner::Append(const char* aBuffer,PRUint32 aLen,  
                            nsIRequest*aRequest)  
 {  
  nsresult res=NS_OK;  
  PRUnichar *unichars, *start;  
   if (mUnicodeDecoder) {  
    PRInt32 unicharBufLen = 0;  
 mUnicodeDecoder->GetMaxLength(aBuffer,aLen, &unicharBufLen); //就是unicharBufLen = aLen + 1  
 //申请一个新数组，长度为unicharBufLen + 1，因为C++中字符数组最后一位要放’\0’  
    nsScannerString::Buffer* buffer =nsScannerString::AllocBuffer(unicharBufLen + 1);  
 NS_ENSURE_TRUE(buffer,NS_ERROR_OUT_OF_MEMORY);  
 //指针指向字符数组的第一个字节  
    start = unichars = buffer->DataStart();  
    //初始化几个变量  
    PRInt32 totalChars = 0;  
    PRInt32 unicharLength = unicharBufLen;  
 PRInt32errorPos = -1;  
 //下面这个循环主要就是对于那些非法的字符(即无法识别的字符)需要用之前设置好的Replacement字符进行替换。  
    do {  
      PRInt32 srcLength = aLen;  //设置一个变量，记录附加字符串的原始长度  
      //进行字符串转换，转换结果放到unichars中去，并在unicharLength中记录转换后的字符串长度  
      res = mUnicodeDecoder->Convert(aBuffer, &srcLength, unichars,&unicharLength);  
      //将总字节数，加上unicharLength  
      totalChars += unicharLength;  
       // Continuationof failure case  
      if(NS_FAILED(res)) {  
        // if we failed, we consume one byte, replaceit with the replacement  
        // character and try the conversion again.  
        // This is only needed because some decodersdon't follow the  
        // nsIUnicodeDecoder contract: they return afailure when *aDestLength  
         // is 0rather than the correct NS_OK_UDEC_MOREOUTPUT. See bug 244177  
          //运行到这里，说明我们刚才的转换操作失败了，我们将错误字符替换为代替字符，并且再次尝试对其进行转换。  
          //这只有在有些解码器不符合nsIUnicodeDecoder规则的时候才会发生：他们当  
            DestLength为0的时候会返回一个失败值  
        if ((unichars + unicharLength) >=buffer->DataEnd()) {   //如果超出了最大长度  
          NS_ERROR("Unexpected end of destinationbuffer");  //指针越界出错了  
          break;  
        }  
          if (mReplacementCharacter == 0x0 && errorPos== -1) {    //如果替换字符为0，且出错位置为-1  
          errorPos = totalChars;     //出错位置直接记录为整体字符串  
        }  
          //进行字符替换  
        unichars[unicharLength++] = mReplacementCharacter == 0x0 ?  
                                    mUnicodeDecoder->GetCharacterForUnMapped() :  
                                    mReplacementCharacter;  
          //重新设置字符串的起始位置和长度  
        unichars = unichars + unicharLength;  
        unicharLength = unicharBufLen - (++totalChars);  
          //重设UnicodeDecoder  
        mUnicodeDecoder->Reset();  
        if(((PRUint32) (srcLength + 1)) >aLen) {  //此处应当是出现了错误字符才会导致的情况  
          srcLength = aLen;  
        }  
        else {     //一般情况下只需要进行加一操作，即按序解析下一个字符  
          ++srcLength;  
        }  
        aBuffer += srcLength;    //将aBuffer向后移动srcLength个位置  
        aLen -= srcLength;  //减少srcLength长度，即已经解析的字节数  
      }  
 }while (NS_FAILED(res) && (aLen >0));  
    
    buffer->SetDataLength(totalChars);    //设置buffer的数据长度为新的数据长度  
    // Don't propagate return code of unicodedecoder  
    // since it doesn't reflect on our success orfailure  
    // - Ref. bug 87110  
 res= NS_OK;  
    if (!AppendToBuffer(buffer, aRequest,errorPos))    //使用转换好的字符串进行AppendToBuffer操作，这个操作在代码的最后会进行介绍  
      res = NS_ERROR_OUT_OF_MEMORY;  
   }  
    
   else {      //其他情况下，说明Append操作失败  
    NS_WARNING("No decoder found.");  
    res = NS_ERROR_FAILURE;      //设置结果为错误值  
  }  
    
   return res; //返回结果  
 }  
    
 //看完了上面的一些方法，我们来看接下来的几个经典的Scanner所支持的操作：  
 /** 
  * retrieve next char from scanners internal input stream 
  *  
  * @update  gess 3/25/98 
  * @param   
  * @return  error code reflectingread status 
  */  
 //这个方法很简单，就是“取出”字符流中的第一个字符，并将aChar指向的它  
 nsresultnsScanner::GetChar(PRUnichar& aChar) {  
   if (!mSlidingBuffer || mCurrentPosition ==mEndPosition) { //先判断一下当前解析是不是已经到结尾了，或者带解析的字符串本身就不存在  
    aChar = 0;  
    return kEOF;   //返回文件末尾，即空值  
  }  
    
  aChar = *mCurrentPosition++;   //设置aChar为当前的位置加一  
  --mCountRemaining;   //减少剩余未解析的字节数  
    
   return NS_OK;  
 }  
    
 //下面这个方法和上面的方法不同，并不是“取出(Get)”，而是只读方式的“浏览(Peek)”，代码很简单  
    
 /** 
  *  peekahead to consume next char from scanner's internal 
  *  inputbuffer 
  *  
  * @update  gess 3/25/98 
  * @param   
  * @return  
  */  
 //浏览从当前位置起，aOffset之后个位置的字符，并将aChar指向该字符  
 nsresult nsScanner::Peek(PRUnichar&aChar, PRUint32 aOffset) {  
  aChar = 0;  
   if (!mSlidingBuffer || mCurrentPosition ==mEndPosition) { //如果当前待解析的字符串不存在，或当前位置等于结束位置了  
    return kEOF;   //返回文件末尾kEOF，即空  
  }  
   if (aOffset > 0) {   //如果aOffset大于零  
    if (mCountRemaining <= aOffset)  //如果偏移位置超过了剩余字节的数量  
      return kEOF; //直接返回空（为啥不返回最后一个字节呢，合情合理）  
    
    nsScannerIterator pos = mCurrentPosition;  //获取当前位置  
    pos.advance(aOffset);   //前进aOffset个位置  
    aChar=*pos;    //用aChar指向该位置的字符  
  }  
   else {  
    aChar=*mCurrentPosition;     //其他情况下，即aOffset为0或者为负值的情况下，直接指向当前位置  
  }  
    
   return NS_OK;    //返回正确结果  
 }  
    
    
 //下面这个Peek方法，同样是浏览，但是一次获取的是若干个字符，并不是单个字符  
    
 //较前一个方法，多了一个aNumChars，用来记录取出字符的数量  
 nsresult nsScanner::Peek(nsAString&aStr, PRInt32 aNumChars, PRInt32 aOffset)  
 {  
   if (!mSlidingBuffer || mCurrentPosition ==mEndPosition) { //如果当前待解析的字符串为空，或当前位置已经是结束的位置了  
    return kEOF;   //直接返回文件末尾值，即空值  
  }  
  nsScannerIterator start, end;  //设置两个游标start，end  
  start = mCurrentPosition;      //start游标指向当前位置  
    
   if ((PRInt32)mCountRemaining <= aOffset) {   //如果偏移值超过了剩余字节的数量  
    return kEOF;   //返回文件末尾值  
  }  
    
   if (aOffset > 0) {   //如果偏移值大于0  
    start.advance(aOffset);      //游标start向前前进aOffset个位置  
  }  
    
   if (mCountRemaining < PRUint32(aNumChars +aOffset)) {     //这个和前面的Peek方法就不一样了，如果需要获取的字符串的末位置超出了文档结尾，则已文档末尾作为获取字符串的结束位置  
    end = mEndPosition;  
  }  
   else { //其他情况下，即正常情况  
    end = start;  
    end.advance(aNumChars); //将end在start的基础上前进aNumChars个字节  
  }  
  CopyUnicodeTo(start, end, aStr);   //这样就直接可以获取start和end之间的字符串作为结果放到aStr中去了  
   return NS_OK;    //返回正确值  
 }  
    
 //下面这个方法，是让扫描器从当前开始，不断前进，直到遇到一个不为空字符类型（\0，\r，\n）的字符，其过程并不复杂且很好理解。  
    
 /** 
  *  Skipwhitespace on scanner input stream 
  *  
  * @update  gess 3/25/98 
  * @param   
  * @return  error status 
  */  
 nsresult nsScanner::SkipWhitespace(PRInt32&aNewlinesSkipped) {  
  //aNewlinesSkipped中记录跳过的行数  
   if (!mSlidingBuffer) {    //如果当前解析字符串为空  
    return kEOF;   //返回文件末尾值，即空值  
  }  
  PRUnichar theChar = 0;    //设置一个字符变量  
  nsresult  result = Peek(theChar);  //获取当前位置的字符  
   if (NS_FAILED(result)) {  //如果获取失败  
    return result;     //则返回该结果  
  }  
    
  nsScannerIterator current = mCurrentPosition;    //获取当前位置的游标  
  //设置两个变量  
  PRBool    done = PR_FALSE;  
  PRBool    skipped = PR_FALSE;  
   //进行循环，直到文件末尾，或者遇到不为空字符的字符为止  
   while (!done && current != mEndPosition) {  
    switch(theChar) {  
      case '\n':  
      case '\r':++aNewlinesSkipped; //遇到\r或者\n，则对参数中的变量+1  
      case ' ':  
      case '\t':  
        {  
          skipped = PR_TRUE;     //设置遇到了空字符并进行了跳过  
          PRUnichar thePrevChar = theChar;     //用thePrevChar记录当前字节  
          theChar = (++current != mEndPosition) ? *current : '\0';    //如果到文件末尾了，那么直接将theChar写成’\0’  
          if ((thePrevChar == '\r' && theChar == '\n') ||  
               (thePrevChar == '\n' && theChar == '\r')) {  
             theChar = (++current !=mEndPosition) ? *current : '\0'; // CRLF == LFCR => LF        //如果遇到了’\r’和’\n’结合使用的情况，再多跳过一个字节  
          }  
        }  
        break;  
      default:  
        done = PR_TRUE;     //其他情况下即遇到非空字符，则设置DONE为PR_TRUE以跳出循环  
        break;  
    }  
  }  
    
   if (skipped) {   //如果发生了跳过空字符  
    SetPosition(current);   //设置当前位置为新位置  
    if (current == mEndPosition) {   //如果当前位置为mEndPosition  
      result = kEOF;   //返回文件末尾值  
    }  
  }  
   return result;   //返回结果  
 }  
    
 //下面这个方法，是让扫描器从当前开始，不断前进，直到遇到一个不为参数所给出的aSkipChar为止。  
    
 /** 
  *  Skipover chars as long as they equal given char 
  *  
  * @update  gess 3/25/98 
  * @param 
  * @return  error code 
  */  
 nsresult nsScanner::SkipOver(PRUnicharaSkipChar){  
    
   if (!mSlidingBuffer) {    //如果当前待解析字符串为空  
    return kEOF;   //返回空值  
  }  
  //初始化两个变量  
  PRUnichar ch=0;  
  nsresult   result=NS_OK;  
   while(NS_OK==result) {    //循环进行字符跳过  
    result=Peek(ch);   //获取当前位置的字符  
    if(NS_OK == result) {   //如果获取成功  
      if(ch!=aSkipChar) {   //如果当前位置字符和所给定字符不等  
        break;     //跳出循环  
      }  
      GetChar(ch);     //调用前面的GetChar获取下一个字符  
    }  
    else break;    //其他情况下，即Peek()返回失败值，则退出循环  
  } //while  
   return result;   //返回结果  
 }  
    
 //下面这个方法，是针对Tag进行的，会让扫描器从当前位置开始，一直读取，直到遇到了一个’<’，或’>’，或’/’字符，或者前面提到过的空格型字符为止。  
 /** 
  * Consume characters until you run into space, a '<', a '>', or a'/'. 
  *  
  * @param   aString - receives newdata from stream 
  * @return  error code 
  */  
 nsresultnsScanner::ReadTagIdentifier(nsScannerSharedSubstring& aString) {  
    
   if (!mSlidingBuffer) {    //如果当前待解析的字符串为空  
    return kEOF;   //返回文件末尾值，即空值  
  }  
 //设置并初始化一些需要用的变量  
  PRUnichar         theChar=0;  
  nsresult         result=Peek(theChar);  
  nsScannerIterator current, end;  
  PRBool           found=PR_FALSE;   
    
  current = mCurrentPosition;  
  end = mEndPosition;  
    
   // Loop until we find an illegal character. Everything isthen appended  
   // later.  
  //下面这个循环，不断地循环，直到找到一个非法的字符为止  
   while(current != end && !found) {  
    theChar=*current;  
    
    switch(theChar) {  
      case '\n':  
      case '\r':  
      case ' ':  
      case '\t':  
      case '\v':  
      case '\f':  
      case '<':  
      case '>':  
      case '/':  
        found = PR_TRUE;    //找到非法字符，设置相应标示位  
        break;  
    
      case '\0':  
        ReplaceCharacter(current, sInvalid);   //如果是空字符则使用特殊字符对其进行替换  
        break;  
    
      default:  
        break;  
 }  
    if (!found) {  //如果没找到  
      ++current;   //则将当前位置前进一个字符  
    }  
 }  
  SetPosition(current);     //设置当前位置为新位置  
   if (current == end) {     //如果当前已经到了文件末尾  
    result = kEOF;     //返回文件末尾值  
  }  
    
   //DoErrTest(aString);  
    
   return result;   //返回处理结果  
 }  
    
 //下面这个方法，是让扫描器不断地读取字符，直到遇到了一个实体名为止。  
    
 /** 
  * Consume characters until you run into a char that's not valid in an 
  * entity name 
  *  
  * @param   aString - receives newdata from stream 
  * @return  error code 
  */  
 //和前面的方法基本相同，区别就是判断条件改为了：’_’，’-’，’.’或大小写字符及数字  
 nsresultnsScanner::ReadEntityIdentifier(nsString& aString) {  
    
   if (!mSlidingBuffer) {    //对待解析字符串进行判断  
    return kEOF;  
  }  
  //设置几个变量  
  PRUnichar         theChar=0;  
  nsresult         result=Peek(theChar);  
  nsScannerIterator origin, current, end;  
  PRBool           found=PR_FALSE;   
  //下面几个变量用来记录位置信息  
  origin = mCurrentPosition;  
  current = mCurrentPosition;  
  end = mEndPosition;  
    
   while(current != end) {   //循环遍历字符串，直到末尾或主动退出  
    theChar=*current;  //获取当前位置的字符  
    if(theChar) {  //如果字符存在  
      found=PR_FALSE;  //设置是否找到位found默认值为PR_FALSE  
      switch(theChar) {  
        case '_':  
        case '-':  
        case '.':  
          // Don't allow ':' in entity names.  See bug 23791  
          found = PR_TRUE;  
          break;  
        default:  
          found = ('a'<=theChar &&theChar<='z') ||  
                   ('A'<=theChar&& theChar<='Z') ||  
                   ('0'<=theChar&& theChar<='9');  
          break;  
      }  
      if(!found) {     //这里不应当对是否前进了进行一下判断么？如果mCurrentPosition和current相等怎么办？他似乎默认当前一定能找到Entity字符  
         //如果该字符不是任何Entity字符，那么将CurrentPosition位置和当前位置之间的字符串Append到aString中去  
        AppendUnicodeTo(mCurrentPosition, current,aString);  
        break;  
      }  
    }  
    ++current;     //将current前进一位  
  }  
    
  SetPosition(current);     //将当前位置设置为新的位置  
   if (current == end) {     //如果发现是文件末尾了  
    AppendUnicodeTo(origin, current, aString);  //将原始的position和当前位置之间的这段字符串粘贴到aString中去  
    return kEOF;  
  }  
   //DoErrTest(aString);  
   return result;   //返回结果  
 }  
    
 //下面这个ReadNumber方法和刚才那个方法几乎一样，只不过不是读取EntityName，而是读取数字，一旦遇到非数字就退出。  
    
 /** 
  * Consume digits 
  *  
  * @param   aString - should containdigits 
  * @return  error code 
  */  
 nsresultnsScanner::ReadNumber(nsString& aString,PRInt32 aBase) {  
    
   if (!mSlidingBuffer) {    //对待解析字符串的存在进行判定  
    return kEOF;  
  }  
 //判断aBase值进行判断，判断是什么进制的，目前只支持10进制或16进制  
  NS_ASSERTION(aBase == 10 || aBase == 16,"basevalue not supported");  
 //设置一些变量  
  PRUnichar         theChar=0;  
  nsresult         result=Peek(theChar);  
  nsScannerIterator origin, current, end;  
 //下面这些变量用来记录位置信息  
  origin = mCurrentPosition;  
  current = origin;  
  end = mEndPosition;  
    
  PRBool done = PR_FALSE;  
   while(current != end) {   //循环遍历字符串，直到字符串结尾或主动退出循环  
    theChar=*current;  
    if(theChar) {  //如果字符串存在  
      done = (theChar < '0' || theChar> '9') &&  
              ((aBase == 16)? (theChar < 'A' || theChar > 'F')&&  
                              (theChar < 'a' || theChar > 'f')  
                              :PR_TRUE);   //判断是否是0~9，或16进制情况下的A~F  
      if(done) {   //如果找到  
        AppendUnicodeTo(origin, current, aString); //则将其粘附到aString末尾  
        break;     //退出循环  
      }  
    }  
    ++current;  
  }  
  SetPosition(current);     //同上一个方法一样，主要为进行一些特殊情况的收尾工作  
   if (current == end) {  
    AppendUnicodeTo(origin, current, aString);  
    return kEOF;  
  }  
   //DoErrTest(aString);  
   return result;  
 }  
    
 //下面的方法ReadWhitespace是让扫描前从当前位置开始，一直读取，直到遇到非空白字符为止。  
    
 /** 
  * Consume characters until you find the terminal char 
  *  
  * @update  gess 3/25/98 
  * @param   aString receives new datafrom stream 
  * @param   addTerminal tells uswhether to append terminal to aString 
  * @return  error code 
 //注意其中aHaveCR参数和aNewlinesSkipped参数都是需要在本函数体内进行修改的外部变量 
 nsresultnsScanner::ReadWhitespace(nsScannerSharedSubstring& aString, 
                                    PRInt32&aNewlinesSkipped, 
                                    PRBool&aHaveCR) { 
  //首先将aHaveCR默认设置为FALSE 
  aHaveCR = PR_FALSE; 
   if (!mSlidingBuffer) {    //对待解析字符串的存在进行判定 
    return kEOF; 
  } 
  //申请一个字符类型变量，默认值为0 
  PRUnichar theChar = 0; 
  nsresult  result = Peek(theChar);  //查看当前位置的字符 
   
   if (NS_FAILED(result)) {  //如果查看失败 
    return result; //则返回失败结果 
  } 
   //申请用来存放位置信息的游标 
  nsScannerIterator origin, current, end; 
  PRBool done = PR_FALSE;   //设置后面循环用到的变量 
  //记录几个位置信息 
  origin = mCurrentPosition; 
  current = origin; 
  end = mEndPosition; 
   
  PRBool haveCR = PR_FALSE;      //申请一个新的内部使用的haveCR变量，默认同样为FALSE 
   while(!done && current != end) { 
    switch(theChar) { 
      case '\n': 
      case '\r': 
        {     //如果是’\n’或’\r’的情况下 
          ++aNewlinesSkipped;    //首先将aNewlinesSkipped加一，因为新的一行开始了 
          PRUnichar thePrevChar = theChar;     //记录当前字符 
          theChar = (++current != end) ? *current : '\0';    //获取下一个字符，如果是文件末尾了则设置下一个字符为’\0’ 
          if ((thePrevChar == '\r' && theChar == '\n') ||    //判断是否是\r\n同时出现 
               (thePrevChar == '\n' && theChar == '\r')) { 
            //如果是，那么首先判断theChar之后是否是字符串末尾，如果是则设theChar为’\0’ 
 theChar = (++current != end) ? *current: '\0'; // CRLF ==LFCR => LF 
 //设置内部的haveCR为TRUE 
             haveCR = PR_TRUE; 
          } else if(thePrevChar == '\r') {    //如果上一个字符为’\r’ 
             // LoneCR becomes CRLF; callers should know to remove extra CRs 
             AppendUnicodeTo(origin, current,aString);  //拷贝字符串 
            aString.writable().Append(PRUnichar('\n')); //并且需要手动在其之后加上一个’\n’字符 
             origin = current; 
             haveCR = PR_TRUE; 
          } 
        } 
        break; 
      case ' ': 
      case '\t': 
        theChar = (++current != end) ? *current : '\0'; //遇到其他类型的空白字符，则都需要对其是否为文件末尾做判断 
        break; 
      default: 
        done = PR_TRUE;     //默认情况下即不为空白字符，那么设置done为TRUE 
        AppendUnicodeTo(origin, current, aString); //并将目前已解析的这些字符串，注意是从orgin 
        break; 
    } 
  } 
   
   
 //下面这个方法和上面的ReadWhiteSpace大同小异 
   
 //XXXbz callers of this haveto manage their lone '\r' themselves if they want 
 //it to work.  Good thing they're all in view-source and itdeals. 
 nsresultnsScanner::ReadWhitespace(nsScannerIterator& aStart, 
                                   nsScannerIterator& aEnd, 
                                    PRInt32&aNewlinesSkipped) { 
   if (!mSlidingBuffer) {    //首先对代解析字符串的存在进行判断 
    return kEOF; 
  } 
   PRUnichartheChar = 0;         //申请一个新的变量 
  nsresult  result = Peek(theChar);  //获取当前位置的字符 
   if (NS_FAILED(result)) {  //如果获取字符失败 
    return result;     //返回失败结果 
  } 
  nsScannerIterator origin, current, end;      //三个用来记录位置的游标 
  PRBool done = PR_FALSE;   //设置循环条件 
  //初始化这三个游标的位置 
  origin = mCurrentPosition; 
  current = origin; 
  end = mEndPosition; 
  //循环查找字符，直到 
   while(!done && current != end) { 
    switch(theChar) { 
      case '\n': 
      case '\r':++aNewlinesSkipped; //遇到\n或者\r就将新行数加一 
      case ' ': 
      case '\t': 
        { 
          PRUnichar thePrevChar = theChar; 
          theChar = (++current != end) ? *current : '\0'; 
          if ((thePrevChar == '\r' && theChar == '\n') ||    //同时需要注意处理\n\r紧邻着同时出现的情况 
               (thePrevChar == '\n' && theChar == '\r')) { 
             theChar = (++current != end) ?*current : '\0'; //CRLF == LFCR => LF 
          } 
        } 
        break; 
      default: 
        done = PR_TRUE;     //默认情况下就说明找到了非空格字符 
        aStart = origin; 
        aEnd = current; 
        break; 
    } 
  } 
   
  SetPosition(current);     //设置当前位置为新位置 
   if (current == end) {     //判断是否已到达字符串末尾 
    aStart = origin; 
    aEnd = current; 
    result = kEOF; 
  } 
   
   return result; 
 } 
   
 //下面这个ReadUntil方法，将会不断地读取字符，直到遇到了一个在给定输入集中出现的字符为止，看过了以上几个方法，相信对于以下这个方法驾轻就熟地就能明白。 
   
 /** 
  * Consume characters until you encounter one contained in given 
  *  inputset. 
  *  
  * @update  gess 3/25/98 
  * @param   aString will contain theresult of this method 
  * @param   aTerminalSet is anordered string that contains 
  *          the set of INVALID characters 
  * @return  error code 
  */  
 //与以上几个方法不同，这里的参数中多了一个前面解析过的nsReadEndCondition，其中就包含了能够导致读取终止的特殊字符  
 nsresultnsScanner::ReadUntil(nsAString& aString,  
                               const nsReadEndCondition& aEndCondition,  
                               PRBooladdTerminal)  
 {   
   if (!mSlidingBuffer) {    //判断待解析的字符串是否为空  
    return kEOF;  
  }  
  //设置两个游标  
  nsScannerIterator origin, current;  
  //获取特殊字符  
   const PRUnichar* setstart = aEndCondition.mChars;  
   const PRUnichar* setcurrent;  
  //设置两个游标的位置  
  origin = mCurrentPosition;  
  current = origin;  
    
  PRUnichar         theChar=0;  
  nsresult         result=Peek(theChar);      //获取当前位置的字符  
   if (NS_FAILED(result)) {  //如果获取字符失败  
    return result;  
  }  
    
   while (current != mEndPosition) {       //循环，直到字符串末尾  
    theChar = *current;     //获取当亲字符  
    if (theChar == '\0'){  //如果当前位置是空字符’\0’  
      ReplaceCharacter(current, sInvalid);     //用替换字符对其进行替换  
      theChar = sInvalid;   //并且获取替换后的字符  
 }  
    
    // Filter out completely wrong characters  
    // Check if all bits are in the required area  
 if(!(theChar & aEndCondition.mFilter)){  
 //首先进行一下粗略的检查过滤，过滤掉大部分肯定是错误的字符，使用的就是前面aEndCondition构造方法中提到过的mFilter,通过位与的方法进行判断和处理，这主要应当是为了提高当aEndCondition很大时的处理效率  
      // They were. Do a thorough check.  
       //如果到了这里，那么就说明它很有可能是aEndCondition中的字符之一  
      setcurrent = setstart;  
      while (*setcurrent) {  
        if (*setcurrent == theChar) {     //判断是否是特殊字符  
          if(addTerminal)   //参数传递过来的标示位，是否需要将该特殊字符也添加到读取结果字符串中  
             ++current;  
          AppendUnicodeTo(origin, current, aString);    //粘贴字符串  
          SetPosition(current);  //设置当前位置为新位置  
          //DoErrTest(aString);  
          return NS_OK;  
        }  
        ++setcurrent;  //获取下一个aEndCondition中的字符  
      }  
    }  
    ++current;     //比较源字符串中的下一个字符  
  }  
   // If we are here, we didn't find any terminator in thestring and  
   // current = mEndPosition  
   //如果到达了这里，说明我们已经到达了字符串的末尾，并且没有遇到特殊字符  
  SetPosition(current);  
  AppendUnicodeTo(origin, current, aString);  
   return kEOF;  
 }  
    
 //下面这个ReadUntil()方法，和前面的方法唯一的区别就在于，其参数中使用的不是普通的String，而是nsScannerSharedSubString()，其他的和上面的方法一样，我们就不详细解析了，留给读者自己去理解。  
    
 nsresultnsScanner::ReadUntil(nsScannerSharedSubstring& aString,  
                               const nsReadEndCondition& aEndCondition,  
                               PRBooladdTerminal)  
 {   
   if (!mSlidingBuffer) {  
    return kEOF;  
  }  
  nsScannerIterator origin, current;  
   const PRUnichar* setstart = aEndCondition.mChars;  
   const PRUnichar* setcurrent;  
  origin = mCurrentPosition;  
  current = origin;  
  PRUnichar         theChar=0;  
  nsresult          result=Peek(theChar);  
   if (NS_FAILED(result)) {  
    return result;  
  }  
   while (current != mEndPosition) {  
    theChar = *current;  
    if (theChar == '\0'){  
      ReplaceCharacter(current, sInvalid);  
      theChar = sInvalid;  
 }  
    // Filter out completely wrong characters  
    // Check if all bits are in the required area  
    if(!(theChar &aEndCondition.mFilter)) {  
      // They were. Do a thorough check.  
      setcurrent = setstart;  
      while (*setcurrent) {  
        if (*setcurrent == theChar) {  
          if(addTerminal)  
             ++current;  
          AppendUnicodeTo(origin, current, aString);  
          SetPosition(current);  
          //DoErrTest(aString);  
          return NS_OK;  
        }  
        ++setcurrent;  
      }  
    }  
    ++current;  
  }  
  // If we are here, we didn't find any terminatorin the string and  
   // current = mEndPosition  
  SetPosition(current);  
  AppendUnicodeTo(origin, current, aString);  
   return kEOF;  
 }  
    
 //下面这个仍然是ReadUntil()方法，和前面唯一的区别就在于参数中多了两个参数aStart和aEnd，我们需要在读取的时候对这两个函数外部变量进行赋值，其中aStart实际上就是mCurrentPosition(几乎没有变化？)，aEnd标示了读取结束的位置，这个我们同样交给读者去理解。  
    
 /** 
  * Consumes chars until you see the given terminalChar 
  *  
  * @update  gess 3/25/98 
  * @param   
  * @return  error code 
  */  
 nsresult nsScanner::ReadUntil(nsAString&aString,  
                               PRUnicharaTerminalChar,  
                               PRBooladdTerminal)  
 {  
   if (!mSlidingBuffer) {  
    return kEOF;  
  }  
    
  nsScannerIterator origin, current;  
  origin = mCurrentPosition;  
  current = origin;  
  PRUnichar theChar;  
  nsresult result = Peek(theChar);  
    
   if (NS_FAILED(result)) {  
    return result;  
  }  
    
   while (current != mEndPosition) {  
    theChar = *current;  
    if (theChar == '\0'){  
      ReplaceCharacter(current, sInvalid);  
      theChar = sInvalid;  
    }  
    
    if (aTerminalChar == theChar) {  
      if(addTerminal)  
        ++current;  
      AppendUnicodeTo(origin, current, aString);  
      SetPosition(current);  
      return NS_OK;  
    }  
    ++current;  
  }  
    
   // If we are here, we didn't find any terminator in thestring and  
   // current = mEndPosition  
  AppendUnicodeTo(origin, current, aString);  
  SetPosition(current);  
   return kEOF;  
    
 }  
    
 //下面，是几个提供支持的简单的方法：  
    
 voidnsScanner::BindSubstring(nsScannerSubstring& aSubstring, const nsScannerIterator& aStart, const nsScannerIterator& aEnd)  
 {  
   //获取mSlidingBuffer，赋值到aSubstring中去，同时要为其传递mStart，和mEnd，以及计算一些如length等参数  
  aSubstring.Rebind(*mSlidingBuffer, aStart, aEnd);  
 }  
    
 voidnsScanner::CurrentPosition(nsScannerIterator& aPosition)  
 {  
  //获取mCurrentPosition  
  aPosition = mCurrentPosition;  
 }  
    
 voidnsScanner::EndReading(nsScannerIterator& aPosition)  
 {  
  //获取mEndPosition  
  aPosition = mEndPosition;  
 }  
    
 //接下来的这个SetPosition()方法前面用到过很多次，主要是为了强制重新设置mCurrentPosition的，同时要做好一些相关的处理工作，如重新计算mCountRemaining，所剩未解析的字节数等。  
    
 voidnsScanner::SetPosition(nsScannerIterator& aPosition, PRBool aTerminate,PRBool aReverse)  
 {  
   if (mSlidingBuffer) {     //首先对未解析字符串的存在进行判定  
 #ifdefDEBUG  
     PRUint32 origRemaining = mCountRemaining;  
 #endif  
 if (aReverse) {     //需要通过参数来判断新位置是在当前位置之前还是之后  
  //如果是在之前，则当前所剩字节需要加上偏移距离  
      mCountRemaining += (Distance(aPosition, mCurrentPosition));  
    }  
    else {    //反之就是在之后，需要减去偏移距离  
      mCountRemaining -= (Distance(mCurrentPosition, aPosition));  
    }  
      //下面这个是为了小心而对上面操作所做的一个检测  
    NS_ASSERTION((mCountRemaining >= origRemaining && aReverse)||     
                  (mCountRemaining <=origRemaining && !aReverse),  
                  "Improperuse of nsScanner::SetPosition. Make sure to set the"  
                  "aReverse parameter correctly");  
      //设置当前位置为新位置  
    mCurrentPosition = aPosition;  
    if (aTerminate &&(mCurrentPosition == mEndPosition)) {  //如果当前已经到了字符串结尾，并且相应的aTerminate标示位被设置为TRUE  
      mMarkPosition = mCurrentPosition;   //记录一下当前位置  
      mSlidingBuffer->DiscardPrefix(mCurrentPosition);  //删除当前位置之前的所有字符  
    }  
  }  
 }  
    
 //下面的方法是用来对非法字符等进行替换的方法。  
    
 voidnsScanner::ReplaceCharacter(nsScannerIterator& aPosition,  
                                  PRUnicharaChar)  
 {  
   if (mSlidingBuffer) {     //如果当前待解析字符串存在  
    mSlidingBuffer->ReplaceCharacter(aPosition, aChar); //直接对aPosition位置的字符进行替换  
  }  
 }  
    
    
 //下面这个AppendToBuffer是前面的那个Append所调用的，进行实际粘贴操作的方法。  
    
 PRBoolnsScanner::AppendToBuffer(nsScannerString::Buffer* aBuf,  
                                  nsIRequest *aRequest,  
                                  PRInt32aErrorPos)  
 {  
   //首先调用mParser的DataAdded通知Parser新的数据到达了  
   if (nsParser::sParserDataListeners && mParser&&  
      NS_FAILED(mParser->DataAdded(Substring(aBuf->DataStart(),  
                                             aBuf->DataEnd()), aRequest))) {  
 // Don't actually append on failure.  
 //如果失败了，那么直接将字符串至为空  
    return mSlidingBuffer != nsnull;  
  }  
    
   if (!mSlidingBuffer) {    //如果字符串为空的情况下  
    mSlidingBuffer = newnsScannerString(aBuf);    //使用aBuf初始化其为一个新的字符串  
    if (!mSlidingBuffer)    //如果初始化失败  
      return PR_FALSE;      //返回错误值，这里怎么不报那个NS_OUTOFMEMORY错误了？  
    mSlidingBuffer->BeginReading(mCurrentPosition);     //获取字符串的读取当前位置，即起始位置  
    mMarkPosition = mCurrentPosition;     //标记一下当前位置  
    mSlidingBuffer->EndReading(mEndPosition);  //获取结束位置  
    mCountRemaining = aBuf->DataLength();      //获取aBuf的长度  
  }  
   else {  
    mSlidingBuffer->AppendBuffer(aBuf);   //其他情况下，说明当前待解析的字符串不为空，我们需要将aBuf放到该字符串之后  
    if (mCurrentPosition == mEndPosition) {    //判断，如果当前位置是原始字符串的末尾  
      mSlidingBuffer->BeginReading(mCurrentPosition);   //设置新的当前位置，因为我们新增了内容  
    }  
    mSlidingBuffer->EndReading(mEndPosition);  //设置新的结束位置，同样因为有新增内容  
    mCountRemaining += aBuf->DataLength();     //增加剩余字节的数量  
  }  
    
    
   if (aErrorPos != -1 && !mHasInvalidCharacter){  //同时，要对非法字符进行处理，做判断，如果原始字符串中没有非法字符，而新增加的字符串中有非法字符  
    mHasInvalidCharacter = PR_TRUE;  //那么我们需要设置新的非法字符标志位  
    mFirstInvalidPosition = mCurrentPosition;      //改变新的非法字符位置  
    mFirstInvalidPosition.advance(aErrorPos);      //设置该位置为当前位置前进aErrorPos偏移距离后的位置  
  }  
    
   if (mFirstNonWhitespacePosition == -1) {         //同时需要对第一个非空白字符标示位进行修改，判断，如果原始的字符串中全部都是空白字符  
    nsScannerIterator iter(mCurrentPosition);  //那么设置两个游标iter和end  
    nsScannerIterator end(mEndPosition);  
    
    while (iter != end) {   //循环遍历新增加的那段字符串  
      if (!nsCRT::IsAsciiSpace(*iter)) {  //判断当前字符如果是非空字符  
        mFirstNonWhitespacePosition = Distance(mCurrentPosition, iter);    //那么设置第一个非空白字符标示位为起始地址+当前偏移地址（此处我怎么觉得这么别扭？不过貌似没错）  
        break;  
      }  
      ++iter; //将游标前进至下一个字符  
    }  
  }  
   return PR_TRUE;  
 }  
    
 //下面的方法，是在Parser中，以及一些nsScanner的调用体中经常用到的方法，该将未使用的字符串拷贝出去，以便在下一次解析过程中再进行使用，相当于对分步解析过程的支持。  
    
 /** 
  *  callthis to copy bytes out of the scanner that have not yet been consumed 
  *  bythe tokenization process. 
  *  
  *  @update  gess 5/12/98 
  * @param   aCopyBuffer is where thescanner buffer will be copied to 
  * @return  nada 
  */  
 voidnsScanner::CopyUnusedData(nsString& aCopyBuffer) {  
   if (!mSlidingBuffer) {         //首先得判断解析字符串是否存在  
    aCopyBuffer.Truncate();      //如果不存在或者为0值，直接清空并返回空值  
    return;  
  }  
  //设置两个游标  
  nsScannerIterator start, end;  
  start = mCurrentPosition;  
  end = mEndPosition;  
  //将当前未解析的字节拷贝出去，终于知道为什么设置mCurrentPosition和mEndPosition了  
  CopyUnicodeTo(start, end, aCopyBuffer);  
 }  
    
    
 //之后还有几个无关紧要的小方法，读者自己看一看就明白了，特别简单。  
    
 /** 
  * Retrieve the name of the file that the scanner is reading from. 
  *  Insome cases, it's just a given name, because the scanner isn't 
  * really reading from a file. 
  *  
  * @update  gess 5/12/98 
  * @return  
  */  
 nsString& nsScanner::GetFilename(void) {  //这个filename基本没用  
   return mFilename;  
 }  
    
    
 /** 
  * Conduct self test. Actually, selftesting for this class 
  * occurs in the parser selftest. 
  *  
  * @update  gess 3/25/98 
  * @param   
  * @return  
  */  
    
 voidnsScanner::SelfTest(void) {     //空方法，期待后来人编写  
 #ifdef_DEBUG  
 #endif  
 }  
    
 voidnsScanner::OverrideReplacementCharacter(PRUnichar aReplacementCharacter)  
 {             //重设新的非法字符替换字符  
  mReplacementCharacter = aReplacementCharacter;  
    
   if (mHasInvalidCharacter) {  
    ReplaceCharacter(mFirstInvalidPosition, mReplacementCharacter);  
  }  
 }  

后续:Mozilla Firefox Gecko内核源代码解析(4.nsHTMLTokens)

你可能感兴趣的:(buffer,firefox,Terminal,distance,mozill)

无人机避障——配置新NX Perishell 无人机
TerminalUbuntu安装Terminator及设置为默认终端_ubuntu安装terminator-CSDN博客谷歌拼音基于ubuntu20.4安装谷歌拼音中文输入法_ubuntu安装google输入法-CSDN博客JetsonOrin和Xaviernx的风扇调节Orinnx的默认风扇速度太慢，nx发烫的厉害，需要调节风速https://zhuanlan.zhihu.com/p/66558
Selenium使用指南程序员杰哥 selenium 测试工具 python 测试用例职场和发展程序人生功能测试
概述selenium是网页应用中最流行的自动化测试工具，可以用来做自动化测试或者浏览器爬虫等。官网地址为：相对于另外一款web自动化测试工具QTP来说有如下优点：免费开源轻量级，不同语言只需要一个体积很小的依赖包支持多种系统，包括Windows，Mac，Linux支持多种浏览器，包括Chrome，FireFox，IE，safari，opera等支持多语言，包括Java，C，python，c#等主流
Pytorch实现之利用特征分布的差异来指导GAN的训练这张生成的图像能检测吗优质GAN模型训练自己的数据集 GAN系列 pytorch 生成对抗网络人工智能神经网络深度学习计算机视觉机器学习
简介简介：FIDGAN通过将FID损失引入GAN的训练过程，显著提升了生成图像的质量。其核心思想是利用特征分布的差异来指导生成器的训练，同时通过使用轻量级的MobileNet-v3提高了计算效率。这种方法在图像生成任务中具有广泛的应用前景。论文题目：FIDGAN:AGenerativeAdversarialNetworkwithAnInceptionDistance（FIDGAN：具有初始距离的生
进阶 RocketMQ - 消息存储-一张图掌握核心要点微服务技术分享 rocketmq
看了很多遍源码整理的一张图进阶RocketMQ图片，关于RocketMQ你只需要记住这张图！消息传递责任已移交至Broker，接下来如何处理？首先，我们需要确保消息的持久化，避免因宕机导致的数据丢失。那么，消息该如何存储呢？是采用二进制、JSON、还是ProtocolBuffers（PB）？虽然这些格式在功能上都是可行的，但RocketMQ究竟选择了哪种？在确定了存储结构之后，消息应该存放在哪里呢
Java 字符串处理：String、StringBuilder 和 StringBuffer 探讨老猿讲编程 java 开发语言
在Java编程领域，字符串处理是极为常见的操作。Java提供了String、StringBuilder和StringBuffer这三个类来满足不同场景下对字符序列的处理需求。本文将深入探讨这三个类的特性、使用场景以及性能表现，并通过详细的源代码示例进行解析。一、String类：不可变的字符序列1.1不可变特性原理String类在Java中被设计为不可变类，这意味着一旦创建了一个String对象，其
Java(JavaEE)学习线路图太阳上的雨天 JAVA JAVA
Java学习线路图Java教程Java教程Java简介Java开发环境配置Java基础语法Java对象和类Java基本数据类型Java变量类型Java修饰符Java运算符Java循环结构Java分支结构JavaNumber类JavaCharacter类JavaString类JavaStringBuffer和StringBuilder类Java数组Java日期和时间Java正则表达式Java方法Ja
在make编译时，出现C++： fatal error:已杀死 signal terminated program cc1plus，解决办法太想进步了～ c++开发语言
在make编译时，出现C++：fatalerror:已杀死signalterminatedprogramcc1plus，如下图所示：出现上述问题，可以考虑是虚拟机内存不足，可以采用swap分区的方式解决。具体命令是：（1）主目录下创建分区路径（直接用“ctrl+ALT+T打开terminal，运行下面命令”）sudomkdir-p/var/cache/swap/（2）设置分区的大小（不唯一）bs=
ubuntu配置pip 清华源溯源006 论文复现 ubuntu pip linux
在Ubuntu上配置pip源可以通过修改~/.pip/pip.conf文件来完成。打开终端（Terminal）并输入以下命令创建或编辑该文件：nano~/.pip/pip.conf如果提示没有该目录或者文件不存在，则会自动创建相应的目录及文件。或者用其他编辑器也可以比如vim或者其他文本编辑器。将以下内容复制到pip.conf中保存退出：[global]index-url=https://pypi
vscode默认终端怎么设置成git bash 一个前端人前端 vscode git bash
要将VSCode的默认终端设置为GitBash，可以按照以下步骤操作：打开VSCode并点击左侧菜单栏中的“视图”（View）选项。在下拉菜单中选择“命令面板”（CommandPalette）。在命令面板中输入“Terminal:SelectDefaultProfile”并选择该选项。在弹出的下拉菜单中选择“GitBash”作为默认终端。或者，你也可以通过以下方式进行设置：打开VSCode并点击左
ffmpeg源码分析：avformat_open_input() 风雨兼程8023 ffmpeg ffmpeg
目录一、avformat_alloc_context()二、init_input()2.1av_probe_input_format2()2.2av_probe_input_buffer2()2.3io_open三、read_header()本文简单分析FFmpeg中一个常用的函数：avformat_open_input()。该函数用于打开多媒体数据并且获得一些相关的信息。它的声明位于libavf
第十四章文件操作 MPCTHU python python
文章目录14.1认识I/O从硬件角度看I/O从软件角度看I/O14.2文件的基本操作思维导图14.2.1打开文件1.`fileName`2.`mode`3.`buffering`4.`encoding`5.`errors`6.`newline`7.`closefd`8.`opener`14.2.2读取文件1.`file.read(size=-1)`2.`file.readline(size=-1)
java使用递归获取geojson（json）数据迷茫的小猿 java java json
需要导入的包：org.json-chargebee-1.0.jarpackageparse;importjava.io.BufferedReader;importjava.io.BufferedWriter;importjava.io.FileReader;importjava.io.FileWriter;importjava.io.IOException;importjava.util.Arra
Django中的超级管理员相关操作胜天半月子 Web django 数据库 python
超级管理员操作场景描述添加超级管理员删除超级管理员更改超级管理员名称场景描述在进行管理员操作的时候，密码忘记，导致超级管理员无法使用，因此网上搜索相关操作，进行总结记录相关操作都是在控制台完成Terminal添加超级管理员pythonmanage.pycreatesuperuser(就是createsuperuser连接在一起)删除超级管理员pythonmanage.pyshellfromdjan
保姆级教学 uniapp绘制二维码海报并保存至相册，真机正常展示图片二维码前端（从入门到入土） uni-app
一、获取二维码uni.request({url:`https://api.weixin.qq.com/wxa/getwxacode?access_token=${getStorage("token")}`,responseType:"arraybuffer",method:"POST",data:{path:"/pages/index/index"},success(res){//转换为Uint8
POI按行读取word,并去掉属性标签内容：超链接 weixin_30535043
publicStringreadDoc(Filefile){StringBufferbuffer=newStringBuffer();InputStreaminput=null;WordExtractorextractor=null;String[]paragraphs=null;try{input=newFileInputStream(file);extractor=newWordExtract
Netty的ByteBuf为何如此高效？深入解析其设计与优势星辰@Sea 系统架构 Java Netty Java
前言在高性能网络编程中，Netty因其卓越的性能和灵活性而被广泛应用。本文将深入探讨Netty的核心组件之一——ByteBuf的设计理念及其优势。部署准备一、JavaNIOBuffer的痛点在传统JavaNIO编程中，ByteBuffer存在以下缺陷：容量固定：初始化后无法自动扩容读写模式切换：需要调用flip()方法切换API复杂：position/limit等指针管理繁琐内存管理：直接内存需要
Excel与数据库操作楼外楼 excel 数据库 sql sqlserver 服务器 insert
VC6.0中用ADO操作Excel的连接字符串："DSN=ExcelFiles;DBQ=FilePath+FileName;DefaultDir=FilePath;DriverID=790;MaxBuffersize=2048;pagetimeout=5;"例如：DSN=ExcelFiles;DBQ=D://T_20071122.xls;DefaultDir=D://;DriverId=790;M
字符串相似度算法 S Y H java工具类算法 java 开发语言
publicstaticvoidmain(String[]args){Stringaddress1="济南市历下区经十路69号12号楼1单元401号";Stringaddress2="济南市历下区经十路69号顺元街道12号楼1单元401号";intdistance=levenshteinDistance(address1,address2);System.out.println("Levensht
android 使用wifi进行adb调试 huangmingcsdn Android android adb
1.确认使用usb线连接android后adb调试成功2.android和电脑连接同一个局域网,记录androidip3.下载android终端模拟器Terminal4.打开android终端模拟器,输入命令,开启androidadb调试端口setpropservice.adb.tcp.port5555stopadbdstartadbd5.打开cmd窗口,输入命令adbconnectip
java 知识点突击-(1-10) 栗子~~ 面试突击(个人)java 面试开发语言
文章目录前言java知识点扫盲目录java知识点突击-(1-10)01JDK、JRE、JVM什么区别02==和equals的区别03hashcode()与equals()的作用、区别和联系04重载和重写的区别05final的作用06为什么局部内部类和匿名内部类只能访问局部final变量?07String、StringBuffer,StringBuilder的区别?08String为什么是final
java面试突击 rywyyvc3qv2k---- JAVA java 面试 jvm
Java基础Java接口和抽象类有什么区别？String，StringBuilder和StringBuffer的区别？final、finally、finalize三个关键字的区别？==和equals的区别，给段代码判断下“==”和equals的返回值。Java基本数据类型有几种，每一种的区别是什么？值传递和引用传递的区别？Java的异常体系？受检查和非受检查异常区别？序列化和反序列化。反射和泛型。
python3 + selenium webdriver自动化测试启动不同浏览器 cs_mengxi selenium Web自动化 selenium 测试工具
seleniumwebdriver自动化测试启动不同浏览器seleniumwebdriver介绍SeleniumWebDriver进行自动化测试的一般流程浏览器驱动下载浏览器驱动的安装chrome、edge、Firefox、Opera、Safari、phantomjs应用HeadlessChrome、HeadlessFirefox应用seleniumwebdriver介绍SeleniumWebDr
火狐浏览器webdriver配置爱吃红薯拔丝的小鹿爬虫
要使用Selenium和Firefox浏览器，你需要配置Firefox浏览器和GeckoDriver。以下是配置的步骤：下载Firefox浏览器：确保你已经下载并安装了最新版本的Firefox浏览器。你可以从Mozilla官方网站下载Firefox：https://www.mozilla.org/firefox/下载GeckoDriver：根据你的Firefox浏览器版本下载对应的GeckoDri
【Node-Red】Function节点教学零炻大礼包 Node-Red 笔记 node.js
本篇来讲在Node-Red中编写函数时用到的一个至关重要的节点：function。function节点允许消息运行JavaScript代码。其中部分内容来自官方文档翻译：function节点用户指南。Function节点教学1.变量定义2.返回值1）返回单条数据进阶1进阶22）返回多条数据3.其他变量定义1）数组定义buffer2.Array4.运算符1）算数运算符2）赋值运算符3）字符与运算符4
JavaScript实现拖动窗口功能详解滚菩提哦呢
本文还有配套的精品资源，点击获取简介：本教程深入讲解了如何通过JavaScript实现拖动窗口功能，涵盖了原生方法和面向对象（OOP）的封装技术，以及确保代码在主流浏览器（包括IE6、Firefox和Chrome）中的兼容性。教程提供详细代码示例，从基础的原生拖动方法到利用OOP封装的Droppable类，再到特殊浏览器的兼容性处理，使读者能够掌握全面的拖动窗口实现技巧。1.JavaScript拖
html显示base64的pdf,html - base64 embeded PDF files won't render in Chrome - Stack Overflow weixin_33047553
SomePDFfileswon'trenderinChromebrowserbutwillrenderfineinFirefox.Allfilesrenderfineinallbrowsersifemededdirectly.Theconfusingpartisthattheproblemisonlyforsomefilesandnotall.Filesarestoredinafolderthat
java怎么复制别人的数据库_使用java将数据库文件复制到本地磁盘中岑依惜 java怎么复制别人的数据库
packagecom.starry.exersise;importjava.io.BufferedInputStream;importjava.io.BufferedOutputStream;importjava.io.FileOutputStream;importjava.io.InputStream;importjava.sql.Blob;importjava.sql.Connection;i
在springboot加vue项目中加入图形验证码小山曲奇 spring boot vue.js 后端
后端首先先要创建一个CaptchaController的类，可以在下面的代码中看到在getCaptcha的方法里面写好了生成随机的4位小写字母或数字的验证码，然后通过BufferedImage类变为图片，顺便加上了干扰线。之后把图片转为Base64编码方便传给前端为了安全我写了encrypt方法把4位验证码加密了一下，和图片放在了Mapli传给了前端，后面的verifyCaptcha是对前端输入的
零基础油猴脚本保姆级学习计划，7天快速入门星河776(重名区分) 技巧文章其他学习 dubbo javascript
「零基础油猴脚本」保姆级学习计划，共7天完成。所有步骤保证清晰无术语，附带案例和验证方法，确保小白也能跑通。───第1天：认识油猴&完成第一个脚本───安装油猴（Tampermonkey）Chrome：打开应用商店→搜索Tampermonkey→安装Firefox：附加组件商店→搜索安装Edge：同Chrome操作创建第一个脚本点击油猴图标→创建新脚本删除默认代码，粘贴以下内容：//==UserS
HTTP头部参数详解 weixin_34418883 xhtml
HTTP请求消息头部实例：Host：rss.sina.com.cn//客户端指定自己想访问的WEB服务器的域名/IP地址和端口号User-Agent：Mozilla/5.0(Windows;U;WindowsNT5.1;zh-CN;rv:1.8.1.14)Gecko/20080404Firefox/2.0.0.14//头域的内容包含发出请求的用户信息。Accept：text/xml,applica
web报表工具FineReport常见的数据集报错错误代码和解释老A不折腾 web报表 finereport 代码可视化工具
在使用finereport制作报表，若预览发生错误，很多朋友便手忙脚乱不知所措了，其实没什么，只要看懂报错代码和含义，可以很快的排除错误，这里我就分享一下finereport的数据集报错错误代码和解释，如果有说的不准确的地方，也请各位小伙伴纠正一下。 NS-war-remote=错误代码\:1117 压缩部署不支持远程设计 NS_LayerReport_MultiDs=错误代码
Java的WeakReference与WeakHashMap bylijinnan java 弱引用
首先看看 WeakReference wiki 上 Weak reference 的一个例子： public class ReferenceTest { public static void main(String[] args) throws InterruptedException { WeakReference r = new Wea
Linux——（hostname）主机名与ip的映射 eksliang linux hostname
一、什么是主机名无论在局域网还是INTERNET上，每台主机都有一个IP地址，是为了区分此台主机和彼台主机，也就是说IP地址就是主机的门牌号。但IP地址不方便记忆，所以又有了域名。域名只是在公网（INtERNET)中存在，每个域名都对应一个IP地址，但一个IP地址可有对应多个域名。域名类型 linuxsir.org 这样的；主机名是用于什么的呢？答：在一个局域网中，每台机器都有一个主
oracle 常用技巧 18289753290
oracle常用技巧 ①复制表结构和数据 create table temp_clientloginUser as select distinct userid from tbusrtloginlog ②仅复制数据如果表结构一样 insert into mytable select * &nb
使用c3p0数据库连接池时出现com.mchange.v2.resourcepool.TimeoutException 酷的飞上天空 exception
有一个线上环境使用的是c3p0数据库，为外部提供接口服务。最近访问压力增大后台tomcat的日志里面频繁出现 com.mchange.v2.resourcepool.TimeoutException: A client timed out while waiting to acquire a resource from com.mchange.v2.resourcepool.BasicResou
IT系统分析师如何学习大数据蓝儿唯美大数据
我是一名从事大数据项目的IT系统分析师。在深入这个项目前需要了解些什么呢？学习大数据的最佳方法就是先从了解信息系统是如何工作着手，尤其是数据库和基础设施。同样在开始前还需要了解大数据工具，如Cloudera、Hadoop、Spark、Hive、Pig、Flume、Sqoop与Mesos。系统分析师需要明白如何组织、管理和保护数据。在市面上有几十款数据管理产品可以用于管理数据。你的大数据数据库可能
spring学习——简介 a-john spring
Spring是一个开源框架，是为了解决企业应用开发的复杂性而创建的。Spring使用基本的JavaBean来完成以前只能由EJB完成的事情。然而Spring的用途不仅限于服务器端的开发，从简单性，可测试性和松耦合的角度而言，任何Java应用都可以从Spring中受益。其主要特征是依赖注入、AOP、持久化、事务、SpringMVC以及Acegi Security 为了降低Java开发的复杂性，
自定义颜色的xml文件 aijuans xml
<?xml version="1.0" encoding="utf-8"?> <resources> <color name="white">#FFFFFF</color> <color name="black">#000000</color> &
运营到底是做什么的？ aoyouzi 运营到底是做什么的？
文章来源：夏叔叔（微信号：woshixiashushu），欢迎大家关注！很久没有动笔写点东西，近些日子，由于爱狗团产品上线，不断面试，经常会被问道一个问题。问：爱狗团的运营主要做什么？答：带着用户一起嗨。为什么是带着用户玩起来呢？究竟什么是运营？运营到底是做什么的？那么，我们先来回答一个更简单的问题——互联网公司对运营考核什么？以爱狗团为例，绝大部分的移动互联网公司，对运营部门的考核分为三块——用
js面向对象类和对象百合不是茶 js 面向对象函数创建类和对象
接触js已经有几个月了,但是对js的面向对象的一些概念根本就是模糊的,js是一种面向对象的语言但又不像java一样有class,js不是严格的面向对象语言 ,js在java web开发的地位和java不相上下 ,其中web的数据的反馈现在主流的使用json,json的语法和js的类和属性的创建相似下面介绍一些js的类和对象的创建的技术一:类和对
web.xml之资源管理对象配置 resource-env-ref bijian1013 java web.xml servlet
resource-env-ref元素来指定对管理对象的servlet引用的声明，该对象与servlet环境中的资源相关联 <resource-env-ref> <resource-env-ref-name>资源名</resource-env-ref-name> <resource-env-ref-type>查找资源时返回的资源类
Create a composite component with a custom namespace sunjing
https://weblogs.java.net/blog/mriem/archive/2013/11/22/jsf-tip-45-create-composite-component-custom-namespace When you developed a composite component the namespace you would be seeing would
【MongoDB学习笔记十二】Mongo副本集服务器角色之Arbiter bit1129 mongodb
一、复本集为什么要加入Arbiter这个角色回答这个问题，要从复本集的存活条件和Aribter服务器的特性两方面来说。什么是Artiber？ An arbiter does not have a copy of data set and cannot become a primary. Replica sets may have arbiters to add a
Javascript开发笔记白糖_ JavaScript
获取iframe内的元素通常我们使用window.frames["frameId"].document.getElementById("divId").innerHTML这样的形式来获取iframe内的元素，这种写法在IE、safari、chrome下都是通过的，唯独在fireforx下不通过。其实jquery的contents方法提供了对if
Web浏览器Chrome打开一段时间后，运行alert无效 bozch Web chorme alert 无效
今天在开发的时候，突然间发现alert在chrome浏览器就没法弹出了，很是怪异。试了试其他浏览器，发现都是没有问题的。开始想以为是chorme浏览器有啥机制导致的，就开始尝试各种代码让alert出来。尝试结果是仍然没有显示出来。这样开发的结果，如果客户在使用的时候没有提示，那会带来致命的体验。哎，没啥办法了就关闭浏览器重启。结果就好了，这也太怪异了。难道是cho
编程之美-高效地安排会议图着色问题贪心算法 bylijinnan 编程之美
import java.util.ArrayList; import java.util.Collections; import java.util.List; import java.util.Random; public class GraphColoringProblem { /**编程之美高效地安排会议图着色问题贪心算法 * 假设要用很多个教室对一组
机器学习相关概念和开发工具 chenbowen00 算法 matlab 机器学习
基本概念：机器学习(Machine Learning, ML)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域，它主要使用归纳、综合而不是演绎。开发工具 M
[宇宙经济学]关于在太空建立永久定居点的可能性 comsci 经济
大家都知道,地球上的房地产都比较昂贵,而且土地证经常会因为新的政府的意志而变幻文本格式........ 所以,在地球议会尚不具有在太空行使法律和权力的力量之前,我们外太阳系统的友好联盟可以考虑在地月系的某些引力平衡点上面,修建规模较大的定居点
oracle 11g database control 证书错误 daizj oracle 证书错误 oracle 11G 安装
oracle 11g database control 证书错误 win7 安装完oracle11后打开 Database control 后，会打开em管理页面，提示证书错误，点“继续浏览此网站”，还是会继续停留在证书错误页面解决办法：是 KB2661254 这个更新补丁引起的，它限制了 RSA 密钥位长度少于 1024 位的证书的使用。具体可以看微软官方公告：
Java I/O之用FilenameFilter实现根据文件扩展名删除文件游其是你 FilenameFilter
在Java中，你可以通过实现FilenameFilter类并重写accept(File dir, String name) 方法实现文件过滤功能。在这个例子中，我们向你展示在“c:\\folder”路径下列出所有“.txt”格式的文件并删除。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
C语言数组的简单以及一维数组的简单排序算法示例，二维数组简单示例 dcj3sjt126com c array
# include <stdio.h> int main(void) { int a[5] = {1, 2, 3, 4, 5}; //a 是数组的名字 5是表示数组元素的个数，并且这五个元素分别用a[0], a[1]...a[4] int i; for (i=0; i<5; ++i) printf("%d\n",
PRIMARY, INDEX, UNIQUE 这3种是一类 PRIMARY 主键。就是唯一且不能为空。 INDEX 索引，普通的 UNIQUE 唯一索引 dcj3sjt126com primary
PRIMARY, INDEX, UNIQUE 这3种是一类PRIMARY 主键。就是唯一且不能为空。INDEX 索引，普通的UNIQUE 唯一索引。不允许有重复。FULLTEXT 是全文索引，用于在一篇文章中，检索文本信息的。举个例子来说，比如你在为某商场做一个会员卡的系统。这个系统有一个会员表有下列字段：会员编号 INT会员姓名
java集合辅助类 Collections、Arrays shuizhaosi888 Collections Arrays HashCode
Arrays、Collections 1 ）数组集合之间转换 public static <T> List<T> asList(T... a) { return new ArrayList<>(a); } a）Arrays.asL
Spring Security（10）——退出登录logout 234390216 logout Spring Security 退出登录 logout-url LogoutFilter
要实现退出登录的功能我们需要在http元素下定义logout元素，这样Spring Security将自动为我们添加用于处理退出登录的过滤器LogoutFilter到FilterChain。当我们指定了http元素的auto-config属性为true时logout定义是会自动配置的，此时我们默认退出登录的URL为“/j_spring_secu
透过源码学前端之 Backbone 三 Model 逐行分析JS源代码 backbone 源码分析 js学习
Backbone 分析第三部分 Model 概述： Model 提供了数据存储，将数据以JSON的形式保存在 Model的 attributes里，但重点功能在于其提供了一套功能强大，使用简单的存、取、删、改数据方法，并在不同的操作里加了相应的监听事件，如每次修改添加里都会触发 change，这在据模型变动来修改视图时很常用，并且与collection建立了关联。
SpringMVC源码总结（七）mvc:annotation-driven中的HttpMessageConverter 乒乓狂魔 springMVC
这一篇文章主要介绍下HttpMessageConverter整个注册过程包含自定义的HttpMessageConverter，然后对一些HttpMessageConverter进行具体介绍。 HttpMessageConverter接口介绍： public interface HttpMessageConverter<T> { /** * Indicate
分布式基础知识和算法理论 bluky999 算法 zookeeper 分布式一致性哈希 paxos
分布式基础知识和算法理论 BY [email protected] 本文永久链接：http://nodex.iteye.com/blog/2103218 在大数据的背景下，不管是做存储，做搜索，做数据分析，或者做产品或服务本身，面向互联网和移动互联网用户，已经不可避免地要面对分布式环境。笔者在此收录一些分布式相关的基础知识和算法理论介绍，在完善自我知识体系的同
Android Studio的.gitignore以及gitignore无效的解决 bell0901 android gitignore
　　github上.gitignore模板合集，里面有各种.gitignore ： https://github.com/github/gitignore 　　自己用的Android Studio下项目的.gitignore文件，对github上的android.gitignore添加了　　　　　　# OSX files　　　　　　//mac os下　　　　　　.DS_Store
成为高级程序员的10个步骤 tomcat_oracle 编程
What 软件工程师的职业生涯要历经以下几个阶段：初级、中级，最后才是高级。这篇文章主要是讲如何通过 10 个步骤助你成为一名高级软件工程师。 Why 得到更多的报酬！因为你的薪水会随着你水平的提高而增加提升你的职业生涯。成为了高级软件工程师之后，就可以朝着架构师、团队负责人、CTO 等职位前进历经更大的挑战。随着你的成长，各种影响力也会提高。
mongdb在linux下的安装 xtuhcy mongodb linux
一、查询linux版本号： lsb_release -a LSB Version: :base-4.0-amd64:base-4.0-noarch:core-4.0-amd64:core-4.0-noarch:graphics-4.0-amd64:graphics-4.0-noarch:printing-4.0-amd64:printing-4.0-noa