starxu85

北大天网搜索引擎TSE分析及完全注释[3]来到关键字分词及相关性分析程序

有前面注释我们可以知道查询关键字和字典文件准备好好后，将进入用户关键字分词阶段

//TSESearch.cpp中：

view plain copy to clipboard print ?

CHzSeg iHzSeg; //include ChSeg/HzSeg.h
//
iQuery.m_sSegQuery = iHzSeg.SegmentSentenceMM(iDict, iQuery.m_sQuery); //将get到的查询变量分词分成 "我/ 爱/ 你们/ 的/ 格式"
vector<STRING></STRING> vecTerm;
iQuery.ParseQuery(vecTerm); //将以"/"划分开的关键字一一顺序放入一个向量容器中
set<STRING></STRING> setRelevantRst;
iQuery.GetRelevantRst(vecTerm, mapBuckets, setRelevantRst);
gettimeofday(&end_tv,&tz);
// search end
//搜索完毕

	CHzSeg iHzSeg;		//include ChSeg/HzSeg.h

	//
	iQuery.m_sSegQuery = iHzSeg.SegmentSentenceMM(iDict, iQuery.m_sQuery);	//将get到的查询变量分词分成 "我/		爱/		你们/	的/		格式"
	
	vector vecTerm;
	iQuery.ParseQuery(vecTerm);		//将以"/"划分开的关键字一一顺序放入一个向量容器中
	
	set setRelevantRst; 
	iQuery.GetRelevantRst(vecTerm, mapBuckets, setRelevantRst); 
	
	gettimeofday(&end_tv,&tz);
	// search end
	//搜索完毕

view plain copy to clipboard print ?

看CHzSeg 中的这个方法

看CHzSeg 中的这个方法

view plain copy to clipboard print ?

//ChSeg/HzSeg.h

//ChSeg/HzSeg.h

view plain copy to clipboard print ?

/**
* 程序翻译说明
* 进一步净化数据，转换汉字
* @access public
* @param CDict, string 参数的汉字说明:字典，查询字符串
* @return string 0
*/
// process a sentence before segmentation
//在分词前处理句子
string CHzSeg::SegmentSentenceMM (CDict &dict, string s1) const
{
string s2="";
unsigned int i,len;
while (!s1.empty())
{
unsigned char ch=(unsigned char) s1[0];
if(ch<128)
{ // deal with ASCII
i=1;
len = s1.size();
while (i<LEN len="s1.length();" i="0;" 中文标点等非汉字字符="" if="" else="" yhf="" s1="s1.substr(i);" by="" added="" ch="=13)" s2="" cr=""></LEN>=161)
&& (!((unsigned char)s1[i]==161 && ((unsigned char)s1[i+1]>=162 && (unsigned char)s1[i+1]<=168)))
&& (!((unsigned char)s1[i]==161 && ((unsigned char)s1[i+1]>=171 && (unsigned char)s1[i+1]<=191)))
&& (!((unsigned char)s1[i]==163 && ((unsigned char)s1[i+1]==172 || (unsigned char)s1[i+1]==161)
|| (unsigned char)s1[i+1]==168 || (unsigned char)s1[i+1]==169 || (unsigned char)s1[i+1]==186
|| (unsigned char)s1[i+1]==187 || (unsigned char)s1[i+1]==191)))
{
ii=i+2; // 假定没有半个汉字
}
if (i==0) ii=i+2;
// 不处理中文空格
if (!(ch==161 && (unsigned char)s1[1]==161))
{
if (i <= s1.size()) // yhf
// 其他的非汉字双字节字符可能连续输出
s2 += s1.substr(0, i) + SEPARATOR;
else break; // yhf
}
if (i <= s1.size()) // yhf
s1s1=s1.substr(i);
else break; //yhf
continue;
}
}
// 以下处理汉字串
i = 2;
len = s1.length();
while(i<LEN></LEN>=176)
// while(i<LEN></LEN>=128 && (unsigned char)s1[i]!=161)
i+=2;
s2+=SegmentHzStrMM(dict, s1.substr(0,i));
if (i <= len) // yhf
s1s1=s1.substr(i);
else break; // yhf
}
return s2;
}

/**
 * 程序翻译说明
 * 进一步净化数据，转换汉字
 * @access  public
 * @param   CDict, string 参数的汉字说明:字典，查询字符串
 * @return  string 0
 */
// process a sentence before segmentation
//在分词前处理句子
string CHzSeg::SegmentSentenceMM (CDict &dict, string s1) const
{
	string s2="";
	unsigned int i,len;

	while (!s1.empty()) 
	{
		unsigned char ch=(unsigned char) s1[0];
		if(ch<128) 
		{ // deal with ASCII
			i=1;
			len = s1.size();
			while (i=161)
              && (!((unsigned char)s1[i]==161 && ((unsigned char)s1[i+1]>=162 && (unsigned char)s1[i+1]<=168)))
              && (!((unsigned char)s1[i]==161 && ((unsigned char)s1[i+1]>=171 && (unsigned char)s1[i+1]<=191)))
              && (!((unsigned char)s1[i]==163 && ((unsigned char)s1[i+1]==172 || (unsigned char)s1[i+1]==161) 
              || (unsigned char)s1[i+1]==168 || (unsigned char)s1[i+1]==169 || (unsigned char)s1[i+1]==186
              || (unsigned char)s1[i+1]==187 || (unsigned char)s1[i+1]==191))) 
				{ 
					i=i+2; // 假定没有半个汉字
				}

				if (i==0) i=i+2;

				// 不处理中文空格
				if (!(ch==161 && (unsigned char)s1[1]==161)) 
				{ 
					if (i <= s1.size())	// yhf
						// 其他的非汉字双字节字符可能连续输出
						s2 += s1.substr(0, i) + SEPARATOR; 
					else break; // yhf
				}

				if (i <= s1.size())	// yhf
					s1=s1.substr(i);
				else break;		//yhf

				continue;
			}
		}
    

    // 以下处理汉字串

		i = 2;
		len = s1.length();

		while(i=176) 
//    while(i=128 && (unsigned char)s1[i]!=161)
			i+=2;

		s2+=SegmentHzStrMM(dict, s1.substr(0,i));

		if (i <= len)	// yhf
			s1=s1.substr(i);
		else break;	// yhf
	}

	return s2;
}

view plain copy to clipboard print ?

//Query.cpp

//Query.cpp

view plain copy to clipboard print ?

<PRE class=csharp name="code">/**
* 程序翻译说明
* 将以"/"划分开的关键字一一顺序放入一个向量容器中
*
* @access public
* @param vector<STRING></STRING> 参数的汉字说明：向量容器
* @return void
*/
void CQuery::ParseQuery(vector<STRING></STRING> &vecTerm)
{
string::size_type idx;
while ( (idx = m_sSegQuery.find("/ ")) != string::npos ) {
vecTerm.push_back(m_sSegQuery.substr(0,idx));
m_sSegQuerym_sSegQuery = m_sSegQuery.substr(idx+3);
}
}
</PRE>
<PRE class=csharp name="code"> </PRE>
<PRE class=csharp name="code"><PRE class=csharp name="code">/**
* 程序翻译说明
* 相关性分析查询，构造结果集合setRelevantRst //瓶颈所在
*
* @access public
* @param vector<STRING></STRING> map set<STRING></STRING> 参数的汉字说明：用户提交关键字的分词组，倒排索引映射，相关性结果集合
* @return string 0
*/
bool CQuery::GetRelevantRst
(
vector<STRING></STRING> &vecTerm,
map &mapBuckets,
set<STRING></STRING> &setRelevantRst
) const
{
set<STRING></STRING> setSRst;
bool bFirst=true;
vector<STRING></STRING>::iterator itTerm = vecTerm.begin();
for ( ; itTerm != vecTerm.end(); ++itTerm )
{
setSRst.clear();
copy(setRelevantRst.begin(), setRelevantRst.end(), inserter(setSRst,setSRst.begin()));
map mapRstDoc;
string docid;
int doccnt;
map::iterator itBuckets = mapBuckets.find(*itTerm);
if (itBuckets != mapBuckets.end())
{
string strBucket = (*itBuckets).second;
string::size_type idx;
idx = strBucket.find_first_not_of(" ");
strBucketstrBucket = strBucket.substr(idx);
while ( (idx = strBucket.find(" ")) != string::npos )
{
docid = strBucket.substr(0,idx);
doccnt = 0;
if (docid.empty()) continue;
map::iterator it = mapRstDoc.find(docid);
if ( it != mapRstDoc.end() )
{
doccnt = (*it).second + 1;
mapRstDoc.erase(it);
}
mapRstDoc.insert( pair(docid,doccnt) );
strBucketstrBucket = strBucket.substr(idx+1);
}
// remember the last one
docid = strBucket;
doccnt = 0;
map::iterator it = mapRstDoc.find(docid);
if ( it != mapRstDoc.end() )
{
doccnt = (*it).second + 1;
mapRstDoc.erase(it);
}
mapRstDoc.insert( pair(docid,doccnt) );
}
// sort by term frequencty
multimap > newRstDoc;
map::iterator it0 = mapRstDoc.begin();
for ( ; it0 != mapRstDoc.end(); ++it0 ){
newRstDoc.insert( pair((*it0).second,(*it0).first) );
}
multimap::iterator itNewRstDoc = newRstDoc.begin();
setRelevantRst.clear();
for ( ; itNewRstDoc != newRstDoc.end(); ++itNewRstDoc ){
string docid = (*itNewRstDoc).second;
if (bFirst==true) {
setRelevantRst.insert(docid);
continue;
}
if ( setSRst.find(docid) != setSRst.end() ){
setRelevantRst.insert(docid);
}
}
//cout << "setRelevantRst.size(): " << setRelevantRst.size() << "<BR>";
bFirst = false;
}
return true;
}</PRE>
</PRE>
接下来的就是现实了，前面都只是处理数据得到 setRelevantRst 这个查询结构集合,这里就不多说了下面就和php之类的脚本语言差不多，格式化结果集合并显示出来。

  
  
  
  
   
   
   
    
    
      view plain copy to clipboard print ? 
     
   
   
   
   
    
    /**   
     * 程序翻译说明   
     * 将以"/"划分开的关键字一一顺序放入一个向量容器中   
     *   
     * @access  public   
     * @param   vector<STRING></STRING> 参数的汉字说明：向量容器   
     * @return  void   
     */   
    void CQuery::ParseQuery(vector<STRING></STRING> &vecTerm)    
    {    
        string::size_type idx;     
        while ( (idx = m_sSegQuery.find("/  ")) != string::npos ) {     
            vecTerm.push_back(m_sSegQuery.substr(0,idx));     
            m_sSegQuery = m_sSegQuery.substr(idx+3);     
        }    
    }   
   
  
  
  
  
/**
 * 程序翻译说明
 * 将以"/"划分开的关键字一一顺序放入一个向量容器中
 *
 * @access  public
 * @param   vector 参数的汉字说明：向量容器
 * @return  void
 */
void CQuery::ParseQuery(vector &vecTerm)
{
	string::size_type idx; 
	while ( (idx = m_sSegQuery.find("/  ")) != string::npos ) { 
		vecTerm.push_back(m_sSegQuery.substr(0,idx)); 
		m_sSegQuery = m_sSegQuery.substr(idx+3); 
	}
}


  
  
  
  

   
   
   
    
    
      view plain copy to clipboard print ? 
     
   

   
   
   
    
        
   
  
  
  
  
 

  
  
  
  

   
   
   
    
    
      view plain copy to clipboard print ? 
     
   

   
   
   
    
    <PRE class=csharp name="code">/**   
     * 程序翻译说明   
     * 相关性分析查询，构造结果集合setRelevantRst //瓶颈所在   
     *   
     * @access  public   
     * @param   vector<STRING></STRING> map set<STRING></STRING> 参数的汉字说明： 用户提交关键字的分词组，倒排索引映射，相关性结果集合   
     * @return  string 0   
     */   
    bool CQuery::GetRelevantRst    
    (    
        vector<STRING></STRING> &vecTerm,     
        map &mapBuckets,     
        set<STRING></STRING> &setRelevantRst    
    ) const   
    {    
        set<STRING></STRING> setSRst;    
       
        bool bFirst=true;    
        vector<STRING></STRING>::iterator itTerm = vecTerm.begin();    
       
        for ( ; itTerm != vecTerm.end(); ++itTerm )    
        {    
       
            setSRst.clear();    
            copy(setRelevantRst.begin(), setRelevantRst.end(), inserter(setSRst,setSRst.begin()));    
       
            map mapRstDoc;    
            string docid;    
            int doccnt;    
       
            map::iterator itBuckets = mapBuckets.find(*itTerm);    
            if (itBuckets != mapBuckets.end())    
            {    
                string strBucket = (*itBuckets).second;    
                string::size_type idx;    
                idx = strBucket.find_first_not_of(" ");    
                strBucket = strBucket.substr(idx);    
       
                while ( (idx = strBucket.find(" ")) != string::npos )     
                {    
                    docid = strBucket.substr(0,idx);    
                    doccnt = 0;    
       
                    if (docid.empty()) continue;    
       
                    map::iterator it = mapRstDoc.find(docid);    
                    if ( it != mapRstDoc.end() )    
                    {    
                        doccnt = (*it).second + 1;    
                        mapRstDoc.erase(it);    
                    }    
                    mapRstDoc.insert( pair(docid,doccnt) );    
       
                    strBucket = strBucket.substr(idx+1);    
                }    
       
                // remember the last one    
                docid = strBucket;    
                doccnt = 0;    
                map::iterator it = mapRstDoc.find(docid);    
                if ( it != mapRstDoc.end() )    
                {    
                    doccnt = (*it).second + 1;    
                    mapRstDoc.erase(it);    
                }    
                mapRstDoc.insert( pair(docid,doccnt) );    
            }    
       
            // sort by term frequencty    
            multimap > newRstDoc;    
            map::iterator it0 = mapRstDoc.begin();    
            for ( ; it0 != mapRstDoc.end(); ++it0 ){    
                newRstDoc.insert( pair((*it0).second,(*it0).first) );    
            }    
       
            multimap::iterator itNewRstDoc = newRstDoc.begin();    
            setRelevantRst.clear();    
            for ( ; itNewRstDoc != newRstDoc.end(); ++itNewRstDoc ){    
                string docid = (*itNewRstDoc).second;    
       
                if (bFirst==true) {    
                    setRelevantRst.insert(docid);    
                    continue;    
                }    
       
                if ( setSRst.find(docid) != setSRst.end() ){        
                    setRelevantRst.insert(docid);    
                }    
            }    
       
            //cout << "setRelevantRst.size(): " << setRelevantRst.size() << "<BR>";    
            bFirst = false;    
        }    
        return true;    
    }</PRE>   
   
  
  
  
  
   
   
   
   
    
    
    
     
     
       view plain copy to clipboard print ? 
      
    
    
    
    
     
     /**   
      * 程序翻译说明   
      * 相关性分析查询，构造结果集合setRelevantRst //瓶颈所在   
      *   
      * @access  public   
      * @param   vector<STRING></STRING> map set<STRING></STRING> 参数的汉字说明： 用户提交关键字的分词组，倒排索引映射，相关性结果集合   
      * @return  string 0   
      */   
     bool CQuery::GetRelevantRst    
     (    
         vector<STRING></STRING> &vecTerm,     
         map &mapBuckets,     
         set<STRING></STRING> &setRelevantRst    
     ) const   
     {    
         set<STRING></STRING> setSRst;    
        
         bool bFirst=true;    
         vector<STRING></STRING>::iterator itTerm = vecTerm.begin();    
        
         for ( ; itTerm != vecTerm.end(); ++itTerm )    
         {    
        
             setSRst.clear();    
             copy(setRelevantRst.begin(), setRelevantRst.end(), inserter(setSRst,setSRst.begin()));    
        
             map mapRstDoc;    
             string docid;    
             int doccnt;    
        
             map::iterator itBuckets = mapBuckets.find(*itTerm);    
             if (itBuckets != mapBuckets.end())    
             {    
                 string strBucket = (*itBuckets).second;    
                 string::size_type idx;    
                 idx = strBucket.find_first_not_of(" ");    
                 strBucket = strBucket.substr(idx);    
        
                 while ( (idx = strBucket.find(" ")) != string::npos )     
                 {    
                     docid = strBucket.substr(0,idx);    
                     doccnt = 0;    
        
                     if (docid.empty()) continue;    
        
                     map::iterator it = mapRstDoc.find(docid);    
                     if ( it != mapRstDoc.end() )    
                     {    
                         doccnt = (*it).second + 1;    
                         mapRstDoc.erase(it);    
                     }    
                     mapRstDoc.insert( pair(docid,doccnt) );    
        
                     strBucket = strBucket.substr(idx+1);    
                 }    
        
                 // remember the last one    
                 docid = strBucket;    
                 doccnt = 0;    
                 map::iterator it = mapRstDoc.find(docid);    
                 if ( it != mapRstDoc.end() )    
                 {    
                     doccnt = (*it).second + 1;    
                     mapRstDoc.erase(it);    
                 }    
                 mapRstDoc.insert( pair(docid,doccnt) );    
             }    
        
             // sort by term frequencty    
             multimap > newRstDoc;    
             map::iterator it0 = mapRstDoc.begin();    
             for ( ; it0 != mapRstDoc.end(); ++it0 ){    
                 newRstDoc.insert( pair((*it0).second,(*it0).first) );    
             }    
        
             multimap::iterator itNewRstDoc = newRstDoc.begin();    
             setRelevantRst.clear();    
             for ( ; itNewRstDoc != newRstDoc.end(); ++itNewRstDoc ){    
                 string docid = (*itNewRstDoc).second;    
        
                 if (bFirst==true) {    
                     setRelevantRst.insert(docid);    
                     continue;    
                 }    
        
                 if ( setSRst.find(docid) != setSRst.end() ){        
                     setRelevantRst.insert(docid);    
                 }    
             }    
        
             //cout << "setRelevantRst.size(): " << setRelevantRst.size() << "<BR>";    
             bFirst = false;    
         }    
         return true;    
     }   
    
   
   
   
   
/**
 * 程序翻译说明
 * 相关性分析查询，构造结果集合setRelevantRst	//瓶颈所在
 *
 * @access  public
 * @param   vector map set 参数的汉字说明： 用户提交关键字的分词组，倒排索引映射，相关性结果集合
 * @return  string 0
 */
bool CQuery::GetRelevantRst
(
	vector &vecTerm, 
	map &mapBuckets, 
	set &setRelevantRst
) const
{
	set setSRst;

	bool bFirst=true;
	vector::iterator itTerm = vecTerm.begin();

	for ( ; itTerm != vecTerm.end(); ++itTerm )
	{

		setSRst.clear();
		copy(setRelevantRst.begin(), setRelevantRst.end(), inserter(setSRst,setSRst.begin()));

		map mapRstDoc;
		string docid;
		int doccnt;

		map::iterator itBuckets = mapBuckets.find(*itTerm);
		if (itBuckets != mapBuckets.end())
		{
			string strBucket = (*itBuckets).second;
			string::size_type idx;
			idx = strBucket.find_first_not_of(" ");
			strBucket = strBucket.substr(idx);

			while ( (idx = strBucket.find(" ")) != string::npos ) 
			{
				docid = strBucket.substr(0,idx);
				doccnt = 0;

				if (docid.empty()) continue;

				map::iterator it = mapRstDoc.find(docid);
				if ( it != mapRstDoc.end() )
				{
					doccnt = (*it).second + 1;
					mapRstDoc.erase(it);
				}
				mapRstDoc.insert( pair(docid,doccnt) );

				strBucket = strBucket.substr(idx+1);
			}

			// remember the last one
			docid = strBucket;
			doccnt = 0;
			map::iterator it = mapRstDoc.find(docid);
			if ( it != mapRstDoc.end() )
			{
				doccnt = (*it).second + 1;
				mapRstDoc.erase(it);
			}
			mapRstDoc.insert( pair(docid,doccnt) );
		}

		// sort by term frequencty
		multimap > newRstDoc;
		map::iterator it0 = mapRstDoc.begin();
		for ( ; it0 != mapRstDoc.end(); ++it0 ){
			newRstDoc.insert( pair((*it0).second,(*it0).first) );
		}

		multimap::iterator itNewRstDoc = newRstDoc.begin();
		setRelevantRst.clear();
		for ( ; itNewRstDoc != newRstDoc.end(); ++itNewRstDoc ){
			string docid = (*itNewRstDoc).second;

			if (bFirst==true) {
				setRelevantRst.insert(docid);
				continue;
			}

			if ( setSRst.find(docid) != setSRst.end() ){	
				setRelevantRst.insert(docid);
			}
		}

		//cout << "setRelevantRst.size(): " << setRelevantRst.size() << "
";
		bFirst = false;
	}
	return true;
}

接下来的就是现实了，前面都只是处理数据得到 setRelevantRst 这个查询结构集合,这里就不多说了下面就和php之类的脚本语言差不多，格式化结果集合并显示出来。

//TSESearch.cpp

view plain copy to clipboard print ?

//下面开始显示
CDisplayRst iDisplayRst;
iDisplayRst.ShowTop();
float used_msec = (end_tv.tv_sec-begin_tv.tv_sec)*1000
+((float)(end_tv.tv_usec-begin_tv.tv_usec))/(float)1000;
iDisplayRst.ShowMiddle(iQuery.m_sQuery,used_msec,
setRelevantRst.size(), iQuery.m_iStart);
iDisplayRst.ShowBelow(vecTerm,setRelevantRst,vecDocIdx,iQuery.m_iStart);

6-scala特质 qwy715229258163 scala scala 开发语言后端
特质(Traits)用于在类(Class)之间共享程序接口(Interface)和字段(Fields)。它们类似于Java8的接口。类和对象(Objects)可以扩展特质，但是特质不能被实例化，因此特质没有参数。定义一个特质最简化的特质就是关键字trait+标识符：traitHairColor特征作为泛型类型和抽象方法非常有用。traitIterator[A]{defhasNext:Boolean
Scala 默认参数值、命名参数小黑王HK 大数据 Scala 默认参数值命名参数
默认参数值Scala提供了给参数设置默认值的机制，这样，便可以令调用者在调用方法时省略这些参数。#定义具有默认参数的方法deflog(kkk:String,iii:String="GG")=println(s"$kkk$iii")#忽略具有默认值的参数log("hhhhhhh")如果调用者省略了某一参数，那么此参数之后的参数需要指定名称。deflll(kkk:String="GG",ggg:Str
【Linux】ubuntu解决github无法拉取代码问题奈何不吃鱼 Linux 问题解决 linux github git
使用git拉取代码时，有时会出现如下的问题fatal:unabletoaccess'https://github.com/FISCO-BCOS/java-sdk-demo/':Couldnotresolvehost:github.com那么如何解决呢？我们可以在/etc/hosts里添加如下内容，对github.com进行解析即可140.82.112.3github.com199.232.69.1
4.scala默认参数值 qwy715229258163 scala scala 开发语言后端
Scala具备给参数提供默认值的能力，这样调用者就可以忽略这些具有默认值的参数。deflog(message:String,level:String="INFO")=println(s"$level:$message")log("Systemstarting")//printsINFO:Systemstartinglog("Usernotfound","WARNING")//printsWARNI
22.日常算法三问走天下 #每日算法题算法数据结构
1.按奇偶排序数组题目来源给你一个整数数组nums，将nums中的的所有偶数元素移动到数组的前面，后跟所有奇数元素。返回满足此条件的任一数组作为答案。示例1：输入：nums=[3,1,2,4]输出：[2,4,3,1]解释：[4,2,3,1]、[2,4,1,3]和[4,2,1,3]也会被视作正确答案。classSolution{public:vectorsortArrayByParity(vecto
23.日常算法三问走天下 #每日算法题算法哈希算法
1.最小绝对差题目来源给你个整数数组arr，其中每个元素都不相同。请你找到所有具有最小绝对差的元素对，并且按升序的顺序返回。每对元素对[a,b]如下：a,b均为数组arr中的元素a>minimumAbsDifference(vector&arr){sort(arr.begin(),arr.end());inttarget=arr[1]-arr[0];vector>ret;intn=arr.size
使用python调用JIRA6 进行OAuth1认证获取AccessToken yaoshengting python #jira python
Jira配置应用程序链接1)创建应用程序链接登录JIRA管理后台。转到Administration>Applications>ApplicationLinks。在输入框中输入外部应用程序的URL（例如GitLab或自定义应用），然后点击Createnewlink。2)配置ConsumerKey和PublicKey在创建应用链接的过程中：ConsumerKey：自定义一个唯一的字符串标识应用程序（例
25.日常算法三问走天下 #每日算法题算法哈希算法
1.仅仅反转字母题目来源给你一个字符串s，根据下述规则反转字符串：所有非英文字母保留在原有位置。所有英文字母（小写或大写）位置反转。返回反转后的s。示例1：输入：s=“ab-cd”输出：“dc-ba”classSolution{public:stringreverseOnlyLetters(strings){intleft=0,right=s.size();while(lefthash;for(a
.Net HTTP 请求封装代码 code36 C#&.Net开发 http 网络协议 .net
有了这些方法请求第三api接口就不用慌了，拷贝就可以用了定义了一个请求的接口IHttpClientMananger：1）POST请求泛型数据//////POST请求泛型数据//////请求的对象///地址///参数///头部数据///TaskPostEntityAsync(stringurl,HttpContenthttpContent,Dictionaryheads=null);2）Form表单
选择最佳线路（二）周山至水数翠峰算法数据结构贪心算法
如何要改进？在上文中，讨论了最佳线路计算的数据结构的算法。但在交通线路的描述中，对网站线路孤立的起点，为了防止计算中无效循环，人为增加了下一结点为-1的虚拟点。但增加结点ID为-1的点，与现实不符。本文试图取消ID为-1的结点，并对算法进行修改。修改后的深圳地铁的描述为string[]nsStr=["1:1","0:1>2:1>6:1>16:1","1:4>3:6>7:3>15:1","2:1>4
C#集合排序的三种方法（List＜T＞.Sort、LINQ 的 OrderBy、IComparable＜T＞接口）我曾经是个程序员常用代码片段 c#开发语言
见过不少人、经过不少事、也吃过不少苦，感悟世事无常、人心多变，靠着回忆将往事串珠成链，聊聊感情、谈谈发展，我慢慢写、你一点一点看......1、使用List.Sort方法与自定义比较器public class Person{ public stringName{ get; set;} public intAge{ get; set;}}public class PersonComparer
在C#中动态编译和执行代码我曾经是个程序员高阶高效代码 c#开发语言
见过不少人、经过不少事、也吃过不少苦，感悟世事无常、人心多变，靠着回忆将往事串珠成链，聊聊感情、谈谈发展，我慢慢写、你一点一点看......publicstaticvoidCompileAndExecute(stringcode){//创建语法树SyntaxTreesyntaxTree=CSharpSyntaxTree.ParseText(code);//设置编译选项stringassemblyN
Python中常见的几种输出形式 .zhy. Python python 开发语言
目录一、标准输出（print函数）特点适用场景二、格式化占位符输出（%操作符）特点适用场景三、格式化输出（str.format()方法）特点适用场景四、格式化字符串常量输出（f-string）特点适用场景五、总结一、标准输出（print函数）这是最基本的输出方式，使用print函数简单直观，适用于快速输出数据。print函数可以输出多种类型的数据，如字符串、数字、列表等，并且默认在输出结束后换行。
.net 如何处理网页的Json请求？周山至水数翠峰 .net json 服务器
一、传变量客户端请求客户端一般是用Jscript写的，传送变量，代码如下：functionsave(i){//这是用PostMethod使用var1=value1&var2=value2格式传送数据varcount=chkCount.value;varchk0="";for(k=0;kSave1(stringchk0){intn=0;string[]sa=chk0.Split(",");Listc
mac中svn,git的配置与使用白云影中仙 git svn
subversionbrew安装brewinstallsubversion#查看下载的软件brewlistsvn配置#1。创建资源库位置,自己设置目录svnadmincreate/usr/java/testJenk#2.设置权限，在你创建的目录的conf文件里（会自动生成）#svnserve.confanon-access=readanon-access=read#代表匿名访问的时候是只读的，若改
MongoDB 全文检索 lsx202406 开发语言
MongoDB全文检索MongoDB是一个流行的NoSQL数据库，以其灵活的数据模型和强大的查询语言而闻名。在MongoDB中，全文检索是一种功能，允许用户对存储在数据库中的文本数据进行复杂的搜索。全文检索对于构建搜索引擎、内容推荐系统和文本分析工具等应用非常有用。什么是全文检索？全文检索是一种信息检索技术，它允许用户通过搜索关键字或短语来查找文档中的文本。与传统的基于关键字的搜索不同，全文检索考
var let const 详解热乎劲的小仓库 js基础 javascript 前端开发语言
前言总所周知，varletconst是声明变量的关键字，那么他们三者之间又有什么区别，分别都是怎么应用的呢？以下会给大家一一解释，希望再看完本篇文章后能给您带来收获。varvar跟随这JavaScript就诞生了，是ES6之前就存在的，也是最早声明变量的一个关键字，var是全局变量var可以声明任何数据类型的变量，如：Number、String、Boolean、Null等；varnumber=1;
java语言学习（5） memorycx Javase 学习历程 java 学习开发语言
第九章目录类变量和类方法理解main方法语法代码块单列设计模式final关键字抽象类接口类变量/静态变量该变量最大的特点就是会被本类的所有对象实例共享，类变量可以通过类名来访问分析代码，探讨内存的分配classChild{privateStringname;publicstaticintcount=0;//这个叫类变量或者叫静态变量publicChild(Stringname){this.name
在Linux系统上使用nmcli命令配置各种网络（有线、无线、vlan、vxlan、路由、网桥等） m0_74823983 面试学习路线阿里巴巴 linux 网络服务器
1、更新于2024/5/13，新增VethPair配置2、更新于2024/5/19，修复NetworkManager接管网络配置无效的错误3、更新于2024/5/20，新增Ubuntu两种版本下NetworkManager接管网络的配置目录一、配置NetworkManager接管网络（选）安装Network-Manager并启动netplan管理网络的系统ifupdown管理网络的系统二、nmcl
C++11新特性之可调用对象包装器和绑定器 is-zq C++c++开发语言算法
一、可调用对象C++中可调用对象有六种.1.普通函数普通函数类型可以声明函数,定义函数指针和引用,但是不能定义函数的实体.usingFun=void(int,conststring&);//普通函数类型的别名。Funshow;//声明普通函数。intmain(){show(1,"我是一只傻傻鸟。");//直接调用普通函数。void(*fp1)(int,conststring&)=show;//声明
Python基础 - 发起http请求 shawn.zhang. python java ajax json curl
目录[-]1、Python发起http请求#!/usr/bin/envpython#coding=utf-8#licenseremovedfor******importrospyimportpycurlimportStringIOimporturllibfromstd_msgs.msgimportStringimportjsonimporthashlibfromcyber_msgs.msgimpo
fatal: unable to access ‘https://github 江_小_白报错解决方案 github
fatal:unabletoaccess‘https://github.com/protocolbuffers/protobuf.git/’:Failedtoconnecttogithub.comport443:Connectiontimedout下载项目的时候出现了这个问题，本以为是网络或者什么的问题，没想到是sudo,sudosudogitclone-bv3.6.1https://github
为了避免工作疏忽，钉钉推送通知到个人（实例）小小蚂蚁钉钉 java 前端
publicstaticvoidmain(Stringargs[]){//获取tokenJSONObjectjson=newJSONObject();json.put("appKey","应用程序的唯一标识符");json.put("appSecret","应用程序（App）的密钥");StringURL="https://api.dingtalk.com/v1.0/oauth2/accessTo
python发送钉钉消息，发送个人到工作通知夜语醉星辰 Python python 钉钉开发语言
需求，钉钉消息通知不能发到群里，需要发送到个人。一、钉钉企业后台创建应用1、进入钉钉管理后台，创建应用2、记住ID等应用的信息，在后面需要用到3、设置允许对接的IP，需要公网IP4、设置权限，通讯录权限全选申请二、编写代码，通过手机号发送信息importrequestsimporttkinterastk#第一步：获取access_tokendefget_access_token(app_key,a
数据采集与存储——Elasticsearch实战详解 AI天才研究院 Python实战深度学习实战自然语言处理人工智能语言模型编程实践开发语言架构设计
作者：禅与计算机程序设计艺术1.简介Elasticsearch是一个基于Lucene构建的开源分布式搜索引擎，主要用于大规模数据的存储、检索、分析等功能。Elasticsearch非常适合处理结构化和非结构化的数据，并且提供完整的RESTfulAPI接口，可以与多种语言的客户端进行交互。本文将从以下几个方面对Elasticsearch进行详细介绍：⒈Elasticsearch的历史及特性介绍；⒉E
Elasticsearch——Arrays字段类型 java编程小帅 Elasticsearch 大数据 elasticsearch java 搜索引擎数据库
在Elasticsearch中，没有专用的数组数据类型。默认情况下，任何字段都可以包含零个或多个值，但是，数组中的所有值必须是相同的数据类型。例如：anarrayofstrings:["one","two"]anarrayofintegers:[1,2]anarrayofarrays:[1,[2,3]]whichistheequivalentof[1,2,3]anarrayofobjects:[{
mysql 出现 Incorrect string value for column ‘表项‘ at row 1 错误解决方案 Tiantangbujimo7 数据库 mysql 数据库 database
今天使用mysql编写服务端时遇到中文字符串无法插入数据库表的成员中，报错如下：Incorrectstringvalue:'\xB2\xE2\xCA\xD4\xB2\xE2...'forcolumn'Remark'atrow1尝试了各种方案，用命令设置格式为utf8都不管用直到使用以下指令：MYSQL_RES*DBModuleMysql::QueryStore(constchar*sql,bool
把hive中的数据导出到mysql 樱浅沐冰笔记 hadoop hive mysql
注意事项！！！！1.hive中的表的字段和类型必须和mysql表中的字段和类型一样不如hive中的stnamevarchar（50），那么mysql中的字段和类型也必须为stnamestring2.sqoopexport--connectjdbc:mysql://localhost:3306/xiandian--usernameroot--passwordbigdata--tablem1--hca
大侠，你真的了解JS中的toString&toLocaleString方法吗？不做超级小白 web前端 javascript 前端开发语言
toString()与toLocaleString()的区别：你需要了解的JavaScript字符串化方法在JavaScript中，toString()和toLocaleString()都是对象转换为字符串的常用方法。虽然它们的功能看似相似，但实际上它们有着不同的用途和行为。本文将详细解析这两者的区别，帮助开发者更好地理解并选择适合的字符串化方法。1.toString()方法：目的：toStrin
运行虚幻引擎UE设置Visual Studio yblackd 虚幻 visual studio c++
运行虚幻引擎UE设置VisualStudio1.枚举转换为字符串2.修改解决方案配置下拉框宽度3.调试较慢4.如何修复GPU驱动程序崩溃1.枚举转换为字符串-Desc:从静态Uenum调用GetNameStringByValue并为其提供你要获取其名称的值，可以将枚举转换为字符串。初始化Uenum时使用的StaticEnum与传入其数值的枚举，两者的类型必须相同。EMyEnum::TypeMyVa
书其实只有三类西蜀石兰类
一个人一辈子其实只读三种书，知识类、技能类、修心类。知识类的书可以让我们活得更明白。类似十万个为什么这种书籍，我一直不太乐意去读，因为单纯的知识是没法做事的，就像知道地球转速是多少一样（我肯定不知道），这种所谓的知识，除非用到，普通人掌握了完全是一种负担，维基百科能找到的东西，为什么去记忆？知识类的书，每个方面都涉及些，让自己显得不那么没文化，仅此而已。社会认为的学识渊博，肯定不是站在
《TCP/IP 详解，卷1：协议》学习笔记、吐槽及其他 bylijinnan tcp
《TCP/IP 详解，卷1：协议》是经典，但不适合初学者。它更像是一本字典，适合学过网络的人温习和查阅一些记不清的概念。这本书，我看的版本是机械工业出版社、范建华等译的。这本书在我看来，翻译得一般，甚至有明显的错误。如果英文熟练，看原版更好： http://pcvr.nl/tcpip/ 下面是我的一些笔记，包括我看书时有疑问的地方，也有对该书的吐槽，有不对的地方请指正： 1.
Linux—— 静态IP跟动态IP设置 eksliang linux IP
一.在终端输入 vi /etc/sysconfig/network-scripts/ifcfg-eth0 静态ip模板如下： DEVICE="eth0" #网卡名称 BOOTPROTO="static" #静态IP（必须） HWADDR="00:0C:29:B5:65:CA" #网卡mac地址 IPV6INIT=&q
Informatica update strategy transformation 18289753290
更新策略组件：标记你的数据进入target里面做什么操作，一般会和lookup配合使用，有时候用0,1,1代表 forward rejected rows被选中，rejected row是输出在错误文件里，不想看到reject输出，将错误输出到文件，因为有时候数据库原因导致某些column不能update，reject就会output到错误文件里面供查看，在workflow的
使用Scrapy时出现虽然队列里有很多Request但是却不下载，造成假死状态酷的飞上天空 request
现象就是：程序运行一段时间，可能是几十分钟或者几个小时，然后后台日志里面就不出现下载页面的信息，一直显示上一分钟抓取了0个网页的信息。刚开始已经猜到是某些下载线程没有正常执行回调方法引起程序一直以为线程还未下载完成，但是水平有限研究源码未果。经过不停的google终于发现一个有价值的信息，是给twisted提出的一个bugfix 连接地址如下http://twistedmatrix.
利用预测分析技术来进行辅助医疗蓝儿唯美医疗
2014年，克利夫兰诊所（Cleveland Clinic）想要更有效地控制其手术中心做膝关节置换手术的费用。整个系统每年大约进行2600例此类手术，所以，即使降低很少一部分成本，都可以为诊所和病人节约大量的资金。为了找到适合的解决方案，供应商将视野投向了预测分析技术和工具，但其分析团队还必须花时间向医生解释基于数据的治疗方案意味着什么。克利夫兰诊所负责企业信息管理和分析的医疗
java 线程(一)：基础篇 DavidIsOK java 多线程线程
&nbs
Tomcat服务器框架之Servlet开发分析 aijuans servlet
最近使用Tomcat做web服务器，使用Servlet技术做开发时，对Tomcat的框架的简易分析：疑问：为什么我们在继承HttpServlet类之后，覆盖doGet(HttpServletRequest req, HttpServetResponse rep)方法后，该方法会自动被Tomcat服务器调用，doGet方法的参数有谁传递过来？怎样传递？分析之我见： doGet方法的
揭秘玖富的粉丝营销之谜与小米粉丝社区类似 aoyouzi 揭秘玖富的粉丝营销之谜
玖富旗下悟空理财凭借着一个微信公众号上线当天成交量即破百万，第七天成交量单日破了1000万;第23天时，累计成交量超1个亿……至今成立不到10个月，粉丝已经超过500万，月交易额突破10亿，而玖富平台目前的总用户数也已经超过了1800万，位居P2P平台第一位。很多互联网金融创业者慕名前来学习效仿，但是却鲜有成功者，玖富的粉丝营销对外至今仍然是个谜。　　近日，一直坚持微信粉丝营销
Java web的会话跟踪技术百合不是茶 url会话 Cookie会话 Seession会话 Java Web 隐藏域会话
会话跟踪主要是用在用户页面点击不同的页面时,需要用到的技术点会话:多次请求与响应的过程 1,url地址传递参数,实现页面跟踪技术格式:传一个参数的 url?名=值传两个参数的 url?名=值 &名=值关键代码
web.xml之Servlet配置 bijian1013 java web.xml Servlet配置
定义： <servlet> <servlet-name>myservlet</servlet-name> <servlet-class>com.myapp.controller.MyFirstServlet</servlet-class> <init-param> <param-name>
利用svnsync实现SVN同步备份 sunjing SVN 同步 E000022 svnsync 镜像
1. 在备份SVN服务器上建立版本库 svnadmin create test 2. 创建pre-revprop-change文件 cd test/hooks/ cp pre-revprop-change.tmpl pre-revprop-change 3. 修改pre-revprop-
【分布式数据一致性三】MongoDB读写一致性 bit1129 mongodb
本系列文章结合MongoDB，探讨分布式数据库的数据一致性，这个系列文章包括：数据一致性概述与CAP 最终一致性(Eventually Consistency) 网络分裂(Network Partition)问题多数据中心(Multi Data Center) 多个写者(Multi Writer)最终一致性一致性图表(Consistency Chart) 数据
Anychart图表组件-Flash图转IMG普通图的方法白糖_ Flash
问题背景：项目使用的是Anychart图表组件，渲染出来的图是Flash的，往往一个页面有时候会有多个flash图，而需求是让我们做一个打印预览和打印功能，让多个Flash图在一个页面上打印出来。那么我们打印预览的思路是获取页面的body元素，然后在打印预览界面通过$("body").append(html)的形式显示预览效果，结果让人大跌眼镜：Flash是
Window 80端口被占用 WHY? bozch 端口占用 window
平时在启动一些可能使用80端口软件的时候，会提示80端口已经被其他软件占用，那一般又会有那些软件占用这些端口呢？下面坐下总结： 1、web服务器是最经常见的占用80端口的，例如：tomcat , apache , IIS , Php等等； 2
编程之美-数组的最大值和最小值-分治法（两种形式） bylijinnan 编程之美
import java.util.Arrays; public class MinMaxInArray { /** * 编程之美数组的最大值和最小值分治法 * 两种形式 */ public static void main(String[] args) { int[] t={11,23,34,4,6,7,8,1,2,23}; int[]
Perl正则表达式 chenbowen00 正则表达式 perl
首先我们应该知道 Perl 程序中，正则表达式有三种存在形式，他们分别是：匹配：m/<regexp>;/ （还可以简写为 /<regexp>;/ ，略去 m）替换：s/<pattern>;/<replacement>;/ 转化：tr/<pattern>;/<replacemnt>;
[宇宙与天文]行星议会是否具有本行星大气层以外的权力呢? comsci
举个例子: 地球,地球上由200多个国家选举出一个代表地球联合体的议会,那么现在地球联合体遇到一个问题,地球这颗星球上面的矿产资源快要采掘完了....那么地球议会全体投票,一致通过一项带有法律性质的议案,既批准地球上的国家用各种技术手段在地球以外开采矿产资源和其它资源........ &
Oracle Profile 使用详解 daizj oracle profile 资源限制
Oracle Profile 使用详解转一、目的： Oracle系统中的profile可以用来对用户所能使用的数据库资源进行限制，使用Create Profile命令创建一个Profile，用它来实现对数据库资源的限制使用，如果把该profile分配给用户，则该用户所能使用的数据库资源都在该profile的限制之内。二、条件：创建profile必须要有CREATE PROFIL
How HipChat Stores And Indexes Billions Of Messages Using ElasticSearch & Redis dengkane elasticsearch Lucene
This article is from an interview with Zuhaib Siddique, a production engineer at HipChat, makers of group chat and IM for teams. HipChat started in an unusual space, one you might not
循环小示例，菲波拉契序列，循环解一元二次方程以及switch示例程序 dcj3sjt126com c 算法
# include <stdio.h> int main(void) { int n; int i; int f1, f2, f3; f1 = 1; f2 = 1; printf("请输入您需要求的想的序列："); scanf("%d", &n); for (i=3; i<n; i
macbook的lamp环境 dcj3sjt126com lamp
sudo vim /etc/apache2/httpd.conf /Library/WebServer/Documents 是默认的网站根目录重启Mac上的Apache服务这个命令很早以前就查过了，但是每次使用的时候还是要在网上查：停止服务：sudo /usr/sbin/apachectl stop 开启服务：s
java ArrayList源码下 shuizhaosi888 ArrayList源码
版本 jdk-7u71-windows-x64 JavaSE7 ArrayList源码上：http://flyouwith.iteye.com/blog/2166890 /** * 从这个列表中移除所有c中包含元素 */ public boolean removeAll(Collection<?> c) {
Spring Security（08）——intercept-url配置 234390216 Spring Security intercept-url 访问权限访问协议请求方法
intercept-url配置目录 1.1 指定拦截的url 1.2 指定访问权限 1.3 指定访问协议 1.4 指定请求方法 1.1 &n
Linux环境下的oracle安装 jayung oracle
linux系统下的oracle安装本文档是Linux(redhat6.x、centos6.x、redhat7.x) 64位操作系统安装Oracle 11g(Oracle Database 11g Enterprise Edition Release 11.2.0.4.0 - 64bit Production)，本文基于各种网络资料精心整理而成，共享给有需要的朋友。如有问题可联系：QQ：52-7
hotspot虚拟机 leichenlei java HotSpot jvm 虚拟机文档
JVM参数 http://docs.oracle.com/javase/6/docs/technotes/guides/vm/index.html JVM工具 http://docs.oracle.com/javase/6/docs/technotes/tools/index.html JVM垃圾回收 http://www.oracle.com
读《Node.js项目实践：构建可扩展的Web应用》 ——引编程慢慢变成系统化的“砌砖活” noaighost Web node.js
读《Node.js项目实践：构建可扩展的Web应用》 ——引编程慢慢变成系统化的“砌砖活” 眼里的Node.JS 初初接触node是一年前的事，那时候年少不更事。还在纠结什么语言可以编写出牛逼的程序，想必每个码农都会经历这个月经性的问题：微信用什么语言写的？facebook为什么推荐系统这么智能，用什么语言写的？dota2的外挂这么牛逼，用什么语言写的？……用什么语言写这句话，困扰人也是阻碍
快速开发Android应用 rensanning android
Android应用开发过程中，经常会遇到很多常见的类似问题，解决这些问题需要花时间，其实很多问题已经有了成熟的解决方案，比如很多第三方的开源lib，参考 Android Libraries 和 Android UI/UX Libraries。编码越少，Bug越少，效率自然会高。但可能由于根本没听说过、听说过但没用过、特殊原因不能用、自己已经有了解决方案等等原因，这些成熟的解决
理解Java中的弱引用 tomcat_oracle java 工作面试
　不久之前，我面试了一些求职Java高级开发工程师的应聘者。我常常会面试他们说，“你能给我介绍一些Java中得弱引用吗？”，如果面试者这样说，“嗯，是不是垃圾回收有关的？”，我就会基本满意了，我并不期待回答是一篇诘究本末的论文描述。　　然而事与愿违，我很吃惊的发现，在将近20多个有着平均5年开发经验和高学历背景的应聘者中，居然只有两个人知道弱引用的存在，但是在这两个人之中只有一个人真正了
标签输出html标签" target="_blank">关于标签输出html标签 xshdch jsp
http://back-888888.iteye.com/blog/1181202 关于<c:out value=""/>标签的使用，其中有一个属性是escapeXml默认是true(将html标签当做转移字符，直接显示不在浏览器上面进行解析)，当设置escapeXml属性值为false的时候就是不过滤xml，这样就能在浏览器上解析html标签， &nb

北大天网搜索引擎TSE分析及完全注释[3]来到关键字分词及相关性分析程序

你可能感兴趣的:(搜索引擎,String,vector,iterator,Access,pair)