wangeclipse

程序员编程艺术第三十~三十一章：字符串转换成整数，通配符字符串匹配

文章转载：http://blog.csdn.net/v_july_v/article/details/9024123

第三十~三十一章：字符串转换成整数，带通配符的字符串匹配

前言

之前本一直想写写神经网络算法和EM算法，但写这两个算法实在需要大段大段的时间，而平时上班，周末则跑去北大教室自习看书（顺便以时间为序，说下过去半年看过的自觉还不错的数学史方面的书：《数理统计学简史》《微积分概念发展史》《微积分的历程：从牛顿到勒贝格》《数学恩仇录》《数学与知识的探求》《古今数学思想》《素数之恋》），故一直未曾有时间写。

然最近在负责一款在线编程挑战平台：http://hero.pongo.cn/（简称hero，通俗理解是中国的topcoder，当然，一直在不断完善中，与一般OJ不同点在于，OJ侧重为参与ACM竞赛者提供刷题练习的场所，而hero则着重为企业招聘面试服务），在上面出了几道编程面试题，有些题目看似简单，但一coding，很多问题便立马都在hero上给暴露出来了，故就从hero上的编程挑战题切入，继续更新本程序员编程艺术系列吧。

况且，前几天与一朋友聊天，他说他认识的今年360招进来的三四十人应届生包括他自己找工作时基本都看过我的博客，则更增加了更新此编程艺术系列的动力。

OK，本文讲两个问题：

第三十章、字符串转换成整数，从确定思路，到写出有瑕疵的代码，继而到microsoft & linux的atoi实现，再到第一份比较完整的代码，最后以Net/OS中的实现结尾，看似很简单的一个问题，其实非常不简单；
第三十一章、字符串匹配问题

还是这句老话，有问题恳请随时批评指正，感谢。

第三十章、字符串转换成整数

先看题目：

输入一个表示整数的字符串，把该字符串转换成整数并输出，例如输入字符串"345"，则输出整数345。
给定函数原型int StrToInt(const char *str) ，完成函数StrToInt，实现字符串转换成整数的功能，不得用库函数atoi（即便准许使用，其对于溢出情况的处理也达不到题目的要求，详情请参看下文第7节末）。

我们来一步一步分析（共9小节，重点在下文第8小节及后续内容），直至写出第一份准确的代码：

1、本题考查的实际上就是字符串转换成整数的问题，或者说是要你自行实现atoi函数。那如何实现把表示整数的字符串正确地转换成整数呢？以"345"作为例子：

当我们扫描到字符串的第一个字符'3'时，由于我们知道这是第一位，所以得到数字3。
当扫描到第二个数字'4'时，而之前我们知道前面有一个3，所以便在后面加上一个数字4，那前面的3相当于30，因此得到数字：3*10+4=34。
继续扫描到字符'5'，'5'的前面已经有了34，由于前面的34相当于340，加上后面扫描到的5，最终得到的数是：34*10+5=345。

因此，此题的思路便是：每扫描到一个字符，我们便把在之前得到的数字乘以10，然后再加上当前字符表示的数字。

2、思路有了，有一些细节需要注意，如zhedahht所说：

“由于整数可能不仅仅之含有数字，还有可能以'+'或者'-'开头，表示整数的正负。因此我们需要把这个字符串的第一个字符做特殊处理。如果第一个字符是'+'号，则不需要做任何操作；如果第一个字符是'-'号，则表明这个整数是个负数，在最后的时候我们要把得到的数值变成负数。
接着我们试着处理非法输入。由于输入的是指针，在使用指针之前，我们要做的第一件是判断这个指针是不是为空。如果试着去访问空指针，将不可避免地导致程序崩溃。
另外，输入的字符串中可能含有不是数字的字符。每当碰到这些非法的字符，我们就没有必要再继续转换。
最后一个需要考虑的问题是溢出问题。由于输入的数字是以字符串的形式输入，因此有可能输入一个很大的数字转换之后会超过能够表示的最大的整数而溢出。”

比如，当给的字符串是如左边图片所示的时候，有考虑到么？当然，它们各自对应的正确输出如右边图片所示（假定你是在32位系统下，且编译环境是VS2008以上）：

3、很快，可能你就会写下如下代码：

 
    //copyright@zhedahht 2007    
 enum Status {kValid = 0, kInvalid};  
 int g_nStatus = kValid;  
   
 // Convert a string into an integer  
 int StrToInt(const char* str)  
 {  
     g_nStatus = kInvalid;  
     long long num = 0;  
   
     if(str != NULL)  
     {  
         const char* digit = str;  
   
         // the first char in the string maybe '+' or '-'  
         bool minus = false;  
         if(*digit == '+')  
             digit ++;  
         else if(*digit == '-')  
         {  
             digit ++;  
             minus = true;  
         }  
   
         // the remaining chars in the string  
         while(*digit != '\0')  
         {  
             if(*digit >= '0' && *digit <= '9')  
             {  
                 num = num * 10 + (*digit - '0');  
   
                 // overflow    
                 if(num > std::numeric_limits<int>::max())  
                 {  
                     num = 0;  
                     break;  
                 }  
   
                 digit ++;  
             }  
             // if the char is not a digit, invalid input  
             else  
             {  
                 num = 0;  
                 break;  
             }  
         }  
   
         if(*digit == '\0')  
         {  
             g_nStatus = kValid;  
             if(minus)  
                 num = 0 - num;  
         }  
     }  
     return static_cast<int>(num);  
 }  
 
  

run下上述程序，会发现当输入字符串是下图中红叉叉部分所对应的时候，程序结果出错：

两个问题：

当输入的字符串不是数字，而是字符的时候，比如“1a”，上述程序直接返回了0（而正确的结果应该是得到1）：
1. // if the char is not a digit, invalid input
2. else
3. {
4. num = 0;
5. break;
6. }
处理溢出时，有问题。因为它遇到溢出情况时，直接返回了0：
1. // overflow
2. if(num > std::numeric_limits<int>::max())
3. {
4. num = 0;
5. break;
6. }

4、把代码做下微调，如下（注：库函数atoi规定超过int值，按最大值maxint：2147483647来，超过-int按最小值minint：-2147483648来）：

 
     //copyright@SP_daiyq 2013/5/29  
 int StrToInt(const char* str)  
 {  
     int res = 0; // result  
     int i = 0; // index of str  
     int signal = '+'; // signal '+' or '-'  
     int cur; // current digit  
   
     if (!str)  
         return 0;  
   
     // skip backspace  
     while (isspace(str[i]))  
         i++;  
   
     // skip signal  
     if (str[i] == '+' || str[i] == '-')  
     {  
         signal = str[i];  
         i++;  
     }  
   
     // get result  
     while (str[i] >= '0' && str[i] <= '9')  
     {  
         cur = str[i] - '0';  
   
         // judge overlap or not  
         if ( (signal == '+') && (cur > INT_MAX - res*10) )  
         {  
             res = INT_MAX;  
             break;  
         }  
         else if ( (signal == '-') && (cur -1 > INT_MAX - res*10) )  
         {  
             res = INT_MIN;  
             break;  
         }  
   
         res = res * 10 + cur;  
         i++;  
     }  
   
     return (signal == '-') ? -res : res;  
 }  
 
   

此时会发现，上面第3小节末所述的第1个小问题（当输入的字符串不是数字，而是字符的时候）解决了：

但，上文第3小节末所述的第2个小问题：溢出问题却没有解决。即当给定下述测试数据的时候，问题就来了：

需要转换的字符串代码运行结果理应得到的正确结果

什么问题呢？比如说用上述代码转换这个字符串：" 10522545459"，它本应得到的正确结果应该是2147483647，但程序实际得到的结果却是：1932610867。故很明显，程序没有解决好上面的第2个小问题：溢出问题。原因是什么呢？咱们来分析下代码，看是如何具体处理溢出情况的：

 
    // judge overlap or not  
         if ( (signal == '+') && (cur > INT_MAX - res*10) )  
         {  
             res = INT_MAX;  
             break;  
         }  
         else if ( (signal == '-') && (cur -1 > INT_MAX - res*10) )  
         {  
             res = INT_MIN;  
             break;  
         }  
 
  

接着上面的例子来，比如给定字符串" 10522545459"，除去空格有11位，而MAX_INT，即2147483647是10位数，当扫描到最后一个字符‘9’的时候，程序会比较 9 和 2147483647 - 1052254545*10的大小。

问题立马就暴露出来了，因为此时让res*10，即让1052254545*10 > MAX_INT，溢出无疑，程序已经出错，再执行下面这行代码已无意义：

 
    cur > INT_MAX - res*10

也就是说，对于字符串"10522545459", 当扫描到最后一个字符‘9’时，根据上文第1小节的字符串转换成整数的思路：“每扫描到一个字符，我们便把在之前得到的数字乘以10，然后再加上当前字符表示的数字”，为了得到最终的整数，我们得如此计算：

1052254545*10 + 4，

然实际上当程序计算到1052254545*10时，

1052254545*10 >

2147483647

此时已经溢出了,若再执意计算，则程序逻辑将出错，故此后也就不能再判断字串的最后一位4是否大于2147483647%10了（耐不得烦想尽快看到最终正确代码的读者可以直接跳到下文第8节）。

5、上面说给的程序没有“ 很好的解决溢出问题。由于输入的数字是以字符串的形式输入，因此有可能输入一个很大的数字转换之后会超过能够表示的最大的整数而溢出”。那么，到底代码该如何写呢？

像下面这样？：

 
    //copyright@fuwutu 2013/5/29  
 int StrToInt(const char* str)  
 {  
     bool negative = false;  
     long long result = 0;  
     while (*str == ' ' || *str == '\t')  
     {  
         ++str;  
     }  
     if (*str == '-')  
     {  
         negative = true;  
         ++str;  
     }  
     else if (*str == '+')  
     {  
         ++str;  
     }  
   
     while (*str != '\0')  
     {  
         int n = *str - '0';  
         if (n < 0 || n > 9)  
         {  
             break;  
         }  
   
         if (negative)  
         {  
             result = result * 10 - n;  
             if (result < -2147483648LL)  
             {  
                 result = -2147483648LL;  
             }  
         }  
         else  
         {  
             result = result * 10 + n;  
             if (result > 2147483647LL)  
             {  
                 result = 2147483647LL;  
             }  
         }  
         ++str;  
     }  
   
   return result;  
 }  
 
  

run下程序，看看运行结果：

上图所示程序貌似通过了，然实际上它还是未能处理数据溢出的问题，因为它只是做了个取巧，即把返回的值esult定义成了long long，如下所示：

 
    long long result = 0;

故严格说来，我们依然未写出准确的规范代码。

6 、那到底该如何解决这个数据溢出的问题呢？咱们先来看看Microsoft是如何实现atoi的吧：

 
    //atol函数  
 //Copyright (c) 1989-1997, Microsoft Corporation. All rights reserved.  
 long __cdecl atol(  
     const char *nptr  
     )  
 {  
     int c; /* current char */  
     long total; /* current total */  
     int sign; /* if ''-'', then negative, otherwise positive */  
   
     /* skip whitespace */  
     while ( isspace((int)(unsigned char)*nptr) )  
         ++nptr;  
   
     c = (int)(unsigned char)*nptr++;  
     sign = c; /* save sign indication */  
     if (c == ''-'' || c == ''+'')  
         c = (int)(unsigned char)*nptr++; /* skip sign */  
   
     total = 0;  
   
     while (isdigit(c)) {  
         total = 10 * total + (c - ''0''); /* accumulate digit */  
         c = (int)(unsigned char)*nptr++; /* get next char */  
     }  
   
     if (sign == ''-'')  
         return -total;  
     else  
         return total; /* return result, negated if necessary */  
 }  
 
  

其中，isspace和isdigit函数的实现代码为：

 
    isspace(int x)    
 {    
     if(x==' '||x=='/t'||x=='/n'||x=='/f'||x=='/b'||x=='/r')    
         return 1;    
     else     
         return 0;    
 }    
   
 isdigit(int x)    
 {    
     if(x<='9'&&x>='0')             
         return 1;     
     else     
         return 0;    
 }   
 
  

然后 atoi调用上面的atol函数，如下所示：

 
    //atoi调用上述的atol  
 int __cdecl atoi(  
     const char *nptr  
     )  
 {  
     //Overflow is not detected. Because of this, we can just use  
     return (int)atol(nptr);  
 }  
 
  

但很遗憾的是，上述atoi标准代码依然返回的是long：

 
    long total; /* current total */  
 if (sign == ''-'')  
     return -total;  
 else  
     return total; /* return result, negated if necessary */  
 
  

再者，下面这里定义成long的total与10相乘，即total*10很容易溢出：

 
    long total; /* current total */  
 total = 10 * total + (c - ''0''); /* accumulate digit */

最后，根据本文评论下的读者meiyuli反应：“测试数据是字符串"-21474836480"，api算出来的是-2147483648，用上述代码算出来的结果是0”，如此，上述微软的这个atoi源码是有问题的。

7 、microsoft既然不行，读者想必很自然的想到linux。So，咱们接下来便看看 linux内核中是如何实现此字符串转换为整数的问题的。linux内核中提供了以下几个函数：

simple_strtol，把一个字符串转换为一个有符号长整数；
simple_strtoll，把一个字符串转换为一个有符号长长整数；
simple_strtoul，把一个字符串转换为一个无符号长整数；
simple_strtoull，把一个字符串转换为一个无符号长长整数

相关源码及分析如下。

首先，atoi调下面的strtol：

 
    //linux/lib/vsprintf.c  
 //Copyright (C) 1991, 1992  Linus Torvalds  
 //simple_strtol - convert a string to a signed long  
 long simple_strtol(const char *cp, char **endp, unsigned int base)  
 {  
     if (*cp == '-')  
         return -simple_strtoul(cp + 1, endp, base);  
   
     return simple_strtoul(cp, endp, base);  
 }  
 EXPORT_SYMBOL(simple_strtol);  
 
  

然后，上面的strtol调下面的strtoul：

 
    //simple_strtoul - convert a string to an unsigned long  
 unsigned long simple_strtoul(const char *cp, char **endp, unsigned int base)  
 {  
     return simple_strtoull(cp, endp, base);  
 }  
 EXPORT_SYMBOL(simple_strtoul);  
 
  

接着，上面的strtoul调下面的strtoull：

 
    //simple_strtoll - convert a string to a signed long long  
 long long simple_strtoll(const char *cp, char **endp, unsigned int base)  
 {  
     if (*cp == '-')  
         return -simple_strtoull(cp + 1, endp, base);  
   
     return simple_strtoull(cp, endp, base);  
 }  
 EXPORT_SYMBOL(simple_strtoll);  
 
  

最后，strtoull调_parse_integer_fixup_radix和_parse_integer来处理相关逻辑：

 
    //simple_strtoull - convert a string to an unsigned long long  
 unsigned long long simple_strtoull(const char *cp, char **endp, unsigned int base)  
 {  
     unsigned long long result;  
     unsigned int rv;  
   
     cp = _parse_integer_fixup_radix(cp, &base);  
     rv = _parse_integer(cp, base, &result);  
     /* FIXME */  
     cp += (rv & ~KSTRTOX_OVERFLOW);  
   
     if (endp)  
         *endp = (char *)cp;  
   
     return result;  
 }  
 EXPORT_SYMBOL(simple_strtoull);  
 
  

重头戏来了。接下来，我们来看上面strtoull函数中的parse_integer_fixup_radix和_parse_integer两段代码。如鲨鱼所说

“真正的处理逻辑主要是在_parse_integer里面，关于溢出的处理，_parse_integer处理的很优美，
而_parse_integer_fixup_radix是用来自动根据字符串判断进制的”。

先来看 _parse_integer函数：

 
    //lib/kstrtox.c, line 39    
 //Convert non-negative integer string representation in explicitly given radix to an integer.    
 //Return number of characters consumed maybe or-ed with overflow bit.    
 //If overflow occurs, result integer (incorrect) is still returned.    
 unsigned int _parse_integer(const char *s, unsigned int base, unsigned long long *p)    
 {    
     unsigned long long res;    
     unsigned int rv;    
     int overflow;    
     
     res = 0;    
     rv = 0;    
     overflow = 0;    
     while (*s) {    
         unsigned int val;    
     
         if ('0' <= *s && *s <= '9')    
             val = *s - '0';    
         else if ('a' <= _tolower(*s) && _tolower(*s) <= 'f')    
             val = _tolower(*s) - 'a' + 10;    
         else    
             break;    
     
         if (val >= base)    
             break;    
         /*  
          * Check for overflow only if we are within range of  
          * it in the max base we support (16)  
          */    
         if (unlikely(res & (~0ull << 60))) {    
             if (res > div_u64(ULLONG_MAX - val, base))    
                 overflow = 1;    
         }    
         res = res * base + val;    
         rv++;    
         s++;    
     }    
     *p = res;    
     if (overflow)    
         rv |= KSTRTOX_OVERFLOW;    
     return rv;    
 }  
 
  

解释下两个小细节：

上头出现了个unlikely，其实unlikely和likely经常出现在linux相关内核源码中
1. if(likely(value)){
2. //等价于if(likely(value)) == if(value)
3. }
4. else{
5. }
likely表示value为真的可能性更大，而unlikely表示value为假的可能性更大，这两个宏被定义成：
1. //include/linux/compiler.h
2. # ifndef likely
3. # define likely(x) (__builtin_constant_p(x) ? !!(x) : __branch_check__(x, 1))
4. # endif
5. # ifndef unlikely
6. # define unlikely(x) (__builtin_constant_p(x) ? !!(x) : __branch_check__(x, 0))
7. # endif
呈现下div_u64的代码：
1. //include/linux/math64.h
2. //div_u64
3. static inline u64 div_u64(u64 dividend, u32 divisor)
4. {
5. u32 remainder;
6. return div_u64_rem(dividend, divisor, &remainder);
7. }
9. //div_u64_rem
10. static inline u64 div_u64_rem(u64 dividend, u32 divisor, u32 *remainder)
11. {
12. *remainder = dividend % divisor;
13. return dividend / divisor;
14. }

最后看下_parse_integer_fixup_radix函数：

 
    //lib/kstrtox.c, line 23  
 const char *_parse_integer_fixup_radix(const char *s, unsigned int *base)  
 {  
     if (*base == 0) {  
         if (s[0] == '0') {  
             if (_tolower(s[1]) == 'x' && isxdigit(s[2]))  
                 *base = 16;  
             else  
                 *base = 8;  
         } else  
             *base = 10;  
     }  
     if (*base == 16 && s[0] == '0' && _tolower(s[1]) == 'x')  
         s += 2;  
     return s;  
 }  
 
  

读者MJN君在我的建议下，对上述linux内核中的atoi函数进行了测试，咱们来看下测试结果如何。

2147483647 : 2147483647
2147483648 : -2147483648
10522545459 : 1932610867
-2147483648 : -2147483648
-2147483649 : -2147483647
-10522545459 : 1932610867

如上，根据程序的输出结果可以看出，对于某些溢出的情况，atoi程序的处理并不符合本题的要求。

也就是说，atoi程序对溢出的处理是一个标准，而本题要求对溢出的处理则是另外一个标准，所以说直接用atoi程序达不到本题的要求，但你不能因为本题的标准而否认atoi程序的正确性。

既然直接借用atoi的源码（原理是parseXXX，int i=Integer.parseInt(String str)，把str转换成int的方法），不符合题目要求，则咱们另寻他路。

路漫漫其修远兮，吾等将上下而求索，但与此同时，我们已渐入佳境。

8、根据我们第1小节达成一致的字符串转换成整数的思路：“每扫描到一个字符，我们便把在之前得到的数字乘以10，然后再加上当前字符表示的数字”，相信读者已经觉察到，在扫描到最后一个字符的时候，如果之前得到的数比较大，此时若再让其扩大10倍，相对来说是比较容易溢出的。

但车到山前必有路，既然让一个比较大的int整型数括大10倍，比较容易溢出，那么在不好判断是否溢出的情况下，可以尝试使用除法。即如MJN所说：

与其将n扩大10倍,，冒着溢出的风险, 再与MAX_INT进行比较（如果已经溢出, 则比较的结果没有意义），
不如未雨绸缪先用n与MAX_INT/10进行比较：若n>MAX_INT/10（当然同时还要考虑n=MAX_INT/10的情况），说明最终得到的整数一定会溢出，故此时可以当即进行溢出处理，直接返回最大值MAX_INT，从而也就免去了计算n*10这一步骤。

也就是说，计算n*10前,先比较n与MAX_INT/10大小，若n>MAX_INT/10，那么n*10肯定大于MAX_INT，即代表最后得到的整数n肯定溢出，既然溢出，不能再计算n*10，直接提前返回MAX_INT就行了。

一直以来，我们努力的目的归根结底是为了更好的处理溢出，但上述做法最重要的是巧妙的规避了计算n*10这一乘法步骤，转换成计算除法MAX_INT/10代替，不能不说此法颇妙。

他的代码如下，如有问题请指出：

 
     //copyright@njnu_mjn 2013  
 int StrToDecInt(const char* str)      
 {      
     static const int MAX = (int)((unsigned)~0 >> 1);      
     static const int MIN = -(int)((unsigned)~0 >> 1) - 1;      
     unsigned int n = 0;      
     int sign = 1;      
     int c;      
       
     while (isspace(*str))      
         ++str;      
     if (*str == '+' || *str == '-')      
     {      
         if (*str == '-')      
             sign = -1;      
         ++str;      
     }      
     while (isdigit(*str))      
     {      
         c = *str - '0';      
         if (sign > 0 && (n > MAX/10 || (n == MAX/10 && c > MAX%10)))      
         {      
             n = MAX;      
             break;      
         }      
         else if (sign < 0 && (n > (unsigned)MIN/10       
                               || (n == (unsigned)MIN/10 && c > (unsigned)MIN%10)))      
         {      
             n = MIN;      
             break;      
         }      
         n = n * 10 + c;      
         ++str;      
     }      
     return sign > 0 ? n : -n;      
 }    
 
   

上述代码从测试结果来看，暂未发现什么问题

输入输出
10522545459 : 2147483647
-10522545459 : -2147483648

咱们再来总结下上述代码是如何处理溢出情况的。对于正数来说，它溢出的可能性有两种：

一种是诸如2147483650，即n > MAX/10 的；
一种是诸如2147483649，即n == MAX/10 && c > MAX%10。

故咱们上面处理溢出情况的代码便是：

 
     c = *str - '0';    
         if (sign > 0 && (n > MAX/10 || (n == MAX/10 && c > MAX%10)))    
         {    
             n = MAX;    
             break;    
         }    
         else if (sign < 0 && (n > (unsigned)MIN/10     
                               || (n == (unsigned)MIN/10 && c > (unsigned)MIN%10)))    
         {    
             n = MIN;    
             break;    
         }    
 
   

不过，即便如此，有些细节是改进的，如他自己所说：

n的声明及定义应该为
1. int n = 0;
将MAX/10,MAX%10,(unsigned)MIN/10及(unsigned)MIN%10保存到变量中, 防止重复计算

这样，优化后的代码为：

 
     //copyright@njnu_mjn 2013  
 int StrToDecInt(const char* str)    
 {    
     static const int MAX = (int)((unsigned)~0 >> 1);    
     static const int MIN = -(int)((unsigned)~0 >> 1) - 1;    
     static const int MAX_DIV = (int)((unsigned)~0 >> 1) / 10;    
     static const int MIN_DIV = (int)((((unsigned)~0 >> 1) + 1) / 10);    
     static const int MAX_R = (int)((unsigned)~0 >> 1) % 10;    
     static const int MIN_R = (int)((((unsigned)~0 >> 1) + 1) % 10);    
     int n = 0;    
     int sign = 1;    
     int c;    
     
     while (isspace(*str))    
         ++str;    
     if (*str == '+' || *str == '-')    
     {    
         if (*str == '-')    
             sign = -1;    
         ++str;    
     }    
     while (isdigit(*str))    
     {    
         c = *str - '0';    
         if (sign > 0 && (n > MAX_DIV || (n == MAX_DIV && c >= MAX_R)))    
         {    
             n = MAX;    
             break;    
         }    
         else if (sign < 0 && (n > MIN_DIV     
                                                     || (n == MIN_DIV && c >= MIN_R)))    
         {    
             n = MIN;    
             break;    
         }    
         n = n * 10 + c;    
         ++str;    
     }    
     return sign > 0 ? n : -n;    
 }    
 
   

部分数据的测试结果如下图所示：

输入            输出
10522545459  : 2147483647
-10522545459 : -2147483648
2147483648   : 2147483647
-2147483648  : -2147483648

是否已是完美？如MJN君本人所说“ 我的实现与linux内核的atoi函数的实现, 都有一个共同的问题: 即使出错, 函数也返回了一个值, 导致调用者误认为自己传入的参数是正确的, 但是可能会导致程序的其他部分产生莫名的错误且很难调试”。

9、最后看下Nut/OS中atoi的实现，同时，本小节内容主要来自参考文献条目9，即MJN的博客：

 
   00077 #include <compiler.h>  
 00078 #include <stdlib.h>  
 00079   
 00084   
 00092 int atoi(CONST char *str)  
 00093 {  
 00094     return ((int) strtol(str, (char **) NULL, 10));  
 00095 }  
 
 

上述代码中strtol实现的思想跟上文第7节所述的MJN君的思路类似，也是除法代替乘法。加上测试函数后的具体代码如下：

 
   #include <errno.h>  
 #include <stdio.h>  
 #include <ctype.h>  
 #include <limits.h>  
   
 #define CONST      const  
   
 long mstrtol(CONST char *nptr, char **endptr, int base)  
 {  
     register CONST char *s;  
     register long acc, cutoff;  
     register int c;  
     register int neg, any, cutlim;  
   
     /* 
      * Skip white space and pick up leading +/- sign if any. 
      * If base is 0, allow 0x for hex and 0 for octal, else 
      * assume decimal; if base is already 16, allow 0x. 
      */  
     s = nptr;  
     do {  
         c = (unsigned char) *s++;  
     } while (isspace(c));  
     if (c == '-') {  
         neg = 1;  
         c = *s++;  
     } else {  
         neg = 0;  
         if (c == '+')  
             c = *s++;  
     }  
     if ((base == 0 || base == 16) && c == '0' && (*s == 'x' || *s == 'X')) {  
         c = s[1];  
         s += 2;  
         base = 16;  
     }  
     if (base == 0)  
         base = c == '0' ? 8 : 10;  
   
     /* 
      * Compute the cutoff value between legal numbers and illegal 
      * numbers.  That is the largest legal value, divided by the 
      * base.  An input number that is greater than this value, if 
      * followed by a legal input character, is too big.  One that 
      * is equal to this value may be valid or not; the limit 
      * between valid and invalid numbers is then based on the last 
      * digit.  For instance, if the range for longs is 
      * [-2147483648..2147483647] and the input base is 10, 
      * cutoff will be set to 214748364 and cutlim to either 
      * 7 (neg==0) or 8 (neg==1), meaning that if we have accumulated 
      * a value > 214748364, or equal but the next digit is > 7 (or 8), 
      * the number is too big, and we will return a range error. 
      * 
      * Set any if any `digits' consumed; make it negative to indicate 
      * overflow. 
      */  
     cutoff = neg ? LONG_MIN : LONG_MAX;  
     cutlim = cutoff % base;  
     cutoff /= base;  
     if (neg) {  
         if (cutlim > 0) {  
             cutlim -= base;  
             cutoff += 1;  
         }  
         cutlim = -cutlim;  
     }  
     for (acc = 0, any = 0;; c = (unsigned char) *s++) {  
         if (isdigit(c))  
             c -= '0';  
         else if (isalpha(c))  
             c -= isupper(c) ? 'A' - 10 : 'a' - 10;  
         else  
             break;  
         if (c >= base)  
             break;  
         if (any < 0)  
             continue;  
         if (neg) {  
             if ((acc < cutoff || acc == cutoff) && c > cutlim) {  
                 any = -1;  
                 acc = LONG_MIN;  
                 errno = ERANGE;  
             } else {  
                 any = 1;  
                 acc *= base;  
                 acc -= c;  
             }  
         } else {  
             if ((acc > cutoff || acc == cutoff) && c > cutlim) {  
                 any = -1;  
                 acc = LONG_MAX;  
                 errno = ERANGE;  
             } else {  
                 any = 1;  
                 acc *= base;  
                 acc += c;  
             }  
         }  
     }  
     if (endptr != 0)  
         *endptr = (char *) (any ? s - 1 : nptr);  
     return (acc);  
 }  
   
 int matoi2(CONST char *str)  
 {  
     return ((int) mstrtol(str, (char **) NULL, 10));  
 }  
   
 int mgetline(char* buf, size_t n) {  
   size_t idx = 0;  
   int c;  
     
   while (--n > 0 && (c = getchar()) != EOF && c != '\n') {  
     buf[idx++] = c;  
   }  
   buf[idx] = '\0';  
   return idx;  
 }  
   
 #define MAX_LINE 200  
   
 int main() {  
     char buf[MAX_LINE];  
     while (mgetline(buf, MAX_LINE) >= 0) {  
         if (strcmp(buf, "quit") == 0) break;  
         printf("matoi2=%d\n", matoi2(buf));  
     }  
     return 0;  
 }  
 
 

同样，MJN对上述实现测试了下，结果如下:

10522545459
matoi2=2147483647
-10522545459
matoi2=-2147483648

程序貌似对溢出的处理是正确的, 真的吗? 再把测试数据换成"10522545454"（与"10522545459"的区别在于最后一个字符）

10522545454
matoi2=1932610862
-10522545454
matoi2=-1932610862

症结就在于下面这段代码：

 
   if (neg) {  
             if ((acc < cutoff || acc == cutoff) && c > cutlim) {  
                 any = -1;  
                 acc = LONG_MIN;  
                 errno = ERANGE;  
             } else {  
                 any = 1;  
                 acc *= base;  
                 acc -= c;  
             }  
         } else {  
             if ((acc > cutoff || acc == cutoff) && c > cutlim) {  
                 any = -1;  
                 acc = LONG_MAX;  
                 errno = ERANGE;  
 
 

要想得到正确的输出结果，需要改动两个地方：

①其中这行：

 
   if ((acc > cutoff || acc == cutoff) && c > cutlim)

应该改为：

 
   if ( acc > cutoff ||  (acc == cutoff) && c > cutlim)  )

②与此同时，这行:

 
   if ((acc < cutoff || acc == cutoff) && c > cutlim) {

改为：

 
   if (acc < cutoff || (acc == cutoff && c > cutlim)) {

为何要这样修改呢？细心的读者相信还是会记得上文第8节中关于正数的两种溢出情况的可能性：“对于正数来说，它溢出的可能性有两种：

一种是诸如2147483650，即n > MAX/10 的；
一种是诸如2147483649，即n == MAX/10 && c > MAX%10。”

也就是说无论是"10522545459"，还是"10522545454"，都是属于第1种情况，即“诸如2147483650，即n > MAX/10的”，此时直接返回MAX_INT即可，所以不需要也不能再去判断n == MAX/10的情况。

这个处理思路类似于上文第8节处理溢出情况的代码：

 
   if (sign > 0 && (n > MAX/10 || (n == MAX/10 && c > MAX%10)))      
         {      
             n = MAX;      
             break;      
         }      
         else if (sign < 0 && (n > (unsigned)MIN/10       
                               || (n == (unsigned)MIN/10 && c > (unsigned)MIN%10)))      
         {      
             n = MIN;      
             break;      
         }      
 
 

So，修改过后的代码测试正常:

10522545459
matoi2=2147483647
-10522545459\
matoi2=-2147483648
10522545454
matoi2=2147483647
-10522545454
matoi2=-2147483648
quit

OK，字符串转换成整数这一问题已基本解决。但如果面试官继续问你，如何把整数转换成字符串呢？欢迎于本文评论下或hero上show出你的思路或代码。

第三十一章、带通配符的字符串匹配问题

字符串匹配问题，给定一串字符串，按照指定规则对其进行匹配，并将匹配的结果保存至output数组中，多个匹配项用空格间隔，最后一个不需要空格。

要求：

匹配规则中包含通配符？和*，其中？表示匹配任意一个字符，*表示匹配任意多个（>=0）字符。
匹配规则要求匹配最大的字符子串，例如a*d,匹配abbdd而非abbd,即最大匹配子串。
匹配后的输入串不再进行匹配，从当前匹配后的字符串重新匹配其他字符串。

请实现函数：char* my_find(char input[], char rule[])

举例说明

input:abcadefg
rule:a?c
output:abc

input :newsadfanewfdadsf
rule: new
output: new new

input :breakfastfood
rule: f*d
output:fastfood

注意事项：

自行实现函数my_find，勿在my_find函数里夹杂输出，且不准用C、C++库，和Java的String对象；
请注意代码的时间，空间复杂度，及可读性，简洁性；
input=aaa，rule=aa时，返回一个结果aa，即可。

1、本题与上述第三十章的题不同，上题字符串转换成整数更多考察对思维的全面性和对细节的处理，本题则更多的是编程技巧。闲不多说，直接上代码：

 
   //copyright@cao_peng 2013/4/23  
 int str_len(char *a) {  //字符串长度  
     if (a == 0) {  
         return 0;  
     }  
     char *t = a;  
     for (;*t;++t)  
         ;  
     return (int) (t - a);  
 }  
   
 void str_copy(char *a,const char *b,int len) {  //拷贝字符串 a = b  
     for (;len > 0; --len, ++b,++a) {  
         *a = *b;  
     }  
     *a = 0;  
 }  
   
 char *str_join(char *a,const char *b,int lenb) { //连接字符串 第一个字符串被回收  
     char *t;  
     if (a == 0) {  
         t = (char *) malloc(sizeof(char) * (lenb + 1));   
         str_copy(t, b, lenb);  
         return t;  
     }  
     else {  
         int lena = str_len(a);  
         t = (char *) malloc(sizeof(char) * (lena + lenb + 2));  
         str_copy(t, a, lena);  
         *(t + lena) = ' ';  
         str_copy(t + lena + 1, b, lenb);  
         free(a);  
         return t;  
     }  
 }  
   
 int canMatch(char *input, char *rule) { // 返回最长匹配长度 -1表示不匹配　  
     if (*rule == 0) { //已经到rule尾端  
         return 0;  
     }  
     int r = -1 ,may;  
     if (*rule == '*') {  
         r = canMatch(input, rule + 1);  // *匹配0个字符  
         if (*input) {  
             may = canMatch(input + 1, rule);  // *匹配非0个字符  
             if ((may >= 0) && (++may > r)) {  
                 r = may;  
             }  
         }  
     }  
     if (*input == 0) {  //到尾端  
         return r;  
     }  
     if ((*rule == '?') || (*rule == *input)) {  
         may = canMatch(input + 1, rule + 1);  
         if ((may >= 0) && (++may > r)) {  
             r = may;  
         }  
     }  
     return r;  
 }  
   
 char * my_find(char  input[],   char rule[]) {  
     int len = str_len(input);  
     int *match = (int *) malloc(sizeof(int) * len);  //input第i位最多能匹配多少位 匹配不上是-1  
     int i,max_pos = - 1;  
     char *output = 0;  
   
     for (i = 0; i < len; ++i) {  
         match[i] = canMatch(input + i, rule);  
         if ((max_pos < 0) || (match[i] > match[max_pos])) {  
             max_pos = i;  
         }  
     }  
     if ((max_pos < 0) || (match[max_pos] <= 0)) {  //不匹配  
         output = (char *) malloc(sizeof(char));  
         *output = 0;   // \0  
         return output;  
     }  
     for (i = 0; i < len;) {  
         if (match[i] == match[max_pos]) { //找到匹配  
             output = str_join(output, input + i, match[i]);  
             i += match[i];  
         }  
         else {  
             ++i;  
         }  
     }  
     free(match);  
     return output;  
 }  
 
 

2、本题也可以直接写出DP方程，如下代码所示：

 
   //copyright@chpeih 2013/4/23  
 char* my_find(char  input[],   char rule[])  
 {  
     //write your code here  
     int len1,len2;  
     for(len1 = 0;input[len1];len1++);  
     for(len2 = 0;rule[len2];len2++);  
     int MAXN = len1>len2?(len1+1):(len2+1);  
     int  **dp;  
   
     //dp[i][j]表示字符串1和字符串2分别以i j结尾匹配的最大长度  
     //记录dp[i][j]是由之前那个节点推算过来  i*MAXN+j  
     dp = new int *[len1+1];  
     for (int i = 0;i<=len1;i++)  
     {  
         dp[i] = new int[len2+1];  
   
     }  
   
     dp[0][0] = 0;  
     for(int i = 1;i<=len2;i++)  
         dp[0][i] = -1;  
     for(int i = 1;i<=len1;i++)  
         dp[i][0] = 0;  
   
     for (int i = 1;i<=len1;i++)  
     {  
         for (int j = 1;j<=len2;j++)  
         {  
             if(rule[j-1]=='*'){  
                 dp[i][j] = -1;  
                 if (dp[i-1][j-1]!=-1)  
                 {  
                     dp[i][j] = dp[i-1][j-1]+1;  
   
                 }  
                 if (dp[i-1][j]!=-1 && dp[i][j]<dp[i-1][j]+1)  
                 {  
                     dp[i][j] = dp[i-1][j]+1;  
   
                 }  
             }else if (rule[j-1]=='?')  
             {  
                 if(dp[i-1][j-1]!=-1){  
                     dp[i][j] = dp[i-1][j-1]+1;  
   
                 }else dp[i][j] = -1;  
             }   
             else  
             {  
                 if(dp[i-1][j-1]!=-1 && input[i-1]==rule[j-1]){  
                     dp[i][j] = dp[i-1][j-1]+1;  
                 }else dp[i][j] = -1;  
             }  
         }  
     }  
   
     int m = -1;//记录最大字符串长度  
     int *ans = new int[len1];  
     int count_ans = 0;//记录答案个数  
     char *returnans = new char[len1+1];  
     int count = 0;  
     for(int i = 1;i<=len1;i++)  
         if (dp[i][len2]>m){  
             m = dp[i][len2];  
             count_ans = 0;  
             ans[count_ans++] = i-m;  
         }else if(dp[i][len2]!=-1 &&dp[i][len2]==m){  
             ans[count_ans++] = i-m;  
         }  
   
         if (count_ans!=0)  
         {      
             int len = ans[0];  
             for (int i = 0;i<m;i++)  
             {  
                 printf("%c",input[i+ans[0]]);  
                 returnans[count++] = input[i+ans[0]];  
             }  
             for (int j = 1;j<count_ans;j++)  
             {  
                 printf(" ");  
                 returnans[count++] = ' ';  
                 len = ans[j];  
                 for (int i = 0;i<m;i++)  
                 {  
                     printf("%c",input[i+ans[j]]);  
                     returnans[count++] = input[i+ans[j]];  
                 }  
             }  
             printf("\n");  
             returnans[count++] = '\0';  
         }  
   
         return returnans;  
 }  
 
 

欢迎于本文评论下或hero上 show your code 。

参考文献及推荐阅读

http://zhedahht.blog.163.com/blog/static/25411174200731139971/；
http://hero.pongo.cn/，本文大部分代码都取自左边hero上参与答题者提交的代码，欢迎你也去挑战；
字符串转换成整数题目完整描述：http://hero.pongo.cn/Question/Details?ID=47&ExamID=45；
字符串匹配问题题目完整描述：http://hero.pongo.cn/Question/Details?ID=28&ExamID=28；
linux3.8.4版本下的相关字符串整数转换函数概览：https://git.kernel.org/cgit/linux/kernel/git/stable/linux-stable.git/tree/lib/vsprintf.c?id=refs/tags/v3.9.4；
关于linux中的likely和unlikely：http://blog.21ic.com/user1/5593/archives/2010/68193.html；
如果你喜欢编程挑战，除了topcoder和hero，你应该还多去leetcode上逛逛：http://leetcode.com/onlinejudge；
atio函数的实现：http://blog.csdn.net/njnu_mjn/article/details/9099405；
atoi函数的实现: linux内核atoi函数的测试：http://blog.csdn.net/njnu_mjn/article/details/9104143；
Nut/OS中atoi函数的实现：http://www.ethernut.de/api/atoi_8c_source.html；
一读者写的hero上“字符串转换成整数”一题的解题报告（测试正确）：http://blog.csdn.net/u011070134/article/details/9116831；

你可能感兴趣的:(程序员编程艺术第三十~三十一章：字符串转换成整数，通配符字符串匹配)

用 C++ 打造综合管理系统：功能实现与代码解析他是只猫 C++教程 c++算法学习开发语言
文章目录系统功能概述设计与实现可逆素数模块计算数字总和模块各位数字之和排序模块字符串中的最大整数模块字符串解压模块输出指定图形模块计算学生信息操作之最高分模块字符串反转模块菜单界面与主函数总结完整代码在C++编程学习过程中，将所学知识应用到实际项目里是提升编程能力的有效途径。今天，我们就来构建一个综合管理系统，这个系统集成了多个实用功能模块，能帮助我们解决不同类别的问题。通过这个项目，我们不仅能巩
算法-动态规划-最大子数组和程序员南飞算法动态规划 leetcode java 开发语言数据结构职场和发展
力扣题目：53.最大子数组和53.描述：给你一个整数数组nums，请你找出一个具有最大和的连续子数组（子数组最少包含一个元素），返回其最大和。子数组是数组中的一个连续部分。示例1：输入：nums=[-2,1,-3,4,-1,2,1,-5,4]输出：6解释：连续子数组 [4,-1,2,1]的和最大，为 6。示例2：输入：nums=[1]输出：1示例3：输入：nums=[5,4,-1,7,8]输出：2
面试经典算法150题系列-除自身以外数组的乘积 betterManchester 面试经典算法题150题算法面试 java
除自身以外数组的乘积给你一个整数数组nums，返回数组answer，其中answer[i]等于nums中除nums[i]之外其余各元素的乘积。题目数据保证数组nums之中任意元素的全部前缀元素和后缀的乘积都在32位整数范围内。请不要使用除法，且在O(n)时间复杂度内完成此题。示例1:输入:nums=[1,2,3,4]输出:[24,12,8,6]示例2:输入:nums=[-1,1,0,-3,3]输出
Python数据可视化与地理空间分析 CrMylive. 信息可视化 python 开发语言
一、引言数据可视化与地理空间分析是数据科学领域中的两个重要领域，其中数据可视化侧重于将数据转换成可视化的图表，而地理空间分析则关注于如何在地理空间内处理与分析数据。Python作为一种高效、灵活、易用的编程语言，近年来在数据科学领域越来越受到欢迎。本文将以Python为工具，在数据可视化与地理空间分析方面进行详细探讨，并给出一些相关实例。二、数据可视化数据可视化是指利用图表、图形和其他视觉元素来展
算法通关----除自己自身以外数组乘积 fang4084 算法通关算法
题目来源：leetcode--238题目内容：给你一个整数数组nums，返回数组answer，其中answer[i]等于nums中除nums[i]之外其余各元素的乘积。题目数据保证数组nums之中任意元素的全部前缀元素和后缀的乘积都在32位整数范围内。请不要使用除法，且在O(n)时间复杂度内完成此题。示例1:输入:nums=[1,2,3,4]输出:[24,12,8,6]示例2:输入:nums=[-
蓝易云 - 【C++STL基础入门】string类的基础使用蓝易云 c++java linux okhttp 开发语言架构
C++的STL（标准模板库）中的string类是用于操作字符串的重要工具。以下是string类的基础使用方法：包含头文件：首先，要使用string类，需要包含头文件。定义和初始化：可以通过以下方式定义和初始化string对象：stringstr1;//默认构造函数，创建空字符串stringstr2="Hello,world!";//使用字符串字面量初始化stringstr3(str2);//使用另
【第4章】项目实战-亿级电商系统需求分析 cherry5230 架构需求分析大数据数据库架构
1-14项目背景介绍项目基本背景平台类型:B2B电商平台年交易额:超200亿元客户定位:行业龙头企业项目规模:历时:1年以上总投入:450+人月费用等级:千万级业务背景解析1.平台业务模式演进初始阶段自营模式:自有品牌商品完整生产链:设计→生产→制造→销售主要客户:企业采购业务特点:自产自销发展阶段平台扩展:引入供应商体系商品结构:自有商品供应商商品客户服务升级:提供综合商品包一站式采购解决方案2
【教程4＞第2章＞第30节】本章整体思维导图与学习总结 fpga和matlab #第3章·通信—高阶调制解调 FPGA 教程4 学习总结高阶调制解调
教程4.目录.目录1.本章节目录2.本章节思维导图3.本章节学习案例与实际应用欢迎订阅FPGA/MATLAB/Simulink系列教程《★教程1:matlab入门100例》《★教程2:fpga入门100例》《★教程3:simulink入
3.4 C#的运算符和表达式详解（运算符优先级、算术运算符、逻辑运算符……） Argonaut春从零开始学c c#java android 运算符表达式
文章目录C#的运算符和表达式3.4.1运算符与表达式类型1.算术运算符与算术表达式2.字符串运算符与字符串表达式3.关系运算符与关系表达式4.逻辑运算符与逻辑表达式5.条件运算符与条件表达式6.赋值运算符与赋值表达式3.4.2运算符的优先级与结合性1.运算符的优先级2.结合性示例代码C#的运算符和表达式运算符大致分为3类：一元运算符，包括前缀运算符和后缀运算符，用于处理一个操作数二元运算符，使用时
基于 SSM 架构的 JAVA 网络直播带货查询系统设计与 JSP 实践成果 2401_85702623 架构 java 开发语言
第二章关键技术的研究2.1JSP技术介绍JSP技术本身是一种脚本语言，但它的功能是十分强大的，因为它可以使用所有的JAVA类。当它与JavaBeans类进行结合时，它可以使显示逻辑和内容分开，这就极大的方便了用户的需求。JavaBeans可以对JSP技术的程序进行扩展，从而形成新的应用程序，而且JavaBeans的代码可以重复使用，所以就便于对程序进行维护。JavaBean组件有内部的接口，可以帮
【设计模式精讲】开源实战之剖析MyBatis框架：MyBatis中的设计模式之Builder模式 mybatis
文章目录第七章开源实战7.2剖析MyBatis框架中用到的经典设计模式7.2.1MyBatis回顾7.2.1.1MyBatis与ORM框架7.2.1.1MyBatis的基础使用7.2.2MyBatis中使用到的设计模式7.2.2.1Builder模式个人主页：道友老李欢迎加入社区：道友老李的学习社区第七章开源实战7.2剖析MyBatis框架中用到的经典设计模式7.2.1MyBatis回顾7.2.1
PHP入门教程3：数组和字符串操作 Evaporator Core #php程序设计经验 php android 开发语言
PHP入门教程3：数组和字符串操作在前两篇文章中，我们学习了PHP的基础语法、控制结构和函数的使用。本文将重点介绍数组和字符串的高级操作，这些是PHP编程中非常常见且重要的内容。本文将包含以下几个部分：数组的类型和操作多维数组数组函数字符串操作字符串函数1.数组的类型和操作数组是一种可以存储多个值的数据结构。PHP中有三种类型的数组：索引数组、关联数组和多维数组。索引数组索引数组是用数字索引的数组
力扣刷题笔记_动态规划爬楼梯问题 yma16 csp算法题目学习
题目描述假设你正在爬楼梯。需要n阶你才能到达楼顶。每次你可以爬1或2个台阶。你有多少种不同的方法可以爬到楼顶呢？注意：给定n是一个正整数。示例一输入：2输出：2解释：有两种方法可以爬到楼顶。方法一：1阶+1阶方法二：2阶示例二输入：3输出：3解释：有三种方法可以爬到楼顶。方法一：1阶+1阶+1阶方法二：1阶+2阶方法三：2阶+1阶动态规划它的最优解可以从其子问题的最优解来有效地构建。第i阶可以由以
第16讲- 插入排序 mochensage 算法数据结构排序算法
A-L1-2-第16讲-插入排序5393n个数降序排序描述输入n个整数，使用插入排序，将n个数降序排序并输出。输入描述第一行，一个整数n（1≤n≤100）；第二行，n个整数，每个整数的范围1~1000，存入数组a中。输出描述一行n个整数，从大到小（降序）排列，使用空格隔开。样例输入1510137568326754样例输出175456832613710#includeusingnamespacest
Java入门第72课——String字符串基本操作猴子学编程 Java零基础课程 Java字符串 String StringBuilder
1.1String及其常用API1.1.1String是不可变对象·java.lang.String使用了final修饰，不能被继承；·字符串底层封装了字符数组及针对字符数组的操作算法；·字符串一旦创建，对象永远无法改变，但字符串引用可以重新赋值；·Java字符串在内存中采用Unicode编码方式，任何一个字符对应两个字节的定长编码。1.1.2String常量池·Java为了提高性能，静态字符串(
数据结构：数组和链表 OutlierLi 数据结构代码随想录数据结构链表
数据结构：数组和链表数组数组基础数组是一种数据结构，它在计算机内存中占据一段连续的空间，并由一系列元素组成，这些元素的类型相同。在数组中，每个元素都可以通过数组索引（通常是整数）快速访问，索引通常从0开始。数组的特点是其大小（即可以容纳的元素数量）在被创建时就已经确定，并且在整个使用周期内保持固定。vector向量array数组和vector数组的区别：固定大小vs动态大小：std::array是
RNN及其变体 EmbodiedTech 人工智能大模型自然语言处理
第三章RNN及其变体1认识RNN模型【根据RNN内部结构，可以分为哪几类】定义循环神经网络：一般接受的一序列进行输入，输出也是一个序列作用和应用场景RNN擅长处理连续语言文本，机器翻译、文本生成、文本分类、摘要生成RNN模型的分类根据输入与输出结构NVsN:输入和输出等长，应用场景：对联生成；词性标注；NERNVs1:输入N，输出为单值，应用场景：文本分类1VsN:输入是一个，输出为N，应用场景：
lvs wzyzzu linux
目录LVS项目理论项目介绍体系结构IP负载均衡负载调度安装配置简介组件背景硬件/网络的要求路由的必要条件节点内部连接的必要条件安装软件配置例子简单实例LVSLVS是章文嵩博士发起和领导的优秀的集群解决方案，许多商业的集群产品，比如RedHat的Piranha，TurboLinux公司的TurboCluster等，都是基于LVS的核心代码的。在现实的应用中，LVS得到了大量的部署，请参考http:/
oracle常用函数小辉煌 oracle
1、replace()含义：替换字符串，用法：replace(原字段，“原字段旧内容“,“原字段新内容“)2、greatest（expr_1,expr_2,...expr_n)含义：从表达式（列、常量、计算值）expr_1,expr_2,...expr_n等中找出最大的数返回用法：SELECTGREATEST(2,5,12,3,16,8,9)AFROMDUAL;--结果为163、nvl()含义：如
【SpringMVC】_简单示例计算器 _周游 Spring JavaEE java-ee mvc spring
目录1.需求分析2.接口定义3.请求参数4.响应数据5.服务器代码6.前端页面代码7.运行测试为阶段性总结与应用，现将以SpringMVC项目创建一个可以实现加法的计算器为例1.需求分析加法计算器功能，对两个整数进行相加，需要客户端提供参与计算的两个数，服务器返回这两个整数计算的结果。2.接口定义（1）请求路径：cala/sum（2）请求方式：GET/POST（3）接口描述：计算两个整数相加3.请
2024年第十五届蓝桥杯大赛软件类省赛C/C++大学B组真题——好数小黄Calm 蓝桥杯 c语言 c++
题目：一个整数如果按从低位到高位的顺序，奇数位（个位、百位、万位···）上的数字是奇数，偶数位（十位、千位、十万位···）上的数字是偶数，我们就称之为“好数”。给定一个正整数N，请计算从1到N一共有多少个好数。由于题目中最高只有七位数，可以通过多少位数来分别判断：#includeintmain(){intnum1,count=0,n=0;scanf("%d",&num1);for(intnum=1
好数第十五届蓝桥杯大赛软件赛省赛C/C++ 大学 B 组 Geometry Fu 蓝桥杯蓝桥杯 c语言 c++
好数题目来源第十五届蓝桥杯大赛软件赛省赛C/C++大学B组原题链接蓝桥杯好数问题描述P10424[蓝桥杯2024省B]好数题目描述一个整数如果按从低位到高位的顺序，奇数位（个位、百位、万位……）上的数字是奇数，偶数位（十位、千位、十万位……）上的数字是偶数，我们就称之为“好数”。给定一个正整数NNN，请计算从111到NNN一共有多少个好数。输入格式一个整数NNN。输出格式一个整数代表答案。输入输出
LJF-Framework 第1章【一个不成熟的想法】 one one day LJF-Framework spring java spring boot
LJF-Framework第1章【一个不成熟的想法】一、想法的诞生平时自己写点小demo，练练手，学点新知识，或者整点小项目。弱鸡的我在写一些新的项目的时候，对于一些常用的功能，写代码那肯定就是CV大法了，从以前写过的代码中各种CV，结果好多项目用的框架不同，总得修修改改，太费经，比如说安全鉴权等，一开始练习shiro、后来又学习SpringSecurity，然后又研究了一波sa-token，对于
LeetCode第92题_反转链表II @蓝莓果粒茶算法 leetcode 链表算法 c++数据结构 python 后端
LeetCode第92题：反转链表II题目描述给你单链表的头指针head和两个整数left和right，其中left1->2->3->4->5|prev|curr找到left前一个节点prev（即节点1）：dummy->1->2->3->4->5||prevcurr第一次头插：将节点3插入到prev之后：dummy->1->3->2->4->5||prevcurr第二次头插：将节点4插入到prev
牛客周赛 Round 54 题解（A~E） TCaaaaa 算法图论 c++
牛客周赛Round54题解A清楚姐姐的糖葫芦思路解析:显然只需要数字符串的字符o的个数即可。时间复杂度:O(N)O(N)O(N)代码块:voidsolve(){strings;cin>>s;intc=0;for(autov:s){c+=v=='o';}cout>a>>b>>x;llres1=x*a;llv=(x+2)/3*b;res1=min(res1,v);res1=min(res1,x/3*b
python 实例教程 weixin_33810006 python
PythonHelloWorldPython变量Python运算符Python比较运算Python循环Python数字Python字符Python数组列表Python字符串Python子字符串Python函数PythonI/O文件输入输出Python脚本Python注释Python脚本Python赋值Python字符串Python列表Python元组Python字典Python算术运算符Pytho
案例驱动的 IT 团队管理：创新与突破之路：第二章团队组建：从人才画像到生态构建-2.2.1星型架构 vs 网状架构对比言析数智案例驱动的 IT 团队管理：创新与突破之路 IT项目管理星型架构网状架构
点击关注不迷路点击关注不迷路点击关注不迷路文章大纲星型架构vs网状架构：IT团队结构创新的双模选择引言：从网络拓扑到组织设计的范式迁移一、架构解析：技术原理与管理哲学的融合1.1星型架构：中心化控制体系1.2网状架构：分布式协作网络二、对比分析：六维能力评估模型2.1核心能力矩阵2.2适用场景对照三、混合架构创新：数字时代的第三选择3.1蜂巢式结构设计3.2动态平衡机制四、转型路线图：四阶段演进路
Redis常用命令详解：从基础到高阶应用指南黑猫Teng redis 数据库缓存
Redis常用命令详解：从基础到高阶应用指南一、Redis命令使用须知两种连接方式：命令行工具：redis-cli编程客户端（Java/Python等）通用语法：COMMANDKEY[PARAMS]返回值类型：简单字符串（SimpleStrings）错误信息（Errors）整型（Integers）批量字符串（BulkStrings）数组（Arrays）二、核心数据类型操作命令1.字符串（Strin
刷算法Leetcode---4（字符串篇）搞笑症患者力扣刷算法 leetcode 算法
前言本文是根据代码随想录中的字符串顺序进行编写，只刷了里面力扣的题代码随想录其他文章链接：刷算法Leetcode文章汇总字符串篇344.反转字符串①双指针，前后交换②for循环，s[i]=s[n-i-1]，与双指针思想相同541.反转字符串Ⅱjava中字符串不能修改，先转换为char数组for循环每2k个字符一组，组内使用双指针反转前k个字符，每次判断右指针是否越界151.反转字符串中单词①双指针
第七章Solr：企业级搜索应用 AGI大模型与大数据研究院 DeepSeek R1 &大数据AI人工智能计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
第七章Solr：企业级搜索应用1.背景介绍1.1搜索引擎的重要性在当今信息时代,数据量呈指数级增长,海量数据中蕴含着极其宝贵的信息和知识。然而,如何快速、准确地从大数据中检索出所需的信息,一直是企业和组织面临的巨大挑战。传统的数据库查询方式已经无法满足现代搜索需求,因此高效的搜索引擎应运而生。1.2什么是SolrApacheSolr是一个高性能、可扩展、云就绪的企业级搜索平台,由Apache软件基
遍历dom 并且存储（将每一层的DOM元素存在数组中）换个号韩国红果果 JavaScript html
数组从0开始！！ var a=[],i=0; for(var j=0;j<30;j++){ a[j]=[];//数组里套数组，且第i层存储在第a[i]中 } function walkDOM(n){ do{ if(n.nodeType!==3)//筛选去除#text类型 a[i].push(n); //con
Android+Jquery Mobile学习系列(9)-总结和代码分享白糖_ JQuery Mobile
目录导航经过一个多月的边学习边练手，学会了Android基于Web开发的毛皮，其实开发过程中用Android原生API不是很多，更多的是HTML/Javascript/Css。个人觉得基于WebView的Jquery Mobile开发有以下优点： 1、对于刚从Java Web转型过来的同学非常适合，只要懂得HTML开发就可以上手做事。 2、jquerym
impala参考资料 dayutianfei impala
记录一些有用的Impala资料 1. 入门资料 >>官网翻译： http://my.oschina.net/weiqingbin/blog?catalog=423691 2. 实用进阶 >>代码&架构分析： Impala/Hive现状分析与前景展望：http
JAVA 静态变量与非静态变量初始化顺序之新解周凡杨 java 静态非静态顺序
今天和同事争论一问题，关于静态变量与非静态变量的初始化顺序，谁先谁后，最终想整理出来！测试代码： import java.util.Map; public class T { public static T t = new T(); private Map map = new HashMap(); public T(){ System.out.println(&quo
跳出iframe返回外层页面 g21121 iframe
在web开发过程中难免要用到iframe，但当连接超时或跳转到公共页面时就会出现超时页面显示在iframe中，这时我们就需要跳出这个iframe到达一个公共页面去。首先跳转到一个中间页，这个页面用于判断是否在iframe中，在页面加载的过程中调用如下代码： <script type="text/javascript"> //<!-- function
JAVA多线程监听JMS、MQ队列 510888780 java多线程
背景：消息队列中有非常多的消息需要处理，并且监听器onMessage（）方法中的业务逻辑也相对比较复杂，为了加快队列消息的读取、处理速度。可以通过加快读取速度和加快处理速度来考虑。因此从这两个方面都使用多线程来处理。对于消息处理的业务处理逻辑用线程池来做。对于加快消息监听读取速度可以使用1.使用多个监听器监听一个队列；2.使用一个监听器开启多线程监听。对于上面提到的方法2使用一个监听器开启多线
第一个SpringMvc例子布衣凌宇 spring mvc
第一步：导入需要的包；第二步：配置web.xml文件 <?xml version="1.0" encoding="UTF-8"?> <web-app version="2.5" xmlns="http://java.sun.com/xml/ns/javaee" xmlns:xsi=
我的spring学习笔记15-容器扩展点之PropertyOverrideConfigurer aijuans Spring3
PropertyOverrideConfigurer类似于PropertyPlaceholderConfigurer，但是与后者相比，前者对于bean属性可以有缺省值或者根本没有值。也就是说如果properties文件中没有某个bean属性的内容，那么将使用上下文（配置的xml文件）中相应定义的值。如果properties文件中有bean属性的内容，那么就用properties文件中的值来代替上下
通过XSD验证XML antlove xml schema xsd validation SchemaFactory
1. XmlValidation.java package xml.validation; import java.io.InputStream; import javax.xml.XMLConstants; import javax.xml.transform.stream.StreamSource; import javax.xml.validation.Schem
文本流与字符集百合不是茶 PrintWrite()的使用字符集名字别名获取
文本数据的输入输出; 输入;数据流,缓冲流输出;介绍向文本打印格式化的输出PrintWrite(); package 文本流; import java.io.FileNotFound
ibatis模糊查询sqlmap-mapping-**.xml配置 bijian1013 ibatis
正常我们写ibatis的sqlmap-mapping-*.xml文件时，传入的参数都用##标识，如下所示： <resultMap id="personInfo" class="com.bijian.study.dto.PersonDTO"> <res
java jvm常用命令工具——jdb命令(The Java Debugger) bijian1013 java jvm jdb
用来对core文件和正在运行的Java进程进行实时地调试，里面包含了丰富的命令帮助您进行调试，它的功能和Sun studio里面所带的dbx非常相似，但 jdb是专门用来针对Java应用程序的。现在应该说日常的开发中很少用到JDB了，因为现在的IDE已经帮我们封装好了，如使用ECLI
【Spring框架二】Spring常用注解之Component、Repository、Service和Controller注解 bit1129 controller
在Spring常用注解第一步部分【Spring框架一】Spring常用注解之Autowired和Resource注解（http://bit1129.iteye.com/blog/2114084）中介绍了Autowired和Resource两个注解的功能，它们用于将依赖根据名称或者类型进行自动的注入，这简化了在XML中，依赖注入部分的XML的编写，但是UserDao和UserService两个bea
cxf wsdl2java生成代码super出错,构造函数不匹配 bitray super
由于过去对于soap协议的cxf接触的不是很多,所以遇到了也是迷糊了一会.后来经过查找资料才得以解决. 初始原因一般是由于jaxws2.2规范和jdk6及以上不兼容导致的.所以要强制降为jaxws2.1进行编译生成.我们需要少量的修改: 我们原来的代码 wsdl2java com.test.xxx -client http://..... 修改后的代
动态页面正文部分中文乱码排障一例 ronin47
公司网站一部分动态页面，早先使用apache+resin的架构运行，考虑到高并发访问下的响应性能问题，在前不久逐步开始用nginx替换掉了apache。不过随后发现了一个问题，随意进入某一有分页的网页，第一页是正常的（因为静态化过了）；点“下一页”，出来的页面两边正常，中间部分的标题、关键字等也正常，唯独每个标题下的正文无法正常显示。因为有做过系统调整，所以第一反应就是新上
java-54- 调整数组顺序使奇数位于偶数前面 bylijinnan java
import java.util.Arrays; import java.util.Random; import ljn.help.Helper; public class OddBeforeEven { /** * Q 54 调整数组顺序使奇数位于偶数前面 * 输入一个整数数组，调整数组中数字的顺序，使得所有奇数位于数组的前半部分，所有偶数位于数组的后半
从100PV到1亿级PV网站架构演变 cfyme 网站架构
一个网站就像一个人，存在一个从小到大的过程。养一个网站和养一个人一样，不同时期需要不同的方法，不同的方法下有共同的原则。本文结合我自已14年网站人的经历记录一些架构演变中的体会。 1：积累是必不可少的架构师不是一天练成的。 1999年，我作了一个个人主页，在学校内的虚拟空间，参加了一次主页大赛，几个DREAMWEAVER的页面，几个TABLE作布局，一个DB连接，几行PHP的代码嵌入在HTM
[宇宙时代]宇宙时代的GIS是什么？ comsci Gis
我们都知道一个事实，在行星内部的时候，因为地理信息的坐标都是相对固定的，所以我们获取一组GIS数据之后，就可以存储到硬盘中，长久使用。。。但是，请注意，这种经验在宇宙时代是不能够被继续使用的宇宙是一个高维时空
详解create database命令 czmmiao database
完整命令 CREATE DATABASE mynewdb USER SYS IDENTIFIED BY sys_password USER SYSTEM IDENTIFIED BY system_password LOGFILE GROUP 1 ('/u01/logs/my/redo01a.log','/u02/logs/m
几句不中听却不得不认可的话 datageek
1、人丑就该多读书。 2、你不快乐是因为：你可以像猪一样懒，却无法像只猪一样懒得心安理得。 3、如果你太在意别人的看法，那么你的生活将变成一件裤衩，别人放什么屁，你都得接着。 4、你的问题主要在于：读书不多而买书太多，读书太少又特爱思考，还他妈话痨。 5、与禽兽搏斗的三种结局：(1)、赢了，比禽兽还禽兽。(2)、输了，禽兽不如。(3)、平了，跟禽兽没两样。结论：选择正确的对手很重要。 6
1 14:00 PHP中的“syntax error, unexpected T_PAAMAYIM_NEKUDOTAYIM”错误 dcj3sjt126com PHP
原文地址：http://www.kafka0102.com/2010/08/281.html 因为需要，今天晚些在本机使用PHP做些测试，PHP脚本依赖了一堆我也不清楚做什么用的库。结果一跑起来，就报出类似下面的错误：“Parse error: syntax error, unexpected T_PAAMAYIM_NEKUDOTAYIM in /home/kafka/test/
xcode6 Auto layout and size classes dcj3sjt126com ios
官方GUI https://developer.apple.com/library/ios/documentation/UserExperience/Conceptual/AutolayoutPG/Introduction/Introduction.html iOS中使用自动布局（一） http://www.cocoachina.com/ind
通过PreparedStatement批量执行sql语句【sql语句相同，值不同】梦见x光 sql 事务批量执行
比如说：我有一个List需要添加到数据库中，那么我该如何通过PreparedStatement来操作呢？ public void addCustomerByCommit(Connection conn , List<Customer> customerList) { String sql = "inseret into customer(id
程序员必知必会----linux常用命令之十【系统相关】 hanqunfeng Linux常用命令
一.linux快捷键 Ctrl+C : 终止当前命令 Ctrl+S : 暂停屏幕输出 Ctrl+Q : 恢复屏幕输出 Ctrl+U : 删除当前行光标前的所有字符 Ctrl+Z : 挂起当前正在执行的进程 Ctrl+L : 清除终端屏幕，相当于clear 二.终端命令 clear : 清除终端屏幕 reset : 重置视窗，当屏幕编码混乱时使用 time com
NGINX IXHONG nginx
pcre 编译安装 nginx conf/vhost/test.conf upstream admin { server 127.0.0.1:8080; } server { listen 80; &
设计模式--工厂模式 kerryg 设计模式
工厂方式模式分为三种： 1、普通工厂模式：建立一个工厂类，对实现了同一个接口的一些类进行实例的创建。 2、多个工厂方法的模式：就是对普通工厂方法模式的改进，在普通工厂方法模式中，如果传递的字符串出错，则不能正确创建对象，而多个工厂方法模式就是提供多个工厂方法，分别创建对象。 3、静态工厂方法模式：就是将上面的多个工厂方法模式里的方法置为静态，
Spring InitializingBean/init-method和DisposableBean/destroy-method mx_xiehd java spring bean xml
1.initializingBean/init-method 实现org.springframework.beans.factory.InitializingBean接口允许一个bean在它的所有必须属性被BeanFactory设置后，来执行初始化的工作，InitialzingBean仅仅指定了一个方法。通常InitializingBean接口的使用是能够被避免的，（不鼓励使用，因为没有必要
解决Centos下vim粘贴内容格式混乱问题 qindongliang1922 centos vim
有时候，我们在向vim打开的一个xml，或者任意文件中，拷贝粘贴的代码时，格式莫名其毛的就混乱了，然后自己一个个再重新，把格式排列好，非常耗时，而且很不爽，那么有没有办法避免呢？答案是肯定的，设置下缩进格式就可以了，非常简单：在用户的根目录下直接vi ~/.vimrc文件然后将set pastetoggle=<F9> 写入这个文件中，保存退出，重新登录，
netty大并发请求问题 tianzhihehe netty
多线程并发使用同一个channel java.nio.BufferOverflowException: null at java.nio.HeapByteBuffer.put(HeapByteBuffer.java:183) ~[na:1.7.0_60-ea] at java.nio.ByteBuffer.put(ByteBuffer.java:832) ~[na:1.7.0_60-ea]
Hadoop NameNode单点问题解决方案之一 AvatarNode wyz2009107220 NameNode
我们遇到的情况 Hadoop NameNode存在单点问题。这个问题会影响分布式平台24*7运行。先说说我们的情况吧。我们的团队负责管理一个1200节点的集群(总大小12PB)，目前是运行版本为Hadoop 0.20，transaction logs写入一个共享的NFS filer(注：NetApp NFS Filer)。经常遇到需要中断服务的问题是给hadoop打补丁。 DataNod