leetcode之令人头大的有限状态自动机

传说中的有限状态自动机

今日打卡一题是leetcode 8. 字符串转换整数 (atoi)。但从题目看来,感觉挺简单呀,这不就是语言里面会自带的atoi函数吗?跟传说中编译原理中的自动机有什么关系,做题要不要这么博学。

其实由于将字符串转换成整数的时候限制条件有很多个,流程复杂。所以使用有限状态自动机可以梳理开始和结束,中间各种条件转换和状态变化,进行流程控制,覆盖整个功能。

题目

请你来实现一个 atoi 函数,使其能将字符串转换成整数。

首先,该函数会根据需要丢弃无用的开头空格字符,直到寻找到第一个非空格的字符为止。接下来的转化规则如下:

如果第一个非空字符为正或者负号时,则将该符号与之后面尽可能多的连续数字字符组合起来,形成一个有符号整数。
假如第一个非空字符是数字,则直接将其与之后连续的数字字符组合起来,形成一个整数。
该字符串在有效的整数部分之后也可能会存在多余的字符,那么这些字符可以被忽略,它们对函数不应该造成影响。
注意:假如该字符串中的第一个非空格字符不是一个有效整数字符、字符串为空或字符串仅包含空白字符时,则你的函数不需要进行转换,即无法进行有效转换。

在任何情况下,若函数不能进行有效的转换时,请返回 0 。

提示:

本题中的空白字符只包括空格字符 ' ' 。
假设我们的环境只能存储 32 位大小的有符号整数,那么其数值范围为 [−231,  231 − 1]。
如果数值超过这个范围,请返回  INT_MAX (231 − 1) 或 INT_MIN (−231)

示例 1:

输入: "42"
输出: 42

示例 2:

输入: "   -42"
输出: -42
解释: 第一个非空白字符为 '-', 它是一个负号。
     我们尽可能将负号与后面所有连续出现的数字组合起来,最后得到 -42 。

示例 3:

输入: "4193 with words"
输出: 4193
解释: 转换截止于数字 '3' ,因为它的下一个字符不为数字。

示例 4:

输入: "words and 987"
输出: 0
解释: 第一个非空字符是 'w', 但它不是数字或正、负号。
     因此无法执行有效的转换。

示例 5:

输入: "-91283472332"
输出: -2147483648
解释: 数字 "-91283472332" 超过 32 位有符号整数范围。 
     因此返回 INT_MIN (−231)

来源:力扣(LeetCode)
链接:https://leetcode-cn.com/problems/string-to-integer-atoi
著作权归领扣网络所有。商业转载请联系官方授权,非商业转载请注明出处。

思路:有限状态自动机DFA

leetcode之令人头大的有限状态自动机_第1张图片
图片转自leetcode官方题解。题解的下一句话就是:
接下来编程部分就非常简单了:我们只需要把上面这个状态转换表抄进代码即可。

作者:LeetCode-Solution
链接:https://leetcode-cn.com/problems/string-to-integer-atoi/solution/zi-fu-chuan-zhuan-huan-zheng-shu-atoi-by-leetcode-/
来源:力扣(LeetCode)
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

所以看到这里你懂了吗?我可是一脸问号。这就完了?

结果看了官方实现的代码,这不是跟我自己梳理的差不多吗。所以我们不要畏惧自动机这个概念,而是使用它为我们服务。以下为梳理过程。

1 确定自动机中需要考虑的数据分类
答:数据有4类:数字,正负符号,空格和其他
2 确定自动机中数据的状态
答:自动机最后返回的结果为数字*正负符号,若是遇到其他则返回0,空格不影响结果。
3 确定自动机的开始和结束
答:当遇到数字,或者正负符号的时候,自动机开始。
当数字溢出,或者遇到其他,或者得到最后的结果,自动机结束。
4 确定自动机开始后的流程

 - 遇到数字,[自动机开始],进行计算,[溢出返回或计算结束返回,自动机结束] 
 - 遇到正负符号,[自动机开始],符号保留
 - 遇到不是数字,不是空格的,直接返回0 
 - 自动机开始]的状态下,遇到非数字,[自动机结束]

show me the code -- Golang

时间复杂度:O(n)
空间复杂度:O(1)

func myAtoi(str string) int {
    flag := 1 //正负
    res := 0 //结果
    begin := false //未开始

    for _,v := range str {
        if (v>='0' && v<='9'){
            if res > 214748364 || res == 214748364 && int(v-'0')>7 {
                return 2147483647
            }
            if res < -214748364 || res == -214748364 && int(v-'0')>8 {
                return -2147483648
            }
            res = res*10 + flag*int(v-'0')
            begin = true
        } else {
            if begin {
                break //开始转换后遇到非数字停止
            } else if v == '-' {
                flag = -1
                begin = true
            } else if v == '+' {
                begin = true
            } else if v != ' '{
                return 0 //开始就遇到不是数字不是空格的,直接返回0
            }
        }
    }
    return res
}

总结

  1. 其实代码的实现部分没有抽象一个自动机出来,所以只能说代码实现使用了自动机的思想。具体的抽象自动机的形式推荐查看leetcode官方题解。
  2. 再次被算法在各种高深如编译原理般的领域无处不在而感动。说好的算法只有在面试的时候会用到呢?哈哈,程序员需内外兼修。高手需要知识渊博呦。加油!

你可能感兴趣的:(leetcode,字符串,算法)