LeetCode 字符串转换整数 (atoi)

字符串转换整数 (atoi)


题目来源:https://leetcode-cn.com/problems/string-to-integer-atoi

题目


实现一个 atoi 函数,使其能将字符串转换成整数。

首先,该函数会根据需要丢弃无用的开头空格字符,直到寻找到第一个非空格的字符为止。

当我们寻找到的第一个非空字符为正或者负号时,则将该符号与之后面尽可能多的连续数字组合起来,作为该整数的正负号;假如第一个非空字符是数字,则直接将其与之后连续的数字字符组合起来,形成整数。

该字符串除了有效的整数部分之后也可能会存在多余的字符,这些字符可以被忽略,它们对于函数不应该造成影响。

注意:假如该字符串中的第一个非空格字符不是一个有效整数字符、字符串为空或字符串仅包含空白字符时,则你的函数不需要进行转换。

在任何情况下,若函数不能进行有效的转换时,请返回 0。

说明:

假设我们的环境只能存储 32 位大小的有符号整数,那么其数值范围为 [−231, 231 − 1]。如果数值超过这个范围,请返回 INT_MAX (231 − 1) 或 INT_MIN (−231) 。

示例 1:

输入: "42"
输出: 42

示例 2:

输入: "   -42"
输出: -42
解释: 第一个非空白字符为 '-', 它是一个负号。
     我们尽可能将负号与后面所有连续出现的数字组合起来,最后得到 -42 。

示例 3:

输入: "4193 with words"
输出: 4193
解释: 转换截止于数字 '3' ,因为它的下一个字符不为数字。

示例 4:

输入: "words and 987"
输出: 0
解释: 第一个非空字符是 'w', 但它不是数字或正、负号。
     因此无法执行有效的转换。

示例 5:

输入: "-91283472332"
输出: -2147483648
解释: 数字 "-91283472332" 超过 32 位有符号整数范围。 
     因此返回 INT_MIN (−231) 。

解题思路


  1. 首先去除前面的空格(这里不用 lstrip() 函数,避免产生新的变量,直接定位不为空格的字符索引);
  2. 定位不为空格的索引后,从此处开始判断第一个字符为 +- 的情况。定义 sign,初始化为 1 表示正数,若是遇到 - 则修改为 -1,表示负数
  3. 判断是否为数字,直接用 ASCII 码数值进行比较;
  4. +- 字符的情况下,判断第一个字符不为数字直接跳出循环;
  5. 判断数值是否会越界,若是越界,则跳出循环。

其中越界这部分的内容可以参考下面的文章:

Python 整数反转

上面的文章中大致提及了越界的情况,这里的处理大同小异。只是这里遍历的字符不同于负数取模,处理最小值边界的情况下要注意。

代码实现


class Solution:
    def myAtoi(self, str: str) -> int:
        # max_value_div_10 = (1<<31) // 10
        # min_value_div_10 = -(-((1<<31)-1) // -10)
        INT_MAX = (1<<31) - 1
        INT_MIN = -(1<<31)

        str_len = len(str)
        # 去除空格,这里不使用 lstrip() 避免产生新的遍历
        # 直接定位不为空格的字符索引
        index = 0
        while index < str_len:
            if str[index] != ' ':
                break
            index += 1

        # 如果索引值就等于字符长度,直接返回 0
        if index == str_len:
            return 0

        # 判断取出空格后首位字符,判断合法,记录正负
        sign = 1
        first_chr = str[index]
        if first_chr == '+':
            index += 1
            sign = 1
        elif first_chr == '-':
            index += 1
            sign = -1

        res = 0

        while index < str_len:
            cur_chr = str[index]

            if cur_chr > '9' or cur_chr < '0':
                break
            
            cur_chr = int(cur_chr)
            # 判断是否越界
            if res > INT_MAX // 10 or (res == INT_MAX // 10 and cur_chr > 7):
                return INT_MAX
            # 这里处理边界有些不同,与上面提及的文章比较,需要注意
            if res < -(INT_MIN // -10) or (res == -(INT_MIN // -10) and cur_chr > 8):
                return INT_MIN
            

            # 每一步都把符号位乘进去
            res = res * 10 + sign * cur_chr
            index += 1
        

        return res

实现结果


扩展部分


这里提及一个比较骚的解法。除了导入必要库,使用正则表达式一行代码就解决了该问题。来源出自下面这位作者的题解:

https://leetcode-cn.com/problems/string-to-integer-atoi/solution/python-1xing-zheng-ze-biao-da-shi-by-knifezhu/

大致是这样的:

class Solution:
    def myAtoi(self, s: str) -> int:
        import re
        return max(min(int(*re.findall('^[\+\-]?\d+', s.lstrip())), 2**31 - 1), -2**31)

这里 max(min(数字,2**31 - 1), -2**31) 处理边界问题,re.findall() 这里找的就是符合条件的部分,* 星号表达式在这里表示解包。

虽然这样的解法非常骚气,也建议思考背后实现的原理。


以上就是本篇的主要内容

欢迎关注微信公众号《书所集录》

你可能感兴趣的:(python)