字符串转换整数 (atoi)
题目来源:https://leetcode-cn.com/problems/string-to-integer-atoi
题目
实现一个 atoi 函数,使其能将字符串转换成整数。
首先,该函数会根据需要丢弃无用的开头空格字符,直到寻找到第一个非空格的字符为止。
当我们寻找到的第一个非空字符为正或者负号时,则将该符号与之后面尽可能多的连续数字组合起来,作为该整数的正负号;假如第一个非空字符是数字,则直接将其与之后连续的数字字符组合起来,形成整数。
该字符串除了有效的整数部分之后也可能会存在多余的字符,这些字符可以被忽略,它们对于函数不应该造成影响。
注意:假如该字符串中的第一个非空格字符不是一个有效整数字符、字符串为空或字符串仅包含空白字符时,则你的函数不需要进行转换。
在任何情况下,若函数不能进行有效的转换时,请返回 0。
说明:
假设我们的环境只能存储 32 位大小的有符号整数,那么其数值范围为 [−231, 231 − 1]。如果数值超过这个范围,请返回 INT_MAX (231 − 1) 或 INT_MIN (−231) 。
示例 1:
输入: "42"
输出: 42
示例 2:
输入: " -42"
输出: -42
解释: 第一个非空白字符为 '-', 它是一个负号。
我们尽可能将负号与后面所有连续出现的数字组合起来,最后得到 -42 。
示例 3:
输入: "4193 with words"
输出: 4193
解释: 转换截止于数字 '3' ,因为它的下一个字符不为数字。
示例 4:
输入: "words and 987"
输出: 0
解释: 第一个非空字符是 'w', 但它不是数字或正、负号。
因此无法执行有效的转换。
示例 5:
输入: "-91283472332"
输出: -2147483648
解释: 数字 "-91283472332" 超过 32 位有符号整数范围。
因此返回 INT_MIN (−231) 。
解题思路
- 首先去除前面的空格(这里不用 lstrip() 函数,避免产生新的变量,直接定位不为空格的字符索引);
- 定位不为空格的索引后,从此处开始判断第一个字符为
+
和-
的情况。定义sign
,初始化为1
表示正数,若是遇到-
则修改为-1
,表示负数 - 判断是否为数字,直接用 ASCII 码数值进行比较;
- 无
+
和-
字符的情况下,判断第一个字符不为数字直接跳出循环; - 判断数值是否会越界,若是越界,则跳出循环。
其中越界这部分的内容可以参考下面的文章:
上面的文章中大致提及了越界的情况,这里的处理大同小异。只是这里遍历的字符不同于负数取模,处理最小值边界的情况下要注意。
代码实现
class Solution:
def myAtoi(self, str: str) -> int:
# max_value_div_10 = (1<<31) // 10
# min_value_div_10 = -(-((1<<31)-1) // -10)
INT_MAX = (1<<31) - 1
INT_MIN = -(1<<31)
str_len = len(str)
# 去除空格,这里不使用 lstrip() 避免产生新的遍历
# 直接定位不为空格的字符索引
index = 0
while index < str_len:
if str[index] != ' ':
break
index += 1
# 如果索引值就等于字符长度,直接返回 0
if index == str_len:
return 0
# 判断取出空格后首位字符,判断合法,记录正负
sign = 1
first_chr = str[index]
if first_chr == '+':
index += 1
sign = 1
elif first_chr == '-':
index += 1
sign = -1
res = 0
while index < str_len:
cur_chr = str[index]
if cur_chr > '9' or cur_chr < '0':
break
cur_chr = int(cur_chr)
# 判断是否越界
if res > INT_MAX // 10 or (res == INT_MAX // 10 and cur_chr > 7):
return INT_MAX
# 这里处理边界有些不同,与上面提及的文章比较,需要注意
if res < -(INT_MIN // -10) or (res == -(INT_MIN // -10) and cur_chr > 8):
return INT_MIN
# 每一步都把符号位乘进去
res = res * 10 + sign * cur_chr
index += 1
return res
实现结果
扩展部分
这里提及一个比较骚的解法。除了导入必要库,使用正则表达式一行代码就解决了该问题。来源出自下面这位作者的题解:
大致是这样的:
class Solution:
def myAtoi(self, s: str) -> int:
import re
return max(min(int(*re.findall('^[\+\-]?\d+', s.lstrip())), 2**31 - 1), -2**31)
这里 max(min(数字,2**31 - 1
), -2**31
) 处理边界问题,re.findall() 这里找的就是符合条件的部分,*
星号表达式在这里表示解包。
虽然这样的解法非常骚气,也建议思考背后实现的原理。
以上就是本篇的主要内容
欢迎关注微信公众号《书所集录》