请你来实现一个 atoi 函数,使其能将字符串转换成整数。
首先,该函数会根据需要丢弃无用的开头空格字符,直到寻找到第一个非空格的字符为止。接下来的转化规则如下:
注意:假如该字符串中的第一个非空格字符不是一个有效整数字符、字符串为空或字符串仅包含空白字符时,则你的函数不需要进行转换,即无法进行有效转换。
在任何情况下,若函数不能进行有效的转换时,请返回 0 。
提示:
本题中的空白字符只包括空格字符 ' ' 。
假设我们的环境只能存储 32 位大小的有符号整数,那么其数值范围为 [−231, 231 − 1]。如果数值超过这个范围,请返回 INT_MAX (231 − 1) 或 INT_MIN (−231) 。
示例 1:
输入: "42"
输出: 42
示例 2:
输入: " -42"
输出: -42
解释: 第一个非空白字符为 '-', 它是一个负号。我们尽可能将负号与后面所有连续出现的数字组合起来,最后得到 -42 。
示例 3:
输入: "4193 with words"
输出: 4193
解释: 转换截止于数字 '3' ,因为它的下一个字符不为数字。
示例 4:
输入: "words and 987"
输出: 0
解释: 第一个非空字符是 'w', 但它不是数字或正、负号。因此无法执行有效的转换。
示例 5:
输入: "-91283472332"
输出: -2147483648
解释: 数字 "-91283472332" 超过 32 位有符号整数范围。因此返回 INT_MIN (−231) 。
来源:力扣(LeetCode)
链接:https://leetcode-cn.com/problems/string-to-integer-atoi
首先判断给定字符串的第一个非空格字符是否为'-'、'+'、数字中的一种,如果为正负号则继续判断下一个字符是否为数字,如果不是返回0,如果是则继续判断直至到非数字停止。再将字符串中的数字字符转换为int型数据,返回即可。
public class Solution {
public int myAtoi(String str) {
double num = 0;
for(int i = 0;i < str.length();i++) {
//判断第一个非空格字符是否为数字或者'-'
if (str.charAt(i) != ' ' && ((str.charAt(i) == '-' || str.charAt(i) == '+')|| (str.codePointAt(i) >= 48 && str.codePointAt(i) <= 57))) {
//如果第一个非空格字符是'-'但是'-'后不是数字,直接返回0
if (i 57)) {
num = 0;
break;
}
else if (str.charAt(i) == '-') {
for (int j = i + 1; j < str.length() && (str.codePointAt(j) >= 48 && str.codePointAt(j) <= 57); j++) {
num = (num * 10 + Integer.parseInt(str.substring(j,j+1)));
}
num = (-1) * num;
break;
}else if (i 57)) {
num = 0;
break;
}else if(str.charAt(i) == '+'){
for (int j = i+1;j < str.length() && (str.codePointAt(j) >= 48 && str.codePointAt(j) <= 57) ; j++) {
num = (num * 10 + Integer.parseInt(str.substring(j,j+1)));
}
break;
}else{
for (int j = i;j < str.length() && (str.codePointAt(j) >= 48 && str.codePointAt(j) <= 57) ; j++) {
num = (num * 10 + Integer.parseInt(str.substring(j,j+1)));
}
break;
}
} else if (str.charAt(i) != ' '){
num = 0;
break;
}
}
return (int)num;
}
}
POINT 1:Unicode编码和ASCII码。
计算机发明后,为了在bai计算机中表示字符,人们制定du了一种编码,叫ASCII码。ASCII码由一zhi个字dao节中的7位(bit)表示,范围是0x00 - 0x7F 共128个字符。
后来他们突然发现,如果需要按照表格方式打印这些字符的时候,缺少了“制表符”。于是又扩展了ASCII的定义,使用一个字节的全部8位(bit)来表示字符了,这就叫扩展ASCII码。范围是0x00 - 0xFF 共256个字符。
中国人利用连续2个扩展ASCII码的扩展区域(0xA0以后)来表示一个汉字,该方法的标准叫GB-2312。后来,日文、韩文、阿拉伯文、台湾繁体(BIG-5)......都使用类似的方法扩展了本地字符集的定义,现在统一称为 MBCS 字符集(多字节字符集)。这个方法是有缺陷的,因为各个国家地区定义的字符集有交集,因此使用GB-2312的软件,就不能在BIG-5的环境下运行(显示乱码),反之亦然。
为了把全世界人民所有的所有的文字符号都统一进行编码,于是制定了UNICODE标准字符集。UNICODE 使用2个字节表示一个字符(unsigned shor int、WCHAR、_wchar_t、OLECHAR)。这下终于好啦,全世界任何一个地区的软件,可以不用修改地就能在另一个地区运行了。虽然我用 IE 浏览日本网站,显示出我不认识的日文文字,但至少不会是乱码了。UNICODE 的范围是 0x0000 - 0xFFFF 共6万多个字符,其中光汉字就占用了4万多个。
POINT 2:在字符串中如何判断一个字符是否为数字?
在字符串中,要判断某一个字符是否为数字,直接用该字符跟数字进行比较显然是行不通的。因为,即使该字符是一个数字,但是系统还是会认为它是一个字符,如果直接将字符型数据和整型数据进行比较,系统会用字符型数据的Unicode编码进行比较。因此,在进行比较时我们可以用数字的Unicode编码进行比较。即:判断字符串str中的第i个字符是否为数字时,可以使用if(str.charAt(i)>=47 && str.charAt(i)<=58)即可。
POINT 3:如何将字符串中的一个个字符转换为int型数据?
我们知道Java中Integer.parseInt(String str)方法可以将字符串转换为int型数据,但是在本题中我们不知道该字符串中数字字符的结束位置,因此我们需要边转换边判断。首先,我们可以使用str.subString(j,j+1)方法将字符串str中的第j个数字字符转换为字符站,在使用Integer.parseInt(str.subString(j,j+1))方法将该数字字符转换为int型数据,并且将转换后的int型数据保存在num中,每次只需要给num*10+转换后的int型数据即可得到该字符串的int型数据。
POINT 4:为什么要先将得到的数据存入double类型的num中在强制转换为int型返回?
为了防止在存储过程中,因为数据溢出导致结果出错,可以先将结果存入较大的double类型的变量中,再将double类型强制转换为int型,如果转换过程中超出范围直接返回int型数据的最大\最小值。