作者:翟天保Steven
版权声明:著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处

写一个函数 StrToInt,实现把字符串转换成整数这个功能。不能使用 atoi 或者其他类似的库函数。传入的字符串可能有以下部分组成:
1.若干空格
2.(可选)一个符号字符('+' 或 '-')
3. 数字,字母,符号,空格组成的字符串表达式
4. 若干空格
转换算法如下:
1.去掉无用的前导空格
2.第一个非空字符为+或者-号时,作为该整数的正负号,如果没有符号,默认为正数
3.判断整数的有效部分:
3.1 确定符号位之后,与之后面尽可能多的连续数字组合起来成为有效整数数字,如果没有有效的整数部分,那么直接返回0
3.2 将字符串前面的整数部分取出,后面可能会存在存在多余的字符(字母,符号,空格等),这些字符可以被忽略,它们对于函数不应该造成影响
3.3 整数超过 32 位有符号整数范围 [−231, 231 − 1] ,需要截断这个整数,使其保持在这个范围内。具体来说,小于 −231的整数应该被调整为 −231 ,大于 231 − 1 的整数应该被调整为 231 − 1
4.去掉无用的后导空格
数据范围:
1.0 <=字符串长度<= 100
2.字符串由英文字母(大写和小写)、数字(0-9)、' '、'+'、'-' 和 '.' 组成
输入:
"4396 clearlove"
返回值:
4396
说明:
6后面的字符不属于有效的整数部分,去除,但是返回前面提取的有效部分
本题考察算法场景模拟。两种解题思路。
1)遍历法
首先过滤前置空格;再判断正负号;之后判断连续数字,过程中注意正负极限判断;每找到一个新数字,就把之前的数字*10再累加上去,遍历完即可得到答案。复杂度O(n)。
2)状态机
基于状态转移矩阵对字符串遍历过程的状态进行分析。
状态分为4种,空格、符号、数字和无效,对应0123,根据题目条件设立矩阵如下:

总的来说,状态机就是基于题目要求,将可能发生的情形和状态的转变,以矩阵形式表示,进而解题。复杂度O(n)。
1)遍历法
- #include <climits>
- class Solution {
- public:
- // 字符串转为整数
- int StrToInt(string s) {
- int sign = 1;
- int idx = 0;
- int size = int(s.size());
- // 前空格过滤,过滤完如果没有后续则退出
- while(idx < size){
- if(s[idx] == ' ')
- idx++;
- else
- break;
- }
- if(idx == size)
- return 0;
- // 判断符号,如果没有后续则退出
- if(s[idx] == '+')
- idx++;
- else if(s[idx] == '-'){
- idx++;
- sign = -1;
- }
- if(idx == size)
- return 0;
- // 继续遍历寻找目标数字
- int result = 0;
- while(idx < size){
- // 遇到非数字退出
- if(s[idx] < '0' || s[idx] > '9')
- break;
- // 判断极限
- if(result > INT_MAX / 10 || (result == INT_MAX / 10 && (s[idx] - '0') >= (INT_MAX % 10)))
- return INT_MAX;
- if(result < INT_MIN / 10 || (result == INT_MIN / 10 && (s[idx] - '0') >= -(INT_MIN % 10)))
- return INT_MIN;
- // 字符转为数字
- result = result * 10 + sign * (s[idx] - '0');
- idx++;
- }
- return result;
- }
- };
2)状态机
- class Solution {
- public:
- // 字符串转为整数
- int StrToInt(string s) {
- // 状态转移矩阵
- vector<vector<int>> states = {
- {0,1,2,3},
- {3,3,2,3},
- {3,3,2,3},
- };
- // 定义
- long result = 0;
- long top = INT_MAX;
- long bottom = INT_MIN;
- int sign = 1;
- int size = int(s.length());
- // 状态从0开始
- int state = 0;
- for(int i = 0; i < size; ++i){
- // 空格
- if(s[i] == ' '){
- state = states[state][0];
- }
- // 正负号
- else if(s[i] == '-' || s[i] == '+'){
- state = states[state][1];
- if(state == 1){
- sign = (s[i] == '-') ? -1 : 1;
- }
- }
- // 数字
- else if(s[i] >= '0' && s[i] <= '9'){
- state = states[state][2];
- }
- // 非法字符
- else{
- state = states[state][3];
- }
- // 状态为2时,表明在连续数字状态,进行数字累加
- if(state == 2){
- // 数字相加
- result = result * 10 + s[i] - '0';
- // 越界处理
- result = (sign == 1) ? min(result, top) : min(result, -bottom);
- }
- // 状态为3时,说明后续无效,退出即可
- else if(state == 3)
- break;
- }
- return (int)sign * result;
- }
- };