[笔记]一道C语言面试题:IPv4字符串转为UInt整数

题目:输入一个IPv4字符串,如“1.2.3.4”,输出对应的无符号整数,如本例输出为 0x01020304。

来源:某500强企业面试题目

思路:从尾部扫描到头部,一旦发现无法转换,立即返回,减少无谓操作。

#include "stdio.h"

#include "stdlib.h"

#include "string.h"



bool ConvertIPv4ToUInt(const char *strIP, unsigned int *ip)

{

    if (!strIP) {

        return false;

    }



    int Len = strlen(strIP);



    // min len is 7, e.g. 1.2.3.4; max len is 15, e.g. 123.234.121.254

    if ((Len < 7) || (Len > 15)) {

        return false;

    }



    int num[4] = { 0 };     // 4 parts of number

    int partNum = 0;        // 1 part of number 

    int base = 1;           // 10^base

    int dotCount = 0;       // dot count



    // from right to left

    for (int i = Len - 1; i >= 0; --i) {

        char ch = strIP[i];

        if (ch == '.') {

            // if the first char of last char is ".", e.g. ".1.2.3.4" or "1.2.", exit

            if ((i == 0) || (i == Len - 1)){

                return false;

            }

            dotCount++;



            // if more than 3 dot found, e.g. "1.2.3.4.5", exit

            if (dotCount > 3) {

                return false;

            }



            // save partNum to num[]

            num[dotCount - 1] = partNum;

            partNum = 0;

            base = 1;

        }

        else if ((ch < '0') || (ch > '9')) {

            // if illeagal char inside, exit

            return false;

        }

        else {

            // handle digit char

            partNum += (ch - '0') * base;

            base *= 10;



            if (partNum > 255) {

                return false;

            }



            // handle first part num

            if (i == 0) {

                // if count of "." is not enough, exit

                if (dotCount != 3) {

                    return false;

                }

                num[dotCount] = partNum;

            }

        }

    }



    // output ip

    *ip = 0;

    for (int i = 0; i < 4; ++i) {

        *ip += num[i] << (i * 8);

    }



    return true;

}



int main(int argc, char* argv[])

{

    char* strIP[] = {

        "1",

        "1.2",

        "1.2.3",

        "111.222.113", 

        "1.2.3.",

        ".1.2.3",

        "256.1.2.3",

        "1.2.3.4",

        "1.2.3.4.5",

        "12.234.45.6",

        "12.2345.45.6",

        "1.a.2.3",

        "1.2.3.4 ",

        "1.2. 3.4",

        "1,2,3,4",

    };



    for (int i = 0; i < sizeof(strIP) / sizeof(char *); ++i){

        unsigned int ip = 0;

        if (ConvertIPv4ToUInt(strIP[i], &ip)){

            printf("%s -> %08X\n", strIP[i], ip);

        }

        else {

            printf("%s is not valid\n", strIP[i]);

        }

    }



    getchar();

    return 0;

}

输出结果为:

1 is not valid

1.2 is not valid

1.2.3 is not valid

111.222.113 is not valid

1.2.3. is not valid

.1.2.3 is not valid

256.1.2.3 is not valid

1.2.3.4 -> 01020304

1.2.3.4.5 is not valid

12.234.45.6 -> 0CEA2D06

12.2345.45.6 is not valid

1.a.2.3 is not valid

1.2.3.4  is not valid

1.2. 3.4 is not valid

1,2,3,4 is not valid

 

从工程化角度考虑,有几点需要注意:

1、输入的字符串是否有效?
    不但要判断输入字符串是否为空,还要在处理过程中随时检查中间结果值,快速返回。
    需要考虑“.”的非法位置,如开头和结尾不能有“.”。
    需要考虑某段数字过长(超过255)。
    需要考虑“.”的个数,必须有且只有3个。

2、快速识别错误并退出
    发现有问题就快速退出,不需要进行无谓的多余计算。

3、考虑到转换失败的情况,所以返回值设定为bool,通过参数指针来返回转换结果。
    如果设定UInt为返回值,则无法通过返回值判断转换是否成功。
    需要的话,可以将bool的返回值改为enum,从而返回各种错误类型供调用者使用。

 

从编程角度考虑,有几点需要注意:

1、从后向前扫描字符串时,需要注意处理顺序
    先判断字符是否为“.”,然后判断是否为非数字,剩下的就是数字了。
    这样的顺序逻辑清晰,便于在发现问题时快速退出。

2、对于类似问题,可以将测试集先列出来,写代码时候就可以有的放矢的进行容错处理了。

 

你可能感兴趣的:(ipv4)