题目:输入一个IPv4字符串,如“1.2.3.4”,输出对应的无符号整数,如本例输出为 0x01020304。
来源:某500强企业面试题目
思路:从尾部扫描到头部,一旦发现无法转换,立即返回,减少无谓操作。
#include "stdio.h" #include "stdlib.h" #include "string.h" bool ConvertIPv4ToUInt(const char *strIP, unsigned int *ip) { if (!strIP) { return false; } int Len = strlen(strIP); // min len is 7, e.g. 1.2.3.4; max len is 15, e.g. 123.234.121.254 if ((Len < 7) || (Len > 15)) { return false; } int num[4] = { 0 }; // 4 parts of number int partNum = 0; // 1 part of number int base = 1; // 10^base int dotCount = 0; // dot count // from right to left for (int i = Len - 1; i >= 0; --i) { char ch = strIP[i]; if (ch == '.') { // if the first char of last char is ".", e.g. ".1.2.3.4" or "1.2.", exit if ((i == 0) || (i == Len - 1)){ return false; } dotCount++; // if more than 3 dot found, e.g. "1.2.3.4.5", exit if (dotCount > 3) { return false; } // save partNum to num[] num[dotCount - 1] = partNum; partNum = 0; base = 1; } else if ((ch < '0') || (ch > '9')) { // if illeagal char inside, exit return false; } else { // handle digit char partNum += (ch - '0') * base; base *= 10; if (partNum > 255) { return false; } // handle first part num if (i == 0) { // if count of "." is not enough, exit if (dotCount != 3) { return false; } num[dotCount] = partNum; } } } // output ip *ip = 0; for (int i = 0; i < 4; ++i) { *ip += num[i] << (i * 8); } return true; } int main(int argc, char* argv[]) { char* strIP[] = { "1", "1.2", "1.2.3", "111.222.113", "1.2.3.", ".1.2.3", "256.1.2.3", "1.2.3.4", "1.2.3.4.5", "12.234.45.6", "12.2345.45.6", "1.a.2.3", "1.2.3.4 ", "1.2. 3.4", "1,2,3,4", }; for (int i = 0; i < sizeof(strIP) / sizeof(char *); ++i){ unsigned int ip = 0; if (ConvertIPv4ToUInt(strIP[i], &ip)){ printf("%s -> %08X ", strIP[i], ip); } else { printf("%s is not valid ", strIP[i]); } } getchar(); return 0; }
输出结果为:
1 is not valid 1.2 is not valid 1.2.3 is not valid 111.222.113 is not valid 1.2.3. is not valid .1.2.3 is not valid 256.1.2.3 is not valid 1.2.3.4 -> 01020304 1.2.3.4.5 is not valid 12.234.45.6 -> 0CEA2D06 12.2345.45.6 is not valid 1.a.2.3 is not valid 1.2.3.4 is not valid 1.2. 3.4 is not valid 1,2,3,4 is not valid
从工程化角度考虑,有几点需要注意:
1、输入的字符串是否有效?
不但要判断输入字符串是否为空,还要在处理过程中随时检查中间结果值,快速返回。
需要考虑“.”的非法位置,如开头和结尾不能有“.”。
需要考虑某段数字过长(超过255)。
需要考虑“.”的个数,必须有且只有3个。
2、快速识别错误并退出
发现有问题就快速退出,不需要进行无谓的多余计算。
3、考虑到转换失败的情况,所以返回值设定为bool,通过参数指针来返回转换结果。
如果设定UInt为返回值,则无法通过返回值判断转换是否成功。
需要的话,可以将bool的返回值改为enum,从而返回各种错误类型供调用者使用。
从编程角度考虑,有几点需要注意:
1、从后向前扫描字符串时,需要注意处理顺序。
先判断字符是否为“.”,然后判断是否为非数字,剩下的就是数字了。
这样的顺序逻辑清晰,便于在发现问题时快速退出。
2、对于类似问题,可以将测试集先列出来,写代码时候就可以有的放矢的进行容错处理了。