面试题4:替换空格
题目:请实现一个函数,把字符串中的每个空格替换成"%20",例如输入"We are happy.",则输出"we%20are%20happy"。
在网络编程中,如果URL参数中含有特殊字符,如空格、#等,可能导致服务器端无法获得正确的参数值。我们需要将这些特殊符号转换成服务器可以识别的字符。转换的规则是在%后面跟上ASCI1码的两位十六进制的表示。比如空格的ASCI码是32,即十六进制的0x20,因此空格被替换成"%20",再比如"的ASCI码为35,即十六进制的0x23,它在URL中被替换为"%23"。
看到这个题目,我们首先应该想到的是原来一个空格字符,替换之后变成’%’、'2’和’0’这3个字符,因此字符串会变长。如果是在原来的字符串上做替换,那么就有可能覆盖修改在该字符串后面的内存。如果是创建新的字符串并在新的字符串上做替换,那么我们可以自己分配足够多的内存。由于有两种不同的解决方案,我们应该向面试官问清楚,让他明确告诉我们他的需求。假设面试官让我们在原来的字符串上做替换,并且保证输入的字符串后面有足够多的空余内存。
*时间复杂度为O(n2)的解法,不足以拿到Offer
现在我们考虑怎么做替换操作。最直观的做法是从头到尾扫描字符串,每一次碰到空格字符的时候做替换。由于是把1个字符替换成3个字符,我们必须要把空格后面所有的字符都后移两个字节,否则就有两个字符被覆盖了。
举个例子,我们从头到尾把"We are happy."中的每一个空格替换成 “%20”。为了形象起见,我们可以用一个表格来表示字符串,表格中的每个格子表示一个字符。
注: (a)字符串 “We are happy”. (b)把字符串中的第一个空格替换成 “%20”。灰色背景表示需要移动的字符。©把字符串中的第二个空格替换成 ‘%20’。浅灰色背景表示需要移动一次的字符,深灰色背景表示需要移动两次的字符。
我们替换第一个空格,这个字符串变成图(b)中的内容,表格中灰色背景的格子表示需要做移动的区域。接着我们替换第二个空格,替换之后的内容如图©所示。同时,我们注意到用深灰色背景标注的"happy"部分被移动了两次。
假设字符串的长度是n。对每个空格字符,需要移动后面0(n)个字符,因此对含有O(n)个空格字符的字符串而言总的时间效率是O(n2)
当我们把这种思路阐述给面试官后,他不会就此满意,他将让我们寻找更快的方法。在前面的分析中,我们发现数组中很多字符都移动了很多次,能不能减少移动次数呢?答案是肯定的。我们换一种思路,把从前向后替换改成从后向前替换。
*时间复杂度为O(n)的解法,搞定Offer就靠它了
我们可以先遍历一次字符串,这样就能统计出字符串中空格的总数,并可以由此计算出替换之后的字符串的总长度。每替换一个空格,长度增加2,因此替换以后字符串的长度等于原来的长度加上2乘以空格数目。我们还是以前面的字符串"We are happy."为例, "We are happy."这个字符串的长度是14 (包括结尾符号n0’),里面有两个空格,因此替换之后字符串的长度是18。
我们从字符串的后面开始复制和替换。首先准备两个指针, P1和P2。P1指向原始字符串的末尾,而P2指向替换之后的字符串的末尾(如图(a)所示)。接下来我们向前移动指针P1,逐个把它指向的字符复制到P2旨向的位置,直到碰到第一个空格为止。此时字符串包含如图(b)所示,灰色背景的区域是做了字符拷贝(移动)的区域。碰到第一个空格之后,把 P1向前移动1格,在P2之前插入字符串"%20"。由于"%20"的长度为3,同时也要把P2向前移动3格如图©所示。
我们接着向前复制,直到碰到第二个空格(如图(d)所示)。和上一次一样,我们再把P1向前移动1格,并把P2向前移动3格插入"%20" (如图(e)所示)。此时P1和P2指向同一位置,表明所有空格都已经替换完毕。
从上面的分析我们可以看出,所有的字符都只复制(移动)一次,因此这个算法的时间效率是0(n),比第一个思路要快。
注:图中带有阴影的区域表示被移动的字符。(a)把第一个指针指向字符串的末尾,把第二个指针指向替换之后的字符串的末尾。(b)依次复制字符串的内容,直至第一个指针碰到第一个空格。©把第一个空格替换成 ‘%20’,把第一个指针向前移动1格,把第二个指针向前移动3格。(d)依次向前复制字符串中的字符,直至碰到空格。(e)替换字符串中的倒数第二个空格,把第一个指针向前移动1格,把第二个指针向前移动3格。
在面试的过程中,我们也可以和前面的分析一样画一两个示意图解释自己的思路,这样既能帮助我们理清思路,也能使我们和面试官的交流变得更加高效。在面试官肯定我们的思路之后,就可以开始写代码了。下面是参考代码
void ReplaceBlank(char str[], int length)
{
if (str == NULL && length <= 0)
return;
int count = 0; //单词的数量
int Blank = 0; //空格的个数
int i = 0;
while (str[i] != ' ') //统计字符与空格的长度
{
++count;
if (str[i] == ' ') ++Blank;
++i;
}
int newLength = count + Blank * 2;
if (newLength > length) return;
int left = count; //指向原字符串尾部
int right = newLength; //指向新字符串尾部
while (left >= 0 && right > left)
{
if (str[left] == ' ')
{
str[right--] = '0';
str[right--] = '2';
str[right--] = '%';
}
else
{
str[right--] = str[left];
}
--left;
}
}
测试用例:
- 输入的字符串中包含空格(空格位于字符串的最前面,空格位于字符串的最后面,空格位于字符串的中间,字符串中有连续多个空格)。
- 输入的字符串中没有空格。
- 特殊输入测试(字符串是个NULL指针、字符串是个空字符串、字符串只有一个空格字符、字符串中只有连续多个空格)。
本题考点:
- 考查对字符串的编程能力。
- 考查分析时间效率的能力。我们要能清晰地分析出两种不同方法的时i效&&是多少。
- 考查对内存覆盖是否有高度的警惕。在分析得知字符串会变长之后,我们能够意识到潜在的问题,并主动和面试官沟通以寻找问题的解决方案。
- 考查思维能力。在从前到后替换的思路被面试官否定之后,我们能迅速想到从后往前替换的方法,这是解决此题的关键。
相关题目:
有两个排序的数组A1和A2,内存在A1的末尾有足够多的空余空间容纳A2,请实现一个函数,把A2中的所有数字插入到A1中并且所有的数字是排序的。
从后往前插入和前面的例题一样,很多人首先想到的办法是在Al中从头到尾复制数字,但这样就会出现多次复制一个数字的情况。更好的办法是从尾到头比较A1和A2中的数字,并把较大的数字复制到A1的合适位置。
测试:
void ReplaceBlank(char str[], int length)
{
if (str == NULL || length <= 0)
return;
int count = 0; //单词的数量
int Blank = 0; //空格的个数
int i = 0;
while (str[i] != ' ') //统计字符与空格的长度
{
++count;
if (str[i] == ' ') ++Blank;
++i;
}
int newLength = count + Blank * 2;
if (newLength > length) return;
int left = count; //指向原字符串尾部
int right = newLength; //指向新字符串尾部
while (left >= 0 && right > left)
{
if (str[left] == ' ')
{
str[right--] = '0';
str[right--] = '2';
str[right--] = '%';
}
else
{
str[right--] = str[left];
}
--left;
}
}
int main()
{
/* 数组需预留空间 */
char str[100] = "helloworld";
/* 空格位于字符串的最前面 */
char str1[100] = " helloworld";
/* 空格位于字符串的最后面 */
char str2[100] = "helloworld ";
/* 空格位于字符串的中间 */
char str3[100] = "hello world";
/* 空格位于字符串的中间 */
char str4[100] = "hello world";
/* 特殊输入测试*/
char *strs = NULL;
char strs1[100] = "";
char strs2[100] = " ";
ReplaceBlank(str, sizeof(str) / sizeof(char));
std::cout << "str=" << str << std::endl;
ReplaceBlank(str1, sizeof(str1) / sizeof(char));
std::cout << "str1=" << str1 << std::endl;
ReplaceBlank(str2, sizeof(str2) / sizeof(char));
std::cout << "str2=" << str2 << std::endl;
ReplaceBlank(str3, sizeof(str3) / sizeof(char));
std::cout << "str3=" << str3 << std::endl;
ReplaceBlank(str4, sizeof(str4) / sizeof(char));
std::cout << "str4=" << str4 << std::endl;
ReplaceBlank(strs, sizeof(strs) / sizeof(char));
if(strs != NULL) std::cout << "strs=" << strs << std::endl;
else std::cout << " " << std::endl;
ReplaceBlank(strs1, sizeof(strs1) / sizeof(char));
std::cout << "strs1=" << strs1 << std::endl;
ReplaceBlank(strs2, sizeof(strs2) / sizeof(char));
std::cout << "strs2=" << strs2 << std::endl;
return 0;
}
测试结果:
注意:其中char *strs = NULL;
这句语句strs
指向NULL
了,所以在输出strs的值时要进行判断,if(strs != NULL)
成立再输出结果,否则直接将strs
输出将会发生内存读取的错误。
另外,本例中函数返回值用的void
,可以修改函数返回值为bool
类型,这样在输出的时候可以直接判断ReplaceBlank()
的返回结果,考虑是否进行相应的操作。