• std::stringstream(1)


     在编写应用程序时,我们经常要使用到字符串。C++标准库中的<string>和<sstream>为我们操作字符串提供了很多的方便,例如:对象封装、安全和自动的类型转换、直接拼接、不必担心越界等等。但今天我们并不想长篇累牍得去介绍这几个标准库提供的功能,而是分享一下stringstream.str()的一个有趣的现象。我们先来看一个例子:
         1  #include <string>
         2  #include <sstream>
         3  #include <iostream>
         4  
         5  using namespace std;
         6  
         7  int main()
         8  {
         9      stringstream ss("012345678901234567890123456789012345678901234567890123456789");
        10      stringstream t_ss("abcdefghijklmnopqrstuvwxyz");
        11      string str1(ss.str());
        12  
        13      const char* cstr1 = str1.c_str();
        14      const char* cstr2 = ss.str().c_str();
        15      const char* cstr3 = ss.str().c_str();
        16      const char* cstr4 = ss.str().c_str();
        17      const char* t_cstr = t_ss.str().c_str(); 
        18  
        19      cout << "------ The results ----------" << endl
        20           << "cstr1:	" << cstr1 << endl 
        21           << "cstr2:	" << cstr2 << endl
        22           << "cstr3:	" << cstr3 << endl
        23           << "cstr4:	" << cstr4 << endl
        24           << "t_cstr:	" << t_cstr << endl
        25           << "-----------------------------"  << endl;
        26  
        27      return 0;
        28  }
           在看这段代码的输出结果之前,先问大家一个问题,这里cstr1、cstr2、cstr3和cstr4 打印出来结果是一样的么?(相信读者心里会想:结果肯定不一样的嘛,否则不用在这里“故弄玄虚”了。哈哈)
     
           接下来,我们来看一下这段代码的输出结果:
        
            ------ The results ----------
            cstr1:  012345678901234567890123456789012345678901234567890123456789
            cstr2:  012345678901234567890123456789012345678901234567890123456789
            cstr3:  abcdefghijklmnopqrstuvwxyz
            cstr4:  abcdefghijklmnopqrstuvwxyz
            t_cstr: abcdefghijklmnopqrstuvwxyz
            -----------------------------
        
            这里,我们惊奇地发现cstr3和cstr4竟然不是ss所表示的数字字符串,而是t_ss所表示的字母字符串,这也太诡异了吧,但我们相信“真相只有一个”。下面我们通过再加几行代码来看看,为什么会出现这个“诡异”的现象。
        
         1  #include <string>
         2  #include <sstream>
         3  #include <iostream>
         4  
         5  using namespace std;
         6  
         7  #define PRINT_CSTR(no) printf("cstr" #no " addr:	%p
    ",cstr##no)
         8  #define PRINT_T_CSTR(no) printf("t_cstr" #no " addr:	%p
    ",t_cstr##no)
         9  
        10  int main()
        11  {
        12      stringstream ss("012345678901234567890123456789012345678901234567890123456789");
        13      stringstream t_ss("abcdefghijklmnopqrstuvwxyz");
        14      string str1(ss.str());
        15  
        16      const char* cstr1 = str1.c_str();
        17      const char* cstr2 = ss.str().c_str();
        18      const char* cstr3 = ss.str().c_str();
        19      const char* cstr4 = ss.str().c_str();
        20      const char* t_cstr = t_ss.str().c_str(); 
        21  
        22      cout << "------ The results ----------" << endl
        23           << "cstr1:	" << cstr1 << endl 
        24           << "cstr2:	" << cstr2 << endl
        25           << "cstr3:	" << cstr3 << endl
        26           << "cstr4:	" << cstr4 << endl
        27           << "t_cstr:	" << t_cstr << endl
        28           << "-----------------------------"  << endl;
        29      printf("
    ------ Char pointers ----------
    ");
        30      PRINT_CSTR(1);
        31      PRINT_CSTR(2);
        32      PRINT_CSTR(3);
        33      PRINT_CSTR(4);
        34      PRINT_T_CSTR();
        35  
        36      return 0;
        37  }
        
           在上述代码中,我们把那几个字符串对应的地址打印出来,其输出结果为:
        
            ------ The results ----------
            cstr1:  012345678901234567890123456789012345678901234567890123456789
            cstr2:  012345678901234567890123456789012345678901234567890123456789
            cstr3:  abcdefghijklmnopqrstuvwxyz
            cstr4:  abcdefghijklmnopqrstuvwxyz
            t_cstr: abcdefghijklmnopqrstuvwxyz
            -----------------------------
    
            ------ Char pointers ----------
            cstr1 addr:     0x100200e4
            cstr2 addr:     0x10020134
            cstr3 addr:     0x10020014
            cstr4 addr:     0x10020014
            t_cstr addr:    0x10020014
        
           从上面的输出,我们发现cstr3和cstr4字串符的地址跟t_cstr是一样,因此,cstr3、cstr4和t_cstr的打印结果是一样的。按照我们通常的理解,当第17-19行调用ss.str()时,将会产生三个string对象,其对应的字符串也将会是不同的地址。
        
           而打印的结果告诉我们,真实情况不是这样的。其实,streamstring在调用str()时,会返回临时的string对象。而因为是临时的对象,所以它在整个表达式结束后将会被析构。由于紧接着调用的c_str()函数将得到的是这些临时string对象对应的C string,而它们在这个表达式结束后是不被引用的,进而这块内存将被回收而可能被别的内容所覆盖,因此我们将无法得到我们想要的结果。虽然有些情况下,这块内存并没有被别的内容所覆盖,于是我们仍然能够读到我们期望的字符串,(这点在这个例子中,可以通过将第20行删除来体现)。但我们要强调的是,这种行为的正确性将是不被保证的。
        
           通过上述分析,我们将代码修改如下:
        
         1  #include <string>
         2  #include <sstream>
         3  #include <iostream>
         4  
         5  using namespace std;
         6  
         7  #define PRINT_CSTR(no) printf("cstr" #no " addr:	%p
    ",cstr##no)
         8  #define PRINT_T_CSTR(no) printf("t_cstr" #no " addr:	%p
    ",t_cstr##no)
         9  
        10  int main()
        11  {
        12      stringstream ss("012345678901234567890123456789012345678901234567890123456789");
        13      stringstream t_ss("abcdefghijklmnopqrstuvwxyz");
        14      string str1(ss.str());
        15  
        16      const char* cstr1 = str1.c_str();
        17      const string& str2 = ss.str();
        18      const char* cstr2 = str2.c_str();
        19      const string& str3 = ss.str();
        20      const char* cstr3 = str3.c_str();
        21      const string& str4 = ss.str();
        22      const char* cstr4 = str4.c_str();
        23      const char* t_cstr = t_ss.str().c_str(); 
        24  
        25      cout << "------ The results ----------" << endl
        26           << "cstr1:	" << cstr1 << endl 
        27           << "cstr2:	" << cstr2 << endl
        28           << "cstr3:	" << cstr3 << endl
        29           << "cstr4:	" << cstr4 << endl
        30           << "t_cstr:	" << t_cstr << endl
        31           << "-----------------------------"  << endl;
        32      printf("
    ------ Char pointers ----------
    ");
        33      PRINT_CSTR(1);
        34      PRINT_CSTR(2);
        35      PRINT_CSTR(3);
        36      PRINT_CSTR(4);
        37      PRINT_T_CSTR();
        38  
        39      return 0;
        40  }
            现在我们将获得我们所期望的输出结果了:
        
            ------ The results ----------
            cstr1:  012345678901234567890123456789012345678901234567890123456789
            cstr2:  012345678901234567890123456789012345678901234567890123456789
            cstr3:  012345678901234567890123456789012345678901234567890123456789
            cstr4:  012345678901234567890123456789012345678901234567890123456789
            t_cstr: abcdefghijklmnopqrstuvwxyz
            -----------------------------
    
            ------ Char pointers ----------
            cstr1 addr:     0x100200e4
            cstr2 addr:     0x10020134
            cstr3 addr:     0x10020184
            cstr4 addr:     0x100201d4
            t_cstr addr:    0x10020014
     
            现在我们知道stringstream.str()方法将返回一个临时的string对象,而它的生命周期将在本表达式结束后完结。当我们需要对这个string对象进行进一步操作(例如获得对应的C string)时,我们需要注意这个可能会导致非预期结果的“陷阱”。:)
    
           最后,我们想强调一下:由于临时对象占用内存空间被重新使用的不确定性,这个陷阱不一定会明显暴露出来。但不暴露出来不代表行为的正确性,为了避免“诡异”问题的发生,请尽量采用能保证正确的写法。
        

     这个stringstream各种坑,这算一个

  • 相关阅读:
    MySQL改动rootpassword的多种方法
    略论并行处理系统的日志设计
    ERROR (UnicodeEncodeError): 'ascii' codec can't encode characters in position 0-1: ordinal not in range(128
    UnicodeEncodeError: 'ascii' codec can't encode character u'u65e0' in position 1: ordinal not in range(128)
    python -m json.tool 中文乱码 Format JSON with python
    CentOS6.6 zookeeper完全集群搭建
    libvirt kvm云主机监控
    glance image-create
    通过上一节部署出来的 Windows instance 有时候会发现操作系统时间总是慢 8 个小时,即使手工调整好时间和时区,下次 instance 重启后又会差 8 个小时
    云监控网址
  • 原文地址:https://www.cnblogs.com/zzyoucan/p/3721451.html
Copyright © 2020-2023  润新知