• .net 中的 StringBuilder 和 TextWriter 区别


    最近闲来之余,看了一些开源的类库,看到有些类库喜欢用TextWriter类来记录相关的字符串数据,感到比较好奇,为啥不用StringBuilder类对象。于是在网上搜索了一番,总结了相关笔记。

    StringBuilder

    在 .net 中,字符串作为一种基本的数据类型,通常在一个程序中同一个字符串只维护一个副本。也就是说,通过直接给定字符串值的字符串引用会引用到相同数据上。这种处理的好处在于它能够减少字符串所占用的内存空间,不需要为多个同样的字符串开辟多次空间。在C#中 string 类型是一个不变量,给字符串引用赋予新值并不会改变对应内存中的数据,而是设置引用为新字符串位置。

    在平时,这种处理逻辑能够大大减少字符串所占用的内存空间,但有的时候,也会起一些反效果,典型的例子就是在一些构造字符串的操作时所生成的中间字符串数据。举个例子:

    string[] words = {"Nice ", "to ", "meet ", "you."};
    string sentence = "";
    for(i = 0;i < words.Length; i++)
    {
        sentence += words[i];
    }
    

    这是一个很简单的字符串组装功能,它将给定的单词拼接成一个句子,我们希望的是直接拼接成最后的结果,但这段代码除了生成最终句子外,先前的临时也会生成出来。也就是说,"Nice "、"Nice to "、"Nice to meet "以及最后字符串"Nice to meet you."会随着一次次循环迭代全部构造出来。但实际上,对于我们来说只需要最后句子即可,中间部分完全不需要。为此,我们需要新的方式来避免无意义的开销。

    StringBuilder类就是一种动态灵活地构造字符串的方法。这种构造字符串的好处在于,它能够避免构造中间字符串结果,转而直接生成最终的字符串数据。按照上面的例子,稍作修改就能得到一个性能更加优异的版本,在该版本下只有最后的句子字符串才会被生成。

    string[] words = {"Nice ", "to ", "meet ", "you."};
    StringBuilder sentenceBuilder = new StringBuilder();
    for(i = 0;i < words.Length; i++)
    {
        sentenceBuilder.Append(words[i]);
    }
    string setence = sentenceBuilder.ToString();
    

    至于StringBuilder类的原理,我个人猜测是该类中维护一个char型列表,然后动态地修改数组元素,达到每次拼接时不会生成字符串的目的,只有当显式调用命令生成时,才会生成。不过,因为能力有限,我还不知道怎么在runtime这个开源库中找StringBuilder的实现(感谢评论区的各位大神,本人正在查看StringBuilder的内部实现)。

    --------- 更新 -------
    (感谢评论区9L的 沉睡的木木夕 的说明)

    虽然说StringBuilder在字符串拼接过程中有比较大的优势,但仍需要耗费一些额外的时间,比如说StringBuilder对象的创建等,因此并不是说任何场合下都建议使用StringBuilder类来拼接字符串。如果待拼接字符串的个数比较少,往往直接利用string字符串拼接会比StringBuilder的效率更快,但在大量的字符串拼接上,StringBuilder的效果会更好些。本例只是用来说明二者在构造期间的一些差异,方便起见只使用少量拼接的字符串。

    ---- 更新结束 ------

    TextWriter

    TextWriter是一个抽象类,按照微软官方给出的描述,该类指的是可以编写一个有序字符系列的编写器。嗯,字都认识,但是这句话感觉就不像是人说的。实际上,我个人对这个类的理解是它是一个写入器。换句话来说,TextWriter描述了一个写入的过程,但具体写什么?向哪里写入?这不是这个抽象类所关心的话题,而是由其子类所负责。

    .net中常用内置的一些子类:

    • StreamWriter :这个类相信很多人都熟悉,当需要向文件中写入数据时,往往通过该类写入数据
    • StringWriter :今天本文所需要研究的对象,向字符串写入
    • HttpWriter : 向网络流中写入数据

    StringWriter类作为TextWriter的一个继承类,按照MSDN给出的解释是,用于将信息写入字符串的TextWriter类对象,这个类看起来和StringBuilder类所做的功能差不多,那么为什么在 .net 中设计两个不同类做同一个功能呢?翻了下相关资料,只能说这两个类是不同设计思路下的产物。StringBuilder是一种灵活构建字符串的类,它不会产生额外的临时字符串,而StringWriter则将字符串数据作为一种写入的目的地,从这个角度来看,确实也是一种必要的实现。

    比如说,有一个函数,它专门是将字符串数据记录下来,具体点,可以想像为日志记录器将日志信息记录到某个地方。这样的情况下,我们提供两个输入参数,TextWriter类对象表明是一个写入器,message描述一个日志信息,那么记录数据只需要这样写就可以了:

    public void WriteData(TextWriter writer, string message)
    {
        writer.Write(message);
    }
    

    这样一来,如果将信息记录到某个文件中,只要这样写:

    using var file = new FileStream("./log.txt", FileAccess.Write);
    using var writer = new StreamWriter(file);
    WriteData(writer, "hello");
    

    如果想将信息记录到某个变量中,就是这样:

    var writer = new StringWriter();
    WriteData(writer, "hello");
    data = writer.ToString();
    

    总结

    总的来说,如果只是单纯使用字符串而不涉及到修改字符串值时,直接使用string类型即可。如果需求是更加专注构造某种字符串数据,那么使用StringBuilder是一个比较好的选择。如果需求强调的是将某种格式的字符串数据写入到某个介质中,使用TextWriter对应的继承类会更好,更符合封装的思想,且不需要过多关注数据是怎么写入的,只要将需要写入的数据传入到其中即可。

  • 相关阅读:
    codeforces 869E. The Untended Antiquity(二维树状数组,随机化)
    bzoj 3083: 遥远的国度(树上换根操作,树剖+询问整个子树)
    hdu 5534 Partial Tree(dp+降唯,好题)
    AtCoder Regular Contest 075 E
    hihocoder 1387 A Research on "The Hundred Family Surnames"(树,lca,求同一颜色的直径)
    hdu 5458 Stability(生成树,树链剖分,好题)
    推荐一套个人ui组件库
    回望2019,期盼2020
    如何从产品的角度对待自己的博客
    致一名迷茫的我
  • 原文地址:https://www.cnblogs.com/iskcal/p/difference_between_stringbuilder_and_textwriter.html
Copyright © 2020-2023  润新知