• 分割字符串(C++)


    方案1:

    利用"IO流"的概念,即C++中的stream,我们都用过C++中std::iostream中的std::istreamstd::ostream

    image.png

    如果你接触过网络编程(Socket编程),可能会对这个流的概念更加清楚。在C++中,我们常用的cin其实是一个istream对象,从标准输入读取数据,cout是一个ostream对象,用于向标准输出写入数据。IO对象无拷贝或赋值

    相应的,我们可以使用std::istream_iterator来作为关联输入流的迭代器:

    std::string text = "Let me split this into words";
    std::istringstream iss(text);
    std::vector<std::string> results(std::istream_iterator<std::string>{iss},
    		std::istream_iterator<std::string>());
    

    利用stream_iterator的方法,由于是stream,我们甚至可以利用fstream对除了字符串之外的输入进行分割,虽然可以分割,但是他只能识别出空格。

    针对这个,我们希望可以重载>>,使得满足原有功能的基础上还能满足我们需要的一些操作:

    std::istream& operator>>(std::istream& is, std::string& output)
    {
       // ...do operations we need...
    }
    

    最后的形式需要变为:

    std::istream& operator>>(std::istream& is, SELF_STRING(public std:string)& output)

    其中的SELF_STRING是我们可以把除了空格之外的字符引入,从而可以分割的类型。在这里提出一个可能受争议的解决方式:

    构造一个新的类wordDelimitedBy去继承std:string,然后对于这个新的类我们可以模板化使其适应于多种分隔符:

    template<char delimiter>
    class WordDelimitedBy : public std::string
    {};
    
    template<char delimiter>
    std::istream& operator>>(std::istream& is, WordDelimitedBy<delimiter>& output)
    {
    	std::getline(is, output, delimiter);
    	return is;
    }
    
    int main()
    {
    	std::string text = "Let,me,split,this,into,words";
    
    	std::istringstream iss(text);
    	std::vector<std::string> results(std::istream_iterator<WordDelimitedBy<','>>{iss},
    		std::istream_iterator<WordDelimitedBy<','>>());
    	
    	for (int i = 0; i < results.size(); ++i)
    		std::cout << results[i] << std::endl;
    
    	system("pause");
    }
    
    

    然后为什么说会受争议的方式,因为std::string并没有virtual destructor,即出现了:当一个派生类对象通过使用一个基类指针删除,而这个基类有一个非虚的析构函数,则结果是未定义的。运行时比较有代表性的后果是对象的派生 部分不会被销毁。然而,基类部分很可能已被销毁,这就导致了一个古怪的“部分析构”对象,这是一个泄漏资源。在C++中并没有Java的GC机制。但是铜鼓哦代码我们也会发现,我们并没有实例化WordDelimitedBy,而是一直使用着他的类型和模板化,但是我们也并没有足够的手段去阻止这种实例化的发生;所以严格来说,这种方式虽然比stream的iterator方式快并支持多种分隔符,但是存在漏洞的。

    此外,我们还以可以利用std::getline的一个特性:

    std::vector<std::string> split(const std::string& s, char delimiter)
    {
    	std::vector<std::string> tokens;
    	std::string token;
    	std::istringstream tokenStream(s);
    	while (std::getline(tokenStream, token, delimiter))
    	{
    		tokens.push_back(token);
    	}
    	return tokens;
    }
    
    int main()
    {
    	std::string text = "Let,me,split,this,into,words";
    
    	std::vector<std::string> results=split(text, ',');
    
    	for (int i = 0; i < results.size(); ++i)
    		std::cout << results[i] << std::endl;
    
    	system("pause");
    }
    

    方案2:

    我们可以利用boost库中的split函数,安装boost库可以参照这一篇教程.

    #include <boost/algorithm/string.hpp>
     
    std::string text = "Let me split this into words";
    std::vector<std::string> results;
     
    boost::split(results, text, [](char c){return c == ' ';});
    

    注意到这里的split函数第三个参数实际上是一个lambda表达式,用来判断分隔符是不是一个空格。原理实际上也非常简单,就是执行多次find_if直到到string的结尾。

    方案3:

    第三种方案实际上涉及到Ranges,这是作者Eric Niebler 的库地址,这个应该会在C++20的标准中被纳入。

    用法是这样的:

    std::string text = "Let me split this into words";
    auto splitText = text | view::split(' ');
    

    同样我们在库的test中可以看见相应的代码 rangeV3

    其中我们方案1是最中规中矩的,当然如果ranges被纳入了C++20,会方便许多。

  • 相关阅读:
    shell文本过滤编程(一):grep和正则表达式【转】
    从头开始写项目Makefile(十):make内嵌函数及make命令显示【转】
    写文章 TEE技术分析【转】
    移动电子商务:五个技术标准与Trustonic TEE解决方案【转】
    在vscode中使用pylint-django插件解决pylint的一些不必要的错误提示【转】
    从零开始学习OpenCL开发(一)架构【转】
    一张图让你学会Python【转】
    关于ping以及TTL的分析【转】
    g++的编译选项:-Wl,-rpath=【转】
    【梦幻连连连】源代码分析(四)-触摸处理
  • 原文地址:https://www.cnblogs.com/yunlambert/p/10040218.html
Copyright © 2020-2023  润新知