• c++ TextQuery程序


    TextQuery程序

    我写的第一个版本

    返回的是map<size_t, string>这个数据量很大,效率低下。
    TextQuery.h

    #inlucde<vector>
    #include<map>
    #include<set>
    #include<iterator>
    #include<fstream>
    #include<iostream>
    #include<sstream>
    
    using namespace std;
    
    #ifndef TEXTQUERY__H
    #define TEXTQUERY__H
    
    class TextQuery {
        public:
            TextQuery() = default;
            TextQuery(ifstream &is);
            map<size_t, string> query(const string &str);
            
        private:
            vector<string> text;
            map<string, set<size_t>> lut;
    };
    
    
    #endif
    

    TextQuery.cpp

    include "TextQuery.h"
    
    TextQuery::TextQuery(ifstream &is) {
        string line;
        istringstream iss;
        string word;
        size_t line_cnt = 0;
        
        while(getline(is, line)) {
            iss.clear();
            iss.str(line);
            text.push_back(line);
            while(iss>>word) {
                if(lut.fine(word) != lut.end()) {
                    lut[word].insert(line_cnt);
                } else { 
                    lut[owrd] = set<size_t>{line_cnt};
                }
            }
            ++line_cnt;
        }
    }
    
    
    map<size_t, string> TextQuery::query(const string &str) {
        map<size_t, string> sh;
        auto p = lut.find(str);
        if((p != lut.end()) {
            for(auto iter = p->second.begin(); iter != p->second.end(); ++iter) {
                sh[*iter] = text[*text];
            }
        }
        
        return sh;
    }
    

    这里用到了set<size_t>{line_cnt}来构造一个匿名的对象,赋值给map。但是不能用set<size_t> (line_cnt),因为set没有有参数的构造函数,有参数的也是拷贝的那种。

    书上的版本

    TextQuery.h

    #pragma once
    #include<vector>
    #include<string>
    #include<map>
    #include<set>
    #include<memory>
    #include<fstream>
    #include<sstream>
    #include<iostream>
    using namespace std;
    
    class QueryResult;
    class TextQuery {
    public:
        TextQuery(ifstream &s);
        QueryResult query(const string &str) const;
    
    private:
        shared_ptr<vector<string>> text;
        map < string, shared_ptr<set<size_t>>> lut;
    };
    
    
    class QueryResult {
    public:
        QueryResult(const string &str, shared_ptr<vector<string>> ptr, shared_ptr<set<size_t>> ln):sh(str), contents(ptr), lines(ln) {}
    
    
        shared_ptr<vector<string>> contents;
        shared_ptr<set<size_t>>    lines;
        string                       sh;
    };
    
    
    void print(ostream &os, const QueryResult &qr);
    

    TextQuery.cpp

    #include "TextQuery.h"
    
    TextQuery::TextQuery(ifstream &is) : text(make_shared<vector<string>>()) {
        string line;
        istringstream iss;
        string word;
    
        while (getline(is, line)) {
            iss.clear();
            iss.str(line);
            text->push_back(line);
            //cout << line << endl;
            while (iss >> word) {
                //cout << word << endl;
                auto &lines = lut[word];
                if (!lines) {
                    lines.reset(new set<size_t>{ text->size() - 1 }); 
              // lines = make_shared<set<size_t>>();
               // lines->insert(text-size() -1);
                } else {
                    lines->insert(text->size() - 1); 
                }
            }
        }
    }
    
    QueryResult TextQuery::query(const string &str) const{
        static shared_ptr<set<size_t>> st_ptr(new set<size_t>);
        auto loc = lut.find(str);
        if(loc != lut.end())
            return QueryResult(str, text, loc->second);
        else
            return QueryResult(str, text, st_ptr);
    
    }
    
    
    
    
    void print(ostream &os, const QueryResult &pr) {
        os << pr.sh << " occurs " << pr.lines->size() << " times"<<endl;
        for (auto iter = pr.lines->begin(); iter != pr.lines->end(); ++iter) {
            os << "(line " << *iter + 1 << ") " << (*pr.contents)[*iter] << endl;
        }
    }
    

    测试代码

    #include<iostream>
    #include<fstream>
    #include"TextQuery.h"
    using namespace std;
    
    int main() {
        ifstream is("TextQuery.cpp");
        TextQuery tq(is);
    
        QueryResult qr = tq.query("QueryResult");
        print(cout, qr);
    
        return 1;
    }
    

    这个代码相比我写的代码的优点

    1. 使用指针返回查找的数据,返回的数据量比较小,没有大量拷贝。
    2. 为了使用指针使用了shared_ptr
    3. 在判断map中lut[word]这个数据是否存在是巧妙的使用了map在没有word对应键的元素的时候会插入这个键,值使用值初始化,shared_ptr值初始化就是nullptr,根据是否为nullptr来确定是否需要分配set的空间。
  • 相关阅读:
    phpinfo mac 和 php -moudle里的不一致(mongodb篇)
    0、服务启动前之日志字段和格式
    P3740 贴海报
    树状数组区间修改and查询和
    P1823 Patrik 音乐会的等待
    西安段素扫描线
    P1903 数颜色
    P1220 关路灯
    [p1559] 运动员最佳匹配问题
    treap数组版
  • 原文地址:https://www.cnblogs.com/yuandonghua/p/15636069.html
Copyright © 2020-2023  润新知