• 分布式对象存储 读书笔记(三) 元数据


    上节的代码无法区分同一个对象的不同版本,为了记录对象版本以及其他一些元数据,本节中会加入一个新组件:元数据服务

    元数据服务就是提供对元数据的存取功能的服务。元数据指的是对象的描述信息,比如对象的名字、版本、大小以及散列值.

    新增加服务后的结构图如下

    需要新安装一个ElasticSearch搜索引擎。安装过程可自行百度

    ElasticSearch搜索引擎中,我们需要定义这样一个映射。

    '{"mappings":{"objects":{"properties":{"name":{"type":"string","index":"not_analyzed"},"version":{"type":"integer"},"size":{"type":"integer"},"hash":{"type":"string"}}}}}'

    ES的索引相当于数据库而类型相当于数据库的表,映射则相当于定义表结构。该索引只有一个类型就是objects,包括4个属性分别是name,version,size和hash

    接口服务代码添加了versions访问处理函数

    1 func main() {
    2     go heartbeat.ListenHeartbeat()
    3     http.HandleFunc("/objects/", objects.Handler)
    4     http.HandleFunc("/locate/", locate.Handler)
    5     http.HandleFunc("/versions/", versions.Handler)
    6     log.Fatal(http.ListenAndServe(os.Getenv("LISTEN_ADDRESS"), nil))
    7 }
    View Code

    version处理函数仅处理Get请求

    调用ES的API进行version查询最后返回

     1 func Handler(w http.ResponseWriter, r *http.Request) {
     2     m := r.Method
     3     if m != http.MethodGet {
     4         w.WriteHeader(http.StatusMethodNotAllowed)
     5         return
     6     }
     7     from := 0
     8     size := 1000
     9     name := strings.Split(r.URL.EscapedPath(), "/")[2]
    10     for {
    11         metas, e := es.SearchAllVersions(name, from, size)
    12         if e != nil {
    13             log.Println(e)
    14             w.WriteHeader(http.StatusInternalServerError)
    15             return
    16         }
    17         for i := range metas {
    18             b, _ := json.Marshal(metas[i])
    19             w.Write(b)
    20             w.Write([]byte("
    "))
    21         }
    22         if len(metas) != size {
    23             return
    24         }
    25         from += size
    26     }
    27 }
    View Code

    OBJECT处理函数中 添加了DELETE处理

    在ES中添加新版本,数据为0 ,哈希为"",表示删除操作

    OBJECT处理函数中 PUT操作没有较大改变 但是添加了在ES中记录元数据的代码

    OBJECT处理函数中 GET操作会根据version查询ES 获取元数据 才开始获取对象数据 

     1 func get(w http.ResponseWriter, r *http.Request) {
     2     name := strings.Split(r.URL.EscapedPath(), "/")[2]
     3     versionId := r.URL.Query()["version"]
     4     version := 0
     5     var e error
     6     if len(versionId) != 0 {
     7         version, e = strconv.Atoi(versionId[0])
     8         if e != nil {
     9             log.Println(e)
    10             w.WriteHeader(http.StatusBadRequest)
    11             return
    12         }
    13     }
    14     meta, e := es.GetMetadata(name, version)
    15     if e != nil {
    16         log.Println(e)
    17         w.WriteHeader(http.StatusInternalServerError)
    18         return
    19     }
    20     if meta.Hash == "" {
    21         w.WriteHeader(http.StatusNotFound)
    22         return
    23     }
    24     object := url.PathEscape(meta.Hash)
    25     stream, e := getStream(object)
    26     if e != nil {
    27         log.Println(e)
    28         w.WriteHeader(http.StatusNotFound)
    29         return
    30     }
    31     io.Copy(w, stream)
    32 }
    33 
    34 func put(w http.ResponseWriter, r *http.Request) {
    35     hash := utils.GetHashFromHeader(r.Header)
    36     if hash == "" {
    37         log.Println("missing object hash in digest header")
    38         w.WriteHeader(http.StatusBadRequest)
    39         return
    40     }
    41 
    42     c, e := storeObject(r.Body, url.PathEscape(hash))
    43     if e != nil {
    44         log.Println(e)
    45         w.WriteHeader(c)
    46         return
    47     }
    48     if c != http.StatusOK {
    49         w.WriteHeader(c)
    50         return
    51     }
    52 
    53     name := strings.Split(r.URL.EscapedPath(), "/")[2]
    54     size := utils.GetSizeFromHeader(r.Header)
    55     e = es.AddVersion(name, hash, size)
    56     if e != nil {
    57         log.Println(e)
    58         w.WriteHeader(http.StatusInternalServerError)
    59     }
    60 }
    View Code

    实操验证

    开启 rabbitmq ES 设置ES映射

    开启 apiserver dataserver

    使用curl 上传一个test3对象  这时候会显示400 bad request。 因为没提供test3 对象的散列值 

    先计算对象的哈希值的 然后再添加哈希PUT一次

    OK!!

    作 者: itdef
    欢迎转帖 请保持文本完整并注明出处
    技术博客 http://www.cnblogs.com/itdef/
    B站算法视频题解
    https://space.bilibili.com/18508846
    qq 151435887
    gitee https://gitee.com/def/
    欢迎c c++ 算法爱好者 windows驱动爱好者 服务器程序员沟通交流
    如果觉得不错,欢迎点赞,你的鼓励就是我的动力
    阿里打赏 微信打赏
  • 相关阅读:
    Storm-源码分析-Stats (backtype.storm.stats)
    Storm-源码分析-Topology Submit-Task-TopologyContext (backtype.storm.task)
    Storm-源码分析-Streaming Grouping (backtype.storm.daemon.executor)
    Storm-源码分析-Topology Submit-Worker
    Storm-源码分析- Messaging (backtype.storm.messaging)
    Storm-源码分析-LocalState (backtype.storm.utils)
    Storm-源码分析- Disruptor在storm中的使用
    LMAX Disruptor 原理
    Shiro学习(7)与Web整合
    MQTT---HiveMQ源代码具体解释(十四)Persistence-LocalPersistence
  • 原文地址:https://www.cnblogs.com/itdef/p/9608289.html
Copyright © 2020-2023  润新知