• 华为云PB级数据库GaussDB(for Redis)介绍第四期:高斯 Geo的介绍与应用


    摘要:高斯Redis的大规模地理位置信息存储的解决方案。

    1、背景

    LBS(Location Based Service,基于位置的服务)有非常广泛的应用场景,最常见的应用就是POI(Point of Interest)的查询,例如用户查找附近的人,附近的餐厅,附近的外卖商家等等。LBS的实现需要数据库存储地理位置信息,开源Redis是一个功能强、效率高、使用方便的缓存数据库,实现了地理位置存储的功能,可以用于LBS的数据存储。

    开源Redis 3.2以上版本的Geo功能支持了地理位置信息存储管理,但是内存限制导致没有大规模应用。GaussDB(for Redis)(下文简称高斯Redis)兼容开源Redis的Geo功能,使用磁盘替代内存,突破了开源Redis的内存限制,可以完美解决Geo的大规模应用问题。

    2、开源Redis Geo介绍

    Redis的Geo功能支持如下 6 个 Geo 的相关操作:

    • geoadd:添加某个地理位置的坐标。

    • geopos:获取某个地理位置的坐标。

    • geodist:获取两个地理位置的距离。

    • geohash:获取某个地理位置的geohash值。

    • georadius:根据给定地理位置坐标获取指定范围内的地理位置集合。

    • georadiusbymember:根据给定地理位置获取指定范围内的地理位置集合。

    Redis Geo功能的空间索引采用 GeoHash 原理,配合zset集合存储,查询效率接近 log(N)。

    3、为什么开源Redis Geo没有广泛应用?

    存储地理位置信息的应用非常广泛,而开源Redis Geo功能也可以存储地理位置信息,并且查询效率高,为什么没有得到大规模的应用呢?

    分析存储地理位置信息的场景,都有如下特点:

    • 数据量大

    大部分场景存储地理位置信息的数据量都是TB级以上的,开源Redis的数据全部存放在内存中,节点的内存大小固定,要支持大数据量的地理位置信息存储,必须增加节点数,这会造成成本过高、大集群维护困难等问题。

    • 数据持续增长

    随着用户的增长,地理位置信息的数据也在持续增长,要求底层存储能够无损扩容。但开源Redis扩容需要重新划分hash槽进行数据迁移,必定会影响业务。

    • 高并发读写

    开源Redis主从模式下只有主节点可写,主节点高并发数据写入、高并发数据读出,写入速度过高容易造成主从堆积,数据丢失。

     

    除此之外,还需要考虑备份恢复,数据一致性,扩容,高可用等数据库系统能力。

    • 备份恢复

    开源Redis提供RDB和AOF方式备份数据,但当数据规模大时,RDB方式恢复的数据一致性和完整性较差,AOF方式数据恢复的效率低。

    • 数据一致性

    开源Redis的主从采用异步复制,会出现数据不一致的情况。

    • 高可用

    开源Redis如果同时挂掉一对主从节点,部分数据将不可用,容错能力弱。

    4、高斯Redis为什么合适?

    高斯Redis基于华为自研分布式存储系统DFV,支持PB级大规模的数据存储。解决了开源Redis高成本、存储数据量小、数据不一致等问题,具有秒扩容、超可用、强一致、低成本、自动备份、抗写能力强的优势。

    5、适用场景

    高斯Redis Geo功能适用于数据量大、读写频繁的场景。在外卖平台、点评平台、找房平台中,餐馆的数据、外卖骑手的数据、用户的数据、房源的数据这些数据随着用户增长,数据量过亿,对应的地理位置信息的数据量可到数TB级别,正是高斯Redis适用的场景。下面介绍在不同场景中Geo功能的应用。

    5.1外卖场景:

    (1)用户下完外卖订单后,使用geoadd命令加入骑手的位置。

    (2)使用geopos命令,用户可获得骑手的具体位置。

    (3)使用georadius/ georadiusbymember命令骑手查看附近可配送的订单。

    (4)使用geodist命令用户可获得骑手的距离。

    5.2点评场景:

    (1)新的店铺加入点评平台,使用geoadd命令,添加新店铺的位置。

    (2)使用geopos命令,用户获得店铺的具体位置。

    (3)使用geodist命令,用户可获得与店铺的距离。

    (4)使用georadius/ georadiusbymember,用户可查找距离500米范围的店铺。

    5.3找房场景:

    (1)新的房源加入房源平台中,使用geoadd命令,添加新房源的位置。

    (2)使用geopos命令,用户可获得房源的具体位置。

    (3)使用geodist命令,用户可获得与房源的距离。

    (4)使用georadius/ georadiusbymember命令,用户查找附近1km范围内的房源。

    6、总结

    开源Redis的Geo功能查询效率高,但存在存储容量小、抗写能力弱、可用性差等明显缺点,导致了其Geo功能一直没有广泛应用。高斯Redis突破了开源Redis的内存限制,以高性能磁盘存储数据,具有秒扩容、超可用、强一致、低成本、自动备份、抗写能力强的特点,因此高斯Redis适用于大量地理位置信息存储的场景。

    7、结束

    本文作者:华为云高斯Redis团队。

    杭州西安深圳简历投递:yuwenlong4@huawei.com

    更多技术文章,关注高斯Redis官方博客:https://bbs.huaweicloud.com/community/usersnew/id_1614151726110813

    PS:值此开年采购季之际,企业新用户购买GaussDB (for Redis)4U16G任意存储规格,内存可享3个月3折。另外还有多款云数据库包年低至2.7折,0门槛抽千元大奖、新购满额送华为手机P40 Pro 5G等多重福利,链接:https://activity.huaweicloud.com/dbs_Promotion/index.html

     

    本文分享自华为云社区《华为云PB级数据库GaussDB(for Redis)揭秘第四期:高斯 Redis Geo的介绍与应用》,原文作者:高斯Redis官方博客。

     

    点击关注,第一时间了解华为云新鲜技术~

  • 相关阅读:
    [Luogu P4178]Tree 题解(点分治+平衡树)
    [20190725NOIP模拟测试8]题解
    暑假集训考试反思+其它乱写
    [bzoj2752]高速公路 题解(线段树)
    bzoj1211树的计数 x bzoj1005明明的烦恼 题解(Prufer序列)
    [CQOI2014]数三角形 题解(找规律乱搞)
    [Catalan数三连]网格&有趣的数列&树屋阶梯
    [NOIP模拟测试7]visit 题解(组合数学+CRT+Lucas定理)
    [7.22NOIP模拟测试7]方程的解 题解(扩展欧几里得)
    leetcode371
  • 原文地址:https://www.cnblogs.com/huaweiyun/p/14511626.html
Copyright © 2020-2023  润新知