• spark教程(19)-sparkSQL 性能优化之谓词下推


    在 sql 语言中,where 表示的是过滤,这部分语句被 sql 层解析后,在数据库内部以谓词的形式出现;

    在 sparkSQL 中,如果出现 where,它会现在数据库层面进行过滤,一般数据库会有索引,效率不会太低,

    sparkSQL 只读取过滤后的数据,大大减少数据量,提高效率,特别是提高 join 的效率

    大致过程如图

  • 相关阅读:
    快速模幂
    UPC-2249 曲线分割【递推】
    maven 服务器
    maven repo
    php-fpm sock
    mysql
    go 1
    xdebug
    centos
    win10 2503 2502
  • 原文地址:https://www.cnblogs.com/yanshw/p/11984061.html
Copyright © 2020-2023  润新知