• 大数据面试题V3.0 Hive面试题(约3.3w字)




    Hive面试题(约3.3w字)

    1. 说下为什么要使用Hive?Hive的优缺点?Hive的作用是什么?

    2. 说下Hive是什么?跟数据仓库区别?

    3. Hive架构

    4. Hive内部表和外部表的区别?

    5. 为什么内部表的删除,就会将数据全部删除,而外部表只删除表结构?为什么用外部表更好?

    6. Hive建表语句?创建表时使用什么分隔符?

    7. Hive删除语句外部表删除的是什么?

    8. Hive数据倾斜以及解决方案

    9. Hive如果不用参数调优,在map和reduce端应该做什么

    10. Hive的用户自定义函数实现步骤与流程

    11. Hive的三种自定义函数是什么?实现步骤与流程?它们之间的区别?作用是什么?

    12. Hive的cluster by、sort bydistribute by、orderby区别?

    13. Hive分区和分桶的区别

    14. Hive的执行流程

    15. Hive SQL转化为MR的过程?

    16. Hive SQL优化处理

    17. Hive的存储引擎和计算引擎

    18. Hive的文件存储格式都有哪些

    19. Hive中如何调整Mapper和Reducer的数目

    20. 介绍下知道的Hive窗口函数,举一些例子

    21. Hive的count的用法

    22. Hive的union和unionall的区别

    23. Hive的join操作原理,leftjoin、right join、inner join、outer join的异同?

    24. Hive如何优化join操作

    25. Hive的mapjoin

    26. Hive语句的运行机制,例如包含where、having、group by、orderby,整个的执行过程?

    27. Hive使用的时候会将数据同步到HDFS,小文件问题怎么解决的?

    28. Hive Shuffle的具体过程

    29. Hive有哪些保存元数据的方式,都有什么特点?

    30. Hive SOL实现查询用户连续登陆,讲讲思路

    31. Hive的开窗函数有哪些

    32. Hive存储数据吗

    33. Hive的SOL转换为MapReduce的过程?

    34. Hive的函数:UDF、UDAF、UDTF的区别?

    35. UDF是怎么在Hive里执行的

    36. Hive优化

    37. row_number,rank,dense_rank的区别

    38. Hive count(distinct)有几个reduce,海量数据会有什么问题

    39. HQL:行转列、列转行

    40. 一条HQL从代码到执行的过程

    41. 了解Hive SQL吗?讲讲分析函数?

    42. 分析函数中加Order By和不加Order By的区别?

    43. Hive优化方法

    44. Hive里metastore是干嘛的

    45. HiveServer2是什么?

    46. Hive表字段换类型怎么办

    47. parquet文件优势

  • 相关阅读:
    在中文SPS中去掉左上角的“帮助”
    如何将英文SPS站点迁移到中文SPS下?
    Pivot View问题???
    PostgreSQL
    一个简单的全选Jquery插件
    JavaScript 分页控件的实现
    EXTJS新的创建方式
    通用垂直居中方法兼容各浏览器改进
    对Excel中的工作表进行排序的VBA(备份一下)
    关于meta标签(力求“大全”)
  • 原文地址:https://www.cnblogs.com/chang09/p/16419567.html
Copyright © 2020-2023  润新知