个人能力
专业能力
沟通能力
认同和学习力
基本知识点
Linux操作系统
Shell
系统管理员 systectl journalctl
用户管理员 useradd
用户 文件 进程
Python
Python函数参数传递机制
常用组件
Transformer 转换器 Estimator 估计器 Pipeline 管道
Java
Java参数传递机制 - Java中只有值传递
Java
使用传统for循环进行遍历
使用iterator遍历set集合
使用增强for循环遍历set集合
for(Map.Entry<String,List<String>> item : resultMap.entrySet()){
Hadoop
HDFS的组件
datanode namenode
HDFS的常用命令
Hive
1.hive中sort by、order by、cluster by、distribute by各代表的意思
2. row_number densen_rank rank
1234 1223 1224
3.简要描述数据库中的 null,说出null在hive底层如何存储,
NVL() COALESCE()函数,这个函数主要用来进行空值处理
•使用case when then else end
Hbase 的 null值处理 空(null)列并不占用空间
4.hive内部表与外部表的区别
5.Hive 中的压缩格式- 格式有哪些,有什么区别
TextFile、SequenceFile、RCfile 、ORCfile各有什么区别?
6.Hive自定义UDF函数的流程
7.数据倾斜
01. map端--小文件太多
02.reduce 端map输出数据按key Hash的分配到reduce中,
由于key分布不均匀、业务数据本身的特、建表时考虑不周、等原因造成的reduce 上的数据量差异过
Spark
组件
Spark的执行过程
Job --》 Stage --》 task
Spark开发_Spark的UDF开发
Flink
Hbase
Parquet 列时存储和 Hbase的存
Mysql
查看是否日志开启 mysql> show variables like 'log_bin';
记录MySQL操作的几种日志:
# 错误日志 log-error
# 查询日志 log
# 二进制日志 log-bin
# 慢日志 log-slow-queries
# 更新日志 log-update(官方建议,不开启,所以在此忽略它)
面试
面试的目的和标准,以及方式--》面试风格
注意事项
1.情景假设题目
情景性问题
解决问题为目的的问题情景
2.过去情况总结题
你最擅长什么?
3.将来情况
经验性问题
背景性问题
Situation(情景)、Task(任务)、Action(行动)和Result(结果)。
问题类型
封闭式问题
确认式问题
开放式问题
举例式问题
假设式问题
考察候选人的逻辑分析能力和问题处理能力
理论
沟通能力
--沟通行为--沟通目标-沟通场景
倾听能力
表达能力
设计能力
表达能力
语言表达能力
清楚-通顺-准确
逻辑思维
主次分明-逻辑性墙-条理清楚
自我认知能力
判断自己的优点和待改进的地方
对他人的认知--亮点和疑问点
你打多少分?能不能用?有什么特别突出的特质,有什么特别不好的特质
具体是哪些方面
面试的章法和逻辑
哪些能问,哪些不能问?为什么不能问?不必问的有哪些?
什么时候问,先问什么,后问什么?
从哪个角度问?
找到提问点--
用什么方式问?
01.封闭式提问
能不能 是不是 会不会 可不可以
多久 多少
02.开放式
你会怎么做?
提问-发问-追问-反问-设问-诘问
质问-责问
安慰问候叫(慰问),拜访光顾叫(访问),
征求意见叫(询问),反诘发问叫(反问).
提出问题叫(提问),反躬自省叫(自问),
仔细查问叫(盘问),追根究底叫(追问),
审讯案犯叫(审问),
判断
佐证
营造
轻松的交谈气氛,
紧张的气氛
暖场--暖场的方式和时间,暖场的目的和背景
案例分析
从面试的角度谈谈什什么什么
场景演练
信息收集-主干分析
说明
使用专业术语
使用拟人化的,拟物化的词语--保留信息的主干,缺点是增加了信息的歧义