1. hive 中 语句的执行顺序。
2. hive的 窗口函数
3. mysql 或hive 的sql优化方法,怎样可以显著提高执行效率。
4. sql中加索引要注意额事项。
5. 一张表:班级、姓名、成绩。查出每个班级中前3名对应的记录。
pandas的熟悉程度考察。
简历中,不用非常在意说 会使用的算法模型、具体的处理流程。 应该重点多介绍 干过哪些项目,带来哪些效果。(越多越好。)
职业发展方向 1.深耕一个行业,走业务数据分析师方向(应用模型解决业务问题。会模型量不在于多,而在于能能用模型解决实际问题,而且尽量深度考虑模型应用后,产生的有利影响,和可能产生的不利影响,模型失效会带来什么样的严重后果。如果评价自己的模型,如何制定阈值标准)。
2.研究算法,深度了解算法原理,有改善创新能力。能在项目中应用,并带来效果。