一面
2020年4月23日
自我介绍。
Spark和Hadoop的区别
MR流程、RDD流程
new malloc区别 epoll原理看过吗?讲一下多态
写到算法题吧:二分查找,写一下旋转数组最小值(又是这道题。我说这道题之前做过,面试官没再让我写)。
二面
2020年4月28日
自我介绍、在家里?没开学?
学过Hadoop,讲一下MR流程。说一下Partition分区的优化是怎么做的(Partition没答出来)
MR会有数据倾斜,讲一下如何解决(说了一些方法,被要求说的更详细一些。比如为什么增加Reduce数量就可以提高效率,如何自定义分区,如何重新设计key)
然后问的是Hadoop Streaming (没听说过,讲了下spark streaming
)
看简历上有个socket项目,问如何讲一下流程,问如何从socket中提取数据(时间太长,完全记不清了)
写个算法题。给一个树,每个节点的val都有取或不取两种状态。限定条件是,直接连接的节点不能同时取或者不取(比如父子节点) 想的是分成四次递归。问如何剪枝。没答出来
上面那个题没想法了。那咱们换个,给一个二叉树和两个节点 a ,b 找出二叉树的最近公共祖先。(剑指offer原题 最后一题)
平时大部分都是Py Java Scala开发,很少用C++,就很难受。还需要多学习啊。
关注我的公众号【互联网校招面经】
每天精选分享高质量的互联网初级面试经验。
每月月底会替大家总结这个月的面经汇总pdf版免费分享给大家。
每季度会推出针对具体岗位的面经汇总版本直接领取。
还会按照公司对优质面经进行分类整理直接奉送。
辛苦整理不易,帮忙点个赞呗,看见你们的回复是我继续努力的最大动力!!