投了近20家大厂,由于才大二,简历内容也不算丰富,所以大多数在简历关就挂了.得到笔试机会的有网易,今日头条,百词斩.
百词斩(一面挂)
一面:
- 平时如何学习相关知识.
- 项目经历.
- 讲一个最喜欢的机器学习算法.我答了神经网络.
- 为什么神经网络的激励函数要用非线性的.没有回答出来.正确答案是线性函数叠加仍是线性函数,非线性函数才能起到层与层之间的变化.
- 了解决策树吗,决策树划分结点的方法有哪些.
- 详细解释信息增益.
- 什么是过拟合?如何防止过拟合?
- 讲讲KNN和K-Means的不同.
- K-Means一般如何选取K值和初始质心.选取K值应该讲到平均轮廓系数,答得不好.
- 一般怎么做交叉验证.
- 百词斩题库中有很多阅读题,现在如何判断新出的题目和已有题目的相似度.我的回答是用词袋向量计算夹角余弦值.
- 有监督学习和无监督学习的区别是什么.
总共持续了半小时左右,面试官比较和蔼.由于恰好感冒所以问题回答的都不大好.
今日头条(二面挂)
一面:
- 手写代码:旋转有序数组的二分查找,磕磕绊绊写出来了
- 项目经历
- 了解哪些机器学习算法
二面:
- 项目经历
- 了解集成学习吗,讲讲bagging和boosting
- 随机森林
- GBDT
- 如果单棵决策树在数据集上的表现很差,还要尝试随机森林吗
- 知道哪些分类和回归的算法
- 分类和回归常用的损失函数
- 手写代码:有20000个词频,如何选出前100个高频词.因为正好看了堆排序就按堆排序的思路答了,但是面试官说20000其实是一个不大的数据量,直接用sort()排序就可以了.
- 手写代码:有两个二叉树节点,如何找到他们的最近公共子节点.因为对数据结构有些生疏,最后在面试官提示下才回答上来.
总结
不同公司侧重点很不一样,比如百词斩问了很多机器学习基础知识的问题,头条则很注重算法.共同点是项目经历非常重要.通过这次经历看出自己还是有很多知识漏洞的,接下来的学习重点是多参加比赛,多实践,还有了解常用的算法与数据结构.