2019秋招——百度机器学习面经

2019秋招——百度机器学习面经

由于百度是秋招的时候面的，现在很多问题都记不住了，这里只写下我还记得的题目吧(当时太懒了，不想写了。。。)：

1.文本分类比赛用的什么模型？为什么？

答：LR、SVM、XGBoost。。。

问：最终选用了哪个？

答：blabla。。。线性核的SVM

问：为什么选线性核SVM？

答：效果最好，特征数目远大于样本数目时，选线性核的SVM比较好。

问：为什么？

答：LR受全部样本的影响，SVM只受支持向量的影响。(感觉有些牵强)

2.文本分类的数据是怎样的？类别标签是怎样的？

答：blabla。。。

3.LR多分类是怎么实现的？

答：softmax层

问：为什么用softmax层，而不用onevsall等多分类策略

。。。不记得了

4.SGD如何改进优化？

答：这里我理解错了，实际上他是想问mini-batch梯度下降。

5.推导带L1正则项的LR，以及如何进行优化的？

答。。。

6.gdbt和xgboost的区别？

答：（经典面试题）。。。

7.树模型、xgboost、gbdt哪个需要做特征归一化？

。。。

8.面对一个任务，如何选择模型？

我感觉这里可以理解为模型的使用场景。。。

9.LR和SVM的区别？

答：（经典面试题）。。。

10.过拟合的解决手段？

。。。

11.CNN、RNN、LSTM的原理？

。。。

12.书写下链表逆序？

。。。。

13.书写归并排序，并优化到空间复杂度为O(1)

。。。双指针

14.几种梯度下降法的区别？

。。。

15.Hadoop相关
相关阅读:
MFC 简介
 C++使用thread类多线程编程
 C++中stack
C++中头文件简介（stdio.h & chrono）
别人写的很好Arduino教材
 Communicating to 2 SPI Slaves with USART & SPI ports on Atmega16U2
HDU 2089 不要62（挖个坑=-=）
HDU 3555 Bomb（数位DP）
HDU 3480 Division（斜率优化+二维DP）
HDU 3045 Picnic Cows（斜率优化DP）
原文地址：https://www.cnblogs.com/wangkundentisy/p/10575830.html