关于面京东,感触仅仅有一个,虐的快吐血了。首先说京东分四个板块,有京东商城、京东金融、京东刚收购的拍拍和海外事业部。我这个职位主要是在金融部数据组做数据挖掘和机器学习,还有推荐系统。面试是在周一,本身也没打算正经去面试的,结果被虐了整整一个下午。。。。。。
实话实说,京东在整个互联网行业里待遇基本是最低的,只有平台好,每天有10亿新的用户行为数据,对于DM而言,再好只是了。教主让我多面试几家,尽管某狗给13k,可是实在顶不住快被虐的吐血的压力,某狗、优x和乐x就在等等吧。
面试经过,好痛苦。。。上来先自我介绍什么的就不说了,接着就是问推荐系统。还好我周末花了两天的时间把项亮老师写的《推荐系统实战》过了一边,于是我就開始扯架构,然后说了说相关算法,比方User协同过滤和Item协同过滤,还有假设遇到冷启动问题该怎样处理神马的。说完推荐,就问我编码能力怎么样,我说还行,又问sql怎么样,我说曾经做过购物站点,一般的CRUD还凑合,于是就让我写一个sql的嵌套查询来输出一下在一段时间内每一个用户最后一次的购买的物品和购买时间,恩。。。没错。。。写坏了。。。limit写成了top,还好我机智,解释说top是sqlserver的,mysql里用limit。最左面的面试官批评我说:“以后不能仅仅写那种简单的,略微复杂一点的也要多写写,这张纸你拿回去吧,在你数据库里执行试试”,我心想“完了,这就回去了??!!!”只是还好没有。。。接着最右面的面试官(加我qq的那个小leader)说:“你说你曾经搞过算法竞赛,你能写写堆排序么?”我一愣,哎呀妈呀,仅仅记得算法过程了。。。好吧,“那你就写个堆排序吧”,于是面试官们就出去了。。。好忐忑啊,手机在旁边就是不敢百度啊,硬着头皮写吧。。。过了一会儿,面试官们回来了,我基本也写完了,然后他们就拿着来回看啊。。。我心里七上八下。。。。。。。只是还好,好像写的没什么问题。接着就问我数据分析处理怎么样,我说跟着老师学过一点DM,參加过天猫大数据竞赛,可惜rank 1300+,相关工具用过Weka,大数据平台hadoop正在自学,我自学能力非常强。他们表示无法证明我自学能力强,还好我有准备,这个专业top1在这里放着呢哈哈~。然后就是关于机器学习的问题了。问我会什么,我说分类聚类、分词、关联规则什么的。“那你分类都会什么”,我说k近邻(当时说成了k邻近,事实上我到如今都没注意究竟是k近邻还是k邻近,反正当时面试官愣了一下,我还不如直接说knn)、朴素贝叶斯、SVM什么的,神经一抽还非常脑残地把kmeans说进去了,这明明是无监督的聚类。。。然后问我他们有什么差别,我仅仅说了NB是基于概率统计的算法模型,其它的是基于空间切割的。在SVM方面问的不是非常深,万幸没有细问到四个kernal,要不我预计就好pass掉了。一个面试官说,你谢写写NB分类吧,好家伙。。。继续硬着头皮写,写完以后解释了一下算法思想,先验概率和后验概率神马的。最后还有什么不记得了,仅仅记得最最最后,数据组高级项目组长来了,然后又问了我毕业设计爬虫是单线程的么,我说是单进程多线程,还问了问余弦聚类特征向量是怎样取的,我说用tf-idf,取前20词,在比較时构成40维的向量,还问堆排序为什么是nlogn的效率,这个我跪了。。。结束后,几个在场的面试官都说能够,问我待遇有什么要求,我说我是应届生,并且我同学做的都是以开发为主,我也不太懂行情,你们看着给吧,于是。。。!!!!就是这么坑!!!!早知道我就多要点了,刘强东一定是把钱都给奶茶妹妹花了!!!只是后来leader说不惬意的话周三能够找人力的聊聊,结果我周二下午就去了,人力老大跟我笑着聊了一下午互联网金融,听得我是个晕头转向。邻近下班的时候才说到正题,我又一次提了要求,他说他们回去再商议一下,一周内给回复。我心想,你要是不满足我的新要求我就不去了呢!(开玩笑。。。毕竟JD也不小,我更看好这个平台。)
总结,计算机project专业!=计算机专业,要不是我们学校这么坑非要把我们忘软件外包方向推从而提高就业率,非常多有志骚年们还是有多种出路的。编码不一定必须搞软件开发,数据挖掘、机器学习、推荐、图形图像处理、云计算都是非常好的方向,尽管本科教学过程中一般没有这些,可是大量的课余时间都能够用来自学。一開始我是找王金龙博士了解DM这个方向,然后王导给我推荐了一些书以及相关的资料,只是后来王导忙着出国也不理我了。关于机器学习,《集体编程智慧》、《统计学习方法》是非常好的入门书籍,我非常推荐。事实上这些入门书籍要是吃透了,尤其是《统计学习方法》里面的数学推导搞懂了,拿ML的offer非常轻松。其它方面,数学非常重要,除了高数线代概率,还有凸优化,这个数学在本科阶段基本没有讲,《矩阵论》也能够看看。网易斯坦福大学公开课、Coursea的ML课都非常好,讲师都是Andrew Ng(敢不认识他?)。数据挖掘方面,我也不是非常深入,我仅仅看过《数据挖掘导论》,浙江大学的那个数据挖掘视频太老了。。。
其它的,编码能力要非常好,数据结构算法一定要弄清,尽量都会写;sql语句是硬功夫;多搞算法还是非常有优点的。写的非常乱,各位将就看。
PS:为什么从開始关注JD股价開始,它就一直跌!!!
实话实说,京东在整个互联网行业里待遇基本是最低的,只有平台好,每天有10亿新的用户行为数据,对于DM而言,再好只是了。教主让我多面试几家,尽管某狗给13k,可是实在顶不住快被虐的吐血的压力,某狗、优x和乐x就在等等吧。
面试经过,好痛苦。。。上来先自我介绍什么的就不说了,接着就是问推荐系统。还好我周末花了两天的时间把项亮老师写的《推荐系统实战》过了一边,于是我就開始扯架构,然后说了说相关算法,比方User协同过滤和Item协同过滤,还有假设遇到冷启动问题该怎样处理神马的。说完推荐,就问我编码能力怎么样,我说还行,又问sql怎么样,我说曾经做过购物站点,一般的CRUD还凑合,于是就让我写一个sql的嵌套查询来输出一下在一段时间内每一个用户最后一次的购买的物品和购买时间,恩。。。没错。。。写坏了。。。limit写成了top,还好我机智,解释说top是sqlserver的,mysql里用limit。最左面的面试官批评我说:“以后不能仅仅写那种简单的,略微复杂一点的也要多写写,这张纸你拿回去吧,在你数据库里执行试试”,我心想“完了,这就回去了??!!!”只是还好没有。。。接着最右面的面试官(加我qq的那个小leader)说:“你说你曾经搞过算法竞赛,你能写写堆排序么?”我一愣,哎呀妈呀,仅仅记得算法过程了。。。好吧,“那你就写个堆排序吧”,于是面试官们就出去了。。。好忐忑啊,手机在旁边就是不敢百度啊,硬着头皮写吧。。。过了一会儿,面试官们回来了,我基本也写完了,然后他们就拿着来回看啊。。。我心里七上八下。。。。。。。只是还好,好像写的没什么问题。接着就问我数据分析处理怎么样,我说跟着老师学过一点DM,參加过天猫大数据竞赛,可惜rank 1300+,相关工具用过Weka,大数据平台hadoop正在自学,我自学能力非常强。他们表示无法证明我自学能力强,还好我有准备,这个专业top1在这里放着呢哈哈~。然后就是关于机器学习的问题了。问我会什么,我说分类聚类、分词、关联规则什么的。“那你分类都会什么”,我说k近邻(当时说成了k邻近,事实上我到如今都没注意究竟是k近邻还是k邻近,反正当时面试官愣了一下,我还不如直接说knn)、朴素贝叶斯、SVM什么的,神经一抽还非常脑残地把kmeans说进去了,这明明是无监督的聚类。。。然后问我他们有什么差别,我仅仅说了NB是基于概率统计的算法模型,其它的是基于空间切割的。在SVM方面问的不是非常深,万幸没有细问到四个kernal,要不我预计就好pass掉了。一个面试官说,你谢写写NB分类吧,好家伙。。。继续硬着头皮写,写完以后解释了一下算法思想,先验概率和后验概率神马的。最后还有什么不记得了,仅仅记得最最最后,数据组高级项目组长来了,然后又问了我毕业设计爬虫是单线程的么,我说是单进程多线程,还问了问余弦聚类特征向量是怎样取的,我说用tf-idf,取前20词,在比較时构成40维的向量,还问堆排序为什么是nlogn的效率,这个我跪了。。。结束后,几个在场的面试官都说能够,问我待遇有什么要求,我说我是应届生,并且我同学做的都是以开发为主,我也不太懂行情,你们看着给吧,于是。。。!!!!就是这么坑!!!!早知道我就多要点了,刘强东一定是把钱都给奶茶妹妹花了!!!只是后来leader说不惬意的话周三能够找人力的聊聊,结果我周二下午就去了,人力老大跟我笑着聊了一下午互联网金融,听得我是个晕头转向。邻近下班的时候才说到正题,我又一次提了要求,他说他们回去再商议一下,一周内给回复。我心想,你要是不满足我的新要求我就不去了呢!(开玩笑。。。毕竟JD也不小,我更看好这个平台。)
总结,计算机project专业!=计算机专业,要不是我们学校这么坑非要把我们忘软件外包方向推从而提高就业率,非常多有志骚年们还是有多种出路的。编码不一定必须搞软件开发,数据挖掘、机器学习、推荐、图形图像处理、云计算都是非常好的方向,尽管本科教学过程中一般没有这些,可是大量的课余时间都能够用来自学。一開始我是找王金龙博士了解DM这个方向,然后王导给我推荐了一些书以及相关的资料,只是后来王导忙着出国也不理我了。关于机器学习,《集体编程智慧》、《统计学习方法》是非常好的入门书籍,我非常推荐。事实上这些入门书籍要是吃透了,尤其是《统计学习方法》里面的数学推导搞懂了,拿ML的offer非常轻松。其它方面,数学非常重要,除了高数线代概率,还有凸优化,这个数学在本科阶段基本没有讲,《矩阵论》也能够看看。网易斯坦福大学公开课、Coursea的ML课都非常好,讲师都是Andrew Ng(敢不认识他?)。数据挖掘方面,我也不是非常深入,我仅仅看过《数据挖掘导论》,浙江大学的那个数据挖掘视频太老了。。。
其它的,编码能力要非常好,数据结构算法一定要弄清,尽量都会写;sql语句是硬功夫;多搞算法还是非常有优点的。写的非常乱,各位将就看。
PS:为什么从開始关注JD股价開始,它就一直跌!!!
写在后面。。刚刚財哥打电话。。说收到offer了!!財哥就是这么霸气有木有!!!!