上周末参加了IBM Analytics举办的“大数据黑客马拉松(Big Data Hackathon)北京站”比赛,4个人组队拿到了第一名,非常的开心,也非常的不容易,我们四个wesor像共事了很久一样,各司其职配合默契,拿下了最后的锦标。第一天9点到晚上11点多,本想熬夜可是受限于主办方场地,第二天9点到下午三点,连吃饭都端着盘子对着电脑。这两天累的一直缓解不过来,睡觉都觉得累的睡不着,但是确实学到了很多的东西,从比赛中,从队友身上……
就像博士说的,要说服别人觉得自己的工作非常重要。这句话之前从别的地方看到过,当时觉得不以为然,现在越发觉得有理。我们所做的工作或大或小,如何告诉别人,我们的工作是很重要的,其实是要讲,我们要解决的问题是如何的重要和困难,把自己的成果描述的非常有用。而我们的工作永远是个收敛的过程。前面描述的问题是宏大的,之后需要一步一步的收敛,把问题归纳到要解决的点上,解决最关键的核心问题,故而将整个问题解决。
解决问题的方法不在于有多复杂,用最简单的算法解决了最困难的问题,才是最值得称赞的。所以不要总想着研究什么新的算法,先把经典的算法搞清楚会应用,解决实际问题。
我们的ppt准备的不错,也算没白写几个月的ppt给各种领导汇报,把故事讲圆了,而且没有任何的废话,点赞。想起了自己当年去A国做论文演讲,好几年不讲了,以后有机会也需要上台讲一讲。
时间紧迫,scala代码只能算是实现了功能,有非常多的地方需要优化。而且仅仅用到spark core的部分,其实是可以利用MLlib里一些高级数据类型DataFrame来预处理数据的,可惜还没有学到,CollaborativeFilter也是现学现卖,需要加快spark core + MLlib的学习进度。
github学会了使用,确实非常好。
机器学习算法的学习不能停,还好这次是没有题目数据限定的比赛,如果以后有机会参加限定题目的比赛,对机器学习模型算法的要求就高了,趁着算是有一点点的基础,多学习多实践,不求知道每个算法的数学基础,但要知道什么问题用什么模型和算法,怎么优化调整等等。
几个wosor真心“骚”味相投,即使最后不拿奖,两天时间也特别开心,好吃好喝,连蹲坑都是一起,庆幸自己有这些好朋友,自豪自己也是其中的一份子。
正在搞新的数据,翻译新的模型算法,学习新的东西,向着新的目标出发……
http://www.csdn.net/article/a/2015-08-18/15827301
http://www.c114.net/news/212/a914245.html
END