大数据黑客马拉松（Big Data Hackathon）赛后小结

大数据黑客马拉松（Big Data Hackathon）赛后小结

上周末参加了IBM Analytics举办的“大数据黑客马拉松（Big Data Hackathon）北京站”比赛，4个人组队拿到了第一名，非常的开心，也非常的不容易，我们四个wesor像共事了很久一样，各司其职配合默契，拿下了最后的锦标。第一天9点到晚上11点多，本想熬夜可是受限于主办方场地，第二天9点到下午三点，连吃饭都端着盘子对着电脑。这两天累的一直缓解不过来，睡觉都觉得累的睡不着，但是确实学到了很多的东西，从比赛中，从队友身上……

就像博士说的，要说服别人觉得自己的工作非常重要。这句话之前从别的地方看到过，当时觉得不以为然，现在越发觉得有理。我们所做的工作或大或小，如何告诉别人，我们的工作是很重要的，其实是要讲，我们要解决的问题是如何的重要和困难，把自己的成果描述的非常有用。而我们的工作永远是个收敛的过程。前面描述的问题是宏大的，之后需要一步一步的收敛，把问题归纳到要解决的点上，解决最关键的核心问题，故而将整个问题解决。

解决问题的方法不在于有多复杂，用最简单的算法解决了最困难的问题，才是最值得称赞的。所以不要总想着研究什么新的算法，先把经典的算法搞清楚会应用，解决实际问题。

我们的ppt准备的不错，也算没白写几个月的ppt给各种领导汇报，把故事讲圆了，而且没有任何的废话，点赞。想起了自己当年去A国做论文演讲，好几年不讲了，以后有机会也需要上台讲一讲。

时间紧迫，scala代码只能算是实现了功能，有非常多的地方需要优化。而且仅仅用到spark core的部分，其实是可以利用MLlib里一些高级数据类型DataFrame来预处理数据的，可惜还没有学到，CollaborativeFilter也是现学现卖，需要加快spark core + MLlib的学习进度。

github学会了使用，确实非常好。

机器学习算法的学习不能停，还好这次是没有题目数据限定的比赛，如果以后有机会参加限定题目的比赛，对机器学习模型算法的要求就高了，趁着算是有一点点的基础，多学习多实践，不求知道每个算法的数学基础，但要知道什么问题用什么模型和算法，怎么优化调整等等。

几个wosor真心“骚”味相投，即使最后不拿奖，两天时间也特别开心，好吃好喝，连蹲坑都是一起，庆幸自己有这些好朋友，自豪自己也是其中的一份子。

正在搞新的数据，翻译新的模型算法，学习新的东西，向着新的目标出发……

http://www.csdn.net/article/a/2015-08-18/15827301

http://www.c114.net/news/212/a914245.html

END
相关阅读:
Struts学习之手动验证
 Struts学习之文件上传
 Struts学习之模型驱动
 Struts学习之类型转换
 Struts学习之自定义拦截器
 Java基础之"=="和和 equals 方法的区别
 Hadoop学习之Hadoop案例分析
 Hadoop学习之Hadoop集群搭建
 Hadoop学习之自定义二次排序
 Hadoop学习之Mapreduce执行过程详解
原文地址：https://www.cnblogs.com/kevingu/p/4740827.html