• 大数据黑客马拉松(Big Data Hackathon)赛后小结


    上周末参加了IBM Analytics举办的“大数据黑客马拉松(Big Data Hackathon)北京站”比赛,4个人组队拿到了第一名,非常的开心,也非常的不容易,我们四个wesor像共事了很久一样,各司其职配合默契,拿下了最后的锦标。第一天9点到晚上11点多,本想熬夜可是受限于主办方场地,第二天9点到下午三点,连吃饭都端着盘子对着电脑。这两天累的一直缓解不过来,睡觉都觉得累的睡不着,但是确实学到了很多的东西,从比赛中,从队友身上……

    就像博士说的,要说服别人觉得自己的工作非常重要。这句话之前从别的地方看到过,当时觉得不以为然,现在越发觉得有理。我们所做的工作或大或小,如何告诉别人,我们的工作是很重要的,其实是要讲,我们要解决的问题是如何的重要和困难,把自己的成果描述的非常有用。而我们的工作永远是个收敛的过程。前面描述的问题是宏大的,之后需要一步一步的收敛,把问题归纳到要解决的点上,解决最关键的核心问题,故而将整个问题解决。

    解决问题的方法不在于有多复杂,用最简单的算法解决了最困难的问题,才是最值得称赞的。所以不要总想着研究什么新的算法,先把经典的算法搞清楚会应用,解决实际问题。

    我们的ppt准备的不错,也算没白写几个月的ppt给各种领导汇报,把故事讲圆了,而且没有任何的废话,点赞。想起了自己当年去A国做论文演讲,好几年不讲了,以后有机会也需要上台讲一讲。

    时间紧迫,scala代码只能算是实现了功能,有非常多的地方需要优化。而且仅仅用到spark core的部分,其实是可以利用MLlib里一些高级数据类型DataFrame来预处理数据的,可惜还没有学到,CollaborativeFilter也是现学现卖,需要加快spark core + MLlib的学习进度。

    github学会了使用,确实非常好。

    机器学习算法的学习不能停,还好这次是没有题目数据限定的比赛,如果以后有机会参加限定题目的比赛,对机器学习模型算法的要求就高了,趁着算是有一点点的基础,多学习多实践,不求知道每个算法的数学基础,但要知道什么问题用什么模型和算法,怎么优化调整等等。

    几个wosor真心“骚”味相投,即使最后不拿奖,两天时间也特别开心,好吃好喝,连蹲坑都是一起,庆幸自己有这些好朋友,自豪自己也是其中的一份子。

    正在搞新的数据,翻译新的模型算法,学习新的东西,向着新的目标出发……

    http://www.csdn.net/article/a/2015-08-18/15827301

    http://www.c114.net/news/212/a914245.html

    END

  • 相关阅读:
    Struts学习之手动验证
    Struts学习之文件上传
    Struts学习之模型驱动
    Struts学习之类型转换
    Struts学习之自定义拦截器
    Java基础之"=="和 和 equals 方法的区别
    Hadoop学习之Hadoop案例分析
    Hadoop学习之Hadoop集群搭建
    Hadoop学习之自定义二次排序
    Hadoop学习之Mapreduce执行过程详解
  • 原文地址:https://www.cnblogs.com/kevingu/p/4740827.html
Copyright © 2020-2023  润新知