前一段时间, 一个老师建议我能够学学 '大数据' 和 '机器学习', 他说这必定是今后的热点, 学会了, 你就是香饽饽。在此之前, 我对大数据, 机器学习并没有非常深的认识, 总觉得它们是那么的缥缈, 高不可攀, 也没想着深入学习。
之后, 一次偶然的机会, 在csdn官方博客上看到了这种一个活动
[置顶] 话题讨论&征文--谈论大数据时我们在谈什么
于是, 从下载试读样章, 到正式读书, 開始了学习大数据的过程...
到今天, 差点儿相同两周过去了, 马马虎虎过了一遍, 感触颇多。 以下简单评价下我看完后对这本书的认识。
(ps: 在此之前, 我对大数据等全然没有概念, 接下去的言论, 仅仅是个人的观点, 不喜勿喷)
本书前言中提到:
"从传统IT 业到互联网、互联网到移动互联网,从以智能手机和Pad 为主要终端载体的移动互联网到可穿戴设备的移动互联网。然后再到万物互联的物联网,这一定是不可违抗的发展规律和前进方向。伴随着这个趋势必定有越来越多、形态越来越丰富的超量数据不断产生。而大数据明显是由此衍生出来的明白且必定的发展趋势。 "
-----<大数据日知录:架构与算法>
看到这, 给我一种感觉, 大数据无处不在, 大数据高贵冷艳...直到如今, 我才干确定, 它确实是这样!
读完最大的感受是有助于建立大数据技术的总体大局观。
这书从大数据基本理论、各种架构组件以及算法几个角度归纳了眼下常见的大数据技术,理论部分讲的还挺透彻。也包含了方方面面的技术点,真挺全面,能够当个工具书。
这本书蕴涵的的内容比較多——从大数据的存储结构、内容管理,讲到集群任务调度、分布式数据通信、流行的各类新式数据库的介绍,还有基于机器学习技术的大数据实现以及大数据挖掘应用范例等内容,既包罗万象,又深入浅出。17个章节, 17个不同内容, 尽管有所差别, 可是密切相关, 它们分别从大数据基础理论、大数据系统体系结构、大数据存储,以及包含批处理、流式计算、交互式数据分析、图数据库、并行机器学习的架构与算法以及增量计算等技术, 从不同角度描写叙述了同一个知识--"大数据",可见作者张俊林扎实的功底。尽管我不是专业从事大数据行业的, 可是仅凭我的一些计算机知识, 也能把这本书读下来, 可见作者写作水平之高。
17章中, 我看的最认真的应该是图数据库(毕竟是样章, 最早看), 等我看完之后, 个人觉得这是书中的一个亮点, (不然也不会拿来当样章), 相同的, 数据结构、集群资源管理这两章也非常不错。 就说图数据库这一章吧, 有完整的理论归纳也有详细小样例,体系感强,也好理解。
喜欢这本书的另外一个理由是图文并茂, 比方在介绍TAO的跨数据中心架构的时候, 给了一张非常直观的图,例如以下。我想这比写再多的文字描写叙述都管用。另外, 在介绍一些知识点的时候, 总会举出非常贴切的样例, 便于读者理解。
比方介绍图的时候, 引入Facebook关系图来描写叙述, 十分贴切。
"Facebook是眼下世界上最著名的社交站点, 假设从数据抽象的角度来看, Facebook的社交图不仅包含好友之间的关系, 还包含人与实体以及实体与实体之间的关系, 每一个用户, 每一个页面, 每张图片, 每一个应用。每一个地点以及每一个评论都能够作为独立的实体......"
另外, 看的比較蛋疼的一章应该是机器学习这一章了。
内容尽管非常有用。覆盖了多数经常使用的互联网应用,也是实际使用中的经常使用算法,但缺点也非常明显,感觉对于刚開始学习的人(就像我这样从没学习过的...)有点深,要具备一些主要的机器学习知识恐怕才干理解。
所以我想等先看一些入门书籍过后, 再来又一次读读这个章节。
另外, 每一个章节前面都有一小段歌词, 尽管我没看出有什么名堂, 可是感觉挺好的, 重拾好心情, 開始一个新章节的学习。
最后呢, 借用之前学习大数据看到的一段话: "大数据就是互联网发展到现今阶段的一种表象或特征而已,没有必要神话它或对它保持敬畏之心。在以云计算为代表的技术创新大幕的衬托下,这些原本非常难收集和使用的数据開始easy被利用起来了,通过各行各业的不断创新,大数据会逐步为人类创造很多其它的价值。"
假设, 你想从理论方面学习大数据
(理论是认知的必经途径,也是被广泛认同和传播的基线。在这里从大数据的特征定义理解行业对大数据的总体描绘和定性;从对大数据价值的探讨来深入解析大数据的珍贵所在;洞悉大数据的发展趋势;从大数据隐私这个特别而重要的视角审视人和数据之间的长久博弈)
或者, 你想从技术方面学习大数据
(技术是大数据价值体现的手段和前进的基石。在这里分别从云计算、分布式处理技术、存储技术和感知技术的发展来说明大数据从採集、处理、存储到形成结果的整个过程。)
再不然, 你想从实践方面学习大数据
(实践是大数据的终于价值体现。在这里分别从互联网的大数据。政府的大数据,企业的大数据和个人的大数据四个方面来描绘大数据已经展现的美好景象及即将实现的蓝图)。
我都觉得, <大数据日知录:架构与算法>是一本你值得一读的书,。
非常庆幸,我能静下心看了这本书。