倾情大奉送--Spark入门实战系列

倾情大奉送--Spark入门实战系列

这一两年Spark技术很火，自己也凑热闹，反复的试验、研究，有痛苦万分也有欣喜若狂，抽空把这些整理成文章共享给大家。这个系列基本上围绕了Spark生态圈进行介绍，从Spark的简介、编译、部署，再到编程模型、运行架构，最后介绍其组件SparkSQL、Spark Streaming、Spark MLib和Spark GraphX等。文章内容的整理一般是先介绍原理，随后是实战例子，由于面向的是入门读者，在实战中多截图，还请谅解。为了大家实验方便，在这里把实验相关的测试数据和安装包放在百度盘提供链接: https://pan.baidu.com/s/1i67cLsp 密码: 778w。

本系列博客在博客园和CSDN首发，地址为：

博客园 http://www.cnblogs.com/shishanyuan

CSDN http://blog.csdn.net/yirenboy

以下为该系列文章列表：

1.Spark及其生态圈简介   下载

2.Spark编译与部署（上）--基础环境搭建   下载

2.Spark编译与部署（中）--Hadoop编译安装   下载

2.Spark编译与部署（下）--Spark编译安装   下载

3.Spark编程模型（上）--编程模型及SparkShell实战   下载

3.Spark编程模型（下）--IDEA搭建及实战   下载

4.Spark运行架构   下载

5.Hive（上）--Hive介绍及部署   下载

5.Hive（下）--Hive实战   下载

6.SparkSQL（上）--SparkSQL简介   下载

6.SparkSQL（中）--深入了解运行计划及调优   下载

6.SparkSQL（下）--Spark实战应用   下载

7.Spark Streaming（上）--实时流计算Spark Streaming原理介绍   下载

7.Spark Streaming（下）--实时流计算Spark Streaming实战   下载

8.Spark MLlib（上）--机器学习及SparkMLlib简介   下载

8.Spark MLlib（下）--机器学习库SparkMLlib实战   下载

9.Spark图计算GraphX  下载

10.分布式内存文件系统Tachyon介绍及安装部署   下载

作者：石山园  出处：http://www.cnblogs.com/shishanyuan/

本文版权归作者和博客园共有，欢迎转载，但未经作者同意必须保留此段声明，且在文章页面明显位置给出原文连接，否则保留追究法律责任的权利。如果觉得还有帮助的话，可以点一下右下角的【推荐】，希望能够持续的为大家带来好的技术文章！想跟我一起进步么？那就【关注】我吧。
相关阅读:
Kafka写入流程和副本策略
 Kafka消费分组和分区分配策略
 Kafka安装和常用操作命令
 面试：谈谈你对大数据的理解
 HDFS写数据和读数据流程
 java笔记之分支、循环语句
 java笔记之分支、循环语句
 java笔记之运算符
 java笔记之运算符
 java笔记之java内存结构
原文地址：https://www.cnblogs.com/xiongchang95/p/8526756.html