spark快速大数据分析

从上层来看，每个Spark 应用都由一个驱动器程序（driver program）来发起集群上的各种并行操作。驱动器程序包含应用的main 函数，并且定义了集群上的分布式数据集，还对这些分布式数据集应用了相关操作。

驱动器程序通过一个SparkContext 对象来访问Spark。这个对象代表对计算集群的一个连接.

一旦有了SparkContext，你就可以用它来创建RDD.

相关阅读:
【架构师必看】淘宝从百万到千万级并发的14次服务端架构演进之路
Nginx（四）------nginx 负载均衡
Nginx（三）------nginx 反向代理
Nginx（二）------nginx.conf 配置文件
Nginx（一）------简介与安装
nginx配置ssl实现https访问
架构设计的五大原则-SOLID
ABP开发框架前后端开发系列
Windows程序通用自动更新模块（C#，.NET4.5以上）
网络通讯中粘包的处理

原文地址：https://www.cnblogs.com/playforever/p/9759323.html