学习大数据目前主要三个平台hadoop,storm,spark
比如学hadoop,从哪儿开始学首先要根据你的基本情况而定,如果你就一小白,没有任何开发基础,也没有学过任何开发语言,那就必须先从基础java开始学起(大数据支持很多开发语言,但企业用的最多的还是JAVA),接下来学习数据结构、关系型数据库、linux系统操作,夯实基础之后,再进入大数据的学习,例如:hadoop离线分析、Storm实时计算、spark内存计算的学习,学习体系可以按照如下:
第一阶段
CORE JAVA (加**的需重点熟练掌握,其他掌握)
Java基础**
数据类型
运算符、循环
算法
顺序结构程序设计
程序结构
数组及多维数组
面向对象**
构造方法、控制符、封装
继承**
多态**
抽象类、接口**
常用类
集合Collection、list**
HashSet、TreeSet、Collection
集合类Map**
异常
File
文件/流**
数据流和对象流**
线程(理解即可)
网络通信(理解即可)
第二阶段
数据结构
关系型数据库
Linux系统操作
Linux操作系统概述
安装Linux操作系统
图形界面操作基础
Linux字符界面基础
字符界面操作进阶
用户、组群和权限管理
文件系统管理
软件包管理与系统备份
Linux网络配置
(主要掌握Linux操作系统的理论基础和服务器配置实践知识,同时通过大量实验,着重培养学生的动手能力。使学生了解Linux操作系统在行业中的重要地位和广泛的使用范围。在学习Linux的基础上,加深对服务器操作系统的认识和实践配置能力。加深对计算机网络基础知识的理解,并在实践中加以应用。掌握Linux操作系统的安装、命令行操作、用户管理、磁盘管理、文件系统管理、软件包管理、进程管理、系统监测和系统故障排除。掌握Linux操作系统的网络配置、DNS、DHCP、HTTP、FTP、SMTP和POP3服务的配置与管理。为更深一步学习其它网络操作系统和软件系统开发奠定坚实的基础。与此同时,如果大家有时间把javaweb及框架学习一番,会让你的大数据学习更自由一些)
重点掌握:
常见算法
数据库表设计
SQL语句
Linux常见命令
第三阶段
Hadoop阶段
离线分析阶段
实时计算阶段
重点掌握:
Hadoop基础
HDFS
MapReduce
分布式集群
Hive
Hbase
Sqoop
Pig
Storm实时数据处理平台
Spark平台
若之前没有项目经验或JAVA基础,掌握了第一阶段进入企业,不足以立即上手做项目,企业需再花时间与成本培养;
第二阶段掌握扎实以后,进入企业就可以跟着做项目了,跟着一大帮人做项目倒也不用太担心自己能不能应付的来,当然薪资不能有太高的要求;
前两个阶段都服务于第三阶段的学习,除了熟练掌握这些知识以外,重点需要找些相应的项目去做,不管项目大小做过与没有相差很多的哦!掌握扎实后可直接面对企业就业,薪资待遇较高!大数据学习资料分享群119599574 不管你是小白还是大牛,小编我都挺欢迎,不定期分享干货,包括我自己整理的一份最新的适合2018年学习的大数据开发和零基础入门教程,欢迎初学和进阶中的小伙伴。