Cloudera Hadoop 5& Hadoop高阶管理及调优课程(CDH5,Hadoop2.0,HA,安全,管理,调优)

1.课程环境

本课程涉及的技术产品及相关版本：

技术	版本
Linux	CentOS 6.5
Java	1.7
Hadoop2.0	2.6.0
Hadoop1.0	1.2.1
Zookeeper	3.4.6
CDH Hadoop	5.3.0
Vmware	10
Hive	0.13.1
HBase	0.98.6
Impala	2.1.0
Oozie	4.0.0
Hue	3.7.0

2.内容简介

本教程针对有一定Hadoop基础的学员，深入讲解如下方面的内容：

1、Hadoop2.0高阶运维，包括Hadoop节点增加删除、HDFS和YARN的HA实现，

HDFS Federation实现等

2、搭建本地Yum部署CDH5的重要组件和优化配置

3、Impala、Oozie和Hue的部署、使用操作及调优

4、Hadoop安全认证及授权管理

5、Hadoop各组件性能调优

《Hadoop2.0/YARN深入浅出(Hadoop2.0、Spark、Storm和Tez)》http://www.ibeifeng　.com/goods-435.html

《Hadoop大数据零基础高端实战培训系列配文本挖掘项目(挑战年薪50万)》http://www.ibeifeng　.com/goods-428.html

《基于Greenplum Hadoop分布式平台的大数据解决方案及商业应用案例剖析》http://www.ibeifeng.　com/goods-377.html

迪伦老师:某知名500强企业大数据平台架构师，大数据处理专家。长期从事于大数据基础架构建设、企业级数据仓库、大数据分析、挖掘等领域项目的开发及管理。

熟悉多种技术架构的综合运用，包括Hadoop、Greenplum、Oracle、Cognos、Datastage等。对于Hadoop生态系统，特别是Hive、HBase、Mahout等开源框架的业务

应用、可靠性、基础架构和高级应用等方面有着丰富经验。

迪伦老师在北风网参与的其他课程链接:

单品课程:

《基于Hadoop2.0、YARN技术的大数据高阶应用实战(Hadoop2.0YARNMapReduce数据挖掘项目实战) 》 http://www.ibeifeng.　com/goods-440.html

《深入浅出Hadoop Mahout数据挖掘实战(算法分析、项目实战、中文分词技术)》 http://www.ibeifeng.　com/goods-438.html

《MapReduce/Hbase进阶提升(原理剖析、实战演练)》 http://www.ibeifeng　.com/goods-438.html

《Hadoop2.0/YARN深入浅出(Hadoop2.0、Spark、Storm和Tez)》http://www.ibeifeng.　com/goods-435.html

《Hadoop大数据零基础高端实战培训系列配文本挖掘项目(挑战年薪50万)》http://www.ibeifeng. com/goods-428.html

《基于Greenplum Hadoop分布式平台的大数据解决方案及商业应用案例剖析》http://www.ibeifeng. com/goods-377.html

一、Hadoop2.0 动态增加节点

01.1 怎样添加节点

01.2 添加新的服务器节点

01.3 新节点操作系统配置

01.4 新节点Hadoop配置

01.5 调整新节点副本数

二、Hadoop2.0 动态删除节点

02.1 怎样删除节点

02.2 删除Hadoop2.0集群节点

02.3 测试监控删除节点后的集群

三、Hadoop2.0 HDFS HA部署

03.1 HDFS HA的实现方式

03.2 HDFS HA的实现步骤

03.3 HA集群环境配置

03.4 HA hdfs-site.xml参数配置

03.5 HA其他参数配置

03.6 JournalNode服务启动及初始化

03.7 HDFS HA服务启动及手工切换

03.8 基于ZK自动切换模式的实现

03.9 HDFS HA中ZooKeeper部署

03.10 配置HDFS HA自动切换模式

03.11 HDFS HA自动故障切换测试

四、Hadoop2.0 HDFS HA+Federation部署

04.1 HDFS Federation的实现方式及规划

04.2 HDFS Federation的配置步骤

04.3 配置HDFS Federation

04.4 HDFS Federation服务启动及测试

04.5 HDFS HA+Federation实现及配置步骤

04.6 HDFS HA+Federation的配置及服务启动

04.7 HDFS HA+Federation集群故障模拟测试

五、Hadoop升级

05.1 Hadoop内部升级的实现

05.2 Hadoop1.0升级到2.0步骤

05.3 HDFS升级配置操作

05.4 执行HDFS升级并测试验证

05.5 MapReduce升级

六、Hadoop2.0 YARN HA部署

06.1 YARN HA的实现

06.2 YARN HA的配置步骤及其相关参数

06.3 Hadoop2.0 YARN HA配置操作

06.4 YARN HA服务启动及测试

06.5 YARN HA测试及错误处理

06.6 解决YARN HA启动错误的问题

06.7 HDFS+YARN HA故障模拟测试

七、Hadoop安全管理深度剖析

07.1-Hadoop安全背景

07.2-Hadoop1.0安全问题及处理机制

07.3 Kerberos基本概念及授权认证过程

07.4 Kerberos在Hadoop中的应用

07.5 Hadoop1.0安全机制的具体实现

07.6 RPC安全之身份认证机制

07.7 RPC安全之服务访问控制机制

07.8 HDFS安全策略

07.9 Mapreduce安全策略

07.10 Hadoop上层服务的安全策略

07.11 Hadoop1.0安全机制的应用场景

07.12 Hadoop2.0安全认证机制的实现

07.13 Yarn中的各类令牌及其作用

07.14 Hadoop2.0授权机制的实现

八、搭建本地yum安装CDH5 Hadoop集群

08.1 为什么选择CDH

08.2 CDH的体系架构

08.3 CDH的集群规划

08.4 CDH操作系统配置步骤

08.5 CDH集群主机名及网络配置

08.6 操作系统yum源配置

08.7 CDH5的yum源配置

08.8 主机间信任关系的建立

08.9 NTP时间同步服务配置

08.10 JDK安装

08.11 安装和配置HDFS步骤

08.12 YUM安装HDFS

08.13 CDH集群环境变量配置

08.14 CDH5 HDFS核心配置

08.15 HDFS其他重要配置及服务启动

08.16 安装和配置YARN的步骤

08.17 YARN的安装

08.18 YARN的核心参数配置

08.19 MapReduce相关参数配置

08.20 服务启动及验证

08.21 CDH5集群测试

08.22 webHDFS的使用

九、基于Kerberos认证的Hadoop安全管理

09.1 Kerberos集群规划及配置步骤

09.2 Kerberos安装配置

09.3 Kerberos数据库创建及服务启动

09.4 Kerberos的使用及测试

09.5 Kerberos principal和keytab概念剖析

09.6 HDFS上配置Kerberos步骤

09.7 HDFS principal创建及生成keytab文件

09.8 HDFS keytab文件部署

09.9 HDFS安全参数配置

09.10 Namenode服务的安全启动

09.11 Datanode服务的安全启动

09.12 HDFS安全使用测试

09.13 YARN配置Kerberos步骤

09.14 YARN principal创建及keytab文件生成部署

09.15 YARN安全参数配置

09.16 YARN服务安全启动及测试

09.17 自动化集群管理

十、Zookeeper&HIVE&HBASE&LDAP实现Kerberos认证

10.01 Zookeeper配置Kerberos步骤

10.02 通过Yum安装Zookeeper

10.03 Zookeeper Server配置Kerberos

10.04 Zookeeper Client配置kerberos

10.05 HBase相关概念深度解析

10.06 HBase配置Kerberos步骤

10.07 通过Yum安装HBase 01

10.08 通过Yum安装HBase 02

10.09 为HBase配置Kerberos

10.10 HBase启动错误诊断及测试

10.11 CDH Hive架构及配置Kerberos认证步骤

10.12 安装HIVE组件及配置PostgreSQL

10.13 Hive的基础配置

10.14 为Hive配置Kerberos认证

10.15 Hive shell及Beeline安全访问测试

10.16 hive与hbase集成原理

10.17 hive-hbase集成安装配置

10.18 hive-hbase映射表创建

10.19 LDAP基本概念

10.20 LDAP模式设计

10.21 LDAP集成Kerberos配置步骤

10.22 LDAP安装和基础配置

10.23 LDAP集成Kerberos及数据库创建

10.24 导入系统用户到LDAP

10.25 OpenLDAP客户端配置和使用

十一、Impala大数据分析引擎

11.01 什么是Impala

11.02 Impala架构和进程

11.03 Impala安装配置步骤

11.04 Impala安装部署

11.05 Impala配置及服务启动

11.06 Impala配置Kerberos认证

11.07 Impala启停故障处理及测试

11.08 Impala的使用

11.09 Impala-shell基本功能的使用

11.10 Impala连接查询

11.11 Impala聚合及子查询

11.12 Impala分区表的使用

11.13 Impala的优化

11.14 Impala收集统计信息及生成查询计划

11.15 HDFS缓存池在Impala中的使用

十二、Oozie&Hue的使用及安全认证管理

12.01 什么是oozie

12.02 Oozie安装和配置步骤

12.03 Oozie安装和基本配置

12.04 Oozie安全配置及服务启动

12.05 Oozie启动问题处理

12.06 Oozie Mapreduce作业测试

12.07 Oozie常用命令及工作流程定义

12.08 Oozie MR&hive&sqoop动作节点配置

12.09 Oozie pig&ssh&java&sw&shell动作节点配置

12.10 Oozie Coordinator作业

12.11 Coordinator动作和应用定义

12.12 Oozie Bundle应用定义

12.13 什么是Hue

12.14 安装配置Hue-HDFS&YARN

12.15 Hue配置Hive、Kerberos、Imapala和Zookeeper等

12.16 Hue安装启动问题处理

12.17 Hue页面初始化及查询问题解决

12.18 Hue控制台的使用

十三、Hadoop2.0授权及资源调度管理

13.01 Hadoop授权管理基础知识

13.02 服务访问授权

13.03 服务级授权配置实例

13.04 队列访问控制列表

13.05 队列访问控制配置实例

13.06 公平调度器配置步骤

13.07 公平调度器配置实例

13.08公平调度器验证

13.09 容量调度器配置

13.10 容量调度器配置

13.11 容量调度配置测试验证

13.12 基于标签的调度器

十四、Hadoop压缩

14.01 hadoop压缩概念及支持的格式

14.02 hadoop常用几种压缩格式对比

14.03 压缩格式的选择

14.04 Snappy压缩配置

14.05 Snappy&Gzip压缩测试

14.06 Hadoop LZO压缩安装配置步骤

14.07 cdh5 lzo压缩安装

14.08 lzo安装问题处理

14.09 lzo压缩配置及测试

14.10 hive配置使用lzo压缩

14.11 Hive外部表使用lzo压缩文件

14.12 Hive使用lzo压缩实例

14.13 hbase压缩配置

14.14 hbase压缩测试

十五、Hadoop文件存储格式

15.01 大数据存储需求及方式

15.02 Hadoop常用文件格式

15.03 HDFS块内三种存储方式实例

15.04 RCFile的设计和实现

15.05 ORCFile文件结构

15.06 Hive文件存储格式的选择

15.07 Hive不同文件格式数据加载测试

15.08 多种文件格式查询存储效率测试

15.09 RCFile性能测试

十六、Hadoop调优

16.01 调优思路

16.02 应用程序优化

16.03 Linux系统优化

16.04 Hadoop实现机制调优

16.05 机架感知策略实现

16.06 Hadoop参数调优综述及NameNode调优

16.07 Datanode参数调优

16.08 集中化缓存管理

16.09 集中缓存架构和概念

16.10 缓存管理及缓存池命令

16.11 缓存操作实例

16.12 缓存参数配置

16.13 YARN调优概述

16.14 Slave和Container资源分配

16.15 配置资源分配和进程大小属性

16.16 YARN内存监控

16.17 Reducer调度调优

16.18 Mapreduce其他关键参数调优

目标一. 掌握Hadoop2.0动态增加和删除节点的维护操作

目标二. 掌握通过Hadoop2.0 HDFS&YARN HA+Federation技术来搭建高可用集群的技能

目标三. 掌握Hadoop2.0升级操作

目标四. 熟悉Hadoop安全管理的知识

目标五. 掌握通过搭建本地yum来部署CDH5 Hadoop集群，包括HBase、Hive、Impala、Oozie和Hue等

目标六. 掌握Impala、Oozie和Hue的安装、使用及优化等

目标七. 掌握基于Kerberos认证的Hadoop安全管理的技能

目标八. 掌握Hadoop安全授权管理的技能

目标九. 掌握Hadoop性能优化的技巧

<未完待续>

亮点一、Hadoop2.6.0、CDH5.3 等采用的均是目前为止最新的版本，技术的前沿性可以保证让您的技术在二到三年内不会落伍.

亮点二、理论与实战相结合，由浅入深。即照顾到基础学员，又照顾到有一定经验的学员。

亮点三、课程所有实例都有操作演示，手把手一步步带领学员从入门到精通.

一.课程针对人群

　本课程针对掌握一定的Hadoop基础知识的学员，想通过本项目的学习，深入掌握Hadoop高阶运维、管理和调优技巧的学员。

没有Hadoop基础的同学，可先学习如下课程：

《Hadoop大数据零基础高端培训课程》 http://www.　ibeifeng.　com/hadoop.html

二.我该怎么学,如何才能学好这门课程，给些建议

2.1、时间上的安排建议

本课程共80讲，如果您时间上充分，建议以每天2-3讲的进度往前学习。

2.2、学习要求

如果您没有基础，建议还是中规中矩的按照课程进度一点一点仔细观看学习，并一定要把看完的视频中的代码自己手敲一遍，以加深理解和记忆

如果您有基础，可不必按步就搬进行，可以拿你感兴趣的部分去学习，但一定要注意实践，并学会举一反三

2.3、讲师建议

1.最好看完视频之后，抛开视频，独立自己去把上课中的示例写一遍，看自己是否理解，如果不正确，可以回过头看再看下视频，如果反复，达到真正理解和

熟练掌握的目的。

2.对于课程实战部分，一定要自己亲自动手做一遍，不要满足听完就OK了

3. 建议一般听视频，一般拿个纸和笔，做一些记录和笔记，这是一种非常好的学习习惯。

4. 一定不要过于依赖视频，要学会看文档日志和使用百度，学会思考，学会举一反三

5. 最后祝您学有所成

课程是属于某个特定的专业技术，掌握该技术后，你可以从事以下职位的相关工作

1.Hadoop运维工程师

2.Hadoop大数据架构师

相关阅读:
【BIEE】01_下载安装BIEE(Business Intelligence)11g 11.1.1.9.0
【Excle数据透视表】如何按照地区交替填充背景颜色
 【Excle数据透视表】如何利用图标集将销售数据划分为五个等级
 【Excle数据透视表】如何将价格小于5000的显示为红色“不达标”
【Excle数据透视表】如何让字段标题不显示“求和项”
【Excle】如何隐藏数据透视表中的错误值
 使用虚拟机运行Ubuntu时，主机与宿主机共享文件的方法。
mount命令汇总
 虚拟机网络模式
 linux（虚拟机中）与windows共享文件两种方法
原文地址：https://www.cnblogs.com/timssd/p/5380899.html