• Greenplum Hadoop视频教程_Hadoop应用案例剖析


    基于Greenplum Hadoop分布式平台的大数据解决方案及商业应用案例剖析
    适合人群:高级
    课时数量:96课时
    用到技术:MapReduce、HDFS、Map-Reduce、Hive、Sqoop
    涉及项目:Greenplum Hadoop大数据分析平台
    联系qq:1840215592


    Hadoop视频教程课程实战、实用、实际,总共 96 课时,系史上最全最深入的讲解Greenplum、Hadoop、云计算相关领域的技能课程,Hadoop视频教程适合于有一定java基础知识,对数据库和sql语句有一定了解,熟练使用linux系统的技术人员,特别适合于想换工作或寻求高薪职业的人士。


    课程内容简介:
    Hadoop视频教程分两大部分:
    第一部分全面深入地介绍了Greenplum数据库,包括架构特性、部署、管理、开发和调优等,由浅入深,理论结合实战,让同学全面彻底掌握这把大数据利剑。
    第二部分深入阐述了Hadoop的架构原理,Hadoop整体技术架构,包括HBase、Hive、Pig、ZooKeeper、Chukwa等实战运用。另外Hadoop视频教程还介绍了云计算的基础知识和Hadoop在云计算领域的运用,以及剖析了Hadoop在各个互联网巨头商业环境的运用。


    学习课程目标:
    课程结束时,帮助学员实现如下目标:
    1、了解Greenplum和Hadoop的历史及目前发展的现状、以及它们的技术特点,从而把握分布式计算框架及未来发展方向,在大数据时代能为企业的技术选型及架构设计提供决策参考。
    2、深入理解Greenplum的技术核心和管理操作,以此为基础,进而掌握MPP架构数据库的使用和调优的思想。
    3、全面掌握Hadoop的架构原理和使用场景,并通过贯穿课程的项目进行实战锻炼,从而熟练使用Hadoop进行MapReduce程序开发。
    4、深入理解Hadoop整体技术架构,包括HBase、Hive、Pig、ZooKeeper、Chukwa等,对Hadoop运作机制有清晰全面的认识,可以独立规划及部署生产环境的Hadoop集群,掌握Hadoop基本运维思路和方法,对Hadoop集群进行管理和优化。
    5、理解什么是云计算和Hadoop在云计算领域的运用,以及理解Hadoop在各个互联网巨头商业环境的运用。


    课程大纲:
    第一部分 Greenplum 分布式数据库基础(41课时)
    1 Greenplum架构
    什么是Greenplum
    Greenplum体系结构
    Greenplum高可用性架构
    2 安装Greenplum
    配置环境
    安装并初始化GPDB系统
    启停数据库
    配置GP系统
    3 分布式数据库存储
    数据是如何存储的
    分布策略
    4 GBDB查询处理
    查询命令的执行
    SQL查询处理机制
    并行查询计划
    5 角色权限及客户端认证管理
    客户端认证
    管理用户和组
    6 客户端接口和程序
    pgAdmin III
    PSQL
    7 定义数据库对象
    创建并管理数据库
    创建并管理表空间
    创建并管理模式
    创建并管理表
    分区表
    数据分布与分区
    压缩存储与行列存储
    序列、索引与视图
    8 管理数据
    插入、更新、删除记录
    事务管理
    空间回收和统计
    9 查询数据
    定义查询
    使用函数和运算符
    查询分析
    10 工作负载及资源管理
    GP工作负载管理概述
    配置工作负载管理
    创建资源队列
    分配资源队列
    检查资源队列状态
    11 装载和卸载数据
    GP装载命令概述
    装载数据到GP
    从GP卸载数据
    格式化数据文件
    12 备份恢复
    串行备份和恢复
    并行恢复和恢复
    13 性能调优
    如何进行调优
    常见的性能问题
    14 GP系统配置参数
    关于GP的Master参数与本地化参数
    设置配置参数
    配置参数种类
    15 开启高可用性
    GP高可用概述
    开启GP的Mirror
    获知Segment何时失败
    恢复失败的Segment
    恢复失败的Master
    16 GP MapReduce
    MapReduce基础
    GP MapReduce编程
    MapReduce作业执行和故障诊断
    第二部分 Hadoop分布式平台(55课时)
    1 Hadoop的起源和体系
    Hadoop思想起源:Google
    Hadoop子项目家族
    Hadoop的架构
    2 Hadoop的安装与配置
    准备和配置环境
    三种运行模式
    完全分布式模式安装
    3 HDFS-大数据存储
    HDFS概念与体系结构
    HDFS的可靠性
    HDFS文件操作
    HDFS API
    4 关于MapReduce
    MapReduce编程模型
    MapReduce的集群行为
    MapReduce任务的优化
    MapReduce工作机制
    错误处理及作业调度机制
    5 MapReduce应用开发
    Hadoop Eclipse插件开发
    数据筛选程序开发
    倒排索引程序开发
    6 Hadoop监控与管理
    页面监控
    hadoop备份
    7 HBase数据库
    Hbase体系结构
    HBase shell
    HBase API应用实例
    HBase场景应用
    HBase模式设计
    8 Hive数据仓库
    Hive组件与体系架构
    Hive安装配置
    Hive的服务接口
    HiveQL常用操作
    Hive的优化
    Hive UDF编程
    Hive综合实战
    9 Pig数据分析平台
    Pig框架
    Pig安装配置
    Pig的使用
    Pig的数据模型
    常用Pig Latin操作
    Pig UDF编程
    Pig数据分析实战
    10 ZooKeeper分布式服务框架
    ZooKeeper工作原理
    ZooKeeper设计目标
    ZooKeeper的数据结构和组成
    ZooKeeper的安装配置
    ZooKeeper命令行工具
    ZooKeeper API
    ZooKeeper实战:Hadoop任务调度
    11 Chukwa集群监控系统
    Chukwa的组成
    Chukwa架构和设计
    Chukwa安装与配置
    常用Chukwa命令
    实现自定义数据处理
    12 Hadoop商业应用案例
    云计算概念和特征
    云计算服务模式和形态
    Hadoop在云计算的运用
    京东商城
    百度
    阿里巴巴
    腾讯
    13 Greenplum Hadoop集群
    集成架构的特征
    集成架构的优势
    配置gphdfs协议使用环境
    使用HDFS外部表
    Hadoop视频教程详细查看:http://www.ibeifeng.com/goods-377.html

  • 相关阅读:
    CSS压缩工具(自动合并重复的定义)
    windows创建服务
    ashx是什么文件,如何创建(转载)
    在mojoportal中建立自定义模块
    Mojoportal2339之汇总页面
    在vs2008中设置jquery智能提示 (转载)
    关于mojoportal在局域网或单机使用时注意事项
    html编辑器kindeditor我的使用方法 (转载)
    visual studio 2008 没有设计视图的解决方法(转载)
    模块开发捷径配置参数
  • 原文地址:https://www.cnblogs.com/hadoop88/p/4075776.html
Copyright © 2020-2023  润新知