1、熟悉linux操作,包括常见的命令
2、了解学习vmware的一些高级的使用场景
3、做了一年的基于rdms数据仓库的开发、ETL工具的开发,彻底了解CUBE的计算过程,同时与分布式里面的hive、kylin原理的理解
4、安装使用分布式计算引擎、包括hadoop、spark、storm、kakfa、fluem生态系统的环境打架以及使用的场景。
所以这一年的工作主要是开发传统模式的数据仓库的开发,如何聚合CUBE、如何设计实现ETL的工具,为下一年进入分布式计算打下基础。
1、熟悉linux操作,包括常见的命令
2、了解学习vmware的一些高级的使用场景
3、做了一年的基于rdms数据仓库的开发、ETL工具的开发,彻底了解CUBE的计算过程,同时与分布式里面的hive、kylin原理的理解
4、安装使用分布式计算引擎、包括hadoop、spark、storm、kakfa、fluem生态系统的环境打架以及使用的场景。
所以这一年的工作主要是开发传统模式的数据仓库的开发,如何聚合CUBE、如何设计实现ETL的工具,为下一年进入分布式计算打下基础。