大数据组件以及岗位职业规划
https://www.bilibili.com/video/BV1zE411L7v7?from=search&seid=13769678672608071444
flume
相当于水泵,如果数据量比较大可以进行串联,各部位对应关系如上。
kafka
1、数据处理速度<<数据采集速度的时候可以先进行缓存
2、对数据进行简单处理,也就是相当于去杂质
spark 功能分类
spark 分为离线计算的 spark core spark sql spark mlib spark R 还有在线计算的spark streaming 还有更快的storm
javaee 作用范围
spark 体系的数据流程
软件平台架构
大数据生态体系
数据计算层少了个流行的flink
推荐系统项目架构
从韩老师买善存片在javaee项目下产生日志,而后流入大数据处理解析最后到推荐业务再到推荐韩老师买善存片
大数据职位
ETL数据的抽取转换和加载
大数据挖掘师/算法工程师
大数据工程师
大数据运维工程师
大数据仓库工程师
产品经理
大数据架构师
大数据新技术
基础知识学完之后的大厂高频面试、企业级项目
最后是源码剖析
老韩文档想办法搞到--已经搞到,现存百度网盘中
大数据岗位职业规划
https://gitee.com/li521miao/xsj_lsk/raw/master/xsj/1591844498966.png