作者:ForrestGump-彭
链接:https://www.nowcoder.com/discuss/120918?type=2
来源:牛客网
hbase:
如何设计rowkey,region是怎么回事,怎么划分的,怎么定位的,写***作是怎么样的,什么情况下会刷写,wal是干啥用的,为啥要有这个东西存在,cap理论,这里我是看了一本叫hbase不睡觉的书,基本一天看完,基本就都了解了。
HDFS:
这个就要了解的详细点,是怎么存数据的,怎么对数据分块的,怎么读取数据的,都有什么控制的节点,各自都是做什么用的等等。断电的话怎么办,哪些数据丢失。。
Yarn:
有什么模式,模式之间的区别,yarn都是由什么组件组成的,都是干啥的。
mapreduce:
大数据开发最基本的原理,这个如果不理解那还是别做大数据开发了。
Kafka/zookeeper:
大家自己找些书看看,面试的时候被问过几个问题,我项目没用过这些,只是后来看了看博客,现在的问题也基本忘了,抱歉了。