下面列出我搭建hadoop应用环境的文章整理在一起,不定期更新,供大家参考,互相学习!!!
杂谈篇:
【英语学习】 Re-pick up English for learning big data (not updated regularly)
第一篇 大数据主流技术之HADOOP部分
1.2 编译Hadoop连接eclipse的插件遇见的一系列错误,崩溃的操作
第二篇 大数据主流技术之HIVE与HBASE部分
2.2 centos7下apache-hive-3.1.2-bin的安装测试
2.3 apache-zookeeper-3.5.5的安装测试
2.4 hbase-2.2.1配置独立的zookeeper的安装与测试
第三篇 大数据主流技术之SQOOP与ZOOKEEPER部分
3.2 安装部署kafka集群(kafka版本:kafka_2.12-2.3.0)
第四篇 内存计算主流技术之SPARK与SCALA部分
4.4 scala&sbt+idea+spark使用过程中问题汇总(不定期更新)
4.5 spark应用(分布式估算圆周率+基于Spark MLlib的贷款风险预测)
脚本:
命令 :
Hadoop:
启动:sbin/start-all.sh 或 start-dfs.sh + start-yarn.sh
停止:stop-all.sh
启功历史服务器:sbin/mr-jobhistory-daemon.sh start jobhistoryserver
注:因Hadoop和Spark启动命令一样,故在设置环境变量时只设置其中一个
MySQL:
启动:service mysqld start
停止:service mysqld stop
状态:service mysqld status
Spark:
启动:sbin/start-all.sh
停止:stop-all.sh
idea:
启动:bin/idea.s
文件分享:
链接:https://pan.baidu.com/s/1e6zz4p-rCbzzE5DxMA4eFw
提取码:amdl