一、课程地址
-
厦门大学数据库实验室
http://dblab.xmu.edu.cn/ -
《大数据技术原理与应用》教材官网
http://dblab.xmu.edu.cn/post/bigdata/ -
《大数据基础编程、实验和案例教程》教材官网
http://dblab.xmu.edu.cn/post/bigdatapractice/
注:推荐教材 -
大数据Linux实验环境虚拟机镜像文件
http://dblab.xmu.edu.cn/blog/1645-2/
镜像地址:https://pan.baidu.com/s/1kUWaNWz#list/path=%2F
Visual box 5.2+ubuntu 14.06.04 -
林子雨编著《大数据技术原理与应用》教材配套大数据软件安装和编程实践指南
http://dblab.xmu.edu.cn/post/5663/
重要网页,包含软件下载地址与编程实践指南两部分内容。 -
配套大数据软件下载地址
https://pan.baidu.com/s/1ZuY142dtMERuh4vfliAgJg#list/path=%2F
提取码:gx0b -
林子雨主讲入门级大数据在线课程(包含课程视频)
http://dblab.xmu.edu.cn/post/bigdata-online-course/#lesson0 -
大数据技术原理与应用 第二章 大数据处理架构Hadoop 学习指南
http://dblab.xmu.edu.cn/blog/285/ -
hadoop单机版与伪分布式安装步骤
http://dblab.xmu.edu.cn/blog/install-hadoop/ -
eclipse mars下载地址
https://www.eclipse.org/downloads/packages/release/mars/2 -
hadoop集群安装步骤
http://dblab.xmu.edu.cn/blog/install-hadoop-cluster/ -
ssh加密原理学习贴:
https://www.cnblogs.com/linzetong/p/10382432.html
https://www.cnblogs.com/pcheng/p/9629621.html
https://blog.csdn.net/udeankyd/article/details/81059704
https://blog.csdn.net/a1510841693/article/details/83743989 -
大数据技术原理与应用 第三章 分布式文件系统HDFS 学习指南
http://dblab.xmu.edu.cn/blog/290-2/ -
大数据原理与应用 第四章 分布式数据库HBase 学习指南
http://dblab.xmu.edu.cn/blog/install-hbase/ -
Hbase原理、基本概念、基本架构
https://blog.csdn.net/woshiwanxin102213/article/details/17584043 -
使用Eclipse编译运行MapReduce程序_Hadoop2.6.0_Ubuntu/CentOS(实验报告7)
http://dblab.xmu.edu.cn/blog/hadoop-build-project-using-eclipse/ -
林子雨编著《大数据技术原理与应用》教材配套上机练习题目
http://dblab.xmu.edu.cn/post/5645/
注:与书本课后实验对应,但是格式不一样,从学生角度出发。 -
厦门大学林子雨编著《大数据技术原理与应用》教材配套机房上机实验指南
http://dblab.xmu.edu.cn/post/6131/
注:与书本课后实验一致 -
PPT下载
http://dblab.xmu.edu.cn/post/5633/ -
中国大学mooc(hadoop)(未开课,不能看)
http://www.icourse163.org/course/XMU-1002335004 -
网易云课堂(hadoop)
https://study.163.com/course/courseMain.htm?courseId=1002887002&trace_c_p_k2=036309fb1fd04d16bad3fad81fe6e28a#/courseDetail?tab=1 -
林子雨Spark教材官网
http://dblab.xmu.edu.cn/post/spark/
包含实验指南网址 -
子雨大数据之Spark入门教程(Scala版)(教材文字版-简化版本)
http://dblab.xmu.edu.cn/blog/spark/
主要的学习材料 -
Scala安装(实验报告1)
http://dblab.xmu.edu.cn/blog/929-2/ -
scala下载地址
https://www.scala-lang.org/download/2.11.8.html
https://www.scala-sbt.org/download.html -
Spark安装(实验报告2)
http://dblab.xmu.edu.cn/blog/1307-2/ -
使用Eclipse编写Spark应用程序(Scala+SBT)
http://dblab.xmu.edu.cn/blog/1490/ -
网易云课堂(spark)
https://study.163.com/course/introduction/1005031005.htm -
中国大学mooc(spark)
http://www.icourse163.org/course/XMU-1205811805 -
教材百度网盘
https://pan.baidu.com/s/1l80bqAUpvnFTMNRHEyODeQ#list/path=%2F
提取码:vdgm -
ppt下载
http://dblab.xmu.edu.cn/post/7659/#kejianxiazai -
在集群上运行Spark应用程序
http://dblab.xmu.edu.cn/blog/1217-2/ -
Spark 2.0分布式集群环境搭建
http://dblab.xmu.edu.cn/blog/1187-2/ -
Spark快速入门指南 – Spark安装与基础使用
http://dblab.xmu.edu.cn/blog/spark-quick-start-guide/ -
网易云课堂视频(spark)
https://study.163.com/course/introduction.htm?courseId=1005031005#/courseDetail?tab=1
二、hadoop实验报告
1、实验报告1:
2019/10/3 ubuntukylin16.04(Original) 原始安装盘
2019/10/3 ubuntukylin16.04(1) = ubuntukylin16.04(Original)+安装vmware-tools
2、实验报告2:
2019/10/3 ubuntukylin16.04(2) = ubuntukylin16.04(1)+ssh
2019/10/5 ubuntukylin16.04(3)=ubuntukylin(2)+jdk
2019/10/5 ubuntukylin16.04(4)=ubuntukylin(3)+hadoop(单机版)
2019/10/14 ubuntukylin16.04(5)= ubuntukylin16.04(4)+伪分布配置
3、实验报告3:
2019/10/25 master= ubuntukylin16.04(4)+集群配置
2019/10/25 slave1= ubuntukylin16.04(4)+集群配置
4、实验报告4:
2019/11/5 ubuntukylin16.04(5.5)= ubuntukylin16.04(5)+eclipse(在线安装)
内容:1)基于ubuntu(5)版本,安装eclipse,形成5.5版本。
2)基于ubuntu(5.5)版本,完成shell HDFS练习。
3)基于ubuntu(5.5)版本,基于eclipse完成HDFS程序开发。
备注:离线安装eclipse-java-mars-2-linux-gtk-x86_64.tar.gz,非常卡,几乎不能使用,故改为在线安装方式,版本号为3.8.1
5、实验报告5:
2019/11/03 ubuntukylin16.04(6)=ubuntu16.04(5)+hbase+hbase单机版配置
2019/11/03 ubuntukylin16.04(7)=ubuntu16.04(6)+hbase伪分布式版配置
内容:1)基于ubuntu(5)版本,完成HBASE单机版配置,形成ubuntu(6)版本。
2)基于ubuntu(6)版本,完成HBASE伪分布式配置,形成ubuntu(7)版本。
3)基于ubuntu(7)版本,完成HBASE SHELL命令练习。
6、实验报告6:
2019/11/03 ubuntukylin16.04(8)= ubuntukylin16.04(7)+eclipse(在线安装)+HBASE实例程序
内容:
1)基于ubuntu(7)版本,在线安装eclipse,形成ubuntu(8)。
2)基于ubuntu(8)版本,完成eclipse HBASE编程实践。
7、实验报告7
2019/12/15 ubuntukylin16.04(9)= ubuntukylin16.04¬(8)+ hadoop-eclipse-kepler-plugin-2.6.0.jar
内容:1)基于ubuntu(8)版本,安装eclipse插件,形成ubuntukylin16.04(9)版本。
2)基于ubuntu(9)版本,完成eclipse MapReduce程序开发。
三、Spark实验报告
1、实验报告1:安装scala
2020/2/7 ubuntukylin16.04(10)= ubuntukylin16.04(4)+scala-2.11.8
内容:1)基于ubuntukylin16.04(4)版本,安装scala-2.11.8,形成ubuntukylin16.04(10)
参照http://dblab.xmu.edu.cn/blog/spark/的快学scala部分,完成实例练习。
2、实验报告2:安装spark
2020/2/10 ubuntukylin16.04(11)=ubuntukylin16.04(10)+spark2.1.0+sbt0.13.15
内容:参考http://dblab.xmu.edu.cn/blog/1307-2/ ,基于ubuntukylin16.04(10),安装spark2.1.0和sbt0.13.15