• 2020系统综合实践 第4次实践作业


    使用Docker-compose实现Tomcat+Nginx负载均衡

    (1)理解反向代理原理

    参考资料


    总结起来就是一句话:正向代理代理客户端,反向代理代理服务器

    (2)nginx代理tomcat集群,代理2个以上tomcat;

    参考资料
    文件结构

    编写default.conf

    user  nginx;
    worker_processes  1;
     
    error_log  /var/log/nginx/error.log warn;
    pid        /var/run/nginx.pid;
     
     
    events {
        worker_connections  1024;
    }
     
     
    http {
        include       /etc/nginx/mime.types;
        default_type  application/octet-stream;
     
        log_format  main  '$remote_addr - $remote_user [$time_local] "$request" '
                          '$status $body_bytes_sent "$http_referer" '
                          '"$http_user_agent" "$http_x_forwarded_for"';
     
        access_log  /var/log/nginx/access.log  main;
     
        sendfile        on;
        #tcp_nopush     on;
     
        keepalive_timeout  65;
     
        #gzip  on;
     
        #include /etc/nginx/conf.d/*.conf;
     
        upstream tomcat_client {
             server t01:8080 ;
             server t02:8080 ;
        } 
     
        server {
            server_name "";
            listen 80 default_server;
            listen [::]:80 default_server ipv6only=on;
     
            location / {
                proxy_pass http://tomcat_client;
                proxy_redirect default;
                proxy_set_header Host $host;
                proxy_set_header X-Real-IP $remote_addr;
            }
        }
    }
    

    编写docker-compose.yml

    version: "3"
    services:
      tomcat001:
        image: tomcat:8.5.0
        ports:
          - "8083:8080"
        restart: "always"
        container_name: tomcat001
        volumes:
                - ./tomcat1:/usr/local/tomcat/webapps/ROOT 
      tomcat002:
        image: tomcat:8.5.0
        ports:
          - "8082:8080"
        container_name: tomcat002
        restart: "always"
        volumes:
                - ./tomcat2:/usr/local/tomcat/webapps/ROOT
      nginx:
        image: nginx
        volumes:
          - ./nginx/default.conf:/etc/nginx/nginx.conf
        ports:
          - "81:80"
        links:
          - tomcat001:t01
          - tomcat002:t02
    

    两个tomcat的html文件
    tomcat1

    <!DOCTYPE html>
    <html>
    <head>
    <meta charset="utf-8">
    <title>tomcat</title>
    </head>
    <body>
        <h1>This is tomcat NO.1</h1>
    </body>
    </html>
    

    tomcat2

    <!DOCTYPE html>
    <html>
    <head>
    <meta charset="utf-8">
    <title>tomcat</title>
    </head>
    <body>
        <h1>This is tomcat NO.2</h1>
    </body>
    </html>
    

    构建

    sudo docker-compose up -d --build
    

    测试(默认负载均衡是轮询,两个不同页面会轮流出现)


    (3)了解nginx的负载均衡策略,并至少实现nginx的2种负载均衡策略;

    轮询策略:每个服务器轮流提供服务
    这是默认策略,直接测试就好了
    访问100次,观察两种页面出现的顺序关系和次数统计
    由于抓取的是网页的源代码,如果直接输出源代码不利于观察,所以算法的思路就是识别和统计这两种不同的源代码,并将一个网页标记为page1,另一个标记为page2


    权重策略:每个服务器以正比于其权重的概率被访问
    修改default.conf

    upstream tomcat_client {
             server t01:8080 weight=3;
             server t02:8080 weight=1;
        } 
    

    访问10000次,统计两种不同页面出现的次数(我本来以为结果会是接近3:1,没想到会是刚刚好的3:1,试了几次都是这样)

    使用Docker-compose部署javaweb运行环境

    (1)分别构建tomcat、数据库等镜像服务;
    (2)成功部署Javaweb程序,包含简单的数据库操作;
    (3)为上述环境添加nginx反向代理服务,实现负载均衡。
    鉴于javaweb学习成本太高和一周4个实验课的压力,最终选择使用参考链接中的项目。
    文件结构

    其中wait-for-it.sh参考这里
    配置文件
    docker-compose.yml

    version: "3"   
    services:    
      tomcat00:     
        image: tomcat    
        hostname: hostname       
        container_name: tomcat00   
        ports:      
         - "5050:8080"          #后面访问网页的时候要选择对应的端口号5050
        volumes:  #数据卷
         - "./webapps:/usr/local/tomcat/webapps"
         - ./wait-for-it.sh:/wait-for-it.sh
        networks:   #网络设置静态IP
          webnet:
            ipv4_address: 15.22.0.15
      mymysql:  #mymysql服务
        build: .   #通过MySQL的Dockerfile文件构建MySQL
        image: mymysql:test
        container_name: mymysql
        ports:
          - "3309:3306" 
    
        command: [
                '--character-set-server=utf8mb4',
                '--collation-server=utf8mb4_unicode_ci'
        ]
        environment:
          MYSQL_ROOT_PASSWORD: "123456"
        networks:
          webnet:
            ipv4_address: 15.22.0.6
      nginx:
          image: nginx
          container_name: "nginx-tomcat"
          ports:
              - 8080:8080
          volumes:
              - ./default.conf:/etc/nginx/conf.d/default.conf # 挂载配置文件
          tty: true
          stdin_open: true
          networks:
           webnet:
            ipv4_address: 15.22.0.7
    networks:   #网络设置
     webnet:
       driver: bridge  #网桥模式
       ipam:
         config:
          - 
           subnet: 15.22.0.0/24   #子网
    

    default.conf

    upstream tomcats {
        server tomcat00:5050; 
    
    }
    
    server {
        listen 8080
        server_name localhost;
    
        location / {
            proxy_pass http://tomcat123;
            proxy_set_header   Host    $host; 
            proxy_set_header   X-Real-IP   $remote_addr; 
            proxy_set_header   X-Forwarded-For $proxy_add_x_forwarded_for;
    
        }
    }
    
    

    docker-entrypoint.sh

    #!/bin/bash
    mysql -uroot -p123456 << EOF
    source /usr/local/grogshop.sql;
    

    Dockerfile

    #  这个是构建MySQL的dockerfile
     
    FROM registry.saas.hand-china.com/tools/mysql:5.7.17
     
    # mysql的工作位置
    ENV WORK_PATH /usr/local/
    
    # 定义会被容器自动执行的目录
    ENV AUTO_RUN_DIR /docker-entrypoint-initdb.d
     
    #复制gropshop.sql到/usr/local 
    COPY grogshop.sql  /usr/local/
    #把要执行的shell文件放到/docker-entrypoint-initdb.d/目录下,容器会自动执行这个shell
    COPY docker-entrypoint.sh  $AUTO_RUN_DIR/
     
    #给执行文件增加可执行权限
    RUN chmod a+x $AUTO_RUN_DIR/docker-entrypoint.sh
     
    # 设置容器启动时执行的命令
    #CMD ["sh", "/docker-entrypoint-initdb.d/import.sh"]
    

    修改连接数据库的ip为本机ip

    cd /home/tinor/lzz/webapps/ssmgrogshop_war/WEB-INF/classes
    vim jdbc.properties
    

    构建并且启动容器

    docker-compose up -d --build
    

    访问网页并测试数据库操作

    localhost:5050/ssmgrogshop_war
    

    以新增商品为例,新增一个酸奶,对于数据库的增加操作


    删除娃哈哈和雪碧


    修改可乐价格


    修改以下文件,实现反向代理
    default.conf

    upstream tomcat123 {
        server tomcat00:8080;
    }
    
    server {
        listen 8080;
        server_name localhost;
    
        location / {
            proxy_pass http://tomcat123;
        }
    }
    

    yml文件

    version: "3"   #版本
    services:     #服务节点
      tomcat:     #tomcat 服务
        image: tomcat    #镜像
        hostname: hostname       #容器的主机名
        container_name: tomcat00   #容器名
        ports:      #端口
         - "5050:8080"
        volumes:  #数据卷
         - "./webapps:/usr/local/tomcat/webapps"
         - ./wait-for-it.sh:/wait-for-it.sh
        networks:   #网络设置静态IP
          webnet:
            ipv4_address: 15.22.0.15
      mymysql:  #mymysql服务
        build: .   #通过MySQL的Dockerfile文件构建MySQL
        image: mymysql:test
        container_name: mymysql
        ports:
          - "3309:3306" 
    #红色的外部访问端口不修改的情况下,要把Linux的MySQL服务停掉
    #service mysql stop
    #反之,将3306换成其它的
        command: [
                '--character-set-server=utf8mb4',
                '--collation-server=utf8mb4_unicode_ci'
        ]
        environment:
          MYSQL_ROOT_PASSWORD: "123456"
        networks:
          webnet:
            ipv4_address: 15.22.0.6
      nginx:
          image: nginx
          container_name: "nginx-tomcat"
          ports:
              - 8080:8080
          volumes:
              - ./default.conf:/etc/nginx/conf.d/default.conf # 挂载配置文件
          tty: true
          stdin_open: true
          networks:
           webnet:
            ipv4_address: 15.22.0.7
    networks:   #网络设置
     webnet:
       driver: bridge  #网桥模式
       ipam:
         config:
          - 
           subnet: 15.22.0.0/24   #子网
    

    Dockerfile不用修改
    重新构建和启动容器即可。

    通过8080端口访问nginx服务器
    可以看到实际访问到的网页是tomcat服务器中的项目,说明反向代理成功了

    使用Docker搭建大数据集群环境

    (1)hadoop分布式集群环境配置,至少包含三个节点(一个master,两个slave);

    在docker安装ubuntu系统

    docker pull ubuntu
    

    安装完成后,在启动Ubuntu镜像时,需要先在个人文件下创建一个目录,用于向Docker内部的Ubuntu系统传输文件;然后再在Docker上运行Ubuntu系统;
    -v 表示docker内部的ubuntu系统/root/build目录与本地/home/tinor/build共享;这可以很方便将本地文件上传到Docker内部的Ubuntu系统;

    mkdir build
    docker run -it -v /home/tinor/build:/root/build --name ubuntu ubuntu
    

    Ubuntu系统初始化
    刚安装好的Ubuntu系统,是一个很纯净的系统,很多软件是没有安装的,所以我们需要先更新下Ubuntu系统的源以及安装一些必备的软件;
    以下操作在ubuntu容器内进行
    更新系统软件源

    apt-get update
    

    安装vim和sshd

    apt-get install vim
    apt-get install ssh  #在开启分布式Hadoop时,需要用到ssh连接slave
    

    开启sshd服务器

    /etc/init.d/ssh start
    

    把这启动命令写进~/.bashrc文件,这样我们每次登录Ubuntu系统时,都能自动启动sshd服务

    vim ~/.bashrc
    

    在该文件中最后一行添加如下内容:

    /etc/init.d/ssh start
    

    配置sshd
    安装好sshd之后,我们需要配置ssh无密码连接本地sshd服务,如下命令:

    cd ~/.ssh
    ssh-keygen -t rsa #一直按回车键即可
    cat id_rsa.pub >> authorized_keys  
    

    接下来使用的安装方法是大数据实验课程的方法
    先准备好jdk和hadoop的安装包(安装包是大数据的老师提供的,直接粘贴到虚拟机里就行了)

    安装JDK
    在/usr/lib 目录下新建文件夹jvm,将JDK安装包解压到该文件夹下。

    tar -zxvf /root/build/jdk-8u162-linux-x64.tar.gz -C /usr/lib/jvm
    

    jdk环境变量配置
    vim打开用户环境变量配置文件即用户主目录下的.bashrc文件,添加如下环境变量;

    vim ~/.bashrc
    
    export JAVA_HOME=/usr/lib/jvm/jdk1.8.0_162
    export JRE_HOME=$JAVA_HOME/jre
    export CLASSPATH=.:$JAVA_HOME/lib:$JRE_HOME/lib
    export PATH=$PATH:$JAVA_HOME/bin
    
    

    用 source ~/.bashrc命令使之生效。在任意目录下查看 Java 版本号 或执行java 命令出现如下提示则表示 JDK 环境配置成功。

    安装Hadoop
    把下载下来的Hadoop安装文件放到共享目录/home/tinor/build下面,然后在Docker内部Ubuntu系统的/root/build目录即可获取到Hadoop安装文件;

    cd /root/build
    tar -zxvf hadoop-3.1.3.tar.gz -C /usr/local   #大数据实验课用的是3.1.3版本,刚好拿过来用
    

    Hadoop环境变量配置(将上面的环境变量修改为如下,是修改不是追加)

    vim ~/.bashrc
    
    export JAVA_HOME=/usr/lib/jvm/jdk1.8.0_162
    export JRE_HOME=$JAVA_HOME/jre
    export HADOOP_HOME=/usr/local/hadoop-3.1.3
    export CLASSPATH=.:$JAVA_HOME/lib:$JRE_HOME/lib
    export PATH=$PATH:$HADOOP_HOME/sbin:$HADOOP_HOME/bin:$JAVA_HOME/bin
    

    执行hadoop version 命令测试环境变量是否配置成功,配置成功则显示如下版本信息。

    配置Hadoop集群
    进入配置文件存放目录

    cd /usr/local/hadoop-3.1.3/etc/hadoop
    

    配置hadoop-env.sh

    export JAVA_HOME=/usr/lib/jvm/jdk1.8.0_162
    

    配置workers

    slave01
    slave02
    

    配置core-site.xml

    <configuration>
    	<property>
    		<name>hadoop.tmp.dir</name>
    		<value>file:/usr/local/hadoop-3.1.3/tmp</value>
    		<description>A base for other temporary directories.</description>
    	</property>
    	<property>
    		<!--hdfs://host:port-->
    		<name>fs.defaultFS</name>
    		<value>hdfs://Master:9000</value>
    	</property>
    </configuration>
    

    配置hdfs-site.xml

    <configuration>
    	<property>
    		<name>dfs.replication</name>
    		<value>1</value>
    	</property>
    	<property>
    		<name>dfs.namenode.name.dir</name>
    		<value>file:/usr/local/hadoop-3.1.3/tmp/dfs/name</value>
    	</property>
    	<property>
    		<name>dfs.datanode.data.dir</name>
    		<value>file:/usr/local/hadoop-3.1.3/tmp/dfs/data</value>
    	</property>
    </configuration>
    

    配置mapred-site.xml

    <configuration>
    	<property>
    		<name>mapreduce.framework.name</name>
    		<value>yarn</value>
    	</property>
    	<property>
    		<name>mapreduce.jobhistory.address</name>
    		<value>Master:10020</value>
    	</property>
    	<property>
    		<name>mapreduce.jobhistory.webapp.address</name>
    		<value>Master:19888</value>
    	</property>
    	<property>
    		<name>mapreduce.application.classpath</name>
    		<value>/usr/local/hadoop-3.1.3/share/hadoop/mapreduce/lib/*,/usr/local/hadoop-3.1.3/share/hadoop/mapreduce/*</value>
    	</property>
    </configuration>
    

    配置yarn-site.xml

    <configuration>
    
    <!-- Site specific YARN configuration properties -->
    	<property>
    		<name>yarn.resourcemanager.hostname</name>
    		<value>Master</value>
    	</property>
    	<property>
    		<name>yarn.nodemanager.aux-services</name>
    		<value>mapreduce_shuffle</value>
    	</property>
    	<property>
    		<name>yarn.nodemanager.vmem-pmem-ratio</name>
    		<value>2.5</value>	
    	</property>
    </configuration>
    

    emmm 在这个位置其实应该还有一步修改脚本的操作,第一次做到这里的时候没有修改脚本,导致出现错误,所以修改脚本的操作就放在问题4了。

    保存这个镜像,在其他终端输入如下命令:

    docker commit [容器id] ubuntu/hadoopinstalled
    

    在三个终端上开启三个容器运行ubuntu/hadoopinstalled镜像,分别表示Hadoop集群中的master,slave01和slave02;

    # 第一个终端
    docker run -it -h master --name master ubuntu/hadoopinstalled
    # 第二个终端
    docker run -it -h slave01 --name slave01 ubuntu/hadoopinstalled
    # 第三个终端
    docker run -it -h slave02 --name slave02 ubuntu/hadoopinstalled
    

    接着配置master,slave01和slave02的地址信息,这样他们才能找到彼此,分别打开/etc/hosts可以查看本机的ip和主机名信息,最后得到三个ip和主机地址信息如下:

    172.17.0.2      master
    172.17.0.3      slave01
    172.17.0.4      slave02
    

    最后把上述三个地址信息分别复制到master,slave01和slave02的/etc/hosts即可

    我们可以用如下命令来检测下是否master是否可以连上slave01和slave02

    ssh slave01
    ssh slave02
    

    在master终端上,运行如下命令开启hadoop集群:

    cd /usr/local/hadoop-3.1.3
    hdfs namenode -format   #格式化
    start-dfs.sh   #启动 HDFS
    start-yarn.sh  #启动 YARN
    mapred --daemon start historyserver   #启动 Job History Server
    

    第二条命令执行后要在输出中找到这样的提示才算成功

    这时Hadoop集群就已经开启,我们可以在master,slave01和slave02上分别运行命令jps查看运行结果;

    用hdfs dfsadmin –report 查看信息,Live datanodes 不为 0 表示数据节点正常启动。

    (2)运行hadoop自带的测试实例

    准备输入文件夹和输入文件

    cd /usr/local/hadoop-3.1.3
    hdfs dfs -mkdir /user
    hdfs dfs -mkdir /user/tinor
    hdfs dfs -mkdir /user/tinor/input
    hdfs dfs -put etc/hadoop/*.xml /user/tinor/input  #将xml复制到input下,作为输入文件
    

    运行grep实例程序:

    hadoop jar /usr/local/hadoop-3.1.3/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.1.3.jar grep /user/tinor/input /user/tinor/output 'dfs[a-z.]+'
    

    查看输出结果:

    hdfs dfs -cat /user/tinor/output/*
    

    (4)实验报告

    遇到的问题

    问题1:

    解决:
    要注意自己的文件路径和教程可能不一样

    问题2:

    解决:回看博客前面的内容,发现自己把公钥放错地方了

    问题3:
    这是一个很坑爹的问题,当我把hadoop环境安装好之后,也保存了镜像,这时候系统提示存储空间不足了,然后我看到这个镜像2G左右大小,然后想到等一下得要开启3个容器,这个虚拟机只分配了4G内存,估计不够用,于是关机多分配一些内容,然后重新启动的时候就进不去了。
    解决:
    我想到那个存储空间不足的提示,大概是存储空间被挤爆了然后开机的时候出现问题,于是去找度娘,找到了一个靠谱的博客(忘记记下地址了,现在找不到了),大概意思就是按ctrl+Alt+F2可以进入终端,然后用命令行删掉一些文件,用df-l查看磁盘用量,等删到磁盘空间用量小于100%的时候就可以开机了。
    问题4:

    解决:查询了百度,找到如下方案
    在Hadoop安装目录下找到sbin文件夹
    在里面修改四个文件
    1、对于start-dfs.sh和stop-dfs.sh文件,添加下列参数:

    #!/usr/bin/env bash
    HDFS_DATANODE_USER=root
    HADOOP_SECURE_DN_USER=hdfs
    HDFS_NAMENODE_USER=root
    HDFS_SECONDARYNAMENODE_USER=root
    

    2、对于start-yarn.sh和stop-yarn.sh文件,添加下列参数:

    #!/usr/bin/env bash
    YARN_RESOURCEMANAGER_USER=root
    HADOOP_SECURE_DN_USER=yarn
    YARN_NODEMANAGER_USER=root
    

    问题5:两个slave节点都没有datanode

    解决:
    这个问题做大数据实验的时候就遇到了,没想到这次又遇到了,跟当时一样,用百度的方法解决没有用,最后还是返工重新配置一遍结果就好了,历史总是惊人的相似...
    PS:返工是从开启三个容器那一步开始的。

    后来看到群里在讨论这个问题,所以就把老师和同学的回答码在这里
    多次格式化导致ClusterID不一致等问题?
    第一种解决方法是删除安装目录下的tmp文件夹后重新格式化;
    第二种解决方法是打开${HADOOP_HOME}/tmp/dfs/name/current/VERSION和${HADOOP_HOME}/tmp/dfs/data/current/VERSION将两个文件里的clusterID设置为一致。


    问题6:不会javaweb开发
    解决:尝试学习javaweb,但是学习成本太高,又加上每周要做4个实验,最后还是选择向参考项目屈服。

    经验和感想

    这次的实验量明显比之前的大,难度也更高。之前的几次实验都是一直参考其他同学的做法,做得都比较顺利,但是做完会有一种很空虚的感觉,于是这次我一开始就不打算去借鉴其他同学的博客,很早就开始自己动手做,这才发现自己动手做是真的不容易,跌跌撞撞会遇到好多问题,而且每次解决都要花好多时间,最终实验一和实验三是自己独立做完的,实验二由于实在没时间学javaweb就用了参考项目,也参考了其他同学的做法。最后的感想就是自己独立完成的话真的很痛苦,但是也能明显感觉到自己对问题的理解更加透彻,对知识和技能掌握得会更好一些。

    耗时

    第一个实验 2h
    第二个实验 先是折腾了3h无果,去做第三个实验,后来又折腾了6h才做完
    第三个实验 不断返工,中间还遇到了虚拟机因为存储满无法启动的问题,来来回回花了12h左右
    总计23h(包括写博客时间)

  • 相关阅读:
    静态查找表和动态查找表
    内存分配
    常用不等式
    考研线性代数(向量,线性方程组)
    考研线性代数(矩阵)
    考研线性代数(行列式)
    微积分常用思想方法小结
    bug修复集合(不定期更新)
    上下文对象及servletContext接口
    手动编解码解决get提交错误的问题
  • 原文地址:https://www.cnblogs.com/Tinor/p/12870485.html
Copyright © 2020-2023  润新知