• 教你用squid做CDN把公司做到上市


    我们都知道CDN(内容分发网络)是用来给网站加速用的,通过在现有的Internet中增加一层新的网络架构,将网站的内容发布到最接近用户的网络的“边缘”,使用户可以就近取得所需的内容,以提高用户访问网站的响应速度,目前国外的CDN技术已经是如火如荼,而国内也已经是异军突起,像网宿、帝联、cdn联盟、蓝汛等等纷纷加入到CDN的行列.那么到底CDN是通过什么技术来实现的呢?其实说白了目前国内众多CDN厂商都是使用软件技术—Squid也就是代理服务器的方式实现,其本身成本比较低、配置方便灵活.其内容服务模式是基于缓存服务器,也叫做代理缓存.主要的技术是网络负载均衡(多个squid代理服务器)、动态内容分发复制和缓存技术,简单的说当一个用户访问已经加入CDN服务(squid代理)的网站时,用户的请求并不直接发送到后端web服务器,而是发送到squid服务器(CDN中称节点),squid再根据本地的DNS记录向后端的目标web服务器发送请求,请求有响应并返回数据时squid会先将数据缓存一份到本地服务器上,然后返回结果给用户,当下一位客户访问相同的内容时直接从squid上返回结果而不经过后端web服务器,从而节约网站带宽,加速客户访问速度。下面的配置告诉你CDN是如何实现
    1.此处我们使用的是源代码包编译的方式安装,squid源代码包可以从以下站点下载http://www.squid-cache.org/Versions/v2/2.7/squid-2.7.STABLE9.tar.gz
    2在系统的根目录下我们创建一个名为squid的文件夹用作squid安装目录并进入此目录,将你下载好的源代码包放置于此目录,使用以下命令:
    mkdir /squid 
    cd /squid
    3.在开始编译安装之前我们还需要做些准备工作:
    service iptables stop -------停止iptables服务
    service httpd stop  ------停止httpd服务
    安装squid所需要的组件
    yum –y install gcc-c++ net-snmp net-snmp-utils make
    创建squid用户且此用户不能登陆系统
    useradd squid -M -c "Squid user" -d /dev/null -s /sbin/nologin
    命令查看文件描述符
    ulimit -n unlimited
    ulimit -n
    1048576
    ulimit -HSn 1048576 -----设置文件描述符,此处我们设置的文件描述符是1048576
    4.编译配置squid
    进入目录cd /squid
    使用命令tar-zxvf /squid/squid-2.7.STABLE9.tar.gz解压源代码包,解压后生成目录squid-2.7. STABLE9
    cd squid-2.7. STABLE9
    开始编译安装,使用命令:
    ./configure --enable-kill-parent-hack --enable-large-cache-files --with-large-files --with-maxfd=344800 --enable-snmp --disable-ident-lookups --enable-carp --enable-async-io=160 --enable-storeio=ufs,aufs,diskd,null,coss --enable-epoll --enable-linux-netfilter --enable-stacktraces --enable-forward-log --enable-referer-log --enable-useragent-log --enable-delay-pools --enable-follow-x-forwarded-for --enable-forw-via-db --enable-default-err-language=Simplify_Chinese --enable-err-languages="Simplify_Chinese English" --without-system-md5 --disable-internal-dns --prefix=/squid
    make
    make install
    Configure 选项
     --prefix=/squid 这里为squid的安装目录
     --enable-kill-parent-hack 关掉squid进程时连同父进程也一起关掉(enable表示开启此项功能,disable则表示关闭)
     --enable-large-cache-files 支持大的缓存文件
     --with-large-files 支持大的文件
     --with-maxfd=344800 覆盖的最大数量的filedescriptors
     --enable-snmp 简单网络管理协议(SNMP)是监视网络设备和服务器的流行方法。该选项导致编译过程去编译所有的SNMP相关的代码,包括一个裁切版本的CMU SNMP库
     --disable-ident-lookups  ident是一个简单的协议允许服务器利用客户端的特殊TCP连接来发现用户
     --enable-carp  Cache数组路由协议(CARP)用来转发丢失的cache到父cache的数组或cluster
     --enable-async-io=160 同步I/O 是squid 技术之一,用以提升存储性能。aufs 模块使用大量的线程来执行磁盘I/O 操作。该代码仅仅工作在linux 和solaris 系统中。=N_THREADS 参数改变squid 使用的线程数量  此处Io是有瓶颈限制的
     ----enable-storeio=ufs,aufs,diskd,null,coss  Squid 支持大量的不同存储模块。通过使用该选项,你告诉squid 编译时使用哪个模块
     --enable-epoll 支持epoll的IO模式,2.6以上内核才具有
     --enable-linux-netfilter  netfilter是linux内核的包过滤器的名字
    --enable-stacktraces 某些系统支持在程序崩溃时,自动产生数据追踪。当你激活该功能后,如果squid崩溃,数据追踪信息被写到cache.log文件。这些信息对开发和程序bug调试有用
    --enable-forward-log 支持实验forward-log指令
    --enable-referer-log 该选项激活来自客户请求的HTTP referer 日志
    --enable-useragent-log 该选项激活来自客户请求的HTTP 用户代理头的日志
    --enable-delay-pools 延时池是squid 用于传输形状或带宽限制的技术。该池由大量的客户端IP 地址组成。当来自这些客户端的请求处于cache 丢失状态,他们的响应可能被人工延迟
    --enable-follow-x-forwarded-for 当一个请求被另一些代理服务器转发时通过从http头中寻找X-Forwarded-For来发现直接或间接的客户端的IP地址
    --enable-forw-via-db  支持forw/via 数据库
    --enable-default-err-language=Simplify_Chinese  该选项设置error_directory指令的默认值
    --enable-err-languages="Simplify_Chinese English"  squid支持定制错误消息,错误消息可以用多种语言报告。该选项指定复制到安装目录($prefix/share/errors)的语言
    --without-system-md5 不使用md5加密算法
    --disable-internal-dns  squid源代码包含两个不同的DNS解决方案,叫做“内部的”和“外部的”。内部查询是默认的,但某些人可能要使用外部技术。该选项禁止内部功能,转向使用旧的方式
    给squid创建缓存目录并赋予相应的权限
    mkdir  /data 
    mkdir  /data/cache1
    chmod –R 777 /data/cache1
    chmod –R 777 /squid/var/
    chmod –R 777 /squid/var/logs/
    chown -R squid:squid /data/cache1
    chown -R squid:squid /squid/var/logs
    5.编辑squid配置文件
    rm –rf /squid/etc/squid.conf
    vi /squid/etc/squid.conf
    cache_peer 192.168.1.30 parent 8080 0 no-query round-robin max-conn=32 originserver name=ip
    cache_peer_domain ip 192.168.1.30 此处还可增加多个squid节点IP,用于负载均衡、动态内容分发与复制
    ------反向代理 语法cache_peer Web服务器地址 服务器类型 http端口 
    ------ACL访问控制列表-----
    acl all src 0.0.0.0/0.0.0.0
    acl manager proto cache_object
    acl localhost src 127.0.0.1/255.255.255.255
    acl to_localhost dst 127.0.0.0/8
    acl SSL_ports port 443 563
    acl Safe_ports port 80          # http
    acl Safe_ports port 800         # http1
    acl Safe_ports port 21          # ftp
    acl Safe_ports port 443 563     # https, snews
    acl Safe_ports port 70          # gopher
    acl Safe_ports port 210         # wais
    acl Safe_ports port 1025-65535  # unregistered ports
    acl Safe_ports port 280         # http-mgmt
    acl Safe_ports port 488         # gss-http
    acl Safe_ports port 591         # filemaker
    acl Safe_ports port 777         # multiling http
    acl CONNECT method CONNECT
    acl monitor src 192.168.1.0/255.255.255.0 127.0.0.1
    acl 789789 referer_regex -i 789789
    http_access deny 789789
    deny_info http://www.hnhack.com/  789789
    #http_access allow manager  
    http_access allow manager monitor
    http_access deny manager 
    acl PURGE method PURGE
    http_access allow PURGE localhost
    http_access deny purge
    acl snmppublic snmp_community public
    snmp_access allow snmppublic all
    http_access deny !Safe_ports
    http_access deny CONNECT !SSL_ports
    ############################## Device Configuration Define #################################
    visible_hostname hnhack     ------可见主机名
    cache_dir aufs /data/cache1/ 260000 128 2   -----定义缓存目录 数据存储格式 缓存到的目录 为缓存目录分配的磁盘空间(MB) 缓存空间的一级子目录个数 二级子目录个数
    maximum_object_size 2048 KB  -----最大缓存对象大小
    minimum_object_size 0 KB       -----最小缓存对象大小
    store_dir_select_algorithm round-robin
    cache_replacement_policy lru
    cache_swap_low 90
    cache_swap_high 95
    reload_into_ims on
    via off
    refresh_stale_hit 0 minute
    vary_ignore_expire on
    request_timeout 30 seconds
    persistent_request_timeout 10 seconds
    connect_timeout 30 seconds
    read_timeout 10 minutes
    server_persistent_connections off
    client_persistent_connections off
    collapsed_forwarding on
    maximum_object_size_in_memory 8 KB
    cache_mem 1024 MB   -----缓存所占内存空间大小
    memory_replacement_policy lru
    logformat squid_custom_log %ts.%03tu %6tr %>a %Ss/%03Hs %<st %rm %ru  %un %Sh/%<A %mt "%{Referer}>h" "%{User-Agent}>h" %{Cookie}>h
    #cache_access_log /squid/var/logs/access.log squid_custom_log
    cache_access_log none
    strip_query_terms off
    logfile_rotate 0
    #cache_log /data/proclog/log/squid/cache.log
    cache_store_log none
    http_port 80 accel vhost vport allow-direct   -----指定squid监听HTTP请求的端口,一般都设置成80端口,
    这样使用户感觉不到反向代理的存在,就像访问真正的WEB服务器一样。设定squid为accel加速模式,vhost必须要加.
    否则将无法将主机头转发至后端服务器,访问时就会出现无法找到主机头的错误 此处就为加入到CDN服务的网站起加速作用
    icp_port 0
    snmp_port 3401
    cache_effective_user squid   ----- squid用户及用户组
    cache_effective_group squid
    pid_filename /var/run/squid.pid  -----squid进程名
    diskd_program /squid/libexec/diskd
    unlinkd_program /squid/libexec/unlinkd
    half_closed_clients off
    hosts_file /squid/etc/hosts
    dns_children 3
    dns_testnames 127.0.0.1
    client_db off
    cachemgr_passwd test4squid config
    cache_mgr my@you.com  ----管理员账号
    quick_abort_min -1 KB
    range_offset_limit -1 KB
    refresh_pattern -i ^http:// 5 0% 5 ignore-reload override-lastmod
    refresh_pattern -i .htm$ 5 0% 5 ignore-reload override-lastmod
    refresh_pattern -i .html$ 5 0% 5 ignore-reload override-lastmod
    refresh_pattern -i .bmp$ 5 0% 5 ignore-reload override-lastmod
    refresh_pattern -i .gif$ 5 0% 5 ignore-reload override-lastmod
    refresh_pattern -i .jpg$ 5 0% 5 ignore-reload override-lastmod
    refresh_pattern -i .jpeg$ 5 0% 5 ignore-reload override-lastmod
    refresh_pattern -i .png$ 5 0% 5 ignore-reload override-lastmod
    refresh_pattern -i .js$ 5 0% 5 ignore-reload override-lastmod
    refresh_pattern -i .swf$ 5 0% 5 ignore-reload override-lastmod
    refresh_pattern -i .css$ 5 0% 5 ignore-reload override-lastmod
    refresh_pattern -i .xml$ 5 0% 5 ignore-reload override-lastmod
    refresh_pattern -i .yaml$ 30 0% 30 ignore-reload override-lastmod
    refresh_pattern -i .text$ 5 0% 5 ignore-reload override-lastmod
    refresh_pattern -i .ico$ 1440 0% 1440 ignore-reload override-lastmod
    acl QUERY urlpath_regex cgi-bin? .php
    cache deny QUERY 
    acl LocalServers dst 192.168.1.30 
    no_cache deny LocalServers
    vi  /squid/etc/hosts 文件 添加DNS记录
    x.x.x.x  www.x.com   注意此处的DNS记录为本地DNS记录,记录加入到CDN服务的网站,用于squid代理服务器快速寻找目标网站
    7.Squid常用命令
    1,初始化你在 squid.conf 里配置的 cache 目录
    #/squid/sbin/squid -z //初始化缓存空间
    如果有错误提示,请检查你的 cache目录的权限。
    2,对你的squid.conf 排错,即验证 squid.conf 的 语法和配置。
    #/squid/sbin/squid -k parse
    如果squid.conf 有语法或配置错误,这里会返回提示你,如果没有返回,恭喜,可以尝试启动squid。
    3,启动squid在后台运行。
    #/squid/sbin/squid -s
    这时候可以 ps -A 来查看系统进程,可以看到俩个 squid 进程。  查看squid进程看是否启动
    ps aux |grep squid 
    如配置文件有更改,需使用命令 /squid/sbin/squid –k reconfigure 重新加载配置文件
    Squid相关的命令
    结束squid进程 /squid/sbin/squid –k shutdown
    取得squid运行状态信息:/squid/bin/squidclient -p 80 mgr:info
     取得squid内存使用情况:/squid/bin/squidclient -p 80 mgr:mem
     取得squid已经缓存的列表:/squid/bin/squidclient -p 80 mgrbjects. use it carefully,it may crash
     取得squid的磁盘使用情况:/squid/bin/squidclient -p 80 mgr:diskd
     强制更新某个url:/squid/bin/squidclient -p 80 -m PURGE http://www.hnhack.com/
     查命中率:
     /squid/bin/squidclient -h111.222.111.111 -p80 mgr:info
     /squid/bin/squidclient -h具体的IP -p80 mgr:info
     8. 将squid写入启动脚本,随计算机每次启动而自启动
       vi /etc/rc.local 添加一行
       /squid/sbin/squid -s
     网络安全选项的调整:
      echo 1 > /proc/sys/net/ipv4/tcp_syncookies
      echo 1 > /proc/sys/net/ipv4/tcp_synack_retries
     echo 1 > /proc/sys/net/ipv4/tcp_syn_retries
    编辑iptables配置文件,禁止ping
     *filter
     :INPUT ACCEPT [1:229]
     :FORWARD ACCEPT [0:0]
     :OUTPUT ACCEPT [0:0]
     -A INPUT -p icmp -m icmp --icmp-type 8 -j DROP
     COMMIT
    保存退出,重新启动iptables服务
    Service iptables save
        Service iptables restart


    通过我上面的详细地解读,您应该知道了CDN并不是多么的神秘,而且CDN也存在一定的局限性那就是它的实时性不太好,而且squid有限制不支持多核得cpu,这对于服务器得利用率不高,所以对于网络上CDN的宣传,我们还是要知道其真实的面目,知道它是怎么一回事.

  • 相关阅读:
    第七届蓝桥杯javaB组真题解析-煤球数目(第一题)
    考生须知
    2016年12月1日
    蓝桥网试题 java 基础练习 矩形面积交
    蓝桥网试题 java 基础练习 矩阵乘法
    蓝桥网试题 java 基础练习 分解质因数
    蓝桥网试题 java 基础练习 字符串对比
    个人银行账户管理程序
    new和delete的三种形式详解
    C++的六个函数
  • 原文地址:https://www.cnblogs.com/tonykan/p/3517106.html
Copyright © 2020-2023  润新知