一、防火墙相关概念
从逻辑上讲:防火墙可以大体分为主机防火墙和网络防火墙!
- 主机防火墙:针对单个主机进行防护;
- 网络防火墙:往往处于网络入口或边缘,针对于网络入口进行防护,服务于防火墙背后的本地局域网;
网络防火墙和主机防火墙并不冲突,可以理解为:
- 网络防火墙主外(集体);
- 主机防火墙主内(个人);
从物理上讲,防火墙分为硬件防火墙和软件防火墙!
- 硬件防火墙:在硬件级别实现部分防火墙功能,另一部分功能基于软件实现,性能高、成本高;
- 软件防火墙:应用软件处理逻辑运行于通用硬件平台之上的防火墙,性能低,成本低;
本篇博文主要介绍一下Linux中的iptables!
iptables其实不是真正的防火墙,我们可以把它理解成一个客户端代理,用户通过iptables这个代理,将用户的安全设定执行到对应的安全框架中,这个安全框架才是真正的防火墙,这个框架的名字叫netfilter。
netfilter才是防火墙真正的安全框架(framework),netfilter位于内核空间。
iptables其实是一个命令行工具,位于用户空间,我们用这个工具操作真正的框架。
netfilter/iptables(博文中简称为iptables)组成Linux平台下的包过滤防火墙,与大多数的Linux软件一样,这个包过滤防火墙是免费的,它可以代替昂贵的商业防火墙解决方案,完成封包过滤、封包重定向和网络地址转换(NAT)等功能。
Netfilter是Linux操作系统核心层内部的一个数据包处理模块,它具有如下功能:
- 网络地址转换(Network Address Translate);
- 数据包内容修改;
- 数据包过滤的防火墙功能;
所以说,虽然我们使用service iptables start启动iptables服务,但是其实准确的来说,iptables并没有一个守护进程,所以并不能算是真正意义上的服务,而应该算是内核提供的功能。
二、iptables基础
我们知道iptables是按照规则来办事的,我们就来说说规则(rules),规则其实就是网络管理员预定义的条件,规则一般的定义为如果数据包头符合这样的条件,就这样处理这个数据包。规则存储在内核空间的信息包过滤表中,这些规则分别指定了源地址、目的地址、传输协议(如TCP、UDP、ICMP)和服务类型(如HTTP、FTP和SMTP)等。当数据包与规则匹配时,iptables就根据规则所定义的方法来处理这些数据包,如放行(accept)、拒绝(reject)和丢弃(drop)等。配置防火墙的主要工作就是添加、修改和删除这些规则。
这样说可能并不容易理解,我们来换个容易理解的角度,从头说起:
当客户端访问服务器的web服务时,客户端发送报文到网卡,而tcp/ip协议栈是属于内核的一部分,所以,客户端的信息会通过内核的TCP协议传输到用户空间中的web服务中,而此时,客户端报文的目标终点为web服务所监听的套接字(IP:Port)上,当web服务需要响应客户端请求时,web服务发出的响应报文的目标终点则为客户端,这个时候,web服务所监听的IP与端口反而变成了原点,我们说过,netfilter才是真正的防火墙,它是内核的一部分,所以,如果我们想要防火墙能够达到防火的目的,则需要在内核中设置关卡,所有进出的报文都要通过这些关卡,经过检查后,符合放行条件的才能放行,符合阻拦条件的则需要被阻止,于是,就出现了input关卡和output关卡,而这些关卡在iptables中不被称为关卡,而被称为链。
其实我们上面描述的场景并不完善,因为客户端发来的报文访问的目标地址可能并不是本机,而是其他服务器,当本机的内核支持IP_FORWARD时,我们可以将报文转发给其他服务器,所以,这个时候,我们就会提到iptables中的其他关卡,也就是其他链,他们就是 “路由前、转发、路由后**,他们的英文名是PREROUTING
、FORWARD
、POSTROUTING
!
也就是说,当我们启用了防火墙功能时,报文需要经过如下关卡,也就是说,根据实际情况的不同,报文经过链可能不同。如果报文需要转发,那么报文则不会经过input链发往用户空间,而是直接在内核空间中经过FORWARD
链和POSTROUTING
链转发出去的。
所以,根据上图,我们能够想象出某些常用场景中,报文的流向:
-
到本机某进程的报文:
PREROUTING
–>INPUT
-
由本机转发的报文:
PREROUTING
–>FORWARD
–>POSTROUTING
-
由本机的某进程发出报文(通常为响应报文):
OUTPUT
–>POSTROUTING
2.1 链的概念
现在,我们想象一下,这些关卡在iptables中为什么被称作链呢?我们知道,防火墙的作用就在于对经过的报文匹配规则,然后执行对应的动作,所以,当报文经过这些关卡的时候,则必须匹配这个关卡上的规则,但是,这个关卡上可能不止有一条规则,而是有很多条规则,当我们把这些规则串到一个链条上的时候,就形成了链,所以,我们把每一个关卡想象成如下图中的模样 ,这样来说,把他们称为链更为合适,每个经过这个关卡的报文,都要将这条链上的所有规则匹配一遍,如果有符合条件的规则,则执行规则对应的动作。
2.2 表的概念
我们再想想另外一个问题,我们对每个链上都放置了一串规则,但是这些规则有些很相似,比如,A类规则都是对IP或者端口的过滤,B类规则是修改报文,那么这个时候,我们是不是能把实现相同功能的规则放在一起呢,必须能的。
我们把具有相同功能的规则的集合叫做表,所以说,不同功能的规则,我们可以放置在不同的表中进行管理,而iptables已经为我们定义了4种表,每种表对应了不同的功能,而我们定义的规则也都逃脱不了这4种功能的范围,所以,学习iptables之前,我们必须先搞明白每种表 的作用。
iptables为我们提供了如下规则的分类,或者说,iptables为我们提供了如下表
- filter表:负责过滤功能,防火墙;内核模块:iptables_filter
- nat表:network address translation,网络地址转换功能;内核模块:iptable_nat
- mangle表:拆解报文,做出修改,并重新封装 的功能;iptable_mangle
- raw表:关闭nat表上启用的连接追踪机制;iptable_raw
也就是说,我们自定义的所有规则,都是这四种分类中的规则,或者说,所有规则都存在于这4张表中。
2.3 表链关系
但是我们需要注意的是,某些链中注定不会包含某类规则,就像某些关卡天生就不具备某些功能一样,比如,A关卡只负责打击陆地敌人,没有防空能力,B关卡只负责打击空中敌人,没有防御步兵的能力,C关卡可能比较NB,既能防空,也能防御陆地敌人,D关卡最屌,海陆空都能防。
那让我们来看看,每个关卡都有哪些能力,或者说,让我们看看每个链上的规则都存在于哪些表中。
我们还是以图为例,先看看PREROUTING链上的规则都存在于哪些表中。
注意:下图只用于说明PREROUTING链上的规则存在于哪些表中,并没有描述表的顺序。
这幅图是什么意思呢?它的意思是说,PREROUTING链只拥有nat表、raw表和mangle表所对应的功能,所以,PREROUTING中的规则只能存放于nat表、raw表和mangle表中。
那么,根据上述思路,我们来总结一下,每个关卡都拥有什么功能,
或者说,每个链中的规则都存在于哪些表中。
- PREROUTING的规则可以存在于:raw表,mangle表,nat表;
- INPUT的规则可以存在于:mangle表,filter表,(centos7中还有nat表,centos6中没有);
- FORWARD的规则可以存在于:mangle表,filter表;
- OUTPUT的规则可以存在于:raw表mangle表,nat表,filter表;
- POSTROUTING的规则可以存在于:mangle表,nat表;
但是,我们在实际的使用过程中,往往是通过表作为操作入口,对规则进行定义的,之所以按照上述过程介绍iptables,是因为从关卡的角度更容易从入门的角度理解,但是为了以便在实际使用的时候,更加顺畅的理解它们,此处我们还要将各表与链的关系罗列出来!
表(功能) | 链(钩子) |
---|---|
raw | PREROUTING,OUTPUT |
mangle | PREROUTING,INPUT,FORWARD,OUTPUT,POSTROUTING |
nat | PREROUTING,OUTPUT,POSTROUTING(centos7中还有INPUT,centos6中没有) |
filter | INPUT,FORWARD,OUTPUT |
其实我们还需要注意一点,因为数据包经过一个链的时候,会将当前链的所有规则都匹配一遍,但是匹配时总归要有顺序,我们应该一条一条的去匹配,而且我们说过,相同功能类型的规则会汇聚在一张表中,那么,哪些表中的规则会放在链的最前面执行呢,这时候就需要有一个优先级的问题,我们还拿PREROUTING链做图示。
PREROUTING链中的规则存放于三张表中,而这三张表中的规则执行的优先级如下:raw –> mangle –> nat
但是我们知道,iptables为我们定义了4张表,当他们处于同一条链时,执行的优先级如下。
优先级次序(由高而低):raw –> mangle –> nat –> filter
但是我们前面说过,某些链天生就不能使用某些表中的规则,所以,4张表中的规则处于同一条链的目前只有output链,它就是传说中海陆空都能防守的关卡。
为了更方便的管理,我们还可以在某个表里面创建自定义链,将针对某个应用程序所设置的规则放置在这个自定义链中,但是自定义链接不能直接使用,只能被某个默认的链当做动作去调用才能起作用,我们可以这样想象,自定义链就是一段比较短的链子,这条短链子上的规则都是针对某个应用程序制定的,但是这条短的链子并不能直接使用,而是需要焊接在iptables默认定义链子上,才能被IPtables使用,这就是为什么默认定义的链需要把自定义链当做动作去引用的原因。这是后话,后面再聊,在实际使用时我们即可更加的明白。
2.4 数据经过防火墙的流程
结合上述所有的描述,我们可以将数据包通过防火墙的流程总结为下图:
我们在写Iptables规则的时候,要时刻牢记这张路由次序图,灵活配置规则。
我们将经常用到的对应关系重新写在此处,方便对应图例查看。
链的规则存放于哪些表中(从链到表的对应关系):
链名 | 表名 |
---|---|
PREROUTING | raw表,mangle表,nat表 |
INPUT | mangle表,filter表,(centos7中还有nat表,centos6中没有) |
FORWARD | mangle表,filter表 |
OUTPUT | raw表,mangle表,nat表,filter表 |
POSTROUTING | mangle表,nat表 |
表中的规则可以被哪些链使用(从表到链的对应关系):
表名 | 链名 |
---|---|
raw | PREROUTING,OUTPUT |
mangle | PREROUTING,INPUT,FORWARD,OUTPUT,POSTROUTING |
nat | PREROUTING,OUTPUT,POSTROUTING(centos7中还有INPUT,centos6中没有) |
filter | INPUT,FORWARD,OUTPUT |
下图中nat表在centos7中的情况就不再标明。
2.5 规则的概念
说了一圈又说回来了,在上述描述中我们一直在提规则,可是没有细说,现在说说它。
先说说规则的概念,然后再通俗的解释它。
规则:根据指定的匹配条件来尝试匹配每个流经此处的报文,一旦匹配成功,则由规则后面指定的处理动作进行处理;
那么我们来通俗的解释一下什么是iptables的规则,之前打过一个比方,每条链都是一个关卡,每个通过这个关卡的报文都要匹配这个关卡上的规则,如果匹配,则对报文进行对应的处理,比如说,你我二人此刻就好像两个报文,你我二人此刻都要入关,可是城主有命,只有器宇轩昂的人才能入关,不符合此条件的人不能入关,于是守关将士按照城主制定的规则,开始打量你我二人,最终,你顺利入关了,而我已被拒之门外,因为你符合器宇轩昂的标准,所以把你放行了,而我不符合标准,所以没有被放行,其实,器宇轩昂就是一种匹配条件,放行就是一种动作,匹配条件与动作组成了规则。
了解了规则的概念,那我们来聊聊规则的组成部分,此处只是大概的将规则的结构列出,后面的文章中会单独对规则进行总结。
规则由匹配条件和处理动作组成。
2.5.1 匹配条件
-
基本匹配条件:源地址Source IP,目标地址 Destination IP
-
扩展匹配条件:除了上述的条件可以用于匹配,还有很多其他的条件可以用于匹配,这些条件泛称为扩展条件,这些扩展条件其实也是netfilter中的一部分,只是以模块的形式存在,如果想要使用这些条件,则需要依赖对应的扩展模块。
2.5.2 处理工作
处理动作在iptables中被称为target(这样说并不准确,我们暂且这样称呼),动作也可以分为基本动作和扩展动作。
此处列出一些常用的动作,之后的文章会对它们进行详细的示例与总结:
-
ACCEPT:允许数据包通过;
-
DROP:直接丢弃数据包,不给任何回应信息,这时候客户端会感觉自己的请求泥牛入海了,过了超时时间才会有反应;
-
REJECT:拒绝数据包通过,必要时会给数据发送端一个响应的信息,客户端刚请求就会收到拒绝的信息;
-
SNAT:源地址转换,解决内网用户用同一个公网地址上网的问题;
-
MASQUERADE:是SNAT的一种特殊形式,适用于动态的、临时会变的ip上;
-
DNAT:目标地址转换;
-
REDIRECT:在本机做端口映射;
-
LOG:在/var/log/messages文件中记录日志信息,然后将数据包传递给下一条规则,也就是说除了记录以外不对数据包做任何其他操作,仍然让下一条规则去匹配;