//调用路径ip_rcv->ip_rcv_finish->dst_input->(skb->dst->input) //ip_forward以回调函数的形式,保存在skb->dst->input,input在通过ip_route_input路由封包时被设置 //函数的主要任务: // 1.更新ttl // 2.如果路由被重定向,则向发送方发送icmp重定向报文 // 2.如果有选项,通过ip_forward_options处理在转发时需要更新的选项 // 3.通过ip_output,将报文传递到ip发送路径上 //skb的下一跳信息,在ip_rcv->ip_rcv_finish中,已经通过ip_route_input设置,保存在skb->dst中 1.1 int ip_forward(struct sk_buff *skb) { struct iphdr *iph; struct rtable *rt; struct ip_options * opt = &(IPCB(skb)->opt);//ip协议控制块,由ip_options_compile初始化 //XFRM是 Linux 2.6 内核为安全处理引入的一个可扩展功能框架 if (!xfrm4_policy_check(NULL, XFRM_POLICY_FWD, skb)) goto drop; // if (IPCB(skb)->opt.router_alert && ip_call_ra_chain(skb))//对router alert选项的处理 return NET_RX_SUCCESS; if (skb->pkt_type != PACKET_HOST)//重复检查,l2地址非本机,直接丢弃 goto drop; skb->ip_summed = CHECKSUM_NONE;//需要软件重新计算校验和 iph = skb->nh.iph; if (iph->ttl <= 1)//数据帧到期 goto too_many_hops; //XFRM路由 if (!xfrm4_route_forward(skb)) goto drop; iph = skb->nh.iph; rt = (struct rtable*)skb->dst; //处理严源路由选项 //rt->rt_dst 目的ip地址 //rt->rt_gateway 当目的主机直连时,rt_gateway匹配目的地址,当需要通过网关到达目的地址时,rt_gateway设置为下一条网关 //skb->dst在ip_options_rcv_srr中,使用选项中指定的ip地址作为目标地址,通过路由查找,设置为第一个非本机ip的单播路由项 if (opt->is_strictroute && rt->rt_dst != rt->rt_gateway)//由于是严源路由选项,因此下一跳地址,必须等于源路由选项中列出的地址 goto sr_failed; if (skb_cow(skb, LL_RESERVED_SPACE(rt->u.dst.dev)+rt->u.dst.header_len))//检查skb是否被共享,如果被共享的话,拷贝一份,并在头部预留l3+l2 goto drop; iph = skb->nh.iph; //递减跳数 ip_decrease_ttl(iph); //RTCF_DOREDIRECT在ip_route_input_slow中被设置,表示ICMP_REDIRECT必须被送回源地址 if (rt->rt_flags&RTCF_DOREDIRECT && !opt->srr) ip_rt_send_redirect(skb); skb->priority = rt_tos2priority(iph->tos);//通过tos字段计算skb在规则队列中的优先级 return NF_HOOK(PF_INET, NF_IP_FORWARD, skb, skb->dev, rt->u.dst.dev, ip_forward_finish); sr_failed: icmp_send(skb, ICMP_DEST_UNREACH, ICMP_SR_FAILED, 0); goto drop; too_many_hops: icmp_send(skb, ICMP_TIME_EXCEEDED, ICMP_EXC_TTL, 0); drop: kfree_skb(skb); return NET_RX_DROP; } //调用路径ip_forward->netfilter hooks->ip_forward_finish 1.2 static inline int ip_forward_finish(struct sk_buff *skb) { struct ip_options * opt = &(IPCB(skb)->opt); IP_INC_STATS_BH(IPSTATS_MIB_OUTFORWDATAGRAMS); if (unlikely(opt->optlen)) ip_forward_options(skb);//处理宽松路由选项和time stamp选项 return dst_output(skb);//调用ip_output } //处理在转发时需要更新的选项 // 1.record route选项 // 2.源路由选项 // 3.time stamp选项 1.3 void ip_forward_options(struct sk_buff *skb) { struct ip_options * opt = &(IPCB(skb)->opt); unsigned char * optptr; struct rtable *rt = (struct rtable*)skb->dst; unsigned char *raw = skb->nh.raw; //record route选项 if (opt->rr_needaddr) {//说明为出口skb,因为入口skb在ip_options_compile已经被使用首选源地址填写 optptr = (unsigned char *)raw + opt->rr; ip_rt_get_source(&optptr[optptr[2]-5], rt); opt->is_changed = 1; } if (opt->srr_is_hit) {//表示在源路由选项列表中,有可用的下一跳ip地址 int srrptr, srrspace; optptr = raw + opt->srr; for ( srrptr=optptr[2], srrspace = optptr[1]; srrptr <= srrspace; srrptr += 4 ) { if (srrptr + 3 > srrspace) break; if (memcmp(&rt->rt_dst, &optptr[srrptr-1], 4) == 0)//下一跳地址在源路由地址列表中 break; } if (srrptr + 3 <= srrspace) {//表示下一跳在源路由地址列表中 opt->is_changed = 1; ip_rt_get_source(&optptr[srrptr-1], rt); skb->nh.iph->daddr = rt->rt_dst;//更新目的地址为下一跳的地址 optptr[2] = srrptr+4;//更新选项的ptr[2]指针到下一跳 } else if (net_ratelimit()) printk(KERN_CRIT "ip_forward(): Argh! Destination lost! "); if (opt->ts_needaddr) { optptr = raw + opt->ts; ip_rt_get_source(&optptr[optptr[2]-9], rt); opt->is_changed = 1; } } if (opt->is_changed) { opt->is_changed = 0; ip_send_check(skb->nh.iph);//计算ip校验和 } }