• Linux系统网络设备启动和禁止“ifconfig eth0 up/down”命令的跟踪


    前面文章讲了Linux系统的ethtool框架的一些东西,是从用户空间可以直观认识到的地方入手。同样,本文从Linux系统绝大部分人都熟悉的“ifconfig eth0 up”命令来跟踪一下此命令在内核中的发生了什么事情。由于ifconfig启动(up)和禁止(down)网络设备很相似,就放到一起讲了。

    首先从ifconfig的源码入手,我下载的源码地址是http://www.tazenda.demon.co.uk/phil/net-tools/。这个网站上还有大量很有用的工具的源码,源码分布符合Linux的系统目录,有兴趣的可以去看看。

    在我们输入up或down时,对应的代码如下:

    [cpp] view plain copy
     
    1. main()  
    2. {  
    3.      if (!strcmp(*spp, "up")) {  
    4.          goterr |= set_flag(ifr.ifr_name, (IFF_UP | IFF_RUNNING));  
    5.          spp++;  
    6.          continue;  
    7.      }  
    8.      if (!strcmp(*spp, "down")) {  
    9.          goterr |= clr_flag(ifr.ifr_name, IFF_UP);  
    10.          spp++;  
    11.          continue;  
    12.      }  
    13. }  

    很简单,就是根据用户的输入来标志IFF_UP参考。当up时,使用set_flag置位IFF_UP和IFF_RUNNING,当down时,使用clr_flag清除IFF_UP。Linux的这种思想值得学习,其实对于内核来讲,真的就是通过IFF_UP标志来判断网卡的使能和禁止的。

    来看设置标志的set_flag函数:

    [cpp] view plain copy
     
    1. static int set_flag(char *ifname, short flag)  
    2. {  
    3.     struct ifreq ifr;  
    4.   
    5.     safe_strncpy(ifr.ifr_name, ifname, IFNAMSIZ);  
    6.     if (ioctl(skfd, SIOCGIFFLAGS, &ifr) < 0) {  
    7.      fprintf(stderr, _("%s: unknown interface: %s "),  
    8.           ifname,     strerror(errno));  
    9.      return (-1);  
    10.     }  
    11.     safe_strncpy(ifr.ifr_name, ifname, IFNAMSIZ);  
    12.     ifr.ifr_flags |= flag;  
    13.     if (ioctl(skfd, SIOCSIFFLAGS, &ifr) < 0) {  
    14.      perror("SIOCSIFFLAGS");  
    15.      return -1;  
    16.     }  
    17.     return (0);  
    18. }  

    以及清除标志的clr_flag函数:

    [cpp] view plain copy
     
    1. static int clr_flag(char *ifname, short flag)  
    2. {  
    3.     struct ifreq ifr;  
    4.     int fd;  
    5.   
    6.     if (strchr(ifname, ':')) {  
    7.         /* This is a v4 alias interface.  Downing it via a socket for 
    8.         another AF may have bad consequences. */  
    9.         fd = get_socket_for_af(AF_INET);  
    10.      if (fd < 0) {  
    11.          fprintf(stderr, _("No support for INET on this system. "));  
    12.          return -1;  
    13.      }  
    14.     } else  
    15.         fd = skfd;  
    16.   
    17.     safe_strncpy(ifr.ifr_name, ifname, IFNAMSIZ);  
    18.     if (ioctl(fd, SIOCGIFFLAGS, &ifr) < 0) {  
    19.      fprintf(stderr, _("%s: unknown interface: %s "),  
    20.           ifname, strerror(errno));  
    21.      return -1;  
    22.     }  
    23.     safe_strncpy(ifr.ifr_name, ifname, IFNAMSIZ);  
    24.     ifr.ifr_flags &= ~flag;  
    25.     if (ioctl(fd, SIOCSIFFLAGS, &ifr) < 0) {  
    26.      perror("SIOCSIFFLAGS");  
    27.      return -1;  
    28.     }  
    29.     return (0);  
    30. }  

    观察这两个函数,最后都是使用SIOCSIFFLAGS命令和内核交互。我们找到这个命令的使用地方,它位于net/core/dev.c文件,如下:

    [cpp] view plain copy
     
    1. int dev_ioctl(struct net *net, unsigned int cmd, void __user *arg)  
    2. {  
    3.      case SIOCSIFFLAGS:  
    4.      case SIOCSIFMETRIC:  
    5.      case SIOCSIFMTU:  
    6.      case SIOCSIFMAP:  
    7.      case SIOCSIFHWADDR:  
    8.      case SIOCSIFSLAVE:  
    9.      case SIOCADDMULTI:  
    10.      case SIOCDELMULTI:  
    11.      case SIOCSIFHWBROADCAST:  
    12.      case SIOCSIFTXQLEN:  
    13.      case SIOCSMIIREG:  
    14.      case SIOCBONDENSLAVE:  
    15.      case SIOCBONDRELEASE:  
    16.      case SIOCBONDSETHWADDR:  
    17.      case SIOCBONDCHANGEACTIVE:  
    18.      case SIOCBRADDIF:  
    19.      case SIOCBRDELIF:  
    20.      case SIOCSHWTSTAMP:  
    21.           if (!capable(CAP_NET_ADMIN))  
    22.                return -EPERM;  
    23.           /* fall through */  
    24.      case SIOCBONDSLAVEINFOQUERY:  
    25.      case SIOCBONDINFOQUERY:  
    26.           dev_load(net, ifr.ifr_name);  
    27.           rtnl_lock();  
    28.           ret = dev_ifsioc(net, &ifr, cmd);  
    29.           rtnl_unlock();  
    30.           return ret;  
    31. }  

    SIOCSIFFLAGS会调用到dev_ifsioc函数:

    [cpp] view plain copy
     
    1. static int dev_ifsioc(struct net *net, struct ifreq *ifr, unsigned int cmd)  
    2. {  
    3.      switch (cmd) {  
    4.      case SIOCSIFFLAGS:     /* Set interface flags */  
    5.           return dev_change_flags(dev, ifr->ifr_flags);  
    6. }  

    继续跟进dev_change_flags函数:

    [cpp] view plain copy
     
    1. int dev_change_flags(struct net_device *dev, unsigned flags)  
    2. {  
    3.      int ret, changes;  
    4.      int old_flags = dev->flags;  
    5.   
    6.      ret = __dev_change_flags(dev, flags); // 打开设备  
    7.      if (ret < 0)  
    8.           return ret;  
    9.   
    10.      changes = old_flags ^ dev->flags;  
    11.      if (changes)  
    12.           rtmsg_ifinfo(RTM_NEWLINK, dev, changes); // 暂未了解  
    13.   
    14.      __dev_notify_flags(dev, old_flags); // 向通道链netdev_chain发出通知  
    15.      return ret;  
    16. }  

    真正干活的是__dev_change_flags函数:

    [cpp] view plain copy
     
    1. int __dev_change_flags(struct net_device *dev, unsigned int flags)  
    2. {  
    3.      if ((old_flags ^ flags) & IFF_UP) {     /* Bit is different  ? */  
    4.           ret = ((old_flags & IFF_UP) ? __dev_close : __dev_open)(dev);  
    5. }  

    根据标志选择打开设备__dev_open或关闭__dev_close。在同一文件还有dev_open或dev_close,我发现它们使用了EXPORT_SYMBOL导出,供给其它模块使用,但在这里,是使用了__dev_XX函数的。

    打开函数如下:

    [cpp] view plain copy
     
    1. static int __dev_open(struct net_device *dev)  
    2. {  
    3.     const struct net_device_ops *ops = dev->netdev_ops;  
    4.     int ret;  
    5.   
    6.     ASSERT_RTNL();  
    7.   
    8.     /* 
    9.      *  Is it even present? 
    10.      */  
    11.     if (!netif_device_present(dev))  
    12.         return -ENODEV;  
    13.   
    14.     ret = call_netdevice_notifiers(NETDEV_PRE_UP, dev);  
    15.     ret = notifier_to_errno(ret);  
    16.     if (ret)  
    17.         return ret;  
    18.   
    19.     /* 
    20.      *  Call device private open method 
    21.      */  
    22.     set_bit(__LINK_STATE_START, &dev->state);  
    23.   
    24.     if (ops->ndo_validate_addr)  
    25.         ret = ops->ndo_validate_addr(dev);  
    26.   
    27.     if (!ret && ops->ndo_open)  
    28.         ret = ops->ndo_open(dev);  
    29.   
    30.     /* 
    31.      *  If it went open OK then: 
    32.      */  
    33.   
    34.     if (ret)  
    35.         clear_bit(__LINK_STATE_START, &dev->state);  
    36.   
    37.     return ret;  
    38. }  

    在真正调用具体驱动的接口前,先发NETDEV_PRE_UP给到通知链,再置__LINK_STATE_START,然后才调用驱动的ndo_open接口,最后需要清除__LINK_STATE_START标志。

    关闭函数如下:

    [cpp] view plain copy
     
    1. static int __dev_close(struct net_device *dev)  
    2. {  
    3.     const struct net_device_ops *ops = dev->netdev_ops;  
    4.   
    5.     ASSERT_RTNL();  
    6.     might_sleep();  
    7.   
    8.     /* 
    9.      *  Tell people we are going down, so that they can 
    10.      *  prepare to death, when device is still operating. 
    11.      */  
    12.     call_netdevice_notifiers(NETDEV_GOING_DOWN, dev);  
    13.   
    14.     clear_bit(__LINK_STATE_START, &dev->state);  
    15.   
    16.     /* Synchronize to scheduled poll. We cannot touch poll list, 
    17.      * it can be even on different cpu. So just clear netif_running(). 
    18.      * 
    19.      * dev->stop() will invoke napi_disable() on all of it's 
    20.      * napi_struct instances on this device. 
    21.      */  
    22.     smp_mb__after_clear_bit(); /* Commit netif_running(). */  
    23.   
    24.     dev_deactivate(dev);  
    25.   
    26.     /* 
    27.      *  Call the device specific close. This cannot fail. 
    28.      *  Only if device is UP 
    29.      * 
    30.      *  We allow it to be called even after a DETACH hot-plug 
    31.      *  event. 
    32.      */  
    33.     if (ops->ndo_stop)  
    34.         ops->ndo_stop(dev);  
    35.   
    36.     /* 
    37.      *  Device is now down. 
    38.      */  
    39.   
    40.     dev->flags &= ~IFF_UP;  
    41.   
    42.     return 0;  
    43. }  

    在真正调用具体驱动的接口前,先发NETDEV_GOING_DOWN给到通知链,表示网络设备准备挂了,再清除__LINK_STATE_START标志,然后才调用驱动的ndo_stop接口,最后需要清除IFF_UP。

    经过内核的层层结构,条条框框,终于到了具体的驱动了,上面的函数使用的接口实际上是net_device_ops结构体的函数指针,还是以igb驱动为例,赋值如下:

    [cpp] view plain copy
     
    1. static const struct net_device_ops igb_netdev_ops = {  
    2.     .ndo_open       = igb_open,  
    3.     .ndo_stop       = igb_close,  
    4.     .ndo_start_xmit     = igb_xmit_frame_adv,  
    5.     .ndo_get_stats64    = igb_get_stats64,  
    6.     .ndo_set_rx_mode    = igb_set_rx_mode,  
    7.     .ndo_set_multicast_list = igb_set_rx_mode,  
    8.     .ndo_set_mac_address    = igb_set_mac,  
    9.     .ndo_change_mtu     = igb_change_mtu,  
    10.     .ndo_do_ioctl       = igb_ioctl,  
    11.     .ndo_tx_timeout     = igb_tx_timeout,  
    12.     .ndo_validate_addr  = eth_validate_addr,  
    13.     .ndo_vlan_rx_register   = igb_vlan_rx_register,  
    14.     .ndo_vlan_rx_add_vid    = igb_vlan_rx_add_vid,  
    15.     .ndo_vlan_rx_kill_vid   = igb_vlan_rx_kill_vid,  
    16.     .ndo_set_vf_mac     = igb_ndo_set_vf_mac,  
    17.     .ndo_set_vf_vlan    = igb_ndo_set_vf_vlan,  
    18.     .ndo_set_vf_tx_rate = igb_ndo_set_vf_bw,  
    19.     .ndo_get_vf_config  = igb_ndo_get_vf_config,  
    20. #ifdef CONFIG_NET_POLL_CONTROLLER  
    21.     .ndo_poll_controller    = igb_netpoll,  
    22. #endif  
    23. };  

    我们看到最开始的2个函数就是打开和关闭。在igb_probe函数对igb_netdev_ops进行赋值:

    [cpp] view plain copy
     
    1. netdev->netdev_ops = &igb_netdev_ops;  

    至此,整个过程分析完毕。

    文中涉及到通知链,网络设备通知链netdev_chain,这个还没研究过,这里简单列一下:

    [cpp] view plain copy
     
    1. // 声明通知链表  
    2. static RAW_NOTIFIER_HEAD(netdev_chain);  
    3.   
    4. //注册  
    5. int register_netdevice_notifier(struct notifier_block *nb)  
    6. {  
    7. raw_notifier_chain_register(&netdev_chain, nb);  
    8. }  
    9.   
    10. 注销:  
    11. int unregister_netdevice_notifier(struct notifier_block *nb)  
    12. {  
    13.      int err;  
    14.      err = raw_notifier_chain_unregister(&netdev_chain, nb);  
    15. }  

    31号的PS:

    写完后想一想,感觉没到分析彻底,因为到具体的驱动后干了些什么还没跟踪,于是又花了点时间跟踪一下。我跟踪的是ti的网卡驱动,主要实现代码在cpsw.c文件,在http://lxr.oss.org.cn/source/drivers/net/ethernet/ti/?v=3.17可以找到。下面列出启动网卡时的过程的重要函数调用:

    [cpp] view plain copy
     
    1. > cpsw_ndo_open  
    2. > cpsw_slave_open  
    3.    > phy_connect (传递cpsw_adjust_link)  
    4.       > phy_connect_direct (PHY_READY)  
    5.       >  phy_prepare_link (赋值cpsw_adjust_link为adjust_link)  
    6.       > phy_start_machine  
    7.   > phy_start (PHY_READY变成PHY_UP)  

    phy_start之后进入了phy驱动重要的状态判断函数phy_state_machine,phy驱动有一个工作队列就是调用这个函数的,这个函数判断了网络各种状态:PHY_DOWN、PHY_UPPHY_AN、PHY_NOLINK,等,并做出对应的动作。我们设置了PHY_UP,则函数过程如下:

    [cpp] view plain copy
     
    1. phy_state_machine  
    2.  > phy_start_aneg  
    3.   > config_aneg  
    4.   > genphy_config_aneg(实际上是这个函数,由phy驱动赋值的)  

    到了genphy_config_aneg这个函数,就是直接和phy芯片打交道了,读phy寄存器、写phy寄存器。默认情况下会进行自动协商(其实就是写phy的第0个寄存器),当然,如果不是,即phy_device成员变量autoneg是AUTONEG_DISABLE,则会强制设置指定的速率、双工模式。


    至此,就不再继续分析、跟踪了。

    原文:https://blog.csdn.net/subfate/article/details/44755679

  • 相关阅读:
    渐变的圆
    画一组同心圆
    画五角星
    照猫画虎求阶乘
    字符串逆序输出
    格式化输出
    计算矩形面积
    字符串反码A
    快乐数字
    Maratona Brasileira de Popcorn( 二分答案+暴力 )
  • 原文地址:https://www.cnblogs.com/Ph-one/p/9025305.html
Copyright © 2020-2023  润新知