套接字将Unix一切都是内核的概念应用到网络连接中,内核跟用户空间套接字之间的接口实现在c的标准库中,使用了socketcall系统调用.
socketcall充当了一个多路分解器,将各种任务分配到不同的过程执行,比如打开一个套接字,绑定或发送数据.
对于程序使用的套接字来说,都对应一个socket结构和sock的实例,二者充当向下(内核)跟向上(用户)接口
socket定义:
struct socket{
socket_state state;//套接字连接状态
unsigned long flags;
const struct proto_ops *ops; //具体协议类型
struct file *file; //指向一个伪文件的file实例,用于跟套接字通信(描述符)
struct sock *sk;
short type; //所用协议类型的数字标识符
};
ops包含处理套接字的特定于协议函数
struct proto_ops
{
int family;
.....
int (*bind)(.............);
int (*connect)(...........);
.......等等
};
这里跟c标准库的对应函数同名,因为c库函数会通过syscall系统调用来调用上面的函数指针
套接字与文件
在连接建立后,用户进程使用普通的文件操作来访问套接字,每个套接字都分配了一个该类型的inode,inode又管理到另外一个普通文件相关的结构.用于操作文件的函数保存到一个单独的指针表中
struct inode{
.....
struct file_operations *i_fop;
....
}
因此,对套接字文件描述符的文件操作,可以透明的定向到网络子系统的代码,套接字使用的file_operations如下:
struct file_operations socket_file_ops={
.owner=THIS_MODULE,
.poll=sock_poll
.aio_read=sock_aio_read;
.mmap
.....
};
前缀为sock_的函数都是简单的包装器函数,他们会调用sock_operations.比如sock_mmap所示
static int sock_mmap(struct file*file,struct vm_area_struct *vma)
{
struct socket*sock=file->private_data; //socket指向 文件实例
return sock->ops->ops->mmap(file,sock,vma);
}
inode跟套接字的关联,是通过以下辅助结构完成的
struct socket_alloc{
struct socket socket;
struct inode vfs_inode;
}
内核提供了两个宏进行必要的指针运算,根据inode找到相关套接字实例(socket_i)或者反过来(sock_inode)
socketcall系统调用
文件功能中的读写操作可以通过虚拟文件系统相关调用进入内核,然后重定向到socket_file_ops的函数指针,除此之外,还要对套接字执行其他任务
Linux提供了socketcall系统调用,它实现在sys_socketcall中,17个套接字操作对应一个系统调用,由于所要处理的任务不同,参数列表有很大差别.
sys_socketcall(int call,unsigned long _user*args)
{
switch(call)
{ case sys_socket:
err=sys_socket(a0,a1,a[2]);
break;
case SYS_bind:
err=sys_bind(a0,(struct sockaddr __user*)a1,a[2]);
- ........
}
}