1.Socket简介
Socket是TCP/IP网络的API,可以用它来开发网络应用程序,Socket数据传输是一种特殊的I/O,Socket也是一种文件描述符
2.Socket的建立
int socket(int domain, int type, int protocol)
函数返回:一个整型的Socket描述符,可以在后面调用它。
参数说明:
int domain:指明所使用的协议族, 通常是PF_INET, 表示网络(TCP/IP)协议族说明我们网络程序所在的主机采用的通讯协族(AF_UNIX和AF_INET等).
AF_UNIX:只能够用于单一的Unix系统进程间通信,
AF_INET:是针对Internet的,因而可以允许在远程主机之间通信(当我们man socket时发现domain可选项是 PF_*而不是AF_*,因为glibc是posix的实现所以用PF代替了AF,不过我们都可以使用的)
int type:指定socket的类型, 通常是 SOCK_STREAM 流式Socket这样会提供按顺序的,可靠,双向,面向连接的比特流和SOCK_DGRAM数据报式Socket这样只会提供定长的,不可靠,无连接的通信
int prottocol:通常为0 由于我们指定了type,所以这个地方我们一般只要用0来代替就可以了
应用示例:int sockfd = socket(PF_INET, SOCK_STREAM, 0);
3.Socket配置
Socket描述符是一个指向内部数据结构的指针,它指向描述符表入口。调用Socket函数时,socket执行体将建立一个Socket,实际上"建立一个Socket"意味着为一个Socket数据结构分配存储空间。Socket执行体为你管理描述符表。
两个网络程序之间的一个网络连接包括五种信息:通信协议、本地协议地址、本地主机端口、远端主机地址和远端协议端口。Socket数据结构中包含这五种信息。
通过socket调用返回一个socket描述符后,在使用socket进行网络传输以前,必须配置该socket:
1) 面向连接的socket客户端通过调用Connect函数在socket数据结构中保存本地和远端信息。
2) 无连接socket的客户端和服务端以及面向连接socket的服务端通过调用bind函数来配置本地信息。
4.Bind()
Bind函数将socket与本机上的一个端口相关联,随后你就可以在该端口监听服务请求。
函数原型:int bind(int sockfd, struct sockaddr *my_addr, int addrlen);
函数返回:成功被调用时返回0;出现错误时返回"-1"并将errno置为相应的错误号。
参数说明:
Sockfd:是调用socket函数返回的socket描述符,
my_addr:是一个指向包含有本机IP地址及端口号等信息的sockaddr类型的指针;
addrlen:常被设置为sizeof(struct sockaddr)。
1> struct sockaddr结构类型是用来保存socket信息的:
struct sockaddr
{
unsigned short sa_family; /* 地址族, AF_xxx */
char sa_data[14]; /* 14 字节的协议地址 */
};
sa_family:一般为AF_INET,代表Internet(TCP/IP)地址族;
sa_data:则包含该socket的IP地址和端口号。
2>sockaddr_in结构类型:
struct sockaddr_in
{
short int sin_family; /* 地址族 */
unsigned short int sin_port; /* 端口号 */
struct in_addr sin_addr; /* IP地址 */
unsigned char sin_zero[8]; /* 填充0 以保持与struct sockaddr同样大小sin_zero用来将sockaddr_in结构填充到与struct sockaddr同样的长度,可以用bzero()或memset()函数将其置为零。 */
};
这个结构更方便使用。
指向sockaddr_in 的指针和指向sockaddr的指针可以相互转换,这意味着如果一个函数所需参数类型是sockaddr时,你可以在函数调用的时候将一个指向 ockaddr_in的指针转换为指向sockaddr的指针;或者相反。使用bind函数时,可以自动获得本机IP地址和随机获取一个没有被占用的端口号:系统随机选择一个未被使用的端口号,通过将my_addr.sin_port置为0,函数会自动为你选择一个未占用的端口来使用。填入本机IP地址:通过将my_addr.sin_addr.s_addr置为INADDR_ANY,系统会自动填入本机IP地址。
注意在使用bind函数是需要将sin_port和sin_addr转换成为网络字节优先顺序;而sin_addr则不需要转换。计算机数据存储有两种字节优先顺序:高位字节优先和低位字节优先: Internet上数据以高位字节优先顺序在网络上传输,所以对于在内部是以低位字节优先方式存储数据的机器,在Internet上传输数据时就需要进行转换,否则就会出现数据不一致。
下面是几个字节顺序转换函数: (h: host n: network l: long s: short)
htonl():把32位值从主机字节序转换成网络字节序, 转为高位字节优先
htons():把16位值从主机字节序转换成网络字节序, 转为高位字节优先
ntohl():把32位值从网络字节序转换成主机字节序, 从高位字节优先转换
ntohs():把16位值从网络字节序转换成主机字节序, 从高位字节优先转换
需要注意的是,在调用bind函数时一般不要将端口号置为小于1024的值,因为1到1024是保留端口号,你可以选择大于1024中的任何一个没有被占用的端口号。
应用示例:
A)服务端
1)建立结构变量
struct sockaddr_in my_addr;
int SERVPORT;
2)配置协议族、端口、地址、sin_zero填充位
my_addr.sin_family = AF_INET;
my_addr.sin_port = htons(SERVPORT);
my_addr.sin_addr.s_addr = INADDR_ANY;
bzero(&(my_addr.sin_zero), 8);
3)把sockfd的本地端口、IP地址、连接协议进行绑定
if( bind(sockfd, (struct sockaddr *)&my_addr, sizeof(struct sockaddr))== -1)
{
perror("bind");
return 1;
}
B)客户端
1)建立结构体变量和端口号
struct sockaddr_in serv_addr;
struct hostent *host;
int SERVPORT;
//struct hostent *host; 把服务器端IP通过gethostbyname赋给host结构体,如果传入的是域名则转为IP地址再赋值
if((host = gethostbyname(“www.800hr.com”)) == NULL)
//或 if((host = gethostbyname(“192.168.0.1”)) == NULL)
{
herror("gethostbyname error");
return 1;
}
else
{//输出IP地址: xxx.xxx.xxx.xxx
printf("host: %s/n", inet_ntoa(*((struct in_addr*)host->h_addr)));
}
2)建立Socket
if((sockfd = socket(AF_INET, SOCK_STREAM, 0)) == -1)
{
perror("create sock");
return 1;
}
3)给服务端结构变量赋值
serv_addr.sin_family = AF_INET;
serv_addr.sin_port = htons(SERVPORT);
serv_addr.sin_addr = *((struct in_addr *)host->h_addr);
bzero(&(serv_addr.sin_zero), 8);
4)连接服务端
//int connect(int socfd, struct sockaddr *serv_addr, int addrlen)
进行客户端程序设计无须调用bind(),因为这种情况下只需知道目的机器的IP地址,而客户通过哪个端口与服务器建立连接并不需要关心,socket执行体为你的程序自动选择一个未被占用的端口,并通知你的程序数据什么时候到达端口
Connect函数启动和远端主机的直接连接。只有面向连接的客户程序使用socket时才需要将此socket与远端主机相连。
面向连接的服务器从不启动一个连接,它只是被动的在协议端口监听客户的请求。
无连接协议从不建立直接连接。
if(connect(sockfd, (struct sockaddr *)&serv_addr, sizeof(struct sockaddr)) == -1)
{
perror("create sock");
return 1;
}
5.Listen()
Listen函数使socket处于被动的监听模式,为该socket建立一个输入数据队列,将到达的服务请求保存在此队列中,直到程序处理它们。
函数原型:int listen(int socfd, int backlog)
参数说明:
sockfd 是socket()函数返回的socket描述符
backlog 指定在请求队列中允许的最大请求数, 进入的连接请求将在队列中等待accept它们
如果一个服务请求到来时,输入队列己满, 此socket将拒绝连接请求,客户收到一个出错信息。
应用实例:
int BACKLOG = 20;
if(listen(sockfd, BACKLOG) == -1)
{
perror("listen");
return 1;
}
6.accept()
在建立好输入队列后,服务器就调用accept函数,然后睡眠并等待客户的连接请求。
函数原型:int accept(int sockfd, void *addr, int *addrlen);
参数说明:
sockfd 被监听的socket描述符
addr sockaddr_in变量的指针,该变量用来存放请求服务的客户机的信息
addrlen 通常是sizeof(struct sockaddr_in)
返回值:-1出错,client_fd 成功
[注]:当accept函数监视的socket收到连接请求时,socket执行体将建立一个新的socket,执行体将这个新socket和请求连接进程的地址联系起来,收到服务请求的初始socket仍可以继续在以前的 socket上监听,同时可以在新的socket描述符上进行数据传输操作。
应用实例:
int client_fd;
sin_size = sizeof(struct sockaddr_in);
if((client_fd = accept(sockfd, (struct sockaddr *)&remote_addr.sin_addr, &sin_size)) == -1)
{
perror("accept");
continue;
}
7.send()
函数原型:int send(int sockfd, const void *msg, int len, int flags);
参数列表:
Sockfd:接收数据的socket方的id
msg: 要发送数据的指针
len: 以字节为单位的数据的长度
flags: 一般为0
返回值:失败 -1,成功 发送成功的字节数
应用实例:
char *msg = "Hello!";
int len, bytes_sent;
。。。
len = strlen(msg);
bytes_sent = send(client_fd, msg,len,0);
。。。
8.recv()
函数原型:int recv(int sockfd, void *buf, int len, unsigned int flags);
参数列表:
Sockfd:接收数据的socket的fd
Buf: 存放数据的数据缓冲区
Len: len是缓冲的长度
flags: 通常为0
返回值:成功 实际接收的字节数,错误 -1。
应用实例:
while(1)
{
recvbytes = recv(sockfd, buf, MAXDATASIZE, 0);
if(recvbytes <= 0)
break;
fwrite(buf,1,recvbytes, fp);
};
recv和send
recv和send函数提供了和read和write差不多的功能.不过它们提供 了第四个参数来控制读写操作.
int recv(int sockfd,void *buf,int len,int flags)
int send(int sockfd,void *buf,int len,int flags)
前面的三个参数和read,write一样,第四个参数可以是0或者是以下的组合
MSG_DONTROUTE:不查找路由表
MSG_OOB:接受或者发送带外数据
MSG_PEEK:查看数据,并不从系统缓冲区移走数据
MSG_WAITALL:等待所有数据
MSG_DONTROUTE:是send函数使用的标志.这个标志告诉IP协议.目的主机在本地网络上面,没有必要查找路由表.这个标志一般用网络诊断和路由程序里面。
MSG_OOB:表示可以接收和发送带外的数据.关于带外数据我们以后会解释的。
MSG_PEEK:是recv函数的使用标志,表示只是从系统缓冲区中读取内容,而不清楚系统缓冲区的内容.这样下次读的时候,仍然是一样的内容.一般在有多个进程读写数据时可以使用这个标志。
MSG_WAITALL:是recv函数的使用标志,表示等到所有的信息到达时才返回.使用这个标志的时候recv回一直阻塞,直到指定的条件满足,或者是发生了错误。
1)当读到了指定的字节时,函数正常返回。返回值等于len
2)当读到了文件的结尾时,函数正常返回.返回值小于len
3) 当操作发生错误时,返回-1,且设置错误为相应的错误号(errno)。
如果flags为0,则和read,write一样的操作.还有其它的几个选项,不过我们实际上用的很少,可以查看 Linux Programmer's Manual得到详细解释。
recvfrom和sendto
这两个函数一般用在非套接字的网络程序当中(UDP),我们已经在前面学会了。
recvmsg和sendmsg
recvmsg和sendmsg可以实现前面所有的读写函数的功能.
int recvmsg(int sockfd,struct msghdr *msg,int flags)
int sendmsg(int sockfd,struct msghdr *msg,int flags)
struct msghdr
{
void *msg_name;
int msg_namelen;
struct iovec *msg_iov;
int msg_iovlen;
void *msg_control;
int msg_controllen;
int msg_flags;
}
struct iovec
{
void *iov_base; /* 缓冲区开始的地址 */
size_t iov_len; /* 缓冲区的长度 */
}
msg_name和 msg_namelen当套接字是非面向连接时(UDP),它们存储接收和发送方的地址信息.msg_name实际上是一个指向struct sockaddr的指针,msg_name是结构的长度.当套接字是面向连接时,这两个值应设为NULL. msg_iov和 msg_iovlen指出接受和发送的缓冲区内容.msg_iov是一个结构指针,msg_iovlen指出这个结构数组的大小. msg_control和msg_controllen这两个变量是用来接收和发送控制数据时的 msg_flags指定接受和发送的操作选项.和 recv,send的选项一样
9.套接字的关闭
关闭套接字有两个函数close和shutdown.用close时和我们关闭文件一样.
shutdown
int shutdown(int sockfd,int howto)
TCP连接是双向的(是可读写的),当我们使用close时,会把读写通道都关闭,有时侯我们希望只关闭一个方向,这个时候我们可以使用 shutdown.针对不同的howto,系统回采取不同的关闭方式。Howto = 0这个时候系统会关闭读通道.但是可以继续往接字描述符写.,howto=1关闭写通道,和上面相反,着时候就只可以读了。howto=2关闭读写通道,和close一样 在多进程程序里面,如果有几个子进程共享一个套接字时,如果我们使用shutdown,那么所有的子进程都不能够操作了,这个时候我们只能够使用close来关闭子进程的套接字描述符.
[附]
Sendto()和recvfrom()用于在无连接的数据报socket方式下进行数据传输。由于本地socket并没有与远端机器建立连接,所以在发送数据时应指明目的地址。
sendto()函数原型为:int sendto(int sockfd, const void *msg,int len,unsigned int flags,const struct sockaddr *to, int tolen);
该函数比send()函数多了两个参数,to表示目地机的IP地址和端口号信息,而tolen常常被赋值为sizeof (struct sockaddr)。Sendto 函数也返回实际发送的数据字节长度或在出现发送错误时返回-1。
Recvfrom()函数原型为:int recvfrom(int sockfd,void *buf,int len,unsigned int flags,struct sockaddr *from,int *fromlen);
from是一个struct sockaddr类型的变量,该变量保存源机的IP地址及端口号。fromlen常置为sizeof (struct sockaddr)。当recvfrom()返回时,fromlen包含实际存入from中的数据字节数。
Recvfrom()函数返回接收到的字节数或当出现错误时返回-1,并置相应的errno。
如果你对数据报socket调用了connect()函数时,你也可以利用send()和recv()进行数据传输,但该socket仍然是数据报socket,并且利用传输层的UDP服务。但在发送或接收数据报时,内核会自动为之加上目地和源地址信息。
10.结束传输
当所有的数据操作结束以后,你可以调用close()函数来释放该socket,从而停止在该socket上的任何数据操作:close(sockfd)。
你也可以调用shutdown()函数来关闭该socket。该函数允许你只停止在某个方向上的数据传输,而一个方向上的数据传输继续进行。如你可以关闭某socket的写操作而允许继续在该socket上接受数据,直至读入所有数据。
int shutdown(int sockfd,int how);
Sockfd是需要关闭的socket的描述符。参数 how允许为shutdown操作选择以下几种方式: 0 不允许继续接收数据,1 不允许继续发送数据,2 不允许继续发送和接收数据,均为允许则调用close ()
shutdown在操作成功时返回0,在出现错误时返回-1并置相应errno。
11.IP和域名的转换
在网络上标志一台机器可以用IP或者是用域名.那么我们怎么去进行转换呢?
struct hostent *gethostbyname(const char *hostname)
struct hostent *gethostbyaddr(const char *addr,int len,int type)
在中有struct hostent的定义
struct hostent
{
char *h_name; /* 主机的正式名称 */
char *h_aliases; /* 主机的别名 */
int h_addrtype; /* 主机的地址类型 AF_INET*/
int h_length; /* 主机的地址长度 对于IP4 是4字节32位*/
char **h_addr_list; /* 主机的IP地址列表 */
#define h_addr h_addr_list[0] /* 主机的第一个IP地址*/
}
gethostbyname:可以将机器名(如 linux.yessun.com)转换为一个结构指针,在这个结构里面储存了域名的信息。
gethostbyaddr:可以将一个32位的IP地址(C0A80001)转换为结构指针。
这两个函数失败时返回NULL 且设置h_errno错误变量,调用h_strerror()可以得到详细的出错信息。