Socket - 润新知

Socket

1．Socket简介
　　Socket是TCP/IP网络的API，可以用它来开发网络应用程序，Socket数据传输是一种特殊的I/O，Socket也是一种文件描述符
　　2．Socket的建立
　　int socket(int domain， int type， int protocol)
　　函数返回：一个整型的Socket描述符，可以在后面调用它。
　　参数说明：
　　int domain：指明所使用的协议族，通常是PF_INET，表示网络(TCP/IP)协议族说明我们网络程序所在的主机采用的通讯协族(AF_UNIX和AF_INET等).
　　AF_UNIX：只能够用于单一的Unix系统进程间通信，
　　AF_INET：是针对Internet的，因而可以允许在远程主机之间通信（当我们man socket时发现domain可选项是 PF_*而不是AF_*，因为glibc是posix的实现所以用PF代替了AF，不过我们都可以使用的）
　　int type：指定socket的类型，通常是 SOCK_STREAM 流式Socket这样会提供按顺序的，可靠，双向，面向连接的比特流和SOCK_DGRAM数据报式Socket这样只会提供定长的，不可靠，无连接的通信
　　int prottocol：通常为0 由于我们指定了type，所以这个地方我们一般只要用0来代替就可以了
　　应用示例：int sockfd = socket(PF_INET， SOCK_STREAM， 0);
　　
　　3．Socket配置
　　Socket描述符是一个指向内部数据结构的指针，它指向描述符表入口。调用Socket函数时，socket执行体将建立一个Socket，实际上"建立一个Socket"意味着为一个Socket数据结构分配存储空间。Socket执行体为你管理描述符表。
　　两个网络程序之间的一个网络连接包括五种信息：通信协议、本地协议地址、本地主机端口、远端主机地址和远端协议端口。Socket数据结构中包含这五种信息。
　　通过socket调用返回一个socket描述符后，在使用socket进行网络传输以前，必须配置该socket：
　　1) 面向连接的socket客户端通过调用Connect函数在socket数据结构中保存本地和远端信息。
　　2) 无连接socket的客户端和服务端以及面向连接socket的服务端通过调用bind函数来配置本地信息。
　　
　　4．Bind（）
　　Bind函数将socket与本机上的一个端口相关联，随后你就可以在该端口监听服务请求。
　　函数原型：int bind(int sockfd， struct sockaddr *my_addr， int addrlen);
　　函数返回：成功被调用时返回0；出现错误时返回"-1"并将errno置为相应的错误号。
　　参数说明：
　　Sockfd：是调用socket函数返回的socket描述符，
　　my_addr：是一个指向包含有本机IP地址及端口号等信息的sockaddr类型的指针；
　　addrlen：常被设置为sizeof(struct sockaddr)。
　　1> struct sockaddr结构类型是用来保存socket信息的：
　　struct sockaddr
　　{
　　unsigned short sa_family; /* 地址族， AF_xxx */
　　char sa_data[14]; /* 14 字节的协议地址 */
　　};
　　sa_family：一般为AF_INET，代表Internet（TCP/IP）地址族；
　　sa_data：则包含该socket的IP地址和端口号。
　　2>sockaddr_in结构类型：
　　struct sockaddr_in
　　{
　　short int sin_family; /* 地址族 */
　　unsigned short int sin_port; /* 端口号 */
　　struct in_addr sin_addr; /* IP地址 */
　　unsigned char sin_zero[8]; /* 填充0 以保持与struct sockaddr同样大小sin_zero用来将sockaddr_in结构填充到与struct sockaddr同样的长度，可以用bzero()或memset()函数将其置为零。 */
　　};
　　这个结构更方便使用。
　　指向sockaddr_in 的指针和指向sockaddr的指针可以相互转换，这意味着如果一个函数所需参数类型是sockaddr时，你可以在函数调用的时候将一个指向 ockaddr_in的指针转换为指向sockaddr的指针；或者相反。使用bind函数时，可以自动获得本机IP地址和随机获取一个没有被占用的端口号：系统随机选择一个未被使用的端口号，通过将my_addr.sin_port置为0，函数会自动为你选择一个未占用的端口来使用。填入本机IP地址：通过将my_addr.sin_addr.s_addr置为INADDR_ANY，系统会自动填入本机IP地址。
　　注意在使用bind函数是需要将sin_port和sin_addr转换成为网络字节优先顺序；而sin_addr则不需要转换。计算机数据存储有两种字节优先顺序：高位字节优先和低位字节优先： Internet上数据以高位字节优先顺序在网络上传输，所以对于在内部是以低位字节优先方式存储数据的机器，在Internet上传输数据时就需要进行转换，否则就会出现数据不一致。
　　下面是几个字节顺序转换函数： (h: host n: network l: long s: short)
　　htonl()：把32位值从主机字节序转换成网络字节序，转为高位字节优先
　　htons()：把16位值从主机字节序转换成网络字节序，转为高位字节优先
　　ntohl()：把32位值从网络字节序转换成主机字节序，从高位字节优先转换
　　ntohs()：把16位值从网络字节序转换成主机字节序，从高位字节优先转换
　　需要注意的是，在调用bind函数时一般不要将端口号置为小于1024的值，因为1到1024是保留端口号，你可以选择大于1024中的任何一个没有被占用的端口号。
　　应用示例:
　　A)服务端
　　1)建立结构变量
　　struct sockaddr_in my_addr;
　　int SERVPORT;
　　
　　2)配置协议族、端口、地址、sin_zero填充位
　　my_addr.sin_family = AF_INET;
　　my_addr.sin_port = htons(SERVPORT);
　　my_addr.sin_addr.s_addr = INADDR_ANY;
　　bzero(&(my_addr.sin_zero)， 8);
　　
　　3)把sockfd的本地端口、IP地址、连接协议进行绑定
　　if( bind(sockfd， (struct sockaddr *)&my_addr， sizeof(struct sockaddr))== -1)
　　{
　　perror("bind");
　　return 1;
　　}
　　
　　
　　B)客户端
　　1)建立结构体变量和端口号
　　struct sockaddr_in serv_addr;
　　struct hostent *host;
　　int SERVPORT;
　　
　　
　　//struct hostent *host; 把服务器端IP通过gethostbyname赋给host结构体，如果传入的是域名则转为IP地址再赋值
　　if((host = gethostbyname(“www.800hr.com”)) == NULL)
　　//或 if((host = gethostbyname(“192.168.0.1”)) == NULL)
　　{
　　herror("gethostbyname error");
　　return 1;
　　}
　　else
　　{//输出IP地址: xxx.xxx.xxx.xxx
　　printf("host: %s/n"， inet_ntoa(*((struct in_addr*)host->h_addr)));
　　}
　　
　　
　　2)建立Socket
　　if((sockfd = socket(AF_INET， SOCK_STREAM， 0)) == -1)
　　{
　　perror("create sock");
　　return 1;
　　}
　　
　　3)给服务端结构变量赋值
　　serv_addr.sin_family = AF_INET;
　　serv_addr.sin_port = htons(SERVPORT);
　　serv_addr.sin_addr = *((struct in_addr *)host->h_addr);
　　bzero(&(serv_addr.sin_zero)， 8);
　　
　　4)连接服务端
　　//int connect(int socfd， struct sockaddr *serv_addr， int addrlen)
　　进行客户端程序设计无须调用bind()，因为这种情况下只需知道目的机器的IP地址，而客户通过哪个端口与服务器建立连接并不需要关心，socket执行体为你的程序自动选择一个未被占用的端口，并通知你的程序数据什么时候到达端口
　　
　　Connect函数启动和远端主机的直接连接。只有面向连接的客户程序使用socket时才需要将此socket与远端主机相连。
　　面向连接的服务器从不启动一个连接，它只是被动的在协议端口监听客户的请求。
　　无连接协议从不建立直接连接。
　　
　　if(connect(sockfd， (struct sockaddr *)&serv_addr， sizeof(struct sockaddr)) == -1)
　　{
　　perror("create sock");
　　return 1;
　　}
　　
　　5．Listen()
　　Listen函数使socket处于被动的监听模式，为该socket建立一个输入数据队列，将到达的服务请求保存在此队列中，直到程序处理它们。
　　函数原型：int listen(int socfd， int backlog)
　　参数说明：
　　sockfd 是socket()函数返回的socket描述符
　　backlog 指定在请求队列中允许的最大请求数，进入的连接请求将在队列中等待accept它们
　　如果一个服务请求到来时，输入队列己满，此socket将拒绝连接请求，客户收到一个出错信息。
　　应用实例：
　　int BACKLOG = 20;
　　if(listen(sockfd， BACKLOG) == -1)
　　{
　　perror("listen");
　　return 1;
　　}
　　
　　6．accept()
　　在建立好输入队列后，服务器就调用accept函数，然后睡眠并等待客户的连接请求。
　　函数原型：int accept(int sockfd， void *addr， int *addrlen);
　　参数说明：
　　sockfd 被监听的socket描述符
　　addr sockaddr_in变量的指针，该变量用来存放请求服务的客户机的信息
　　addrlen 通常是sizeof(struct sockaddr_in)
　　返回值：-1出错，client_fd 成功
　　[注]：当accept函数监视的socket收到连接请求时，socket执行体将建立一个新的socket，执行体将这个新socket和请求连接进程的地址联系起来，收到服务请求的初始socket仍可以继续在以前的 socket上监听，同时可以在新的socket描述符上进行数据传输操作。
　　应用实例：
　　int client_fd;
　　sin_size = sizeof(struct sockaddr_in);
　　if((client_fd = accept(sockfd， (struct sockaddr *)&remote_addr.sin_addr， &sin_size)) == -1)
　　{
　　perror("accept");
　　continue;
　　}
　　
　　7．send()
　　函数原型：int send(int sockfd， const void *msg， int len， int flags);
　　参数列表：
　　Sockfd：接收数据的socket方的id
　　msg：要发送数据的指针
　　len：以字节为单位的数据的长度
　　flags：一般为0
　　返回值：失败 -1，成功发送成功的字节数
　　应用实例：
　　char *msg = "Hello!";
　　int len， bytes_sent;
　　。。。
　　len = strlen(msg);
　　bytes_sent = send(client_fd， msg，len，0);
　　。。。
　　
　　8．recv()
　　函数原型：int recv(int sockfd， void *buf， int len， unsigned int flags);
　　参数列表：
　　Sockfd：接收数据的socket的fd
　　Buf：存放数据的数据缓冲区
　　Len： len是缓冲的长度
　　flags：通常为0
　　返回值：成功实际接收的字节数，错误 -1。
　　应用实例：
　　while(1)
　　{
　　recvbytes = recv(sockfd， buf， MAXDATASIZE， 0);
　　if(recvbytes <= 0)
　　break;
　　fwrite(buf，1，recvbytes， fp);
　　};
　　
　　recv和send
　　recv和send函数提供了和read和write差不多的功能.不过它们提供了第四个参数来控制读写操作.
　　int recv(int sockfd，void *buf，int len，int flags)
　　int send(int sockfd，void *buf，int len，int flags)
　　前面的三个参数和read，write一样，第四个参数可以是0或者是以下的组合
　　MSG_DONTROUTE：不查找路由表
　　MSG_OOB：接受或者发送带外数据
　　MSG_PEEK：查看数据，并不从系统缓冲区移走数据
　　MSG_WAITALL：等待所有数据
　　MSG_DONTROUTE：是send函数使用的标志.这个标志告诉IP协议.目的主机在本地网络上面，没有必要查找路由表.这个标志一般用网络诊断和路由程序里面。
　　MSG_OOB：表示可以接收和发送带外的数据.关于带外数据我们以后会解释的。
　　MSG_PEEK：是recv函数的使用标志，表示只是从系统缓冲区中读取内容，而不清楚系统缓冲区的内容.这样下次读的时候，仍然是一样的内容.一般在有多个进程读写数据时可以使用这个标志。
　　MSG_WAITALL：是recv函数的使用标志，表示等到所有的信息到达时才返回.使用这个标志的时候recv回一直阻塞，直到指定的条件满足，或者是发生了错误。
　　1)当读到了指定的字节时，函数正常返回。返回值等于len
　　2)当读到了文件的结尾时，函数正常返回.返回值小于len
　　3) 当操作发生错误时，返回-1，且设置错误为相应的错误号(errno)。
　　如果flags为0，则和read，write一样的操作.还有其它的几个选项，不过我们实际上用的很少，可以查看 Linux Programmer's Manual得到详细解释。
　　
　　recvfrom和sendto
　　这两个函数一般用在非套接字的网络程序当中(UDP)，我们已经在前面学会了。
　　recvmsg和sendmsg
　　recvmsg和sendmsg可以实现前面所有的读写函数的功能.
　　int recvmsg(int sockfd，struct msghdr *msg，int flags)
　　int sendmsg(int sockfd，struct msghdr *msg，int flags)
　　struct msghdr
　　{
　　void *msg_name;
　　int msg_namelen;
　　struct iovec *msg_iov;
　　int msg_iovlen;
　　void *msg_control;
　　int msg_controllen;
　　int msg_flags;
　　}
　　
　　struct iovec
　　{
　　void *iov_base; /* 缓冲区开始的地址 */
　　size_t iov_len; /* 缓冲区的长度 */
　　}
　　msg_name和 msg_namelen当套接字是非面向连接时(UDP)，它们存储接收和发送方的地址信息.msg_name实际上是一个指向struct sockaddr的指针，msg_name是结构的长度.当套接字是面向连接时，这两个值应设为NULL. msg_iov和 msg_iovlen指出接受和发送的缓冲区内容.msg_iov是一个结构指针，msg_iovlen指出这个结构数组的大小. msg_control和msg_controllen这两个变量是用来接收和发送控制数据时的 msg_flags指定接受和发送的操作选项.和 recv，send的选项一样
　　
　　9．套接字的关闭
　　关闭套接字有两个函数close和shutdown.用close时和我们关闭文件一样.
　　shutdown
　　int shutdown(int sockfd，int howto)
　　TCP连接是双向的(是可读写的)，当我们使用close时，会把读写通道都关闭，有时侯我们希望只关闭一个方向，这个时候我们可以使用 shutdown.针对不同的howto，系统回采取不同的关闭方式。Howto = 0这个时候系统会关闭读通道.但是可以继续往接字描述符写.，howto=1关闭写通道，和上面相反，着时候就只可以读了。howto=2关闭读写通道，和close一样在多进程程序里面，如果有几个子进程共享一个套接字时，如果我们使用shutdown，那么所有的子进程都不能够操作了，这个时候我们只能够使用close来关闭子进程的套接字描述符.
　　［附］
　　Sendto()和recvfrom()用于在无连接的数据报socket方式下进行数据传输。由于本地socket并没有与远端机器建立连接，所以在发送数据时应指明目的地址。
　　sendto()函数原型为：int sendto(int sockfd， const void *msg，int len，unsigned int flags，const struct sockaddr *to， int tolen);
　　该函数比send()函数多了两个参数，to表示目地机的IP地址和端口号信息，而tolen常常被赋值为sizeof (struct sockaddr)。Sendto 函数也返回实际发送的数据字节长度或在出现发送错误时返回-1。
　　Recvfrom()函数原型为：int recvfrom(int sockfd，void *buf，int len，unsigned int flags，struct sockaddr *from，int *fromlen);
　　from是一个struct sockaddr类型的变量，该变量保存源机的IP地址及端口号。fromlen常置为sizeof (struct sockaddr)。当recvfrom()返回时，fromlen包含实际存入from中的数据字节数。
　　Recvfrom()函数返回接收到的字节数或当出现错误时返回-1，并置相应的errno。
　　如果你对数据报socket调用了connect()函数时，你也可以利用send()和recv()进行数据传输，但该socket仍然是数据报socket，并且利用传输层的UDP服务。但在发送或接收数据报时，内核会自动为之加上目地和源地址信息。
　　
　　10．结束传输
　　当所有的数据操作结束以后，你可以调用close()函数来释放该socket，从而停止在该socket上的任何数据操作：close(sockfd)。
　　你也可以调用shutdown()函数来关闭该socket。该函数允许你只停止在某个方向上的数据传输，而一个方向上的数据传输继续进行。如你可以关闭某socket的写操作而允许继续在该socket上接受数据，直至读入所有数据。
　　int shutdown(int sockfd，int how);
　　Sockfd是需要关闭的socket的描述符。参数 how允许为shutdown操作选择以下几种方式： 0 不允许继续接收数据，1 不允许继续发送数据，2 不允许继续发送和接收数据，均为允许则调用close ()
　　shutdown在操作成功时返回0，在出现错误时返回-1并置相应errno。
　　
　　11．IP和域名的转换
　　在网络上标志一台机器可以用IP或者是用域名.那么我们怎么去进行转换呢?
　　struct hostent *gethostbyname(const char *hostname)
　　struct hostent *gethostbyaddr(const char *addr，int len，int type)
　　在中有struct hostent的定义
　　struct hostent
　　{
　　char *h_name; /* 主机的正式名称 */
　　char *h_aliases; /* 主机的别名 */
　　int h_addrtype; /* 主机的地址类型 AF_INET*/
　　int h_length; /* 主机的地址长度对于IP4 是4字节32位*/
　　char **h_addr_list; /* 主机的IP地址列表 */
　　#define h_addr h_addr_list[0] /* 主机的第一个IP地址*/
　　}
　　gethostbyname：可以将机器名(如 linux.yessun.com)转换为一个结构指针，在这个结构里面储存了域名的信息。
　　gethostbyaddr：可以将一个32位的IP地址(C0A80001)转换为结构指针。
　　这两个函数失败时返回NULL 且设置h_errno错误变量，调用h_strerror()可以得到详细的出错信息。
相关阅读:
Request源码总结
 jmeter并发顺序问题
 mysql函数应用
 读《飘》之后的感受
 itchat源码阅读一
 python将print的内容输出到txt文件
 说一下StoreBoard和纯代码编程各有什么好处吧
 CocoaPods 安装
 Silverlight调用WebSite类型的WebService,Debug时的跨域问题
 ComboBox的奇怪属性
原文地址：https://www.cnblogs.com/k1988/p/2165694.html