知识点
第十一章 网络编程
1.客户端-服务器编程模型
-
每个网络应用都是基于客户端-服务器模型的。
-
客户端-服务器模型中的基本操作是事务。
2.网络
-
对于主机,网络是一种I/O设备,作为数据源和数据接收方。
-
物理上而言,网络是一个按照地理远近组成的层次系统。最底层是LAN。
-
一个以太网段,包括电缆和集线器;每根电缆都有相同的最大位带宽;集线器不加分辩地将一个端口上收到的每个位复制到其他所有的端口上。因此,每台主机都能看到每个位。
使用电缆和网桥,多个以太网段可以连接成较大的局域网,称为桥接以太网。这些电缆的带宽可以是不同的。
-
互联网络如何实现跨过不兼容发送数据?
协议。
具备两种基本能力:命名机制、传送机制。
3.全球IP因特网
-
TCP/IP协议(协议族)。
-
因特网的客户端和服务器混合使用套接字接口函数和Unix I/O函数进行通信。
3.1 IP地址
-
一个IP地址就是一个32位无符号整数。
-
IP地址通常以点分十进制表示法来表示。
如,128.2.194.242就是地址0x8002c2f2的点分十进制表示
3.2 因特网域名
- 因特网应用程序通过调用gethostbyname函数和gethostbyaddr函数,从DNS数据库中检索任意的主机条目。
gethostbyname函数:返回和域名name相关的主机条目。
gethostbyaddr函数:返回和IP地址相关联的主机条目。
3.3 因特网链接
-
套接字是连接的端点。
-
每个套接字都有相应的套接字地址,由一个因特网地址和一个16位的整数端口组成的,用“地址:端口”来表示。
-
一个连接是由它两端的套接字地址惟一确定的。这对套接字地址叫做套接字对。
4.套接字接口
- 套接字接口是一组用来结合unit I/O函数创建网络应用的函数。
4.1套接字地址结构
- 从unit内核的角度来看,套接字就是通信的端点;从unix程序的角度来看,套接字就是一个有相应描述符的打开文件。
4.2 函数
- sockte函数
创建一个套接字描述符。
- connect函数
建立和服务器的连接。
- open_clientfd函数
将socket和connect函数包装而成。客户端可以用它来和服务器建立连接。
- bind函数
- listen函数
- accept函数
均被服务器用于和客户端建立连接。
- open_listenfd函数
socket、bind和listen函数结合。用于服务器创建一个监听描述符。
5.Web服务器
5.1Web基础
1.客户端和服务器之间一个交互用的是基于文本的应用级协议——HTTP
2.Web服务和常规文件检索服务区别
Web内容可以用一个叫做HTML的语言来编写。
5.2Web内容
- 以两种不同方式向客户端提供内容
服务静态内容
服务动态内容
5.3HTTP事务
响应
- HTTP请求(方法:GET POST OPTIONS HEAD PUT DELETE TRACE)
- HTTP响应
5.4服务动态内容
- 客户端如何将程序参数传递给服务器
- 服务器如何将参数传递给子进程
- 服务器如何将其他信息传递给子进程
- 子进程将它的输出发送到那儿
第十二章 并发编程
- 现在操作系统提供了三种基本的构造并发程序的方法:
进程。每个逻辑控制流都是一个进程,由内核来调度和维护。
I/O多路复用。
线程。
一、基于进程的并发编程
- 在接受连接请求之后,服务器派生出一个子进程,这个子进程获得服务器描述表完整的拷贝。子进程关闭它的拷贝中监听描述符3,父进程关闭它的已连接描述符4的拷贝,因为不需要这些描述符了。
- 通常服务器会运行很长时间,所以需要一个SIGCHLD处理程序,来回收僵死进程。因为当SIGCHLD执行时,信号是阻塞的,而UNIX信号是不排队的,所以SIGCHLD必须准备好回收多个僵死进程。
- 循环中的父进程和子进程关闭各自需要关闭的描述符。
- 进程能够共享文件表,但不共享用户地址空间。
二、基于I/O多路复用的并发编程
- 面对困境——服务器必须响应两个互相独立的I/O事件:
1)网络客户端发起的连接请求
2)用户在键盘上键入的命令 ,解决的办法是I/O多路复用技术。基本思想是,使用select函数,要求内核挂起进程,只有在一个或多个I/O事件发生后,才将控制返回给应用程序。
select函数
使用select函数的过程如下:
第一步,初始化fd_set集,19~22行;
第二步,调用select,25行;
第三步,根据fd_set集合现在的值,判断是哪种I/O事件,26~31行。
2.1基于I/O多路复用的并发事件驱动服务器
-
I/O多路复用可以用做并发事件驱动程序的基础,在事件驱动程序中,流是因为某种事件而前进的,一般概念是把逻辑流模型化为状态机。一个状态机就是一组状态、输入事件和转移。
-
并发事件驱动程序中echo服务器中逻辑流的状态机
三、基于线程的并发编程
-
线程运行在进程上下文中的逻辑流。线程由内核自动调度,每个线程都有它自己的线程上下文。
-
线程执行模型。多线程的执行模型在某些方面和多进程的执行模型相似。每个进程开始生命周期时都是单一线程,这个线程称为主线程。在某一时刻,主线程创建一个对等线程,从在此刻开始,两个线程就并发地运行。
-
Posix线程
-
创建线程:
-
获取自身ID:
-
终止线程:
有以下四种方式终止线程:
当顶层的线程例程返回时,线程会隐式终止;
线程调用pthread_exit函数,线程会显示终止;如果主线程调用pthread_exit,它会等到所有其他对等线程终止,然后再终止主线程和整个线程,返回值为thread_return;
某个对等线程调用exut函数,则函数终止进程和所有与该进程相关的线程;
另一个对等线程调用以当前ID为参数的函数ptherad_cancel来终止当前线程。
- 回收已终止线程的资源:
pthread_join函数会终止,直到线程tid终止。和wait不同,该函数只能回收指定id的线程,不能回收任意线程。
- 分离线程:
一个可结合的线程能够被其他线程回收其资源和杀死,在被其他线程回收之前,它的存储其资源是没有被释放的;相反,一个分离的线程是不能被其他线程回收或杀死的。它的存储器资源是在它终止时系统自动释放的。默认情况下,线程被创建成可结合的。
- 初始化线程:
该函数用来初始化多个线程共享的全局变量。
- 一个基于线程的并发服务器:
四、多线程程序中的共享变量
- 每个线程都有它自己独自的线程上下文,包括线程ID、栈、栈指针、程序计数器、条件码和通用目的寄存器值。
- 每个线程和其他线程一起共享进程上下文的剩余部分。寄存器是从不共享的,而虚拟存储器总是共享的。
- 线程化的c程序中变量根据它们的存储器类型被映射到虚拟存储器:全局变量,本地自动变量(不共享),本地静态变量。
五、用信号量同步线程
- 共享变量引入了同步错误。
5.1
-
进度图
-
轨迹线示
5.2信号量
-
用信号量解决同步问题,信号量s是具有非负整数值的全局变量,有两种特殊的操作来处理(P和V):
P(s):如果s非零,那么P将s减1,并且立即返回。如果s为0,那么就挂起这个线程,直到s变为非零; V(s):V操作将s加1。
5.3使用信号量实现互斥
5.4利用信号量调度共享资源
a)生产者——消费者问题
- 保证对缓冲区的访问是互斥的;还需要调度对缓冲区的访问,即,如果缓冲区是满的(没有空的槽位),那么生产者必须等待直到有一个空的槽位为止,如果缓冲区是空的(即没有可取的项目),那么消费者必须等待直到有一个项目变为可用。
** b)读者——写者问题**
- 修改对象的线程叫做写者;只读对象的线程叫做读者。
- 写者必须拥有对对象的独占访问,而读者可以和无限多个其他读者共享对象。
- 读者——写者问题基本分为两类:
第一类,读者优先,要求不要让读者等待,除非已经把使用对象的权限赋予了一个写者。换句话说,读者不会因为有一个写者等待而等待;
第二类,写者优先,要求一定能写者准备好可以写,它就会尽可能地完成它的写操作。同第一类问题不同,在一个写者后到达的读者必须等待,即使这个写者也是在等待。
5.5基于预线程的并发服务器
- 一个基于预线程化的服务器通过使用如下图所示的生产者——消费者模型来降低这种开销。
- 服务器是由一个主线程和一组工作组线程构成的。
- 主线程不断地接受来自客户端的连接请求,并将得到的连接描述符放在一个有限缓冲区中。
- 每一个工作组线程反复地从共享缓冲区中取出描述符,为客户端服务,然后等待下一个描述符。
六、其他并发问题
四种不安全函数;
a)可重入函数。可重入函数是线程安全函数的一个真子集,它不访问任何共享数据。可重入安全函数通常比不可重入函数更有效,因为它们不需要任何同步原语。
b)竞争。当程序员错误地假设逻辑流该如何调度时,就会发生竞争。为了消除竞争,通常我们会动态地分配内存空间。
c)死锁。当一个流等待一个永远不会发生的事件时,就会发生死锁。
总结
这周学习内容一部分在网络编程课和操作系统课中讲述过,通过这次看书学习,使我对其他两门课程中遇到的知识点有了进一步理解,课程之间的连通性有助于学习。但是这本书主要是分析代码、代码中所涉及的函数以及某个功能具体的实现方式。此外,这本书中讲述了其他课程没有深入的内容,也让我学到了新的知识。
参考资料
《深入理解计算机系统》