2019-2020-1学期 20192415
《网络空间安全专业导论》第七周学习总结
第十二章 信息系统
12.1 信息管理
信息系统(information system):帮助我们组织和分析数据的软件
最流行的三种应用信息系统:电子表格、数据库管理、电子商务
12.2 电子制表软件
电子制表软件(spreadsheet):允许用户用单元格组织和分析数据的程序
单元格(cell):电子数据表中用于存放数据或公式的元素
可存放:①数据:文本、数字、特殊数据
②公式
电子数据表:
字母指定列,数字指定行
标签便于理解
(一)电子数据表公式
存放公式的单元格,是以“=”开头的
范围的表示:可以表示行、列、矩形
例:(E4..E7)
尽量避免在公式中使用常量
在复制的公式中,对单元格的引用会被自动更新,以反映新的公式所在的行
电子数据表函数(spreadsheet function):电子表格软件提供的可用于公式的计算数据
(二)循环引用
要避免循环引用
循环引用(circular reference):在计算结果时要错误地彼此依赖的一组公式
(三)电子数据表分析
模拟假设分析(what-if analysis):修改电子数据表中表示假设的值,以观察假设的变化对相关的数据有什么影响
12.3 数据库管理系统(DBMS)
数据库:结构化的数据集合
数据库管理系统:由物理数据库、数据库引擎和数据库模式构成的软件和数据的组合
物理数据库——存放数据的文件的集合
数据库引擎——支持对数据库内容的访问和修改的软件
与专用的数据库语言交互
数据库模式——存储在数据库中的数据的逻辑结构的规约
用户先与数据库引擎软件交互,决定或修改数据库的模式;
然后再与数据库引擎软件交互,访问和修改存储在磁盘上的数据库的内容。
(一)关系模型
关系模型(relational model):用表组织数据和数据之间的关系的数据库模型
表是记录的集合,记录是相关域的集合;每个记录都包含相同的域.
键(key):在表的所有记录中唯一标识一个数据库记录的一个或多个域
键域中的每个值都必须是唯一的,但并不要求是连续的。
模式表示法:
例:
有时还会说明每个域中存储的数据的类型
(二) 关系
关系表并不是重复其他表的数据,而是存储数据库记录的关键值,以便需要时能够查找详细的数据
关系实际上就是关系模式在某一时刻的状态或内容。也就是说,关系模式是型,关系是它的值。关系模式是静态的、稳定的,而关系是动态的、随时间不断变化的,因为关系操作在不断地更新着数据库中的数据。
(三) 结构化查询语言(SQL)
结构化查询语言(Structured Query Language,SQL):用于管理和查询数据的综合性关系数据库语言
不区分大小写
-
查询select
select从句决定了返回哪些属性。from从句决定了使用哪个表进行查询。where从句限制了返回的数据
-
修改insert/update/delete
insert语句可以给表添加一条新纪录,每个insert语句都指定了新纪录的属性值
update语句可以改变表中的一条或多条记录的值
delete语句可以删除表中与指定的条件匹配的所有记录
(四)数据库设计
一种设计关系数据库的常用方法:实体关系(ER)建模(entity-relationship modeling)
ER建模使用ER图,用图形化的形式捕捉重要的记录类型、属性和关系
特定的形状区分数据库的不同部分
连线上的标签说明关系的基数约束,基数约束限制了一次可以存在的关系数量
12.4 电子商务
通过互联网购买和销售服务的过程
第十三章 人工智能
13.1 思维机
人工智能:研究对人类思想建模和应用人类智能的计算机系统的学科
(一)图灵测试
图灵测试(Turing test):一种行为方法,用于判断一个计算机系统是否是智能的
弱等价性(weak equivalence):两个系统基于其结果的等价性
强等价性(strong equivalence):两个系统基于其结果和实现这种结果的处理方法的等价性
Loebner奖(Loebner prize):正式的图灵测试,每年举行一次
聊天机器人(chatbot):用于执行人机对话的程序
(二)AI问题
13.2 知识表示
(一)语义网
语义网(semantic network):表示对象之间关系的知识表示法
语义网借用了许多面向对象的概念,如继承、实例化
语义网中必须具有回答问题所必需的信息
表示语义网的是有向图
图中的节点表示对象,节点之间的箭头表示关系,箭头上的标签说明了关系的类型
(二)检索树
检索树(sear tree):表示对抗性情况(如博弈)中的所有选择的结构
深度优先法(depth-first approach):优先沿着树的路径向下检索,而不是优先横向检索每层的检索法
广度优先法(breadth-first approach):优先横向检索树的每层,而不是优先向下检索特定路径的检索法
对于分析复杂的游戏,广度优先法趋于生成最好的结果
13.3 专家系统
-
基于知识的系统(knowledge-based system):使用特定信息集合的软件
专家系统(expert system):基于人类专家的知识的软件系统
-
基于规则的系统(rule-based system):基于一套if-then规则的软件系统
推理机(inference engineer):处理规则以得出结论的软件
优点:
-
面向目标:它的重点不是抽象信息或理论信息,而是如何解决特定的问题
-
非常有效:它将记录之前的反应,不会问无关的问题
-
即使你不知道某些问题的答案,一个真正的专家系统也会通过精心构造的规则集合提供有用的指示
13.4 神经网络
人工神经网络(arrificial nenral network):尝试模拟人体神经网络的计算机知识表示法
一个元素接受一定数量的输入值,生成一个输出值0或1
每个输入值有一个数字权;有效权是所有输入值与它的权的乘积之和。
有效值>阈值,元素生成1;
有效值<阈值,元素生成0.
输入值只能是0或1;权却可以是任何值,甚至可能是负数。权值对应于神经键对每个输入信号的控制效果。
每个处理元素的输出将根据输入信号、权、阈值而改变。
训练(training):调整神经网络中的权和阈值以实现想要的结果的过程
13.5 自然语言处理
人机语音交互过程中的三种基本处理类型:
语音识别(voice recognition)——用计算机来识别人类所讲的话
自然语言理解(natural language comprehension)——用计算机对人类传达的信息做出合理的解释
语音合成(voice synthesis)——用计算机制造出人类的语音
自然语言(natural language):人们用于交流的语言如英语
具有不规则性和二义性
(一) 语音合成
两种方法:动态语音合成、录制语音
音素(phoneme):任何指定的语言中的基本声音单元的集合
(二) 语音识别
没有经过特定声音和单词训练的语音识别系统将与通用的声波纹比较以识别单词
声波纹(voiceprint):表示人随时间的推移的频率变化的图
(三) 自然语言理解
自然语言固有二义性;自然语言的句子还会有句法二义性;使用代词时可能会发生指代二义性。
词法二义性(lexical ambiguity):由于单词具有多种含义而造成的二义性
句法二义性(syntactic ambiguity):由于句子的构成方式有多种而造成的二义性
指代二义性(referential ambiguity):由于代词可以指代多个对象而造成的二义性
13.6 机器人学
固定机器人:被固定起来等待要处理对象经过它们的机器人
可移动机器人:能够移动,需要利用人工智能的技术对它们所处的环境进行建模
(一) 感知——规划——执行范型
(二)包孕体系结构
机器人学三定律(艾萨克·阿西莫夫)
LawⅠ:A ROBOT MAY NOT INJURE A HUMAN BEING OR, THROUGH INACTION, ALLOW A HUMAN BEING TO COME TO HARM.
第一定律:机器人不得伤害人类个体,或者目睹人类个体将遭受危险而袖手不管
LawⅡ:A ROBOT MUST OBEY ORDERS GIVEN IT BY HUMAN BEINGS EXCEPT WHERE SUCH ORDERS WOULD CONFLICT WITH THE FIRST LAW.
第二定律:机器人必须服从人给予它的命令,当该命令与第一定律冲突时例外
LawⅢ:A ROBOT MUST PROTECT ITS OWN EXISTENCE AS LONG AS SUCH PROTECTION DOES NOT CONFLICT WITH THE FIRST OR SECOND LAW.
第三定律:机器人在不违反第一、第二定律的情况下要尽可能保护自己的生存
(三)物理部件
传感器、执行器、计算部件
第14章 模拟、图形学、游戏和其他应用
14.1 什么是模拟
模拟(simulation):设计复杂系统的模型并为观察结果而对该模型进行实验
纯理性的——风洞
纯逻辑性的——计算机程序表示的模型
软件控制的物理对象——太空船、飞行模拟器
(一)复杂系统
最适合模拟的系统是动态的、交互式的和复杂的系统
难于理解和分析
动态:行为随时间而变化
交互式:交互性越多,越适合模拟
系统应该由许多对象构成
(二) 构造模型
构造模型的关键是确定一个足以描述被调查的行为的特征或特征的小集合。
具体的:太空船、飞行模拟器
抽象的:分析所需的收银台数量的计算机程序
连续模拟
连续模拟把时间看作是连续的,用一组反映特征集合中的关系的微分方程表示时间的变化。
离散事件模拟
离散事件模拟由实体、属性和事件构成。
流经系统的对象通常被表示为实体。实体表示真实系统中必须明确定义的对象。即,系统的特征或特性是对象。
属性是一个特定实体的特征。事件是实体之间的相互作用。流经系统的对象通常被表示为实体。
事件是实体之间的相互作用。
构造一个好模型的关键是选择实体以表示系统,并正确地决定定义事件结果的规则。
14.2 特殊模型
(一)排队系统
排队系统是一种离散事件模型。它使用随机数表示事件的到达和持续。
服务器+等待服务的对象队列
构造一个排队模型(FIFO队列——受到服务的实体是在队列中停留时间最久的实体):
1.事件的数量以及它们如何影响系统,以确定实体相互作用的规则。
2.服务器的数量。
3.到达时间的分布情况,以确定是否把一个实体加人系统。
4.预计的服务时间,以确定事件的持续时间。
其他类型的队列
优先队列——每个项目都有一个优先级。每次出列的项目都是优先级最高的项目。
挂序事件——是采用了两个FIFO队列,一个用于较短的服务时间,一个用于较长的服务时间。
(二)气象模型
一种连续模拟——预测天气。
天气预报
计算机模型用于辅助天气预报,而不是代替预报员。计算机模型输出的是预测的将来的变量值。
飓风跟踪/浮动模型/专用模型
(三)计算生物学
计算生物学( computational biology): 一种通过计算机、应用数学以及统计学的知识解决生物学问题的交叉性学科。
计算生物学整合了许多其他领域的知识,包括:
生物信息学:一种将信息技术应用到分子生物学的学科,涉及对生物信息在计算机和网络中的查询、存储、操作、分析以及可视化。
计算生物建模:对生物学系统进行计算建模。
计算基因组:对基因组序列进行解密。
分子建模:对分子进行的建模。
蛋白质结构预测:尝试进行三维的蛋白质序列建模,这在实验中还尚未被实现。
14.3 计算机图形学
最常见的引用是现代操作系统中的图形用户界面(GUI).
计算机图形学决定了如何设置像素的颜色来显示图标以及在屏幕上拖曳图标时如何改变像素值。
(一)光的工作原理
-
根据波长划分视锥:
长视锥反应红色 中视锥反应绿色 短视锥反应蓝色
-
VECTOR:
法向量 normal vector 光线向量 light vector 视向量 view vector 反射向量 reflection vector
(二) 物体形状
计算机图形学只能处理物体的表面。图形软件利用纹理映射技术模拟粗糙的表面。
(三) 光模拟
照明模型:对光在物体上的一点的交互的模拟
明暗处理:利用照明模型确定整个物体的外观的处理
绘制:创建整个图像的过程
(四) 复杂对象建模
14.4 游戏
计算机游戏(computer gaming):计算机模拟的虚拟世界
(一)历史
游戏分类:
(1)按照使用游戏平台分类
(2)按照游戏玩法分类
动作、格斗、射击、生活模拟、角色扮演、策略
(二)创建虚拟世界
游戏引擎(game engine):创造计算机游戏的软件系统。
(三)游戏设计与开发
(四)游戏编程
编程的过程是游戏生产中最大耗时过程