2020-2021第一学期20202411《计算机科学概论》第七周自习总结
自习内容:《计算机科学概论》第12章 信息系统 第13章 人工智能 第14章 模拟、图形学、游戏和其他应用
现在我们已经进入到了应用层。首先是信息系统和人工智能。这三个部分不仅仅更加贴近我们的生活,而且更加先进,与我们当代的生活密切相关。其中的电子表格,电子商务,以及简略介绍的人工智能、模拟,极大地方便了我们的工作生活。
第12章 信息系统
一个用户对应用层之外的各个计算层一无所知,也可以使用这些软件。本章的重点在一般的信息系统。
12.1 信息管理
数据被定义为原始事实,信息表示组织起来帮助我们回答问题以及解决问题的数据。
信息系统(information system):帮助我们组织和分析数据的软件。
任何应用程序都是管理数据的,有些程序采用特定的结构以特定的方式管理数据。还有一些专用应用程序使用特定的技术解决问题。目前三种最流行的一般应用信息系统是电子表格、数据库管理系统和电子商务。
12.2 电子制表软件
电子制表软件(spreadsheet):允许用户用单元格组织和分析数据的程序。
单元格(cell):电子数据表中用于存放数据或公式的元素。
大多数电子制表软件允许用户控制单元格中的数据的外观和格式。电子数据表的好处在于易于修改和易于扩展。我们能够创建并储存单元格中的公式。电子表格是动态的,能对变化立即做出响应。
电子数据表函数(spreadsheet function):电子制表软件提供的可用于公式的计算函数。
范围(range):用端点指定的一组连续单元格。
任何影响公式中所含单元格数据的操作,都会影响公式的值。电子数据表应该将所有这种关系考虑在内。除非特别合适,否则尽量避免在公式中使用常量。这会导致公示的能动性变差。
循环引用(circular reference):在计算结果时要错误地彼此依赖的一组数据。
电子制表软件通常能探测出这些问题并提示错误信息。
电子数据表有用源于其具有多功能性。电子数据表的运算在商业领域的大量特定情况中是不可或缺的。电子数据表的动态特性也使得它极其有用。
模拟假设分析(what-if analysis):修改电子数据表中表示假设的值,以观察假设的变化对相关数据有什么影响。
电子表格可视化。
12.3 数据库管理系统
几乎所有复杂的数据管理情况都要依靠下层的数据库和允许用户(人或程序)与之交互的支持结构。
数据库(database):结构化的数据集合。
数据库管理系统(database management system):由物理数据库、数据库引擎和数据库模式构成的软件和数据的组合。
物理数据库
——存放数据的文件的集合
数据库引擎
——支持对数据库内容的访问和修改的软件
数据库模式
——存储在数据库中的数据的逻辑结构的规约
查询(query):从数据库检索数据的请求。
模式(schema):数据库中数据的逻辑结构的规约。
关系模型(relational model):用表组织数据和数据之间的关系的数据库模型。
表(table):数据库记录的集合。
记录(或对象、实体)(record(or object,entity)):构成一个数据库实体的相关的字段的集合)。
字段(或属性)(field(or attribute)):数据库记录中的一个值。
数据库表中的记录又叫数据库对象或实体。记录中的字段有时又叫做数据库对象的属性。
键(key):在表的所有记录中唯一标识一个数据库记录的一个或多个字段。
大多数DBMS可以自动生成这种字段,以确保实体的唯一性。键的值只需要在同一张表中是唯一的。
关系数据库管理系统的真正强大之处在于能创建把各个表从概念上联系起来的表。
结构化查询语言(Structured Query Language,SQL):用于管理和查询数据的综合性关系数据库语言。
1.查询
2.修改数据库的内容
实体关系(ER)建模(Entity-Relationship(ER) modeling):设计关系数据库的常用方法。
ER图(ER diagram):ER模型的图形化表示。
技术约束(cardinality constraint):在ER图中,一次可以存放于实体间的关系数量。
一般的基数关系有三种:一对一,一对多,多对多。
12.4 电子商务
电子商务(electronic commerce):使用万维网买卖物品及服务的过程。
在线应用程序能够提供增强的用户交互能力在这一增长中是至关重要的。因为安全协议和其他允许电子资金安全传输的技术在同时发展。
12.5 大数据
大数据(big data):不能够用传统管理办法处理的大数据集。
大数据会带来更广阔的眼界。使用数据驱动并且将数据作为战略资产的企业将会比那些没有使用的企业占据更多的优势。同时也有以下挑战:大数据集经常包含各种各样的数据,。存储大数据需要大量的辅助存储器。需要更强大的处理能力。要保护个人隐私。
这个时候又要聊到川建国的推特治国了。
第13章 人工智能
13.1 思维机
人工智能(Artificial Intelligence,AI):研究对人类思维建模和应用人类智能的计算机系统的学科。
图灵测试(Turing text):一种行为方法,用于判断一个计算机系统是否是智能的。
弱等价性(weak equivalence):两个系统基于其结果的等价性。
强等价性(strong equivalence):两个系统基于其结果和实现这种结果的处理方法的等价性。
13.2 知识表示
语义网(semantic network):表示对象之间关系的知识表示法。
语义网是表示大量信息的强有力而通用的方式。难点在于建立正确的关系模型并用精确完整的数据填充整个网络。
检索树(search tree):表示对抗性情况(如博弈)中所有选择的结构。
检索树分析的概念适用于复杂的游戏。想想alpha GO。
深度优先法(depth-first approach):优先沿着树的的路径向下检索,而不是优先横着检索每层的检索法。
广度检索法(breadth-first approach):优先横向检索树的每层,而不是优先向下检索特定路径的检索法。
13.3 专家系统
基于知识的系统(knowledge-based system):使用特定信息集合的软件。
专家系统(expert system):基于人类专家的知识的软件系统。
基于规则的系统(rule-based system):基于一套if-then规则的软件系统。
推理机(inference engine):处理规则以得出结论的软件。
专家系统不会对任何它可以查到的信息提问。它是面向目标的:它的重点不是抽象信息或理论信息,而是如何解决特定的问题。其次有效:它将记录之前的反应,不会问无关的问题。一个真正的专家系统也会通过精心构造的规则集合提供有用的指示。
13.4 神经网络
好像现在任何手机厂商,芯片制造商都会在自己的产品名称前面加一个Bio的前缀了。连拍照也要。
人工神经网络(artificial neural network):尝试模拟人体神经网络的计算机知识表示法。
有效权(effective weight):人工神经元中输入值和相应的权的乘积之和。
每一个元素都有一个数字阈值,元素的有效权将与这个阈值进行比较。如果有效值大于阈值,这个元素将生成1。如果有效权小于等于阈值,该元素将生成0.
训练(training):调整神经网络中的权和阈值以实现想要的结果的过程。
神经网络之所以具有这样的通用性,是因为网络的权和阈值没有任何内在含义。
13.5 自然语言处理
语音识别(voice recognition):用计算机来识别人类所讲的话。
自然语言理解(natural language comprehension):用计算机对人类传达的信息做出合理的解释。
语音合成(voice synthesis):用计算机制造出人类的语音。
自然语言固有的语法不规则性和二义性使得处理它们具有很大的挑战性。
自然语音(natural language):人们用于交流的语言。
音素(phoneme):任何指定的语言中的基本声音单元的集合。
选中合适的音素后,计算机根据使用这个因素的上下文修改它的音调,此外还要确定每个因素的持续时间。
声波纹(voiceprint):表示人声随着时间推移的频率变化的图。
词法二义性(lexical ambiguity):由于单词具有多种含义而造成的二义性。
句法二义性(syntactic ambiguity):由于句子的构造方式有多种而造成的二义性。
指代二义性(referential ambiguity):由于代词可以指代多个对象而造成的二义性。
13.6 机器人学
机器人可分为固定机器人和可移动机器人。
处理规则:感知—规划—执行(Sense-Plan-Act,SPA)
包孕体系结构。
在内存中表示拓扑地图比表示统一的坐标系更有效。
第14章 模拟、图形学、游戏和其他应用
使用模型表示现象、对象或情况的技术叫作模拟。
14.1 什么是模拟
模拟(simulation):设计复杂系统的模型并为观察结果而对该模型进行试验。
上世纪中叶,计算机模拟就被用于协助决策。模型可以是纯物理性的、软件控制的物理对象和纯逻辑性的。系统是一组以某种方式相互作用的对象。最适合模拟的系统是动态的、交互式的和复杂的系统。
模型(model):真实系统的抽象,是系统中对象和管理这些对象相互作用的规则的表示。
连续模拟和离散事件模拟区别是表示时间的方式。
14.2 特殊模型
排队系统是一种离散事件模型,它使用随机数表示事件的到达和持续。在时间驱动模拟中,每个固定的时间间隔就观察一次模型。可以用随机数发生器表示可能性。此外,还有优先队列和两个FIFO队列。
计算机模型输出的是预测的将来的变量值,这些值的含义不由计算机决定。
飓风跟踪对对象是移动目标,所以也叫作浮动模型。气象模型可以被改编为专用模型。
计算生物学(computational biology):一个通过计算机、应用数学以及统计学的知识解决生物学问题的交叉性学科。
包括生物信息学、计算生物建模、计算基因组、分子建模和蛋白质结构预测。
还有的模型采用回归分析作为预测的基础。
定义模型中的实体之间相互作用的偏微分方程是众所周知的。
14.3 计算机图像学
根据光线的波长,视锥可以分为长、中和短三种。
反射的光线量由可用的光线量决定。物体的外观还受物体成分的影响。阴影也是现实世界的一个重要组成元素,它提供给我们光源位置的视觉线索。计算机图形学只能处理物体的表面。对光在物体上的一点的交互模拟叫作照明模型,有明暗处理模型。又有光线跟踪、颜色扩散、辐射度等。
可以用不规则的碎片模型或腐蚀模型对地形建模。不规则碎片模型采用中点细分技术。植物生长建模采用了语法和可能性方法。
有一种欺骗方式,即动作捕捉。
14.4 游戏
计算机游戏(computer gaming):计算机模拟的虚拟世界。
虚拟世界通常也可以被当作是一个数码的或者模拟的世界,是一个充满交互的由计算机生成的世界。
游戏玩法(gameplay):玩家在游戏过程中交互与体验的类型。
游戏引擎(game engine):创造计算机游戏的软件系统。
物理引擎模拟基于牛顿经典物理学的模型。碰撞检测算法精确检测碰撞点或者两个固体的交错作用。
游戏循环管理着游戏中整个仿真环节。
Q&A见小组讨论