2020—2021—1学期20202402毕辰成《网络空间安全导论》第十二周学习总结
内容安全基础
5.1 信息内容安全概述
社会信息化和网络化发展加快,现在全球数据增长十分迅速,数据内容成为了互联网的中心关注点。各种社交网络不断涌现。但是!互联网和信息媒体的发展带来了许多负面影响,出现了很多恶性事件,因此,信息内容安全越来越值得人们重视。
我国现代化建设有一个重要举措——大力推进信息化,是贯彻落实科学发展观、全面建设小康社会等迫切需要,信息安全作为网络安全中智能信息处理的核心技术,为先进网络文化建设、加强社会主义先进文化传播起到了技术支撑。所以研究信息安全,不仅有学术意义,还有社会意义。
5.2 信息内容安全威胁
一方面,内容安全所面临的威胁有泄露、欺骗、破坏和篡夺等;另一方面,一些恶意用户产生并传播的恶意内容也是网络空间面临的潜在安全威胁。
5.3 网络信息内容获取
5.3.1 网络信息内容获取技术
理想的网络媒体信息获取流程主要由初使URL集合—信息“种子”集合,等待获取的URL队列,信息获取模块,信息解析模块,信息判重模块与网络媒体信息库共同组成。
5.3.2 信息内容获取的典型工具
网络爬虫是在互联网上实施信息内容获取的主要工具。
网络爬虫通常采用分布式机制来保证信息获取的全面性和时效性。
5.3.3 信息内容特征抽取与选择
信息内容的表示及其特征项的选取是数据挖掘、信息检索的一个基本问题,把它从信息中抽取出的特征词进行量化来表示文本信息。将它们从一个无结构的原始信息内容转化为结构化的计算机可以识别处理的信息。
1.文本信息内容的特征抽取与选择
特征选取有4种:
- 用映射或变换的方式把原始特征变换为较少的新特征。
- 从原始特征中挑选出一些最具代表性的特征。
- 根据专家的知识挑选最有影响的特征。
- 用数学的方法进行选取,找出最具分类信息的特征。
2.音频信息内容的特征抽取与选择
基于帧的音频特征:
- MFCC
- 频域能量
- 子带能量比
- 过零率
- 基音频率
基于片段的音频特征:
- 静音帧率
- 高过零率帧率
- 低能量帧率
- 谱能量
- 和谐度
3.图像信息的特征抽取与选择
(1)图像信息的特征抽取与选择
(2)图像纹理特征提取
(3)其他图像特征
5.4 信息内容分析与处理
5.4.1 信息内容分类
分类算在图像分类法、索引和内容理解方面都有直接的应用,直接分析不同图像类别的图像特征之间存在的差异,将其按照内容分成若干类别。
1.线性分类器
2.最近邻分类法
3.支持向量机
5.4.2 信息内容过滤
信息过滤是大规模内容处理的一种典型操作,它是对陆续到达的信息过滤操作,可以认为是满足用户信息需求的信息选择过程,将符合用户需求的信息保留,将不符合用户需求的信息过滤掉。
5.5 网络舆情内容监测与预警
5.5.1 网络舆情系统的背景与应用范围
网络舆情预警监测系统主要完成互联网海量信息资源的综合分析,提取支持政府部门决策的有效信息。
5.5.2 网络舆情系统的功能分解
高仿真网络信息深度提取技术
基于语义的海量媒体内容特征快速提取与分类技术
非结构信息自组织聚合表达技术
5.5.3 互联网舆情内容分析
伴随互联网的迅速普及,各式各样的内容日渐泛滥,面对各种的信息,我们必须部署互联网舆情内容监控技术。