2017-2018-2 《密码与安全新技术》第3周作业
课程:《密码与安全新技术》
班级:2017级92班
学号:20179225
上课教师:谢四江
主讲教师:金鑫
上课日期:2018年4月12日
必修/选修: 必修
主要内容:
网络空间安全前沿技术介绍(跨媒体安全)
一、多媒体与跨媒体的区别
**多媒体技术特点:**
获取不易
数据量小
关联度低
**跨媒体技术特点:**
获取容易
数据量大
关联度高
二 、多媒体转变为跨媒体的原因
视频增长量飞速发展
云备份服务的使用
3D打印机的出现
3D模型数据的增长
三、跨媒体大数据分析与计算
1 主要运用在公共安全方面
2 跨媒体形式:
- 不同类型数据之间的跨越
- 不同来源数据之间的跨越
- 信息空间与物理空间之间的跨越
3 跨媒体大数据分析研究热点:
- 跨媒体时代的知识表达
- 跨媒体检索与排序
- 面向跨媒体数据的因果推理
- 基于跨媒体分析的态势感知
属性感知
关联分析
一致描述
4 跨媒体---哈希索引
(图和文本的哈希值相似或相等)
5 跨媒体安全问题
- 面向安全的跨媒体内容分析
- 跨媒体安全监控
- 有害内容的识别
- 跨媒体取证分析
- 跨媒体内容辨伪
- 基于跨媒体的信息安全技术
- 跨媒体信息隐藏
- 跨媒体验证技术
- 跨媒体自身的信息安全技术
- 跨媒体版权保护
- 跨媒体安全存储
- 跨媒体安全传输
- 跨媒体安全处理
三、安全计算模型及应用需求
- 缺少计算能力
- 缺少计算方法
- 缺少存储能力
- 缺少计算数据
加密过程判断是否安全
云环境安全盲计算
学习中的问题和解决过程
1 跨媒体定义
跨媒体传播是指信息在不同媒体之间的流布与互动,它至少包含两层含义:其一是指相互信息在不同媒体之间的交叉传播与整合。其二是指媒体之间的合作、共生、互动与协调。
2 跨媒体的优势
- 可以最大限度的扩大受众覆盖面
- 可以大幅度降低传播成本
- 可以提高信息传播效率
- 可以综合利用媒介资源
- 可以 充分满足受众需求
- 可以提高媒体的抗风险能力
3 跨媒体数据表达与识别
多媒体对象用向量来表达时,其在向量度量空间的距离应与它们在人的高层感知之间的相似度一致.也就是说,如果人在视觉感知上认为2个对象是相似的,那么它们所对应的特征向量在特征空间里也是相近的.同时,为了保证检索的效率,多媒体对象的语义表达需要支持快速的相似性计算。
目前国际上在这方面研究热点是通过分析网页中颜色、水平线、垂直线和字体大小等视觉线索,将网页分割成在视觉及语义上独立信息块,属于同一个信息块的多媒体对象(如一段文字和一幅图像)在语义上相近可能性较大。与传统基于整个网页的语义表达和识别相比,基于块的方法能够大大提高其准确率,其代表工作是微软亚洲研究院提出基于视觉的网页分割算法,该算法已成功运用到互联网网页链接分析中中。最近,Yahoo研究院Chakrabarti等提出用图论方法来分割网页,与之前基于规则的方法相比,该方法理论上能够具有更好的效果。
近年来,张量理论及其处理方法被用来表达和分析图像、视频和文本,张量是对向量和矩阵的自然扩展,张量几何定义了一系列在向量空间上的多线性运算法则.张量表达与机器学习能自然结合,如文献[41]提出了一个以张量作为输入的监督张量学习(supervised tensor learning,STL)框架,STL是凸优化和多线性几何运算的结合,它采用交替投影优化来实现.基于STL可将传统支持向量机扩展到支持张量机(support tensormachine,STM),实现图像和视频语义识别。“元素重排”研究也表明:在计算过程中保持复杂对象本身拓扑结构将取得更好效果。
近年来,从统计信号处理中发展出的压缩感知(compressive sensing, CS)受到越来越多的关注:CS理论突破了传统的香农-奈奎斯特采样定理,提出利用随机测量矩阵将一个可压缩的或稀疏高维信号投影到低维空间上,并证明了这样的随机投影包含了重建信号的足够信息,即利用信号稀疏性先验条件,通过一定线性或非线性解码模型以很高概率重建原始信号。压缩感知也可称为稀疏表示,目前压缩感知和稀疏表示并不局限于信号处理,而是更广泛地应用于模式识别、机器学习、计算机视觉以及多媒体检索等领域。
4 存在的难题
如何定义和表达视觉单词、建立视觉文法,以及在建模复杂性和计算高效性之间寻找平衡仍然是这一方面工作今后需要解决难点问题。
5 热点问题
- 底层特征难以反映高层语义信息,多媒体数据理解中存在的“语义鸿沟”仍然是多媒体检索领域所面临的巨大挑战。
- 最近认知科学也发现,受所接受信息存在噪声以及问题求解病态性等因素影响,人脑对信息进行处理时,至少在某些底层感知上依赖于从例子中学习而形成的先验知识(或者约束条件),进行着非完全规范条件下概率认知推理,这也为当前以机器学习为核心的、通过样例学习进行语义理解提供了与人脑生理特性所吻合的依据。
- 在多媒体语义理解过程,用户的交互知识对于提高语义理解性能有极大改善。主动学习机制能显著提高语义的分类精度.通过用户相关反馈行为以及先验知识的分析来提高语义识别性能是有意义的研究方向。
- 实现互联网个性化检索是信息海量增长的必然结果,其基本思路是从交互中获取用户行为,生成偏好信息,但是由于这种方法收集的用户偏好存在稀缺性,将导致交互先验知识不全面,因此,实现用户个性化检索将是下一代搜索引擎所提供重要服务的突破所在。
- 互联网本身是一个蕴含丰富知识的巨大语料库,近年来出现了在互联网级语料库或者图像数据集上结合机器学习方法实现知识挖掘和语义理解的研究趋势,如美国华盛顿大学的“ Intelligence inWikipedia”[71]和麻省理工大学的“ 80 Million TinyImages”等项目。如何面向互联网中实际数据进行语义分析与知识挖掘,是将这个领域研究推向实
用的必经之路.