应用:
一、图像分析
NMF最成功的一类应用是在图像的分析和处理领域。图像本身包含大量的数据,计算机一般将图像的信息按照矩阵的形式进行存放,针对图像的识别、分析和处理也是在矩阵的基础上进行的。这些特点使得NMF方法能很好的与图像分析处理相结合。人们已经利用NMF算法,对卫星发回的图像进行处理,以自动辨别太空中的垃圾碎片;使用NMF算法对天文望远镜拍摄的图像进行分析,有助于天文学家识别星体;美国还尝试在机场安装由NMF算法驱动的识别系统,根据事先输入计算机 的恐怖分子的特征图像库来自动识别进出机场的可疑恐怖分子。
学术界中:(1)NMF首次被Lee教授用于处理人脸识别。等等
二、话题识别
文本在人类的日常接触的信息中占有很大分量,为了更快更精确的从大量的文本数据中取得所需要的信息,针对文本信息处理的研究一直没有停止过。文本数据不光信息量大,而且一般是无结构的。此外,典型的文本数据通常以矩阵的形式被计算机处理,此时的数据矩阵具有高维稀疏的特征,因此,对大规模文本信息进行处理分析的另一个障碍便是如何消减原始数据的维数。NMF算法正是解决这方面难题的一种新手段。NMF在挖掘用户所需数据和进行文本聚类研究中都有着成功的应用例子。由于NMF算法在处理文本数据方面的高效性,著名的商业数据库软件Oracle在其第十版中专门利用NMF算法进行文本特征的提取和分类。为什么NMF对文本信息提取的很好呢?原因在于智能文本处理的核心问题是以一种能捕获语义或相关信息的方式来表示文本,但是传统的常用分析方法仅仅是对词进行统计,而不考虑其他的信息。而NMF不同,它往往能达到表示信息的局部之间相关关系的效果,从而获得更好的处理结果。
话题识别的话跟probabilistic Latent Semantic Analysis概率隐语义分析相似
首先假设是一个单词-文件的矩阵,是单词在文件的出现频率:
假设
那么模型可变成:
在这里,可以被解释成为与数据的主题相关度
三、特征学习
这一点思想类似的主成分分析,但是在实际的工程环境当中都要比PCA效果要好
四、语音处理
语音的自动识别一直是计算机科学家努力的方向,也是未来只能应用实现的基础技术。语音同样包含大量的数据信息,识别语音的过程也是对这些信息处理的过程。NMF算个发在这方面也为我们提供了一种新的方法,在已有的应用中,NMF算法成功实现了有效的语音特征提取,并且由于NMF算法的快速性,对实现机器的实时语音识别有着促进意义。也有使用NMF方法进行音乐分析的应用。
五、时序分割
这里的话思想可以引用隐马尔科夫模型HMM,可以处理时间序列的数据,例如音频时频
NMF可以通过阈值设置把文件序列数据分割成不同兴趣的主题,下面为挖掘电影剪辑结构的一个例子:
同样基于时序分割的想法下有了这样一个语音处理项目,对很多人说的一段话进行语音特征分割,识别出每段话属于哪个人说的:
六、聚类
聚类最常用的方法是K-means,俗称K均值算法,NMF算法比K-means算法更优之处因为他是一种软聚类方法(也是一个元素可以被分为多种类型,不是Kmeans那种非彼则此),对于有可能重复的聚类方法NMF是简单高效哦
七、机器人控制
如何快速准确地让机器人识别周围的物体对于机器人研究具有重要的意义,因为这是机器人能迅速作出相应反应和动作的基础。机器人通过传感器获得周围环境的图像信息,这些图像信息也是以矩阵的形式存储的。已经有研究人员采用NMF算法实现了机器人对周围对象的快速识别,根据现有的研究资料显示,识别的准确率达到了80%以上
八、生物医学工程和化学工程
生物医学和化学研究中,也常常需要借助计算机来分析处理试验的数据,往往一些烦杂的数据会耗费研究人员的过多精力。NMF算法也为这些数据的处理提供了一种新的高效快速的途径。科学家将NMF方法用于处理核医学中的电子发射过程的动态连续图像,有效地从这些动态图像中提取所需要的特征。NMF还可以应用到遗传学和药物发现中。因为NMF的分解不出现负值,因此采用NMF分析基因DNA的分子序列可使分析结果更加可靠。同样,用NMF来选择药物成分还可以获得最有效的且负作用最小的新药物。
九、滤波和源分离