计算机视觉一些项目实战技术(续)
1. PROTO-OBJECT BASED SALIENCY
在本项目中,提出一种新的方法来完成显著目标侦测的任务。与以往基于聚光灯注意理论的显著目标检测器相比,遵循基于对象的注意理论,并将对象的概念直接纳入显著性测量中。特别地,把原始对象看作是分析的单位,其中原始对象是一个连接的图像区域,一旦注意力集中到,可以转换成一个可信的对象或对象部分。根据基于对象的注意理论,首先使用选择性搜索方法将复杂图像分割成原始对象,然后评估每个原始对象的显著性。最突出的原型对象被认为是一个突出的对象。
区分了两种类型的对象显著性。首先,如果一个对象与其周围环境不同,就是显著的,称之为中心环绕显著性。其次,如果一个对象包含稀有或突出的细节,那么是显著的,通过综合显著性来衡量。证明了这两种类型的目标显著性具有互补的特征,而且,两者的结合在显著目标检测方面表现出最新的水平。
2. REAL-TIME BAG-OF-WORDS
在这个项目中,回顾了加速概念分类的技术,其中展示了计算效率和准确性之间的权衡。在此基础上,使用了在2008年TRECVID和PASCAL基准测试中获得最佳性能分数的单词包算法。将评估分为三个步骤:
(1)描述符提取,其中评估SIFT、SURF、DAISY和语义文本。
(2) 视觉词汇分配,将k-均值视觉词汇与随机森林进行比较,评估子抽样、PCA降维和空间金字塔的分割策略。
(3) 分类,其中评估the chi-square, RBF, and Fast Histogram Intersection kernel快速直方图交叉核支持向量机。
在评价的基础上,加速了密集采样筛和SURF的计算,加速了最近邻赋值,提高了直方图求交核的精度。还发现空间金字塔中的垂直划分对性能有负面影响。最后,讨论了是否有可能进一步加速“文字袋”管道。
结果使速度增加了7倍而没有精度损失,速度增加了70倍而精度损失为3%。后者实时进行分类,为概念自动分类开辟了新的应用领域。例如,这个系统允许5台标准台式机自动标记20个类所有当前上传到Flickr的图像。
Experiment with several spatial divisions of the image. Vertical divisions do not work, which makes sense while using complete image representations as mirroring the image over the vertical axis does not change the image content.
实验图像的几个空间分割。垂直分割不起作用,这在使用完整的图像表示时是有意义的,因为在垂直轴上镜像图像不会更改图像内容。
3. ANALYSING ABSTRACT ART
大多数艺术作品的创作都是为了唤起强烈的情感反应。几个世纪以来,有许多艺术运动采用不同的技术来实现艺术作品所传达的情感表达。然而,即使是从最抽象的绘画作品中,人也能始终如一地阅读情感信息。
一台机器能学会什么使艺术品富有感情吗?
在这个项目中,考虑了特伦托和罗夫雷托现代和当代艺术博物馆(MART)的一组500幅抽象画,其中每幅画都以1-7里克特(Likert)为标准进行正面或负面评价。使用最先进的识别系统来了解哪些统计模式与积极和消极情绪相关。此外,剖析分类机制,以确定图像的哪些部分唤起了哪些情感。这为研究为什么一幅特定的画被视为情感画开辟了新的机会。在这个项目中,证实了在艺术中长期以来已知的观察:明亮的颜色唤起积极的情绪,黑暗的颜色往往唤起消极的情绪。平滑线通常是正的,而混沌纹理通常被认为是负的。
另外,通过一个眼睛跟踪实验,发现绘画的积极部分最吸引人:即使在情感内容消极的绘画中,人仍然喜欢看积极的部分。
另一种视觉化的抽象绘画部分根据字袋算法唤起积极情绪(黄色)和消极情绪(蓝色)。
人眼注视在视觉效果上以红点绘制,显示图像的积极和消极情感部分。对于许多负面的形象(比如这个),人往往更倾向于看到正面的一面。