上一篇讲了图像搜索技术的基础,那那些东西在没有DEEP LEARNING 之前,是如何用到工业界的呢?
先看个问题,有一副图片中有蓝天,白云,青山,绿水。我把这张图片颠倒过来,问这两张图片的相似度是多少?你期待这两个相似度很大,毕竟是同一张图片啊,虽然人眼看的还是同一张图片,但对计算机而言,当图像的布局或者结构变了后,就应该有个机制来保证这些差异,相似度就会有变化。看下图:
level 0是对整幅图而言进行的visual words的直方图比对,第二幅图是把这张图片分成左右两半部分分别进行基于visual word的直方图的提取,比如说我一张图片的左半部分是蓝天,右半部分是青山,而另一张图片的左半部分是青山,右半部分是蓝天。甚至我还可以切更多的快去进行直方图的提取.
最后一张图总结: