基于内容的图像检索软件库LIRE的特征提取方法综述_lucene image retrieval-程序员宅基地

技术标签: FCTH  Java编程  LIRE  图像检索  CBIR  CEDD  

LIRE(Lucene Image Retrieval ) 是利用Apache Lucene 建立索引进行图像检索的开源软件库。该软件项目的网址是 http://lire-project.net。LIRE这个软件库可以很方便地建立Lucene索引进行基于内容的图像检索 (CBIR, content based image retrieval ),该库为检索提供了丰富的图像特征提取方法。这里提醒大家一下,如果使用LIRE时你要用Lucene 建立索引,请注意Lucene版本兼容问题。本文对LIRE 特征提取方法做简介,不介绍LIRE其他方面。

 

1 全局特征

LIRE源码解压后,在src\main\java\net\semanticmetadata\lire\imageanalysis\features路径下有global文件夹,里面有20个全局特征提取方法。

 

1.1 ACCID

ACCID特征的目的是寻找不同尺度下最重要的边缘特征,然后把它们和使用 CEDD描述子得到的模糊色彩方案一起储存在一个直方图里。

1.2 AutoColorCorrelogram

AutoCorrelogram特征基于颜色,算法参考Huang, J.; Kumar, S. R.; Mitra, M.; Zhu, W. & Zabih, R. (2007) "Image Indexing Using Color Correlograms", IEEE Computer Society. DOI: 10.1109/CVPR.1997.609412。一个颜色相关图(color correlogram) 是一个用颜色和像素间距离建立索引的三维数据表。它代表了一个图像中,颜色改变的空间相关性是如何随距离变化的。

1.3 BinaryPatternsPyramid

BinaryPatternsPyramid和PHOG一样,但PHOG是以方向渐变来量度,而这里用的是旋转不变性的局部二值模式(LBP, Local binary patterns)的直方图。

1.4 CEDD

 CEDD是颜色和边缘方向性描述子,将图像的颜色和边缘方向性信息结合起来生成一个144字节的直方图。关于CEDD的更多知识可以参考 Savvas A. Chatzichristofis and Yiannis S. Boutalis, CEDD: Color and Edge Directivity Descriptor. A Compact Descriptor for Image Indexing and Retrieval, A. Gasteratos, M. Vincze, and J.K. Tsotsos (Eds.): ICVS 2008, LNCS 5008, pp. 312-322, 2008.

1.5 ColorLayout

ColorLayout是MPEG-7多媒体标准描述子中一种高效的颜色特征描述子。通过图像分割、代表颜色选择、离散余弦变换(DCT, Discrete Cosine Transform)、Z字形扫描四个步骤得到特征描述子。(用于CEDD)

1.6 EdgeHistogram

EdgeHistogram是MPEG-7多媒体标准描述子中一种高效的边缘特征描述子。用一个40个字节的数组构成一个边缘直方图描述子。通过图像分割、计算子图边缘直方图、归一化、计算图像边缘直方图等步骤得到特征描述子。(用于CEDD)

1.7 FCTH

FCTH是模糊颜色和纹理直方图特征。它从3个模糊单元的组合求得。先将图像分割,然后用两个模糊单元产生模糊颜色直方图,再在第三个模糊单元中将子图经小波变换生成模糊纹理直方图,最后模糊颜色直方图和模糊纹理直方图结合得到FCTH特征描述子。更多信息请参考:Savvas A. Chatzichristofis and Yiannis S. Boutalis, FCTH: Fuzzy Color and Texture Histogram - A Low Level Feature for Accurate Image Retrieval, in Proceedings of the Ninth International Workshop on Image Analysis for Multimedia Interactive Services, IEEE, Klagenfurt, May, 2008.

1.8 FuzzyColorHistogram 

FuzzyColorHistogram是一种模糊颜色直方图特征。传统颜色直方图对噪音敏感。模糊颜色直方图通过模糊算法产生模糊颜色直方图。

1.9 FuzzyOpponentHistogram

 FuzzyOpponentHistogram是基于对色(对手颜色)空间的简单的模糊64-bin(维)对色直方图。更多信息参考Sande K E A V D , Gevers T , Snoek C G M . Evaluating color descriptors for object and scene recognition. IEEE Trans Pattern Anal Mach Intell[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2010, 32(9):1582-1596.

1.10 Gabor

Gabor纹理特征通过对图像与gabor滤波器做卷积而得到,gabor滤波器定义为高斯函数与正弦函数的乘积。Gabor特征提取模拟了人类视觉刺激响应,广泛应用于视觉信息理解,例如人脸识别。

1.11 JCD

 JCD特征将CEDD和FCTH结合在一个直方图里面。

1.12 JpegCoefficientHistogram

JpegCoefficientHistogram是JPEG 系数直方图特征。将图像分块,然后求离散余弦变换(DCT,Discrete Cosine Transform。JPEG图像压缩时要做DCT变换),计算DCT系数矩阵,再从得到的差分DCT系数矩阵求得直方图。适用于JPEG图像检索。

1.13 LocalBinaryPatterns

LocalBinaryPatterns是原始的局部二值模式特征。在图像每个3*3像素块中,以中心像素为阈值,将相邻的8个像素的灰度值与其进行比较,大于中心像素值的像素点标记为1,反之为0,中心点周围8个点经比较产生8位二进制数,将其转换为十进制数作为中心像素点的LBP值,以此来反映该区域的纹理信息。

1.14 LuminanceLayout

LuminanceLayout描述子用于灰度或黑白图像。它将图像缩小到很小然后将它作为描述子。

1.15 OpponentHistogram

简单的64-bin(维)对色直方图,基于对色空间。参见1.9。

1.16 PHOG

PHOG描述子大体上就是将几个空间金字塔中不同层(可理解为图像缩小到不同分辨率)的边缘直方图结合在一起。更多信息参考 Anna Bosch, Andrew Zisserman & Xavier Munoz (2007) "Representing shape with a spatial pyramid kernel", CVIR 2007.

1.17 RotationInvariantLocalBinaryPatterns

一个简单的具有旋转不变性的局部二值模式特征。

1.18 ScalableColor

ScalableColor是MPEG-7 Scalable Color使用LireFeature的一个打包。可伸缩颜色描述符(Scalable Color Descriptor)是MPEG-7标准中颜色描述符的一种。它是固定于HSV空间的颜色直方图,用Haar变化编码,针对不同需求可改变尺寸。更多信息可参考:李志全, 黎建辉, 阎保平. MPEG-7可伸缩颜色描述符的研究[J]. 中国科学院大学学报, 2006, 23(2):192-197.

1.19 SimpleColorHistogram

SimpleColorHistogram提供一个简单的RGB颜色直方图,用于基于内容的图像检索。在LIRE的SimpleColorHistogram中,维数是可配置的,直方图归一化到每维8位。

1.20 Tamura

Tamura特征由Tamura提出,用粗糙度、对比度、方向度、 线像度、规整度和粗略度六个分量对应于心理学角度上纹理特征的六种属性。前三种最重要,所以LIRE的Tamura特征用前三个分量来实现。

 

2 局部特征

LIRE局部特征描述子包括:Simple、SelfSimilarities、Shapecontext、Sift、Surf。源码在src\main\java\net\semanticmetadata\lire\imageanalysis\features路径下local文件夹中。

2.1 Simple

Simple特征基于论文:Anagnostopoulos N , Boutalis Y , Kapoutsis A C , et al. Searching Images with MPEG-7 (& MPEG-7-like) Powered Localized dEscriptors: The SIMPLE answer to effective Content Based Image Retrieval[C]// International Workshop on Content-based Multimedia Indexing. IEEE, 2014。论文中,作者使用SURF检测子定义团状纹理突出部分,用MPEG-7 可伸缩颜色 Scalable Color ,颜色布局Color Layout以及边缘直方图Edge Histogram描述子以及CEDD来产生最终的局部特征描述子。

2.2 SelfSimilarities

SelfSimilarities特征基于论文:Chatfield K , Philbin J , Zisserman A . Efficient retrieval of deformable shape classes using local self-similarities[C]// IEEE International Conference on Computer Vision Workshops. IEEE Xplore, 2009。论文中,作者表示该特征描述子可用于快速检索图像,即使目标图像中物体缩放、图像颜色纹理发生变化、位置变化。此外,该特征对物体非刚性变形的鲁棒性也很好。

2.3 Shapecontext

Shapecontext特征基于论文: S. Belongie, J. Malik, and J. Puzicha, "Shape Matching and Object Recognition Using Shape Contexts," IEEE Trans. Pattern Analysis and Machine Intelligence, vol. 24, no. 4, pp. 509-522, Apr. 2002。论文作者用新方法测量形状之间的相似性并将其用于物体识别。在该框架中,形状相似性量度通过两个步骤进行1)求两个形状间对应点;2)用这些对应来估算对准后的形变。为解决对应的问题,设计了shape context(形状上下文)描述子。这个shape context是一个参考点,它是周围余下点相对于它的分布。相对应的点会有近似的shape context。这样,两个相似的形状的对应点会有相似的shape context。

2.4 Sift

Sift是尺度不变特征变换(Scale-invariant feature transform)。它用不同尺度(标准差)的高斯函数对图像进行平滑,平滑后图像变化差别大的像素就是特征明显的点。 它对旋转、缩放、亮度变化保持不变性,对视角变化、仿射变换、噪声也保持一定程度的鲁棒性。网上资料较多,大家也比较熟悉,这里不多说了。

2.3 Surf

Surf (Speeded Up Robust Features) 比SIFT要快数倍,而且其作者声称在不同图像变换方面比Sift更加稳健。Hessian矩阵是SURF算法的核心。Surf网上资料也很多,这里不多说了。

3 总结

LIRE提供的特征描述子中,ColorLayout、 ScalableColor是MPEG-7标准中颜色描述子中的其中两种;SimpleColorHistogram是经典的颜色直方图,OpponentHistogram是基于对色空间的直方图;FuzzyColorHistogram、FuzzyOpponentHistogram利用模糊算法处理减少噪音对Color Histogram、Opponent Histogram的干扰。LuminanceLayout是简单快速的明暗特征,AutoColorCorrelogram颜色改变随距离变化的空间相关性特征,这些都是属于图像的颜色特征描述。

EdgeHistogram是基本的边缘直方图特征, LocalBinaryPatterns是原始的局部二值模式特征,RotationInvariantLocalBinaryPatterns是旋转不变的局部二值模式;PHOG是图像不同分辨率下边缘直方图的结合(以方向渐变来量度),BinaryPatternsPyramid与PHOG不同的地方是使用旋转不变性的局部二值模式的直方图。这几个都是图像纹理特征的描述子。

CEDD把图像的颜色和边缘方向性信息结合起来生成直方图。ACCID把不同尺度下最重要的边缘特征,与使用 CEDD描述子得到的模糊色彩方案一起储存在一个直方图里。FCTH是颜色和纹理直方图模糊处理再结合的;JCD则把CEDD和FCTH联合在一起。

JpegCoefficientHistogram是JPEG 系数直方图特征,适用于JPEG压缩的图片。

    Gabor纹理特征模拟了人类视觉刺激响应,广泛应用于视觉信息理解

Tamura用对应于心理学角度上纹理:特征粗糙度、对比度、方向度来进行图像纹理特征描述。

LIRE提供的局部特征描述子中Sift、Surf是最为人所知的。Simple是Surf、Scalable Color、Color Layout、Edge Histogram、CEDD等多种特征的综合。SelfSimilarities和Shapecontext是检测图像局部形状的特征。

LIRE提供的这些特征描述子各具特色,在不同的基于内容的图像检索应用中,需根据具体的需要进行选择,很显然一个基于内容的图像检索如果结合考虑了颜色、纹理和形状特征是会提高精确性的。结合不同特征时还应考虑速度、精确性(precision)和召回率(recall)。即使综合应用多种特征,往往也难以达到很高的精确性。为了提高精确性,可以对大样本提取特征再聚类分析后获取更具代表性的特征用于检索,甚至通过人工神经网(ANN)和支持向量机(SVM)等监督学习方法对大量样本进行训练建模来提高检索的精确性,但这在速度上肯定是收到很大影响的。

 

希望对LIRE了解更多的可以参考以下文献:

  1. Lux Mathias, Savvas A. Chatzichristofis. Lire: Lucene Image Retrieval- An Extensible Java CBIR Library. In proceedings of the 16th ACM International Conference on Multimedia, pp. 1085-1088, Vancouver, Canada, 2008. http://doi.acm.org/10.1145/1459359.1459577

[2]Lux Mathias. Content Based Image Retrieval with LIRE. In proceedings of the 19th ACM International Conference on Multimedia, pp. 735-738, Scottsdale, Arizona, USA, 2011. http://dl.acm.org/citation.cfm?id=2072432

[3]Mathias Lux, Oge Marques. Visual Information Retrieval using Java and LIRE. Morgan & Claypool, 2013. http://www.morganclaypool.com/doi/abs/10.2200/S00468ED1V01Y201301ICR025

 

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/netscaner/article/details/99720381

智能推荐

5个超厉害的资源搜索网站,每一款都可以让你的资源满满!_最全资源搜索引擎-程序员宅基地

文章浏览阅读1.6w次,点赞8次,收藏41次。生活中我们无时不刻不都要在网站搜索资源,但就是缺少一个趁手的资源搜索网站,如果有一个比较好的资源搜索网站可以帮助我们节省一大半时间!今天小编在这里为大家分享5款超厉害的资源搜索网站,每一款都可以让你的资源丰富精彩!网盘传奇一款最有效的网盘资源搜索网站你还在为找网站里面的资源而烦恼找不到什么合适的工具而烦恼吗?这款网站传奇网站汇聚了4853w个资源,并且它每一天都会持续更新资源;..._最全资源搜索引擎

Book类的设计(Java)_6-1 book类的设计java-程序员宅基地

文章浏览阅读4.5k次,点赞5次,收藏18次。阅读测试程序,设计一个Book类。函数接口定义:class Book{}该类有 四个私有属性 分别是 书籍名称、 价格、 作者、 出版年份,以及相应的set 与get方法;该类有一个含有四个参数的构造方法,这四个参数依次是 书籍名称、 价格、 作者、 出版年份 。裁判测试程序样例:import java.util.*;public class Main { public static void main(String[] args) { List <Book>_6-1 book类的设计java

基于微信小程序的校园导航小程序设计与实现_校园导航微信小程序系统的设计与实现-程序员宅基地

文章浏览阅读613次,点赞28次,收藏27次。相比于以前的传统手工管理方式,智能化的管理方式可以大幅降低学校的运营人员成本,实现了校园导航的标准化、制度化、程序化的管理,有效地防止了校园导航的随意管理,提高了信息的处理速度和精确度,能够及时、准确地查询和修正建筑速看等信息。课题主要采用微信小程序、SpringBoot架构技术,前端以小程序页面呈现给学生,结合后台java语言使页面更加完善,后台使用MySQL数据库进行数据存储。微信小程序主要包括学生信息、校园简介、建筑速看、系统信息等功能,从而实现智能化的管理方式,提高工作效率。

有状态和无状态登录

传统上用户登陆状态会以 Session 的形式保存在服务器上,而 Session ID 则保存在前端的 Cookie 中;而使用 JWT 以后,用户的认证信息将会以 Token 的形式保存在前端,服务器不需要保存任何的用户状态,这也就是为什么 JWT 被称为无状态登陆的原因,无状态登陆最大的优势就是完美支持分布式部署,可以使用一个 Token 发送给不同的服务器,而所有的服务器都会返回同样的结果。有状态和无状态最大的区别就是服务端会不会保存客户端的信息。

九大角度全方位对比Android、iOS开发_ios 开发角度-程序员宅基地

文章浏览阅读784次。发表于10小时前| 2674次阅读| 来源TechCrunch| 19 条评论| 作者Jon EvansiOSAndroid应用开发产品编程语言JavaObjective-C摘要:即便Android市场份额已经超过80%,对于开发者来说,使用哪一个平台做开发仍然很难选择。本文从开发环境、配置、UX设计、语言、API、网络、分享、碎片化、发布等九个方面把Android和iOS_ios 开发角度

搜索引擎的发展历史

搜索引擎的发展历史可以追溯到20世纪90年代初,随着互联网的快速发展和信息量的急剧增加,人们开始感受到了获取和管理信息的挑战。这些阶段展示了搜索引擎在技术和商业模式上的不断演进,以满足用户对信息获取的不断增长的需求。

随便推点

控制对象的特性_控制对象特性-程序员宅基地

文章浏览阅读990次。对象特性是指控制对象的输出参数和输入参数之间的相互作用规律。放大系数K描述控制对象特性的静态特性参数。它的意义是:输出量的变化量和输入量的变化量之比。时间常数T当输入量发生变化后,所引起输出量变化的快慢。(动态参数) ..._控制对象特性

FRP搭建内网穿透(亲测有效)_locyanfrp-程序员宅基地

文章浏览阅读5.7w次,点赞50次,收藏276次。FRP搭建内网穿透1.概述:frp可以通过有公网IP的的服务器将内网的主机暴露给互联网,从而实现通过外网能直接访问到内网主机;frp有服务端和客户端,服务端需要装在有公网ip的服务器上,客户端装在内网主机上。2.简单的图解:3.准备工作:1.一个域名(www.test.xyz)2.一台有公网IP的服务器(阿里云、腾讯云等都行)3.一台内网主机4.下载frp,选择适合的版本下载解压如下:我这里服务器端和客户端都放在了/usr/local/frp/目录下4.执行命令# 服务器端给执_locyanfrp

UVA 12534 - Binary Matrix 2 (网络流‘最小费用最大流’ZKW)_uva12534-程序员宅基地

文章浏览阅读687次。题目:http://acm.hust.edu.cn/vjudge/contest/view.action?cid=93745#problem/A题意:给出r*c的01矩阵,可以翻转格子使得0表成1,1变成0,求出最小的步数使得每一行中1的个数相等,每一列中1的个数相等。思路:网络流。容量可以保证每一行和每一列的1的个数相等,费用可以算出最小步数。行向列建边,如果该格子是_uva12534

免费SSL证书_csdn alphassl免费申请-程序员宅基地

文章浏览阅读504次。1、Let's Encrypt 90天,支持泛域名2、Buypass:https://www.buypass.com/ssl/resources/go-ssl-technical-specification6个月,单域名3、AlwaysOnSLL:https://alwaysonssl.com/ 1年,单域名 可参考蜗牛(wn789)4、TrustAsia5、Alpha..._csdn alphassl免费申请

测试算法的性能(以选择排序为例)_算法性能测试-程序员宅基地

文章浏览阅读1.6k次。测试算法的性能 很多时候我们需要对算法的性能进行测试,最简单的方式是看算法在特定的数据集上的执行时间,简单的测试算法性能的函数实现见testSort()。【思想】:用clock_t计算某排序算法所需的时间,(endTime - startTime)/ CLOCKS_PER_SEC来表示执行了多少秒。【关于宏CLOCKS_PER_SEC】:以下摘自百度百科,“CLOCKS_PE_算法性能测试

Lane Detection_lanedetectionlite-程序员宅基地

文章浏览阅读1.2k次。fromhttps://towardsdatascience.com/finding-lane-lines-simple-pipeline-for-lane-detection-d02b62e7572bIdentifying lanes of the road is very common task that human driver performs. This is important ..._lanedetectionlite

推荐文章

热门文章

相关标签