数据冗余是指数据之间的重复,也可以说是同一数据存储在不同数据文件中的现象。
数据冗余的种类主要有:空间冗余、时间冗余、信息熵冗余、结构冗余、知识冗余、视觉冗余、其它冗余等。
我认为比较重要的有空间冗余、时间冗余、结构冗余和视觉冗余这四种。
以下是对这四种冗余的简单描述:
(1)空间冗余
空间冗余是图像数据中经常存在的一种冗余,是静态图像中存在的最主要的一种数据冗余。
同一景物表面上采样点的颜色之间往往存在着空间连贯性,但是基于离散像素采样来表示物体颜色的方式通常没有利用这种连贯性。
例如:图像中有一片连续的区域,其像素为相同的颜色,空间冗余产生。
(2)时间冗余
时间冗余是序列图像(电视图像、动画)和语音数据中所经常包含的冗余。
图像序列中的两幅相邻的图像,后一幅图像与前一幅图像之间有较大的相关性,这反映为时间冗余。同理,在语言中,由于人在说话时发音的音频是一连续的渐变过程,而不是一个完全的在时间上独立的过程,因而存在时间冗余。
例如:房间里的两个人在聊天,在这个聊天的过程中,背景(房间和家具)一直是相同的,同时也没有移动,而且是同样的两个人在聊天,只有动作和位置的变化。
(3)结构冗余
结构冗余是在某些场景中,存在着明显的图像分布模式,这种分布模式称作结构。图像中重复出现或相近的纹理结构,结构可以通过特定的过程来生成。
例如:方格状的地板,蜂窝,砖墙,草席等图结构上存在冗余。已知分布模式,可以通过某一过程生成图像。
(4)视觉冗余
人类视觉系统对于图像场的任何变化,并不是都能感知的。例如,对于图像的编码和解码处理时,由于压缩或量比截断引入了噪声而使图像发生了一些变化,如果这些变化不能为视觉所感知,则仍认为图像足够好。事实上人类视觉系统一般的分辨能力约为26灰度等级,而一般图像量化采用28灰度等级,这类冗余我们称为视觉冗余。通常情况下,人类视觉系统对亮度变化敏感,而对色度的变化相对不敏感;在高亮度区,人眼对亮度变化敏感度下降对物体边缘敏感,内部区域相对不敏感;对整体结构敏感,而对内部细节相对不敏感。