常见音频文件格式的特点。 常见的音频格式有哪些

常见音频文件格式的特点。

http://www.360doc.com/content/11/1125/18/8050095_167351161.shtml


  要在计算机内播放或是处理音频文件,也就是要对声音文件进行数、模转换,这个过程同样由采样和量化构成,人耳所能听到的声音,最低的频率是从20Hz起一直到最高频率20KHZ,20KHz以上人耳是听不到的,因此音频的最大带宽是20KHZ,故而采样速率需要介于40~50KHZ之间,而且对每个样本需要更多的量化比特数。音频数字化的标准是每个样本16位-96dB的信噪比,采用线性脉冲编码调制PCM,每一量化步长都具有相等的长度。在音频文件的制作中,正是采用这一标准。

CD格式:正统血脉

  当今世界上音质最好的音频格式是什么?当然是CD了。因此要讲音频格式,CD自然是打头阵的先锋。在大多数播放软件的“打开文件类型”中,都可以看到*.cda格式,这就是CD音轨了。标准CD格式也就是44.1K的采样频率,速率88K/秒,16位量化位数,因为CD音轨可以说是近似无损的,因此它的声音基本上是忠于原声的,因此如果你是一个音响发烧友的话,CD是你的首选。它会让你感受到天籁之音。CD光盘可以在CD唱机中播放,也能用电脑里的各种播放软件来重放。一个CD音频文件是一个*.cda文件,这只是一个索引信息,并不是真正的包含声音信息,所以不论CD音乐的长短,在电脑上看到的“*.cda文件”都是44字节长。注意:不能直接的复制CD格式的*.cda文件到硬盘上播放,需要使用象EAC这样的抓音轨软件把CD格式的文件转换成WAV,这个转换过程如果光盘驱动器质量过关而且EAC的参数设置得当的话,可以说是基本上无损抓音频。推荐大家使用这种方法。

WAV:无损

  是微软公司开发的一种声音文件格式,它符合PIFFResourceInterchange File Format 文件规范,用于保存WINDOWS平台的音频信息资源,被WINDOWS平台及其应用程序所支持。“*.WAV”格式支持MSADPCM、CCITT ALAW等多种压缩算法,支持多种音频位数、采样频率和声道,标准格式的WAV文件和CD格式一样,也是44.1K的采样频率,速率88K/秒,16位量化位数,看到了吧,WAV格式的声音文件质量和CD相差无几,也是目前PC机上广为流行的声音文件格式,几乎所有的音频编辑软件都“认识”WAV格式。但缺点是体型过于“巨大”。

AIFF与AU

  这里顺便提一下由苹果公司开发的AIFF(Audio InterchangeFile Format)格式和为UNIX系统开发的AU格式,它们都和WAV非常相像,在大多数的音频编辑软件中也都支持它们这几种常见的音乐格式。

MP3:流行

  MP3格式诞生于八十年代的德国,所谓的MP3也就是指的是MPEG标准中的音频部分,也就是MPEG音频层。根据压缩质量和编码处理的不同分为3层,分别对应“*.mp1"/“*.mp2”/“*.mp3”这3种声音文件。需要提醒大家注意的地方是:MPEG音频文件的压缩是一种有损压缩,MPEG3音频编码具有10:1~12:1的高压缩率,同时基本保持低音频部分不失真,但是牺牲了声音文件中12KHz到16KHz高音频这部分的质量来换取文件的尺寸,相同长度的音乐文件,用*.mp3格式来储存,一般只有*.wav文件的1/10,而音质要次于CD格式或WAV格式的声音文件。由于其文件尺寸小,音质好;所以在它问世之初还没有什么别的音频格式可以与之匹敌,因而为*.mp3格式的发展提供了良好的条件。直到现在,这种格式还是风靡一时,作为主流音频格式的地位难以被撼动。但是树大招风,MP3音乐的版权问题也一直是找不到办法解决,因为MP3没有版权保护技术,说白了也就是谁都可以用。

  MP3格式压缩音乐的采样频率有很多种,可以用64Kbps或更低的采样频率节省空间,也可以用320Kbps的标准达到极高的音质。我们用装有FraunhoferIIS Mpeg Lyaer3的MP3编码器(现在效果最好的编码器)MusicMatch Jukebox6.0在128Kbps的频率下编码一首3分钟的歌曲,得到2.82MB的MP3文件。采用缺省的CBR(固定采样频率)技术可以以固定的频率采样一首歌曲,而VBR(可变采样频率)则可以在音乐“忙”的时候加大采样的频率获取更高的音质,不过产生的MP3文件可能在某些播放器上无法播放。我们把VBR的级别设定成为与前面的CBR文件的音质基本一样,生成的VBRMP3文件为2.9MB。

MIDI:作曲家最爱

  经常玩音乐的人应该常听到MIDI(Musical InstrumentDigital Interface)这个词,MIDI允许数字合成器和其他设备交换数据。MID文件格式由MIDI继承而来。MID文件并不是一段录制好的声音,而是记录声音的信息,然后在告诉声卡如何再现音乐的一组指令。这样一个MIDI文件每存1分钟的音乐只用大约5~10KB。今天,MID文件主要用于原始乐器作品,流行歌曲的业余表演,游戏音轨以及电子贺卡等。*.mid文件重放的效果完全依赖声卡的档次。*.mid格式的最大用处是在电脑作曲领域。*.mid文件可以用作曲软件写出,也可以通过声卡的MIDI口把外接音序器演奏的乐曲输入电脑里,制成*.mid文件。

WMA:最具实力

  WMA (Windows Media Audio)格式是来自于微软的重量级选手,后台强硬,音质要强于MP3格式,更远胜于RA格式,它和日本YAMAHA公司开发的VQF格式一样,是以减少数据流量但保持音质的方法来达到比MP3压缩率更高的目的,WMA的压缩率一般都可以达到1:18左右,WMA的另一个优点是内容提供商可以通过DRM(Digital RightsManagement)方案如Windows MediaRights Manager 7加入防拷贝保护。这种内置了版权保护技术可以限制播放时间和播放次数甚至于播放的机器等等,这对被盗版搅得焦头乱额的音乐公司来说可是一个福音,另外WMA还支持音频流(Stream)技术,适合在网络上在线播放,作为微软抢占网络音乐的开路先锋可以说是技术领先、风头强劲,更方便的是不用象MP3那样需要安装额外的播放器,而Windows操作系统和Windows MediaPlayer的无缝捆绑让你只要安装了windows操作系统就可以直接播放WMA音乐,新版本的Windows MediaPlayer7.0更是增加了直接把CD光盘转换为WMA声音格式的功能,在新出品的操作系统WindowsXP中,WMA是默认的编码格式,大家知道Netscape的遭遇,现在“狼”又来了。WMA这种格式在录制时可以对音质进行调节。同一格式,音质好的可与CD媲美,压缩率较高的可用于网络广播。虽然现在网络上还不是很流行,但是在微软的大规模推广下已经是得到了越来越多站点的承认和大力支持,在网络音乐领域中直逼*.mp3,在网络广播方面,也正在瓜分Real打下的天下。因此,几乎所有的音频格式都感受到了WMA格式的压力。

  时下的MP3支持格式最常见的是MP3和WMA。MP3由于是有损压缩,因此讲求采样率,一般是44.1KHZ。另外,还有比特率,即数据流,一般为8---320KBPS。在MP3编码时,还看看它是否支持可变比特率(VBR),现在出的MP3机大部分都支持,这样可以减小有效文件的体积。WMA则是微软力推的一种音频格式,相对来说要比MP3体积更小。

RealAudio:流动旋律

  RealAudio主要适用于在网络上的在线音乐欣赏,现在大多数的用户仍然在使用56Kbps或更低速率的Modem,所以典型的回放并非最好的音质。有的下载站点会提示你根据你的Modem速率选择最佳的Real文件。现在real的的文件格式主要有这么几种:有RA(RealAudio)、RM(RealMedia,RealAudioG2)、RMX(RealAudioSecured),还有更多。这些格式的特点是可以随网络带宽的不同而改变声音的质量,在保证大多数人听到流畅声音的前提下,令带宽较富裕的听众获得较好的音质。

  近来随着网络带宽的普遍改善,Real公司正推出用于网络广播的、达到CD音质的格式。如果你的RealPlayer软件不能处理这种格式,它就会提醒你下载一个免费的升级包。

VQF:无人问津

  VQF是 雅马哈公司开发的一种格式是,它的核心是减少数据流量但保持音质的方法来达到更高的压缩比,可以说技术上也是很先进的,但是由于宣传不力,这种格式难有用武之地。*.vqf可以用雅马哈的播放器播放。同时雅马哈也提供从*.wav文件转换到*.vqf文件的软件。此文件缺少特点外加缺乏宣传,现在几乎已经宣布死刑了。

OGG:新生代音频格式

  Ogg全称应该是OGG Vobis(oggVorbis) 是一种新的音频压缩格式,类似于MP3等现有的音乐格式。但有一点不同的是,它是完全免费、开放和没有专利限制的。OGGVobis有一个很出众的特点,就是支持多声道,随着它的流行,以后用随身听来听DTS编码的多声道作品将不会是梦想。

  Vorbis 是这种音频压缩机制的名字,而Ogg则是一个计划的名字,该计划意图设计一个完全开放性的多媒体系统。目前该计划只实现了OggVorbis这一部分。

  Ogg Vorbis文件的扩展名是.OGG。这种文件的设计格式是非常先进的。现在创建的OGG文件可以在未来的任何播放器上播放,因此,这种文件格式可以不断地进行大小和音质的改良,而不影响旧有的编码器或播放器。

  ogg格式完全开源,完全免费,和mp3不相上下的新格式。

AAC: 前途无量

  AAC(高级音频编码技术Advanced AudioCoding),是杜比实验室为音乐提供的技术,最大能容纳48通道的音轨,采样率达96KHz。出现于1997年,是基于MPEG-2的音频编码技术。由FraunhoferIIS、杜比、苹果、AT&T、索尼等公司共同开发,以取代mp3格式。2000年,MPEG-4标准出台,AAC从新整合了其特性,故现又称MPEG-4AAC,即m4a。

  AAC作为一种高压缩比的音频压缩算法,AAC通常压缩比为18:1,也有资料说为20:1,远远超过了AC-3、MP3等较老的音频压缩算法。一般认为,AAC格式在96Kbps码率的表现超过了128Kbps的MP3音频。AAC另一个引人注目的地方就是它的多声道特性,它支持1~48个全音域音轨和15个低频音轨。除此之外,AAC最高支持96KHz的采样率,其解析能力足可以和DVD-Audio的PCM编码相提并论,因此,它得到了DVD论坛的支持,成为了下一代DVD的标准音频编码。

无损压缩格式

  APE格式

  新一代的无损音频格式。 APE的本质,其实它是一种无损压缩音频格式。庞大的WAV音频文件可以通过Monkey''sAudio这个软件进行“瘦身”压缩为APE。很时候它被用做网络音频文件传输,因为被压缩后的APE文件容量要比WAV源文件小一半多,可以节约传输所用的时间。更重要的是,通过Monkey'sAudio解压缩还原以后得到的WAV文件可以做到与压缩前的源文件完全一致。所以APE被誉为“无损音频压缩格式”,Monkey''sAudio被誉为“无损音频压缩软件”。

  FLAC格式

  非常成熟的无损压缩格式,名气不在APE之下!FLAC是FreeLosslessAudioCodec的简称,该格式的源码完全开放,而且兼容几乎所有的操作系统平台。它的编码算法相当成熟,已经通过了严格的测试,而且据说在文件点损坏的情况下依然能够正常播放(这一点我不曾试过)。该格式不仅有成熟的Windows制作程序,还得到了众多第三方软件的支持。

  TAK格式(Tom'sAudio Kompressor

  TAK是一种新型的无损音频压缩格式,全称是Tom's AudioKompressor,产于德国。目前最新版本还停留在1.01(2007年06月02日)。它类似于FLAC和APE,总体来说,压缩率类似APE而且解压缩速度类似FLAC,算是综合了两者的优点。另外,用此格式的编码器压缩的音频是VBR,即可变比特率的。

  几大特点:

  -较为优秀的压缩率。使用Extra参数的压缩率类似APE的High参数,而使用TAK最快的压缩参数Turbo得到的结果和FLAC压缩率最大的参数效果有得一比。

  -较快的压缩速度。作者说在相同压缩率的情况下,据他了解尚未有别的格式能够比TAK的Turbo和Fast的参数压缩得更快。

  -非常快的解压速度。类似于FLAC的解压速度。

  -支持很多常用音频格式转换为TAK。

  -流支持。每隔两秒,包含解码所需全部信息的一桢会被插入到音频中。

  -容错度。1比特的信息出错,最多影响到250毫秒的音频。由于有上文提到的技术支持,利用本格式压缩的损坏严重的音频也可照样播放,代价是损坏的部分由静音代替。

  -错误校验。24比特的CRC校验用于每一桢上。

  -简单快速的查找能力。即在你需要从中间某一点播放的时候,能够很快地找到你想要的地方开始播放,定位也十分准确。

  -支持音频信息。同时支持利用外挂CUE分割音轨和添加音频信息。类似APE等。

  TTA格式(TrueAudio

  True Audio(缩写TTA)是一种免费又简单的实时无损音频编解码器。TTA是一种基於自适应预测过滤的无损音频压缩,与目前主要的其他各式相比,能有相同或更好的压缩效果。

  可将数据压缩至30%的无损音频数据压缩

  实时编码/解码演算法

  操作快捷、对系统要求低

  支持多平台

  免费和开放源码

  硬体支持

  TTA是用於对多声道8、16、24bits整型和32bitsIEEE浮点型的音频WAV格式的无损压缩,压缩的大小范围是原文件大小的30%—70%。TTA格式主要目标不是追求最大的压缩率,而是对於硬体执行的编码演算法最优化,同时支持ID3v1和ID3v2两种标签信息。

  使用True Audio编码,您可以将20张收藏的音频CD存储到一张DVD-R盘上并播放。还能用流行的ID3标签存储所有曲目的信息。

  WV格式(WavPack)

  一种相当有特点的音频压缩格式,WavPack不仅仅是一个无损压缩格式,它还能同时作为有损压缩格式。在其独特的“hybrid”模式下,WavPack可以压缩成wv文件(有损压缩格式,大小一般相当于WAV文件的23%左右)+wvc文件(修正文件,大小一般相当于WAV文件的41%左右)的组合。有了对应的wvc文件,有损压缩格式的wv文件就变成了无损格式,播放时和普通的无损压缩格式完全一样。如果为了减少文件体积,你可以去掉这个wvc文件,这时wv文件就变成有损格式了,播放起来和高比特率的MP3完全一样!WavPack同时包容了无损格式和有损格式,神奇吧?通过WavPackFrontend前台程序,我们可以方便地使用WavPack格式。

  WavPack是目前主流的无损压缩格式之一,编码速度和算法都相较APE要好。

  WV 优点

  * Open source(开放源码)

  * Very fast decoding(快速解码)

  * Good efficiency(高压缩率)

  * Errorrobustness (容错)

  * Streaming support(支持流媒体)

  * Hardware support(RockBox) (硬件支持)

  * Supports multichannelaudio and high resolutions (多声道)

  * Hybrid/lossymode (有损/无损模式)

  * Tagging support (ID3v1, APEtags) (D3v1、APE标签支援)

  * Supports RIFF chunks(支持RFF)

  * Ability to create selfextracting files for Win32 platform(win32系统支持产生自解压档案)

  * Pipe support

  * Good software support(相当不错的软件支持)

  * ReplayGaincompatible

  WV Other features(其它功能)

  * Supports 32bit floatstreams (支持32bit浮动串流)

  * Supports embedded CUEsheets (支持cue清单)

  * Includes MD5 hashes for quickintegrity checking (支持MD5校验)

  * Can encode in bothsymmetrical and assymmetricalmodes(对称与不对称模式均可编码)

  * Fits the Matroskacontainer (可放入Matroska外壳,也就是MKV)

评论

  作为数字音乐文件格式的标准, WAV 格式容量过大,因而使用起来很不方便。因此,一般情况下我们把它压缩为MP3或WMA 格式。压缩方法有无损压缩,有损压缩,以及混成压缩。MPEG,JPEG就属于混成压缩,如果把压缩的数据还原回去,数据其实是不一样的。当然,人耳是无法分辨的。因此,如果把MP3,OGG格式从压缩的状态还原回去的话,就会产生损失。然而,APE 格式即使还原,也能毫无损失地保留原有音质。所以, APE可以无损失高音质地压缩和还原。在完全保持音质的前提下,APE的压缩容量有了适当的减小。拿一个最为常见的38MBWAV文件为例,压缩为APE 格式后为25MB 左右,比开始足足少了13MB。而且MP3容量越来越大的今天,25M的歌曲已经算不上什么庞然大物了。以1GB的mp3来说可以放入4张CD,那就是40多首歌曲,已经足够了!

=======================================================================================

码率  码率就是数据传输时单位时间传送的数据位数,一般我们用的单位是kbps即千位每秒。

  通俗一点的理解就是取样率,单位时间内取样率越大,精度就越高,处理出来的文件就越接近原始文件,但是文件体积与取样率是成正比的,所以几乎所有的编码格式重视的都是如何用最低的码率达到最少的失真,围绕这个核心衍生出来的cbr(固定码率)与vbr(可变码率),都是在这方面做的文章,不过事情总不是绝对的,从音频方面来说,码率越高,被压缩的比例越小,音质损失越小,与音源的音质越接近。

码率计算公式  基本的算法是:文件体积=时间X码率/8
这里时间单位是秒,码率除以8,就不用说了。举例,D5的碟,容量4.3G,考虑到音频的不同格式,占用一定的空间,姑且算为600M,视频文件应不大于3.7G,视频长度100分钟(6000秒),计算结果:码率应为4900K。

码率几点原则

  1、码率和质量成正比(废话),但是文件体积也和码率成正比。这是要牢记的。

  2、码率超过一定数值,对图像的质量没有多大影响。

  3、DVD的容量有限,无论是标准的4.3G,还是超刻,或是D9,都有极限。这也是废话,但是就有人记不住或忽略这点,漫天讨论。

视频码率  计算机中的信息都是二进制的0和1来表示,其中每一个0或1被称作一个位,用小写b表示,即bit(位);大写B表示byte,即字节,一个字节=八个位,即1B=8b;前面的大写K表示千的意思,即千个位(Kb)或千个字节(KB)。表示文件的大小单位,一般都使用字节(KB)来表示文件的大小。
Kbps:首先要了解的是,ps指的是/s,即每秒。Kbps指的是网络速度,也就是每秒钟传送多少个千位的信息(K 表示千位,Kb表示的是多少千个位),为了在直观上显得网络的传输速度较快,一般公司都使用kb(千位)来表示,如果是KBps,则表示每秒传送多少千字节。1KBps=8Kbps。ADSL上网时的网速是512Kbps,如果转换成字节,就是512/8=64KBps(即64千字节每秒)。

帧率  帧率(Framerate是用于测量显示帧数的量度。所谓的测量单位为每秒显示帧数(FramesperSecond,简:FPS)或“赫兹”(Hz)。此词多用于影视制作和电子游戏。
由于人类眼睛的特殊生理结构,如果所看画面之帧率高于16的时候,就会认为是连贯的,此现象称之为视觉暂留。这也就是为什么电影胶片是一格一格拍摄出来,然后快速播放的。
而对游戏,一般来说,第一人称射击游戏比较注重FPS的高低,如果FPS<30的话,游戏会显得不连贯。所以有一句有趣的话:“FPS(指FPS游戏)重在FPS(指帧率)。
每秒的帧数(fps)或者说帧率表示图形处理器处理场时每秒钟能够更新的次数。高的帧率可以得到更流畅、更逼真的动画。一般来说30fps就是可以接受的,但是将性能提升至60fps则可以明显提升交互感和逼真感,但是一般来说超过75fps一般就不容易察觉到有明显的流畅度提升了。如果帧率超过屏幕刷新率只会浪费图形处理的能力,因为监视器不能以这么快的速度更新,这样超过新率的帧率就浪费掉了。


一、帧率、码流与分辨率

  帧率概念

  一帧就是一副静止的画面,连续的帧就形成动画,如电视图象等。我们通常说帧 数,简单地说,就是在1秒钟时间里传输的图片的数,也可以理解为图形处理器每秒钟能够刷新几次,通常用fps(FramesPerSecond)表示。每一帧都是静止的图象,快速连续地显示帧便形成了运动的假象。高的帧率可以得到更流畅、更逼真的动画。每秒钟帧数(fps)愈多,所显示的动作就会愈流畅。

  码流概念码流(DataRate),是指视频文件在单位时间内使用的数据流量,也叫码率,是他是视频编码中画面质量控制中最重要的部分。同样分辨率下,视频文件的码流越大,压缩比就越小,画面质量就越高。

  分辨率概念视频分辨率是指视频成像产品所成图像的大小或尺寸。常见的视像分辨率有352×288,176×144,640×480,1024×768。在成像的两组数字中,前者为图片长度,后者为图片的宽度,两者相乘得出的是图片的像素,长宽比一般为4:3。

二、用码流和时间计算流媒体文件大小

编码率/比特率直接与文件体积有关。且编码率与编码格式配合是否合适,直接关系到视频文件是否清晰。
在视频编码领域,比特率常翻译为编码率,单位是Kbps,例如800Kbps
其中,1K=1024 1M=1024K
b 为 比特(bit)这个就是电脑文件大小的计量单位,1KB=8Kb,区分大小写,B代表字节(Byte)
s 为 秒(second)
p 为 每(per)
以800kbps来编码表示经过编码后的数据每秒钟需要用800K比特来表示。


1MB=8Mb=1024KB=8192Kb

Windows系统文件大小经常用B(字节)为单位表示,但网络运营商则用b(比特),也就是为什么512K速度宽带在电脑上显示速度最快只有约64K的原因,网络运营商宣传网速的时候省略了计量单位。
完整的视频文件是由音频流与视频流2个部分组成的,音频和视频分别使用的是不同的编码率,因此一个视频文件的最终技术大小的编码率是音频编码率+视频编码率。例如一个音频编码率为128Kbps,视频编码率为800Kbps的文件,其总编码率为928Kbps,意思是经过编码后的数据每秒钟需要用928K 比特来表示。
了解了编码率的含义以后,根据视频播放时间长度,就不难了解和计算出最终文件的大小。编码率也高,视频播放时间越长,文件体积就越大。不是分辨率越大文件就越大,只是一般情况下,为了保证清晰度,较高的分辨率需要较高的编码率配合,所以使人产生分辨率越大的视频文件体积越大的感觉


计算输出文件大小公式:(音频编码率(KBit为单位)/8 +视频编码率(KBit为单位)/8×影片总长度(秒为单位)=文件大小(MB为单位)

这样以后大家就能精确的控制输出文件大小了。
例:有一个1.5小时(5400秒)的影片,希望转换后文件大小刚好为700M
计算方法如下:
700×8÷5400×1024≈1061Kbps
意思是只要音频编码率加上视频编码率之和为1061Kb,则1个半小时的影片转换后文件体积大小刚好为700M。

至于音频编码率和视频编码率具体如何设置,就看选择的编码格式和个人喜好了,只要2者之和为1061即可。如可以设置为视频编码格式H264,视频编码率900Kbps,音频编码格式AAC,编码率161Kbps。
与文件体积大小有关的码率是指的平均码率,因此,不论是使用固定比特一次编码方式还是使用二次(多次)动态编码方式,都是可以保证文件大小的。只有使用基于质量编码的方式的时候,文件大小才不可控制。

编码格式有很多种,在技术不断进步的情况下,针对不同的用途,产生了各种编码格 式。不同编码格式的压缩率不一样,且有各自的特点,有些在低码率情况下能保持较高的画面质量,但在高码率情况下反而画面质量提示不大,有些适合在高码率情况下保持高清晰度画面,但可能在低码率情况下效果不佳。介绍常见的几种。
RMVB/RM在制定的时候主要考虑的是网络传播,目的在于利用不快的网速传播视觉可以接受的画面质量。因此,RMVB/RM编码格式的特点是较低码率下能获得较好的视频质量

(ffmpeg -g 3 -r 3 -t 10 -b 50k -s qcif -f rv10 /tmp/b.rm 低码率低质量的高压缩转换)

但高码率的情况下反不如其他编码格式。同样是RM/RMVB后缀的文件,其内部编码格式细分还有R8/R9/R10等,但总的来说,上面所说的特点依然是存在的。只是压缩率更高了,因此RMVB没人用在高清编码领域。RMVB追求的是高压缩率,能接受的画面质量,所以经常压缩掉一些不容易注意的细节。初看画面不错,细看就发现画面不锐利,层次不分明,总给人一直模糊的感觉。RMVB/RM后缀文件的音频编码部分同样存在这样的情况,声音压缩率很高,但只是能听,不要奢望达到声音动听的境界。RMVB的流行,一是因为REAL的这种格式适合低速网络的传播,能以较小的文件体积获得可以接受的画面质量。二是随着RMVB的使用,开始出现功能比较完善的转码软件和解决方案,方便了视频爱好者,扩大了影片来源。但随着网速越来越快,H264等更好的编码器出现,同时也因为RMVB不适合高清视频制作,且若对于其他硬件厂家希望支持RMVB/RM格式,就必须向REAL公司支付相当昂贵的专利费,导致很多硬件厂商放弃了对RMVB文件的支持。RMVB的文件已经不是以前那种完全压倒性的优势了。现在网络传播的视频文件已经很多都是AVI、MKV、MP4、3GP等后缀了。其中MKV等多用于高清视频文件,MP4、3GP等多用于手机和便携式设备等领域,AVI则使用范围更加广,不但在高清晰度视频文件中有AVI文件,在便携式设备领域也有AVI使用。
VCD用的视频编码格式为MPEG1,DVD的则为MPEG2,VCD和DVD都主要用于家庭影音播放,而且一般来说,VCD用的MPEG1编码为固定码率编码。DVD可以支持动态码率的MPEG2编码。为了能保证激烈变化画面的时候的清晰度,其默认编码率都比较高,VCD标准编码率为1152Kbps,DVD开放些,根据影片播放时间,常设置为5000Kbps-8000Kbps之间,在不浪费DVD碟容量的前提下尽可能的使用较高的码率获得更高的清晰度。MPEG1和MPEG2在超低码率情况效果不佳,且过分提高码率,画面效果带来的提示也不明显。

自然界中的声音非常复杂,波形极其复杂,通常我们采用的是脉冲代码调制编码,即PCM编码。PCM通过抽样、量化、编码三个步骤将连续变化的模拟信号转换为数字编码。


1-1什么是采样率和采样大小(位/bit

声音其实是一种能量波,因此也有频率和振幅的特征,频率对应于时间轴线,振幅对应于电平轴线。波是无限光滑的,弦线可以看成由无数点组成,由于存储空间是相对有限的,数字编码过程中,必须对弦线的点进行采样。采样的过程就是抽取某点的频率值,很显然,在一秒中内抽取的点越多,获取得频率信息更丰富,为了复原波形,一次振动中,必须有2个点的采样,人耳能够感觉到的最高频率为20kHz,因此要满足人耳的听觉要求,则需要至少每秒进行40k次采样,用40kHz表达,这个40kHz就是采样率。我们常见的CD,采样率为44.1kHz。光有频率信息是不够的,我们还必须获得该频率的能量值并量化,用于表示信号强度。量化电平数为2的整数次幂,我们常见的CD位16bit的采样大小,即2的16次方。采样大小相对采样率更难理解,因为要显得抽象点,举个简单例子:假设对一个波进行8次采样,采样点分别对应的能量值分别为A1-A8,但我们只使用2bit的采样大小,结果我们只能保留A1-A8中4个点的值而舍弃另外4个。如果我们进行3bit的采样大小,则刚好记录下8个点的所有信息。采样率和采样大小的值越大,记录的波形更接近原始信号。

1-2有损和无损

根据采样率和采样大小可以得知,相对自然界的信号,音频编码最多只能做到无限接近,至少目前的技术只能这样了,相对自然界的信号,任何数字音频编码方案都是有损的,因为无法完全还原。在计算机应用中,能够达到最高保真水平的就是PCM编码,被广泛用于素材保存及音乐欣赏,CD、DVD以及我们常见的WAV 文件中均有应用。因此,PCM约定俗成了无损编码,因为PCM代表了数字音频中最佳的保真水准,并不意味着PCM就能够确保信号绝对保真,PCM也只能做到最大程度的无限接近。我们而习惯性的把MP3列入有损音频编码范畴,是相对PCM编码的。强调编码的相对性的有损和无损,是为了告诉大家,要做到真正的无损是困难的,就像用数字去表达圆周率,不管精度多高,也只是无限接近,而不是真正等于圆周率的值。

1-3为什么要使用音频压缩技术
常见音频文件格式的特点。 常见的音频格式有哪些

要算一个PCM音频流的码率是一件很轻松的事情,采样率值×采样大小值×声道数bps。一个采样率为44.1KHz,采样大小为16bit,双声道的PCM编码的WAV文件,它的数据速率则为44.1K×16×2 =1411.2Kbps。我们常说128K的MP3,对应的WAV的参数,就是这个1411.2Kbps,这个参数也被称为数据带宽,它和ADSL中的带宽是一个概念。将码率除以8,就可以得到这个WAV的数据速率,即176.4KB/s。这表示存储一秒钟采样率为44.1KHz,采样大小为16bit,双声道的PCM编码的音频信号,需要176.4KB的空间,1分钟则约为10.34M,这对大部分用户是不可接受的,尤其是喜欢在电脑上听音乐的朋友,要降低磁盘占用,只有2种方法,降低采样指标或者压缩。降低指标是不可取的,因此专家们研发了各种压缩方案。由于用途和针对的目标市场不一样,各种音频压缩编码所达到的音质和压缩比都不一样,在后面的文章中我们都会一一提到。有一点是可以肯定的,他们都压缩过。

1-4频率与采样率的关系

采样率表示了每秒对原始信号采样的次数,我们常见到的音频文件采样率多为44.1KHz,这意味着什么呢?假设我们有2段正弦波信号,分别为20Hz和20KHz,长度均为一秒钟,以对应我们能听到的最低频和最高频,分别对这两段信号进行40KHz的采样,我们可以得到一个什么样的结果呢?结果是:20Hz的信号每次振动被采样了40K/20=2000次,而20K的信号每次振动只有2次采样。显然,在相同的采样率下,记录低频的信息远比高频的详细。这也是为什么有些音响发烧友指责CD有数码声不够真实的原因,CD的44.1KHz采样也无法保证高频信号被较好记录。要较好的记录高频信号,看来需要更高的采样率,于是有些朋友在捕捉CD音轨的时候使用48KHz的采样率,这是不可取的!这其实对音质没有任何好处,对抓轨软件来说,保持和CD提供的44.1KHz一样的采样率才是最佳音质的保证之一,而不是去提高它。较高的采样率只有相对模拟信号的时候才有用,如果被采样的信号是数字的,请不要去尝试提高采样率。

  

爱华网本文地址 » http://www.413yy.cn/a/25101013/161753.html

更多阅读

宫颈癌的早期症状有哪些 直肠癌的早期症状

宫颈癌的早期症状有哪些?宫颈癌给女性朋友带来了很大身体和心理的危害。宫颈癌的早期症状并无任何不适,常常在体检、普查时发现。不少病人因为有接触性阴道出血而就医,在大便及阴道检查时,往往有无痛性阴道出血。少数病人阴道分泌物增多

互联网的典型应用有哪些? 互联网金融典型案例

互联网的典型应用有哪些?——简介Internet起源于美国国防部高级研究计划署DARPA的前身ARPAnet,该网于1969年投入使用。现在它已经渗透进了人们日常的学习、工作、生活、娱乐等各个方面,为我们带来了前所未有的方便。那么互联网的典型应

性价比高的智能手机有哪些 小辣椒

性价比高的智能手机有哪些——简介小米。魅族。LG。华为。还有小米旗下的红米手机,这几款手机都属于性价比 比较高的手机了,他们具有高端手机的智能性能,价位比高端手机要便宜很多。下面小编具体介绍下他们各自的优点缺点,仅供大家参考

高血压的治疗方法有哪些 治疗高血压要多少钱

高血压的治疗方法有很多,除降压药外,高血压的治疗方法还有食疗、运动疗法、室内补充负氧离子等方法,高血压患者可以根据自身情况选择合适的治疗方法。高血压的治疗方法有哪些——高血压的治疗方法一:食疗 高血压的治疗方法有哪些 1、控

购买预售房的注意事项有哪些 商品预售注意事项

购买预售房的注意事项有哪些——简介预售是在房屋还没建成的情况下与购房者达成预购合同。在这时,购房者因为不能马上获得自己的购买的房屋,需要比普通的商品房买卖承担更多的风险。那么,在签订这类预售合同的注意事项有哪些呢?购买预

声明:《常见音频文件格式的特点。 常见的音频格式有哪些》为网友举杯消愁愁更愁分享!如侵犯到您的合法权益请联系我们删除