为什么数码声音难听还能听-----声音的掩蔽效应

红灯记 · 发表于 2013-9-9 07:47:03

赶快注册并登录访问我们网站，呈现更多精彩内容！

您需要登录才可以下载或查看，没有帐号？注册加入

x

本帖最后由红灯记于 2013-9-9 15:59 编辑

　　为什么数码声音难听？因为模拟的声音所携带的信息量非常丰富，非常接近自然声音，如实准确地反映着自然声音的各个频率成分。然而数字化的采样过程，会丢失对模拟信号极为细节部分的采样，至少目前的数字化压缩/解压缩方式无法避免这个弊端。再好的硬件系统、再牛的软件算法，都无法解决这个问题，采样过程A/D中会丢失对模拟的细节的采样，这是丢失的第一关，也是最为重要的一关。在跟下来的压缩编码、储存、解压缩以及最后的D/A过程都会有更多数据的丢失，这种丢失的弥补是靠软件算法中插值补充的。这种插值补充填入的数据，是根据算法临时产生的修补数据，它的依据就是对丢失位的前后N个数据进行均值计算而产生，和实际的真实丢失的数据很难做到一致，比如：某一位原来是1，丢失后如果插值补充也是1，那就正确了，可是如果它给插入的是0呢？如果在一个16比特的量化数据里，丢失几位呢？这样产生的数据的准确性就大打折扣了，举个最简单的例子，一张原版的CD，我们把它1:1的复制刻录，重放比较，copyd的碟子和原来的碟子听感不一样，其最根本的原因就是copy过程中数据丢失了。所以数字声音的听感就大打折扣了。可是数字声音为什么还能混过我们的耳朵，能听呢？这些主要是我们的人耳听觉的两个特点决定的，请看：
数字音频压缩系统一般都是有损压缩系统，即压缩以后的数字音频信号不能被还原成压缩前相同的信号波形。那么，音频压缩编码又是如何能保证声音的质量呢？实际上音频压缩编码通过利用人耳的听觉特性，使得人耳几乎感觉不到受损的那部分数据。它所利用的特性就是人耳的听觉系统的掩蔽效应.。
　　人耳的听觉感应频率大约是20HZ到20KHZ，但是在这个可听的频率段里的灵敏度是不均匀的。它和声音的频率有关，实验表明，在一个安静的环境里，耳朵在频率大约是2KHZ到4KHZ的范围内最敏感。于此相反，人的听觉系统有两个性质可用于音频压缩。它们是频率掩蔽和时间掩蔽。
　　频率掩蔽
　　频率掩蔽是指通常情况下能够听到的声音呗邻近频率的另一个声音掩蔽掉。在某个频率出的强信号源，会使它周围频率的正常阀值升高，这使得邻近的一些声音信号由于受到这个强信号的掩蔽而听不见了。在这种情况下，传送时相应于被掩蔽处的声音可以不予以编码，因为它是听不见的。这是有损压缩的一种非常有效的方法。频率掩蔽阀值的曲线与频率有关，它的变化从最低的可听频率100HZ到最高可听频率4KHZ.。
　　时域掩蔽
　　时域掩蔽效应也同样存在，一般情况下有下面三种情况：
　　前掩蔽（pre-masking):在掩蔽信号开始之前，人耳对测试信号的听觉阀值已经提高，也就是一个声音影响了在时间上先于它的听觉能力。只是由于人耳对声音的感觉不是瞬时的，而是一段时间内对声音效果的积累。
　　同时效应（simultaneous masking)在一定的时间内由一个声音对另一个声音同时发生了掩蔽效应。
　　后掩蔽（post masking）：一个频率的声音虽然已经结束，但是它对另一个频率声音的听觉能力依然存在着影响。
前面说到的丢失，以及丢失后差值补充的误码，还有容错后的再纠正等等，最后的数据信号已经面目全非，再加上利用咱们人耳的这两种掩蔽效用，哪儿还能听到好的声音听呢？