MPEG音频第三层编码的算法研究与硬件实现

MPEG音频第三层编码的算法研究与硬件实现

一、MPEG音频第Ⅲ层编码的算法研究与硬件实现(论文文献综述)

罗一帆[1](2021)在《基于媒体特征分析的自适应音视频水印关键技术研究》文中提出随着多媒体技术、网络技术的发展,多媒体数字产品的复制与传播变得非常便捷。相应的,盗版行为也日益猖獗,给版权商带来了不可估量的经济损失。因此,急需有效的版权保护措施来遏制盗版行为。在这一背景下,学者们提出了数字水印技术,经过近年来的快速发展,已成功应用于多媒体数字产品的版权保护,挽回了盗版带来的经济损失。因而,研究数字水印技术,进一步提升其版权保护效果,是一项具有重要理论意义与应用价值的工作。音视频作为视听媒体的代表,其版权保护是数字水印研究的重点,研究者们已提出了多种音视频数字水印方法。但现有方法对音视频信号在时-频域中的变化特征缺乏充分的研究与应用,导致水印抗时域同步攻击、几何变换等攻击能力不足,水印鲁棒性和不可感知性均有待提升;同时,对新发展起来的无损压缩音频、3D视频研究不足,少有针对性数字水印算法。为解决这些问题,本文基于音视频特征信息分析,从以下两个方面提出解决思路。第一,分析音视频信号时-频域变化规律,根据规律构建特征信息作为信号自适应分段标志、确定水印嵌入位置;水印嵌入位置随特征信息变化而改变,而各类攻击对特征信息影响小,水印抗同步攻击、几何攻击等攻击鲁棒性得到提升。第二,将水印嵌入与提取过程同音频信号变化特征、编解码特征、视频角点特征、3D视图渲染特征相结合,充分运用特征信息来提升水印不可感知性和抗各类攻击的鲁棒性。根据解决思路,本文提出了以下解决方案:依次构建在各类攻击下鲁棒性更强的音频节拍、音频显着状态、视频角点、视频对象动作等特征信息作为信号分段、水印嵌入位置选择或水印认证标志,实现水印抗同步攻击鲁棒性的提升。针对有损压缩、无损压缩音频,2D、3D视频,将特征信息构建与水印嵌入、提取方法相结合,分别设计双通道音频水印算法、双域音频水印算法、与无损压缩编码相结合的无损音频水印算法、与视觉密码相结合的2D视频‘零水印’算法、与3D渲染模式相结合的3D视频水印算法,各有侧重地提升水印鲁棒性和不可感知性。根据解决方案,具体算法实现如下:一、提出了基于信号自适应分段与嵌入强度优化的双通道音频水印算法。利用自相关检测法对音频信号进行自适应分段,作为水印嵌入位置选择标志,提高水印抗同步攻击鲁棒性。构建音频信号双通道特征信息,设计水印双通道嵌入与提取方法,降低水印嵌入强度,提高水印不可感知性。二、提出了基于离散小波包变换的双域音频水印算法。设计更具鲁棒性的音频信号自适应分段方法,水印具备更强的抗同步攻击能力;引入心理声学模型,将音频信号划分为听觉掩蔽域和被掩蔽域,设计符合掩蔽效应的双域水印嵌入位置选择方法、水印嵌入强度自适应控制方法,在双域中同时进行水印嵌入与提取,既提高水印的鲁棒性,又能保障其不可感知性。三、提出了针对MPEG-4 SLS格式的无损压缩音频水印算法。构建MPEG-4 SLS(Scalable Lossless Coding)编码整型修正离散余弦变换(Integer Modified Discrete Cosine Transform,Int MDCT)系数显着状态特征信息作为水印嵌入位置选择标志,增强特征信息鲁棒性,实现水印抗同步攻击鲁棒性的提升;设计与无损编解码技术相结合的水印嵌入与提取方法,提高水印抗各类信号处理攻击的鲁棒性,同时应用听觉掩蔽效应实现对水印嵌入强度的有效控制。四、提出了基于时-空域特征和视觉密码的视频‘零水印’算法。设计有限状态机进行关键帧选择,在关键帧中构建时-空域角点特征信息作为水印认证信息元素,提高特征信息抗同步攻击、色彩与几何攻击鲁棒性。将特征信息与视觉密码相结合,生成鲁棒性水印认证信息,在版权机构进行注册,在不改变视频信号的前提下实现水印嵌入。五、提出了基于深度图像渲染(Depth-image-based rendering,DIBR)的3D视频水印算法。与DIBR特征进行融合,构建视频帧对象动作特征信息作为水印嵌入位置自适应选择标志,增强特征信息鲁棒性,提升水印抗深度信息变化、几何变换攻击鲁棒性;设计同DIBR渲染过程相结合的水印嵌入与提取方法,提升水印鲁棒性和不可感知性。综上所述,本文针对现有音视频水印方法存在的问题,基于特征信息分析对音视频数字水印关键技术进行研究。分析音视频信号时-频域变化特征与鲁棒性特征信息提取方法,提出了问题解决思路,给出了解决方案。实现了在小波域、时空域、压缩域中对有损压缩音频、无损压缩音频、2D视频、3D视频进行水印嵌入与提取,有效增强了水印鲁棒性和不可感知性,为水印算法的应用打下了更坚实的基础。

李扬[2](2017)在《基于FPGA的船舶航行记录仪语音压缩系统的设计与实现》文中研究指明随着世界经济的不断发展,世界各地之间的贸易往来也随之越来越多,航运事业快速蓬勃发展,航运事故时有发生。在航运事故中,为了能够更好的对事故进行定性以及分析事故原因,对船舶在航行时的数据信息加以记录变得愈发重要。船载航行数据记录仪能够记录船舶在航行时的各种重要信息,包括日期和时间、船位船速、驾驶室声音、通信声音、雷达数据、回声测深仪、主报警等。由于船载航行数据记录仪时常受内存大小的限制,如何对各种数据信息进行安全、有效的存储,具有重要的研究价值和实用价值。本文针对船舶航行中的语音信号进行压缩存储处理,主要工作分为:本文使用DIGILENT公司生产的NEXYS4作为主开发板,板上集成了 Xilinx公司的Artix-7TM系列的XC7A100T-1CSG324C芯片,并选用MAX9812作为语音信号采集放大模块,MAX9860作为模数转换模块,CH372作为USB传输模块,实现了双路语音信号的采集、模数转换、压缩编码,传输存储以及回放的功能。本文对目前常见的一些船载航行数据记录仪进行研究,主要分析了它们的系统架构,以及所使用的语音压缩编码算法,以及其优势和劣势所在。根据国际电工技术委员会(International Eletro-technical Commission,IEC)61996 文件《船载航行数据记录仪性能要求、校验方式及合格的检验结果》的要求,最终确定了本文的总体设计。本文利用FPGA芯片并行的对语音信号进行压缩编码,多路数据分别缓存,通过USB 口进行传输存储。语音信号的采集通过MAX9812来完成,模数转换通过MAX9860来完成,将模拟信号通过44.1khz的采样频率转变为16位的PCM信号,通过I2S总线传输。信号的压缩编码采取MPEG 1 layer Ⅱ编码算法,生成比特率为128kbs的MP2标准码流进行传输。数据的传输由CH372模块实现,该模块集成了 USB通信协议,通过FPGA模拟其时序,使用其内置固件模式进行数据传输。多路数据分别打包缓存,在上位机进行区分存储。实验结果表明,本文实现了系统各项功能,并能够实时、稳定的工作。

向科燏[3](2011)在《可分级视频编码传输系统的设计与实现》文中认为网络技术和视频编码技术的发展,使得近几年各种面向网络应用的视频服务得到不断的发展。视频编码技术的目标也由单纯的追求较高的压缩效率转向了使视频流能够更好地适应终端设备多样性以及IP网络的动态性和异构性。目前公认的解决这一问题的最好方法就是由ITU-T和ISO/IEC联合制定的H.264可分级视频编码扩展(Scalable Video Coding, SVC)。在H.264/SVC标准中提供了时域可分级,空域可分级和质量可分级三种可分级特性。视频的可分级特性在许多应用场合都可以得到应用,例如在IPTV应用中针对不同分辨率的终端设备和针对不同的网络带宽情况可以使用可分级视频编码以便有效的利用带宽资源。首先,针对SVC编码器编码速度过低的缺点,在研究并行算法理论基础上对SVC编码器进行并行算法优化。分别从OpenMP多线程优化和SSE2多媒体指令优化两个方面进行了研究。测试结果显示在4核机器上OpenMP多线程优化算法对SVC编码器的加速比可以非常接近其理论最大值即4倍。SSE2多媒体指令优化可以在OpenMP多线程优化算法的基础上继续将SVC编码器的编码速度提高30%左右。其次,研究了SVC的MPEG-2传输流封装格式,并实现了SVC视频与MPEG-1音频第二层的传输流复用与解复用。测试结果证明了传输流复用与解复用方案的正确性和有效性。最后,给出一个基于MPEG-2传输流的SVC网络传输和播放演示系统的实现方案。对整个系统的软硬件设计,系统架构以及系统中各个模块的实现方法和使用到的技术都进行了详细的说明。本系统提供单画面播放和多画面活动视频浏览两种播放模式。从测试结果看,不论是单画面还是多画面播放,都可以达到良好的播放效果。同时本系统还实现了SVC视频码流的实时层切换功能。

吕琛[4](2010)在《基于FPGA的数字音频编解码系统的研究》文中认为近几年来,在网络流媒体、移动设备、数字广播等领域,数字音频信号处理得到了广泛的应用。为了解决数字音频信号存储和传输的瓶颈问题,数据压缩成为当代数字音频处理中的一个十分重要的研究课题。在众多的压缩标准中,MP3 (MPEG-LayerⅢ)压缩格式以其优越的性能以及品质与算法复杂度的极佳折衷,使之成为当前PC、网络、PDA上最为流行的音频格式。如今的MP3技术已经非常成熟,因此现阶段各大商家最为关心的并不是如何实现MP3,而是如何能在低成本低功耗的平台上实现MP3,这就意味着对原始MP3标准在实现过程中的优化是当前的一个热点问题,这也是进行本课题研究的现实意义之所在。在整个MP3编解码流程中,IMDCT(反向改进离散余弦变换)是运算量最大最耗时的部分之一(另一个很耗时的部分是综合滤波器组),因此IMDCT的速度对整个MP3解码进程的速度起着极为关键的作用。在众多的解码过程实现方案中,用专用解码芯片实现是速度最快的一种方案。专用解码芯片FPGA或ASIC,本身都具备并行的处理结构,使得它们特别适用于做高性能的数据通路处理器,如数字滤波、快速傅立叶变换、离散余旋变换等,成为高性能数字信号处理系统中的关键部件。因此本文主要研究MP3编解码的算法原理以及对IMDCT模块的FPGA实现。本文首先介绍了音频压缩算法的发展和主要分类及MPEG音频编码系列标准,重点阐述了MP3音频编解码的标准和流程,以及IMDCT常用的各种实现算法。在此基础上选择了适于硬件实现的递归循环实现方法,并在已有算法的基础上进行了改进,减小了所需硬件资源需求并保持了运算速度。接着提出了模块总体设计方案,结合算法进行了实现结构的优化,并在EDA环境下具体实现,用硬件描述语言设计、综合、仿真,且下载到Alter公司的CycloneⅡ系列FPGA芯片EP2C35F672C8器件中,在减小硬件资源的同时快速地实现了IMDCT,经验证功能正确。

朱政[5](2010)在《信源解码系统设计与多视点视频编码方法研究》文中研究表明近二十年来,数字化的浪潮席卷全球,数字多媒体技术的发展和应用极大地影响和改变着当今世界。在其中,数字电视的迅速推广和普及尤为引人注目。在其取代模拟电视的转型过程中,一个成熟而庞大的产业链正逐步形成,有着巨大的市场空间。与此同时,新型的三维立体视频也已初展魅力,引起了人们的关注和热忱。本文一方面立足于数字电视产业化实践,对信源解码系统中的关键部分包括传输流解复用和视频解码系统进行了研究与设计;另一方面面向未来三维和可交互视频应用,对多视点视频编码预测结构的性能建模与优化提出了一系列创新算法。本文主要工作和研究成果如下:1.提出高性能的双路传输流解复用设计方案和结构。采用面向对象的通道配置方法,以及分拍分时和分段分时机制,支持双路传输流和多路音视频同时解析,最大限度地复用了系统资源。2.提出一种多标准视频解码体系结构。支持的标准包括MPEG-2,MPEG-4, H.264/AVC,AVS以及RealVideo 8/9/10。权衡实时性与灵活性,进行了清晰的软硬件划分和流水线设计。针对视频解码系统中处理速度的瓶颈,对其关键模块包括AVS算术熵解码器和多标准运动补偿子系统进行了优化设计,提出了高速的实现结构。3.以有向树分析为工具,对分层B预测结构的建模分析与性能优化提出了一种全新的视角和方案。并提出一种基于参考间隔的线性模型,用于B图和分层B结构的压缩性能量化评估。该模型复杂度低,在具体应用中可进一步省略参数,具有简单实用的价值。将压缩性能评估模型应用于有向树,提出使用动态规划来构造最优树的方法。最优树可调节压缩性能与随机访问性能的平衡。通过最优压缩树构造的分层B结构配置简单,且与现有结构相比,在各个图像组长度下具有更好压缩性能。4.提出一种多视点视频视点间预测结构的最优化配置方法。首先,将预测结构的配置问题转换为最优编码顺序的安排。而后在模型中引入模拟退火算法实施快速搜索。实验表明模拟退火算法在本问题中能够迅速收敛至全局最优。该方法能够充分发掘视点间相关性,与多视点视频编码参考结构相比,可获得0.1-0.8dB的增益,且适用于任意相机阵列。

丰帆[6](2008)在《MP3数字音频编解码算法的研究及实现》文中指出随着MP3音频编解码算法在网络音乐的广泛应用,各种硬件解码器也相继问世,在各种实现方法中,低速CPU搭配MP3解码硬件模块的SOC设计,以其较高的性价比,成为了本项目的首选方案。论文重点研究了MP3编码的算法标准,详细分析了压缩算法中的子带滤波器组编码、MDCT和混叠消除、生理声学模型、非均匀量化、霍夫曼编码与比特流组帧等主要功能模块。并在此基础上介绍了MP3的解码原理,在解码流程中应用了IMDCT、Filterbank的改进型算法以及子带截除技术,有效的减少了计算量,加快了解码速度。深入研究并且优化了ISO/IEC 11172-3的MP3解码标准后,采用并行技术设计了霍夫曼解码器、比例因子解码器和逆量化器等主要功能模块,其优点就是解码可以在每个时钟周期内进行,不受码长的影响,硬件复杂度的提高换来了解码速度的加快。采用硬件语言VHDL实现了MP3解码各个主要模块的功能,且通过了计算机功能仿真。介绍了FPGA的相关理论,并提出了采用FPGA进行验证的方案。

毛利萍[7](2007)在《MP3音频编解码运算中IMDCT算法研究及其FPGA实现》文中认为近年来,随着多媒体技术的迅猛发展,电子、计算机、通讯和娱乐之间的相互融合、渗透越来越多,而数字音频技术则是应用最为广泛的技术之一。MP3(MPEG-1 Audio LayerⅢ)编解码算法作为数字音频的解决方案,在便携式多媒体产品中得到了广泛流行。在已有的便携式MP3系统实现方案中,低速处理器与专用硬件结合的SOC设计方案结合了硬件实现方式和软件实现方式的优点,具有成本低、升级容易、功能丰富等特点。IMDCT(反向改进离散余弦变换)是编解码算法中一个运算量大调用频率高的运算步骤,因此适于硬件实现,以降低处理器的开销和功耗,来提高整个系统的性能。本文首先阐述了MP3音频编解码标准和流程,以及IMDCT常用的各种实现算法。在此基础上选择了适于硬件实现的递归循环实现方法,并在已有算法的基础上进行了改进,减小了所需硬件资源需求并保持了运算速度。接着提出了模块总体设计方案,结合算法进行了实现结构的优化,并在EDA环境下具体实现,用硬件描述语言设计、综合、仿真,且下载到Xilinx公司的VirtexⅡ系列xc2v1000FPGA器件中,在减小硬件资源的同时快速地实现了IMDCT,经验证功能正确。

盛东晖[8](2006)在《DCT域分级运动补偿算法研究》文中认为视频编码技术是多媒体通信的关键技术之一。各种引人入胜的数字视频应用飞速地改变着人们的生活模式。视频编码技术在为人们提供高质量、高清晰度的视觉享受的同时,大力推动着全球信息化的发展。视频编码目标正经历着从传统的面向存储的编码方式向面向网络传输的编码方式发展。视频通信应用中,最新提出的精细可扩展性编码能够适应网络带宽的波动,容忍传输中的错误,无疑成为其中最具广阔发展前景的一项技术。编码效率问题是视频编码技术中的核心问题。面向网络的精细可扩展性编码方法虽然具有良好的可扩展性,但其编码效率却始终低于非扩展性编码方法。传统的视频编码算法通过各种手段去除视频序列中的冗余信息以获得较高的编码效率。经过DCT离散余弦变换的自然图像具有良好的能量集中特性,故而DCT变换被大多数视频编码标准所采纳。但是在处理运动残差时,DCT变换编码的效率很低。本文所有的工作的思路是通过提高DCT变换对运动残差的编码效率,进而解决精细可扩展编码的效率低的问题,具体内容主要包括:1.在分析DCT变换对于运动残差编码效率低的根本原因的基础上,认为在传统编码方法中,经DCT变换编码后的运动残差中仍然存在大量的冗余信息。在对运动残差的DCT系数的分布特性分析的基础上,提出了DCT域内对残差DCT系数分级运动补偿的方法。该方法将运动残差的所有非零的DCT量化系数分为两类,其中的一类残差DCT系数在编码时不需编码其幅值信息,故而降低了输出码率。另一方面,在使用分级运动补偿方法对该类系数进行置零处理时,等效于进行了量化噪声重整处理,降低了编码过程中引入的噪声能量,故而提高了解码重建的图像质量。分级运动补偿方法正式从降低码率、提高图像质量两方面同时着手,显着地提高了编码效率,解决了DCT变换的效率低的问题。2.论文针对DCT域运动估计方法的运动估计匹配精度问题,提出了一种新的块匹配准则――量化DCT域内均方误差匹配准则。该准则在保留MSE均方误差准则的能量匹配的优点的同时,将量化过程中引入的量化噪声能量作为匹配因素纳入到块匹配计算中。新准则保证在需要编码传输的在解码端重建的残差能量最低,故而所需的码率最低。3.论文针对DCT域运动估计的计算复杂度问题,分析了算法中的瓶颈问题――边界非对齐参考块的DCT系数重建计算。本文结合一种新提出的非均衡块匹配准则,提供了一种快速算法。算法在进行块匹配时,只考虑必须完全编码显元系数的能量,因而只需计算参考块在显元位置的对应DCT系数即可。由于显元系数的数目较少,故而省去了大量的计算。4.论文分析了精细可扩展性编码方法的应用背景和体系结构,指出了当前精细可扩展性编码的软肋――相对与非可扩展性编码方法编码效率低的问题。提出了在基本层嵌入分级运动补偿方法的改进方案。新方案在编码效率上相对与传统FGS精细可扩展编码方法有了大幅的提升。

宋亚玲[9](2006)在《MP3音频编码算法的DSP实现及优化》文中认为本文详细论述了MPEG-1第三层音频编码算法的原理、关键技术和算法流程以及LAME算法的硬件实现和优化,用以实现音频的实时编码。论文的主要内容如下:第一,从原理上阐述了MP3音频编码算法。首先,对MPEG标准做了一个概述;其次,对于算法各个模块的关键技术做了详细介绍;最后对MP3文件的文件格式做了说明。第二,针对具体的音频编码算法LAME,分析了算法的具体流程和组成。首先,对几种常见MP3编码算法做频谱测试和听音测试,根据测试效果确定要选择哪种MP3音频编码算法;其次,根据LAME具体算法的实现研究其程序流程和关键技术;最后,给出LAME的具体组成,实现了其在软件环境Visual C++下的MP3编码。第三,完成LAME在DSP芯片上的硬件移植。首先,介绍所选用的芯片ADSPBF-533的特点和结构框图;其次,介绍芯片的内部结构;最后,介绍算法的硬件运行环境Visual DSP++,完成了程序的硬件移植,并实现了在硬件环境Visual DSP++下的MP3编码。第四,完成算法的初步优化。首先,对算法进行精简,把LAME整合成一个工程之后再进行编码部分的剥离;其次,对算法进行性能测试,根据测试结果确定要优化的具体模块和具体函数;最后,对算法进行优化,比较优化前后的算法性能,通过比较算法的运行速度提高了。

胡智华[10](2006)在《基于DSP的音频编解码系统的设计与算法研究》文中进行了进一步梳理MPEG(活动图像专家小组)是ISO/IEC的一个工作小组,负责制定有关活动图像、音频及其组合的压缩、解压缩处理等方面的技术标准。MPEG-1 Layer3(mp3)是MPEG-1国际音频标准(ISO/ICE 11172)的第三层编、解码算法,它具有压缩比高、声音还原质量好、算法复杂度适中等优点,利用这种标准制作的mp3格式的音乐在数字音频的存储、互联网上的多媒体音视频传输等领域得到了广泛的应用。 基于以上背景,论文通过研究、分析,提出了基于DSP的音频编解码系统的设计与算法研究这一研究课题。本课题的主要目的是:以TI公司的C5000系列通用型DSP芯片—TMS320VC5402为核心,完成系统硬件平台的设计与实现,研究mp3的编、解码算法以及其在该硬件平台上的DSP实现。整个系统的硬件平台包括DSP核心模块、FLASH存储器、音频CODEC、USB通信等模块。该系统通过USB接口同PC机通信,下载mp3格式的数据流,并将其存储在Flash中,然后由DSP读取Flash中的mp3数据流,完成解码工作,并通过CODEC播放。同时可以对DSP进行其它编、解码算法的软件编程,实现多种数据流格式的音频编、解码,具有很强的软件升级的灵活性。 整个课题研究完成的主要工作包括:其一,经过原理图设计、PCB设计、PCB制板到主芯片及其它元器件的焊接等步骤,完成了对mp3解码系统硬件平台的设计与实现,详细介绍了硬件平台中各功能模块接口的硬件调试方法,针对容易出现的问题进行了研究分析,开发了系统的驱动及应用程序;其二,对mp3编、解码算法的基本原理及编、解码的过程进行了详细的分析和研究;重点研究了mp3的解码算法,并对算法中的Huffman解码模块以及IMDCT变换模块进行了改进、优化,通过从PC机模拟实现到DSP芯片编程实现,在TI公司的DSP集成开发环境CCS2.0中进行软、硬件的联合调试,完成了基于DSP的mp3解码算法的设计与实现。

二、MPEG音频第Ⅲ层编码的算法研究与硬件实现(论文开题报告)

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

三、MPEG音频第Ⅲ层编码的算法研究与硬件实现(论文提纲范文)

(1)基于媒体特征分析的自适应音视频水印关键技术研究(论文提纲范文)

摘要
Abstract
常用缩略词表
常用符号表
第1章 绪论
    1.1 研究背景及意义
    1.2 数字水印技术概述
        1.2.1 数字水印系统模型
        1.2.2 数字水印的分类
        1.2.3 数字水印的应用
        1.2.4 数字水印的性能特征
        1.2.5 音视频水印攻击类型
        1.2.6 数字水印性能评价指标
    1.3 国内外研究现状
        1.3.1 音频水印算法研究现状
        1.3.2 视频水印算法研究现状
        1.3.3 存在的问题
    1.4 本文主要研究内容
    1.5 本文结构安排
第2章 基于音频信号自适应分段与嵌入强度优化的双通道音频水印算法
    2.1 引言
    2.2 音频信号自适应分段
    2.3 音频信号双通道特征信息构建
    2.4 水印嵌入方法
    2.5 水印提取方法
    2.6 水印嵌入强度优化
    2.7 实验结果
        2.7.1 水印不可感知性评价
        2.7.2 水印鲁棒性评价
    2.8 本章小结
第3章 基于离散小波包变换的双域音频水印算法
    3.1 引言
    3.2 音频节拍检测与自适应分段
    3.3 音频信号双域划分与水印嵌入位置选择
    3.4 水印嵌入与提取
        3.4.1 水印嵌入规则
        3.4.2 自适应嵌入强度计算
        3.4.3 水印嵌入方法
        3.4.4 水印提取方法
    3.5 实验结果
        3.5.1 水印不可感知性评价
        3.5.2 水印鲁棒性评价
    3.6 本章小结
第4章 针对MPEG-4 SLS格式的无损压缩音频水印算法
    4.1 引言
    4.2 相关技术介绍
    4.3 水印嵌入与提取
        4.3.1 嵌入失真允许阈值
        4.3.2 显着状态与嵌入位置选择
        4.3.3 水印嵌入方法
        4.3.4 水印提取方法
    4.4 实验结果
        4.4.1 水印不可感知性评价
        4.4.2 水印鲁棒性评价
    4.5 本章小结
第5章 基于时-空域特征与视觉密码的视频零水印算法
    5.1 引言
    5.2 有限状态机设计与关键帧选择
        5.2.1 视频镜头分割
        5.2.2 有限状态机运行规则
    5.3 视频时-空域特征信息提取
        5.3.1 Harris-Laplace角点检测
        5.3.2 时域特征数据集构建
        5.3.3 频域特征数据集构建
    5.4 Ownership share的产生与水印提取
        5.4.1 Ownership share的产生
        5.4.2 水印提取方法
    5.5 实验结果
    5.6 本章小结
第6章 基于深度图像渲染的3D视频水印算法
    6.1 引言
    6.2 相关技术简介
        6.2.1 DIBR系统
        6.2.2 SIFT特征点检测
    6.3 水印嵌入位置选择
        6.3.1 视频场景分割
        6.3.2 SIFT特征点跨帧匹配
        6.3.3 匹配向量概率分布
        6.3.4 匹配向量主方向和水印嵌入位置选择
    6.4 水印嵌入与提取方法
        6.4.1 改进的扩频水印嵌入方法
        6.4.2 在中心视图中嵌入水印
        6.4.3 从左右视图中提取水印信息
    6.5 实验结果
        6.5.1 水印不可感知性评价
        6.5.2 水印鲁棒性评价
    6.6 本章小结
第7章 总结与展望
    7.1 本文工作总结
    7.2 研究展望
参考文献
作者在读期间科研成果简介
致谢

(2)基于FPGA的船舶航行记录仪语音压缩系统的设计与实现(论文提纲范文)

摘要
abstract
第1章 绪论
    1.1 课题研究背景及意义
    1.2 船用航行记录仪语音压缩系统发展现状
        1.2.1 国内船载航行数据记录发展状况
        1.2.2 国外船载航行数据记录发展状况
        1.2.3 语音压缩编码算法发展状况与综述
    1.3 本文的研究内容及章节安排
        1.3.1 本文的主要研究内容
        1.3.2 本文的章节安排
第2章 系统需求分析和总体设计
    2.1 核心开发板以及外设模块的选择
        2.1.1 核心开发板的选择
        2.1.2 麦克风放大器
        2.1.3 ADC模块
        2.1.4 传输模块
    2.2 语音压缩算法的选择
    2.3 MPEG-1 layer Ⅱ编码算法流程
        2.3.1 子带滤波器组
        2.3.2 心理声学模型
        2.3.3 比例因子的计算
        2.3.4 比例因子的编码
        2.3.5 比例因子选择信息的编码
        2.3.6 比特分配
        2.3.7 自带样本的量化和编码
        2.3.8 组帧
    2.4 本章小结
第3章 语音信号的采集和编码的FPGA实现
    3.1 语音信号采集放大和量化传输的FPGA实现
    3.2 layer Ⅱ编码算法FPGA实现
        3.2.1 子带滤波器组的设计
        3.2.2 对数函数的Verilog实现
        3.2.3 最终编码实现展示
    3.3 本章小结
第4章 编码后数据的传输与存储
    4.1 数据传输功能的实现
        4.1.1 CH372模块工作原理
        4.1.2 CH372模块通讯的FPGA实现
    4.2 多路数据传输时的处理方案
    4.3 主机端的存储与回放
    4.4 本章小结
第5章 总结与展望
    5.1 总结
    5.2 展望
参考文献
致谢
作者简介

(3)可分级视频编码传输系统的设计与实现(论文提纲范文)

摘要
ABSTRACT
第一章 绪论
    1.1 视频编码技术的发展
    1.2 本文研究背景及意义
    1.3 本文研究内容
第二章 SVC 视频编码标准
    2.1 SVC 概述
    2.2 SVC 主要技术
        2.2.1 时间可分级(Temporal Scalability)
        2.2.2 空域可分级(Spatial Scalability)
        2.2.3 质量可分级(Quality Scalability)
    2.3 SVC 码流结构
    2.4 本章小结
第三章 SVC 编码器并行算法的研究与实现
    3.1 并行算法基础
        3.1.1 并行计算机系统分类方法
        3.1.2 衡量并行算法性能的标准
    3.2 SVC 视频编码多线程并行算法
        3.2.1 多线程编程简介
        3.2.2 OpenMP 多线程编程
        3.2.3 SVC 视频编码多线程并行算法实现
        3.2.4 测试结果与分析
    3.3 SVC 视频编码SIMD 并行算法
        3.3.1 Intel SIMD 技术介绍
        3.3.2 利用SSE2 对SAD 计算模块的优化
        3.3.3 测试结果与分析
    3.4 本章小结
第四章 SVC 的MEPG-2 传输流封装的研究与应用
    4.1 MPEG-2 传输流基础
        4.1.1 传输流
        4.1.2 PES
        4.1.3 PCR
        4.1.4 PSI
    4.2 SVC 的MPEG-2 传输流封装格式
    4.3 SVC 音视频传输流复用与解复用的实现
        4.3.1 传输流复用
        4.3.1.1 产生PSI 表
        4.3.1.2 音频同步
        4.3.1.3 视频同步
        4.3.1.4 音视频同步
        4.3.2 传输流解复用
    4.4 测试结果及分析
    4.5 本章小结
第五章 SVC 网络传输与播放演示系统设计与实现
    5.1 系统概述
    5.2 软硬件设计及系统架构
        5.2.1 软件平台
        5.2.2 硬件平台
        5.2.3 系统架构
    5.3 系统使用的软件包
    5.4 媒体服务器
        5.4.1 媒体服务器概述
        5.4.2 管理模块
        5.4.3 抽取决策模块
        5.4.4 发送模块
    5.5 客户端播放器
        5.5.1 客户端播放器概述
        5.5.2 传输流接收和控制模块
        5.5.3 视频解码模块
        5.5.4 视频回放模块
        5.5.5 音频解码模块
        5.5.6 音频回放模块
        5.5.7 音视频同步管理模块
    5.6 其他关键技术
        5.6.1 缓冲区技术
        5.6.2 去隔行技术
        5.6.3 多画面活动视频预览技术
    5.7 系统测试和结果
    5.8 本章小结
        5.8.1 系统优点
        5.8.2 系统不足和改进
第六章 总结和展望
致谢
参考文献
攻硕期间取得的研究成果

(4)基于FPGA的数字音频编解码系统的研究(论文提纲范文)

摘要
ABSTRACT
第1章 绪论
    1.1 课题背景
    1.2 课题研究的目的和意义
    1.3 论文结构及内容安排
第2章 音频压缩算法概述
    2.1 音频压缩算法的原理和主要分类
    2.2 MPEG音频编解码标准介绍
        2.2.1 MPEG-1标准
        2.2.2 MPEG-2标准
        2.2.3 MPEG-4标准
        2.2.4 MPEG-7标准
        2.2.5 MPEG-21标准
第3章 MP3的编解码技术
    3.1 MP3的编码算法
        3.1.1 分析滤波器组
        3.1.2 心理声学模型
        3.1.3 MDCT
        3.1.4 非线性量化
        3.1.5 Huffman编码
        3.1.6 码流的格式
    3.2 MP3的解码算法
        3.2.1 MP3的码流结构
        3.2.2 MP3解码流程
第4章 IMDCT算法的研究
    4.1 IMDCT常用的快速算法
        4.1.1 基于FFT的快速算法
        4.1.2 基于DCT/DST的快速算法
    4.2 递归循环实现的方法
        4.2.1 正弦公式的实现方法
        4.2.2 Clenshaw公式的实现方法
    4.3 改进的递归实现算法
        4.3.1 改进的算法推导
第5章 IMDCT算法的FPGA实现
    5.1 FPGA设计流程
    5.2 IMDCT的FPGA设计
        5.2.1 总体设计
        5.2.2 CCU模块
        5.2.3 multi模块
        5.2.4 addsub模块
        5.2.5 rom模块
    5.3 结果分析
        5.3.1 综合结果
        5.3.2 实时性能分析
        5.3.3 系统测试
第6章 总结
参考文献
攻读学位期间发表的学术论文
致谢

(5)信源解码系统设计与多视点视频编码方法研究(论文提纲范文)

摘要
Abstract
目录
图目录
表目录
第1章 绪论
    1.1 数字电视系统概述
        1.1.1 数字电视的概念和优势
        1.1.2 数字电视系统的组成
        1.1.3 数字电视标准
        1.1.4 数字电视的复用系统
    1.2 视频压缩编码标准简介
        1.2.1 视频混合编码框架
        1.2.2 H.261和H.263
        1.2.3 MPEG-1/2/4
        1.2.4 H.264/AVC
        1.2.5 AVS
    1.3 多视点视频编码简介
        1.3.1 MVC的背景及应用
        1.3.2 MVC编码技术及标准
        1.3.3 MVC的性能指标
    1.4 论文的主要工作和结构安排
        1.4.1 工作和贡献
        1.4.2 论文结构
第2章 数字电视信源解码SoC系统介绍
    2.1 信源解码SoC系统概述
    2.2 设计流程
    2.3 软硬件划分
    2.4 CPU和总线结构
    2.5 数据流
    2.6 存储系统
        2.6.1 容量需求
        2.6.2 带宽需求
        2.6.3 控制器和仲裁策略
    2.7 本章小结
第3章 数字电视解复用系统的设计
    3.1 MPEG-2系统层分析
        3.1.1 从基本流到传输流
        3.1.2 节目专用信息
        3.1.3 多路复用及解复用
    3.2 传统的解复用系统设计
        3.2.1 研究现状
        3.2.2 单路解复用系统设计
    3.3 双路解复用系统设计
        3.3.1 方案分析
        3.3.2 面向对象的通道配置
        3.3.3 分拍分时机制
        3.3.4 分段分时机制
    3.4 实现结果
    3.5 本章小结
第4章 多标准视频解码系统的设计
    4.1 视频解码系统概述
    4.2 多标准视频解码系统结构
        4.2.1 现有方案
        4.2.2 系统分析和软硬件划分
        4.2.3 流水线设计
        4.2.4 帧存结构设计
    4.3 AVS CBAC解码器设计
        4.3.1 算法简介
        4.3.2 方案分析
        4.3.3 结构设计
        4.3.4 实现结果
    4.4 运动补偿子系统设计
        4.4.1 MV计算模块设计
        4.4.2 参考数据搬运模块设计
        4.4.3 插值模块设计
    4.5 本章小结
第5章 分层B预测结构的性能建模与优化
    5.1 分层B预测结构介绍
    5.2 压缩性能评估模型
        5.2.1 B图的评估
        5.2.2 分层B预测结构的评估
    5.3 有向树分析
        5.3.1 有向树分解
        5.3.2 压缩性能评估
        5.3.3 随机访问性能评估
    5.4 最优树构造
        5.4.1 最优平衡树
        5.4.2 最优压缩树
        5.4.3 最优压缩分层B E置方法
    5.5 实验结果
    5.6 本章小结
第6章 MVC视点间预测结构最优化设计
    6.1 MVC预测结构研究现状
    6.2 最优结构设计方案
        6.2.1 正交结构
        6.2.2 问题转换
    6.3 模拟退火算法应用
        6.3.1 模拟退火算法简介
        6.3.2 模拟退火算法实施
        6.3.3 代价查询
    6.4 实验结果
    6.5 本章小结
第7章 总结和展望
参考文献
攻读博士学位期间主要的研究成果
攻读博士学位期间参加的科研工作
致谢

(6)MP3数字音频编解码算法的研究及实现(论文提纲范文)

摘要
Abstract
第一章 绪论
    1.1 常用音频压缩标准
    1.2 MP3 发展现状
    1.3 MP3 播放器介绍
    1.4 论文研究的背景
    1.5 论文研究的目的和意义
    1.6 本文主要的研究内容
第二章 音频编解码技术综述
    2.1 音频压缩技术
        2.1.1 声音与听觉
        2.1.2 声音信号的数字化
        2.1.3 音频压缩的声学原理
        2.1.4 音频压缩算法
    2.2 MPEG 系列压缩标准的发展
        2.2.1 MPEG-1 标准
        2.2.2 MPEG-2 标准
        2.2.3 MPEG-4 标准
        2.2.4 MPEG-7 标准
        2.2.5 MPEG-21 标准
    2.3 MP3 音频
        2.3.1 MP3 的由来
        2.3.2 MP3 的特点
        2.3.3 MP3 的实现基础
        2.3.4 MP3 的局限性
    2.4 本章小结
第三章 MPEG-1 AUDIO LAYER 3 编解码技术
    3.1 MPEG-1 AUDIO LAYER 3 编码算法
        3.1.1 分析子带滤波器组
        3.1.2 MDCT 和混叠消除
        3.1.3 心理声学模型
        3.1.4 非均匀量化
        3.1.5 Huffman 编码
        3.1.6 比特流组帧
    3.2 MPEG-1 AUDIO LAYER 3 解码算法
        3.2.1 比特流解码
        3.2.2 逆量化
        3.2.3 立体声处理
        3.2.4 频域到时域的映射
        3.2.5 IMDCT 和Filterbank 的改进型算法
        3.2.6 基于子带截除的MP3 解码优化技术
第四章 MP3 解码器的硬件设计
    4.1 MP3 解码器的整体设计
    4.2 比例因子解码器的设计
    4.3 霍夫曼解码器的设计
        4.3.1 霍夫曼编码算法和常见解码器设计架构
        4.3.2 MP3 解码器中霍夫曼解码器的设计
    4.4 逆量化模块的设计
    4.5 部分模块的仿真结果
    4.6 FPGA 实现方案
第五章 工作总结和展望
    5.1 本文工作总结
    5.2 课题展望
致谢
参考文献
研究成果
附录A
附录B

(7)MP3音频编解码运算中IMDCT算法研究及其FPGA实现(论文提纲范文)

摘要
Abstract
第一章 绪论
    1.1 引言
    1.2 音频压缩算法的分类
    1.3 MPEG音频编解码标准介绍
    1.4 论文研究的目的和意义
    1.5 本文主要的研究内容
第二章 MP3的编码算法
    2.1 概述
    2.2 心理声学
    2.3 分析多相滤波器组
    2.4 MDCT
    2.5 非线性量化
    2.6 哈夫曼编码
    2.7 码流的格式
第三章 MP3的解码算法
    3.1 码流的解析
    3.2 解码流程
第四章 IMDCT算法的研究
    4.1 IMDCT常用的快速算法
    4.2 递归循环实现的方法
    4.3 改进的递归算法
第五章 IMDCT的FPGA实现
    5.1 FPGA设计流程
    5.2 IMDCT的设计
    5.3 结果分析
第六章 总结
参考文献
后记

(8)DCT域分级运动补偿算法研究(论文提纲范文)

摘要
ABSTRACT
1 绪论
    1.1 引言
    1.2 视频编码标准与发展现状
    1.3 视频编码技术的发展方向
    1.4 视频编码关键技术的研究现状分析
    1.5 本文组织结构和主要创新点
2 DCT 域分级运动补偿算法研究
    2.1 引言
    2.2 DCT 变换对运动残差的编码效率分析
    2.3 运动残差DCT 系数显元分类方法
    2.4 DCT 运动残差系数量化误差分析
    2.5 DCT 域分级运动补偿算法
    2.6 实验仿真结果分析
    2.7 本章小结
3 量化DCT 域内均方误差匹配准则
    3.1 引言
    3.2 量化DCT 域内的均方误差匹配准则(QMSE)
    3.3 基于QMSE 准则的DCT 域内的运动估计算法
    3.4 实验仿真结果分析
    3.5 本章小结
4 基于非均衡准则的快速运动估计算法研究
    4.1 引言
    4.2 当前的DCT 域运动估计算法
    4.3 边界非对齐块的DCT 系数重建计算
    4.4 基于部分系数非均衡匹配准则的快速运动估计算法
    4.5 实验仿真结果分析
    4.6 本章小结
5 基于分级补偿的精细可扩展视频编码方法
    5.1 引言
    5.2 可扩展性编码的应用背景
    5.3 FGS 精细可扩展性视频编码方法
    5.4 分级运动补偿方法
    5.5 基于分级运动补偿FGS 编码方法
    5.6 实验仿真结果分析
    5.7 本章小结
6 总结与展望
    6.1 全文总结
    6.2 展望
致谢
参考文献
附录A 攻读博士学位期间发表论文目录
附录B 切比雪夫不等式
附录C MPEG-4 VM18 中FGS 编码相关数据表
附录D 主持及参与的项目目录

(9)MP3音频编码算法的DSP实现及优化(论文提纲范文)

摘要
Abstract
目录
第1章 绪论
    1.1 课题背景
    1.2 课题的研究现状综述
    1.3 课题来源和意义
        1.3.1 课题来源
        1.3.2 课题意义
    1.4 本文的主要研究内容
第2章 MP3 音频编码原理
    2.1 MPEG 音频编码算法标准概述
        2.1.1 MPEG 编码器的基本结构
        2.1.2 MPEG 音频压缩标准定义的3 个层次
    2.2 子带滤波器组
        2.2.1 滤波器组的基本原理
        2.2.2 分析滤波器组的运算流程
        2.2.3 子带编码的优点
    2.3 修正离散余弦变换(MDCT)
        2.3.1 MDCT 的定义
        2.3.2 MP3 编码中的MDCT 算法
    2.4 心理声学模型
        2.4.1 心理声学模型基本概念
        2.4.2 心理声学模型的标准算法流程
    2.5 量化与编码
    2.6 MPEG 音频第3 层数据流格式
        2.6.1 帧头格式
        2.6.2 ID3 标准
        2.6.3 文件实例
    2.7 本章小结
第3章 LAME 编码算法的流程和关键技术
    3.1 音频编码算法选择
        3.1.1 时频谱测试
        3.1.2 听音测试
    3.2 LAME 算法的流程和关键技术
    3.3 LAME 算法的具体组成
        3.3.1 算法的组成
        3.3.2 算法在VC++环境下的实现
    3.4 本章小结
第4章 算法的DSP 硬件实现
    4.1 BLACKFIN ADSP-BF533 的特点和结构框图
        4.1.1 Blackfin 533 的特点
        4.1.2 Blackfin 533 的结构框图
    4.2 BLACKFIN ADSP-BF533 的内部结构
        4.2.1 Blackfin 533 DSP 内核结构
        4.2.2 存储器
        4.2.3 片内总线
        4.2.4 程序控制器
        4.2.5 中断
    4.3 LAME 在BF533 上的硬件实现
        4.3.1 Visual DSP++
        4.3.2 算法在BF533 上的硬件实现
    4.4 本章小结
第5章 LAME 编码算法的优化
    5.1 LAME 算法的精简
        5.1.1 算法的工程整合
        5.1.2 去除算法的解码部分
    5.2 LAME 算法的性能测试
    5.3 LAME 算法的优化
        5.3.1 子带滤波的快速算法
        5.3.2 MDCT 模块的优化
        5.3.3 心理声学模型模块的优化
    5.4 本章小结
结论
参考文献
攻读硕士学位期间发表的学术论文
致谢

(10)基于DSP的音频编解码系统的设计与算法研究(论文提纲范文)

第1章 绪论
    1.1 课题概述
        1.1.1 课题研究的背景
        1.1.2 课题研究的目的及意义
    1.2 音频压缩技术的发展和现状
        1.2.1 音频压缩算法的分类及典型代表
        1.2.2 MPEG音频压缩技术的发展、现状及算法标准
    1.3 本课题研究的内容及工作安排
第2章 音频压缩的基本原理
    2.1 引言
    2.2 心理声学模型
    2.3 感知编码原理
    2.4 数据压缩编码
        2.4.1 子带编码
        2.4.2 变换编码
        2.4.3 Huffman编码
    2.5 本章小结
第3章 MPEG-1 LayerⅢ音频编解码算法
    3.1 MPEG-1 LayerⅢ音频编码算法
        3.1.1 算法描述
        3.1.2 时频变换
        3.1.3 心理声学模型
        3.1.4 量化与编码
    3.2 MPEG-1 LayerⅢ音频解码算法
        3.2.1 算法描述
        3.2.2 MPEG-1 LayerⅢ数据流格式
        3.2.3 解码算法详述
    3.3 本章小结
第4章 基于DSP平台的系统硬件设计与实现
    4.1 硬件平台的解决方案
    4.2 硬件平台的总体框图
    4.3 硬件平台的具体实现
        4.3.1 DSP芯片介绍
        4.3.2 与PC机的接口设计
        4.3.3 Flash存储器接口设计
        4.3.4 音频Codec接口设计
    4.4 硬件平台的调试
        4.4.1 常规检查
        4.4.2 Flash存储器接口调试
        4.4.3 音频Code接口调试
    4.5 本章小结
第5章 Mp3解码算法在DSP上的设计与实现
    5.1 集成开发环境CCS2.0介绍
    5.2 Mp3解码算法的DSP实现
        5.2.1 霍夫曼解码及反量化采样
        5.2.2 立体声处理
        5.2.3 反离散余弦变换IMDCT
        5.2.4 子带合成
    5.3 优化算法的实现结果
    5.4 本章小结
第6章 成果与展望
    6.1 取得的成果与不足
    6.2 进一步工作展望
附图A 硬件平台实物图
参考文献
作者在攻读硕士学位期间发表的学术论文
致谢

四、MPEG音频第Ⅲ层编码的算法研究与硬件实现(论文参考文献)

  • [1]基于媒体特征分析的自适应音视频水印关键技术研究[D]. 罗一帆. 四川大学, 2021(01)
  • [2]基于FPGA的船舶航行记录仪语音压缩系统的设计与实现[D]. 李扬. 大连海事大学, 2017(07)
  • [3]可分级视频编码传输系统的设计与实现[D]. 向科燏. 电子科技大学, 2011(12)
  • [4]基于FPGA的数字音频编解码系统的研究[D]. 吕琛. 安徽工程大学, 2010(04)
  • [5]信源解码系统设计与多视点视频编码方法研究[D]. 朱政. 浙江大学, 2010(12)
  • [6]MP3数字音频编解码算法的研究及实现[D]. 丰帆. 西安电子科技大学, 2008(01)
  • [7]MP3音频编解码运算中IMDCT算法研究及其FPGA实现[D]. 毛利萍. 华东师范大学, 2007(02)
  • [8]DCT域分级运动补偿算法研究[D]. 盛东晖. 华中科技大学, 2006(03)
  • [9]MP3音频编码算法的DSP实现及优化[D]. 宋亚玲. 北京工业大学, 2006(12)
  • [10]基于DSP的音频编解码系统的设计与算法研究[D]. 胡智华. 武汉理工大学, 2006(08)

标签:;  ;  ;  ;  ;  

MPEG音频第三层编码的算法研究与硬件实现
下载Doc文档

猜你喜欢