一、一种适于压缩细节丰富图像的编码算法(论文文献综述)
蒋琦[1](2021)在《红外与弱可见光图像增强方法的研究》文中认为红外与弱可见光图像融合是一种增强技术,其主要的作用是将两类由不同传感器捕获的同一场景下的图像信息进行融合,从而获得一幅拥有更为丰富场景内容的图像。由于弱可见光图像和红外图像各自不同的成像特性具有明显差异反而使得它们具有良好的互补特性。可见光图像拥有更多的细节纹理信息,但却受到光照、环境、遮蔽物等因素的制约;红外图像通过热辐射成像,虽不具备清晰的细节纹理,但却具有显着的热辐射目标信息且不受光照条件等因素的影响。因此将两者融合,能使得融合后的图像拥有更多显着的目标信息和清晰的背景细节。针对传统融合算法中存在的对比度低、细节信息丢失、可视性差等问题,本文提出两种红外与弱可见光图像融合方法。论文的主要研究内容及创新如下:(1)针对弱可见光图像在光照条件不佳的环境下所存在的对比度低与可视性差的问题,为了提高低照度下的红外与弱可见光图像融合的效果,本文提出一种基于潜在低秩表示与复合滤波的红外与弱可见光增强图像融合方法。利用改进的高动态范围压缩增强方法增强可见光图像提高亮度;然后利用基于潜在低秩表示与复合滤波的分解方法分解增强后的弱可见光和红外图像,得到各自对应的低频和高频分量;再分别使用改进的对比度增强视觉显着图融合方法与改进的加权最小二乘优化融合方法对得到的各个分量进行融合得到最终的融合图像。经实验结果表明,该方法得到的融合图像细节信息更加显着,具有良好的可视性。(2)为了将红外图像的夜间能见度信息与弱可见光图像的纹理细节和环境信息进行融合以生成信息丰富的融合图像,并且能较好的保持来自不同传感器的两类特征信息,防止信息的过度丢失,本文提出了一种新型的深度学习的神经网络模型,以端到端的模式用于红外与弱可见光图像融合。首先,为解决红外与弱可见光数据集的局限性,对现有的一些数据进行整理、校准、切片,构建出数量足够且有效的数据集;之后,以U-net模型为基础设计出一种编解码融合模型,红外与弱可见光图像将通过各自的编码块进行特征提取,然后,各层级的特征相互融合且逐步卷积;最后,使用改进的混合损失函数控制网络参数的学习,并通过解码器对初步融合后的特征图像再通过进一步的卷积并还原到最初的尺度。经实验结果表明,该模型在提取并保留不同传感器源图像特征信息方面有较强的能力,并且融合后的图像具有可见光图像的细节背景信息,并且突出了红外图像的夜间能见度信息。
杨昆[2](2021)在《基于学习的视频纹理分析和合成编码》文中研究表明随着电子技术的日益进步,高品质多媒体设备逐渐进入到人们的日常生活,高清和超高清数字视频内容也逐步得到普及,但是,海量的视频数据也随之出现,这给视频数据的存储和网络传输带来了巨大的压力。目前,高性能视频编码(High Efficiency Video Coding,HEVC)是采用最为广泛的新一代视频编码标准,该标准采纳了大量的新技术,相比于上一代视频编码标准(H.264/AVC),它能够在相同主观质量的情况下节省大约一半的码率。即便如此,现有技术的视频压缩率和视频压缩需求之间仍然存在着巨大的鸿沟。因此,如何设计更加高效的视频压缩方法是目前视频编码领域面临的严峻挑战。传统的视频编码方案通常采用基于预测/变换的混合编码框架,利用灵活的块划分技术将输入图像/视频划分为树形结构单元,并基于信号在该单元内是平稳信号的假设,以牺牲复杂度为代价从多种编码模式中选择最优模式对其进行压缩编码。数十年来,该编码方案一直是基于香农信息论,从信号处理的角度,不断对标准中的技术进行微调。然而,自然视频内容的统计特性十分复杂,它往往在纹理、边沿等内容处展现出非平稳的信号特性,传统编码方法无法高效地对其进行压缩,因此,该部分内容在编码中往往需要耗费大量的比特数。但是,另一方面,人眼通常对该部分内容并不敏感,其内容即使存在细微的差异也不会被察觉;与此同时,深度学习技术在众多计算机视觉任务中展现出了非常强大的学习能力,并且也在视频编码领域取得了巨大的成功。因此,本工作主要的研究内容是如何利用深度学习技术并结合传统的经典视频编码技术来进一步提高视频纹理内容的压缩效率。论文的主要工作和创新如下:(1)本文针对静态纹理内容提出了一种基于深度学习非线性变换的编码方案。首先,本文设计了一个基于深度学习的非线性变换神经网络模型,并将其成功集成到现有的帧内编码框架之中;其次,本文提出可以利用帧内预测信息去除帧内预测残差中的方向性信息,以此提高变换的性能;再次,本文提出利用变换增益作为神经网络的损失函数以及针对变换系数的TopK训练方法,提高变换系数的能量压缩效果,进而降低编码变换系数所需的比特数。实验结果表明,本文提出的基于深度学习的非线性变换方案相比传统方法可以明显提升视频中纹理内容区域的编码性能。(2)本文针对视频中的动态纹理内容提出了一种动态纹理检测方案。首先,本文提出了一种基于运动方向直方图的动态纹理检测算法,该方法简便快捷并已经成功集成到视频编码框架中;其次,本文基于动态纹理内容之间的时空相关性,提出了一种对动态纹理检测结果的优化方案,以此提高动态纹理检测结果的准确度。实验结果表明,本文提出的动态纹理检测方案能够在满足编码需求的情况下快速准确地检测出自然视频中的动态纹理内容。(3)本文针对视频中的动态纹理内容编码提出了一种基于动态纹理检测合成的视频编码方案。首先,本文设计了一种利用时空域信息来进行动态纹理合成的生成对抗网络模型,提出了利用空域判别网络和时域判别网络增强合成结果的空域真实性和时域连贯性的方法;其次,本文提出一种结合动态纹理检测以及动态纹理合成的视频编码方案,并将该编码方案成功集成到帧间编码模块中,大大提升了纹理内容视频的编码效率;最后,本文采集并构建了动态纹理视频训练(验证)数据集用于神经网络的训练,并建立了动态纹理编码测试序列视频数据集用于动态纹理内容编码的研究。实验结果表明,本文提出的基于动态纹理检测和合成的视频编码方案能够显着提升动态纹理视频内容的编码效率。
乔彦[3](2021)在《高动态范围图像隐写技术研究》文中进行了进一步梳理互联网自1969年诞生以来,在各个领域都有不可忽视的建树,同时也给信息安全领域带来了极大的挑战。信息隐藏技术是针对信息安全问题发展起来的,利用不同形式的传播载体实现秘密信息的传递,其中一个分支就是隐写。以图像为载体的隐写技术,从修改操作的作用域进行划分,有空域和变换域两种,并逐渐从无差别对待所有像素点的非自适应隐写发展到关注图像内容并结合编码的自适应隐写,随着深度学习领域的日益火爆和计算机算力的提升,利用深度学习网络模型进行训练直接生成隐写图像以及利用对抗思想进行隐写分析也成为当今图像隐写技术很有前景的发展方向。但现有研究大部分都将LDR图像作为隐写载体,在隐写安全性和隐写容量的权衡上还有一定的局限。高动态范围图像与传统图像相比,其浮点数数据类型的特性能够提供极大的动态范围,从而将自然场景中的色彩、亮度等各种细节真实地展现出来,因此在数字图像领域受到越发广泛的关注。同时,浮点数数据类型也使得HDR图像的冗余空间更大,这也为图像隐写技术提供了新的思路。本文对HDR图像的不同存储格式进行细致研究,以传统图像隐写术和基于深度学习的图像隐写术为理论基础,提出了两种不同的以HDR图像作为载体图像的隐写算法:1)基于RGBE格式的HDR图像隐写算法结合自适应隐写算法思想,将图像分为平坦区域和边缘区域,根据HDR图像像素点的指数值确定像素修改幅度从而对其进行修改,实现秘密信息的嵌入。经验证,本算法生成的隐写图像的可感知概率很低,能够达到SCOA安全等级,与现有的基于HDR图像的隐写算法相比,生成的隐写图像质量更好。2)基于卷积网络的HDR图像隐写算法利用Open EXR格式提取HDR图像小数空域的后八位比特作为隐写载体,设计了以Residual Block为基础模块的隐藏网络和提取网络,并将余弦相似性函数加入损失函数中,衡量图像对之间的颜色失真,最终实现将一张LDR图像隐藏到相同尺寸的HDR图像中。从主观视觉和客观指标两个方面对生成的图像进行质量评估,均取得了不错的效果。除此,实验证明所提算法能够抵抗隐写分析工具的攻击,安全性较高。
杨楚皙[4](2020)在《小波变换域基于图像数据集的图像编码算法研究》文中提出随着手机、数码相机等图像拍摄终端的广泛普及,以及通信技术、图像处理技术的迅猛发展,现有的图像数据量呈指数级增长。大量增长的图像给数据存储和传输带来了巨大压力,但与此同时,随着存储图像数量的增加,新增图像与已存储图像之间很有可能存在一定的相关性,因此,利用已存储的图像数据集辅助完成图像编码,能够进一步提升压缩效率。为了在图像编码过程中充分对已存储的图像数据集加以利用,探究数据集为图像编码带来的性能助益,本文以小波变域基于特征的图像编码算法为出发点,提出了三种基于图像数据集的图像编码算法。本文的主要贡献和创新性工作包括如下三个方面:1.提出了小波变换域基于特征的图像编码算法,以图像特征作为桥梁,利用解码端已存储的相似图像辅助完成高频重构。在编码过程中,通过小波变换将输入图像分解为低频子带和高频子带,并分别进行处理:对低频子带进行高保真的图像压缩,以保留输入图像的全局特征;对高频子带进行局部特征提取,将高频子带由像素描述转换为特征描述,并将得到的特征描述子进行编码和传输。在编码特征描述子时,提出算法通过矢量量化的方式从大规模特征数据集中训练获得特征码书,并利用特征码书将高维特征描述子映射为一维的码矢索引,从而提高描述子的压缩效率。在解码过程中,将解码端已有的图像数据存储看作已知的图像数据集,首先利用解码后的低频子带图像在数据集中进行相似图像检索,然后根据特征码书对输入图像的高频特征进行解码,并与数据集中的相似图像进行高频特征匹配,获得相似高频图像块的对应关系;最后利用匹配特征的位置对应关系对相似图像块进行几何校正,并将校正后的图像块用于对应位置的高频局部重构。当高频特征区域逐一完成重构后,再联合解码后的低频子带进行小波逆变换,输出最终的重构图像,实现低码率下的高效重构。实验结果表明,在相同压缩比下,提出算法与JPEG相比,可实现4.55dB的PSNR提升及0.08的SSIM提升;与JPEG2000相比,可实现0.18dB的PSNR提升及0.001的SSIM提升,且主观重构质量更好。2.提出了小波变换域基于数据集预测的图像编码算法,从图像间预测的思想出发,利用编解码端的共享图像数据集对图像进行预测编码。在编码端,将输入图像的低频子带作为索引图像,在图像数据集中进行相似图像检索,并将检索到的高相关图像作为参考图像,以图像块为单位对输入图像的高频子带进行图像间预测。在图像对齐阶段,提出基于尺度不变特征变换(SIFT)流金字塔的图像对齐方法,逐层根据特征匹配关系进行稠密的特征对齐,以实现更精准的图像对齐;在图像块预测阶段,通过设置相似度阈值,使系统自适应的判断各图像块预测结果的准确性,从而将预测不准确的图像块作为残差进行编码,以降低不良预测带来的重构失真。在解码端,首先利用解码后的低频子带图像从数据集中检索高相关图像;然后根据高频预测信息,从对齐后的高相关图像中提取对应的高频图像块,同时将残差进行解码,与高频预测图块共同组成高频重构子带;最后,将解码后的低频子带与高频重构子带进行小波逆变换,获得最终的重构图像。该算法利用数据集预测的方式去除图像间的数据冗余,有效提升了高频子带的压缩效率;另外,得益于自适应的残差选择策略,即使当数据集中不存在高相关图像时,提出算法仍然能够实现较高质量的图像重构。实验结果表明,对测试图像进行编码,提出算法在低码率下表现出优越的率失真性能。在相同压缩比下,提出算法与JPEG相比最大可实现7dB的PSNR提升;与JPEG2000相比最大可实现1.69dB的PSNR提升,与HEVC相比最大可实现0.03的MS-SSIM提升。3.提出了小波变换域基于高频子带预测的深度图像编码算法,使用深度学习的方法,将大规模图像数据集作为训练集,训练基于深度卷积自动编码器的图像编码模型。输入图像经小波变换之后,通过四个平行支路对不同的子带进行编解码,子带的编解码器均是由多个卷积层构成的。在编码器端,通过不同步长的卷积操作对各个子带进行多尺度的特征提取,并输出每个子带在码字空间的特征表示;在解码器端,通过不同步长的转置卷积将码字空间的特征还原回子带数据。为了在编码之前去除子带间的冗余,提出并设计高频预测网络,从低频子带中获取高频子带的预测,从而只需对高频残差进行编码。除此之外,为了进一步提高编码效率,使用基于条件概率的熵编码模型对码字进行先验概率估计,从而获得编码后的码率估计,并结合图像重构失真进行率失真的联合训练。实验结果表明,提出算法不仅在率失真表现上超越传统图像编码算法及经典的深度图像编码算法,并且在重构图像的主观对比中也表现出明显的优势;与最近提出的深度图像编码算法相比,提出算法可在高频重构中实现0.0048的MS-SSIM提升;另外,采用本文提出的高频预测模型较不采用预测模型可带来平均0.0019的MS-SSIM提升,且预测模型的加入还能够有效消除重构图像中的锯齿边缘,使得高频重构质量更好。
王学军[5](2020)在《鲁棒的稀疏表示方法研究》文中认为随着全球数据量爆炸式的增长,如何能够快速高效地对数据进行处理和分析变得尤为重要。在这样的背景下,压缩感知理论一经提出,便引起了学术界和工业界的广泛关注,而其中稀疏表示模型是压缩感知取得成功必不可少的先决条件。稀疏表示模型在给定的过完备字典(构成数据空间的基元素个数比维数大)中用尽可能少的原子来表示数据,由于其对数据简洁高效的表示方式大大降低了对于内存等硬件的要求,因此被广泛应用于图像处理(如图像编码、超分辨率重构、图像修复)、音频处理(如盲源分离、音频增强、音频压缩)、模式识别(如人脸识别、手势识别、表情识别)等领域。尽管如此,稀疏表示方法仍不能完全满足实际应用的需求,究其原因主要有两点:一是大规模问题的适用性不高,比如超大矩阵线性方程组的求解;另一个是模型的鲁棒性不高,即对不同特性数据的处理能力不足,如噪声数据。前者可以通过增加计算资源来解决,而如何提升模型的鲁棒性目前仍存在较大的困难,其原因主要在于现有稀疏表示方法存在以下几个问题:重构数据时选择样本的不稳定性,使用?1范数过于强调稀疏的局限性,对于训练样本数量和质量的过高要求,对非线性结构数据表示能力的缺乏以及对数据特征信息的利用不足等。基于这些问题,本文从稀疏重构算法和字典表示方法两方面入手,系统开展稀疏表示分类模型的鲁棒性研究,提出4种增强模型鲁棒性的方法,本文的主要研究工作总结如下:(1)提出一种基于自步学习的加权稀疏表示方法。该方法从表示字典中有效剔除与待测样本相差较大的训练样本,并利用加权手段考虑样本间的局部信息,使稀疏表示成为一种循序渐进的过程,从而有效避免利用相差较大的训练样本表示待测样本,提高分类精度和稳定性。(2)提出一种基于非凸优化的自适应稀疏稠密混合表示方法。该方法用非凸优化方法将训练字典分解为类别字典和非类别字典,以增强字典的表示能力,同时可克服一般稀疏表示模型对于训练样本数量充足和质量高的限制。另外,在类别字典中利用迹范数代替?1范数,避免过于强调类别字典中的稀疏信息而忽略其相关信息,从而可以根据类别字典结构自适应地选择表示样本,提高模型表示能力。(3)提出一种基于自适应的核稀疏表示方法。该方法将原始特征空间的数据映射到高维特征空间,并在高维空间利用迹范数对字典结构的自适应性获得更具判别力的训练样本表示待测样本。所提方法结合迹范数与核映射技术,不仅可以有效弥补稀疏表示方法处理非线性结构数据的不足,还能增强模型表示能力,从而可以处理更为普遍的模式识别问题。(4)提出一种基于自编码的弹性网方法。该方法充分利用数据特征信息,将弹性网模型和自编码器相结合,在编码器和解码器之间添加了弹性网编码模型,用于表示待测试样本,同时通过自编码原理对表示系数进行编码,既借鉴了卷积网络强大的特征提取能力,又利用了弹性网络在表示系数求解上的优势,并设计了一种端到端的训练框架,大幅提升了稀疏表示方法对图像数据的分类能力。本文研究工作围绕着稀疏表示模型的鲁棒性增强问题,从稀疏重构和字典构造两方面入手,提出了相应的算法,以提升模型处理更多不同特性数据的能力。取得的研究成果不仅丰富了稀疏表示领域的理论研究,而且可进一步提高其解决实际应用问题的能力。
孙浩然[6](2020)在《基于深度学习的图像压缩算法研究》文中指出随着大数据、云计算、物联网等技术产业的快速发展,数据流量爆炸式增长,数据的存储压力也越来越大。而图像是信息的主要载体,因此设计高效的图像压缩算法减小图像的压缩存储、提高压缩图像质量变得尤为重要。在传统图像压缩算法如JPEG、JPEG2000、BPG不断发展并广泛应用的同时,硬件设备的发展极大提高了计算机的处理速度和存储能力,使得基于神经网络的图像压缩算法研究得以发展、落地。在神经网络的发展过程中,为了提高网络模型的性能,网络结构朝着更深、更宽、更紧密的趋势发展,神经网络模型的存储也越来越大,给神经网络算法在手机等移动端的部署造成困难,因此模型压缩成为了近年来的热门研究方向。本文提出一种面向有损图像压缩应用的全卷积自编码深度神经网络,该网络模型可以端到端的压缩不同尺寸的图像。算法框架包括编码器、量化器、熵编码、熵解码、解码器五个模块。在编解码器模块中,本文以残差卷积块为基础构建编解码网络,避免因为神经网络层数加深而导致的性能退化问题;在解码器网络中,本文提出采用变换卷积代替反卷积对特征向量进行上采样,避免反卷积引起的棋盘效应导致的模型容量下降问题;在量化器中,本文采用软间隔量化代替均匀量化,避免了直接采用均匀量化函数导致的多处间跳跃断点,使得梯度下降算法更好地求导优化;在熵编码器中,本文对量化后的特征向量符号进行算术编码,进一步降低了特征向量的存储大小,从而提高图像的压缩比;在模型优化过程中,本文提出使用不同的混合感知损失函数提升模型生成的图像质量。相比传统的JPEG、JPEG2000图像压缩标准,实验结果表明本文提出的端到端全卷积自编码图像压缩神经网络在MS-SSIM指标上有着更好的性能表现。在以上图像压缩神经网络的基础上,本文提出了一种轻量级图像压缩神经网络模型。该轻量级网络采用训练中参数量化的方式,在保证模型精度仅损失1.68%的基础上,将模型参数从32位浮点型量化到8位整型,压缩后模型的存储仅占用原来的1/4。
吴佳全[7](2020)在《基于神经网络的ECG分类算法及高能效架构研究》文中认为心脏病是一类常见的突发性疾病,发作时不进行及时诊治很容易对病人生命健康造成威胁。可穿戴式心电监护设备能够长期记录和实时分析心电信号,对心脏类疾病的发作做出及时预警,显着提升了患者发病时的存活率。实现高准确率的异常心跳识别算法及其高能效架构设计是目前可穿戴式心电监护设备所面临的主要挑战。本文以心跳自动分类为应用场景,从算法和电路两个方面进行探索,旨在提高便携式心电监护设备的诊断准确率和系统能效。本研究的主要贡献包括:1.基于BLSTM和CNN结合的心跳分类模型研究。本文提出一种双向长短时记忆网络(BLSTM,Bi-directional Long Short-term Memory)和卷积神经网络(CNN,Convolutional Neural Networks)有机结合的算法模型,有助于提取心电信号中多层次特征,实现了高准确率的心跳自动分类。进一步地,本文通过自适应心跳截取技术保证了不同患者输入到分类网络中的心电数据形式上的一致性,并采用聚类的方法筛选出最具代表性的样本用于构建训练集。上述策略有助于通过轻量级的网络规模获得更高的心跳分类准确率,契合便携式心电监护设备的应用场景。2.基于神经网络压缩的高能效心跳分类架构研究。神经网络算法在便携式设备的硬件架构实现上容易受到计算复杂度和访存带宽的制约。针对这一问题,本文将神经网络压缩方法耦合到架构设计过程中,显着降低了模型参数量和运算规模,提升了系统能效。进一步地,本文提出一种量化稀疏矩阵编码格式,充分利用了压缩后神经网络稀疏模型中权重数据的局部性,大大减少了网络权重相关的冗余运算和访存操作。基于上述设计的硬件架构在实现本文所提出的心电分类算法时,能量效率可以达到3.23 GOPS/mW,在目前边缘计算领域神经网络加速器中处于优秀水平。3.基于计算复用的高能效心跳分类架构研究。由于心脏活动的规律性,心电信号往往呈现出近似周期性的特点,从而使得高度相似的连续心跳在多次分类过程中产生大量相同的中间运算结果。为了进一步降低心跳分类架构的硬件能耗,本文提出一种利用心跳相似性来实现多维度计算复用的高能效设计。该设计通过保存前次运算的中间结果并在下次运算中识别相同部分进行复用,显着加速了分类网络的推理过程,对硬件动态功耗的优化具有积极意义。使用本文所提出的心跳分类算法进行测试,基于上述架构的心电信号处理器与不采用计算复用的架构相比,分类速度提升了2.58倍,单次分类的能耗降低61.27%。本文提出的关键技术具有良好的科学研究价值和实际应用前景,对提升便携式心电监护设备的分类性能和架构能效有积极指导意义。
杨伟[8](2019)在《时空轨迹数据的结构化处理与行为语义感知》文中认为在大数据智能时代,随着无线传感定位设备的普及使用,移动对象时空轨迹数据呈现爆炸式增长。轨迹大数据包括交通车辆轨迹、人类活动轨迹、动物迁徙轨迹、自然现象轨迹等,具有数量大、类型多、增长快、价值高、众源泛在、时空多维、精细分辨率等优点。由于其巨大的研究应用价值,已有诸多重量级研究成果相继涌现,并广泛服务于智能交通、城市规划、服务推荐、行为分析、环境监测、公共安全、城市计算、社会感知等领域。然而,大数据的“5V”特性给轨迹数据挖掘处理、知识发现带来了新的挑战,使其面临“数据丰富而知识贫乏”或“知识即常识”的困境。为此,建立快速、高效的轨迹数据结构化处理模型方法,对轨迹大数据去粗取精、去伪存真以提取高价值、结构化的时空知识成为迫切解决的问题。论文以时空轨迹数据为研究对象,以结构化道路信息化提取与更新和活动行为建模与场所语义感知为研究问题,开展了基于时空轨迹数据的结构化处理理论模型与技术方法研究。论文研究工作主要包括以下几个方面:1.针对结构化道路信息快速提取问题,提出了一种基于低频车辆轨迹数据的车行道路面、线一体化提取技术方法。首先,提出自适应优选加密方法解决低频车辆轨迹中存在的假轨迹段、高噪音、采样稀疏、轨迹点数量少等问题。然后,引入约束Delaunay三角网及Voronoi图模型建模车辆轨迹数据,建立基于轨迹密度分布差异的边界识别指标,并集成识别指标、轨迹运动特征构建道路边界探测模型。最后,通过探测模型在轨迹几何细节层次上的分类处理,提出基于Delaunay三角网的道路面、线信息提取模型与算法。该方法顾及车辆轨迹在路网空间中的上下文差异特征,适于处理复杂路网结构、多时间跨度、多密度差异情形下的低频车辆轨迹数据,实现了基于“车辆轨迹->道路边界->路网中线->车行地图”数据处理流程的车辆轨迹结构化建模。2.针对路网变化信息快速发现与更新问题,提出了一种基于众源车行轨迹数据的路网变化信息检测与更新技术方法。首先,分析道路变化信息与车辆轨迹间的关联关系,为路网现势性检测与更新提供理论支撑。然后,集成轨迹运动特征、车行语义、车行轨迹与路网关联知识构建道路变化信息检测与识别模型。最后,提出以道路弧度缓冲区为基本更新单元,通过在轨迹几何特征上的精细化处理,在局部范围内探测路网变化、识别道路变化类型,根据变化类型提取变化信息、快速完成路网更新。相比已有变化发现技术,该方法能在更精细粒度上识别道路局部变化、路网方向变化、判别真实变化与语义变化,实现了基于“局部分析->类型推断->变化提取->增量更新”数据处理流程的路网变化检测更新。3.针对中小区域精细道路地图构建问题,提出了一种基于多源多类活动轨迹数据的中小区域路网精细建模与地图重建技术方法。首先,深入分析人类活动轨迹数据特征和中小区域路网精细建模过程,为精细道路数据获取与地图构建提供理论支持。其次,根据“轨迹数据->轨迹转弯点->聚类中心->道路节点”的逻辑关系,提出轨迹转向点探测算法提取转向轨迹点集、ASCDT算法聚类轨迹转向点建模道路节点。最后,根据“轨迹分割->增量融合->路网构建->优化处理”的处理顺序,提出轨迹线分割、轨迹线增量融合、优化处理等系列方法分层构建多专题精细道路地图。该方法能快速获取中小区域路网信息、完成路网几何、拓扑、语义信息的精细建模、构建多主题路网地图,实现了基于“活动轨迹->道路节点->路网拓扑->道路地图”数据处理流程的精细道路地图重建。4.针对活动行为识别与场所语义感知问题,提出了一种基于时空轨迹数据的活动行为建模与语义特征信息提取技术方法。该方法基于轨迹几何、语义特征,在个体层面运用轨迹运动参数建模活动行为、提取典型化行为语义特征;分别运用三角网模型、语义增强等方法在群体聚合层面分析活动行为事件与场所关联耦合特征、提取活动场所位置语义信息。以加油停留行为和慢跑绕圈行为及其场所语义感知为例,初步建立了从“行为模式挖掘”到“场所语义感知”的轨迹语义感知框架。该框架通过结构化分而治之策略,提取结构化几何、语义特征建模活动行为、挖掘行为语义、完成深层次的场所语义理解,实现了基于“时空轨迹->行为建模->活动探测->场所感知”数据处理流程的活动场所挖掘分析。5.通过研发时空轨迹数据挖掘处理原型系统,实现了时空轨迹数据的一系列挖掘处理分析,验证了论文相关模型、算法的有效性和可行性。综上,论文开展了轨迹密度特征上的时空异质性分析、几何计算与空间统计融合的道路信息获取更新、时空上下文的典型化语义特征提取、活动行为事件的场所位置耦合挖掘等相关工作,提出了系列轨迹数据结构化处理模型、算法,实现了轨迹数据从几何细节层次到语义概化层次的建模处理与语义理解。但轨迹大数据建模处理作为一项既复杂又系统的工作,仍存在诸多问题需要深入研究。
洪亮[9](2013)在《高分辨率图像处理电路的结构设计研究与优化》文中提出随着多媒体和消费电子技术的不断进步,基于高分辨率的图像处理正日益受到广泛关注。在静态图像处理领域,图像的分辨率正在从800万像素、1200万像素提升到2400万像素或更高;在动态图像(视频或动画)处理领域,面向4K×2K和8K×4K像素分辨率的视频图像已经被下一代视频编解码标准HEVC(High Efficiency Video Coding)所采用。因此,面向高分辨率的实时图像处理已经成为需要突破的重要技术。首先,论文对目前的国际图像和视频编解码标准发展趋势、特别是HEVC标准技术特点进行了介绍综述,并针对其中关键步骤的算法进行深入分析,明确已有硬件结构在应用到超高分辨率应用环境时需改进的问题。论文针对HEVC解码系统中的可变块大小图像压缩问题,重点研究了离散正弦逆变换(IDST)/离散余弦逆变换(IDCT)算法硬件实现结构。论文分析了当前文献报道的各种结构存在的不足,并通过标准测试图像仿真分析,得出可变块计算特点;基于上述分析,提出了基于外部串行输入、内部流水计算的IDCT/IDST实现结构,可在确保电路实时处理能力的同时有效提升了架构的硬件利用效率;针对IDCT/IDST中的常数乘法运算开展了优化工作,提出了一种改进的常数乘法器结构。上述电路采用SMIC 65nm1P9M工艺实现,仿真结果验证电路性能较优。在上述工作基础上,论文面向HEVC 4K×2K应用的图像压缩问题,提出了一种基于全流水可变块的二维IDCT/IDST结构,提出了二维IDCT/IDST中转置存储器容量设计方案,在较小存储容量的情况下实现系统工作停顿最小化。论文针对HEVC 8K×4K应用的超高分辨率图像压缩问题,提出了一种高性能可变块二维IDCT/IDST硬件架构;该结构基于4路并发执行的IDCT/IDST运算,电路的性能进一步提升,缓存释放更加高效。设计采用SMIC 65nm 1P9M工艺实现,仿真结果表明,电路性能满足实时图像处理要求。论文面向高分辨率CMOS图像传感器的图像处理需求,分析和研究了像素坏点去除、镜头缺陷矫正、图像去噪、色彩转换与增强、自动白平衡、伽码矫正和图像压缩等算法及图像处理器常见结构,对芯片工作模式进行了详细设计,对通信总线带宽进行了优化考虑,提出了优化的图像处理器结构,并完成了FPGA原型实现。针对CMOS传感器图像中的降噪和色彩插值问题,提出了一种改进的图像联合插值降噪算法,有效降低缓存规模。采用SMIC 65nm 1P9M工艺,仿真实验结果表明,设计满足专业和特殊应用数码相机的应用需求。
刘云鹏[10](2012)在《交通监控可伸缩视频编码研究》文中认为可伸缩视频编码(Scalable Video Coding, SVC:本文主要指H.264/SVC)是指通过一次高压缩率编码,可以形成在时间上、空间上、质量上分层的多层码流,并可以根据应用场景、用户需求、网络环境和终端用户特征抽取所需要层的码流。SVC这种只提供唯一可伸缩的视频码流来支持多种设备和异构网络的技术优势非常适合视频监控系统的应用,为监控视频的压缩、存储和传输提供了强有力的技术支持。在视频监控领域中,交通监控是获取各种交通信息来解决交通问题的主要手段,人们的研究更多的集中在交通对象(主要是汽车)的分割、分析、识别与跟踪,交通特征参数的提取与分析,交通事件的识别与理解等领域,而针对交通监控视频进行压缩编码的研究相对较少。事实上,对于海量级别的交通监控视频更需要快速和高效的压缩编码技术,同时在编码阶段就要考虑压缩域与非压缩域视频检索等问题,因此,交通监控系统内的视频压缩不是一个普通的孤立的视频压缩问题,而是一个必须考虑预处理并且与视频/图像分析模块进行交互的系统问题,该问题已经成为视频压缩编码技术中的一个新兴研究领域,对于交通安防等领域有着巨大的应用价值。鉴于此,本文研究面向交通监控应用的可伸缩视频编码,主要工作及研究成果在于:1)提出适用于交通监控视频的时间可伸缩帧间快速编码算法可伸缩视频编码采用分级B帧来实现时间伸缩性,其计算复杂度大大增加了编码时间,当前先进的改进算法可以将编码时间节省45%左右,但并未针对交通监控视频特点做进一步优化。对此,本文提出一种基于背景差分法的适合分级B帧的快速算法。首先通过改进的基于单高斯模型的时空背景建模方法获取背景图像;再求当前图像与背景图像的差值图像,通过滑动窗口去抖动算法正确获取运动区域;然后结合监控视频编码中影响分级B帧宏块模式选择的关键参数的统计数据分析,来缩减可能编码模式,从而提高编码速度。实验表明,本算法与标准算法比较,在保证编码效率和解码视频质量的前提下,编码时间可以平均节省约85%。2)提出基于视觉注意模型的道路监控视频关键帧提取算法对于日益剧增的海量交通监控视频,关键帧提取是和视频检索、摘要、浏览以及压缩编码都相关的一项重要技术。对此,本文首次提出一种基于视觉注意模型的道路监控视频关键帧提取算法。首先通过运动检测获取运动目标,以车牌和车辆最佳清晰度位置作为注意度评价标准,并提取运动目标位置显着度;然后提取运动目标的运动方向和强度显着度;接着用一种简单有效的车辆位置优先的自适应线性混合模式合成每帧图像的视觉注意度并生成最终的视觉注意度曲线;最后求出视觉注意度曲线的导数曲线,自适应滤波处理后在正值到负值变化的零交叉点中选取显着度最高的图像作为关键帧。实验证明,该算法提取的关键帧不但包括了所有经过监控的车辆最佳或接近最佳清晰度的位置,而且还能包括道路停车、超速和逆向行驶等各种交通事件,符合交通观察者的视觉特性。3)提出跟踪感知下适于快速检索的均衡自适应GOP编码算法在关键帧获取的基础上,形成时间0级上的Ⅰ帧,对该类型Ⅰ帧中的交通事件和交通对象进行H.264/SVC监控信息扩展编码,并利用统一的语法和语义实现检索接口的标准化和统一化,从而极大的提高了压缩域内的检索速度和后期分析需要。但是这会引起Ⅰ帧位置的不定性,对分级B帧结构也造成一定程度的破坏,影响了帧间相关性和分级特性。对此,本文提出一种均衡自适应的GOP结构,并使用一种二叉树算法来实现任意大小GOP的时间分级特性。这样有利于检索和视频摘要的生成,但是由于部分Ⅰ帧的插入和监控信息扩展编码,率失真性能会有一定的损失,考虑到交通视频区别于一般的电视广播视频,其主要目的是在交通对象准确跟踪的基础上进行高层语义分析。对此,本文使用跟踪准确度代替PSNR来进行解码视频质量的度量,并通过优化变换系数的量化来去除更多对跟踪影响较小的码流。实验表明,在保证跟踪准确度相对准确的前提下,比传统方法可以减少约60%的码率。4)提出适用于交通监控的内容自适应空间可伸缩视频编码算法当前空间可伸缩编码系统很少考虑视频感兴趣区域(Region of Interest, ROI)或视觉突出内容,从而不能更好的适应视觉重要内容在较低分辨率移动终端的显示。对此,本文提出一种适用于交通监控的内容自适应空间可伸缩视频编码算法。首先使用背景差法获取运动车辆并进行目标跟踪,通常在交通监控中主导车辆(视觉上最突出的乍辆)所在运动窗为ROI,然后将该ROI设定为裁剪窗口(Cropping Window),使用H.264/SVC标准的扩展空间可伸缩方法(Extended Spatial Scalability, ESS)进行编码,并在空间增强层通过ROI分层量化策略和频域系数压缩矩阵的方法来进一步提高编码的率失真性能。实验表明,本算法与传统的二分下采样空间可伸缩算法相比,在率失真性能略有损失的情况下,对低分辨率空间层解码下的视觉感知有较大的改善。同样,在增强层仍可使用跟踪准确度代替SNR进行视频质量度量,在此标准下可以获得更高的编码性能提升。5)提出适于交通监控视频的容错编码与错误隐藏算法3G技术的发展与4G/LTE技术的快速演进,使得异构环境下的各种移动与无线监控视频业务大大增加。由于移动无线信道的时变、高误码率、有限带宽等特点,其传输错误会严重影响SVC码流的解码质量。对此,本文提出空间可伸缩编码下基于反馈的错误跟踪(Error Tracking, ET)和参考帧选择(Reference Picture Selection, RPS)算法,结合了层间预测特性,并在选择帧内刷新(Intra Refresh)时考虑交通视频的视觉显着区域。并提出空间增强层帧级自适应错误隐藏算法,在对交通视频空间增强层宏块编码模式统计分析的基础上,利用基本层与帧间信息对增强层丢失宏块进行分析,自适应选择最佳的错误隐藏方法。如果使用跟踪准确度代替PSNR度量质量,由于压缩率大幅度提高,利用节省的码率增加冗余帧,在给定码率下,大大增加了解码视频的跟踪准确度。以上差错控制技术可以根据需求任意结合使用,为易错传输环境下接收视频的高层语义分析提供了有利的容错保障。
二、一种适于压缩细节丰富图像的编码算法(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、一种适于压缩细节丰富图像的编码算法(论文提纲范文)
(1)红外与弱可见光图像增强方法的研究(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
§1.1 研究背景与意义 |
§1.2 图像融合研究现状 |
§1.2.1 国外研究现状 |
§1.2.2 国内研究现状 |
§1.3 论文的研究特色与章节安排 |
§1.3.1 论文的研究特色 |
§1.3.2 论文的章节安排 |
第二章 图像融合的相关知识 |
§2.1 红外与弱可见光图像的特性 |
§2.2 常用的图像融合方法 |
§2.2.1 加权平均融合方法 |
§2.2.2 基于多尺度分解的融合方法 |
§2.2.3 基于稀疏表示的融合方法 |
§2.2.4 基于深度学习方法的融合方法 |
§2.3 图像融合的评价方法 |
§2.4 本章小结 |
第三章 基于潜在低秩表示和复合滤波的红外与弱可见光增强图像融合方法 |
§3.1 引言 |
§3.2 高动态范围压缩的弱可见光增强方法原理 |
§3.3 潜在低秩表示原理 |
§3.4 图像融合算法设计 |
§3.4.1 图像融合算法步骤 |
§3.4.2 改进的弱可见光图像增强算法 |
§3.4.3 基于潜在低秩表示和复合滤波的分解方法 |
§3.4.4 改进的低频融合规则 |
§3.4.5 改进的高频融合规则 |
§3.5 实验结果与分析 |
§3.5.1 实验设置 |
§3.5.2 主观视觉评价 |
§3.5.3 客观评价 |
§3.6 本章小结 |
第四章 基于U-net网络的红外与弱可见光图像融合方法 |
§4.1 引言 |
§4.2 图像融合方法设计 |
§4.2.1 总体思路框架 |
§4.2.2 网络具体细节 |
§4.2.3 融合模块具体细节 |
§4.2.4 损失函数设计 |
§4.2.5 网络模型训练 |
§4.3 实验结果与分析 |
§4.3.1 主观视觉评价 |
§4.3.2 客观评价 |
§4.4 本章小结 |
第五章 总结与展望 |
§5.1 工作总结 |
§5.2 研究展望 |
参考文献 |
致谢 |
作者在攻读硕士期间的主要研究成果 |
(2)基于学习的视频纹理分析和合成编码(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 研究背景及意义 |
1.2 研究历史和现状 |
1.2.1 静态纹理内容压缩 |
1.2.2 动态纹理内容分析与合成 |
1.3 论文主要工作及内容安排 |
第二章 数字视频基础知识 |
2.1 视频压缩原理及主要技术 |
2.1.1 视频压缩原理 |
2.1.2 视频压缩主要技术 |
2.2 HEVC简介 |
2.2.1 HEVC编码框架 |
2.2.2 块划分 |
2.2.3 帧内预测 |
2.2.4 帧间预测 |
2.2.5 变换 |
2.2.6 量化 |
2.2.7 熵编码 |
2.3 深度学习基础 |
2.3.1 卷积神经网络 |
2.3.2 生成对抗神经网络 |
2.4 人类视觉系统和质量评价准则 |
2.4.1 人类视觉系统 |
2.4.2 质量评价 |
第三章 基于深度学习的静态纹理高效变换编码 |
3.1 研究简介 |
3.1.1 研究动机 |
3.1.2 主要贡献 |
3.2 基于深度学习的静态纹理高效变换编码框架 |
3.3 网络结构 |
3.3.1 方向信息模块 |
3.3.2 变换模块 |
3.4 网络训练 |
3.4.1 损失函数 |
3.4.2 模型训练 |
3.5 实验结果及其分析 |
3.5.1 实现及实验配置 |
3.5.2 编码性能实验结果及分析 |
3.5.3 验证实验结果及分析 |
3.5.4 实验结果总结 |
3.6 本章小结 |
第四章 基于运动方向直方图的动态纹理的检测技术 |
4.1 动态纹理分析概述 |
4.1.1 研究动机 |
4.1.2 动态纹理检测技术 |
4.1.3 本章贡献 |
4.2 动态纹理检测技术框架及其在编码中的应用 |
4.2.1 动态纹理检测技术框架 |
4.2.2 基于动态纹理检测的编码框架 |
4.3 基于运动方向直方图的动态纹理的检测技术 |
4.4 实验结果 |
4.4.1 动态纹理检测实验结果 |
4.4.2 动态纹理检测在视频编码中的验证 |
4.5 实验结果总结 |
4.6 本章小结 |
第五章 基于动态纹理分析与合成的动态纹理编码 |
5.1 动态纹理分析与合成的动态纹理编码技术概述 |
5.1.1 研究动机 |
5.1.2 现有的动态纹理分析与合成的动态纹理编码技术 |
5.1.3 本章贡献 |
5.2 动态纹理分析与合成的动态纹理编码框架 |
5.3 动态纹理分析与合成的动态纹理编码技术 |
5.3.1 网络结构 |
5.3.2 生成网络 |
5.3.3 判别网络 |
5.3.4 损失函数设计 |
5.4 基于动态纹理分析和合成的编码方案的集成 |
5.5 实验结果及分析 |
5.5.1 数据集 |
5.5.2 网络训练 |
5.5.3 损失函数和网络结构验证 |
5.5.4 压缩性能 |
5.5.5 主观实验 |
5.5.6 实验小结 |
5.6 本章小结 |
第六章 总结与展望 |
6.1 论文总结 |
6.2 未来展望 |
参考文献 |
致谢 |
在读期间发表的学术论文与取得的研究成果 |
(3)高动态范围图像隐写技术研究(论文提纲范文)
摘要 |
abstract |
缩略词表 |
第一章 绪论 |
1.1 课题研究背景及意义 |
1.2 国内外研究历史与现状 |
1.2.1 基于数字图像的隐写算法研究现状 |
1.2.2 基于数字图像的隐写分析算法研究现状 |
1.3 本文的主要贡献 |
1.4 论文的组织结构 |
第二章 隐写和深度学习相关研究综述 |
2.1 HDR图像概述 |
2.1.1 HDR图像的生成和存储 |
2.1.2 色调映射 |
2.2 图像隐写技术与隐写分析技术综述 |
2.2.1 图像隐写模型 |
2.2.2 图像隐写分析技术 |
2.2.3 图像隐写性能指标 |
2.3 深度学习相关工作 |
2.3.1 深度学习与神经网络概述 |
2.3.2 卷积神经网络 |
2.3.3 残差网络 |
2.3.4 自动编码器 |
2.4 本章小结 |
第三章 基于RGBE格式的HDR图像隐写算法 |
3.1 HDR图像的视觉感知曲线 |
3.2 理论分析 |
3.2.1 RGBE格式简介 |
3.2.2 指数通道对图像失真的影响 |
3.2.3 像素等价状态 |
3.2.4 确定图像边缘 |
3.3 算法流程 |
3.3.1 秘密信息预处理 |
3.3.2 秘密信息嵌入和提取 |
3.4 实验结果及分析 |
3.4.1 性能分析 |
3.4.2 综合对比 |
3.5 本章小结 |
第四章 基于卷积网络的HDR图像隐写算法 |
4.1 图像隐写载体选取 |
4.2 基于卷积网络的图像隐写技术 |
4.2.1 训练数据集建立 |
4.2.2 残差卷积网络结构 |
4.3 算法流程及框架 |
4.4 复合损失函数 |
4.5 训练参数 |
4.6 实验结果与分析 |
4.6.1 损失函数性能比较 |
4.6.2 实验结果分析 |
4.7 本章小结 |
第五章 总结与展望 |
5.1 总结 |
5.2 后续工作展望 |
致谢 |
参考文献 |
攻读硕士期间的研究成果 |
(4)小波变换域基于图像数据集的图像编码算法研究(论文提纲范文)
摘要 |
abstract |
第1章 绪论 |
1.1 引言 |
1.2 国内外研究现状 |
1.2.1 图像编码标准及相关改进 |
1.2.2 基于图像数据集的图像编码算法 |
1.3 论文内容与结构安排 |
第2章 基于小波变换的图像编码 |
2.1 小波变换 |
2.1.1 小波变换的提出 |
2.1.2 小波变换的基本原理 |
2.1.3 小波基函数的选择 |
2.2 基于小波变换的图像编码算法 |
2.3 本章小结 |
第3章 小波变换域基于特征码书的图像编码算法 |
3.1 图像特征表示与矢量量化编码 |
3.1.1 图像特征表示 |
3.1.2 矢量量化编码 |
3.2 小波变换域基于特征码书的图像编解码 |
3.2.1 编码过程 |
3.2.2 解码过程 |
3.3 实验结果与分析 |
3.3.1 实验参数设置 |
3.3.2 图像压缩比 |
3.3.3 客观指标对比 |
3.3.4 主观视觉效果对比 |
3.3.5 不同图像元素的重构质量差异 |
3.3.6 复杂度分析 |
3.4 本章小结 |
第4章 小波变换域基于数据集预测的图像编码算法 |
4.1 图像特征在预测编码中的应用 |
4.2 图像对齐算法 |
4.3 小波变换域基于数据集预测的图像编解码 |
4.3.1 编码过程 |
4.3.2 解码过程 |
4.4 实验结果与分析 |
4.4.1 实验参数设置 |
4.4.2 小波变换级数的选择 |
4.4.3 与传统图像编码算法的对比 |
4.4.4 与基于数据集的图像编码的对比 |
4.4.5 复杂度分析 |
4.5 本章小结 |
第5章 小波变换域基于高频预测的深度神经网络图像编码 |
5.1 基于自动编码器的图像编码 |
5.2 小波变换域基于高频预测的深度神经网络图像编码 |
5.2.1 小波变换域的平行子带支路 |
5.2.2 高频子带预测模块 |
5.2.3 编解码网络 |
5.2.4 码字量化 |
5.2.5 熵编码网络 |
5.2.6 神经网络结构 |
5.3 实验结果与分析 |
5.3.1 图像集及图像预处理 |
5.3.2 参数设置及训练环境 |
5.3.3 率失真对比 |
5.3.4 不同码率下的高频重构对比 |
5.3.5 重构图像的主观对比 |
5.3.6 预测模型的有效性验证 |
5.3.7 复杂度对比 |
5.4 本章小结 |
第6章 总结与展望 |
6.1 主要贡献及结论 |
6.2 今后待研究的问题 |
参考文献 |
作者简介及在学期间所取得的科研成果 |
致谢 |
(5)鲁棒的稀疏表示方法研究(论文提纲范文)
中文摘要 |
ABSTRACT |
第一章 引言 |
1.1 研究背景和意义 |
1.2 国内外研究现状 |
1.2.1 稀疏重构算法 |
1.2.2 字典构造方法 |
1.3 研究内容和组织结构 |
第二章 基于自步学习的加权稀疏表示方法 |
2.1 自步学习简介 |
2.2 SPL-WSRC原理 |
2.2.1 SPL-WSRC模型 |
2.2.2 SPL-WSRC模型优化 |
2.3 实验结果与分析 |
2.3.1 实验一 |
2.3.2 实验二 |
2.3.3 实验三 |
2.4 本章小结 |
第三章 基于非凸优化的自适应稀疏稠密混合表示方法 |
3.1 稀疏稠密混合表示 |
3.2 ASDR-NO原理 |
3.2.1 ASDR-NO模型 |
3.2.2 ASDR-NO模型优化 |
3.2.3 基于非凸优化的字典分解 |
3.2.4 ASDR-NO模型总结 |
3.3 实验结果与分析 |
3.3.1 无损坏的人脸识别 |
3.3.2 有损坏的人脸识别 |
3.3.3 UCI数据集的实验结果 |
3.3.4 相关性分析 |
3.4 本章小结 |
第四章 基于自适应的核稀疏表示方法 |
4.1 SRC简介 |
4.2 AKSRC原理 |
4.2.1 AKSRC模型及优化 |
4.2.2 AKSRC模型总结 |
4.3 实验结果与分析 |
4.3.1 实验数据集 |
4.3.2 ORL实验结果 |
4.3.3 FERET实验结果 |
4.3.4 Cropped Yale的实验结果 |
4.3.5 AR的实验结果 |
4.3.6 UCI的实验结果 |
4.4 本章小结 |
第五章 基于自编码的弹性网表示方法 |
5.1 卷积自编码网络简介 |
5.2 弹性网简介 |
5.3 基于自编码的弹性网分类器 |
5.4 实验结果与分析 |
5.4.1 UMDAA-01 实验结果 |
5.4.2 USPS实验结果 |
5.4.3 SVHN实验结果 |
5.4.4 与经典卷积网络分类比较 |
5.5 本章小结 |
结论及展望 |
参考文献 |
攻读博士学位期间取得的研究成果 |
致谢 |
个人简况及联系方式 |
(6)基于深度学习的图像压缩算法研究(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 背景介绍 |
1.2 研究现状 |
1.2.1 图像压缩发展历史 |
1.2.2 图像压缩研究路线 |
1.2.3 基于神经网络的图像压缩 |
1.3 研究内容 |
1.3.1 基于卷积自编码神经网络的图像压缩算法 |
1.3.2 基于模型压缩的轻量化图像压缩算法 |
1.4 论文结构 |
第二章 深度学习与图像压缩 |
2.1 人工神经网络 |
2.1.1 MP模型 |
2.1.2 感知机模型 |
2.1.3 多层感知机模型 |
2.1.4 误差反向传播算法 |
2.2 卷积神经网络 |
2.2.1 卷积 |
2.2.2 反卷积 |
2.3 传统图像压缩算法框架 |
2.4 基于神经网络的图像压缩算法框架 |
2.5 本章小结 |
第三章 基于全卷积自编码神经网络的端到端图像压缩算法 |
3.1 理论基础与算法框架 |
3.1.1 率-失真理论 |
3.1.2 算法框架与码率计算 |
3.2 图像预处理 |
3.3 基于残差结构的编解码器网络 |
3.4 基于软间隔量化的量化器 |
3.5 基于算术编码的熵编解码器 |
3.5.1 算术编码过程 |
3.5.2 算术解码过程 |
3.6 基于变换卷积的解码器 |
3.6.1 反卷积与棋盘效应 |
3.6.2 变换卷积 |
3.7 基于图像质量评价指标的混合损失函数 |
3.7.1 经典损失函数 |
3.7.2 图像质量评价指标 |
3.7.3 混合感知损失函数 |
3.8 本章小结 |
第四章 基于参数量化的轻量级图像压缩神经网络 |
4.1 自编码网络模型压缩 |
4.2 图像压缩神经网络基础模型 |
4.3 训练后参数量化 |
4.3.1 模型的量化与存储 |
4.3.2 模型的反量化与推理 |
4.3.3 基础模型的训练后参数量化 |
4.3.4 量化误差 |
4.4 训练中参数量化 |
4.4.1 模型的量化与训练 |
4.4.2 模型的量化与存储 |
4.4.3 模型的反量化与推理 |
4.4.4 量化误差 |
4.5 本章小结 |
第五章 实验验证与结果分析 |
5.1 实验配置与流程 |
5.2 基于全卷积自编码神经网络的端到端图像压缩算法实验 |
5.2.1 反卷积模型与变换卷积模型的对比 |
5.2.2 不同混合损失函数模型的对比 |
5.2.3 最佳模型的选取 |
5.2.4 最佳模型的多码率图像压缩 |
5.2.5 最佳模型与传统压缩算法对比 |
5.2.6 率失真曲线及其他神经网络图像压缩算法对比 |
5.2.7 实验小结 |
5.3 基于参数量化的轻量级图像压缩神经网络实验 |
5.3.1 训练中量化模型与训练后量化模型的对比 |
5.3.2 训练中量化模型与传统压缩算法对比 |
5.3.3 实验小结 |
5.4 多尺寸图像压缩 |
5.5 本章小结 |
第六章 总结与展望 |
6.1 全文总结 |
6.1.1 主要工作与成果 |
6.1.2 创新点 |
6.2 后续研究工作 |
附录A |
参考文献 |
致谢 |
攻读硕士学位期间已发表或录用的论文 |
(7)基于神经网络的ECG分类算法及高能效架构研究(论文提纲范文)
致谢 |
摘要 |
abstract |
1 绪论 |
1.1 研究背景与意义 |
1.2 心电信号形态及其数据库介绍 |
1.2.1 心电信号形态 |
1.2.2 心电信号标准数据库 |
1.2.3 基于AAMI的心跳分类标准 |
1.3 心跳分类算法研究现状 |
1.3.1 基于人工特征提取的心跳分类算法 |
1.3.2 基于深度神经网络的心跳分类算法 |
1.4 心跳分类架构研究现状 |
1.5 技术路线与研究基础 |
1.5.1 技术路线 |
1.5.2 研究基础 |
1.6 研究内容和组织架构 |
1.6.1 研究内容 |
1.6.2 组织架构 |
2 结合双向长短时记忆网络和卷积神经网络的心跳分类算法 |
2.1 引言 |
2.2 “病人特异性”心电信号分类策略 |
2.3 神经网络算法原理 |
2.3.1 双向长短时记忆网络 |
2.3.2 卷积神经网络 |
2.4 双向长短时记忆网络和卷积神经网络结合的心跳分类模型 |
2.4.1 信号前处理 |
2.4.2 训练数据集和测试数据集构建 |
2.4.3 心跳分类网络拓扑 |
2.5 分类模型有效性验证 |
2.5.1 评价指标 |
2.5.2 实验结果与比较 |
2.5.3 算法有效性讨论 |
2.6 适合便携式设备的网络规模探究 |
2.6.1 双向长短时记忆网络规模调整 |
2.6.2 卷积神经网络规模调整 |
2.6.3 网络规模分析 |
2.6.4 分类性能分析 |
2.7 本章小结 |
3 基于神经网络压缩的高能效心跳分类架构 |
3.1 引言 |
3.2 心跳分类网络压缩 |
3.2.1 网络稀疏 |
3.2.2 参数量化 |
3.2.3 网络重训练 |
3.2.4 网络压缩实现 |
3.3 压缩网络权重矩阵编码 |
3.3.1 传统压缩稀疏列编码 |
3.3.2 量化稀疏矩阵编码 |
3.4 硬件架构设计 |
3.4.1 并行通道设计 |
3.4.2 处理单元 |
3.4.3 向量指针维护逻辑 |
3.4.4 非线性单元 |
3.4.5 SRAM配置 |
3.5 硬件指标呈现 |
3.5.1 版图与电路指标 |
3.5.2 心电分类应用性能 |
3.5.3 量化稀疏矩阵编码效率 |
3.6 架构普适性验证 |
3.7 本章小结 |
4 基于多维度计算复用的心跳分类架构 |
4.1 引言 |
4.2 心电信号相似性与计算复用 |
4.3 基于心电信号相似性的架构设计 |
4.3.1 基于BLSTM输入时间步间相似性的计算复用设计 |
4.3.2 基于BLSTM连续输入序列间相似性的计算复用设计 |
4.3.3 卷积神经网络部分的硬件设计 |
4.3.4 基于神经网络压缩的硬件设计 |
4.4 硬件指标呈现 |
4.4.1 版图与电路指标 |
4.4.2 片上SRAM使用情况 |
4.4.3 面积功耗分析 |
4.4.4 计算复用效率 |
4.4.5 指标对比 |
4.5 本章小结 |
5 总结与展望 |
5.1 论文研究工作总结 |
5.2 今后工作展望 |
参考文献 |
攻读学位期间发表/录用/在审的学术论文 |
(8)时空轨迹数据的结构化处理与行为语义感知(论文提纲范文)
本论文创新点 |
摘要 |
Abstract |
第1章 绪论 |
1.1 研究背景与意义 |
1.1.1 大数据与时空大数据 |
1.1.2 时空轨迹大数据 |
1.2 国内外研究现状 |
1.2.1 时空轨迹数据挖掘 |
1.2.2 结构化道路信息提取 |
1.2.3 时空轨迹数据语义感知 |
1.3 研究内容及论文组织 |
1.3.1 研究对象与研究目标 |
1.3.2 研究内容与技术路线 |
1.3.3 论文结构与章节安排 |
1.4 本章小结 |
第2章 理论基础与技术方法 |
2.1 时空轨迹相关概念 |
2.1.1 时空轨迹基本定义 |
2.1.2 时空轨迹获取与分类 |
2.1.3 时空轨迹基本特征 |
2.2 时空轨迹相关理论模型 |
2.2.1 运动空间与运动概念模型 |
2.2.2 时空GIS与时空数据模型 |
2.2.3 时间地理学 |
2.2.4 行为地理学 |
2.3 时空轨迹相关处理技术与方法 |
2.3.1 轨迹数据预处理 |
2.3.2 轨迹数据存储管理 |
2.3.3 时空轨迹数据挖掘 |
2.3.4 其他处理技术方法 |
2.4 本章小结 |
第3章 面向众源车辆轨迹数据的结构化道路信息提取与更新 |
3.1 众源车辆轨迹数据分析 |
3.2 道路信息与轨迹数据关联分析 |
3.2.1 道路几何拓扑信息 |
3.2.2 道路属性语义信息 |
3.2.3 道路变化信息分析 |
3.3 三角网支持下的低频车辆轨迹提取结构化道路信息 |
3.3.1 问题分析 |
3.3.2 方法原理 |
3.3.3 实验结果分析 |
3.4 众源车行轨迹数据的路网变化信息检测与更新方法 |
3.4.1 问题分析 |
3.4.2 方法原理 |
3.4.3 实验结果分析 |
3.5 本章小结 |
第4章 面向人类活动轨迹数据的路网精细建模与地图重建 |
4.1 人类活动轨迹数据分析 |
4.1.1 活动轨迹数据获取 |
4.1.2 活动轨迹数据类型 |
4.1.3 活动轨迹数据特征 |
4.1.4 活动轨迹与精细路网信息关联分析 |
4.2 活动轨迹数据构建精细道路地图过程认知分析 |
4.2.1 轨迹数据综合过程 |
4.2.2 图结构抽象建模过程 |
4.2.3 专题地图分层构建过程 |
4.3 基于多类活动GPS轨迹的中小区域精细道路地图构建 |
4.3.1 问题分析 |
4.3.2 方法原理 |
4.3.3 实验结果分析 |
4.4 本章小结 |
第5章 面向时空轨迹数据的活动行为建模与场所语义感知 |
5.1 轨迹数据的时空语义感知 |
5.1.1 时空行为语义感知 |
5.1.2 场所位置语义感知 |
5.1.3 活动事件语义感知 |
5.1.4 时空语义感知框架 |
5.2 低频车辆轨迹加油停留行为识别与加油场所信息提取 |
5.2.1 问题分析 |
5.2.2 方法原理 |
5.2.3 实验结果分析 |
5.3 慢跑运动轨迹绕圈周期行为探测与运动场所信息提取 |
5.3.1 问题分析 |
5.3.2 方法原理 |
5.3.3 实验结果分析 |
5.4 本章小结 |
第6章 时空轨迹数据结构化处理原型系统实现 |
6.1 系统架构设计 |
6.1.1 系统设计思路 |
6.1.2 系统总体设计 |
6.1.3 系统开发环境 |
6.1.4 系统实验数据集 |
6.2 系统功能模块设计与实现 |
6.2.1 轨迹数据预处理模块 |
6.2.2 轨迹数据挖掘模块 |
6.2.3 系统交互与可视化模块 |
6.3 系统示例展示 |
6.3.1 系统主界面 |
6.3.2 系统功能模块展示 |
6.4 本章小结 |
第7章 总结与展望 |
7.1 研究总结 |
7.2 研究展望 |
中外文参考文献 |
攻博期间发表的科研成果 |
致谢 |
(9)高分辨率图像处理电路的结构设计研究与优化(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 研究背景和课题意义 |
1.2 论文的主要研究内容 |
1.3 论文的组织结构 |
第二章 高分辨率图像处理技术综述 |
2.1 基于动态图像的图像压缩 |
2.1.1 动态图像处理技术发展概述 |
2.1.2 HEVC的主要技术改进 |
2.1.3 图像压缩变换/逆变换的原理 |
2.1.4 DCT/IDCT典型算法 |
2.1.5 HEVC IDCT/IDST算法 |
2.1.6 DCT/IDCT的 VLSI设计发展 |
2.1.7 可变块DCT/IDCT的结构研究综述 |
2.2 静态图像处理技术 |
2.2.1 图像采集相关知识 |
2.2.2 图像预处理的基本理论和常见算法 |
2.2.3 图像压缩和JPEG原理 |
2.2.4 静态图像处理器的发展现状 |
2.3 本章小结 |
第三章 全流水可变块一维IDCT/IDST硬件架构研究 |
3.1 全流水一维IDCT/IDST架构 |
3.1.1 性能需求分析 |
3.1.2 基于串行设计的一维运算过程 |
3.1.3 乘法器复用优化 |
3.2 可变块IDCT/IDST的资源复用策略 |
3.2.1 HEVC IDCT/IDST中不同块分布的统计和分析 |
3.2.2 硬件复用策略 |
3.3 面向HEVC的一维全流水可变块IDCT/IDST结构 |
3.3.1 支持全流水可变块的整体结构 |
3.3.2 IDCT运算阵列结构和基本运算模块结构 |
3.3.3 基于HEVC的常数乘法器 |
3.4 实验结果分析 |
3.4.1 硬件实现结果 |
3.4.2 结果比较 |
3.5 本章小结 |
第四章 基于HEVC的二维IDCT/IDST电路设计与实现 |
4.1 基于4K×2K图像的HEVC IDCT/IDST电路与实现 |
4.1.1 全流水可变块二维IDCT/IDST电路结构 |
4.1.2 快速释放空间的转置缓存模块结构 |
4.1.3 转置缓存空间大小的选择 |
4.1.4 FP_ITM的验证与实现 |
4.2 基于8K×4K图像的IDCT/IDST架构设计与实现 |
4.2.1 8K×4K的性能需求分析 |
4.2.2 高性能一维IDCT/IDST算法 |
4.2.3 高性能可变块IDCT/IDST结构设计 |
4.2.4 实现串行输出的优化32 点蝶形运算结构 |
4.2.5 转置缓冲模块的缓冲数据快速释放机制设计 |
4.2.6 实验结果分析 |
4.3 本章小结 |
第五章 高分辨率静态图像处理器结构设计 |
5.1 ISP-SoC的处理目标 |
5.2 ISP-SoC系统的主要功能模式 |
5.3 ISP-SoC的数据吞吐率分析 |
5.3.1 数据吞吐率 |
5.3.2 数据通路及瓶颈分析 |
5.4 ISP-SoC的整体硬件架构设计 |
5.5 ISP-SoC中的图像预处理模块设计 |
5.5.1 数字图像预处理流程 |
5.5.2 ISP-SoC图像预处理模块结构及子模块的设计 |
5.5.3 联合降噪插值模块设计 |
5.6 ISP-SoC的系统验证 |
5.6.1 ISP-SoC的 FPGA原型演示系统方案设计 |
5.6.2 硬件资源评估与FPGA选型 |
5.6.3 ISP-SoC FPGA系统的调试与演示 |
5.7 ISP-SoC的实现结果 |
5.8 本章小结 |
第六章 全文总结 |
参考文献 |
致谢 |
攻读博士学位期间已发表或录用的论文 |
攻读博士学位期间参与的科研项目 |
(10)交通监控可伸缩视频编码研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 研究背景与意义 |
1.2 国内外研究现状 |
1.3 创新性及本文结构 |
第2章 关键技术 |
2.1 引言 |
2.2 可伸缩视频编码 |
2.2.1 时间可伸缩 |
2.2.2 空间可伸缩 |
2.2.3 质量可伸缩 |
2.3 交通监控视频背景建模 |
2.4 交通监控视频运动检测 |
2.4.1 获取运动区域 |
2.4.2 获取运动目标 |
2.5 本章小结 |
第3章 适用于交通监控视频的时间可伸缩帧间快速编码算法 |
3.1 引言 |
3.2 编码原理 |
3.3 宏块模式统计分析 |
3.4 分级B帧快速编码算法 |
3.5 实验结果 |
3.6 本章小结 |
第4章 基于视觉注意模型的道路监控视频关键帧提取算法 |
4.1 引言 |
4.2 基于运动目标的视觉注意度提取 |
4.2.1 运动目标运动方向和强度注意模型 |
4.2.2 运动目标位置注意模型 |
4.2.3 基于位置优先的视觉注意模型生成 |
4.3 关键帧提取 |
4.4 实验结果 |
4.5 本章小结 |
第5章 跟踪感知下适于快速检索的均衡自适应GOP编码算法 |
5.1 引言 |
5.2 交通事件和对象扩展编码 |
5.3 自适应GOP结构划分 |
5.4 基于跟踪最优的压缩编码 |
5.4.1 跟踪效果度量 |
5.4.2 量化优化 |
5.5 实验结果 |
5.5.1 编码效率 |
5.5.2 视频摘要 |
5.5.3 压缩域检索 |
5.5.4 计算复杂度 |
5.6 本章小结 |
第6章 适用于交通监控的内容自适应空间可伸缩视频编码算法 |
6.1 引言 |
6.2 系统编码结构 |
6.3 内容自适应的空间可伸缩性 |
6.3.1 车辆跟踪 |
6.3.2 主导车辆定位 |
6.4 实验结果 |
6.4.1 编码效率 |
6.4.2 计算复杂度 |
6.5 本章小结 |
第7章 适于交通监控视频的空间可伸缩容错编码与错误隐藏算法 |
7.1 引言 |
7.2 基于反馈的容错编码 |
7.2.1 基于错误跟踪的帧内刷新 |
7.2.2 基于参考帧选择的容错编码 |
7.3 空间增强层自适应错误隐藏算法 |
7.3.1 交通监控视频空间增强层宏块模式统计 |
7.3.2 错误隐藏算法 |
7.3.3 错误隐藏后NACK发送分析 |
7.4 跟踪最优下的冗余编码 |
7.5 实验结果 |
7.5.1 基于反馈的容错编码 |
7.5.2 错误隐藏 |
7.5.3 跟踪最优下冗余编码 |
7.6 本章小结 |
第8章 总结与展望 |
8.1 总结 |
8.2 展望 |
参考文献 |
攻读博士学位期间主要的研究成果 |
致谢 |
四、一种适于压缩细节丰富图像的编码算法(论文参考文献)
- [1]红外与弱可见光图像增强方法的研究[D]. 蒋琦. 桂林电子科技大学, 2021(02)
- [2]基于学习的视频纹理分析和合成编码[D]. 杨昆. 中国科学技术大学, 2021(09)
- [3]高动态范围图像隐写技术研究[D]. 乔彦. 电子科技大学, 2021(01)
- [4]小波变换域基于图像数据集的图像编码算法研究[D]. 杨楚皙. 吉林大学, 2020(08)
- [5]鲁棒的稀疏表示方法研究[D]. 王学军. 山西大学, 2020(12)
- [6]基于深度学习的图像压缩算法研究[D]. 孙浩然. 上海交通大学, 2020(01)
- [7]基于神经网络的ECG分类算法及高能效架构研究[D]. 吴佳全. 浙江大学, 2020(12)
- [8]时空轨迹数据的结构化处理与行为语义感知[D]. 杨伟. 武汉大学, 2019(06)
- [9]高分辨率图像处理电路的结构设计研究与优化[D]. 洪亮. 上海交通大学, 2013(01)
- [10]交通监控可伸缩视频编码研究[D]. 刘云鹏. 浙江大学, 2012(12)