基于HSI空间的实时分级视频检索系统

一、基于HSI空间的实时分级视频检索系统（论文文献综述）

姚凯^[1]（2021）在《森林余火扑灭机器人设计研究》文中提出森林资源是极其重要的陆地资源,火灾不仅可以烧毁树木还会破坏森林生态平衡,甚至烧伤人畜,危害极大。火灾被扑灭后,火场剩下的可燃物还处在高温中或在阴燃状态产生余火,若不及时扑灭,依然会使火灾再次发生。针对目前森林火灾余火扑灭现状,设计一款余火扑灭机器人,能在森林火场复杂的路面上保持良好的行驶状态,快速到达指定地面扑灭余火,保障消防员的生命安全,将损失降到最小。提出森林火灾余火扑灭机器人的总体设计。根据森林火灾余火特征和所需机器人工作环境与工作任务,明确了设计要求。通过分析,余火扑灭机器人由三个系统组成:控制系统,执行系统,行走系统。选取履带式底盘作为运动系统。结合火灾余火的特性及灾后环境要求,设计余火识别系统。主要包括多传感器检测系统硬件设计,元器件的选型、硬件电路图的设计。对消防机器人的控制系统硬件进行选型与原理分析。提出了基于视觉传感器的火焰、烟雾图像识别方法和图像降噪法。设计履带底盘结构,分析其转向性能。提出了履带底盘、防护箱、工作轮的参数设计,分析其运动状态,保证其具有良好的行驶性能。对气动灭火炮系统进行设计,改进了其击发装置。基于其击发装置的特点,对击发过程中灭火弹进行动力学分析,得到其膛内运动方程,并确定身管的合理参数,对身管进行模态分析。研究了发射气压和击发环角度对灭火弹速度的影响,得出击发环最优角度。确定了灭火弹的外弹道方程,由试验所得数据,编制了部分射程数据表,供使用参考。

钟缘^[2]（2021）在《自然场景中的文字检测与识别研究》文中研究说明随着智能手机、智能摄像头等一系列智能设备的普及,越来越多的图像被人们获取,这些图像中不乏包含着一些有用的文字信息,如何将这些图像中的文字信息检索识别出来应用在例如实时翻译、智能辅助驾驶、盲人阅读等新技术上,成为了当今学术和工业界的热门研究领域。但是自然图像由于拍摄角度和拍摄条件等原因,往往存在过曝、光照不均匀、图片模糊、背景复杂等问题。如何高效、准确的定位、识别自然场景中的文字信息也成为了近年来热点研究之一。本文论述了自然场景下文字检测与识别研究的背景和意义,对相应算法的研究现状与存在的不足进行了描述和分析,并针对性的提出了相应算法的改进。具体的工作和主要研究内容如下:1.基于多通道增强的最大稳定极值区域算法。首先将图片进行锐化边缘加强处理,然后对图像在多个颜色通道下（R,G,B,H,S,I）,进行最大稳定区域的提取,再将得到的多个通道下的最大极值稳定极值区域进行合并。通过实验验证,此方法相较与传统方法能够检测出更多的文字候选区域,有助于提高整体检测算法的精确率。2.基于多特征融合的非字符区域过滤算法。首先,将经过多通道增强的MSER算法得到的文字候选区域分别进行HOG特征、LBP特征、CDBN特征的提取,再对这三个特征进行融合,最后将融合后的特征输入到SVM中,通过训练SVM来对字符区域和非字符区域进行判别,进一步对非字符区域进行过滤,并最终合并成文本行。通过实验验证此方法相较于传统过滤算法和目前已有的一些过滤算法,能够过滤掉更多的非字符的候选区域,提高了最终场景文本检测的精确率。3.基于改进卷积深度置信网络的多字体字符识别模型研究。针对自然场景下多种字体包括一些艺术英文字体识别进行了深入研究。建立了涵盖英文常用字体,以及一些常见艺术字体,共计25种英文多字体的数据库。提出了一种基于卷积深度置信网络的自然场景英文字符识别模型。并且在此基础上通过对比实验确定了网络模型的最佳训练迭代次数,深度置信网络的隐含层个数,以及卷积池化方式等参数。最终通过实验验证了卷积深度置信网络在场景字符识别中的优势。之后针对存在的一些相似字符的识别准确率较低,提出了一种改进的卷积深度置信网络,将卷积深度置信网络的两层特征相融合,充分发挥了卷积深度置信模型各层的特征表征能力。改进后的卷积深度置信模型对多字体英文字符识别率达到了98.77%。

卢熠^[3]（2020）在《基于深度学习的高速服务区车位监管系统设计与实现》文中研究说明近年来,随着我国交通车辆的爆发性增长,导致部分高速公路服务区的停车位日趋紧张,违法、违规停车事件时有发生,公众在服务区停留时的舒适度较差。另一方面,服务区需要对油罐车、畜牧车与普通轿车的停车位进行分类管理,以满足高速公路服务区的防控要求。考虑到基于视频的停车位检测技术对摄像头的位置要求较高并且对场景变化的依赖性强,同时该技术对小目标的识别精度不足,直接导致在车型分类时,算法的识别率较低,容易出现漏检、误检现象。因此,本文针对一阶段检测模型中对小目标识别率低以及在训练过程中存在正负样本不平衡的问题进行算法改进,并在此基础上开发并实现了高速服务区车位监管系统。具体工作如下:（1）本文在COCO公共数据集的基础上,增加高速公路服务区高空摄像头所拍摄的样本图像,同时依据高速公路服务区的车位管理需求对车辆的类型重新标注,并在Yolov3的网络结构基础上,提出了一种多尺度特征的卷积神经网络结构,进而有效改善了原有算法对小目标识别精度低的问题;同时,本文采用mixup数据增强的训练策略,增强模型的泛化能力,减少模型对错误标签的记忆,进一步了提升模型的检测精度;最后,本文提出在模型中采用swish激活函数,以解决Leak Relu激活函数在x负半轴的单调性以及在（0,0）处不可导的问题,进一步提高了模型的非线性表达能力。（2）针对一阶目标检测算法模型中存在正负样本不平衡的问题,本文设计了一种参数自适应的深度学习损失函数。该损失函数不仅充分利用了焦点损失函数的权重调节机制,还能够依据模型预测出的概率值,自适应的调节损失函数中超参数的大小,使模型能聚焦于数量较少的难例正样本的训练,有效的改善了模型中正负样本数量不均衡的问题。（3）结合上述提出的理论方法,本文设计并实现了高速公路服务区车位监管系统,该系统可以实时的对剩余车位数量进行检测,同时可以实现对区域内违停车辆的监管。本系统能够适应复杂的高速公路服务区停车场应用场景,算法对车位状态的识别具有较好的泛化能力;在检测阈值为0.5的基础上,准确率m AP超过了90%;检测速度为每秒25帧,目前该系统已成功应用在浙江某高速公路服务区中。

任正韬^[4]（2020）在《基于图像处理的火灾检测算法研究》文中指出随着城市化进程和经济社会的高速发展,城市人口密度增大,消防隐患增加,火灾作为频发的重大灾害之一,给社会带来了越来越严重的经济损失和人员安全问题,因此,提高火灾检测的准确率,及时采取有效预警措施具有重要的理论、现实意义和经济价值。与传统的火灾检测技术相比,图像型火灾检测方法在识别准确率及实时性等方面均具有更佳的表现,因此成为当今研究热点之一。现阶段的图像型火灾识别研究中,采用粒子群（PSO）等传统智能优化算法对支持向量机（SVM）进行优化时,得到的分类模型普遍存在火灾样本识别率以及算法效率偏低的问题,为对其进行改进,本文首次将人工蜂群（ABC）及灰狼算法（GWO）两种近年来新兴的智能优化算法应用于图像型火灾的识别研究,以期获取更优的模型参数,提升模型对火灾样本的分类精度。本文主要研究内容如下:（1）深入分析了图像处理相关技术的主要理论及常用的处理方法。为提高图像质量及后期识别准确率,经对比分析及仿真验证,确定了灰度化及图像滤波的方法。（2）在研究对比光流法、背景减法等主流运动目标检测方法特点的基础上,选用背景差分结合混合高斯背景建模的检测方法,获取了疑似目标区域;同时引入颜色矩及灰度共生矩阵等方法,分别对目标区域进行了颜色、纹理等特性的提取,通过与主要干扰物进行特征比对,进一步说明了提取出的每一项特征量的有效性和合理性。（3）研究探讨了粒子群优化算法、人工蜂群算法以及灰狼算法对支持向量机参数进行优化的性能特点,并基于Matlab平台,利用Libsvm工具箱进行了实验验证。最后展开PSO-SVM、ABC-SVM及GWO-SVM这三种算法对火灾图像识别的实验研究,验证及对比了其识别性能。实验结果显示,相较于传统的PSO-SVM,本文所采用的ABC-SVM和GWO-SVM均能够更准确地对火灾及主要干扰源进行识别,其中GWO-SVM相较于PSO-SVM,火灾样本识别精度由96%提升至99%,其分类速度提升了32.4%,在识别准确率及运行效率方面体现出了更佳的性能,印证了本研究的有效性。

赵博杰^[5]（2020）在《基于机器视觉的茶叶嫩芽识别关键技术研究》文中认为茶叶是人们日常生活中的必需品,同时茶叶在出口商品中也占有一席之地。其中名优茶以精益的加工质量和良好的茶叶品质广受人们追捧。但是名优茶的采摘仍处于手工采摘的阶段,低效率的名优茶采摘工作始终无法扩大生产,所以一套关于名优茶采摘的全自动设备与理论仍有待研究,而在采摘过程中最关键也是最难的问题便是对茶叶嫩芽的识别与定位。本文在综合名优茶采摘的具体环境及近几年目标识别的相关进展的基础上,基于机器视觉相关理论重点研究了芽叶识别与定位问题,在一系列图像预处理和颜色空间变换处理的基础上,建立了茶叶嫩芽的外形特征子集;应用特征mask矩阵的方法判别嫩芽与老叶,并实现自动分割;以张正友相机标定方法为基础,通过改进的RANSAC算法完成特征匹配,最终实现嫩芽三维坐标提取与定位。具体研究工作包括:首先,针对茶叶采摘现场的环境复杂和摄像头自身的原因导致采集到的茶叶图像对比度低、噪点多的问题,先对原始茶叶图像进行了一系列图像预处理,结合数字图像处理相关技术,平滑了图像,使得茶叶嫩芽的边界得到增强。应用边缘检测算法提取图像中边界,为后续芽叶外形特征识别提供了基础数据。运用双边滤波技术对图像进行处理,进一步滤除图像噪声。采用OSTU方法对图像进行阈值分割得到二值化图像。其次,茶叶嫩芽的颜色特征可以带来很多信息,所以先从颜色信息入手进行提取和分隔。而基于RGB通道的灰度直方图统计方式可以看出每个通道的颜色都比较平滑,直接分割相对困难。因此分别采用HSI和HSV色彩空间对原图像进行变换,采用色彩变换和相应的阈值范围判断方案获得嫩芽的位置和基本的外形轮廓。经过大量实验数据的分析,在转换后的各通道采用不同的分隔阈值,然后融合各通道数据为最终结果,实现了嫩芽的区域的较好分割。最后,在嫩芽叶片识别与定位阶段,在一系列图像预处理和颜色空间变换处理的基础上,建立了茶叶嫩芽的外形特征子集;应用mask特征矩阵方法判别实现了嫩芽与老叶判别,并实现自动分割。整合Realsense深度相机的深度数据,采用张正友相机标定方法处理深度数据,结合改进的RANSAC算法完成特征匹配,获得所识别芽叶的三维空间坐标,再经过相机坐标系到机械臂坐标系的变换,最终通过以太网接口上传至机械臂控制系统。由此完成了茶叶嫩芽的自动分割、识别与定位,初步现场试验表明,该方法对茶叶嫩芽识别与定位具有较好效果。

张建生^[6]（2017）在《基于计算机视觉及GPU加速的交通禁令标志检测技术研究》文中进行了进一步梳理随着社会和经济的不断发展,汽车已经变成一种普通交通工具,车辆日益增多,交通事故频繁发生,对人民的生命财产构成了巨大威胁。因此,在现有的道路环境下建立一种辅助驾驶系统,帮助驾驶人员修正车辆的行为,提高驾驶的安全性,具有非常重要的社会意义和研究价值。交通禁令标志是道路中对驾驶行为限制最严格的标志,所以交通禁令标志的检测与识别是辅助驾驶系统的重要模块,正在受到越来越多的关注。然而交通标志所处的真实环境复杂多变,受到光照情况、天气因素、局部遮挡、类似干扰物的影响,使得禁令标志的检测与识别面临许多困难,并且交通禁令标志检测系统对实时性和便携性也有要求,由于要求高问题多,所以在实际的运用中没有达到成熟的地步。本文以交通禁令标志的检测和识别为主要研究内容,首先详细分析交通禁令标志的特点,从颜色和形状两个方面入手,研究真实场景中禁令标志的定位算法,然后分析禁令标志的分类任务,采用深度学习的方法,设计卷积神经网络实现分类,针对实时性和便携性的客观要求,本文研究图像处理算法的并行实现和嵌入式实现,以提高实用性。本文主要研究工作为:1、研究彩色图像增强算法和颜色分割算法。直接用采集的图像进行颜色分割效果较差,研究彩色图像的空域增强算法和频域增强算法,研究颜色模型,以及各种模型下的颜色分割效果。2、研究形状检测算法。提取禁令标志的凸包并计算其凸缺陷,利用凸缺陷的面积、长度、高度、长宽比来排除伪区域并分割相连的标志。3、研究交通禁令标志的分类任务,研究深度学习的思想,设计一个适合本文分类任务的卷积神经网络,实现对交通禁令标志的分类,最终实验结果表明本文的分类准确率可以达到95%。4、研究GPU并行计算和图像算法的并行化。分析本文算法的并行性,针对适合并行的图像算法,利用英伟达生产的嵌入式TK1平台,对其进行并行化处理。本文实现了图像格式转换、图像增强、图像颜色分割和卷积神经网络的嵌入式并行化,可以达到29倍的加速比。

金旭晖^[7]（2016）在《图像处理在汽车驾驶辅助系统中的应用 ——交通标志检测与识别》文中提出现在的高端汽车市场上已有部分配备了汽车驾驶辅助摄像系统（ADAS）,譬如 Benz上 Bosch 的夜视系统,BMW 上 SIEMENS VDO、AUDI上Continental的360°全景摄像系统、PSA和MMC上KOSTAL的航道偏离检测系统等,都是用DSP或FPGA芯片采集实时图像数据,根据不同的实现目标,进行图像处理及分析来检测感兴趣的有用信息,并根据此检测结果加以相应的决策需求对驾驶员加以警示。交通标志识别（TSR）系统作为ADAS的一大功能,也是沉浸在繁忙城市生活中的商务人群对汽车需求的发展方向,而目前市场上还鲜有产品化的产品。本文研究工作致力于提供一个系统软件框架来实现驾驶辅助系统中实时交通标志检测和识别的功能。区别于现行的大部分研究只针对圆圈禁令标志或/和三角警告标志的检测,本文基于中国大陆交通法规中标准交通标志,设计算法以期能检测到大部分类型（不同颜色和形状）的中国境内的交通标志。考虑TSR功能的应用环境的实时性要求,本文算法的每一步尝试都尽量不影响其实时性。因而本研究基于HSI颜色空间,使用了新型的基于区域的快速颜色分割,建立了根据交通标志重要优先级的评价方法,结合简单阈值处理,可以快速地按颜色分层得到采样图像中可能含有标志的感兴趣区域（ROI,区域尺寸可根据需求定制）;再在此区域结合数学形态学的基础处理膨胀运算以得到平滑充盈的连通区域用来进一步识别区域形状。最终基于最后输出的确定形状的感兴趣区域掩模原图像的亮度分量,用边缘方法提取边缘方向的统计特征,用于基于内容的图像检索的相似性度量计算。欧氏距离的计算由于特征维数不是很高,是个较有效的距离度量。初步实验结果,对感兴趣区域的检测准确率在90%以上。此算法可以扩展到大部分目前标志数据图库中涉及的绝大部分标志使用形状。

项艳丽^[8]（2013）在《基于颜色特征的异色物识别方法研究》文中认为异色物检测系统是一种集光、电、气、机一体化的设备,可检测出正常物料中的异色物并将其剔除,提高产品的质量。它不仅能有效地提高劳动的效率及自动化的程度,极大地降低了人工的劳动强度,而且提高了产品的检测准确率及分级的精度,同时也能很好地保证成品的品质。异色物检测系统在很多领域有着广泛应用,如食品生产、农产品检测和分级等。该系统的理论基础是机器视觉及模式识别知识。文中涉及的过程首先是将CCD摄像机拍摄到的图像传送到计算机中,利用图像处理系统对获得的图像进行处理,其处理结果控制气动喷嘴的动作,以达到剔除异色物的最终目的。本文对异色物检测系统的结构及理论做了简要介绍,着重研究了系统中的识别特征及方法。由于颜色特征是图像中最直观、最底层及最明显的物理特征,且对噪声和图像的尺寸等因素不敏感,具有很强的鲁棒性,因此在本文中采用颜色特征作为识别特征。颜色特征的提取离不开颜色空间,这里选择三个颜色空间做特征提取,即RGB空间、Ohta空间及HSI空间。获得颜色特征的方法有多种,文中采用三种方法选取特征,分别是直方图,颜色矩及小波包变换提取的能量值。由于在异色物识别过程中异色物的种类较多,无法进行完全的统计,但是正常物料的特征稳定,属于一分类问题。文中采用阈值分割法,将合格物料的特征范围作为阈值的取值范围,以实现异色物的识别。

李春燕^[9]（2007）在《基于内容的多层次语义视频对象提取技术研究》文中指出近年来,随着视频信号的压缩、传输和存储等方面技术的迅速发展,引发了基于内容的视频分析的研究热潮,人们对多媒体信息的需求也从简单的播放转向了以基于内容的访问、检索和操作为特征的交互式视频服务、娱乐视频应用以及各种媒体的视频点播等。由于MPEG-4和MPEG-7等标准的提出,理解和提取语义视频对象成为一个视频压缩、检索等领域中非常重要的一个研究方向。尽管利用各种区域特征进行图片分割的研究已经取得了很大成效,但从众多视频资源中提取语义视频对象,建立具有健壮性的多层次的语义视频树还是一个亟待研究的课题。但由于特征和语义之间并不存在一一匹配的关系,传统视频内容分析方法带来了语义鸿沟问题。如何利用现有的视频分割提取及内容分析技术,建立合理有效且更加具有一般性的语义视频信息描述模型,提出基于具体模型和内容的多层次语义视频对象提取算法是本文的主要工作。本文的主要思路是:首先在前期的研究基础上,对语义视频信息描述模型进行研究和探讨,提出一种基于内容的多层次语义视频对象描述模型,进而基于该语义视频对象提取结构框图设计和实现了一个足球视频对象提取算法。主要工作包括如下几个方面:在语义视频对象描述与分析方面,本文在分析了基于结构建模和基于内容建模的传统语义视频对象描述模型及改进的视频语义信息层次化描述模型基础上,提出了一种适用于足球视频信息检测的多层次语义视频对象描述模型。在语义视频对象提取方面,本文在提出的描述模型的基础上进一步提出了一个基于内容的多层次语义视频对象提取结构框图,并设计了基于多层次语义视频对象提取算法。算法具体如下:首先进行镜头边缘检测,利用光流法在一段连续的视频序列中提取关键帧。然后用高斯马尔可夫模型对其进行颜色和纹理的混合特征进行图像分割。用Normalize-cut准则,对其运动信息进行分析,分离背景,最后进行区域聚合,即得到具有语义的视频对象。本算法对于背景运动信息较丰富的序列图像取得良好的提取效果。最后,论文还研究和预测了该技术在视频会议、视频对象监控的应用前景,并结合国家863高科技项目需求,开发出了一套“基于宽带网络的流媒体信息检测与内容监控”系统,并将具体的算法应用于系统中。

吕丽^[10]（2007）在《多层次语义视频对象描述模型及提取技术研究》文中指出随着视频信号的压缩、传输和存储等方面技术的迅速发展,人们对多媒体信息的需求也从简单的播放转向了以基于内容的访问、检索和操作为特征的交互式视频服务、娱乐视频应用以及各种媒体的视频点播等。从视频序列中提取语义信息并以此信息描述视频流,不仅能够有效提高视频压缩比,还可以增强对视频内容的访问、检索和操作,因而基于内容的视频分析已成为国内外学术界研究的热点。但由于视频特征和视频语义之间并不存在一一匹配的关系,传统视频内容分析方法带来了语义鸿沟问题。本文主要研究了现有的视频分割提取及内容分析技术,在此基础上建立了合理有效的语义视频信息描述模型,从而实现了从视频特征信息与高低多层语义信息的映射,提出了一个多层次语义视频对象提取算法。本文首先研究语义视频信息描述模型并做了深入探讨,在此基础上提出了一种多层次语义视频对象描述模型,并进一步提出多层次语义视频对象提取结构框图,进而基于该语义

二、基于HSI空间的实时分级视频检索系统（论文开题报告）

（1）论文研究背景及目的

此处内容要求：

首先简单简介论文所研究问题的基本概念和背景，再而简单明了地指出论文所要研究解决的具体问题，并提出你的论文准备的观点或解决方法。

写法范例：

本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。

（2）本文研究方法

调查法：该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法：用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法：通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法：通过调查文献来获得资料，从而全面的、正确的了解掌握研究方法。

实证研究法：依据现有的科学理论和实践的需要提出设计。

定性分析法：对研究对象进行“质”的方面的研究，这个方法需要计算的数据较少。

定量分析法：通过具体的数字，使人们对研究对象的认识进一步精确化。

跨学科研究法：运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法：这是社会科学用来分析社会现象的一种方法，从某一功能出发研究多个方面的影响。

模拟法：通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

三、基于HSI空间的实时分级视频检索系统（论文提纲范文）

（1）森林余火扑灭机器人设计研究（论文提纲范文）

摘要

Abstract

1 绪论

1.1 课题背景

1.2 森林消防机器人国内外研究现状

1.2.1 森林消防机器人发展阶段与发展趋势

1.2.2 国外研究现状

1.2.3 国内研究现状

1.3 森林余火探测与清理技术的研究现状

1.4 本课题主要研究内容

1.4.1 研究目的及意义

1.4.2 论文主要研究内容

2 森林消防机器人总体设计

2.1 森林消防机器人功能要求

2.2 森林消防机器人技术参数要求

2.3 森林消防机器人整体方案设计

2.4 行走机构选择

2.5 驱动方式选择

2.6 本章小结

3 余火识别系统

3.1 余火识别系统结构

3.2 余火识别系统硬件选择

3.3 多传感器信息融合

3.4 森林余火图像预处理

3.4.1 直方图法

3.4.2 火灾图像拉伸

3.4.3 改进型火灾图像的去噪处理

3.5 颜色特征提取

3.6 模板识别

3.7 本章小结

4 履带底盘结构设计与性能分析

4.1 履带式底盘结构设计目标

4.2 履带底盘结构设计

4.2.1 履带参数选择

4.2.2 各工作轮设计计算

4.2.3 防护箱设计计算

4.3 履带工作所需扭矩

4.4 履带驱动电机选型

4.4.1 电动机的分类

4.4.2 驱动电动机的选择

4.5 履带转向能力分析

4.5.1 低速转向分析

4.5.2 高速转向分析

4.5.3 稳定转弯的最大速度

4.6 本章小结

5 灭火执行系统结构设计与分析

5.1 灭火炮机械结构设计

5.1.1 灭火炮设计总体规划

5.1.2 储气排气机构结构设计

5.1.3 灭火弹击发装置结构设计

5.1.4 灭火炮姿态调整机构设计

5.1.5 炮管设计

5.2 灭火炮关键参数分析

5.2.1 击发环压力角计算

5.2.2 身管长度和锥角计算

5.2.3 灭火炮身管壁厚计算

5.2.4 灭火弹外弹道计算

5.3 灭火弹设计

5.3.1 选择灭火剂

5.3.2 灭火弹结构研究

5.4 身管有限元分析

5.4.1 有限元思想概述

5.4.2 有限元软件及其分析步骤

5.4.3 身管模态分析

5.5 本章小结

结论

参考文献

攻读学位期间发表的学术论文

致谢

东北林业大学硕士学位论文修改情况确认表

（2）自然场景中的文字检测与识别研究（论文提纲范文）

摘要

ABSTRACT

1 绪论

1.1 研究背景及意义

1.2 相关技术及研究现状

1.2.1 自然场景文字检测与识别的困难

1.2.2 场景文字定位研究现状

1.2.3 场景文字识别研究现状

1.3 论文主要研究工作和章节安排

2 基于多通道增强的MSER文本检测

2.1 引言

2.2 基于MSER的文本定位

2.2.1 MSER算法概念

2.2.2 MSER算法实现流程

2.2.3 基于MSER文本定位流程

2.3 多通道增强MSER模型

2.3.1 对Canny图像边缘增强

2.3.2 多通道颜色模型

2.4 数据集介绍

2.4.1 ICDAR2013 数据集

2.4.2 SVT数据集

2.5 实验结果及分析

2.6 本章小结

3 基于多特征融合的非字符区域过滤算法

3.1 引言

3.2 深度学习相关理论

3.2.1 卷积神经网络

3.2.2 深度置信网络

3.2.3 卷积深度置信网络

3.3 伪字符区域过滤

3.3.1 预处理

3.3.2 HOG特征提取

3.3.3 LBP特征提取

3.3.4 CDBN特征提取

3.3.5 SVM伪字符过滤

3.4 文本行生成

3.5 实验结果与分析

3.5.1 场景文本定位算法衡量标准

3.5.2 实验结果分析

3.6 本章小结

4 基于改进卷积深度置信网络的场景文字识别算法

4.1 引言

4.2 字符识别数据集介绍

4.3 基于卷积深度置信网络的场景字符识别算法

4.3.1 卷积深度置信网络模型的应用

4.3.2 Softmax分类器

4.3.3 用于多字体英文字符识别的卷积深度置信网络结构

4.3.4 实验结果分析

4.4 基于改进卷积深度置信网络的相似场景字符识别算法

4.4.1 相似字符识别

4.4.2 改进的卷积深度置信网络

4.4.3 实验结果分析

4.5 本章小结

5 总结与展望

5.1 本论文的研究以及所做工作

5.2 展望

参考文献

攻读硕士学位期间取得的成果

致谢

（3）基于深度学习的高速服务区车位监管系统设计与实现（论文提纲范文）

摘要

ABSTRACT

第一章绪论

1.1 研究背景和意义

1.2 国内外研究现状

1.2.1 图像检测算法研究现状

1.2.2 难例样本挖掘算法研究现状

1.3 主要研究内容及论文结构

1.3.1 主要研究内容

1.3.2 论文结构安排

第二章目标检测算法相关理论与基础

2.1 引言

2.2 卷积神经网络相关理论

2.2.1 卷积层的运算方式

2.2.2 常见的非线性变换

2.2.3 Batch Normalization层

2.2.4 残差网络模型结构

2.3 特征金字塔算法

2.3.1 特征金字塔算法的作用

2.3.2 多尺度特征金字塔结构

2.4 锚点的相关理论与计算

2.4.1 锚点的设计与优化

2.4.2 先验锚点的计算

2.5 非极大值抑制算法

2.6 数据增强策略

2.6.1 颜色抖动

2.6.2 几何变换

2.6.3 Dropout策略

2.7 小结

第三章一种基于多尺度特征融合的目标检测网络

3.1 引言

3.2 基于特征金字塔融合算法改进的Yolov3_plus网络结构

3.2.1 darknet53 特征提取网络模型

3.2.2 改进的Yolov3_plus网络结构

3.3 激活函数

3.3.1 Leakly Relu激活函数

3.3.2 swish激活函数

3.4 模型中采用的损失函数

3.5 mixup在线数据增强

3.6 实验结果比较与分析

3.6.1 数据集的准备

3.6.2 训练参数配置

3.6.3 算法性能评价指标

3.6.4 算法性能对比

3.7 小结

第四章一种参数自适应的深度学习损失函数研究

4.1 引言

4.2 焦点损失函数

4.2.1 难负样本定义

4.2.2 焦点损失函数的原理

4.3 基于Focal Loss改进的Soft-Focal Loss

4.4 实验结果比较与分析

4.4.1 训练的参数配置

4.4.2 实验对比与分析

4.5 小结

第五章高速公路服务区车位监管系统设计与实现

5.1 引言

5.2 车位监管系统平台硬件配置

5.3 车位监管系统软件架构

5.3.1 服务端设计

5.3.2 网页端设计

5.4 小结

第六章总结与展望

6.1 总结

6.2 展望

参考文献

致谢

作者简介

1 作者简历

2 攻读硕士学位期间发表的学术论文

3 参与的科研项目及获奖情况

4 发明专利

学位论文数据集

（4）基于图像处理的火灾检测算法研究（论文提纲范文）

摘要

abstract

1 绪论

1.1 研究背景及意义

1.2 图像型火灾检测技术的研究现状

1.3 论文研究方法及技术路线

1.3.1 研究方法

1.3.2 技术路线

1.4 论文主要内容和结构安排

1.5 本章小结

2 图像处理相关技术

2.1 颜色模型

2.1.1 RGB颜色模型

2.1.2 HSI颜色模型

2.2 灰度图像

2.3 图像去噪

2.3.1 均值滤波法

2.3.2 中值滤波法

2.4 本章小结

3 火焰目标检测及特征提取

3.1 运动目标检测的主要技术方法

3.1.1 帧差法

3.1.2 光流法

3.1.3 背景减法

3.2 基于高斯模型的背景减法

3.2.1 单高斯模型的背景建模

3.2.2 混合高斯模型的背景建模

3.2.3 混合高斯模型仿真实验

3.3 火焰特征提取

3.3.1 火焰颜色特征

3.3.2 火焰面积变化率

3.3.3 致密度

3.3.4 火焰纹理特征

3.4 本章小结

4 基于支持向量机的火灾识别算法

4.1 支持向量机介绍

4.1.1 线性可分支持向量机

4.1.2 非线性支持向量机

4.1.3 核函数

4.2 支持向量机参数优化

4.2.1 粒子群优化算法

4.2.2 人工蜂群算法

4.2.3 灰狼优化算法

4.2.4 基于参数优化的SVM模型的建立

4.3 基于支持向量机的图像识别测试

4.3.1 Libsvm工具箱

4.3.2 参数优化实验测试

4.3.3 火灾识别仿真实验

4.4 本章小结

5 总结与展望

5.1 总结

5.2 展望

致谢

参考文献

附录 A 硕士研究生学习阶段发表论文

附录 B 文中部分核心MATLAB代码

（5）基于机器视觉的茶叶嫩芽识别关键技术研究（论文提纲范文）

中文摘要

ABSTRACT

1.绪论

1.1 课题研究背景和意义

1.1.1 茶叶识别的意义

1.1.2 机器视觉的定义和发展

1.1.3 基于机器视觉的自动化采摘

1.2 国内外研究现状

1.2.1 国外相关技术外发展状况

1.2.2 国内相关技术外发展状况

1.3 课题研究主要内容及章节安排

1.3.1 本文研究内容

1.3.2 本文章节安排

2.茶叶嫩芽识别系统构建及预处理

2.1 机器视觉系统的组成

2.1.1 相机的选型

2.1.2 光源的选型

2.1.3 预处理的开发平台

2.1.4 OpenCV的配置

2.2 图像的平滑处理

2.2.1 中值滤波

2.2.2 高斯滤波

2.2.3 双边滤波

2.3 图像的边缘检测

2.3.1 Sobel边缘检测

2.3.2 Canny边缘检测

2.4 二值化处理

2.4.1 OSTU法计算阈值

2.4.2 迭代法计算阈值

2.4.3 二值化图像处理

2.5 腐蚀和膨胀处理

2.5.1 腐蚀运算

2.5.2 膨胀运算

2.6 本章小结

3.嫩芽图像分割

3.1 RGB的色彩分析

3.1.1 RGB相关基础

3.1.2 RGB空间的相关运算

3.2 HSV的色彩分析

3.2.1 HSV的相关基础与计算

3.2.2 HSV的空间变换

3.3 HSI的色彩分析

3.3.1 HSI色彩空间的基础理论与计算

3.3.2 HSI色彩空间的变换

3.4 基于色彩空间的分割

3.4.1 图像分割流程

3.4.2 嫩芽特征分类

3.5 本章小结

4.嫩芽叶片识别与定位

4.1 几何特征与形状特征

4.1.1 几何特征

4.1.2 形状特征

4.2 特征提取算法

4.2.1 特征提取流程

4.2.2 特征子集检索

4.2.3 特征子集判断

4.3 茶叶嫩芽的特征统计

4.3.1 芽叶图像特征统计

4.3.2 特征匹配算法原理与改进

4.4 嫩芽自动分割的设计与实现

4.4.1 图像采集与通信

4.4.2 自动分割的算法实现

4.5 嫩芽坐标获取

4.5.1 基本标定方法

4.5.2 嫩芽坐标获取

4.6 本章小结

5.总结与展望

5.1 本文总结

5.2 展望

参考文献

攻读硕士学位期间发表学术论文情况

作者简介

致谢

（6）基于计算机视觉及GPU加速的交通禁令标志检测技术研究（论文提纲范文）

摘要

Abstract

第一章绪论

1.1 论文背景及意义

1.2 国内外研究现状

1.2.1 禁令标志检测技术研究

1.2.2 禁令标志识别技术研究

1.2.3 图像并行计算技术的研究

1.3 禁令标志检测和识别系统概述

1.4 论文的研究对象和技术难点

1.5 论文主要研究内容和创新点

1.6 论文的组织结构

第二章彩色图像增强与颜色分割

2.1 彩色模型分析

2.1.1 RGB彩色模型

2.1.2 HSI颜色模型

2.1.3 RGB与 HSI的彩色转换

2.2 彩色图像增强

2.2.1 空域图像增强

2.2.2 频率域滤波

2.3 基于颜色阈值的禁令标志分割

2.3.1 RGB颜色差值和HSI颜色阈值分割方法具体步骤

2.3.2 图像增强前两种阈值分割对比分析

2.3.3 彩色图像增强前后分割效果对比分析

2.4 本章小结

第三章基于凸缺陷的禁令标志定位算法

3.1 连通域标记与面积过滤

3.1.1 连通区域标记基本原理

3.1.2 禁令标志二值图像连通域标记和面积过滤实验结果

3.2 平面点集的凸包与凸缺陷分析

3.2.1 平面点集的凸包分析

3.2.2 凸缺陷分析

3.3 伪区域排除与相连标志分割

3.4 真实复杂场景实验检测结果与分析

3.5 本章小结

第四章基于卷积神经网络的标志识别算法研究与实现

4.1 人工神经网络

4.1.1 神经元模型

4.1.2 多层感知器

4.1.3 感知器训练方法

4.2 卷积神经网络

4.2.1 卷积层

4.2.2 池化层

4.2.3 全连接层

4.2.4 激活函数

4.2.5 分类函数

4.3 交通禁令标志识别卷积神经网络设计

4.3.1 实验数据集

4.3.2 实验环境与Caffe框架简介

4.3.3 卷积神经网络结构

4.3.4 实验结果与分析

4.3.5 交通禁令标志的识别过程与特征可视化分析

4.4 本章小结

第五章禁令标志检测的嵌入式实现及GPU加速

5.1 基于CUDA的并行计算

5.1.1 并行计算基本概念

5.1.2 CPU与 GPU的区别

5.1.3 CUDA编程模型

5.2 本文算法并行性分析

5.3 基于嵌入式CUDA平台的图像处理算法并行化实现

5.3.1 嵌入式并行计算平台介绍

5.3.2 RGB格式图像到HSI格式图像转换的并行化实现

5.3.3 亮度图像直方图均衡化算法并行实现

5.3.4 HSI模式图像到RGB模式图像转化的并行实现

5.3.5 颜色差值二值化算法并行实现

5.3.6 卷积神经网络的并行化实现

5.4 本章小结

第六章工作总结与展望

6.1 研究工作总结

6.2 未来工作展望

参考文献

个人简历、申请学位期间的研究成果及学术论文

致谢

（7）图像处理在汽车驾驶辅助系统中的应用 ——交通标志检测与识别（论文提纲范文）

摘要

abstract

一、绪论

1.1 课题背景和研究意义

1.2 交通辅助识别的发展现状和标志识别问题描述

1.3 论文的研究方向和面临的难点

1.3.1 如何降低数据采集中的噪声和标志变形

1.3.2 感兴趣区域的快速定位

1.3.3 边缘检测的不确定性

1.4 本论文的相关研究工作

二、标志识别应用系统的框架介绍

2.1 图像数据从采集到图像处理模块

2.1.1 颜色空间介绍RGB

2.1.2 颜色空间介绍HSI

2.1.3 两种彩色空间的转换与特点分析

2.2 检测目标分析

2.2.1 国内交通标志标准介绍

2.2.2 检测目标模型描述和分析

2.3 .交通标志识别应用的系统框架和功能模块

三、图像预处理和图像分割

3.1 预处理的方法研究

3.1.1 方法介绍

3.1.2 以上方法选择应用分析降噪效果

3.2 基于底层特征的图像分割研究

3.2.1 边缘检测的方法研究和运用分析

3.2.2 结合高通滤波来强化的边缘检测方法

3.2.3 水平和垂直扫描搜索

3.2.4 基于颜色直方图的区域快速分割法

3.2.5 最大类间方差阈值分割法(OTSU)

3.3 使用综合特征检测实现感兴趣区域的发现和分割

3.4 本章小结

四、形状特征提取和基于中层特征的分类

4.1 形状描述和形状匹配

4.2 霍夫(HOUGH)变换

4.3 基于模板的匹配方法(交通标志标准形状)

4.4 结合形态学的形状提取和具体算法实现

4.5 基于颜色和形状的分类

4.6 其他衍生特征

4.6.1 颜色矩

4.6.2 Tamura特征中的方向性

4.7 本章小结

五、图像交通标志库检索

5.1 图像检索技术概述

5.2 基于内容的图像检索(Content-Based Image Retrieval,CBIR)

5.3 检索的相似性度量

5.3.1 欧氏距离

5.3.2 Minkowski距离

5.3.3 夹角余弦

5.3.4 杰卡德相似距离(Jaccard Distance)

5.4 对现有交通标志库的特征库存储

5.5 基于边缘方向特征的标志库检索

5.6 基于颜色和形状特征先分类的改进检索

5.7 本章小结

六、总结与展望

6.1 论文总结

6.2 后期工作如何改进算法

6.3 展望

参考文献

附录

致谢

攻读学位期间发表的学术论文目录

（8）基于颜色特征的异色物识别方法研究（论文提纲范文）

摘要

ABSTRACT

一绪论

1.1 课题研究背景及意义

1.2 国内外研究现状

1.3 本文主要研究内容

二异色物检测系统的理论基础

2.1 异色物检测系统简介

2.1.1 异色物检测的常用方法

2.1.2 系统整体结构

2.2 机器视觉

2.3 模式识别

2.3.1 图像采集

2.3.2 图像分割

2.3.3 特征选取

2.3.4 分类识别

2.4 本章小结

三颜色空间特征的选取

3.1 彩色模型

3.1.1 RGB颜色空间

3.1.2 Ohta颜色空间

3.1.3 HSI颜色空间

3.2 颜色特征

3.2.1 颜色直方图

3.2.2 颜色矩

3.3 实验分析

3.3.1 RGB空间选取颜色特征

3.3.2 Ohta空间选取颜色特征

3.3.3 HSI空间选取颜色特征

3.4 本章小结

四小波包变换提取颜色特征

4.1 小波变换

4.1.1 连续小波变换

4.1.2 离散小波变换

4.1.3 多分辨率分析

4.2 小波包变换

4.2.1 理论分析

4.2.2 小波基选择

4.3 实验分析

4.3.1 RGB空间选取颜色特征

4.3.2 Ohta空间选取颜色特征

4.3.3 HSI空间选取能量特征

4.4 本章小结

五阈值分割法

5.1 阈值分割法原理

5.2 阈值选取方法

5.3 阈值确定及计算

5.4 实验分析

5.4.1 RGB颜色空间识别分析

5.4.2 Ohta颜色空间识别分析

5.4.3 HSI颜色空间识别分析

5.4.4 方法分析

5.5 本章小结

结论

参考文献

致谢

（9）基于内容的多层次语义视频对象提取技术研究（论文提纲范文）

摘要

ABSTRACT

第一章绪论

1.1 研究背景

1.2 语义视频对象提取技术的发展及研究现状

1.2.1 MPEG-4 视频标准的关键技术

1.2.2 语义视频对象提取技术的发展

1.2.3 语义视频对象提取技术的难题

1.2.4 语义视频对象提取技术的研究现状

1.3 论文的内容结构和安排

第二章视频对象分析技术基础

2.1 基础数学及随机过程知识

2.1.1 马尔可夫随机场模型

2.1.2 最大似然估计

2.1.3 EM 算法

2.1.4 Normalize-cut 准则

2.2 静态图像处理技术

2.2.1 图像的基本描述

2.2.2 标记与邻域

2.3 边缘检测

2.4 图像分割

2.5 本章小结

第三章基于内容的多层次语义视频对象分割及提取技术研究

3.1 语义视频对象在MPEG 标准中的描述

3.2 现有的语义视频对象分割技术

3.2.1 基于时域的视频对象分割

3.2.2 基于时域空域结合的视频对象分割

3.2.3 基于分解运动信息的视频对象分割

3.3 基于内容的多层次语义视频对象提取算法

3.3.1 基于镜头的模型

3.3.2 基于对象的模型

3.3.3 基于内容的模型

3.3.4 基于时域空域信息的层次化模型

3.4 基于内容的多层次模型的低层语义信息提取

3.4.1 镜头边缘检测

3.4.2 关键帧提取

3.4.3 视频帧内图像分析

3.4.4 视频帧间运动信息分析

3.4.5 语义视频对象提取

3.5 基于内容的多层次模型的高层语义信息提取

3.5.1 足球视频镜头分类

3.5.2 足球视频对象语义提取

3.5.3 足球视频高层语义判别

3.6 本章小结

第四章算法在流媒体信息内容监控中的应用

4.1 流媒体监控技术

4.2 算法应用

4.2.1 流媒体视频监控系统

4.2.2 语义视频对象在远程视频监控中的应用

4.3 本章小结

第五章总结和展望

5.1 论文总结

5.2 技术展望

参考文献

附录1

致谢

攻读硕士学位期间已发表的学术论文目录

（10）多层次语义视频对象描述模型及提取技术研究（论文提纲范文）

摘要

ABSTRACT

1 绪论

1.1 研究背景

1.2 语义视频信息处理中的技术难题

1.3 语义视频信息处理技术研究现状

1.3.1 语义视频提取技术研究现状

1.3.2 语义视频对象提取和描述研究现状

1.4 本文研究内容及结构安排

2 多层次语义视频对象提取基础理论

2.1 光流算法原理

2.1.1 光流和运动场

2.1.2 光流的约束方程

2.1.3 光流的计算

2.1.4 孔径问题

2.2 Markov 随机场

2.2.1 图的定义

2.2.2 简单无向图与Markov 随机场

2.2.3 Markov 随机场和吉布斯分布

2.3 最大似然估计及其EM 算法

2.3.1 最大似然估计

2.3.2 标准的EM 算法

2.4 本章小结

3 多层次语义视频对象描述模型研究

3.1 概述

3.2 MPEG 标准中的语义视频对象分析

3.2.1 MPEG-4 中视频对象的描述及编码结构

3.2.2 MPEG-7 中视频对象的描述

3.3 语义视频信息结构化描述模型

3.3.1 基于镜头的模型

3.3.2 基于对象的模型

3.4 基于语义内容的语义视频信息描述模型

3.5 语义视频信息层次化描述模型

3.5.1 一般意义上的语义视频信息层次化描述模型

3.5.2 不良视频检测中的人体语义视频对象描述模型

3.6 本章小结

4 多层次语义视频对象提取技术分析

4.1 概述

4.1.1 语义视频对象平面的分割技术研究现状

4.1.2 语义视频对象的跟踪技术研究现状

4.2 基于层次化描述模型的语义视频信息提取

4.3 基于多层次人体语义视频信息的不良视频检测算法研究

4.3.1 基于光流法的关键帧提取

4.3.2 基于马尔科夫模型的第一层次语义视频对象提取

4.3.3 第二层次语义视频对象提取

4.3.4 判别

4.4 本章小结

5 语义视频对象提取在流媒体内容监控中的应用

5.1 网络流媒体内容监控背景及必要性

5.2 系统总体设计

5.3 关键技术应用描述

5.4 本章小结

6 总结和展望

6.1 研究工作总结

6.2 进一步研究方向

参考文献

附录1

缩略语

致谢

攻读学位期间发表的学术论文目录

四、基于HSI空间的实时分级视频检索系统（论文参考文献）

[1]森林余火扑灭机器人设计研究[D]. 姚凯. 东北林业大学, 2021(08)
[2]自然场景中的文字检测与识别研究[D]. 钟缘. 东华大学, 2021(09)
[3]基于深度学习的高速服务区车位监管系统设计与实现[D]. 卢熠. 浙江工业大学, 2020(02)
[4]基于图像处理的火灾检测算法研究[D]. 任正韬. 西安建筑科技大学, 2020(01)
[5]基于机器视觉的茶叶嫩芽识别关键技术研究[D]. 赵博杰. 辽宁科技大学, 2020(02)
[6]基于计算机视觉及GPU加速的交通禁令标志检测技术研究[D]. 张建生. 桂林理工大学, 2017(06)
[7]图像处理在汽车驾驶辅助系统中的应用 ——交通标志检测与识别[D]. 金旭晖. 上海交通大学, 2016(01)
[8]基于颜色特征的异色物识别方法研究[D]. 项艳丽. 内蒙古大学, 2013(01)
[9]基于内容的多层次语义视频对象提取技术研究[D]. 李春燕. 上海交通大学, 2007(06)
[10]多层次语义视频对象描述模型及提取技术研究[D]. 吕丽. 上海交通大学, 2007(01)

标签：机器学习论文; 特征提取论文; 深度学习论文; 卷积神经网络论文; 图像分割论文;

基于HSI空间的实时分级视频检索系统

一、基于HSI空间的实时分级视频检索系统（论文文献综述）

二、基于HSI空间的实时分级视频检索系统（论文开题报告）

（1）论文研究背景及目的

此处内容要求：

写法范例：

（2）本文研究方法

三、基于HSI空间的实时分级视频检索系统（论文提纲范文）

（1）森林余火扑灭机器人设计研究（论文提纲范文）

（2）自然场景中的文字检测与识别研究（论文提纲范文）

（3）基于深度学习的高速服务区车位监管系统设计与实现（论文提纲范文）

（4）基于图像处理的火灾检测算法研究（论文提纲范文）

（5）基于机器视觉的茶叶嫩芽识别关键技术研究（论文提纲范文）

（6）基于计算机视觉及GPU加速的交通禁令标志检测技术研究（论文提纲范文）

（7）图像处理在汽车驾驶辅助系统中的应用 ——交通标志检测与识别（论文提纲范文）

（8）基于颜色特征的异色物识别方法研究（论文提纲范文）

（9）基于内容的多层次语义视频对象提取技术研究（论文提纲范文）

（10）多层次语义视频对象描述模型及提取技术研究（论文提纲范文）

四、基于HSI空间的实时分级视频检索系统（论文参考文献）

猜你喜欢