基于形状特征和模糊识别的手写汉字识别

基于形状特征和模糊识别的手写汉字识别

一、基于整形特征和模糊识别的手写体汉字识别(论文文献综述)

王磊[1](2021)在《基于交互模式的手写体汉字采集与识别系统研究》文中进行了进一步梳理随着科学技术的发展,模式识别的应用在人们的生活中产生着非常重要的影响。模式识别是人工智能发展的基础理论与方法,主要研究方法是应用计算机技术对识别的事件进行识别与分类,其中一个重要的应用领域就是手写体汉字识别。汉字的种类繁多、结构复杂、不同人的书写风格各不相同、形近字过度相似等因素为手写汉字的识别带来了极大的困难。模式识别技术的不断发展推动着AI技术的进步,其中AI技术主要包含机器学习和深度学习技术。深度学习的崛起,为汉字识别提供了强有力的技术支持,相对于传统的汉字识别技术,深度学习卷积神经网络非人工特征提取、端到端的学习技术有着十分显着的优势,因此深度学习技术正在逐渐代替传统识别方法。本文利用深度学习技术对手写汉字的识别进行了研究,具体研究工作如下:(1)设计了一款手写体汉字数据采集设备,该设备使用加有红光滤光片的摄像头,利用光流算法,采集一字线性激光器反射光斑的移动轨迹,将采集到的轨迹进行二值化处理,最终输出显示在自主开发的汉字识别软件上。(2)实验采用中国科学院自动化研究所CASIA-HWDB1.1手写汉字数据库,由于该数据库的原始数据图像略显模糊,以及为了更好地满足实验数据需求,因此需要对该数据库的图像数据进行预处理。数据预处理主要包括:增强对比度、灰度化、归一化、二值化、平滑去噪以及形态学处理等。采用增强图像对比度的方法,来增强图像像素的对比信息;采用加权平均算法进行灰度化处理;采用双三次插值算法进行图像尺寸归一化处理,从而将图像的边缘特征很好的保留下来;采用最大类间方差算法进行二值化处理,实现数据的前景和背景分割;采用中值滤波算法进行图像平滑去噪,很好的保留了手写汉字的特征信息;将中值滤波后的图像数据进行形态学操作,使得汉字的有效特征区域范围扩大。(3)基于Tensor Flow深度学习框架,采用Inception V3网络模型对数据进行迁移学习训练,通过多组对比实验,采用指数衰减学习率,确定出最优化算法以及适用网络模型,并采用数据增强以及参数优化策略方法,训练出最优网络模型。(4)采用Py Qt5的桌面应用开发技术,开发了一套手写体汉字识别人机交互界面,通过软、硬件相结合的方式,实现了人机交互的手写体汉字识别模式。

侯杰[2](2021)在《面向孔府古籍文档图像的文字识别研究与实现》文中指出古籍档案蕴含着先贤智慧,承载着民族情感,是我们国家非常宝贵的文化财富。目前很多古籍面临着风化、破损等问题,且无法被大众查阅和共享。古籍文档的数字化不仅便于人们研究和交流,而且有利于优秀传统文化的继承与发扬,具有重要的历史价值和科研价值。古籍文档数字化主要涉及图像预处理、文档图像分割、字符图像识别等关键技术的研究,本文针对孔府古籍文档图像中的文字识别问题,主要研究了以下内容:首先,针对古籍文档同一文本列中的字符大小相差很大这类分割难题,在改进单次循环投影分割算法的基础上提出了二次循环投影分割算法。对于预处理后的二值图像,首先使用单次循环投影分割方法提取每一个文本列,然后根据文本列的水平投影划分其中的每一个字符。因为古籍文档的同一文本列中可能存在多列小字符,相邻很近的两个字符会被检测为一个汉字,故继续对分割到的每个字符再次执行投影分割算法,通过设定合适的阈值避免对字符过度分割。实验证明二次循环投影分割算法能够更加准确地定位每一个字符的位置。其次,提出了基于卷积神经网络的手写体汉字识别模型HCCR-Inc BN。针对深度学习模型中存在权重参数多、训练收敛慢、模型太大无法嵌入便携设备等问题,本文应用Goog Le Net中的Inception-v2模块,兼顾网络的宽度与深度,实现了不同特征的融合与映射;利用1×1卷积操作降低了参数数量与特征映射通道数,应用批量标准化算法与滑动平均算法来优化模型。存储模型只需要26MB,通过在公开手写体汉字数据集CASIA-HWDB1.1与ICDAR2013上的实验,对比证明了HCCR-Inc BN模型的识别有效性。此外,本文针对现有脱机手写简体汉字数据集不能有效用于古籍繁体汉字识别的问题,在对孔府古籍档案图像进行预处理和分割操作的基础上,人工标注每个字符图片的类别标签并进行数据集增强,创建了一个全新的脱机手写体古籍汉字数据集(Confucius’Mansion Archives Data),现有数据集包含1131个类别的繁体汉字、339300个样本。本文最后设计开发了古籍文档数字化系统,实现了“古籍文档图像上传”→“图像预处理”→“文档图像分割”→“字符图像识别”→“生成电子文档”的全过程。综上,本文提出的二次循环投影分割算法、设计的脱机手写体汉字识别模型、创建的手写繁体汉字数据集和开发的古籍文档识别系统,不仅巩固了古籍文献数字化的基础,而且对优秀传统文化的保护、传承和应用具有重要的实践价值。

张东东[3](2020)在《基于生成对抗网络的手写体汉字生成》文中认为汉字伴随着中华文化源远流长,是中华文化辉煌的象征。在过去三千年间,世界上超过四分之一的人在使用汉字,汉字一直是中国乃至东亚地区教育,就业,沟通和日常交流的基本工具之一。除此之外,汉字不仅是作为一种语言被使用,从古至今,诸多书法家留下了他们的佳作,中国书法不仅是一种语言表达,更是一种视觉艺术。随着数字信息时代来临,手写体汉字的应用场景和需求逐渐增加,利用标准印刷字体生成手写字体变的尤为重要。传统的字体生成方法集中在汉字的笔画分解并建立层级关系,并没有把研究的重心放在汉字整体风格上。生成对抗网络(Generative Adversarial Networks,GAN)为此开创了新的思路,GAN能够“学习”到已知的真实数据的样本分布,进而模仿该样本并生成真假难辨的数据。对于手写体汉字生成而言,不仅要生成笔画准确的汉字,还要学习到汉字的书写风格,一般的GAN无法完成这样的任务。为了更好的完成手写体汉字生成任务,本文提出改进的Cycle GAN进行手写汉字生成。Cycle GAN是近年来GAN的衍生模型之一。本文通过改进Cycle GAN生成器中传输模块的网络结构,将原结构中的深度残差网络(Res Net)用密集级联网络(Dense Net)替换,由于密集级联网络更优的性能,改进的Cycle GAN能“学习”到更多汉字图像的细节特征,进而生成更好的手写汉字图像。图像预处理和特征提取是图像识别的重要手段。本文将生成对抗网络生成的汉字图像作为手写汉字识别实验的数据集,从汉字识别的正确率衡量本文算法的有效性,实验结果表明,本文算法生成的汉字图像在不同特征下的识别率都比原方法生成的汉字图像高,同时基于最直观的人眼视觉评价,本文生成的汉字图像汉字结构更加完整,轮廓更加清晰,更为美观。

沈强[4](2020)在《基于数据增强的手写体中文简答题识别方法研究》文中研究表明自动化阅卷是一项具有高度社会生产价值的信息技术,目前大多数的做法是通过设计答题卡来实现选择题的自动判别,针对中文简答题仍缺乏有效方法。考虑到手写体汉字文本切分准确度低、识别难度大等问题,本文基于数据增强技术和卷积神经网络模型,对中文简答题的自动阅卷问题提出了一些解决方法。针对简答题文本切分问题,提出多步字符分割方法。将图像的垂直投影直方图做多项式曲线拟合,在函数极小值点处作分割线,然后根据其结果计算图像片段的宽高比例。从而区分不同结构的字符类型,包括过度分割字符和粘连字符。最后通过阈值合并与滴水算法分别处理,能够有效提高分割准确率。针对卷积神经网络识别模型缺乏大规模训练集,以及对分布外数据不友好的问题,提出原生集识别方法。通过收集过往答卷样本建立原生集,将之作为训练数据,以适应试卷环境下的样本分布,可以提高模型识别性能。针对原生集数据规模不足的问题,提出面向小规模手写体汉字数据集的数据增强策略。基于训练数据规模和样本类间数量平衡度对模型性能的影响,引入了 10种数据增强算法对原生集进行样本扩充和样本数量平衡,能够增加样本多样性并减弱过拟合问题。针对传统数据增强方法和DCGAN的不足,提出结合式数据增强方法X-DCGAN。该方法充分结合了传统数据增强方法和生成类方法的优点,既保证生成数据能够有效提高字符分类识别率,同时保证生成模型具备较强的生成效率和可移植性,有效改进了单一 DCGAN的生成方法。

于慧婧[5](2020)在《汉语印刷和手写文本阅读中正字法邻近字启动的抑制效应》文中提出在人们日常的沟通交流和获取信息的过程中,汉语常采用手写体和印刷体两种形式。手写体汉字是最早的书写和阅读形式,曾经也是人们常用的交流载体。近年来随着科技发展以及手机、电脑等的普及使用,印刷体汉字逐渐成为人们获取信息的主要形式和信息载体,但是手写体汉字仍有其不可替代的作用和价值。那么读者在识别或阅读以手写体和印刷体呈现的两种汉语文本时,其加工过程是否具有差异,是研究者关注和探讨的研究问题。正字法加工是汉字识别的重要过程,已有研究表明,汉字词汇识别会受正字法邻近字的影响。但手写体汉字的书写过程中,往往会出现不少的部件、笔画简略等现象,这不仅破坏了读者原本熟悉的字形信息,而且对汉字不同水平的正字法信息产生影响,这种现象在多笔画汉字中尤为明显。以往研究发现,读者阅读汉语印刷文本过程中存在着正字法邻近字启动的抑制效应以及笔画数效应。正字法邻近字启动的抑制效应,是指在词汇识别或句子阅读中,读者对先出现的邻近字的加工会抑制对后出现的目标字的识别。笔画数效应,是指与笔画数少的字或词相比,读者对笔画数多的字或词的注视时间更长,识别更加地困难。那么,当读者在识别和阅读笔画或部件简略的汉语手写文本时,是否也会出现显着的正字法邻近字启动的抑制效应以及笔画数效应?同时,当读者识别和阅读以手写体和印刷体形式呈现的汉语文本时,出现的以上两种效应之间是否表现出差异?本研究目的是为了回答上述两个问题,包括实验一和实验二。实验一以80名大学生为被试,采用2(文本类型:印刷体、手写体)×2(笔画数:多笔画、少笔画)×2(启动类型:正字法邻近字、控制字)×2(SOA:43ms、57ms)的被试内设计。利用启动范式,实验材料为字形相近且读音不同的正字法邻近字对,要求读者完成词汇命名任务,考察在印刷体汉字和手写体汉字的识别过程中的正字法邻近字启动的抑制效应和笔画数效应。实验二以44名大学生为被试,采用2(文本类型:印刷体、手写体)×2(笔画数:多笔画、少笔画)×2(启动类型:正字法邻近字、控制字)的被试内设计。利用眼动记录法,考察读者阅读印刷和手写文本中的正字法邻近字启动的抑制效应和笔画数效应。结合两个实验的结果,本研究初步得出以下结论。(1)读者在对印刷文本和手写文本进行词汇识别和阅读时均存在显着的笔画数效应。(2)与印刷体汉字相比,手写体汉字的阅读代价更大。(3)读者识别和阅读汉语印刷文本过程中均存在正字法邻近字启动的抑制效应,且这种抑制效应仅发生在词汇识别的早期阶段,但在手写文本中无此效应。

张红蕊[6](2020)在《基于生成式对抗网络的汉字生成方法研究》文中研究指明汉字作为信息传播的重要媒介之一,是世界上四分之一的人口持续使用数千年的文字,对人们日常工作、生活、学习、交流、工业化生产等均起到了不可磨灭的重要作用。使用信息化技术处理汉字信息已经成为模式识别领域的重要研究分支,它涉及了汉字生成技术、字体转换问题以及深度神经网络等,是一项十分综合性的研究课题。与英文字库的26个字母不同,汉字常用字符集GB2312共由6763个字符组成,数目庞大且笔划部首种类多样。而手写汉字相比于印刷体汉字,则表现出笔划结构更为复杂、笔划部件大小以及相对位置形变较大等特点;其次,手写体汉字易受到书写人书写风格的影响,笔划粗细长短不均匀、笔划简写、笔划丢失等现象屡见不鲜,这极大地增加了汉字生成任务的难度。本文研究了一种基于生成式对抗网络(Generative Adversarial Networks,GAN)的汉字生成方法,它将编码器-解码器思想融合于GAN生成器结构,并采用了增加跳跃连接的U-Net网络作为生成器网络架构。该方法旨在为汉字生成问题的解决提供一个具有普遍性的算法,具体工作如下:(1)本文提出了一种基于HCCG-GAN的书写人风格汉字生成方法,实现了由印刷体到手写体的汉字生成任务。该方法以生成不同书写风格的汉字图像为目标,结合迁移学习思想,采用两阶段训练方法。首先通过训练一个大型的印刷体到手写体的字体转换模型,用于寻找不同字体间的特征转换关系,之后采用部分少量由特定书写人撰写的汉字样本用于微调网络模型,最终生成具有相同书写风格的汉字图像。本方法融合字体风格损失、编码一致损失、L1距离损失等,用于衡量生成的汉字图像样本与目标字体图像在字符书写结构和字体风格上的差异,并在汉字数据集CASIA-HWDB1.0上进行实验,采用图像像素和图像风格两种差异性作为评估指标评价生成结果。相较于其他相关汉字生成方法,HCCGGAN方法能够生成逼真的书写人风格汉字图像。(2)本文提出了一种基于PCCG-GAN的手写体汉字规范化方法,实现了由手写体到印刷体的汉字生成任务。该方法从汉字识别的角度出发,着眼于传统方法中的预处理步骤,将字体风格转换的汉字生成结果视为手写汉字规范化的最优状态,旨在为手写汉字识别提供新的可能性思路。本方法采用对称的网络提取手写汉字多尺度信息并进行特征融合,以减少输入输出之间共享的大量低级别信息以及下采样过程中的信息丢失。其次,本方法设计了集成损失函数,用于衡量生成结果与真实数据之间的差异性,并在汉字数据集CASIA和CASIA-HWDB1.1上进行实验,并采用图像像素差异性和文字识别准确率作为评估指标。实验结果表明,PCCG-GAN方法在CASIA-HWDB1.1数据集上进行字体转换后的汉字识别准确率比转换前高0.86%。(3)基于本文提出的汉字生成方法,设计并搭建了可视化的实验系统。该系统以手写体汉字和印刷体汉字两个方面的汉字图像生成为主,主要展示了实验系统的可视化界面功能,实现了书写人风格汉字生成的手写体目标转换以及手写汉字规范化的印刷体目标转换。该实验系统的良好运行验证了本文方法的可应用性与可行性。

张馨月[7](2020)在《面向机械臂书写的手写体汉字书法美化方法研究》文中研究表明中国书法是一门古老的汉字书写艺术,是中华文化的基本要素之一,在全世界尤其是东亚影响广泛,深受大众喜爱。然而对于业余书法爱好者而言,用个人独特风格写出赏心悦目的书法作品是一个挑战性难题。近年来,将手写汉字美化为具有特定风格的书法是一个研究热点,但当前研究侧重于模拟某一风格的数字书法,无法生成在物理上可用毛笔写在纸面上的书法字,且模拟的数字书法难以展现用户的书写风格。针对上述问题,本文通过引入卷积神经网络模型和最优化模型,研究了一个基于机械臂的智能书法美化与书写系统,首先用户由鼠标或手写板写出汉字,系统将识别笔画并以楷书形式进行智能美化,然后控制机械臂自动用毛笔真实地书写在宣纸上,形成既有用户书写风格又有标准楷体书法风格的毛笔字。本文主要研究内容如下:(1)交互式手写汉字采集与笔画识别方法研究。针对基于图像的手写汉字笔画分割和识别困难的问题,使用鼠标或手写板在手写界面上以骨架形式绘制手写汉字,同步采集笔画的骨架点,并以笔画为单位进行保存。交互式笔画信息采集的平均效率约1笔/秒,高出基于汉字图像的笔画提取效率。然后利用每笔笔画的骨架点信息自动生成无噪声单笔画图像,使用卷积神经网络(CNN)识别单个笔画类型,用于检索相应的标准笔画,平均识别精度达93%,可满足系统后续研究要求。(2)面向机械臂书写的手写汉字楷体风格美化方法研究。针对手写汉字转化为机械臂书法汉字时存在难以同时保持用户风格和书法美观性的问题,构建了基于田英章和田雪松楷法笔画的机械臂书写标准笔画库,并引入形态特征向量用于描述标准笔画的形态,然后提出一种全局优化模型求解一种最优化书法笔画,该笔画既能保持用户手写笔画的风格,也具备标准书法笔画的美观性,还能保持笔画的光滑性。(3)机械臂毛笔字书写控制方法研究。针对机械臂在书法书写时毛笔的高度与力度难以控制的问题,经过优化的笔画轨迹将被输入至机械臂形成2D平面上的运动轨迹,通过选取经过重定位的标准楷书笔画点的高度值,为每个二维控制点添加3D空间内的高度信息,并采用坐标控制方式使机械臂书写楷体书法,此外,为获得更逼真的楷体风格,对笔画的刚性段做了风格加强处理。结果表明机械臂撰写的毛笔字书法不仅展示了丰富的楷书风格,而且表现出用户手写体的特点。(4)机械臂撰写毛笔书法结果评价方法研究。针对当前机械臂撰写缺乏有效评价模型的问题,提出了一种计算机模拟书法的生成方法,与真实书法进行对比,分别获得了模拟书法和真实书法在结构比、单元比和倾斜度上具有92%、90%和81%的相似性。此外,对机械臂撰写的书法作品进行用户调研,结果表明,本研究的书法美化及智能书写系统得到了87%用户的认可,系统能够有效地实现对手写体的书法美化。本文主要研究了面向机械臂书写的手写汉字书法美化方法,通过手写笔画提取与识别、手写体书法美化、机器人书写以及系统评价四个过程,生成的书法作品能在保持用户手写字形特征的同时有效实现对手写体的书法美化,该方法可为机器人智能书写研究提供理论基础,开发的智能书法美化与机械臂书写系统也能方便普通书法爱好者体验中国书法的魅力,弘扬中国传统文化,具有广阔的应用前景。

岳中彤[8](2019)在《基于PSO与BP神经网络的脱机手写体汉字识别》文中指出汉字识别的研究是模式识别中的一个热门课题,并已在实践中取得了相对成功的应用。本文主要探究脱机状态下对手写体汉字的识别,根据汉字识别流程的特性,创建了基于BP神经网络的汉字手写体脱机识别模型,并通过训练和测试验证其可行性。首先,选取手写体汉字样本图像对其开始预处理。其次,在特征提取流程对处理后的数字图像提取特征矢量。基于神经网络的自适应、自学习、容错能力强等优点,后期设计了随机样本数据的分类识别模型。并对此模型进行了改进,从而提高了脱机手写体汉字的识别率,优化了汉字分类识别流程。本文主要包括以下几个方面:1.概述了脱机手写体汉字识别的基本过程,以及各过程运用的基本算法。整体过程主要有图像的获取、图像的预处理、特征提取、识别分类模型的构建。本文研究的样本图像源自SCUT-IRACHCCLIB样本库。本文图像的预处理主要分为二值化、平滑去噪、字符分割、归一化、细化五个流程。二值化消除手写体字符笔画中的空白点,经处理后的字符笔画基本上保留了原字符的基本特征;平滑去噪去除了二值化图像中孤立的噪声黑点;字符分割把图像分出单个汉字便于仿真训练识别;归一化处理调整单个汉字尺寸和位置的变化;细化处理去除汉字的边缘轮廓,只保留最基本的形状信息。特征提取过程选用网格方向统计特征法,提取的特征矢量作为输入,用于分类和识别模型的仿真验证。之后基于BP神经网络设计了识别分类模型。2.针对汉字识别与分类的过程,本文详述了 BP算法和PSO算法各自的原理、实现及特性。基于BP神经网络对手写体汉字识别分类时,由于BP算法是一种局部的寻优算法,在网络的训练阶段易陷入局部极小点,且收敛速度慢,导致了分类器识别率的降低。针对上述问题,本文提出了 PSO优化BP神经网络(PSO-BPNN)的算法,建立了基于此算法的汉字手写体脱机分类识别模型。3.将数据库中的样本图像用于训练测试上述PSO-BPNN算法的有效性,本文所选择的仿真平台是Matlab。首先选用一定量的样本图像,经过预处理和特征提取之后用于训练汉字识别分类模型,然后将剩下的样本图像用于该模型的测试验证。其次,对大量样本图像进行训练仿真,并将原始BP算法和PSO-BPNN算法的识别效果进行比较,验证表明优化后的分类模型具有较高的预测精度和识别能力。

沈飞[9](2019)在《基于反馈知识迁移的脱机手写体汉字识别》文中研究指明脱机手写体汉字由于书写风格的多样性,同样的一个汉字,不同样本的各个汉字部件之间会出现位置的差异以及汉字部件之间无规律的黏连现象,增加了对其进行识别的难度。为解决这一难题,传统的模式识别方法提出先对汉字样本进行归一化处理,但是由于汉字整体拓扑结构的无法改变,很难从根本上解决这一问题。近年来卷积神经网络的兴起,为脱机手写体汉字识别问题带来了新的活力,使用卷积神经网络克服上述问题时,必须保证网络层次足够深。然而,卷积神经网络的隐藏层过多时,训练网络极易产生梯度弥散与过拟合现象,导致网络性能的下降。为解决以上问题,本文的完成主要研究工作有:1、提出分割脱机手写体汉字样本再训练的训练思路。通过分割脱机手写体汉字样本为各个汉字部件,解决脱机手写体汉字因为汉字部件之间位置差异造成的识别率下降;同时将原本汉字部件之间难以处理的黏连转化为汉字部将样本的边缘噪声,便于样本噪声处理。2、提出利用知识迁移算法训练分割后的脱机手写体汉字样本。将网络分解为若干子网络与一个主网络,使用子网络训练分割后的脱机手写体汉字部件,再使用知识迁移算法将子网络中各个汉字部件的特征信息整合到主网络中。3、提出知识迁移克服梯度弥散现象与过拟合现象的理论,并给出说明。通过分解网络模型的方式,降低网络层级,减少梯度弥散现象对网络参数训练的制约;通过知识提取过程中得到的带有样本类间信息的软目标,间接增加训练样本容量,缓解过拟合现象对网络参数训练的影响。4、提出了基于反馈的知识迁移训练算法,并构造了基于反馈知识迁移的网络模型。通过反馈使得各样本对应的权重系数值能够自适应地调整到合理的区间,提高网络训练效果。

王亚蒙[10](2019)在《基于风格迁移与薄板样条变形的扩充汉字样本库的算法研究》文中进行了进一步梳理随着人工智能的快速发展,汉字识别在信息录入与分析、办公室自动化等方面发挥了重要的作用。然而由于自然环境下采集的汉字样本具有复杂的光线纹理和不同程度的变形扭曲,所以使得自然环境下的汉字识别研究面临了巨大的挑战。现阶段通常采用的汉字识别方法是基于深度学习来实现的,而基于深度学习的方法在进行网络训练时需要提供丰富的汉字样本库。由于现有的汉字样本库存在样本数量少和样本单一的问题,如果采用现有的汉字样本库进行网络,就会出现过拟合的情况,同时训练出来的网络模型也难以在实际场景中得到有效的应用。由此可见,建立一个大规模并且具有代表性的汉字样本库是开展自然环境下汉字识别研究的前提与基础。由于采用的传统方法(例如扫描、拍照等手段)采集汉字样本,在人力物力以及时间成本上都面临着极大的开销,而且在汉字样本标定时的效率也十分低下。因此,本文提出了基于风格迁移与薄板样条的扩充汉字样本库的算法自动生成汉字样本。本文结合汉字识别的应用场景,重点对扩充光线样本的方法和扩充变形样本的方法进行了研究学习,最终提出了一种基于风格迁移与薄板样条的扩充汉字样本库的算法。本文完成的主要工作如下:1.针对自然环境中汉字识别受光照影响的问题,提出了通过扩充具有真实感光照纹理的汉字样本的方法,来减少光照产生的影响。本文结合汉字识别的应用场景,对扩充具有光照样本的方法还进行了研究,提出了采用图像风格迁移的方法生成具有不同光照纹理的汉字样本图像。图像风格迁移的方法是基于卷积神经网络实现的,首先,提取内容图像(汉字原图像)和风格图像(光照纹理图像)的特征向量,并计算它们的激活块;其次,对于每一个内容块计算最匹配的风格块;再次,将每个内容块与其最匹配的风格块交换;最后,重建完整的内容块得到风格化的图像结果,从而达到生成具有真实感光照纹理的汉字样本的目的。2.针对自然环境中汉字识别受图像扭曲变形影响的问题,提出了通过扩充具有不同程度扭曲变形的汉字样本的方法,来减少扭曲变形的影响。本文结合汉字识别的应用场景,对扩充具有不同程度扭曲变形的汉字样本方法进行了研究,提出了采用薄板样条变形的插值算法来生成具有扭曲变形的汉字样本图像。首先,在原图像和目标图像中采用SIFT特征匹配,得到两张图像匹配的N对特征点坐标;然后,通过薄板样条变形将原图像的N个坐标点形变到目标图像中对应位置,同时给出整个空间来实现汉字图像的形变;最后,达到生成不同程度变形和扭曲的汉字样本的目的。3.针对自然环境下汉字识别受光照和扭曲变形影响的问题,提出了通过扩充自然环境下的汉字样本的方法。本文结合汉字识别的应用场景,提出了基于风格迁移与薄板样条变形的算法,来生成更为丰富的、能够模拟自然环境下(光照、纹理、倾斜、扭曲变形)采集的具有真实纹理的汉字样本库。由于在采集汉字样本时光照阴影会随着拍摄角度的变化而变化,因此本文提出的扩充汉字样本的方法是先合成汉字纹理图像,再对汉字纹理图像变形,最终得到既具有真实感纹理又具有不同程度变形的汉字样本。采用上述算法模拟生成自然环境下的汉字图像,从而新建一个具有代表性的汉字数据集。4.采用相机采集自然环境下的汉字图像,建立一个小类别的汉字样本库。同时,采用上述算法模拟生成一个同样类别的汉字样本库,然后通过LeNet网络训练两个新建立的数据集。实验结果表明,本文提出的基于风格迁移与薄板样条的扩充汉字样本库的方法是可行的。不仅解决了自然环境下汉字样本不足的问题,同时还减少了光照和变形对自然环境下汉字识别效果的影响。

二、基于整形特征和模糊识别的手写体汉字识别(论文开题报告)

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

三、基于整形特征和模糊识别的手写体汉字识别(论文提纲范文)

(1)基于交互模式的手写体汉字采集与识别系统研究(论文提纲范文)

摘要
Abstract
第1章 绪论
    1.1 研究背景与意义
    1.2 国内外研究现状
        1.2.1 国外研究现状
        1.2.2 国内研究现状
    1.3 手写体汉字识别的难点分析
    1.4 本文研究内容
    1.5 论文结构安排
    1.6 本章小结
第2章 深度学习与卷积神经网络
    2.1 深度学习技术发展现状
        2.1.1 自动编码器
        2.1.2 受限玻尔兹曼机
    2.2 卷积神经网络
        2.2.1 卷积神经网络结构
        2.2.2 卷积神经网络优化方法
    2.3 本章小结
第3章 硬件设计与实现
    3.1 硬件设计
        3.1.1 硬件设备信息
        3.1.2 硬件设备搭建
    3.2 基于光流算法的数据采集
        3.2.1 光流算法
        3.2.2 LK光流算法原理
    3.3 本章小结
第4章 手写体汉字识别
    4.1 数据集
    4.2 图像预处理
        4.2.1 灰度化
        4.2.2 归一化
        4.2.3 二值化
        4.2.4 去噪处理
        4.2.5 形态学处理
    4.3 手写体汉字识别软件设计
        4.3.1 开发语言及开发平台
        4.3.2 PyQt5
        4.3.3 软件模块设计
        4.3.3.1 软件启动模块
        4.3.3.2 数据选择模块
        4.3.3.3 数据预处理可视化模块
        4.3.3.4 模型调用模块
        4.3.3.5 鼠标书写模块
        4.3.3.6 光斑轨迹采集模块
        4.3.3.7 识别输出模块
    4.4 本章小结
第5章 实验与分析
    5.1 网络模型
    5.2 训练模型
    5.3 手写体汉字识别系统
    5.4 本章小结
第6章 总结与展望
    6.1 总结
    6.2 展望
参考文献
致谢
作者简介
攻读硕士学位期间研究成果

(2)面向孔府古籍文档图像的文字识别研究与实现(论文提纲范文)

摘要
Abstract
第1章 绪论
    1.1 研究背景与意义
    1.2 国内外研究现状
        1.2.1 文档图像分割研究现状
        1.2.2 脱机手写体汉字识别研究现状
    1.3 主要研究内容
    1.4 论文组织结构
第2章 相关理论基础
    2.1 文档图像预处理
        2.1.1 图像去噪
        2.1.2 灰度化
        2.1.3 二值化
        2.1.4 倾斜检测与校正
        2.1.5 图像预处理评价指标
    2.2 深度学习理论
        2.2.1 卷积神经网络结构
        2.2.2 激活函数
        2.2.3 代价函数
        2.2.4 梯度下降算法
        2.2.5 Inception模块
    2.3 本章小结
第3章 古籍文档图像的预处理与分割
    3.1 引言
    3.2 古籍文档图像预处理
        3.2.1 图像去噪
        3.2.2 图像灰度化
        3.2.3 图像倾斜检测与校正
        3.2.4 图像二值化
    3.3 古籍文档图像分割
        3.3.1 单次循环投影分割算法
        3.3.2 二次循环投影分割算法
    3.4 手写体古籍汉字数据集的创建
    3.5 本章小结
第4章 基于GoogLeNet的手写体汉字识别
    4.1 引言
    4.2 手写体汉字识别模型HCCR-IncBN
        4.2.1 HCCR-IncBN模型结构
        4.2.2 基本卷积层
        4.2.3 Inception模块集
        4.2.4 全连接层
        4.2.5 滑动平均算法
        4.2.6 批量标准化算法
    4.3 实验环境与参数设置
        4.3.1 实验环境
        4.3.2 实验参数设置
    4.4 实验结果及分析
        4.4.1 脱机手写体简体汉字识别实验
        4.4.2 脱机手写体古籍汉字识别实验
    4.5 本章小结
第5章 古籍文档数字化系统
    5.1 引言
    5.2 系统需求分析
        5.2.1 系统功能性需求分析
        5.2.2 系统非功能性需求分析
    5.3 系统设计
        5.3.1 系统物理结构设计
        5.3.2 系统数据结构设计
    5.4 系统实现
        5.4.1 系统开发环境
        5.4.2 系统界面设计
    5.5 本章小结
第6章 总结与展望
    6.1 论文总结
    6.2 未来展望
参考文献
在读期间发表的学术论文及研究成果
致谢

(3)基于生成对抗网络的手写体汉字生成(论文提纲范文)

摘要
Abstract
第1章 绪论
    1.1 课题研究背景及意义
        1.1.1 研究背景
        1.1.2 研究目的及意义
    1.2 研究现状
    1.3 本文重难点
    1.4 本文的组织结构
第2章 汉字图像特征提取与特征分析
    2.1 汉字图像预处理
        2.1.1 汉字图像二值化
        2.1.2 汉字图像平滑处理
        2.1.3 汉字图像归一化
    2.2 汉字图像特征提取
        2.2.1 简单的手写汉字图像特征提取
        2.2.2 基于Gabor函数的特征提取
    2.3 汉字图像特征分析
        2.3.1 汉字笔画特征
        2.3.2 汉字拓扑结构特征
        2.3.3 汉字书写顺序特征
        2.3.4 汉字特征表征
    2.4 本章小结
第3章 基于密集级联的生成对抗网络
    3.1 生成对抗网络
        3.1.1 生成对抗网络原理
        3.1.2 生成对抗网络的学习算法
        3.1.3 经典的生成对抗网络模型
    3.2 手写体汉字生成方法
        3.2.1 传统生成方法
        3.2.2 基于深度学习的生成方法
    3.3 基于改进的Cycle GAN的手写体汉字生成
        3.3.1 基于GAN生成手写体汉字的思想
        3.3.2 改进的生成对抗网络
    3.4 本章小结
第4章 实验结果与分析
    4.1 手写体汉字生成实验
        4.1.1 实验数据及环境
        4.1.2 实验参数设置和过程
    4.2 手写汉字生成实验结果评价
        4.2.1 基于视觉的主观评价
        4.2.2 基于汉字识别的客观评价
    4.3 本章小结
结论
参考文献
致谢
攻读硕士学位期间的科研成果

(4)基于数据增强的手写体中文简答题识别方法研究(论文提纲范文)

学位论文数据集
摘要
ABSTRACT
第一章 绪论
    1.1 研究背景及意义
    1.2 相关研究现状
        1.2.1 卷积神经网络与图像识别
        1.2.2 手写体汉字识别发展现状
    1.3 本文的主要内容
    1.4 本文的组织结构
第二章 卷积神经网络和生成对抗网络方法
    2.1 卷积神经网络
        2.1.1 卷积层
        2.1.2 池化层
        2.1.3 激活函数
        2.1.4 过拟合
    2.2 生成对抗网络
    2.3 深度卷积生成对抗网络
    2.4 本章小结
第三章 手写体字符分割与数据增强技术
    3.1 字符分割技术
        3.1.1 投影法
        3.1.2 滴水算法
    3.2 数据增强技术
        3.2.1 形变类方法
        3.2.2 噪声类方法
        3.2.3 生成类方法
    3.3 本章小结
第四章 基于中文简答题的字符分割与识别方法
    4.1 多步字符分割方法
        4.1.1 问题描述
        4.1.2 方案设计
        4.1.3 实验结果与分析
    4.2 原生集识别方法
        4.2.1 数据集样本统计与归一化
        4.2.2 CNN模型设计
        4.2.3 实验结果与分析
    4.3 本章小结
第五章 基于小规模手写体汉字集的数据增强方法
    5.1 小规模手写体汉字的识别与增强方法
        5.1.1 问题描述
        5.1.2 训练规模方案设计
        5.1.3 传统数据增强方案设计
        5.1.4 实验结果与分析
    5.2 X-DCGAN数据增强方法
        5.2.1 问题描述
        5.2.2 方案设计
        5.2.3 实验结果与分析
    5.3 本章小结
第六章 总结与展望
    6.1 本文总结
    6.2 本文展望
参考文献
致谢
研究成果及发表的学术论文
作者及导师简介
附件

(5)汉语印刷和手写文本阅读中正字法邻近字启动的抑制效应(论文提纲范文)

摘要
Abstract
引言
第一部分 文献综述
    1 手写体汉字特点
    2 正字法邻近字
        2.1 拼音文字中的正字法邻近词
        2.2 汉语中的正字法邻近字
    3 正字法邻近字的相关研究
        3.1 研究范式
        3.2 拼音文字中正字法邻近词的相关研究
        3.3 汉语中正字法邻近字的相关研究
    4 正字法邻近字的相关理论
        4.1 交互激活模型
        4.2 多层次交互激活模型
    5 笔画数效应
第二部分 问题提出
    1 问题提出
    2 研究假设
    3 研究意义
        3.1 理论意义
        3.2 实践意义
第三部分 实验研究
    1 实验一:印刷体和手写体汉字识别中正字法邻近字启动的抑制效应
        1.1 研究目的
        1.2 研究方法
        1.3 研究结果
        1.4 讨论
        1.5 结论
    2 实验二:印刷和手写文本阅读中正字法邻近字启动的抑制效应
        2.1 研究目的
        2.2 研究方法
        2.3 研究结果
        2.4 讨论
        2.5 结论
第四部分 总讨论
    1 印刷体汉字中的正字法邻近字启动的抑制效应
    2 手写体汉字中的正字法邻近字启动的抑制效应
    3 印刷体和手写体汉字中的笔画数效应
    4 应用价值
第五部分 研究结论
参考文献
附录
致谢

(6)基于生成式对抗网络的汉字生成方法研究(论文提纲范文)

摘要
abstract
第一章 绪论
    1.1 研究背景与意义
        1.1.1 研究背景
        1.1.2 研究意义
    1.2 研究综述
        1.2.1 图像转换与风格迁移研究综述
        1.2.2 生成式对抗网络研究综述
        1.2.3 汉字生成与字体转换研究综述
        1.2.4 汉字识别与规范化方法研究综述
    1.3 本文研究内容及组织结构
第二章 基于HCCG-GAN的书写人风格汉字生成
    2.1 本章概述
    2.2 书写人风格汉字生成方法
        2.2.1 方法流程
        2.2.2 跳跃连接(Skip connection)
        2.2.3 损失函数
    2.3 实验结果分析
        2.3.1 汉字数据集
        2.3.2 实验细节与参数设置
        2.3.3 实验结果与分析
        2.3.4 错误分析
    2.4 实验评估
        2.4.1 图像像素差异性评估
        2.4.2 图像风格差异性评估
    2.5 本章小结
第三章 基于PCCG-GAN的手写体汉字规范化
    3.1 本章概述
    3.2 手写汉字规范化方法
        3.2.1 方法流程
        3.2.2 网络结构
        3.2.3 损失函数
        3.2.4 拟采用数据集
    3.3 实验结果分析
        3.3.1 汉字数据集
        3.3.2 训练细节与参数设置
        3.3.3 实验结果与分析
        3.3.4 错误分析
    3.4 实验评估
        3.4.1 图像像素差异性评估
        3.4.2 文字识别准确率评估
    3.5 本章小结
第四章 汉字生成系统设计与实现
    4.1 本章概述
    4.2 系统设计
    4.3 结果展示
    4.4 本章小结
第五章 总结与展望
    5.1 工作总结
    5.2 未来展望
参考文献
致谢

(7)面向机械臂书写的手写体汉字书法美化方法研究(论文提纲范文)

摘要
ABSTRACT
第一章 绪论
    1.1 研究背景
    1.2 研究意义
    1.3 国内外研究现状
        1.3.1 汉字笔画提取与识别研究现状
        1.3.2 手写体汉字变形美化
        1.3.3 机械臂书写
        1.3.4 存在问题
    1.4 研究内容
    1.5 研究方法及技术路线
        1.5.1 研究方法
        1.5.2 技术路线
    1.6 本文结构组织
第二章 交互式手写汉字采集与笔画识别方法
    2.1 手写汉字提取方法的问题分析
    2.2 手写汉字提取方法
    2.3 手写笔画识别
        2.3.1 卷积神经网络
        2.3.2 手写笔画分类的CNN模型
    2.4 本章小结
第三章 面向机械臂书写的手写汉字楷书风格美化
    3.1 构建书法笔画库
        3.1.1 获取楷书笔画信息
        3.1.2 标准楷书笔画书写
        3.1.3 标准楷书笔画库
    3.2 手写汉字美化
        3.2.1 手写美化问题描述
        3.2.2 本文研究思路
        3.2.3 笔画全局优化模型
    3.3 权重参数对优化结果的影响
        3.3.1 参数调整
        3.3.2 参数选择
    3.4 本章小结
第四章 机械臂毛笔字书写控制方法
    4.1 机械臂关节与运动控制系统
        4.1.1 机械臂关节
        4.1.2 机械臂运动控制
    4.2 机械臂书写方法研究
        4.2.1 书法撰写技巧研究
        4.2.2 笔画轨迹点高度控制算法
        4.2.3 笔画风格增强
    4.3 机械臂撰写书法实验结果与分析
    4.4 本章小结
第五章 机械臂书法撰写结果与评价
    5.1 评价模型
    5.2 数字书法生成方法与评价
        5.2.1 数字法生成模型
        5.2.2 书法模拟结果
        5.2.3 相似性度量
    5.3 用户调研结果与分析
    5.4 本章小结
第六章 结论
    6.1 结论
    6.2 创新点
    6.3 展望
参考文献
致谢
个人简历

(8)基于PSO与BP神经网络的脱机手写体汉字识别(论文提纲范文)

摘要
Abstract
1 绪论
    1.1 选题的背景和意义
    1.2 脱机手写体汉字识别的发展历程和现状
    1.3 本文主要研究内容与组织结构
2 脱机手写体汉字识别流程
    2.1 汉字图像获取和预处理
    2.2 特征提取
    2.3 识别分类器
    2.4 本章小结
3 PSO优化BP神经网络的分类器算法
    3.1 人工神经网络算法
    3.2 BP神经网络算法
    3.3 PSO算法
    3.4 PSO-BPNN算法
    3.5 本章小结
4 基于PSO-BPNN算法的脱机手写体汉字识别的仿真和分析
    4.1 实验环境和数据源
    4.2 手写体汉字识别实验的设计分析
    4.3 BPNN优化前后的识别效果比较
    4.4 本章小结
5 总结与展望
    5.1 总结
    5.2 未来的展望
参考文献
作者简历
致谢
学位论文数据集

(9)基于反馈知识迁移的脱机手写体汉字识别(论文提纲范文)

致谢
摘要
abstract
第一章 绪论
    1.1 课题背景
    1.2 脱机手写体汉字识别难点
    1.3 国内外研究现状分析
        1.3.1 脱机手写体汉字识别传统方法研究现状
        1.3.2 脱机手写体汉字识别深度模型方法研究现状
    1.4 本文工作安排
        1.4.1 课题的主要研究内容
        1.4.2 本文章节安排
    1.5 本章小结
第二章 脱机手写体汉字样本分割
    2.1 脱机手写体汉字识别关键技术详述
        2.1.1 影响脱机手体汉字识别率的因素分析
        2.1.2 脱机手写体汉字识别经典算法分析
    2.2 分割脱机手体汉字的原理分析
        2.2.1 分割法克服脱机手写体汉字部件位置关系对网络训练的影响
        2.2.2 分割法克服脱机手写体汉字部件黏连对网络训练的影响
    2.3 脱机手体汉字样本分割算法
    2.4 本章小结
第三章 知识迁移算法训练分割后的汉字样本
    3.1 知识迁移理论概述
        3.1.1 知识迁移的作用与意义
        3.1.2 知识迁移的相关理论研究
        3.1.3 卷积神经网络模型的知识迁移算法
    3.2 利用知识迁移完成分割后各汉字部件的训练
    3.3 知识迁移克服梯度弥散以及过拟合现象原理简述
        3.3.1 梯度弥散现象与过拟合现象简介
        3.3.2 知识迁移克服梯度弥散与过拟合现象原理
    3.4 本章小结
第四章 反馈知识迁移训练脱机手写体汉字识别网络
    4.1 反馈结构优化脱机手写体汉字识别网络
    4.2 反馈网络结构
        4.2.1 反馈网络结构网络模块分析
        4.2.2 反馈网络结构示意图
    4.3 网络识别置信度
    4.4 反馈机制
    4.5 本章小结
第五章 实验与结果分析
    5.1 经典卷积神经网络模型分析
        5.1.1 LeNet-5 网络模型
        5.1.2 GoogleNet网络模型
        5.1.3 ResNet网络模型
    5.2 卷积神经网络模型的构造及结构分解
        5.2.1 基于Le Net-5 网络模型的设计与分解
        5.2.2 基于GoogleNet网络模型的设计与分解
        5.2.3 基于Res Net网络模型的设计与分解
    5.3 反馈知识迁移算法训练脱机手写体汉字识别网络
    5.4 实验结果分析
        5.4.1 仿真实验
        5.4.2 结果分析
    5.5 本章小结
第六章 总结与展望
    6.1 总结
    6.2 展望
参考文献
攻读硕士学位期间的学术活动及成果情况

(10)基于风格迁移与薄板样条变形的扩充汉字样本库的算法研究(论文提纲范文)

摘要
abstract
第1章 绪论
    1.1 课题研究背景及其意义
    1.2 研究现状
        1.2.1 扩充汉字样本库的研究现状
        1.2.2 汉字识别的研究现状
    1.3 收集汉字样本与汉字识别存在的主要问题
        1.3.1 收集汉字样本存在的主要问题
        1.3.2 汉字识别存在的主要问题
    1.4 论文的主要研究内容及章节安排
第2章 扩充光照纹理汉字样本的方法
    2.1 扩充光照样本方法的研究
    2.2 基于风格迁移的纹理合成方法
        2.2.1 风格迁移的实现过程
        2.2.2 风格迁移的并行实现
        2.2.3 网络优化方法
    2.3 本章小结
第3章 扩充扭曲变形汉字样本的方法
    3.1 扩充扭曲变形样本方法的研究
        3.1.1 弹性变换算法
        3.1.2 波纹扭曲算法
        3.1.3 余弦整形算法
    3.2 基于薄板样条函数的图像变形方法
        3.2.1 插值算法
        3.2.2 SIFT特征点匹配
        3.2.3 薄板样条变形原理
    3.3 本章小结
第4章 扩充汉字样本与汉字识别的方法
    4.1 基于风格迁移和薄板样条的扩充汉字样本方法
        4.1.1 基于风格迁移和薄板样条的扩充汉字样本方法原理
        4.1.2 基于风格迁移和薄板样条的扩充汉字样本方法流程
    4.2 汉字识别方法的研究
        4.2.1 光学字符识别方法
        4.2.2 基于模板匹配的识别方法
        4.2.3 基于深度学习网络的识别方法
    4.3 本章小结
第5章 扩充汉字样本方法实验结果与分析
    5.1 实验环境及数据
    5.2 扩充汉字样本的实验结果分析
        5.2.1 图像风格迁移实验结果与分析
        5.2.2 薄板样条函数实验结果与分析
        5.2.3 特征点匹配实验结果与分析
        5.2.4 扩充汉字样本实验结果与分析
    5.3 扩充汉字样本库的训练实验结果分析
    5.4 本章小结
第6章 结论与展望
    6.1 研究内容总结
    6.2 将来工作展望
参考文献
致谢
攻读学位期间参加的科研项目和成果

四、基于整形特征和模糊识别的手写体汉字识别(论文参考文献)

  • [1]基于交互模式的手写体汉字采集与识别系统研究[D]. 王磊. 长春大学, 2021(02)
  • [2]面向孔府古籍文档图像的文字识别研究与实现[D]. 侯杰. 曲阜师范大学, 2021(02)
  • [3]基于生成对抗网络的手写体汉字生成[D]. 张东东. 黑龙江大学, 2020(04)
  • [4]基于数据增强的手写体中文简答题识别方法研究[D]. 沈强. 北京化工大学, 2020(02)
  • [5]汉语印刷和手写文本阅读中正字法邻近字启动的抑制效应[D]. 于慧婧. 天津师范大学, 2020(08)
  • [6]基于生成式对抗网络的汉字生成方法研究[D]. 张红蕊. 天津师范大学, 2020(08)
  • [7]面向机械臂书写的手写体汉字书法美化方法研究[D]. 张馨月. 西北农林科技大学, 2020(02)
  • [8]基于PSO与BP神经网络的脱机手写体汉字识别[D]. 岳中彤. 山东科技大学, 2019(05)
  • [9]基于反馈知识迁移的脱机手写体汉字识别[D]. 沈飞. 合肥工业大学, 2019(01)
  • [10]基于风格迁移与薄板样条变形的扩充汉字样本库的算法研究[D]. 王亚蒙. 浙江工业大学, 2019(07)

标签:;  ;  ;  ;  

基于形状特征和模糊识别的手写汉字识别
下载Doc文档

猜你喜欢