一、A buffer planning algorithm for chip-level floorplanning(论文文献综述)
许凯[1](2020)在《基于哈希的高通量生物基因测序数据处理算法优化》文中研究说明近年来,随着生命科学技术不断发展,特别是在高通量测序技术(通常称为下一代测序,Next Generation Sequencing,NGS)的飞速发展推动下,生命科学中生成的数据量大大增加,基因组测序项目的数量和测序数据的数量急剧增加。高通量测序数据在飞速增加,但处理器的性能提升速度却逐年放缓,甚至接近停滞,单个处理器的性能已经难以进一步扩展。在2015年,由于提升芯片频率等方法会进一步加大芯片的散热问题,同时,指令级的流水和并行也出现了巨大的局限性和低效性,各种微体系结构的改进已经达到瓶颈,处理器性能的提升现在每年只有3.5%,平均20年提升一倍,摩尔定律在芯片领域几乎已经失效。因此学者们开启了多核和异构体系结构的研究,不需要改变程序的算法和实现仅仅依靠芯片性能提升从而使程序性能获得大幅度改善已经变得越来越困难,“免费午餐”的时代已经过去。因此,一方面生命科学高通量测序数据一直在急剧增加,另一方面近年来计算性能的提升主要集中在新兴体系结构的发展,因此在新的体系结构上如何处理高通量测序数据是急切需要解决的问题。基因纠错和基因比对是高通量测序数据处理中前期的两个步骤,纠错和比对在同构CPU上的研究已经有很多,但是针对异构架构处理器的研究和针对大规模数据集的处理研究相对较少。如何在基础的算法上进行改进使得计算量减少,如何针对新兴的异构体系架构进行针对性的设计以适应不同架构处理器的特点,如何进行分布式的实现以针对大规模的数据集,都是需要解决的问题。本文的工作主要针对以上问题,围绕DNA测序数据处理过程中的基因纠错和序列比对在Intel多核和众核架构以及国产自主设计的处理器SW26010等体系结构上的算法设计和针对性实现进行研究。本文的主要研究成果如下所述:1)本文提出了一种可扩展的并行纠错算法SPECTR,旨在提高各种Intel并行平台上Illumina DNA短序列进行纠错时的吞吐量。SPECTR的实现基于k-谱方法,针对Intel多核和众核架构以及异构计算集群采用了许多针对性的优化。本文针对SPECTR中的一个关键操作Bloom过滤器的查询进行了优化,对数据重新布局,加快了查询速度,对查询工作中的共同操作,抽象出查询中向量化需要的一般操作,实现了 Bloom过滤器查询操作的异构计算框架。在纠错过程中,本文设计了一个基于堆栈迭代的方法来取代在异构架构上性能较低的递归操作。在单个设备内,本文使用OpenMP的动态任务划分实现了负载均衡。针对单个节点的多个设备,本文设计了数据的分发框架,实现了不同设备间的负载均衡。针对多个节点,本文设计了分布式实现。实验表明,与在CPU上的多线程原始实现相比,优化后的实现在不同设备中加速了 2.8到9.3倍。与其他基因纠错工具相比,在相同的硬件上执行时,SPECTR的速度可提高1.7到6.4倍。在天河二号超级计算机的32个节点上执行时,实现了约86%的并行效率。2)针对基因比对,本文在神威·太湖之光及其申威体系架构SW26010上设计实现了一种高度可扩展的序列比对算法S-Aligner。为解决序列比对算法中的内存瓶颈和计算瓶颈,S-Aligner设计采用了三层并行级别:(1)使用MPI基于任务网格模式进行节点间并行计算;(2)使用多线程和异步数据传输来实现节点内并行处理,将需要计算的数据进行分块实现了不同计算核心之间的负载均衡,充分利用了 SW26010多核处理器的所有260核,以及(3)向量化了基因比对中计算编辑距离的Myers算法,充分利用了可用的256位SIMD向量寄存器。在文件I/O期间,本文采用异步访问模式和数据共享策略以克服网络文件系统的带宽限制。性能评估表明,S-Aligner几乎可以线性扩展,在太湖之光上的13,312个节点上实现了 95%的并行效率。S-Aligner在具有很高准确度的同时,在单个节点上的性能优于在Intel CPU平台上运行的序列比对工具RazerS3。3)在对S-Aligner进行分析之后,本文设计了一个新的可扩展且高效的基因比对算法SWMapper。为了减少内存的使用和加速索引的构建,SWMap-per使用了一个精简哈希索引,设计并实现了一个分布式索引构建方法。在进行比对时,提出了一种新的过滤算法,将基因序列分解为长种子和短种子,使用短种子查找到候选匹配位置后,利用长种子进行过滤减少需要计算的候选位置数。为了去除候选匹配位置中的重复,设计使用了一个最小堆数据结构进行排序删除重复位置。在对基因序列和参考基因子序列进行编辑距离的计算时,设计实现了带状Myers(Baned Myers)算法的向量化,使用SW26010的一条三元逻辑指令替换多条逻辑指令,减少了计算指令数。本文针对多个计算核心设计了动态调度策略来实现负载均衡,针对多个节点,本文设计了分布式实现。性能评估表明,在单个SW26010上,SWMapper的性能优于在相同硬件上的S-Aligner 6.2倍。与运行在Intel CPU上的其他比对算法相比,SWMapper实现了 2.6到26.5倍的加速。在128个计算核组上运行时,SWMappcr实现了 74%的强扩展效率。
王月鹏[2](2020)在《自主路径规划的无人船水质采样系统研究》文中研究指明无人船(Unmanned surface vehicle,USV)广泛应用于水质监测,根据水质监测需求,无人船需满足多点采水路径自主规划。然而,传统无人船路径规划算法在多目标点规划时存在障碍物约束及水域环境建模限制等局限。针对这种问题,本文基于改进的快速扩展随机树算法(RRT),设计了一种自主路径规划的无人船水质采样系统,并运用Dijkstra算法优化采水路径。通过对无人船水质采样系统模块化设计,实现无人船多点采水路径自主规划,经过实验验证,系统能按照预期实现多点采水功能。本文主要研究内容如下:(1)无人船水质采样系统方案设计。针对多目标点的自主采水功能需求,设计包含船载控制系统、采水控制系统和陆基控制系统三个子系统的无人船水质采样系统方案。(2)基于改进RRT的多目标点采水路径规划算法设计。考虑多点采水路径规划有避障和采水两种约束,本文基于改进的RRT算法实现多点采水路径自主规划,并运用Dijkstra算法优化采水路径,实现无人船多点采水路径生成与优化。(3)无人船水质采样系统软硬件平台设计。在算法设计基础上,对无人船水质采样系统进行模块化设计,分为船载控制、采水控制和陆基控制三个子系统进行无人船水质采样系统的软硬件设计。(4)实验验证。在搭建无人船水质采样系统基础上,在江苏某水域进行无人船航行、采水等功能测试及多点采水路径规划算法验证。实验表明,无人船水质采样系统能按预期实现多点采水,进而验证了系统的稳定性。
赵睿[3](2020)在《具备协同搬运功能的多AGV调度系统研发》文中研究表明AGV(Automated Guided Vehicle,AGV)系统作为一种现代化物流输送系统,得到了广泛的应用。然而,随着应用范围的不断扩大,单台AGV搬运的模式也显示出其局限性,针对重载、大件物料的搬运,迫切需要具有多AGV协同搬运功能的AGV系统,以此来提高其搬运能力和AGV的工作效率。因此,本文以具有协同搬运功能的多AGV系统为研究对象,重点研究与其相关的动态调度技术。首先,本文在综述国内外相关技术研究的基础上,探讨了具有多AGV协同搬运功能的AGV系统的特点,并结合协同搬运调度的特殊性完成了基于集中分层式体系结构的AGV调度控制系统的总体架构的设计。其次,由于多AGV系统在执行协同搬运任务前,多台AGV需要完成集结组队的工作。因此,本文以集结总时间最短为优化目标,提出了一种带时间窗的基于遗传算法的AGV集结路径规划方法。通过在遗传算法中加入基于时间窗的调整策略,有效地减少了冲突以及死锁发生的概率,加快求解的收敛速度,可以在较短时间内求解出集结总时间最短的路径。同时,针对协同搬运任务执行过程中可能产生的四种路径冲突,给出了具体的解决方案。然后,针对多AGV调度系统中既有单车搬运,又有多车协同搬运的特点,本文提出一种基于位置适应度的多种类任务分配方法,该方法以任务绑定为基础,在任务待执行阶段进行任务分配优化,通过搜索匹配的协同搬运任务,提高AGV系统整体执行效率。并通过仿真实验验证了该方法的有效性。在完成前述研究工作的基础上,进行了具有协同搬运能力的多AGV调度原型系统的开发,并通过实际试验,验证了原型系统的可行性和有效性。最后,对本文的研究工作进行了总结,并对进一步的研究进行了展望。
李友铖[4](2019)在《智能输配料AGV控制系统开发及关键技术研究》文中认为本课题源于四川省科技支撑计划项目“酱腌食品智能灌装系统共性关键技术研究与示范”(2016NZ0077),旨在设计实现用于吉香居食品有限公司酱腌食品灌装产线上作为物料输配的AGV的控制系统。该AGV完成了自身装料、充电、灌装机加料等过程的自动化控制以及过程中的异常监测与处理,此外还具有手动操作功能。本文首先对AGV的国内外发展现状以及其领域内的研究内容进行了概述,然后对灌装系统的整体方案设计进行了阐述,从中引出AGV子系统的工作职能。随后根据AGV工作需求完成了输配料AGV各个模块的方案设计,确定了磁导航的引导方式、路径方案、输配料方案、自动充电方案以及避障方案等。然后本文在对AGV环境地图建模方法、图论以及模糊控制等相关理论研究的基础上,解决了适用于本系统的磁导航式AGV控制系统在其应用上的关键技术问题。本文提出了一种在拓扑地图模型下AGV的路径表示以及任务执行的解决方案,该方案采用RFID标识生产现场拓扑地图中的节点,并且使用本文提出的一种改进的基于有向图的地图建模方法,该方法通过给有向图中的顶点连通性以及边的权值赋予新的意义,保证了AGV工序的正确执行以及图中最短路径与任务执行时间最优的路径之间的等价性,最后采用了Dijkstra最短路径算法进行了最优路径的查找。对于拓扑地图中节点与节点之间的循迹行驶问题,本文在对所使用的AGV叉车运动学模型建模的基础上,将传统PID控制算法与模糊逻辑结合起来,对比例环节采用了模糊自适应的控制,积分环节采用分离式积分控制器,使得AGV循迹过程中能适应速度的变化,减小了超调量,从而保证循迹过程的平稳性。在有了AGV控制系统的整体设计方案以及关键问题的解决方案后,本文对AGV嵌入式控制系统的具体设计与实现进行了阐述,包括基于英飞凌的XMC4000系列MCU的AGV嵌入式主从控制器硬件部分以及在此硬件平台上的基于CMSISRTOS多任务软件部分。最后,通过现场调试,验证了AGV控制系统的全部方案。在采用AGV自动搬运及输送物料取代原有的人工作业后,灌装产线的生产效率、安全性、信息化程度等多方面指标都有了提升。
吴欣舟[5](2019)在《三维片上系统测试时间及成本的优化方法研究》文中研究指明随着21世纪集成电路制造产业取得巨大突破,三维集成技术成为引领行业延续摩尔定律的重要技术。相比传统二维芯片,三维芯片拥有更高的集成度、更具多样性的功能,芯片测试环节也将面临巨大挑战。优化测试过程的核心问题是控制测试成本,本文针对三维片上系统(system on chip,SoC)绑定中测试阶段提出了两种优化策略,主要工作如下:提出了一种在功耗及测试并行性约束下,三维片上系统绑定中测试阶段并行测试的优化策略,通过最大限度地利用测试访问机制(test access mechanism,TAM)资源,大大减少了测试时间,降低了测试成本。在三维片上系统的测试过程中系统TAM资源十分有限,通过设计相应的测试外壳(test wrapper)结构,对系统当前状态下空闲的TAM资源与待测芯核内部扫描链进行重新分配,使待调度的芯核提前进入测试阶段,减少了并行测试过程中的空闲时间块,在该结构基础上调整各芯核调度顺序,使测试过程满足各项约束条件。在ITC’02电路上的实验结果表明,在同样的功耗约束及测试并行性约束条件下,该方法与现有方法相比更有效地降低了测试时间。提出了一种协同考虑芯核分层布图策略以及TSV绑定成本的三维片上系统测试成本模型,在合理分布芯核的基础上,对TSV的布局进行优化,使测试总成本大大降低。在三维片上系统扫描链设计阶段,根据各个芯核内部扫描链长短,采用模拟退火算法将芯核合理分配至各层晶片,保证每层电路扫描链长度相近,而不同的芯核布图方式将影响TSV数量及布局,本文利用最短路径算法求出TSV的最优布图,在提出的新的测试成本模型下,协同考虑测试时间及TSV绑定成本等因素,从而降低三维片上系统测试总成本。在ITC’02电路上的实验结果表明,相比传统的芯核分层布图方法,本文测试模型考量因素更全面,测试总成本有显着降低。
谢策[6](2019)在《基于交通云的城市无人车协同调度机制研究及实现》文中研究指明随着智能驾驶技术、车联网络以及人工智能、大数据、云计算等新兴技术的快速发展,无人驾驶车辆(简称:无人车)的行为协同日益呈现出车-路-云融合的多维度自主化协同发展趋势。在车辆服务属性多元、协同过程复杂的城市域典型场景中,基于云端大数据和协同服务的广域无人车车流协同管理机制成为协作式智能交通系统(Cooperative ITS,C-ITS)领域中亟待重点研究的关键问题。论文依托国家自然科学基金面上项目和中央高校基金课题从模型、机制、仿真软件的等方面开展研究工作,所取得研究进展简要阐述如下。在深入分析城市-服务域中多无人车行为协同的基础上,基于课题组已有研究对无人车的物理模型和运动状态模型进行了扩展,进而研究并建立了城市路网模型,该模型包括道路模型、路口模型、拓扑关系等。在分析研究了云计算体系之后建立了交通云模型,并针对智能交通系统中无人车、交通云、路网之间如何通信设计了车-路-云的三者交互模型。针对无人车行驶路径的全局优化规划问题,论文中修改并设计了BPR路网权值模型、平均速度路网权值模型等对道路网络的权值进行估算。在分析、选中经典的Dijkstra路径规划算法之后论文中基于所建立的道路网络权值模型设计了静态无人车自主路径规划算法,以及交通云端的动态全局路径规划算法。依照模型驱动的仿真验证思路,给出了Windows平台车-路-云融合的服务域多无人车协同仿真软件v1.0设计机制。该软件使用面向对象方法进行设计,以图形化的方式显示实验参数、交通网络、路口策略。同时,软件中采用了基于多计算核的线程池机制,以并行计算的方式有效提高了仿真效率。基于该仿真软件,通过设定实验参数,在多个交通场景下进行实验,对所提出的模型、方法、策略等进行了全面验证。实验结果表明,本文所设计的车-路-云协同模型、道路网络权值模型等可有效表征城市域中的交通变化,所提出的全局路径规划算法可提升车流的通行效率。总体上,本文密切结合未来城市-服务域协作式智能交通系统的实际应用场景,所研究模型、方法、机制以及仿真软件对于新型智能交通系统的研究具有实际应用价值。同时,所研究方法以及研究中所采取的思路对于多智能航空器/航天器、多仓储机器人等群智能系统的研究也具有实际意义和参考价值。
陈旭[7](2018)在《基三多核架构中片上网络系统若干关键技术研究》文中认为随着集成电路制造工艺和体系结构设计水平的不断提高,芯片已进入多核时代。然而,伴随着芯片上的集成度越来越高,特征尺寸的持续缩小加剧了互连线延迟对系统性能的影响,使得片上互连网络成为制约多核处理器系统性能提升的主要瓶颈。如何解决多核处理器中片上网络系统所面临的延迟大、带宽低、功耗高等问题,是多核时代面临的严峻挑战之一。基三多核架构(Triplet-based Architecture,简称TriBA)是本人所在课题组提出的一种新颖的从底层支持面向对象技术的多核处理器体系结构。本文在基三多核架构的背景下,对基三多核架构中片上网络系统相关的关键技术进行了深入研究和探讨,分别从路由算法、路由器结构和布局布线设计等方面进行了相关研究工作。本文的研究内容和研究成果主要包括:(1)提出一种面向TriBA互连网络的最短路径路由算法SPR4T。该算法采用分布式路由策略,仅根据当前节点以及目标节点的二进制编码就能计算出两节点间的最短路径,这样二进制的计算方式大大降低了计算复杂度。此外,SPR4T算法采用了新的编码系统,该编码系统所用到的字符集合与群论中人们所熟知的S3群具有相同的含义。本文证明了TriBA拓扑对于S3变换具有对称性,因此利用S3群所含元素的循环置换特性对路由算法进行了简化。实验结果表明,相比于DDRA算法和SPORT算法,SPR4T算法具有更小的通信延迟以及更高的吞吐量。(2)提出一种面向TriBA互连网络的路由器结构LA-Router。LA-Router采用前瞻路由技术、最小化缓存策略、分段式交叉开关以及基于注入控制的流控策略等四种技术对通用路由器结构进行改进。其中,前瞻路由技术能够在几乎不增加计算逻辑的条件下有效缩短流水线的关键路径,从而有利于减少路由器的传输延迟;最小化缓存策略能够有效减少缓存使用量,从而有利于降低路由器的功耗和面积;分段式交叉开关只利用最小化的电路部分完成数据的转发,能够有效降低路由器的功耗;基于注入控制的流控策略在一定程度上缓解了网络拥塞,从而有利于降低通信延迟。实验结果表明,相比于通用路由器结构,LA-Router不仅可以有效地降低TriBA互连网络的通信延迟和功耗,而且还有助于提高网络的吞吐量。(3)提出一种面向TriBA互连网络的动态快速虚通道技术。快速虚通道的构建需要路由机制的决策支持,目前大多数有关快速虚通道的设计主要是基于维序路由提出的,然而,维序路由并不适用于TriBA互连网络。为了将快速虚通道技术引入TriBA互连网络中,本文提出了一种适用于TriBA互连网络的维度判断模型,并且在此基础上设计了FSP侦测机制为构建快速虚通道提供决策支持。实验结果表明,相比于普通TriBA互连网络,使用快速虚通道技术的TriBA互连网络拥有更低的延迟和功耗,并且具有更高的吞吐量。(4)提出一种Tile化的布局布线方案解决TriBA混合片上网络的布局布线问题。针对片上网络的流量特点,本课题组提出了一种TriBA混合片上网络,该网络包括两个子网:核间通信子网和片上存储子网。针对TriBA混合片上网络的布局布线问题,本文采用Tile布局方式和曼哈顿布线结构实现了两个子网络的融合布局。实验结果表明,本文提出的双网融合的布局布线设计方案是可行的。更重要的是,相比于单TriBA网络,TriBA混合片上网络在平均网络时延、吞吐量以及功耗等性能方面具有明显优势。
王宇[8](2012)在《多轴机械手控制系统的研究与开发》文中研究说明随着自动化生产进程的推进以及对自动控制系统研究的深入,再加上近年用工荒的问题日益严重,对工业生产机械手的研究和应用必将成为今后的趋势,其中多轴机械手灵活度高,能灵活完成多道工序,它的应用必将会节省大量人力劳动,同时也能提高生产效率,进而提升企业的核心竞争力。为了提高多轴机械手在作业过程中的准确度和速度,同时提升其灵活性,本文在分析国内外机械手作业和机械手控制系统设计难点的基础上,并结合实际考察,主要针对多轴机械手多点定点作业时的路径规划问题,对已知阻隔物进行避让问题,连续小直线段路径中速度反复回零的问题以及多轴机械手控制系统中人机交互界面设计等问题进行了细致的研究,取得的成果如下:1、通过对多轴机械手控制系统整体架构的分析,采用两块STM32系列芯片分别实现显示和运动控制功能,并结合轨迹规划和速度控制算法提升机械手性能的方案。2、研究了Bezier曲线和B样条曲线算法,针对多点定点快速运动提出了基于反算控制点的B样条自适应算法,通过仿真实验结果证明了算法的有效性。3、提出了三点圆弧算法以及特征点求值算法,在实现对已知阻隔避让的同时保证路径的平滑连续性。4、设计了多段预处理速度规划算法,并与直线加减速控制相结合作为机械手的速度控制策略,解决了多段小直线段路径中反复回零速度的问题,通过仿真验证了算法有效性。5、设计并完成了基于STM32系列主控芯片和迪文人机界面交互模组的多轴机械手控制系统,详细介绍了系统主要硬件电路,数据传输格式及解析,系统软件的实现以及人机交互界面设计。6、对研究工作总结,提出有待改进的内容。
夏飞[9](2011)在《生物序列分析算法硬件加速器关键技术研究》文中研究指明生物序列分析是现代生命科学领域重要的基础性研究工作,由于该领域应用的广泛性、程序特征的复杂性以及海量数据特征对计算机性能提出越来越高的要求,迫切需要高性能计算的支持。现有的基于CPU和GPU的通用计算平台虽然能够提供很强的峰值计算能力,但是不能在运算粒度、存储调度、计算适应度方面主动拟合应用的特点,难以应对生物序列分析领域细粒度的位级操作和不规则的计算、存储需求,实际应用效率低。近年来,FPGA器件以其可编程特性、细粒度并行能力、丰富的计算资源、灵活的算法适应性、低硬件代价和高性能功耗比成为理想的定制计算平台。本文针对生物序列分析应用在通用计算平台上并行性能不高的问题,基于通用微处理器结合FPGA可重构算法加速器的异构体系结构,研究了该领域典型计算方法的细粒度并行化问题。以存储优化为核心,集中解决了可重构算法加速器设计中面临的若干技术难点,构建了面向序列分析应用的动态可重构原型系统,实现了对典型生物信息序列分析过程的定制计算,达到了提高特定应用性能和降低系统功耗的双重目标。本文取得的重要研究成果如下:1.针对不同领域动态规划算法的数据相关性和存储访问特征,基于FPGA平台提出了资源受限条件下的数据相关性转换、负载平衡的任务划分和存储调度策略,设计了并行计算结构,对典型算法实现细粒度并行。具体包括:针对回溯条件下序列比对过程存储需求膨胀的问题,提出了节省存储需求的细粒度并行算法,采用区域划分和计算策略解决了长序列比对面临的FPGA片内逻辑和存储资源受限问题;利用二维串行动态规划问题具有的固定数据依赖和矩阵反对角线元素不存在数据相关的特点,提出基于同构线性阵列对矩阵反对角线元素实现并行计算的方法和加速器结构模板;采用等值罚分和仿射罚分模型分别实现了无回溯、片内回溯和片外回溯三种序列比对设计方案,比较全面地解决了序列比对应用的硬件加速问题。针对RNA二级结构预测领域三维非串行动态规划算法中变化的数据相关距离、不规则计算和非连续存储问题,提出了一系列提高存储效率的优化措施:通过重组单元计算顺序提高数据局部性,通过数据重用减少片外存储访问开销,通过数据预取和缓存、同步点写回等措施隐藏片外访问延迟,实现计算和通信的平衡;利用反对角线元素计算量相等且不存在数据依赖的特点,提出了细粒度并行算法和基于主从多处理单元的加速器设计模板;利用列元素计算量之差只与列坐标相关的特点,采用“区域分割”和“按列轮转划分”的层次化任务分配策略实现处理单元间的负载均衡;基于加速器设计模版,在国际上首次实现了对Zuker、RNAalifold和CYK三种典型算法的硬件加速,取得了10倍以上的加速效果。针对带假结RNA结构预测领域的四维动态规划算法中复杂数据相关性和存储带宽受限的问题,提出了“时空域重叠”的数据相关性分析方法;通过对访存请求的动态调度减少片外存储访问的随机性,降低了50%的存储带宽需求;采用基于多处理单元的异构线性阵列结构,实现了对四维动态规划矩阵的细粒度并行计算,相对于通用计算平台取得了35倍的加速效果。2.针对启发式序列数据库搜索算法中存在的种子检测效率不高的问题,提出一种不基于常规查询策略的并行多种子检测算法和基于线性结构的并行多种子搜索阵列;采用阵列分组和并行种子收集、组内种子合并和多种子并行扩展策略实现了无阻塞的数据库搜索,成功对BLAST数据库搜索算法实现硬件加速。3.针对基于HMM模型的随机搜索过程中紧耦合的数据相关导致矩阵元素无法并行计算的问题,提出粗细粒度混合的HMM模型并行计算方法,即对单个元素内部状态的计算实现细粒度并行,对“模型—序列”间的匹配过程实现粗粒度并行。与目前最好的硬件加速方案相比,单PE的计算性能提升了30%;与运行在通用计算平台上的搜索程序相比,可获得接近200倍的全局加速效果。4.以蛋白质结构预测为应用背景,提出了贝叶斯网络模型的细粒度并行方法和计算结构。针对模型的串行结构和不同处理阶段负载不匹配的问题,提出了多阶段混合流水处理策略和细粒度并行计算结构,采用关键流水段复制实现了流水线负载平衡;针对模型参数的共享访问竞争和地址间隔访问的特点,采用参数表分割、复制和传递策略提高参数访问效率,首次对基于贝叶斯统计和网络模型的蛋白质结构预测应用成功实现硬件加速。5.以大容量FPGA芯片和SDRAM存储器为基础设计了硬件算法加速器,与通用微处理器结合构建了基于异构体系结构的序列分析原型系统,并开发了序列分析应用程序集和FPGA配置文件库,采用FPGA动态全局重构技术实现了不同应用间的快速切换,提高了原型系统对应用程序的适应性,达到了对生物序列分析典型应用的整体加速效果。研究结果表明,本文提出的通用微处理器结合可重构FPGA算法加速器的异构计算平台对生物序列分析应用具有显着的加速效果,并能实现提高计算性能和降低系统功耗的双重目标。
黄锋[10](2008)在《面向微处理器系统结构的布图规划算法研究》文中进行了进一步梳理集成电路技术的发展已经进入了超深亚微米工艺的时代,微处理器系统结构也随之面临着巨大的挑战。由于系统结构的设计涉及多方面的设计因素,因此其设计问题的解空间随着系统的设计复杂度而急剧增加。作为布图设计的最初阶段,布图规划和模块布局的质量对于芯片的性能有着显着的影响。高效的布图规划和布局算法对布图设计的许多方面都是十分重要的。本文针对微处理器的布图规划优化问题,以优化系统性能和片上温度为主要目标,提出了完整的设计流程,取得了以下成果:·针对芯片温度这一重要因素,通过阅读、追踪大量文献,深入了解、研究当前国际国内的最新发展成果,对集成电路设计中热问题研究现状进行了综述,并结合实际对现代优化算法有了较深的领悟。·在Hotspot的基础上,提出了一个精简的互连时延周期估计模型,并结合互连时延周期对性能的影响,提出了同时优化性能和热效应的布局算法,得到的布局结构更加合理,芯片最高温度有明显的降低,系统性能得到了进一步改善。·针对多目标优化问题中各个分目标间的矛盾性,根据互连时延周期与互连时延的差异,提出了三种能进一步降低芯片最高温度的智能策略,并在此基础上提出了一个二阶段优化的布局算法框架,与第一阶段布局结果比较,最高温度能再降低4℃以上,而系统性能没有受到影响。本文的研究将布图规划算法应用到微处理器系统设计中,为微处理器体系结构设计提供了物理设计验证工具以及设计指导,在布图规划算法,布图规划设计以及面向微处理器性能优化的布图规划设计等方面都取得了一定的成果,为面向微处理器系统结构的物理设计开辟了崭新的研究领域。由于物理设计和微处理器体系结构设计内容广泛,优化问题多样性,还有很多值得研究和探讨的课题,能够结合集成电路工艺发展推动整个微处理器设计的发展。
二、A buffer planning algorithm for chip-level floorplanning(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、A buffer planning algorithm for chip-level floorplanning(论文提纲范文)
(1)基于哈希的高通量生物基因测序数据处理算法优化(论文提纲范文)
中文摘要 |
英文摘要 |
文中使用的缩略词和符号 |
第一章 绪论 |
1.1 研究的背景和意义 |
1.2 研究的现状和挑战 |
1.2.1 数据量的增加 |
1.2.2 基因序列纠错的方法 |
1.2.3 基因序列比对的方法 |
1.2.4 异构处理器的发展 |
1.2.5 生物信息学在异构架构上的实现 |
1.2.6 面临的挑战 |
1.3 本文研究内容和创新点 |
1.4 本文的组织结构和章节安排 |
第二章 背景 |
2.1 哈希算法 |
2.1.1 哈希简介 |
2.1.2 布隆过滤器 |
2.2 FASTQ格式 |
2.3 基因纠错算法 |
2.4 基于哈希的基因比对算法 |
2.4.1 SAM格式 |
2.4.2 种子-延伸策略 |
2.4.3 精确比对和最优比对 |
2.4.4 Smith-Waterman算法 |
2.5 高性能计算机的体系结构 |
2.5.1 Intel CPU和向量处理器 |
2.5.2 Xeon Phi |
2.5.3 SW26010 |
2.6 编程模型 |
2.6.1 MPI模型 |
2.6.2 OpcnMP模型 |
2.6.3 Athread编程模型 |
2.7 本章小结 |
第三章 SPECTR: 多核和众核架构上的可扩展短读序列纠错 |
3.1 引言 |
3.2 串行纠错算法介绍 |
3.3 并行算法设计 |
3.3.1 数据内存对齐 |
3.3.2 向量化Bloom过滤器查询 |
3.3.3 消除递归代码 |
3.3.4 优化细节 |
3.4 分布式实现 |
3.5 实验结果 |
3.5.1 实验设置 |
3.5.2 准确度 |
3.5.3 单设备性能 |
3.5.4 与其他工具的比较 |
3.5.5 天河二号上的性能 |
3.6 本章小结 |
第四章 S-Aligner: 基于神威·太湖之光超级计算机的基因比对 |
4.1 引言 |
4.2 Myers算法 |
4.3 S-Aligner的设计 |
4.3.1 计算核组间的大规模并行 |
4.3.2 计算核组内的多线程并行 |
4.3.3 SIMD向量化 |
4.3.4 局部设备内存的使用 |
4.4 实验结果 |
4.4.1 单节点的性能分析 |
4.4.2 与RazerS3的比较 |
4.4.3 扩展性分析 |
4.5 本章小结 |
第五章 SWMapper: 基于精简哈希的可扩展基因比对 |
5.1 引言 |
5.2 带状Myers算法 |
5.3 SWMapper的设计 |
5.3.1 MPE上的工作流程 |
5.3.2 精简哈希索引的建立 |
5.3.3 CPE上的工作流程 |
5.3.4 移除重复位置 |
5.3.5 种子过滤 |
5.3.6 带状Myers算法的向量化 |
5.3.7 数据传输优化 |
5.3.8 分布式版本 |
5.4 实验结果 |
5.4.1 准确度 |
5.4.2 建立哈希索引的时间 |
5.4.3 比对时间 |
5.4.4 优化的性能分析 |
5.5 本章小结 |
第六章 总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
致谢 |
博士期间发表的论文 |
博士期间参加的科研工作 |
相关的开源项目 |
学位论文评阅及答辩情况表 |
(2)自主路径规划的无人船水质采样系统研究(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 研究背景和意义 |
1.2 国内外研究现状 |
1.2.1 水质采样船研究现状 |
1.2.2 路径规划研究现状 |
1.3 本文主要特色和创新 |
1.4 主要研究内容 |
第二章 系统总体方案设计 |
2.1 需求分析 |
2.2 总体功能设计 |
2.3 整体技术路线 |
2.4 本章小结 |
第三章 基于改进RRT的多目标路径规划算法设计 |
3.1 多采样点功能设计与分析 |
3.2 基于改进RRT的多目标点路径规划算法 |
3.2.1 基本RRT路径规划算法 |
3.2.2 基于改进RRT的多目标路径规划算法 |
3.2.3 基于Dijkstra的采样路径优化算法 |
3.3 仿真实验验证 |
3.4 本章小结 |
第四章 采样系统硬件平台设计 |
4.1 水质采样船结构组成 |
4.2 电源系统硬件设计 |
4.3 船载控制系统硬件设计 |
4.3.1 定位系统设计 |
4.3.2 环境感知系统设计 |
4.3.3 动力系统设计 |
4.3.4 通信系统设计 |
4.3.5 船载控制系统原理图及电路板 |
4.4 采水控制系统硬件设计 |
4.5 本章小结 |
第五章 采样系统软件平台设计 |
5.1 采水控制系统软件设计 |
5.1.1 通信程序设计 |
5.1.2 采水深度控制程序设计 |
5.1.3 采水箱控制程序设计 |
5.2 船载控制系统软件设计 |
5.2.1 船载控制系统软件设计流程 |
5.2.2 RT-Thread嵌入式操作系统移植 |
5.2.3 设备驱动程序设计 |
5.2.4 船载控制系统软件模块化设计 |
5.3 陆基控制系统软件设计 |
5.3.1 功能设计 |
5.3.2 监控界面 |
5.3.3 服务器建立 |
5.3.4 地图调用 |
5.3.5 采水路径规划 |
5.3.6 软件程序设计 |
5.4 本章小结 |
第六章 系统搭建及实验分析 |
6.1 平台搭建 |
6.2 功能测试 |
6.2.1 通讯功能测试 |
6.2.2 采水测试 |
6.2.3 在线监测测试 |
6.3 路径规划算法验证 |
6.4 本章小结 |
第七章 总结与展望 |
7.1 总结 |
7.2 未来展望 |
致谢 |
参考文献 |
作者简介 |
(3)具备协同搬运功能的多AGV调度系统研发(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 研究背景及意义 |
1.2 多AGV协同搬运系统的应用前景 |
1.3 多AGV协同搬运关键技术国内外研究现状 |
1.3.1 多AGV协同搬运任务调度问题 |
1.3.2 多AGV协同搬运路径规划问题 |
1.3.3 多AGV协同搬运交通管理问题 |
1.4 本文课题来源和研究内容 |
第二章 多AGV协同搬运控制系统体系结构设计 |
2.1 多AGV协同搬运控制系统功能需求分析 |
2.2 AGV控制系统常见的体系结构 |
2.2.1 集中式控制结构 |
2.2.2 分布式控制结构 |
2.2.3 集中分层式控制结构 |
2.3 多AGV协同搬运控制系统结构设计 |
2.3.1 上位机管理系统 |
2.3.2 网络通讯系统 |
2.3.3 多AGV协同搬运体系结构 |
2.4 本章小结 |
第三章 多AGV协同搬运集结路径规划及交通管理研究 |
3.1 常用路径规划办法 |
3.1.1 A-Star算法 |
3.1.2 人工势场法 |
3.1.3 两阶段路径规划法 |
3.1.4 基于时间窗的路径规划算法 |
3.1.5 遗传算法 |
3.2 带时间窗的基于遗传算法的多AGV协同搬运集结路径规划方法 |
3.2.1 多AGV协同搬运集结路径问题描述与建模 |
3.2.2 改进遗传算法求解流程 |
3.3 仿真实验验证与分析 |
3.3.1 构建仿真模型 |
3.3.2 仿真结果分析 |
3.4 协同搬运任务的交通管理问题 |
3.4.1 路径冲突类型 |
3.4.2 路径冲突解决策略 |
3.4.3 基于任务优先级的速度调节法 |
3.5 本章小结 |
第四章 协同搬运任务与普通任务的混合调度研究 |
4.1 具有多AGV协同搬运功能的任务调度模型建立 |
4.1.1 车间环境模型 |
4.1.2 任务描述 |
4.2 任务调度规则 |
4.2.1 任务优先级调整与任务分配触发方式 |
4.2.2 基于位置适应度的多种类任务动态分配方式 |
4.3 调度策略仿真分析 |
4.3.1 建立仿真模型 |
4.3.2 对比实验设置 |
4.3.3 仿真数据分析 |
4.4 本章小结 |
第五章 具备协同搬运功能的多AGV系统开发与实现 |
5.1 系统运行环境介绍 |
5.2 自动导引小车软硬件介绍 |
5.3 系统通信方式 |
5.4 上位机软件功能模块及使用功能 |
5.4.1 数据库模块 |
5.4.2 地图绘制模块 |
5.4.3 运行管理模块 |
5.4.4 仿真模块 |
5.4.5 数据分析报表模块 |
5.5 系统运行情况 |
5.6 本章小结 |
第六章 总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
致谢 |
在学期间的研究成果及发表的学术论文 |
(4)智能输配料AGV控制系统开发及关键技术研究(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 研究背景与意义 |
1.2 AGV发展现状及研究概述 |
1.2.1 国内外发展历史及现状 |
1.2.2 AGV研究概述 |
1.3 论文主要内容及结构 |
第二章 AGV系统整体方案设计 |
2.1 灌装生产线系统方案设计 |
2.1.1 现场环境及设备介绍 |
2.1.2 灌装生产线系统组成 |
2.1.3 通讯方案设计 |
2.1.4 上位机方案设计 |
2.2 AGV系统方案设计 |
2.2.1 AGV功能需求 |
2.2.2 AGV叉车自动化改造 |
2.2.3 引导方式 |
2.2.4 路径方案 |
2.2.4.1 节点及定位标识 |
2.2.4.2 现场磁轨及节点布局 |
2.2.4.3 路径表示方法 |
2.2.5 输配料系统 |
2.2.6 充电系统 |
2.2.6.1 充电桩 |
2.2.6.2 AGV充电推杆 |
2.2.7 避障系统 |
2.2.7.1 AGV前进行驶避障方案 |
2.2.7.2 AGV后退行驶避障方案 |
2.3 本章小结 |
第三章 AGV控制系统关键技术 |
3.1 现场地图建模以及最优路径算法 |
3.1.1 环境地图模型建立方法研究 |
3.1.1.1 栅格图法 |
3.1.1.2 可视图法 |
3.1.1.3 Voronoi图法 |
3.1.1.4 拓扑法 |
3.1.2 基于有向图的环境地图建模方法 |
3.1.2.1 有向图的定义及表示方法 |
3.1.2.2 AGV环境地图建模方法 |
3.1.3 Dijkstra最优路径算法 |
3.1.3.1 Dijkstra算法思想及分析 |
3.1.3.2 Dijkstra算法优化 |
3.2 基于模糊自适应PID的循迹控制 |
3.2.1 PID控制理论 |
3.2.2 模糊控制基础理论 |
3.2.2.1 模糊化 |
3.2.2.2 知识库 |
3.2.2.3 推理机 |
3.2.2.4 反模糊化 |
3.2.3 AGV叉车运动学建模 |
3.2.4 AGV循迹控制算法 |
3.2.4.1 偏差的定义 |
3.2.4.2 模糊自适应PID控制器设计 |
3.2.5 系统仿真 |
3.3 本章小结 |
第四章 AGV嵌入式控制系统硬件设计与实现 |
4.1 主从控制器接口设计 |
4.2 主控电路及其外围电路设计 |
4.2.1 主控芯片选型及其简介 |
4.2.2 最小系统电路设计 |
4.2.2.1 芯片电源电路设计 |
4.2.2.2 时钟及调试及滤波电路设计 |
4.2.2.3 ADC基准电压电路设计 |
4.3 电源电路设计 |
4.3.1 共模滤波电路 |
4.3.2 主从板电源电路 |
4.4 通讯电路设计 |
4.4.1 CAN通讯电路 |
4.4.2 UART通讯电路 |
4.5 输入信号电路 |
4.5.1 电平信号输入电路 |
4.5.2 模拟量信号采样电路 |
4.6 控制信号输出电路 |
4.6.1 手动自动切换电路 |
4.6.2 电平信号输出电路 |
4.7 PCB设计 |
4.8 本章小结 |
第五章 AGV嵌入式控制系统软件设计与实现 |
5.1 开发环境及调试工具介绍 |
5.1.1 DAVE软件开发平台简介 |
5.1.2 uC/Probe调试工具简介 |
5.2 主控制器软件整体设计 |
5.2.1 软件分层设计 |
5.2.2 基于CMSIS-RTOS RTX的多任务设计 |
5.2.2.1 CMSIS-RTOS RTX简介 |
5.2.2.2 操作系统配置 |
5.2.2.3 主控制器多任务设计 |
5.3 底层驱动软件设计 |
5.3.1 UART驱动设计 |
5.3.2 CAN驱动设计 |
5.3.3 CCU4 驱动设计 |
5.3.4 ADC及 DAC驱动设计 |
5.4 服务层软件设计 |
5.4.1 检测服务 |
5.4.2 周期性通讯服务 |
5.4.3 计时器服务 |
5.4.4 线程栈空间使用率监测服务 |
5.5 应用层软件设计 |
5.5.1 初始化 |
5.5.2 通讯 |
5.5.2.1 上位机通讯 |
5.5.2.2 主从板控制器通讯 |
5.5.3 任务执行 |
5.5.3.1 避障任务 |
5.5.3.2 循迹任务 |
5.5.3.3 任务执行 |
5.5.4 状态管理 |
5.5.4.1 AGV状态字管理 |
5.5.4.2 异常检测处理 |
5.6 本章小结 |
第六章 总结与展望 |
6.1 总结 |
6.2 展望 |
致谢 |
参考文献 |
附录 |
攻读硕士学位期间取得的成果 |
(5)三维片上系统测试时间及成本的优化方法研究(论文提纲范文)
致谢 |
摘要 |
abstract |
第一章 绪论 |
1.1 研究背景 |
1.2 研究目的和意义 |
1.3 国内外的研究现状 |
1.4 本文研究内容和论文章节安排 |
第二章 三维片上系统相关介绍 |
2.1 三维集成电路简介 |
2.1.1 三维集成制造工艺 |
2.1.2 三维集成设计规则 |
2.1.3 三维芯片优势与挑战 |
2.2 三维片上系统测试 |
2.2.1 芯片可测试性设计 |
2.2.2 3D SoC测试流程 |
2.3 三维芯片测试结构 |
2.3.1 测试访问机制相关介绍 |
2.3.2 测试外壳结构 |
2.4 本章小结 |
第三章 3D SoC并行测试中TAM调度优化设计 |
3.1 研究动机 |
3.2 三维片上系统并行测试设计 |
3.2.1 测试结构设计 |
3.2.2 3D SoC测试调度方法 |
3.2.3 基于装箱问题调度方法的弊端 |
3.3 测试调度约束条件 |
3.3.1 3D SoC功耗来源 |
3.3.2 功耗及并行性约束 |
3.4 基于向量调整的TAM调度优化设计 |
3.4.1 问题描述与变量定义 |
3.4.2 优化的测试外壳设计 |
3.4.3 功耗及测试并行性约束下的调度顺序调整 |
3.5 实验结果与分析 |
3.6 本章小结 |
第四章 基于TSV绑定成本的芯核布图策略 |
4.1 研究动机 |
4.2 影响测试成本的因素 |
4.2.1 三维片上系统测试成本控制 |
4.2.2 TSV绑定成本 |
4.3 TSV绑定的关键问题 |
4.3.1 TSV布局方式 |
4.3.2 测试TSV数量限制 |
4.4 3D SoC扫描链设计 |
4.4.1 3D SoC芯核分层布图方案 |
4.4.2 基于模拟退火算法的扫描链分配 |
4.5 3D SoC测试成本优化策略 |
4.5.1 协同考虑TSV绑定的成本模型 |
4.5.2 基于最短路径算法的TSV布局 |
4.5.3 芯核分层布图优化算法 |
4.6 实验结果与分析 |
4.7 本章小结 |
第五章 总结和展望 |
5.1 总结 |
5.2 展望 |
参考文献 |
读硕士学位期间发表的论文 |
(6)基于交通云的城市无人车协同调度机制研究及实现(论文提纲范文)
摘要 |
Abstract |
1 绪论 |
1.1 研究背景 |
1.2 国内外研究现状 |
1.2.1 问题提出 |
1.2.2 研究现状 |
1.3 主要工作 |
1.4 组织架构 |
2 城市-服务域交通环境模型设计 |
2.1 无人车动作与状态统一建模 |
2.1.1 物理模型扩展 |
2.1.2 运动模型扩展 |
2.2 城市域道路网络建模 |
2.2.1 道路模型 |
2.2.2 路口模型 |
2.2.3 连通关系 |
2.3 交通云体系模型 |
2.4 车-路-云交互模型 |
2.4.1 V2I、I2V交互模型 |
2.4.2 V2C、C2V交互模型 |
2.4.3 C2I、I2C交互模型 |
2.5 本章小结 |
3 云端多无人车路径协同规划机制设计 |
3.1 道路网络权值模型 |
3.1.1 BPR权值模型 |
3.1.2 平均速度权值模型 |
3.1.3 浮动车模型 |
3.2 多无人车协同路径规划机制 |
3.2.1 车辆自主路径规划算法 |
3.2.2 交通云动态全局路径规划 |
3.3 本章小结 |
4 可配置仿真系统研究及软件设计 |
4.1 典型智能交通系统仿真软件分析 |
4.2 QoS-VRCCS仿真软件设计 |
4.2.1 分层式体系结构 |
4.2.2 结构模型与机制的实例化设计 |
4.2.3 可配置机制设计 |
4.3 基于线程池的计算效能优化 |
4.4 本章小结 |
5 仿真软件的实现与验证 |
5.1 QoS-VRCCS仿真软件实现 |
5.1.1 用户界面实现 |
5.1.2 核心逻辑实现 |
5.2 软件性能验证与分析 |
5.2.1 典型场景验证 |
5.2.2 算法结果分析 |
5.3 本章小结 |
6 结论及展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
攻读硕士学位期间科研情况 |
致谢 |
(7)基三多核架构中片上网络系统若干关键技术研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 研究的背景和意义 |
1.2 TriBA多核架构简介 |
1.2.1 TriBA内核微体系结构 |
1.2.2 TriBA核间互连网络 |
1.2.3 TriBA片上存储系统 |
1.3 国内外研究现状 |
1.3.1 片上网络路由算法研究现状 |
1.3.2 片上网络路由器结构研究现状 |
1.3.3 片上网络布局布线方法研究现状 |
1.4 主要研究内容和创新点 |
1.4.1 主要研究内容 |
1.4.2 研究成果与创新点 |
1.5 论文组织结构 |
第2章 TriBA核间通信互连网络的最短路径路由 |
2.1 引言 |
2.2 相关工作 |
2.3 TriBA的图论定义 |
2.3.1 TriBA的编码系统 |
2.3.2 两个特殊的子图 |
2.4 分布式最短路径路由算法设计 |
2.4.1 数据流模型 |
2.4.2 端口定义 |
2.4.3 FM_0模式下的最短路径路由 |
2.4.4 任意模式下的最短路径路由 |
2.5 实验评估 |
2.5.1 实验设计 |
2.5.2 实验结果与分析 |
2.6 本章小结 |
第3章 面向低延迟的路由器结构优化 |
3.1 引言 |
3.2 研究背景及动机 |
3.3 路由器结构设计优化 |
3.3.1 基于前瞻路由技术的流水线优化设计 |
3.3.2 最小化缓存策略 |
3.3.3 分段式交叉开关 |
3.3.4 基于注入控制的流控策略 |
3.4 实验评估 |
3.4.1 实验设计及方法 |
3.4.2 实验结果与分析 |
3.5 本章小结 |
第4章 基于快速虚通道技术的流控机制研究 |
4.1 引言 |
4.2 相关工作 |
4.3 面向快速虚通道的路由机制设计 |
4.3.1 维度判断模型 |
4.3.2 侦测FSP |
4.4 基于快速虚通道的流控机制设计 |
4.4.1 动态快速虚通道设计 |
4.4.2 防饥饿机制 |
4.4.3 动态缓存管理策略 |
4.5 实验评估 |
4.5.1 实验设计及方法 |
4.5.2 实验结果与分析 |
4.6 本章小结 |
第5章 TriBA片上网络布局布线策略探讨 |
5.1 引言 |
5.2 相关工作 |
5.3 TriBA混合片上网络 |
5.3.1 核间通信子网及定义 |
5.3.2 片上存储子网及定义 |
5.3.3 互连网络静态度量 |
5.4 TriBA混合片上网络布局布线设计 |
5.4.1 双网融合布局布线设计 |
5.4.2 多端口存储控制器设计 |
5.4.3 异构的路由器设计 |
5.5 实验评估 |
5.5.1 实验设计及方法 |
5.5.2 实验结果与分析 |
5.6 本章小结 |
结论 |
参考文献 |
攻读学位期间发表论文与研究成果清单 |
致谢 |
作者简介 |
(8)多轴机械手控制系统的研究与开发(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 研究背景与意义 |
1.1.1 机械手控制系统的组成 |
1.1.2 机械手的分类 |
1.2 国内外研究现状 |
1.3 课题研究的内容 |
1.4 本文章节安排 |
第2章 机械手控制系统整体方案设计 |
2.1 引言 |
2.2 机械手机械平台架构设计 |
2.2.1 机械手机身布局 |
2.2.2 伺服电机及驱动器 |
2.3 机械手控制系统概要设计 |
2.3.1 主控芯片的选型 |
2.3.2 STM32 固件函数库 |
2.3.3 DWIN_HMI 介绍 |
2.3.4 薄膜按键 |
2.4 本章小结 |
第3章 机械手轨迹规划研究 |
3.1 引言 |
3.2 机械手有效动作区域说明 |
3.3 轨迹规划算法研究 |
3.3.1 机械手点到点路径规划 |
3.3.2 Bezier 曲线拟合算法 |
3.3.3 B-spline 算法的研究 |
3.3.4 实验结果与仿真 |
3.4 三点圆弧算法 |
3.4.1 三点圆弧算法的提出 |
3.4.2 特征点求值算法 |
3.4.3 三点圆弧算法的实现过程 |
3.5 空间插补算法的实现及仿真 |
3.5.1 空间直线插补 |
3.5.2 空间圆弧插补 |
3.6 本章小结 |
第4章 机械手控制系统速度规划及加减速算法研究 |
4.1 引言 |
4.2 速度规划算法的研究 |
4.2.1 速度前瞻算法 |
4.2.2 速度回溯算法 |
4.3 机械手速度规划及加减速控制 |
4.3.1 多段预处理速度规划算法 |
4.3.2 直线加减速控制 |
4.3.3 连续小直线段段末速度规划 |
4.3.4 实验结果与仿真 |
4.4 本章小结 |
第5章 机械手控制系统软硬件及界面设计 |
5.1 引言 |
5.2 机械手控制系统硬件设计 |
5.2.1 系统总体架构设计 |
5.2.2 伺服驱动器设置 |
5.2.3 硬件信号接口 |
5.2.4 控制系统硬件实物 |
5.3 机械手控制系统软件设计 |
5.3.1 软件整体架构 |
5.3.2 系统初始化 |
5.3.3 数据通信 |
5.4 机械手控制系统手控器界面设计 |
5.4.1 通信协议 |
5.4.2 DWIN_HMI 函数库编写 |
5.4.3 界面设计 |
5.5 系统调试结果及分析 |
5.5.1 系统脉冲输出部分测试 |
5.5.2 界面显示部分测试 |
5.6 本章小结 |
第6章 总结与展望 |
6.1 研究工作总结 |
6.2 展望 |
参考文献 |
致谢 |
攻读学位期间参加的科研项目和成果 |
(9)生物序列分析算法硬件加速器关键技术研究(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 课题背景 |
1.1.1 生物序列分析研究现状 |
1.1.2 序列分析领域典型计算方法 |
1.1.3 序列分析领域高性能计算的现状和挑战 |
1.2 研究内容 |
1.2.1 典型序列分析方法计算特征提取 |
1.2.2 动态规划算法并行化研究 |
1.2.3 启发式数据库搜索算法并行化研究 |
1.2.4 随机过程数据库搜索算法并行化研究 |
1.2.5 基于贝叶斯模型的蛋白质结构预测算法并行化研究 |
1.2.6 动态可重构序列分析原型系统构建 |
1.3 主要工作和贡献 |
1.4 全文组织结构 |
第二章 基于二维动态规划的序列比对算法并行化研究 |
2.1 序列比对 |
2.1.1 序列比对简介 |
2.1.2 问题描述 |
2.1.3 典型序列比对方法 |
2.2 二维动态规划算法细粒度并行方法 |
2.2.1 算法并行化的主要难点 |
2.2.2 算法计算特征分析 |
2.2.3 细粒度并行算法 |
2.3 算法加速器设计与实现 |
2.3.1 研究现状 |
2.3.2 双序列比对算法并行计算结构 |
2.3.3 多序列比对算法并行计算结构 |
2.4 实验结果与性能分析 |
2.4.1 双序列比对 |
2.4.2 多序列比对 |
2.5 本章小结 |
第三章 基于高维动态规划的RNA 结构预测算法并行化研究 |
3.1 RNA 简介 |
3.1.1 RNA 结构 |
3.1.2 RNA 二级结构预测 |
3.1.3 典型RNA 二级结构预测方法 |
3.2 三维动态规划问题细粒度并行方法 |
3.2.1 问题描述 |
3.2.2 研究现状 |
3.2.3 计算特征分析 |
3.2.4 按列轮转的任务划分策略 |
3.2.5 细粒度并行算法 |
3.2.6 存储优化策略 |
3.3 四维动态规划问题细粒度并行方法 |
3.3.1 问题描述 |
3.3.2 研究现状 |
3.3.3 计算特征 |
3.3.4 数据相关性分析 |
3.3.5 细粒度并行算法 |
3.4 系统设计与实现 |
3.4.1 三维动态规划算法并行计算结构 |
3.4.2 四维动态规划算法并行计算结构 |
3.5 实验结果与性能分析 |
3.5.1 资源利用率 |
3.5.2 加速性能 |
3.5.3 性能分析 |
3.6 本章小结 |
第四章 基于启发式和随机过程的序列搜索算法并行化研究 |
4.1 生物数据库搜索研究现状 |
4.1.1 生物数据库简介 |
4.1.2 数据库搜索面临的挑战 |
4.2 典型序列数据库搜索方法 |
4.2.1 基于序列两两比对的精确搜索方法 |
4.2.2 基于“种子—扩展”的启发式搜索方法 |
4.2.3 基于隐马模型的随机过程搜索方法 |
4.3 基于“种子—扩展”的并行搜索方法 |
4.3.1 算法简介和计算特征 |
4.3.2 研究现状 |
4.3.3 并行多种子检测算法和线性搜索阵列 |
4.3.4 提高阵列搜索效率的优化策略 |
4.3.5 BLAST 算法并行计算结构 |
4.4 基于HMM 模型的并行搜索方法 |
4.4.1 Viterbi 算法简介 |
4.4.2 算法计算特征 |
4.4.3 研究现状 |
4.4.4 粗细粒度混合的并行方法 |
4.4.5 Viterbi 算法并行计算结构 |
4.5 实验结果与性能分析 |
4.5.1 BLAST 算法加速性能 |
4.5.2 Viterbi 算法加速性能 |
4.6 本章小结 |
第五章 基于贝叶斯方法的蛋白质结构预测算法并行化研究 |
5.1 蛋白质简介 |
5.1.1 蛋白质组成 |
5.1.2 蛋白质结构 |
5.2 蛋白质结构预测 |
5.2.1 蛋白质结构类型预测 |
5.2.2 蛋白质二级结构预测 |
5.2.3 蛋白质三级结构预测 |
5.2.4 贝叶斯方法基本原理 |
5.3 蛋白质结构预测细粒度并行方法 |
5.3.1 问题描述 |
5.3.2 研究现状 |
5.3.3 贝叶斯网络模型计算特征 |
5.3.4 细粒度并行方法 |
5.4 系统设计与实现 |
5.4.1 蛋白质二级结构预测并行计算结构 |
5.4.2 蛋白质三级结构预测并行计算结构 |
5.5 实验结果与性能分析 |
5.5.1 FPGA 实现 |
5.5.2 加速性能 |
5.6 本章小结 |
第六章 动态可重构序列分析原型系统构建 |
6.1 系统总体结构 |
6.1.1 系统组成 |
6.1.2 FPGA 算法加速器 |
6.2 通用计算组件设计 |
6.2.1 多功能IO 接口控制器 |
6.2.2 PCI-E 接口 |
6.2.3 DMA 控制器 |
6.2.4 可配置SDRAM 存储控制器 |
6.3 系统动态重构 |
6.3.1 FPGA 重构 |
6.3.2 Virtex-5 FPGA 配置端口 |
6.3.3 全局动态重构 |
6.3.4 动态任务切换 |
6.4 性能评价 |
6.4.1 性能评价指标 |
6.4.2 算法级性能评价 |
6.4.3 系统级性能评价 |
6.5 本章小结 |
第七章 结论与展望 |
7.1 工作总结 |
7.2 工作展望 |
致谢 |
参考文献 |
作者在学期间取得的学术成果 |
作者在学期间参与的科研工作和所获专利 |
(10)面向微处理器系统结构的布图规划算法研究(论文提纲范文)
摘要 |
Abstract |
第一章 引言 |
1.1 工业背景和课题意义 |
1.1.1 集成电路迅猛的发展速度 |
1.1.2 课题意义 |
1.2 VLSI设计流程及布图模式 |
1.3 布局面临的挑战 |
1.3.1 面向集成规模的问题 |
1.3.2 面向电路性能的问题 |
1.4 本文的主要工作和组织结构 |
第二章 集成电路布图与布局研究 |
2.1 布图规划和布局问题的描述 |
2.2 VLSI布局设计中的模拟退火算法 |
2.3 随机优化算法中布图结构表示 |
2.3.1 Slicing结构表示 |
2.3.2 Non-slicing结构表示 |
2.4 面向微处理器的布图规划算法研究现状 |
2.5 本章小结 |
第三章 集成电路设计中热问题研究 |
3.1 热问题分析 |
3.1.1 芯片的发展方向 |
3.1.2 热源分析及其影响 |
3.1.3 功耗和热的关系 |
3.2 在芯片设计的不同层次上考虑热问题 |
3.2.1 在高层次综合中考虑热问题(Temperature-Aware in High-Level Synthesis) |
3.2.2 在布图、布局、布线中考虑 |
3.2.2.1 热R模型(Resistive Thermal Model) |
3.2.2.2 热RC模型(Thermal-RC Model) |
3.3 结合高层次和物理层考虑 |
3.4 热问题的解决方案与技术 |
3.4.1 热通孔(Thermal Via) |
3.4.2 电压岛(voltage islands) |
3.4.3 动态热量管(Dynamic thermal management) |
3.5 本章小结 |
第四章 微处理器的性能设计 |
4.1 超标量处理器体系结构 |
4.2 微处理器设计流程 |
4.2.1 互连时延 |
4.2.2 功耗 |
4.2.3 芯片温度 |
4.3 微处理器设计的仿真方法和策略 |
4.4 互连线上的流水线设计 |
4.5 性能灵敏度模型 |
第五章 面向微处理器系统结构的布局设计方案 |
5.1 正则波兰表达式 |
5.2 温度估计模型—Hotspot |
5.3 性能估计模型 |
5.4 同时优化性能和热效应的布图规划 |
5.5 基于智能策略的二次布局框架 |
5.6 实验具体实现 |
5.6.1 目标函数及各参数的选取 |
5.6.2 实验数据及分析 |
5.7 本章小结 |
第六章 总结和展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
致谢 |
附录A 算法核心代码 |
附录B 参数设置 |
攻读硕士学位期间公开发表的学术论文 |
四、A buffer planning algorithm for chip-level floorplanning(论文参考文献)
- [1]基于哈希的高通量生物基因测序数据处理算法优化[D]. 许凯. 山东大学, 2020(04)
- [2]自主路径规划的无人船水质采样系统研究[D]. 王月鹏. 南京信息工程大学, 2020(02)
- [3]具备协同搬运功能的多AGV调度系统研发[D]. 赵睿. 南京航空航天大学, 2020
- [4]智能输配料AGV控制系统开发及关键技术研究[D]. 李友铖. 电子科技大学, 2019(01)
- [5]三维片上系统测试时间及成本的优化方法研究[D]. 吴欣舟. 合肥工业大学, 2019(01)
- [6]基于交通云的城市无人车协同调度机制研究及实现[D]. 谢策. 西北工业大学, 2019
- [7]基三多核架构中片上网络系统若干关键技术研究[D]. 陈旭. 北京理工大学, 2018(07)
- [8]多轴机械手控制系统的研究与开发[D]. 王宇. 浙江工业大学, 2012(03)
- [9]生物序列分析算法硬件加速器关键技术研究[D]. 夏飞. 国防科学技术大学, 2011(07)
- [10]面向微处理器系统结构的布图规划算法研究[D]. 黄锋. 武汉理工大学, 2008(09)