您好,欢迎访问三七文档
当前位置:首页 > 办公文档 > 其它办公文档 > 自动化专业英文文献翻译2
西南交通大学毕业设计(英文翻译)节能型机房温湿度远程控制系统测控节点设计年级:学号:姓名:专业:指导老师:二零一一年六月西南交通大学本科毕业设计(英文翻译)第1页MosixMosix修改bsdi上的BSD/OS来提供电脑上的跨网络的动态负载平衡组和先发制人进程迁移。这是不错的东西,不只是为并行处理,但对于通常使用一个集群很像一个可扩展的SMP。是否有Linux版本?详细信息,请看。NOW(工作站网络)伯克利工作站网络项目,,已经极大地推广了并行计算中使用工作站网络,这里还有很多工作在进行中,都致力于“在未来几年内展示一个实际的100处理器系统”。唉,他们不使用linux。并行处理使用linux并行处理使用LinuxWWW站点,,是这些指南和许多相关文件包括为全日制量身订造的在线幻灯片的家园。除了在报纸项目上,普渡大学电机与计算机工程系已经是并行处理的领先者,这个网站的设立是为了帮助别人申请并行处理的Linux电脑。自从普渡大学的第一组Linux个人电脑在1994年2月组装以来,已经诞生了许多的LinuxPC集群,有些还包括视频墙。然而这些集群使用386,486和奔腾系统(没有奔腾Pro系统),英特尔最近获得普渡大学的捐赠,将允许它的奔腾II系统构建多个大型集群(与单个群集计划多达165机)。并且这些集群都将有论文网,也具有最传统的网络。奔腾Pro集群研讨会1997年,4月10-11日,埃姆斯实验室在得梅因,爱荷华州举行了奔腾Pro集群研讨会。WWW在本次研讨会,,从云集的参加者中收集了很多丰富的PC集群信息。TreadMarks帝斯曼(分布式共享内存)帝斯曼(分布式共享内存)是一种技术,即一个消息传递系统可以出现的行为作为一个SMP。有不少这样的系统,其中大部分使用OS页故障触发消息传输机制。TreadMarks,~willy/TreadMarks/overview.html,是这种系统更有效地之一,并在Linux集群上运行。坏消息是“TreadMarks”正在由一个小成本的大学和非盈利机构的分配。欲了解更多有关该软件,请联系treadmarks@ece.rice.edu信息。西南交通大学本科毕业设计(英文翻译)第2页U型网(用户级网络接口架构)U型网(用户级网络接口架构)在康奈尔大学,,项目试图提供低延迟,高带宽的网络硬件使用商品由虚拟的网络接口,以便应用程序可以发送和接收邮件没有作业系统的干预。在Linux上运行的U型网,使用DECchipDC21140的快速以太网卡或前置系统的主成分-200(不常设仲裁法院-200E)ATM卡。WWT(威斯康星风洞)的确有相当多集群相关的工作在威斯康星州。该WWT的(威斯康星风洞)项目,~wwt/,正在致力于对发展的“标准”之间的并行编译器和底层硬件接口各项工作。还有就是威斯康星牛(集群工作站),合作共享内存和暴风雨的Paradyn并行性能工具等,不幸的是关于Linux的不是很多。西南交通大学本科毕业设计(英文翻译)第3页4.在A寄存器的SIMD(例如,使用MMX公司)在A寄存器的SIMD(单指令流多数据流)(SWAR)并不是一个新想法。给定一个有k位寄存器,数据路径和功能单元机,人们早已知道,普通的寄存器操作可以像SIMD一样并行操作n,n/k位,整数字段值。然而,这只是由于对多媒体最近有SIMD推动的2倍到8倍加速技术已成为主流计算的关注。大多数微处理器1997的版本包括硬件SWAR支持:AMD的K6型MMX公司(多媒体扩展)Cyrix的货币供应M2MMX公司(多媒体扩展)数字Alpha马克斯(多媒体扩展)惠普的PA-RISC的最大(多媒体加速扩展)英特尔奔腾II和奔腾MMX公司与(多媒体扩展)MicrounityMediaprocessorSIGD(单一数据组指令上)MIPS的数字媒体扩展(MDMX,发音疯狂的麦克斯)的SunSPARCV9的VIS(视觉指令集)还有一些新的微处理器提供了一个由硬件支持的几洞,怪癖像场大小只支持一些操作一些。重要的是要记住,但是,你不需要任何SWAR经营的硬件有效的支持。例如,位操作是不会被寄存器逻辑分区影响的。4.1SWAR:有什么优势?虽然每个现代处理器至少具有一些并行执行能力的SWAR,不幸的是,即使是最好的SWAR增强指令集不支持非常通用并行。事实上,许多人已经意识到,奔腾与“带MMX技术的奔腾”之间性能上的差异通常都是由巨大的L1缓存存在MMX造成的。因此,实际上,什么是SWAR(或MMX)的优势呢?仅整数,越小越好。两个32位值可安装在64位MMX寄存器,但这样做的八单字节字符,更或者是一个完整的国际象棋板上的一位。注:将会有一个浮点版本的MMX,虽然在此篇文章中很少提及。Cyrix已经发布了一些幻灯片,ftp://ftp.cyrix.com/developr/mpf97rm.pdf其中包括一些MMFP的评论。显然,MMFP将支持两个32位浮点数字装入到一个64位的MMX寄存器,结合这两个MMFP管道将产生四个单精度每时钟触发器。SIMD或向量式并行。相同的操作同事应用到各个领域。有许多办法来废止选定域的作用(即相当于掩蔽的SIMD),但它会带来更为复杂的编码和性能的损害。本地化,有规律的(完美的包装),内存参考模式。SWAR在一般情况下,特别是MMX,在随机存取方面很可怕;聚集一个相当昂贵的x[y]向量(其中y是一个索西南交通大学本科毕业设计(英文翻译)第4页引阵列)。这些都是严重的限制,但这种类型的并行算法,发生在许多并行而不只是多媒体应用。对于算法的正确类型,SWAR比SMP或并行群集更效率得多,而且它不需要任何费用。4.2SWAR编程导论SWAR的基本概念,在A寄存器里的SIMD,是指在字长寄存器的操作能被用于加速由SIMD在n,k/n位表上的操作运算。然而,使用SWAR技术可能会难以处理,并且一些SWAR操作确实比串行序列比昂贵的多,因为他们需要额外的指令以执行实地划分。为了说明这一点,让我们考虑一个大大简化的SWAR模型,管理每一个32位寄存器里的4个8位字段。两个寄存器中的值可以表示为:PE3PE2PE1PE0+-------+-------+-------+-------+Reg0|D7:0|C7:0|B7:0|A7:0|+-------+-------+-------+-------+Reg1|H7:0|G7:0|F7:0|E7:0|+-------+-------+-------+-------+这个模型表明每一个寄存器都被有必要地视为一个包含4个独立的8位整型的向量。另外,把A和E作为Reg0和Reg1来处理元素0(PE0),把B和F视为PE1的寄存器,等等。本文档的其余部分简要回顾这些整数向量的SIMD并行操作的基本类型如何将这些功能都可以实现。多态操作有些SWAR操作可以很一般地使用普通的32位整型操作,而不必担心这个操作是真的打算在这些8位的字段上并行操作。我们呼吁任何SWAR操作多态性,因为该功能并未受到字段类型(大小)的影响。测试如果任何字段是非零是多态的,因为都是按位逻辑运算。例如,一个普通的位与操作(C的&操作符)执行按位与,无论这个字段的大小。一个简单的寄存器位与实例如下:PE3PE2PE1PE0西南交通大学本科毕业设计(英文翻译)第5页+---------+---------+---------+---------+Reg2|D&H7:0|C&G7:0|B&F7:0|A&E7:0|+---------+---------+---------+---------+由于位与操作总有K值的结果位值来影响操作,所有字段的大小都支持使用相同的单指令。分区操作不幸的是,很多重要的SWAR操作都不具有多态性。算术运算,如加,减,乘,除等都实行在字段间进/借位。我们称这样的SWAR操作为分区,因为每一个这样的操作必须有效地分开操作数和结果之间的相互作用,以防止字段间相互影响。然而,实际上有三种不同的方法来获得这样的效果。分区说明也许最明显的方法来实现分区操作是字段间提供硬件支持的“分区并行指令”来进行字段见的进/借位。这种方法可以产生最高的性能,但它需要改变处理器的指令体系,但一般存在许多限制(例如,8位字段可能得到支持,但12位的并不能)。AMD/Cyrix/IntelMMX,DigitalMAX,HPMAX和SunVIS都实现分区指令限制版本。不幸的是,这些不同的指令集扩展有不同的限制,使得他们之间的算法有些不简便。例如,分析下面的采样分区操作:指令AMD/Cyrix/IntelMMXDECMAXHPMAXSunVIS+---------------------+---------------------+---------+--------+---------+|绝对差别||8||8|+---------------------+---------------------+---------+--------+---------+|相融最大值||8,16|||+---------------------+---------------------+---------+--------+---------+|比较|8,16,32|||16,32|+---------------------+---------------------+---------+--------+---------+|相乘|16|||8x16|+---------------------+---------------------+---------+--------+---------+|相加|8,16,32||16|16,32|+---------------------+---------------------+---------+--------+---------+在这个表中,这些数字表明了字段的大小,以位为单位,因此每个操作都是支持西南交通大学本科毕业设计(英文翻译)第6页的。即便此表省略了绝大多部分的外来指令,还是可以清楚地看到有许多差异。直接结果是高级语言(HLLS)并没有编程模型那样有效,并且可移植性普遍较差。未划分的操作与校正码用分区指令来实现分区操作一定是有效的,但如果你所需要的分区操作并不被硬件所支持时该如何解决?方法是你可以使用一连串普通指令来实现字段见的进/借位操作,来改正那些不受欢迎的限制。这是一个纯软件的方法,并且做了上层介绍,但它能在通用字段分区环境下工作。这种做法也是完全通用的,因为它不仅可以被用来填补空白,说明硬件支持的分区,也可以用来提供完整的功能在所有的目标机器没有硬件支持。事实上,如C一样的表达语言,这种方法使得SWAR方案得到充分的可移植性。问题立即出现了:很明显,使用带纠错码的未分区操作来模拟SWAR分区操作是多么的无效?因此,这是一个类似于$64K的问题…但许多操作并不像人们想象中的那么难。考虑推行使用四个原色的8位整型向量通过使用普通32位操作来实现两个源向量的相加操作。一个普通的32位加法实际上可能产生正确的结果,但8位字段进位操作排除在外。因此,我们的目标仅仅是确保这一的进位不会发生。因为两个k位字段的数相加最少会产生k+1位的结果,我们能通过简单地掩盖每个字段最有效的位来确保没有进位发生。下面是一个通过与0x7f7f7f7f的与操作来实现普通32位的加操作。t=((x&0x7f7f7f7f)+(y&0x7f7f7f
本文标题:自动化专业英文文献翻译2
链接地址:https://www.777doc.com/doc-20232 .html