您好,欢迎访问三七文档
第1章分布式系统概述分布式系统定义分布式系统目标分布式系统硬件概念分布式系统软件概念设计中的问题1.1分布式系统定义分布式系统的产生功能更强的微处理器的开发高速计算机网络的出现将由大量计算机组成的系统通过高速网络连接起来,形成了分布式系统。分布式系统的定义“一个分布式系统是一些独立的计算机的集合,但是对这个系统的用户来说,系统就像一台计算机一样。”从硬件角度:每台计算机都是自主的。从软件角度:对用户来说就像与单个系统打交道。1.2分布式系统目标1.2.1分布式系统相对于集中式系统的优点项目描述经济性微处理机提供了比大型主机更好的性能价格比速度分布式系统中的计算能力比单个大型主机更强固有的分布性一些应用涉及到空间上分散的机器可靠性如果一个机器崩溃,整个系统还可以运转渐增式的增长方式计算能力可以逐渐有所增加1.2分布式系统目标1.2.2分布式系统相对于独立PC机的优点项目描述数据共享允许多个用户访问一个公共的数据库设备共享允许多个用户共享昂贵的外围设备(如彩色打印机)通信使得人们之间的通信更加容易,如通过电子邮件灵活性用最有效的方式将工作负荷分配到可用的机器上1.2分布式系统目标1.2.3分布式系统的缺点项目描述软件目前为分布式系统开发的软件还很少网络网络可能饱和和引起其他的问题安全容易造成对保密数据的访问1.3硬件概念分布式系统硬件计算机系统按指令流和数据流分类SISD(SingleInstructionstream,SingleDatastream)单处理机系统。SIMD(SingleInstructionstream,MultipleDatastream)并行计算机。MISD(MultipleInstructionstream,SingleDatastream)已知的计算机没有属于这一类的。MIMD(MultipleInstructionstream,MultipleDatastream)所有的分布式系统都是MIMD型。1.3硬件概念分布式系统硬件MIMD计算机分成两类:具有共享存储器的多处理机和不具有共享存储器的多计算机。在多处理机中,所有的CPU共享统一的虚拟地址空间。在多计算机中,每个计算机有它自己的存储器。多处理机和多计算机又可根据互联网的体系结果分为总线型和交换型。总线型:只通过单个网络、底板、总线、电缆或其他介质将所有计算机连接起来。如有线电视。交换型:机器和机器之间有独立的线路。如世界范围内的公共电话系统。1.3硬件概念分布式系统硬件紧耦合和松耦合系统紧耦合型:一台计算机向另一台计算机发送信息的时延很短、数据传输速率很高;多用于并行系统(共同处理一个问题)松耦合型:机器间信息传送延迟大,数据传输速率也低。多用于分布式系统(处理一些不相关的问题)1.3硬件概念分布式系统硬件并行及分布式计算机系统分类并行分布式计算机多处理机(共享存储器)多计算机(私有存储器)总线型总线型交换型交换型MIMD松耦合紧耦合SequentEncore超级计算机RP3LAN工作站超立方体Transputer1.3硬件概念1.3.1基于总线的多处理机基于总线的多处理机由若干个CPU组成,它们都连接到一个公共的总线上,并且共享一个存储器模块。为了避免总线过载,需要高速缓存,但带来了不一致问题。连接的CPU数量有限。CacheCPUBusCacheCPUCacheCPUMemory1.3硬件概念1.3.2交换型多处理机将存储器分成许多存储器模块,用十字交叉开关将它们与CPU相连。MMMMCCCC优点:多个CPU能够同时访问存储器。缺点:n个CPU和n个存储器模块,需要n2个交叉开关。1.3硬件概念1.3.2交换型多处理机Omega网络结论需要的交叉开关数量多,需要解决交换延迟,价格昂贵。建立一个大的、紧密偶合的、共享存储器的多处理机系统是困难的。CCCCMMMM2x2开关1.3硬件概念1.3.3基于总线的多计算机每个CPU都与它自身的存储器直接相连。由于仅是CPU和CPU之间的通信,通信量比当互连网络用于CPU和存储器之间的通信量低几个数量级。CPULocalmemory网络CPULocalmemoryCPULocalmemory图1-4局域网上由多台工作站组成的计算机系统工作站工作站工作站1.3硬件概念1.3.4交换型多计算机两种流行的拓扑结构:网格和超立方体1.4软件概念1.4.1网络操作系统按耦合程度分为两种不同的操作系统:松耦合系统和紧耦合系统。运行在松耦合硬件上的松耦合软件远程登陆目录服务文件服务客户局域网请求响应磁盘上存储有共享的文件系统文件服务器图1-6在网络操作系统环境下的两个客户和一个服务器1.4软件概念1.4.2真正的分布式系统松耦合硬件上的紧耦合软件,根本思想是:用户不必意识到系统中有多个CPU存在。分布式系统的特点必须有一个单一的、全局的进程间通信机制进程管理必须处处相同文件系统相同使用相同的系统调用接口1.4软件概念1.4.3多处理机分时系统运行在紧耦合硬件上的紧耦合软件。关键特点:存在一个唯一的运行队列文件系统有明显不同Cache过程A在运行总线CacheCache操作系统过程B在运行过程C在运行运行队D,EA(运行)B(运行)C(运行)D(就绪)E(就绪)磁盘CPU1CPU2CPU3图1-8具有一个运行队列的多处理机系统1.4软件概念三种操作系统比较项目网络操作系统分布式操作系统多处理机操作系统看起来是否像一个虚拟的单处理机系统?否是是所有的机器只运行相同的操作系统?否是是有多少操作系统的拷贝?nn1怎样通信?共享文件消息共享存储器需要共同一致的网络协议?是是否是否只有一个运行队列?否否是文件共享是否有良好的语义定义?通常没有是是1.5设计中的问题1.5.1透明性透明度可分两个级别对用户隐藏系统的分布性对程序透明种类含义位置透明用户不知道资源位于何处迁移透明资源可以不改名地随意移动复制透明用户不知道有多少个拷贝存在并发透明多个用户可以自动的共享资源并行透明系统活动可以在用户没有感觉的情况下并行发生1.5设计中的问题1.5.2灵活性两种学术观点单内核每台机器都运行一个传统的内核,内核自身提供了大多数的服务。单内核:集中式操作系统+网络服务和远程服务。单内核系统唯一潜在的优点是性能。用户单内核包括文件、目录和过程管理1.5设计中的问题1.5.2灵活性两种学术观点微内核内核尽可能少的提供服务,大量的操作系统服务可从用户级服务器上获得。微内核具有更好的灵活性。只提供四种最小的服务:1.进程间通信机制2.某些内存管理功能3.少量的低层进程管理和调度4.低层输入/输出服务。用户微内核文件服务微内核目录服务微内核处理服务微内核网络1.5设计中的问题1.5.3可靠性可靠性的三个方面高可用性安全性:必须保护文件和其他资源不被非法用户使用。容错1.5设计中的问题1.5.4性能不同的性能衡量标准:响应时间吞吐量(每小时完成的工作量)系统利用率网络容量消耗程度1.5设计中的问题1.5.5可伸缩性可伸缩性的三个方面:适应系统规模变化的能力集中式或分布式算法数据集中或分布1.6小结分布式系统特点优点:好的性能/价格比、同分布式应用的匹配能力强、潜在的高可靠性和负载增加时的可扩展性。缺点:软件较复杂、潜在的通信瓶颈和脆弱的安全性。现代计算机系统计算机系统可被组织成多处理机或多计算机。这两种类型都可以是基于总线或基于交换的。前者趋于紧耦合,后者趋于松耦合。多CPU系统的软件分为三类:网络操作系统、分布式操作系统和共享存储器的多处理机。分布式系统的设计透明性、灵活性、可靠性、性能和可伸缩性。
本文标题:分布式系统概述
链接地址:https://www.777doc.com/doc-4080588 .html