您好,欢迎访问三七文档
第1篇概述第1章云计算概述【内容提要】本章是对云计算进行概念性介绍,试图从外在形态到内部结构等多种视角认识云计算,并展示云计算的本质特征和历史演进。■云计算的特征■云计算的支撑技术■云计算落地的主要形态云计算已成为近年来非常热门的一个词,其涵义阐述可谓众说纷纭。对于云计算的认识,有的侧重于运营模式、有的侧重于技术架构和技术产品。基于技术的观点,有的强调并行集群、有的强调虚拟化。不同的企业更是根据自己的商业应用,有的强调服务器、有的强调用户端、有的强调网络、有的强调存储。给云计算下一个广泛认同的定义也许是一件困难的事,但每个人都会在心中有一个“云计算”的景象,它是各自在各自不同场景下对云计算的真实感受。1.1从案例看云计算先从几个真实的案例认识一下什么是云计算。案例一:2008年3月19日,美国国家档案馆公开了希拉里·克林顿在1993—2001年作为第一夫人期间的白宫日程档案。这些档案具有极高的社会关注度与新闻时效性,华盛顿邮报希望在第一时间上传互联网,以便公众查询。但这些档案都是不可检索的PDF文件,若想将其转换为可以检索并便于浏览的文件格式,需要进行再处理。而以华盛顿邮报当时所拥有的计算能力,需要超过一年的时间才能完成全部档案的格式转换工作。显然,这样的效率不能满足新闻的时效性和公众对于信息的期盼。因此,华盛顿邮报将这个档案的转换工程交给AmazonEC2(ElasticComputeCloud)。AmazonEC2同时使用200个虚拟服务器实例,在9个小时内将所有的档案转换完毕,以最快的速度将这些第一手资料呈现给读者。华盛顿邮报在9个小时内使用了1407小时的虚拟服务器机时,仅需要向Amazon公司支付144.62美元的费用。案例二:Giftag是一款Web2.0应用,其以插件的形式安装在Firefox和IE浏览器上。互联网用户在浏览网页时,可以利用这个插件将心仪的商品加入到由Giftag维护的商品清单中。这个应用一经推出,便广泛流行起来,注册用户数量激增,每天Giftag的服务器都要响应数以百万计的请求,并存储用户提交的海量信息,服务器很快就不堪重负。为此,Giftag将应用迁移到GoogleAppEngine(GAE)平台,基于GAE开放的API,Giftag可以利用Google具有可伸缩性的计算处理性能响应高峰期的用户请求,利用Google的分布式数据库存储用户数据。Giftag从一个初创的Web2.0应用平稳过渡到一个稳定的、持续增长的网络服务。在这一过程中,Giftag公司避开了高昂的基础设施投入风险和Web应用复杂的软件配置。在GAE平台上,Giftag可以将自己的精力集中于应用本身,而将诸如服务器动态扩展、数据库访问、负载均衡等各个层次的问题交给GAE平台来解决。正是由于GAE将Web应用所需的基础功能作为服务提供给了Giftag,才使得其可以专注于应用的开发和优化。案例三:哈根达斯是著名的冰激凌供应商,其加盟店遍布世界各地。公司需要一个CRM(客户关系管理)系统对所有的加盟店进行管理。当时哈根达斯用Excel表单来管理和跟踪主要的加盟店,用Access数据库来存储协议加盟店的数据,通过虚拟专用网(VPN)来访问数据库。因此,公司急需一个能够让分布在各地的员工沟通协作的解决方案,并且该方案应该能够根据不同的需求进行灵活配置。哈根达斯公司选择了SalesforceCRM企业版,应用系统在不到6个月的时间就上线了。哈根达斯公司用更少的成本获得了超预期的效果。如果哈根达斯公司要搭建自己的CRM平台,传统的做法是先聘请一支专业的顾问团队研究公司的业务流程,建模分析并提出咨询报告。然后再雇用一家IT外包公司,进驻自己的公司对平台进行开发。同时,还需要购买服务器、交换机、防火墙、各种各样的软件,以及租用带宽等。哈根达斯公司采用如同在超市选购商品一样选择自己需要的功能模块,让Salesforce.com进行定制集成一个属于自己的CRM系统,系统的上线和维护也将由Salesforce.com的专业团队负责。上述案例如果说是典型的云计算应用,我们就可以从用户的视角归纳出一些云计算的关键特征。网络是实现云计算的基础。云计算是伴随互联网的进步而发展的。当互联网用户的网络传输速度普遍在14.4kbps拨号接入等低速网络带宽时,没有人会考虑采用云计算。云计算时代的用户将严重依赖网络。只有网络通畅才能按需向用户提供服务。云计算提供按需分配和使用计算资源、存储资源和应用软件资源的能力。用户根据实际需求向服务商动态购买计算资源、存储资源和应用软件资源,而不是直接采购软硬件系统。以网络为基础,按需分配和使用计算资源、存储资源和应用软件资源,这是一个再朴素不过的逻辑。因此,云计算的出现是自然的,更是必然的。云计算并不是突然出现的,可以找出其发源和演变的历史轨迹。电厂模式。从其他行业取经对IT行业本身发展是不可或缺的一步。在IT界,“电厂模式”的概念有着深远的影响,许许多多的IT人在不断地实践着这个理念。电厂模式的意思是利用电厂的规模效应来降低电力的价格,并让用户使用起来更方便,且无需维护和购买任何发电设备。效用计算。在20世纪60年代,计算设备的价格非常昂贵,很多人就产生了共享计算资源的想法。人工智能之父麦肯锡1961年在一次会议上提出了“效用计算”(utilitycomputing)的概念,其目标是整合分散在各地的服务器、存储系统以及应用程序,将其共享给多个用户,让用户能够像把灯泡插入灯座一样来使用计算机资源,并且根据其使用量来付费。但由于当时互联网等很多强大的技术还未诞生,尽管这个想法一直都为人称道,但难以将其变为现实。网格计算。网格计算中的网格含义是“grid”,其英文原意就是来源于电力的格。网格计算主要研究如何把一个需要非常巨大的计算能力才能解决的问题分成许多小的部分,然后把这些部分分配给许多相对低性能的计算机来处理,最后把这些计算结果综合起来。网格计算没能在工程界和商业界取得预期的成功,普遍认为是由于其过于技术化,忽略了普通用户的现实需求。今天的云计算与前面的电厂模式、效用计算、网格计算何其类似,都是希望IT技术能像使用电力那样方便,并且成本低廉。但与效用计算和网格计算不同的是,今天许多关键性的支撑技术日渐成熟,用户的需求也渐成规模。让我们借助尼古拉斯·卡尔在《大转变》中有关电力发展史的描述再讲述一下“电厂模式”:“开始因为直流电传输距离短,所以发电机成为很多需要使用电力的企业和个人的选择,但是由于长距离传输交流电技术的不断成熟,英特尔的关于电厂的想法成为了现实;之后由于电厂规模不断增大,电力的价格也随之降低,而且使用起来更方便;最后,电厂模式成为了主流。”回过头来再审视一下IT技术的发展,会与电力技术的发展相似吗?发电机好比现在的机房及基础设施,交流电技术好比现在的互联网,而电厂和云计算数据中心更是何其相似。“电厂模式”的愿景是美好的,只要接入网络,企业和个人就能按需使用计算资源、存储资源和应用软件资源,同时卸去了维护系统的重担,而且价格低廉。但现实是:要真正实现“电厂模式”,绝不是一朝一夕的事情。1.2从服务产品看云计算上述云计算用户案例涉及的AmazonEC2、GoogleAppEngine(GAE)、Salesforce.com也可以说是当前比较典型的云计算服务产品了。现在我们认识一下这些云计算服务产品。1.2.1Amazon云计算服务简介在开展云计算服务之前,亚马逊(Amazon.com)是美国最大的基于B2C的电子商务公司。为了满足旺季的销售需要,Amazon不得不购买很多服务器以应对超常的客户访问量。但是旺季过去之后,这些服务器就处于闲置状态而得不到充分的利用。为了让这些服务器能够得到充分的利用,Amazon开始尝试将这些物理服务器虚拟成虚拟服务器,并以在线交易的形式租给愿意花钱购买虚拟服务器的客户,这就是今天Amazon云计算服务的雏形。1.AmazonEC2AmazonElasticComputingCloud(EC2,亚马逊弹性计算云)是Amazon向公共用户出租虚拟机的商业化服务。任何用户只需要创建一个账号,并绑定有效的信用卡,即可获得一台完全属于自己的虚拟服务器。用户登录服务界面,选择希望虚拟服务运行的“Region”和“zone”后(相当于选择运行虚拟服务的数据中心),就可以创建自己的虚拟服务器了。虚拟服务器的创建过程很简单,只需按照EC2的提示一步一步进行即可。EC2提示用户选CPU个数、内存容量、硬盘容量等配置参数;然后,EC2会询问用户需要安装的操作系统,如Windows或Linux;更进一步,用户可以根据EC2提供的工具创建一个个性化的操作系统,这个个性化的操作系统可能是修改过内核模块的Linux操作系统,或者预装了一些软件的Windows操作系统等。另外,用户可以通过一个简单的防火墙界面,设置虚拟服务器的网络安全策略。上述创建过程完成后,用户只需单击Launch按钮,EC2就开始进行虚拟服务器的部署了。几分钟之内,用户就可以对其进行访问了。在使用过程中,用户还可以结合监控服务,对虚拟机的资源使用状况(例如CPU、网络等)进行实时的观察。除此以外,用户还可以为某项性能指标设定阈值,一旦某项指标超过了阈值,EC2会自动为用户再分配一台虚拟机。因此,通过监控和联动操作,用户能够获得可弹性伸缩的能力。EC2提供的虚拟服务器在用户看来是一台完全独立的服务器,用户甚至感觉不出这是一台虚拟的服务器。通过EC2所提供的服务,用户不仅可以非常方便地申请所需要的计算资源,而且可以灵活地定制所拥有的资源,如用户拥有虚拟的所有权限,可以根据需要定制操作系统,安装所需的软件。最后,用户可以根据业务的需求自由地申请或者终止资源使用,而只需为实际使用的资源数量付费。EC2的虚拟服务器与拥有一台传统意义上的服务器还是存在一些值得注意的差别。EC2由AmazonMachineImage(AMI)、EC2虚拟机实例和AMI运行环境组成。AMI是一个用户可定制的虚拟机镜像,是包含了用户的所有软件和配置的虚拟环境,是EC2部署的基本单位。AMI被部署到EC2的运行环境后就产生了一个EC2虚拟机实例,由同一个AMI创建的所有实例都拥有相同的配置。需要注意的是,EC2虚拟机实例内部并不保存系统的状态信息,存储在实例中的动态信息将随着它的终止而丢失。用户需要借助Amazon的数据持久化服务保存用户数据,这些服务包括AmazonSimpleStorageService(S3,亚马逊简单存储服务)、AmazonSimpleDB(亚马逊简单数据库)、AmazonSimpleQueueService(SQS,亚马逊简单队列服务)。2.AmazonS3AmazonSimpleStorageService(S3)是云计算平台提供的可靠的网络存储服务。通过S3,个人用户可以将自己的数据放到存储云上,通过互联网进行访问和管理。同时,Amazon公司的其他服务也可以直接访问S3。作为云平台上的存储服务,S3具有与本地存储不同的特点。S3采用的按需付费方式节省了用户使用数据服务的成本。S3既可以单独使用,也可以同Amazon公司的其他服务结合使用。云平台上的应用程序可以通过REST或者SOAP接口访问S3中的数据。以REST接口为例,S3中的所有资源都有唯一的URI标识符,通过向指定的URI发出HTTP请求,就可以完成数据的上传、下载、更新或者删除等操作。为了保证数据服务的可靠性,S3采用了冗余备份的存储机制,存放在S3中的所有数据都会在其他位置备份,保证部分数据失效不会导致应用失效。在后台,S3保证不同备份之间的一致性,将更新的数据同步到该数据的所有备份上。3.AmazonSimpleDBAmazonSimpleDB是一种支持结构化数据存储和查询操作的轻量级数据库服务。与传统的关系数据库不同,SimpleDB不需要预先设计和定义任何数据库Schema,只需定义属性和项,即可用简单的服务接口对数据进行创建、查询、更新或删除操作。Simp
本文标题:云计算概述
链接地址:https://www.777doc.com/doc-1889398 .html