hadoop源码分析-HDFS部分

1、2008-11-04Hadoop源代码分析（一）总括关键字:分布式云计算经济不行啦，只好潜心研究技术。Google的核心竞争技术是它的计算平台。Google的大牛们用了下面5篇文章，介绍了它们的计算设施。GoogleCluster：：：：：很快，Apache上就出现了一个类似的解决方案，目前它们都属于Apache的Hadoop项目，对应的分别是：Chubby--ZooKeeperGFS--HDFSBigTable--HBaseMapReduce--Hadoop目前，基于类似思想的OpenSource项目还很多，如Facebook用于用户分析的Hive。HDFS作为一个分布式文件系统，是所有这些项目的基础。分析好HDFS，有利于了解其他系统。由于Hadoop的HDFS和MapReduce是同一个项目，我们就把他们放在一块，进行分析。下图是MapReduce整个项目的顶层包图和他们的依赖关系。Hadoop包之间的依赖关系比较复杂，原因是HDFS提供了一个分布式文件系统，该系统提供API，可以屏蔽本地文件系统和分布式文件系统，甚至象AmazonS3这样的在线存储系统。这就造成了分布式文件系。

2、统的实现，或者是分布式文件系统的底层的实现，依赖于某些貌似高层的功能。功能的相互引用，造成了蜘蛛网型的依赖关系。一个典型的例子就是包conf，conf用于读取系统配置，它依赖于fs，主要是读取配置文件的时候，需要使用文件系统，而部分的文件系统的功能，在包fs中被抽象了。Hadoop的关键部分集中于图中蓝色部分，这也是我们考察的重点。2008-11-19Hadoop源代码分析（二）包的功能分析下面给出了Hadoop的包的功能分析。PackagePackagePackagePackageDependencesDependencesDependencesDependencestool提供一些命令行工具，如DistCp，archivemapreducemapreducemapreducemapreduceHadoop的Map/Reduce实现filecache提供HDFS文件的本地缓存，用于加快Map/Reduce的数据访问速度fsfsfsfs文件系统的抽象，可以理解为支持多种文件系统实现的统一文件访问接口hdfshdfshdfshdfsHDFS，Hadoop的分布式文件系统实现ipcipci。

3、pcipc一个简单的IPC的实现，依赖于io提供的编解码功能参考：表示层。将各种数据编码/解码，方便于在网络上传输2008-11-25Hadoop源代码分析（三）对象序列化由于Hadoop的MapReduce和HDFS都有通信的需求，需要对通信的对象进行序列化。Hadoop并没有采用Java的序列化，而是引入了它自己的系统。org.apache.hadoop.io中定义了大量的可序列化对象，他们都实现了Writable接口。实现了Writable接口的一个典型例子如下：Java代码1.publicclassMyWritableimplementsWritable{2.//Somedata3.privateintcounter;4.privatelongtimestamp;5.6.publicvoidwrite(DataOutputout)throwsIOException{7.out.writeInt(counter);8.out.writeLong(timestamp);9.}10.11.publicvoidreadFields(DataInputin)throwsIOExcepti。

4、on{12.counter=in.readInt();13.timestamp=in.readLong();14.}15.16.publicstaticMyWritableread(DataInputin)throwsIOException{17.MyWritablew=newMyWritable();18.w.readFields(in);19.returnw;20.}21.}其中的write和readFields分别实现了把对象序列化和反序列化的功能，是Writable接口定义的两个方法。下图给出了庞大的org.apache.hadoop.io中对象的关系。net封装部分网络功能，如DNS，socketsecurity用户和用户组信息conf系统的配置参数metrics系统统计数据的收集，属于网管范畴util工具类record根据DDL（数据描述语言）自动生成他们的编解码函数，目前可以提供C++和Javahttp基于Jetty的HTTPServlet，用户通过浏览器可以观察文件系统的一些状态信息和日志log提供HTTP访问日志的HTTPServlet这里，我把ObjectWrita。

5、ble标为红色，是因为相对于其他对象，它有不同的地位。当我们讨论Hadoop的RPC时，我们会提到RPC上交换的信息，必须是Java的基本类型，String和Writable接口的实现类，以及元素为以上类型的数组。ObjectWritable对象保存了一个可以在RPC上传输的对象和对象的类型信息。这样，我们就有了一个万能的，可以用于客户端/服务器间传输的Writable对象。例如，我们要把上面例子中的对象作为RPC请求，需要根据MyWritable创建一个ObjectWritable，ObjectWritable往流里会写如下信息对象类名长度，对象类名，对象自己的串行化结果这样，到了对端，ObjectWritable可以根据对象类名创建对应的对象，并解串行。应该注意到，ObjectWritable依赖于WritableFactories，那存储了Writable子类对应的工厂。我们需要把MyWritable的工厂，保存在WritableFactories中（通过WritableFactories.setFactory）。2008-11-25Hadoop源代码分析（四）compress分。

6、析预留为org.apache.hadoop.io.compressorg.apache.hadoop.io.compressorg.apache.hadoop.io.compressorg.apache.hadoop.io.compress等的分析预留位置2008-11-25Hadoop源代码分析（五）RPC框架介绍完org.apache.hadoop.io以后，我们开始来分析org.apache.hadoop.rpc。RPC采用客户机/服务器模式。请求程序就是一个客户机，而服务提供程序就是一个服务器。当我们讨论HDFS的，通信可能发生在：•Client-NameNode之间，其中NameNode是服务器•Client-DataNode之间，其中DataNode是服务器•DataNode-NameNode之间，其中NameNode是服务器•DataNode-DateNode之间，其中某一个DateNode是服务器，另一个是客户端如果我们考虑Hadoop的Map/Reduce以后，这些系统间的通信就更复杂了。为了解决这些客户机/服务器之间的通信，Hadoop引入了一个RPC框架。该RPC。

7、框架利用的Java的反射能力，避免了某些RPC解决方案中需要根据某种接口语言（如CORBA的IDL）生成存根和框架的问题。但是，该RPC框架要求调用的参数和返回结果必须是Java的基本类型，String和Writable接口的实现类，以及元素为以上类型的数组。同时，接口方法应该只抛出IOException异常。（参考自）既然是RPC，当然就有客户端和服务器，当然，org.apache.hadoop.rpc也就有了类Client和类Server。但是类Server是一个抽象类，类RPC封装了Server，利用反射，把某个对象的方法开放出来，变成RPC中的服务器。下图是org.apache.hadoop.rpc的类图。2008-11-27Hadoop源代码分析（六）RPC-Client既然是RPC，自然就有客户端和服务器，当然，org.apache.hadoop.rpc也就有了类Client和类Server。在这里我们来仔细考察org.apache.hadoop.rpc.Client。下面的图包含了org.apache.hadoop.rpc.Client中的关键类和关键方法。由于Clien。

8、t可能和多个Server通信，典型的一次HDFS读，需要和NameNode打交道，也需要和某个/某些DataNode通信。这就意味着某一个Client需要维护多个连接。同时，为了减少不必要的连接，现在Client的做法是拿ConnectionId（图中最右侧）来做为Connection的ID。ConnectionId包括一个InetSocketAddress（IP地址+端口号或主机名+端口号）对象和一个用户信息对象。这就是说，同一个用户到同一个InetSocketAddress的通信将共享同一个连接。连接被封装在类Client.Connection中，所有的RPC调用，都是通过Connection，进行通信。一个RPC调用，自然有输入参数，输出参数和可能的异常，同时，为了区分在同一个Connection上的不同调用，每个调用都有唯一的id。调用是否结束也需要一个标记，所有的这些都体现在对象Client.Call中。Connection对象通过一个Hash表，维护在这个连接上的所有Call：Java代码1.privateHashtableInteger,Callcalls=newHash。

9、tableInteger,Call();一个RPC调用通过addCall，把请求加到Connection里。为了能够在这个框架上传输Java的基本类型，String和Writable接口的实现类，以及元素为以上类型的数组，我们一般把Call需要的参数打包成为ObjectWritable对象。Client.Connection会通过socket连接服务器，连接成功后回校验客户端/服务器的版本号（Client.ConnectionwriteHeader()方法），校验成功后就可以通过Writable对象来进行请求的发送/应答了。注意，每个Client.Connection会起一个线程，不断去读取socket，并将收到的结果解包，找出对应的Call，设置Call并通知结果已经获取。Call使用Obejct的wait和notify，把RPC上的异步消息交互转成同步调用。还有一点需要注意，一个Client会有多个Client.Connection，这是一个很自然的结果。2008-11-27Hadoop源代码分析（七）RPC-Server聊完了Client聊Server，按惯例，先把类图贴出来。需。

10、要注意的是，这里的Server类是个抽象类，唯一抽象的地方，就是Java代码1.publicabstractWritablecall(Writableparam,longreceiveTime)throwsIOException;这表明，Server提供了一个架子，Server的具体功能，需要具体类来完成。而具体类。