您好,欢迎访问三七文档
1第七章文件管理第七章文件管理7.1文件和文件系统7.2文件的逻辑结构7.3文件目录7.4文件共享7.5文件保护2第七章文件管理文件系统的管理功能是将其管理的程序和数据通过组织为一系列文件的方式实现的。而文件则是指具有文件名的若干相关元素的集合。元素通常是记录,而记录又是一组有意义的数据项的集合。可见,基于文件系统的概念,可以把数据组成分为数据项、记录和文件三级。7.1文件和文件系统3第七章文件管理7.1.1数据项、记录和文件1.数据项在文件系统中,数据项是最低级的数据组织形式,可把它分成以下两种类型:(1)基本数据项。用于描述一个对象的某种属性的字符集,是数据组织中可以命名的最小逻辑数据单位,又称为字段。(2)组合数据项。由若干个基本数据项组成的,简称组项。4第七章文件管理基本数据项除了数据名外,还应有数据类型。因为基本项仅是描述某个对象的属性,根据属性的不同,需要用不同的数据类型来描述。例如,在描述学生的学号时,应使用整数;描述学生的姓名则应使用字符串(含汉字);描述性别时,可用逻辑变量或汉字。可见,由数据项的名字和类型两者共同定义了一个数据项的“型”。而表征一个实体在数据项上的数据则称为“值”。例如,学号/30211、姓名/王有年、性别/男等。5第七章文件管理2.记录记录是一组相关数据项的集合,用于描述一个对象在某方面的属性。一个记录应包含哪些数据项,取决于需要描述对象的哪个方面。由于对象所处的环境不同可把他作为不同的对象。在诸多记录中,为了能惟一地标识一个记录,必须在一个记录的各个数据项中,确定出一个或几个数据项,把它们的集合称为关键字(key)。或者说,关键字是惟一能标识一个记录的数据项。6第七章文件管理3.文件文件是指由创建者所定义的、具有文件名的一组相关元素的集合,可分为有结构文件和无结构文件两种。在有结构的文件中,文件由若干个相关记录组成;而无结构文件则被看成是一个字符流。文件在文件系统中是一个最大的数据单位,它描述了一个对象集。7第七章文件管理文件属性可以包括:(1)文件类型。可以从不同的角度来规定文件的类型,如源文件、目标文件及可执行文件等。(2)文件长度。文件长度指文件的当前长度,长度的单位可以是字节、字或块,也可能是最大允许的长度。(3)文件的物理位置。该项属性通常是用于指示文件在哪一个设备上及在该设备的哪个位置的指针。(4)文件的建立时间。这是指文件最后一次的修改时间等。8第七章文件管理图7-1文件、记录和数据项之间的层次关系9第七章文件管理7.1.2文件名和类型1.文件名和扩展名(1)文件名。(2)扩展名。10第七章文件管理2.文件类型1)按用途分类根据文件的性质和用途的不同,可将文件分为三类:(1)系统文件,这是指由系统软件构成的文件。大多数的系统文件只允许用户调用,但不允许用户去读,更不允许修改;有的系统文件不直接对用户开放。(2)用户文件,指由用户的源代码、目标文件、可执行文件或数据等所构成的文件。用户将这些文件委托给系统保管。(3)库文件,这是由标准子例程及常用的例程等所构成的文件。这类文件允许用户调用,但不允许修改。11第七章文件管理2)按文件中数据的形式分类按这种方式分类,也可把文件分为三类:(1)源文件,这是指由源程序和数据构成的文件。通常,由终端或输入设备输入的源程序和数据所形成的文件都属于源文件。它通常是由ASCII码或汉字所组成的。(2)目标文件,这是指把源程序经过编译程序编译过,但尚未经过链接程序链接的目标代码所构成的文件。目标文件所使用的后缀名是“.obj”。(3)可执行文件,这是指把编译后所产生的目标代码经过链接程序链接后所形成的文件。其后缀名是 .exe。12第七章文件管理3)按存取控制属性分类根据系统管理员或用户所规定的存取控制属性,可将文件分为三类:(1)只执行文件,该类文件只允许被核准的用户调用执行,不允许读和写。(2)只读文件,该类文件只允许文件主及被核准的用户去读,不允许写。(3)读写文件,这是指允许文件主和被核准的用户去读或写的文件。13第七章文件管理4)按组织形式和处理方式分类根据文件的组织形式和系统对其处理方式的不同,可将文件分为三类:(1)普通文件。(2)目录文件。(3)特殊文件。14第七章文件管理7.1.3文件系统的层次结构如图所示,文件系统的模型可分为三个层次:最底层是对象及其属性,中间层是对对象进行操纵和管理的软件集合,最高层是文件系统提供给用户的接口。15第七章文件管理1.对象及其属性文件管理系统管理的对象如下:(1)文件。(2)目录。(3)磁盘(磁带)存储空间。16第七章文件管理2.对对象操纵和管理的软件集合该层是文件管理系统的核心部分。文件系统的功能大多是在这一层实现的,其中包括有:①对文件存储空间的管理;②对文件目录的管理;③用于将文件的逻辑地址转换为物理地址的机制;④对文件读和写的管理;⑤对文件的共享与保护等功能。在实现这些功能时,OS通常都采取了层次组织结构,即在每一层中都包含了一定的功能,处于某个层次的软件,只能调用同层或更低层次中的功能模块。17第七章文件管理3.文件系统的接口为方便用户的使用,文件系统以接口的形式提供了一组对文件和记录操作的方法和手段。通常是下面两种类型的接口:(1)命令接口,是指作为用户与文件系统直接交互的接口,用户可通过键盘终端键入命令取得文件系统的服务。(2)程序接口,是指作为用户程序与文件系统的接口,用户程序可通过系统调用取得文件系统的服务,例如,用于创建文件的系统调用Creat,用于打开一个文件的系统调用Open等。18第七章文件管理7.1.4文件操作1.最基本的文件操作最基本的文件操作包含下述内容:(1)创建文件。(2)删除文件。(3)读文件。(4)写文件。(5)设置文件的读/写位置。19第七章文件管理2.文件的“打开”和“关闭”操作当用户要求对一个文件实施多次读/写或其它操作时,每次都要从检索目录开始。为了避免多次重复地检索目录,在大多数OS中都引入了“打开”(open)这一文件系统调用,当用户第一次请求对某文件进行操作时,须先利用open系统调用将该文件打开。20第七章文件管理3.其它文件操作OS为用户都提供了一系列文件操作的系统调用,其中最常用的一类是有关对文件属性的操作,即允许用户直接设置和获得文件的属性,如改变已存文件的文件名、改变文件的拥有者(文件主)、改变对文件的访问权,以及查询文件的状态(包括文件类型、大小和拥有者以及对文件的访问权等)。另一类是有关目录的操作,如创建一个目录,删除一个目录,改变当前目录和工作目录等。此外,还有用于实现文件共享的系统调用,以及用于对文件系统进行操作的系统调用等。21第七章文件管理(1)文件的逻辑结构(FileLogicalStructure)。从用户观点出发看到的文件组织形式,文件由一系列逻辑记录构成。(2)文件的物理结构,又称为文件的存储结构。系统将文件存储在外存上形成的一种存储组织形式,与所采用的外存分配方式有关。7.2文件的逻辑结构22第七章文件管理7.2.1文件逻辑结构的类型文件逻辑结构的基本要求,首先是有助于提高对文件的检索速度,即在将大批记录组成文件时,应采用一种有利于提高检索记录速度和效率的逻辑结构形式。其次是该结构应方便对文件进行修改,即便于在文件中增加、删除和修改一个或多个记录。第三是降低文件存放在外存上的存储费用,即尽量减少文件占用的存储空间,不要求大片的连续存储空间。23第七章文件管理1.按文件是否有结构分类1)有结构文件(1)定长记录。(2)变长记录。24第七章文件管理2)无结构文件在大量的信息管理系统和数据库系统中,广泛采用了有结构的文件形式(即文件是由定长或变长记录构成的),在系统中运行的大量的源程序、可执行文件、库函数等,所采用的是无结构的文件形式,即流式文件。其文件的长度是以字节为单位的。可以把流式文件看做是记录式文件的一个特例:一个记录仅有一个字节。25第七章文件管理2.按文件的组织方式分类根据文件的组织方式,可把有结构文件分为三类:(1)顺序文件。(2)索引文件。(3)索引顺序文件。26第七章文件管理7.2.2顺序文件(SequentialFile)1.顺序文件的排列方式在顺序文件中的记录,可以按照各种不同的顺序进行排列。一般地,可分为两种情况:(1)串结构。按存入时间排序,顺序与关键字无关。(2)顺序结构。按关键字排序。27第七章文件管理2.顺序文件的优缺点顺序文件的最佳应用场合是在对文件中的记录进行批量存取时(即每次要读或写一大批记录)。所有逻辑文件中顺序文件的存取效率是最高的。此外,对于顺序存储设备(如磁带),也只有顺序文件才能被存储并能有效地工作。28第七章文件管理7.2.3记录寻址1.隐式寻址方式对于定长记录的顺序文件,如果已知当前记录的逻辑地址,便很容易确定下一个记录的逻辑地址。29第七章文件管理2.显式寻址方式该方式可用于对定长记录的文件实现直接或随机访问。因为任何记录的位置都很容易通过记录长度计算出来。而对于可变长度记录的文件则不能利用显式寻址方式实现直接或随机访问,必须增加适当的支持机构方能实现。通过两种方式对定长记录实现随机访问:(1)通过文件中记录的位置。(2)利用关键字。30第七章文件管理7.2.4索引文件(IndexFile)1.按关键字建立索引定长记录的文件可以通过简单的计算,很容易地实现随机查找。但变长记录文件查找一个记录必须从第一个记录查起,一直顺序查找到目标记录为止,耗时很长。为了解决这一问题,可为变长记录文件建立一张索引表,对主文件中的每个记录,在索引表中设有一个相应的表项,用于记录该记录的长度L及指向该记录的指针(指向该记录在逻辑地址空间的首址)。31第七章文件管理图7-4具有单个和多个索引表的索引文件32第七章文件管理2.具有多个索引表的索引文件使用按关键字建立索引表的索引文件与顺序文件一样,都只能按该关键字进行检索。而实际应用情况往往是:不同的用户,为了不同的目的,希望能按不同的属性(或不同的关键字)来检索一条记录。为实现此要求,需要为顺序文件建立多个索引表,即为每一种可能成为检索条件的域(属性或关键字)都配置一张索引表。在每一个索引表中,都按相应的一种属性或关键字进行排序。33第七章文件管理7.2.5索引顺序文件(IndexSequentialFile)1.索引顺序文件的特征索引顺序文件是对顺序文件的一种改进,它基本上克服了变长记录的顺序文件不能随机访问,以及不便于记录的删除和插入的缺点。但它仍保留了顺序文件的关键特征,即记录是按关键字的顺序组织起来的。它又增加了两个新特征:一个是引入了文件索引表,通过该表可以实现对索引顺序文件的随机访问;另一个是增加了溢出(overflow)文件,用它来记录新增加的、删除的和修改的记录。34第七章文件管理2.一级索引顺序文件最简单的索引顺序文件只使用了一级索引。其具体的建立方法是,首先将变长记录顺序文件中的所有记录分为若干个组,如50个记录为一个组。然后为顺序文件建立一张索引表,并为每组中的第一个记录在索引表中建立一个索引项,其中含有该记录的关键字和指向该记录的指针。索引顺序文件是最常见的35第七章文件管理图7-5索引顺序文件36第七章文件管理3.对于一个非常大的文件,为找到一个记录而须查找的记录数目仍然很多,例如,对于一个含有106个记录的顺序文件,当把它作为索引顺序文件时,为找到一个记录,平均须查找1000个记录。为了进一步提高检索效率,可以为顺序文件建立多级索引,即为索引文件再建立一张索引表,从而形成两级索引表。37第七章文件管理7.2.6直接文件和哈希文件1.直接文件采用前述几种文件结构对记录进行存取时,都须利用给定的记录键值,先对线性表或链表进行检索,以找到指定记录的物理地址。然而对于直接文件,则可根据给定的关键字直接获得指定记录的物理地址。换而言之,关键字本身就决定了记录的物理地址。38第七章文件管理2.哈希(Hash)文件这是目前应用最为广泛的一种直接文件。它利用Hash函数(或称散列函数)可将关键字转换为相应
本文标题:第7章文件管理
链接地址:https://www.777doc.com/doc-3257230 .html