您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 管理学资料 > 本章中将学习到如下内容
第二章XML语法本章中将学习到如下内容:如何编写和读取XML文档XML是如何对文档进行格式化的在那里使用XML,以及如何使用XML严格的语法!一、XML基础语法XML用结构化方式来交换和发布信息的一组标准。XML是一种用来描述和操作符合某种结构的文档的语言。1、XML标记初步一、XML基础语法?xmlversion=1.0?!--Downloadfrom=true513-744-8889/teltel513-744-7098/telemailjdoe@emailaholic.com/email/entryaddress-book(pro2.1abook.xml)一、XML基础语法1、XML标记初步[Analysis]pro2.1abook.xml[Conclusion]XML文档=由字符数据和标记两部分组成的文本字符数据是我们需要的信息;标记记录了文档的结构;XML文档所具有的数据结构:元素组成的树。树的深度没有限制,而且元素可以重复。?xmlversion=1.0?!--Downloadfrom=true513-744-8889/teltel513-744-7098/telemailjdoe@emailaholic.com/email/entryaddress-book(pro2.1abook.xml)一、XML基础语法1、XML标记初步JohnDoe34FountainSquarePlazaCincinnati,OH45202US513-744-8889(preferred)513-744-7098Joe@emailaholic.com(pro2.2abook.txt)[Analysis]pro2.1与pro2.2表达的是相同的信息。但是,软件不具备人的识别能力,应用程序无法处理pro2.2显然:pro2.2abook.txt不包含结构信息。标记将XML文档和普通的文本文件区分开;标记将文本划分为更容易被软读取的元素;一、XML基础语法1、XML标记初步标记的作用:1)元素的开始标记和结束标记元素element:是XML文档的基本组成单位。元素的结构:streetTianshuiRoad/street开始标记结束标记(元素内容)元素名称是由用户命名的,XML规范中规定了如何定义元素,并没有定义元素。一、XML基础语法1、XML标记初步1)元素的开始标记和结束标记!--NOTlegalXMLmarkup--pYadayadayada...pYadayadayada...p...以上的标记是不合乎规则的,没有段落结束标记/p这在HTML中可以接受,但XML解析器会拒绝它。XML文档中,不能省去任何结束标记!2)XML中的名称元素的命名规则:一、XML基础语法1、XML标记初步以字母或下划线(“_”)开头的,字母、数字、下划线、点(“.”)、或连字符(“-”)的字符串;名称中不能使用空格;不能以字符串“xml”作为开头;(XML规范本身使用)可以使用冒号(“:”),专用在名称空间中。大小写敏感;两个比较流行的约定:完全用小写字母来书写名称,当名称中包含多个单词时,用连字符隔开,如address-book。每个单词的首字母大写,不使用分隔符,如AddressBook只是约定而已,不是规范!一、XML基础语法1、XML标记初步2)XML中的名称下面是一些合法的元素名称:copyright-infromation,p,firstname下面是一些不合法的元素名称:123,lastname,tom&jerry!--NOTlegalXMLmarkup--h1Elementsarecasesensitive/H1!--legalXMLmarkup--h1Elementsarecasesensitive/h1分析以下两段代码:HTML中允许XML不允许一、XML基础语法1、XML标记初步3)空元素没有内容的元素称为空元素。通常(不是必须)空元素具有属性。HTML中的换行br和图像img元素就是空元素。br/br简写成br/一、XML基础语法1、XML标记初步4)根元素XML文档必须包含在一个单一元素内,这个单一元素称为根元素。它包含文档中所有文本和所有其它元素。?xmlversion=“1.0”?!--Awell-formeddocument--greetingHello,World!/greetingXML包含在一个根元素greeting中。注释语句一、XML基础语法1、XML标记初步4)根元素?xmlversion=“1.0”?!--Aninvaliddocument--greetingHello,World!/greetinggreetingHola,elMundo!/greeting此文档不包含单一根元素,不管该文档可能包含什么信息,XML解析器会拒绝它。[Question]如何改正上述文档?一、XML基础语法1、XML标记初步5)属性属性是为元素添加的附加信息,属性由名称和值组成。XML文档中的属性有两个规则:属性必须有值;值必须用引号括起来;!--NOTlegalXMLmarkup--olcompact!--legalXMLmarkup--olcompact=“yes”XML解析器会拒绝!引号可以是单引号、或双引号,但XML文档必须保持一致。一、XML基础语法1、XML标记初步5)属性olname=“Doug’scar”使用另一种引号。[Question]如果属性值中包含单引号或双引号,怎么办?[Solution1][Solution2]实体引用实体"代表双引号;实体'代表单引号;一、XML基础语法1、XML标记初步6)元素嵌套子元素:包含在另一个元素中的元素。父元素:包含子元素的元素称为父元素。entrynameJackSmith/nametel513-744-3465/telcommentsNeverleavemessageonhis…/commentsentryentry元素有三个子元素:name,tel,comments。一、XML基础语法1、XML标记初步6)元素嵌套!--NotlegalXMLmarkup--pbIireallylove/bXML./i/p(I)!--legalXMLmarkup--pbIireallylove/i/biXML./i/p(II)在元素b中开始了i元素,必须在b中结束它。大多数HTML解析器接受。但XML解析器拒绝。规定:起始和结束标记必须配对;子元素必须完整地包含在父元素中;一、XML基础语法1、XML标记初步7)XML声明XML声明是文档的第一行。大多数XML文档以XML声明作为开始,它向解析器提供了关于文档的基本信息。(建议使用,但它不是必需的)声明最多可以包含三个名称-值对。(“属性”,但技术上不是)?xmlversion=“1.0”encoding=“ISO-8859-1”standalone=“no”版本1.0文档所使用的字符集ISO-8859-1大多数西欧字符;UTF-8(默认)支持所有语言的字符;(Unicode标准)定义了是否可以在不读取任何其它文件的情况下处理该文档。默认值为no。2、XML文档中的其它项8)注释一、XML基础语法注释以!--开始,以--结束。注释可以出现在文档的任何位置,包括根元素的前面或后面。注意:注释不能在结束部分以外包含双连字符(--),除此之外,注释可以包含任何内容。注释内容将被解析器忽略,即注释内的标记也会被忽略。一、XML基础语法2、XML文档中的其它项9)处理指令(ProcessingInstruction,PI)处理指令是为使用一段特殊代码而设计的标记。处理指令包含在?和?中。?xmlversion=“1.0”encoding=“ISO-8859-1”?第一个单词是目标,它指明该指令所针对的应用程序或设备。剩余部分是目标专用格式,这一部分不一定必须是XML。P43一、XML基础语法2、XML文档中的其它项10)UnicodeUnicode是由统一编码联盟(UnicodeConsortium)发布的,它是对ASCII字符集进行的一项扩展。也发布了同一个标准,ISO/IEC10646Unicode支持所有的语言(地球上存在的)以及数学和其他符号。支持英语、西欧语言、西里尔语、日语、汉语等等。ASCII字符集:8byte----一个字符;Unicode字符集:16byte----一个字符;[Question]XML文档比普通文本大一倍吗?一、XML基础语法2、XML文档中的其它项10)Unicode[Conclusion]理论上是;实际中:大多数并不需要16位;XML能够识别两种编码:UTF-8和UTF-16UTF-8:为英语使用8位,其他字符使用16位或24位;UTF-16:对所有的字符都按16位编码。ISO8859-1,即Latin-1,Windows默认字符集。除了UTF-8和UTF-16外,需使用encoding指出所使用的编码。一、XML基础语法2、XML文档中的其它项11)实体(entity)XML中使用实体在物理上为文档进行组织,实体有时候等价于文件,有时候是字符串。用法:通过实体引用来将实体(entityreference)插入文档中。&+实体名称+;[Example]如:已经定义了实体“us”的值为“UnitedStates”,则以下两行代码等价。county&us;/countrycountryUnitedStates/country一、XML基础语法2、XML文档中的其它项11)实体(entity)预定义的实体:1)<2)&&3)>4)'属性值中的单引号‘5)"属性值中的双引号“companyMarks&Spencer/company解析器无法解析&companyMarks&Spencer/company二、XML语法补充1、特殊属性xml:space作用:告诉XML解析器,空格该如何处理。取值:preserve保留所有的空格default忽略重复的空格XML规范中,空格是四种字符的任意组合序列:空格字符(space),对应字符值为#x20返回字符(CarriageReturn)
本文标题:本章中将学习到如下内容
链接地址:https://www.777doc.com/doc-3331228 .html