您好,欢迎访问三七文档
1Page1XML基础教程Page2第1章XML概述1.1HTML及其局限1.2XML解决方案1.3标记语言概述XML的特点1.4XML的应用1.5XML相关技术1.6Page3XML(eXtensibleMarkupLanguage,可扩展标记语言)是由W3C(WorldWideWebConsortium,万维网联盟)推出的新一代网络数据表示、传递和交换的标准,是Internet环境中跨平台的、依赖于内容的技术。XML被设计的宗旨是表示数据,而非显示数据。Page41.1标记语言概述1.1.1标准通用标记语言SGMLSGML(StandardGeneralizedMarkupLanguage,标准通用标记语言),是一种定义电子文档结构和描述其内容的国际标准语言,是所有电子文档标记语言的起源,早在Web发明之前SGML就已存在。Page51.1.2超文本标记语言HTMLHTML(HyperTextMarkupLanguage,超文本标记语言),是目前网络上应用最广泛的语言,也是构成网页文档的主要语言。Page61.1.3可扩展标记语言XMLXML(eXtensibleMarkupLanguage)即可扩展标记语言,是Internet环境中跨平台的、依赖于内容的技术。Page7XML具有如下一些特点:XML是SGML的简化版本XML揭示了数据本身的含义XML是可扩展的XML是跨平台的XML是结构化的XML是基于文本的XML的数据与其显示格式是分离的XML文档比HTML文档更容易访问Page81.2HTML及其局限1.2.1HTML文档范例HTML提供了一组固定的、预先定义好的元素标记用来标注一般用途的网页元素。常用的元素标记包括:标题、段落、列表、表格、图片与超链接等。HTML在创建普通网页时效果良好,大多数网页的代码都是由HTML标记的内容构成的。Page91.2.2HTML文档基本架构HTML使用各种不同的HTML标记符号来分别标识和设定不同的网页元素,这样的网页元素也被称为HTML元素。每个元素通常由开始标记、结束标记,以及夹在这两个标记中的内容所组成。一个完整的HTML文档由文档头部和文档正文两个部分组成,其基本结构如下。Page10HTMLHEADTITLE网页标题/TITLE/HEADBODYP这是正文部分!/P/BODY/HTMLPage111.2.3HTML文档常用标记常用的HTML标记及其功能如表1-1所示。表1-1HTML网页中常用的标记标记标记功能HTML标识整个网页文档HEAD标识网页头部TITLE标识网页标题内容,此内容将出现在浏览器的标题栏中BODY标识网页的主体部份Page12H1标识第一级标题文字H2标识第二级标题文字H3标识第三级标题文字TABLE标识一个表格TR标识表格中的一行TH标识表格标题行中一个单元格的内容TD标识表格数据行中一个单元格的内容UL设定项目列表(无顺序编号的列表)OL设定项目列表(有顺序编号的列表)Page13LI标识列表中的一个项目(列表项目)P标识一个文字段落IMG标识一个图像A标识链接到其他位置或其他网页的超链接(Anchor元素)FONT标识文字的字体、字号与颜色EM标识一个加强显示的斜体文字区块B标识一个粗体文字区块Page141.2.4HTML的局限HTML的局限性主要表现在如下几个方面:HTML欠缺对文档数据含义的确切描述HTML文档的数据结构层次过于简单HTML页面的数据搜索耗时过长HTML的链接机制不够完善。HTML无法表示非传统组件所构成的文档数据HTML只能使用预先定义的标记,可扩展性差HTML缺乏对双字节字符或多语种文字的良好支持HTML本身的语法不够规范严密,严重影响网络信息传递和共享HTML无法真正实现数据的交互HTML不可重用Page151.3XML解决方案1.3.1XML的实现机制XML使用能够说明数据本质而不是其表象的标记来标注数据,并且把数据的样式信息从文档中分离出来,而将其放入相关的样式表文件中。XML的标记总是成对出现,就像通常使用的括号一样,同时又具有引号的功能,并可采用常见的树型结构进行多层嵌套,这就为程序员的编程处理提供了极大的方便。XML是一种电子文档信息的自定义语言——任何人、任何行业都可遵循这些规则,自己定义各种标记来描述信息中的所有数据元素,使信息能够“自我描述”,然后通过一种被称为解析器的小型程序进行处理。Page161.3.2XML文档实例在创建一个XML文档时,可以由用户自己定义各种标记并以任何名字为它们命名,这就是可扩展标记语言的特性。因此,XML几乎可以用来描述所有形式的文档,从音乐乐谱到数据库中的数据记录。Page17XML如何表示数据在现实生活中存在着大量的有关系的数据,如右图所示。问题,这样的数据如何表示并交给计算机处理呢?movies.xmlPage18XML语言出现的根本目的是描述上图中的关系数据XML是一种通用的数据交换格式在XML语言中他运行自定义标签。一个标签用于描述一段数据,一个标签分为开始标签和结束标签,在起始标签之间,又可以使用其它标签描述其他数据,以此来实现数据关系的描述。XML中的数据必须通过软件程序来解析执行或显示,例如IE,这样的解析程序称之为Parser(解析器)?xmlversion=1.0encoding=GB2312?-!--FileName:movies.xml---影片列表+影片类别=武侠-影片类别=贺岁手机主演葛优、徐帆/主演导演冯小刚/导演片长108分钟/片长出品中凯文化/出品/影片+影片类别=战争+影片类别=动作/影片列表Page191.3.3XML的官方目标XML应该在Internet上直接可用。XML应该支持各类不同的应用程序。XML应该与SGML兼容。XML应该很容易编写处理XML文档的程序。XML中可选功能的数目应该维持在最小值,理想情况是零。XML文档应该是易读的,并且清楚合理的。XML的设计应该能在一定时间内迅速地完成其阶段性的任务。XML的设计应该合乎规范并且简洁。XML文档应该容易建立。Page201.4XML的特点良好的可读性方便的可扩展性数据内容与其形式的分离便于信息的检索可以轻松地跨平台应用支持不同文字不同语种间的信息交互为科学实践与交流提供捷径大大改善网页的超链接性能便于信息的长期保存适合面向对象的程序开发Page211.4.2XML与JavaJava技术产生于20世纪90年代,是最重要的信息技术发展之一。Java不仅是一种高性能的网络编程语言,而且已成为网络世界中一种跨系统的操作平台。XML和Java技术的合作,许多任务可以在客户端完成,从而使得网络更加畅通快捷,同时客户端也可以运行多个应用软件。Page221.4.3XML的不足XML的数据是以树状结构存储的,数据的插入与修改比较困难。XML文档的内容完全以文本形式表现与存储,与采用二进制形式相比其存储量和传输量都将大大增加。XML文档作为数据集合使用时,相当于一个数据库,却不具备数据库管理系统那样完备的功能。XML不能替代HTML。XML是一种元标记语言,任何组织、任何人都可以利用它来定义新的标记和标准,从而将产生一定的混乱与冲突。Page231.5XML的应用1.数据交换2.Web服务3.Web集成4.电子商务5.数据库应用6.网络出版7.特定文档的组织8.系统配置文件Page241.5.2XML的延伸语言1.XHTML(可扩展超文本标记语言)2.VML(矢量标记语言)3.PGML(精确图形标记语言)4.SVG(可缩放矢量图形语言)5.WML(无线标记语言)6.基于XML的其他语言Page251.5.3XML的其他应用1.电子商务框架语言ebXML2.开放电子书籍规范OEB3.基于XML的其他应用Page261.6XML相关技术1.6.1文档类型定义DTD1.6.2层叠样式表CSS1.6.3可扩展样式表语言XSL1.6.4数据源对象DSO1.6.5文档对象模型DOM1.6.6XMLSchema1.6.7Xlink与XpointerPage27谢谢!!
本文标题:1XML概述
链接地址:https://www.777doc.com/doc-3024841 .html