您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 公司方案 > 第五章数字出版信息组织.
电子书(数字图书)光盘、互联网、无线网等渠道获得计算机、平板电脑、电子阅读器、手机上阅读特点直接由计算机或其他电子设备存储、检索、显示和处理制作非常简单,可使用专用工具载体多样化经由互联网、移动互联网等通道非常快速地传播方便检索和永久保存问题:为什么出版业没有充分受益?纠结!第五章数字出版信息组织5.1数字文档方式数字出版中所用到的文档形式,在实际中最典型有四种图像方式公司自有格式PDF标准格式标记语言方式数字文档方式图像方式图像方式指对印刷稿直接用扫描仪扫描成图像,阅读时原样显示图像实现简单,占存储容量大,不能用于全文检索和超文本链接只出现在早期,现在基本不再使用观点:图像方式并不是合适的数字文档形式图像方式应用文本转化为图像形式显示,以降低被盗版风险数字文档方式公司自有阅读格式微软(LIT)、Adobe(PDF),国内超星(PDG)、方正(CEB)、书生等,全部拥有自有格式和浏览工具用户使用不同阅读器,一定程度上增加用户阅读成本,可能无形中造成数字图书用户流失观点:竞争后的事实标准数字文档方式PDF格式与印刷密切相关继PostScript(解决符号字型描述的标准化)之后的一项重要技术,解决排版格式上的标准化问题用于印刷的文稿可以直接制作或上网使用,数字文稿完全体现印刷文稿形式,可以原样打印输出,复杂的公式图表也可以很好的描述。一些报刊在网上提供PDF格式,以便读者了解版面情况,出版社也用其存档保存图书信息PDF是可加密文档:可给用户不同等级的权限,可附数字签名,做批注、审批加印等数字文档方式PDF格式不主要针对电子阅读面向版面,而不是面向数据组织在相对很小的屏幕上看大的印刷版面不方便检索功能相对较弱对文章的检索不很方便,超文本链接功能不够强,这些功能是数字文档突出的特点交互功能弱观点:PDF格式实际上是印刷出版的数字化延伸,建立了印刷出版和数字出版的桥梁,是对传统出版的数字化兼容,而非全新意义上的数字出版格式数字文档方式标记语言方式以HTML为代表的数字文档标识方式标记语言专门为计算机描述文档,用户可以方便的浏览和检索信息文稿可以在浏览器在上直接识读网络将Internet上的信息资源联结起来,因而成为今天网络环境中最主要的数字文档描述方式在数字出版领域?浏览器的核心工作就是显示HTML文档(所以叫浏览器)5.2数字出版数据5.2.1数字出版数据信息方正博思内容管理平台中文在线数字出版平台数字出版平台项目建设核心在于数字内容资产的整合、管理、跨平台发布及信息服务平台数字化产品(书+内容)业务流程内容选题脚本与媒体设计素材准备总集成与测试试用与调整销售推广跟踪服务与反馈改进与再版教学审查二审内容创作模板准备(选择)交稿规范化初标媒体制作一审内容编辑版式调整与集成媒体集成三审媒体审查在线发布印制生产在线检查质量控制内容检查整体检测批准发布交稿审查发稿生产加工的对象关键控制点工种实体书收货内容创作(图书\多媒体)结构化内容加工和标注数学物理机械...高等教育出版社内容资产内容管理平台逻辑架构图图书网动图书...OnlineFirstXML模板1模板2模板3高等教育出版社基于内容管理的业务流程5.2.2文献文本是知识交流的主要方式文献——单一的信息单元文本是文献的典型数据形式,文献也可以包含其他媒体可以是一个完整的逻辑单元,如研究报告、书、手册;也可以大型文本的一部分,如一个或多个自然段,词典的一个条目,一个汽车零部件的描述等可以是任意物理单元,如一个文件、一封电子邮件或一个网页信息处理文献化文献的特征语法用于定义结构、表现样式、语义甚至是外部行为结构,文献生产者指定,如章、节(内部结构)语义,由文献作者说明(内容)样式,如何打印或显示(外部形式)文本+结构+其他媒体语法结构表现样式语义文献文献的特征文献类型一次文献指作者以本人的研究成果为基本素材而创作或撰写的文献,不管创作时是否参考或引用他人的著作,也不管该文献以何种物质形式出现,均属一次文献。大部分期刊上发表的文章和在科技会议上发表的论文均属一次文献二次文献指文献工作者对一次文献进行加工、提炼和压缩之后所得到的产物,是为了便于管理和利用一次文献而编辑、出版和累积起来的工具性文献。检索工具书和网上检索引擎是典型的二次文献文献类型三次文献指对有关的一次文献和二次文献进行广泛深入的分析研究综合概括而成的产物。如大百科全书、辞典等文献的处理MVC(ModelViewController)一种软件设计架构,用于组织代码一种业务逻辑和数据显示分离的方法Model描述结构内容如何组织View表现形式内容以何种形式表达Controller控制动作如何操作内容内容(本身)是什么?数字出版数据在数字出版中,需要一种描述出版行为结构框架的工具组织不同类型、格式数据,以形成产品方便联结不同阶段的加工过程方便流程管理方便知识(不仅是数据)保存便于数据转换便于以各种形态发布……内容创作(图书\多媒体)结构化内容加工和标注数学物理机械...高等教育出版社内容资产内容管理平台逻辑架构图图书网动图书...OnlineFirstXML模板1模板2模板3文献的处理人的理解通过内容(智力,知识)计算机理解自然语言?计算机理解文档结构计算机能够识别的格式格式:专用(只是具体系统)/开放(任何系统)……格式标准化计算机认识的“普通话”文献自身的信息(与内容无关)元数据业内称版权与标准问题制约数字出版业发展自然语言理解:我们正在努力真的总有必要?5.2.3元数据元数据——关于数据组织、不同数据域及其相互关系的信息。简言之,元数据就是“关于数据的数据”数据库中的关系名、每个关系的字段和属性、属性区域文本相关的元数据包括作者、出版日期、出版商、文献长度(如页数、字数、字节数)以及文献的类型(如书、文章、备忘录等)元数据功能信息发现:帮助使用者检索和确认所需要的资源,如Dublincore(简称DC)主要用于组织网络信息资源信息描述:用于对数据单元进行详细、全面的信息描述,如图书的MARC、档案的机读目录、地理空间信息(FGDC)等资源管理:支持对资源利用和管理过程的政策与控制机制的描述,例如权限管理、资源评价、电子签名、使用管理等元数据功能资源保护与长期保存:支持对资源的长期保存,除了对信息资源的描述与确认之外,往往还需要关于该资源的格式信息、制作信息、转换方式、技术环境等,以便于资源的利用使用:用以描述信息资源的使用层次与类型。如使用与使用者记录追踪、内容再利用与不同版本的信息真实性保障(正处于研究之中)DC(都柏林核心集)都柏林核心元数据(DublinCoreElementSet)元数据中的一个标准集,简称DCDC元数据主要为了能够以比较简单的方式来描述网上各种主题的电子资源简练、易于理解、可扩展、能与其他元数据形式进行桥接能较好地解决网络资源的发现、控制和管理问题成为一个较好的网络资源的发现描述元数据集,并正在逐步发展成为世界公认的标准DC元素(都柏林核心集)内容描述知识产权外形描述题名Title创建者Creator日期Date主题Subject出版者Publisher类型Type说明Description其他责任者Contributor款式Format来源Source权限Rights标识Identifier语种Language关联Relation覆盖范围CoverageDC元数据一个完整的DC元数据体系,可以包括三个方面的内容语义对元数据的概念实体的定义,比如说定义DC中的题名或日期元素的含义句法规定DC元数据体系的表达与描述结构的定义与描述结构描述DC各个元素之间的相互关系DC元数据目前,国际上对DC元数据的表达与描述多数采用的是标记语言(XML)优点保证了元数据的结构化,易于被计算机处理和交流,对人来说也有很好的可读性标记语言采用了最简单的文本格式,使其具有很强的兼容性和不依赖于软硬件平台的独立性,同时这些特性也确保其具有很强的生命力可以将元数据与资源内容的管理结合在一起,元数据描述与其被描述的对象整合在一起,大大提高了内容管理与交换中元数据的可用性摄影元数据—Exif标准可交换图像文件常被简称为EXIF(Exchangeableimagefileformat),是专门为数码相机的照片设定的,可以记录数码照片的属性信息和拍摄数据数码相机可以把各种拍摄信息记入数码图像中,应用软件可以读取这些数据读取图片的EXIF信息描述性元数据可以用程序读取例:EXIF信息处理的Java包是DrewNoakes写的metadata-extractor,可以直接从下载该项目的最新版本包括其源码描述性元数据的层级第一级第二级第三级记录特性简单格式非标准化的全文索引结构化的格式逐渐成为标准字段结构复杂格式国际标准详细的标记元数据格式举例LycosAltavistaYahooetcDublinCoreIAFAtemplatesRFC1807SOIFFGDCEADTEIGILSMARC描述能力低高元数据标准体系描述上述信息内容的规则、方法和机制信息服务过程和服务系统模式作品与对象集合信息内容作品与对象作品/对象及其集合的管理和服务机制元数据元数据元数据元数据元数据元数据一次文献二次文献(描述元数据)三次文献与系统相关的元数据-引自张晓林《元数据研究与应用》编码与著录方法SGML结构化、规范、复杂、描述能力强、需要DTDHTML半结构化、不断变化发展、描述能力差、单一DTDXML结构化、规范、简洁、描述能力强、DTD可选RDF在结构基础上引入语义(语义出版)其他方式通用可选数据元素核心LOM必须数据元素课件网络课程媒体素材文献资料案例常见问题解答资源目录索引试题试卷高等教育出版社5.2.4数字对象数字对象数字信息库中表示信息的基本逻辑单位。如文章,图片,一部音乐作品数字对象元数据描述对象实体的信息。元数据中可包含数字对象的唯一句柄数字对象构成数字对象头数字对象体A1A2A3An元数据句柄数字对象唯一标识符DOIDOI(DigitalObjectidentifier)提供标识与数字对象之间的链接,针对因特网环境下如何对知识产权进行有效的保护和管理产生1998年,美国出版协会(AAP)创立非赢利组织IDF。IDF在CNRI(美国全国研究创新联合会)配合下制定了DOI标准和相应的解析系统由IDF、注册机构(RA)、CNRI构建了DOI应用体系DOI的作用123FourdynamicfactorsDOI的作用图书馆通过在本地导入DOI并与OpenURL结合,为用户提供访问更多全文文献的机会DOI的作用DOI的作用4搜索服务在学术搜索中引入DOI可以提高搜索质量。CrossRef与Google合作的CrossRefSearch。仅在成员所提供的学术内容中进行搜索,通过DOI保证了检索结果到全文的链接有效性和持久性政府机构相关政府机构通过DOI的推广和应用更有效地管理学术信息资源,从标识体系的建立和应用上实现包括科技文献和科学数据在内的资源整合,从而有助于建立一个基于分布环境下的一站式的科技基础信息服务平台5CrossRef利用DOI形成跨出版商的链接服务PublisherAPublisherCPublisherDPublisherAPublisherBPublisherCPublisherDPublisherEPublisherFPublisherBPublisherEPublisherF15bilateralrelationships6networkrelationships万方数据资源系统期刊学位会议图书……国外出版社国内文摘数据库CBM医学文献数据库;社会科学期刊评价数据
本文标题:第五章数字出版信息组织.
链接地址:https://www.777doc.com/doc-2084293 .html