您好,欢迎访问三七文档
当前位置:首页 > 电子/通信 > 数据通信与网络 > 4-网络信息采集与归类
主讲:徐溢伟微信号:xyw910109Page2知识点:网络信息资源网络信息的采集途径及来源分析网络信息的筛选标准网络信息采集途径的运用关键词的选取网络信息的归类技能点:网络信息采集与归类Page3【引例】彭博误发旧闻引发的股票雪崩2008年9月8日上午,美国Income证券咨询公司一名记者通过谷歌搜索到一则美联航破产的新闻,他于10点53分将这一消息发给彭博社订阅服务系统。6分钟后彭博社以“UAL股价上午10点58分暴跌33%”为题报道了这则消息。当该消息传到华尔街时,美联航母公司UAL股票在数分钟内遭到大规模抛售,交易量达到约1500万股,股价大跌76%,跌至惨不忍睹的3美元。当Income证券咨询公司发现这则“新闻”是一则6年前的消息后,立即电话通知了彭博社,后者在11点08分将这篇文章从网站上删除。约20分钟后,UAL股票在纳斯达克停止交易一小时,当天收盘UAL股价报10.92美元,下跌1.35美元。美联航曾在6年前宣布过一次破产,并且在2002年到2006年期间申请过破产保护。美国的《太阳哨兵报》当时对此进行过报道,但在该报网站档案中没有注明这篇报道的日期。谷歌9月6日从《太阳哨兵报》网站提取这篇报道后,标注的是发现它的日期,这让那位记者误以为这是一篇新发表的文章,因此造成了这一连串的误会。Page4【案例导读】从整个过程我们不难判断传阅这则新闻的人因为追求时效性,并没有仔细审读内容,也没有对信息的来源做出基本的判断,因而给美联航空公司造成了极坏的影响。由这个案例我们不难想到,网络编辑在通过各种途径筛选信息时,不但要对不同来源的信息质量做出分析,还要进一步去求证判断信息的价值,然后才能发布到网站适当的栏目中。这就涉及到本章的主要内容:网络信息筛选的途径、网络信息的来源、网络信息价值的判断及网络信息的归类方式。Page5网络信息采集网络信息筛选网络信息归类本章小结实训内容及指导筛选与归类网络信息2.12.22.3Page6不仅需要最新的资讯,还需要新奇的功能.为用户创造能够互动的氛围,集聚活跃用户.具有别的网站没有的服务或功能.用户与搜索引擎喜好用户喜欢的内容1.用户喜欢的内容具有的特征网上免费资源丰富,免费已成为各大网站广告语.免费的独特的新鲜的互动的尽量避免”误导信息”和”虚假广告”权威的Page7用户与搜索引擎喜好百度官方网站内容建议内容面向用户,不可放置不可见或欺骗用户的内容.百度更喜欢独特的原创内容.谨慎设置友情链接,谨防造成不良影响.谨慎加入频道共建\内容联盟不能产生原创内容的计划.百度尽量收录提供不同信息的网页.Page8网站类型网站常见类型由各企业自身建立的网站网上从事商业活动的网站,通过各种职能获取利润。政务公开化的体现,政府公务、职能、机构信息公开。政府网站商业网站企业网站个人在互联网建立的网站个人网站Page9网络信息采集2.12.1.1网络信息资源2.1.2网络信息采集途径Page10非正式出版信息、正式出版信息、半正式出版信息网络资源指南搜索引擎、联机馆藏目录、网络数据库、电子期刊、电子图书、电子报纸、参考工具书和其他动态信息等新闻信息、学术信息、娱乐信息、教育信息、科技信息、商务信息、体育信息、财经信息、法律信息等网络信息采集2.12.1.1网络信息资源1.网络信息资源的分类文字、图像、声音、视频、动画、图表等按信息形式划分按信息内容的属性划分按人类信息交流方式划分按信息加工层次划分企业站点信息资源、学校及科研院所站点信息资源、信息服务机构站点信息资源、行业机构站点信息资源以及政府站点信息资源等按信息发布机构划分Page11网络信息采集2.12.1.1网络信息资源2.网络信息资源的特点数量庞大、增长迅速内容丰富、覆盖面广信息质量参差不齐、有序与无序并存信息共享程度高、使用成本低Page12网络信息采集2.12.1.2网络信息采集途径搜索引擎网站论坛邮件列表网络数据库Page13网络信息采集2.12.1.2网络信息采集途径1.搜索引擎全文搜索搜索引擎:Baidu、Google等目录搜索引擎:搜狐、新浪、网易分类目录等是指根据一定的策略、运用特定的计算机程序搜集互联网上的信息,在对信息进行组织和处理后,为用户提供检索服务的系统。元搜索引擎:InfoSpace、Bbmao等Page14网络信息采集2.12.1.2网络信息采集途径2.网站新闻信息网站:新华网、中国新闻网、人民网等财经信息网站:国家商务部网站、财政部网站、人民银行网站等是指根据一定的策略、运用特定的计算机程序搜集互联网上的信息,在对信息进行组织和处理后,为用户提供检索服务的系统。教育信息网站:各个大学网站、中国教育和科研计算机网、教育部网站等科技信息网站:国家科技部网站、各门户网站科技频道、中国公众科技网等网络文学网站:榕树下、红袖添香、潇湘书院等Page15网络信息采集2.12.1.2网络信息采集途径3.网络论坛网络编辑要到各种论坛中找内容、发现信息源。论坛中的信息质量参差不齐,很多原创内容被埋没在了大量的垃圾内容中。论坛内容源能有效解决网站内容日益同质化的问题。网上存在着形形色色的论坛,既有一些综合的论坛如天涯社区、猫扑、新浪论坛、搜狐论坛等,也有一些专业性的论坛如瑞丽女性论坛、人民网强国论坛、各个大学的论坛、和讯股吧、铁血军事论坛等。Page16网络信息采集2.12.1.2网络信息采集途径4.邮件列表邮件列表是指建立在互联网上的电子邮件地址的集合。利用这一邮件地址的集合,邮件列表的使用者可以方便地利用邮件列表软件将有关信息发送到所有订户的邮箱中。国内提供邮件列表服务的网站如希网、索易等,此外,百度、谷歌等网站也提供分类或关键词邮件新闻订阅等服务。Page17网络信息采集2.12.1.2网络信息采集途径5.网络数据库网络数据库具有信息量大、更新快,品种齐全、内容丰富,数据标引深度高、检索功能完善等特点,也是获取信息尤其是文献信息的一个有效途径。网络数据库有收费数据库和免费数据库之分。收费数据库一般是需要购买使用权;免费数据库主要是专利、标准、政府出版物,一般是政府、学会、非盈利性组织创建并维护的数据库。Page18网络信息筛选2.22.2.1网络信息来源分析2.2.2网络信息筛选标准Page19网络信息筛选2.22.2.1网络信息来源分析直接采用、原创素材转载传统媒体的信息、转载网站信息等整合、约稿、原创等原创信息协议转载信息社区内容Page20网络信息筛选2.2在转载国内其他媒体和网站信息时,应注意以下问题:看信息是否源于该网站考察该网站是否有登载新闻的资格转载其他网站的信息,应该取得对方的同意,遵守有关规定,注意不要侵犯对方的知识产权等权利转载时应避免重复Page21网络信息筛选2.2来源于BBS、博客、电子邮件等的信息鱼龙混杂,是需要特别加以注意核实的一类信息,在处理时要注意以下问题:按照国家有关规定,对其内容严格审核,不能将国家规定中禁载的内容发布出去对信息内容的真实性要加以十分谨慎的审核如果需要采用,最好能与作者取得联系,征得对方的同意,并在必要时找到责任人Page22网络信息筛选2.22.2.2网络信息筛选标准价值判断标准社会评价标准•政治规范•法律规范•道德规范网站自身规范•除了遵循网络信息价值判断标准、社会评价标准之外,在筛选文稿时,网络编辑还需要遵守网站自身制定的规范。•网络信息的真实性•网络信息的权威性•网络信息的时效性•网络信息的趣味性•网络信息的实用性Page23网络信息筛选2.2网络信息的真实性:是指信息中涉及的事物是客观存在的,同时信息的各个要素都是真实的。要判断信息的真实性,需要注意以下几个方面:查看信息来源判断信息要素判断信息的准确性1.价值判断标准2.2.2网络信息筛选标准Page24网络信息筛选2.2【“新闻”】据北京晨报报道,中国社会科学院日前公布了2007年全国主要城市白领工资标准,包括各城市物价水平、居住成本、交通成本、城市现代化等诸多方面因素。单位:人民币。外地务工者在以下基础上增加1800元。共分七档。一档:香港18500,澳门8900;二档:上海5350,深圳5280,温州5020,北京5000;三档:杭州4980,广州4750,苏州4300,厦门4100,青岛4000……【真相】11月7日,中国社会科学院网站发表正式声明,“我院有关研究所和课题组从未发布过所谓的‘2007年全国主要城市白领工资标准’,也没有进行过有关研究工作。我院发布的研究报告都会通过正式的宣传渠道,并标明相关研究单位或课题组。我院专家学者一向学风严谨,不会随意发表不负责任的言论。目前,对这一消息的确切来源我们正在调查之中。对于此类给我院造成负面影响的行为,我院将保留追究其责任的权利。”【案例2-1】浏览2007年十大假新闻之社科院公布城市白领工资标准Page25网络信息筛选2.2【点评】当今时代,新闻传播不借助网络肯定不行,但完全依赖网络却万万不行。近年来不少假新闻的出笼,均和网络密不可分。但是,现在不少记者已经“进化”到只会在网络上搜索“新闻”,而智力则退化到不知世间竟还有谎言。令人发噱的是,正当全国媒体纷纷转载“《北京晨报》的报道”时,本来是被人强加“电头”充当“信源”的受害者《北京晨报》也不甘人后,11月5日居然也刊登了这篇“本报讯”。这就是网络时代的魔力“创造”的荒唐而苦涩的笑话。【案例思考】问题1:上述案例中提及的虚假信息产生的主要原因是什么?问题2:从编辑角度而言,你觉得应如何控制虚假信息的产生?Page26网络信息筛选2.21.内容编辑方针(1)坚持正面宣传为主,正确把握舆论导向,与党和政府的宣传口径保持一致。(2)以网民需要为出发点,不遗漏用户关心的重要新闻,不断充实网页内容,提供更周到的服务。(3)提倡“抢新闻”和适时发布,缩短与事件发生和信息源的时差。(4)严格杜绝政治性差错,避免知识性、文字性差错。(5)学习网络媒体经验,集众家之长。(6)鼓励和提倡信息内容的再加工和处理,避免简单的重复和拷贝,杜绝I-C-P(InternetCopyPaste)不良倾向。……【案例2-2】某网站编辑规范Page27网络信息筛选2.2【案例思考】问题1:在筛选信息时需要注意哪些方面?问题2:网络编辑在筛选稿件时需要遵守哪些规范?Page28网络信息筛选2.2网络信息的权威性:是保证信息质量的一个重要方面,也是逐步提高网站知名度与影响力的一个重要方面。判断信息的权威性,需要注意以下方面:查看信息来源是否具有权威性,考察网站及其建站机构的权威性与知名度查看稿件作者的情况,如作者的声誉与知名度,作者的E-mail地址、电话,能否与作者取得联系等对于一些涉及重大问题的研究成果,还要同时考察其研究方法是否科学、研究是否具有代表性、普遍性等,以此判断研究结论是否具有权威性1.价值判断标准2.2.2网络信息筛选标准Page29网络信息筛选2.2网络信息的时效性:是指信息的新旧程度,即与社会现实、科技前沿的接近程度。在信息时效性的判断方面,要注意以下不同的情况:情形1情形2情形3情形4信息中涉及的事实本身的发生或变动是突发性的或者跃进性的。事实本身的变化是渐进的,表现为一个过程。有些信息所涉及的事件虽然是过去发生的,但最近才发现或披露出来。预告一件事实的发生。1.价值判断标准2.2.2网络信息筛选标准Page30网络信息筛选2.2网络信息的趣味性信息的趣味性表现内容轻松有趣,能让人读后心情愉快。按照一般心理,人们喜欢轻松幽默的文字、轶闻趣事,或有关动物、自然的话题。趣味性也可表现为它能引发人们的情感,如人的爱憎、喜悦、同情等各种感情。这也被称为人情味。1.价值判断标准2.2.2网络信息筛选标准Page31网络信息筛选2.2网络信息的实用性:是网站信息服务质量的一个重要体现,实用性具体可表现为介绍知识、提供资料、直接服务等。判断信息的实用性,需要注意以下方面:主要标准是看其对网民是否具有用处、有多少实用性信息的实用性首先要求信息是可用的,这就要求其内
本文标题:4-网络信息采集与归类
链接地址:https://www.777doc.com/doc-2923250 .html