您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 信息化管理 > LInkedData.关联数据与开放数据
动手体验关联数据与开放数据曾蕾林夏2015年七月LinkedDataLOD-Cloud.netFiveStepstoBecomeALinkedDataLibrarian•第1步:阅读和理解RDF数据•第2步:验证RDF数据,转换格式•第3步:学习和探索SPARQL查询•第4步:探索可链接数据接口和API•第5步:数据再处理/可视化第1步:阅读和理解RDF数据•XML–It’salanguage,astandard,andatechnology.–It’satooltolabel,organize,andrepresentdocumentcontent.–It’sbothhuman-andmachine-readable.•RDF–Itdescribesrelationshipsthroughtriples:•Subject--Predicate--Object•主语--谓语--对象(宾语)–RDFstatementscanbedescribedinagraph.–Expressedindifferentsyntaxes,includingXML,plaintext,n-triples,etc.(RDF/XMLisoneofthem.)identifierlv,263p.:Fathersanddaughtersidentifieridentifieridentifieridentifierlv,263p.:FathersanddaughtershasauthorhastitlehaspaginationhassubjecthasauthorhaspaginationhastitlehassubjectWilliamShakespeareWilliamShakespeare“Asyoulikeit”“Asyoulikeit”GRAPHTRIPLES要把‘记录’打开了,就能联接现成的数据(示意)比如,将作者名称字符串换成其VIAF的URI-》图片来源:KarenCoyle.SemanticWeb&LinkedData://viaf.org/viaf/96994048动手1a.创建和读取一个RDF文件,并绘制它的graph。://动手:创建你的FOAF文件也许这是你的第一个RDF文件...•转至工具••填几个字段,加1或2个朋友,生成FOAF文件!•阅读RDF/XML文件并解释:•你的姓氏如何编码的?•你的朋友如何被编码为朋友的?第2步:验证RDF数据、转换格式1.转到粘贴你的FOAFRDF文档3.选择“triplesandgraph”4.点击“ParseRDF”234动手2Itshouldlookslikethis:现在,看一下效果:•验证正确吗?•你有没有可视化的关系?一些提示:如果引号不是纯文本,计算机不能处理的!试试:如果你将你做的FOAF文件放到这里,可以转换成很多格式RDF有很多种格式,不要怕,那是机器的任务:RDFxmlns:rdf=:schema=:Descriptionrdf:about=:typerdf:resource=:nameAusten,Jane./schema:nameschema:familyNameAusten/schema:familyNameschema:givenNameJane/schema:givenName/rdf:Description/rdf:RDF@prefixschema:://viaf.org/viaf/102333412aschema:Person;schema:nameAusten,Jane.;schema:familyNameAusten;schema:givenNameJane.简.奥斯汀规范文档格式1机器直接转成格式2:第3步:学习和探索SPARQL查询•SPARQL是关联数据的查询语言,W3C推荐标准–从结构化和半结构化数据中取值–通过提问未知关系来探索数据–用简单的提问式来建立复杂的、跨数据库的联结点–将RDF数据从一种数据模型的词汇转换成另一种词汇•SPARQL提问式是针对有RDFgraphs的RDF数据集来操作.ref:•SPARQL:–看上去非常复杂,用起来非常方便–具体的应用经常要写很复杂、很长的提问式–提问式可以事先准备好范例,通过界面操控(如GettyAAT等)-提问式也可以藏在幕后,界面只是各种选项-还可以提供生成提问式的工具(下面我们会用一个)PREFIXdataset:{{?uriadataset:Artist.?uridataset:influencedBy?influencedBy.filterregex(?influencedBy,'Pablo_Picasso','i').}UNION{?uriadataset:Artist.?uridataset:influencedBy?influencedBy.filterregex(?influencedBy,'Henri_Matisse','i').}}有许多实用的关联数据SparqlEndpoint可供练习••••演示:OpenLinkVirtuoso•Open:•RunyourfirstSPARQLquery:•Limittothisdataset:–•Limittoourdataset?PREFIXfoaf:{?personfoaf:name?name.}演示:Dbpedia•采用Sparql提问式从dbpedia中获取数据,然后可视化•:{{?uriadataset:Artist.?uridataset:influencedBy?influencedBy.filterregex(?influencedBy,'Pablo_Picasso','i').}UNION{?uriadataset:Artist.?uridataset:influencedBy?influencedBy.filterregex(?influencedBy,'Henri_Matisse','i').}}1.在DbpediaSPARQLendpoint,输入检索公式----------------从“艺术家”类别中,发现,谁是受毕加索Picasso和马蒂斯Matisse影响的艺术家。输出数据格式多样SELECT*WHERE{?s?p?o}1大致过程:22.部分结果3.对部分结果用GEPHI工具来对结果进行可视化3From'Overview'mode,trydifferentsettings.Showtext,adjusttextsize,color,etc.Tip:FollowGephiTutorialQuickStart:如果你不是一个日常SPARQL语言用户,可能做提问式不是那么容易。所以,我们创建了一个工具。动手3:做一SPARQL提问式步骤:在模板中选项。下面是这个演示的查询将用于:从“艺术家”类别中,发现,谁是受xxx影响的人。xxx如:毕加索Picasso和马蒂斯Matisse输出数据将包含艺术家的URISubmit将拿到的SPARQL提问公式copy-paste到DBpedia‘sendpoint:{{?uriadataset:Artist.?uridataset:influencedBy?influencedBy.filterregex(?influencedBy,'Pablo_Picasso','i').}UNION{?uriadataset:Artist.?uridataset:influencedBy?influencedBy.filterregex(?influencedBy,'Henri_Matisse','i').}}将这个box清理干净,然后paste先选html看看,然后选CSV格式存档。之后便可以到Gephi去做图像了2应该有这种结果以后可对部分结果用GEPHI工具来对结果进行可视化3第4步:探索可链接数据接口和APIGettyVocabularyEndpoint演示:到GettyLOD艺术与建筑叙词表、地理名称叙词表、艺术家人名规范文档获取知识性数据•动手4:GettyLOD找500010879(LeonardodaVinci)动手5•IdentifyadomainofyourinterestandfindaLOVorSPARQLendpointforthedomain•Today:workwiththeRomanCoinsexercise•Demo:古代罗马硬币研究网站OnlineCoinsoftheRomanEmpire(OCRE)•(OCRE)TheAmericanNumismaticSociety古代
本文标题:LInkedData.关联数据与开放数据
链接地址:https://www.777doc.com/doc-4472950 .html