学术报告:基于图的海量知识图谱数据管理
讲座时间: 2018年11月7日(周三)下午14 :40
讲座地点: 沙河东校区学院7号楼216
主 讲 人: 邹磊
讲座语言: 中文
讲座摘要:
摘要:RDF用W3C提出是对于语义网中的Web对象建模的数据模型。目前,已经涌现出大量的RDF知识库,比较著名的有DBPedia,Yago,Yago2和Freebase等。同时,很多IT公司也在致力于大规模RDF知识库的构建,例如Google的知识库图谱,微软的Satori,搜狗公司的知立方,以及百度的实体搜索。大规模RDF知识库为目前的数据管理领域带来了新的挑战和机遇,例如如何有效地存储和检索这些大规模的RDF知识库数据。
在本次的报告中,我首先回顾一些经典的按照关系数据库的方法来管理RDF数据的技术。然后,我集中讨论从图数据库的观点来研究RDF数据管理的问题。具体的,我将讨论如何利用图数据库中的子图匹配技术来处理RDF知识库中的查询问题。我讨论两种查询,SPARQL和自然语言查询,以及如何利用子图匹配来有效地回答这两类查询。最后,我将演示我们的基于图的RDF数据管理Demo系统,gStore和gAnswer;前者是用来设计支持SPARQL 1.1的RDF存储和查询系统,后者是用来支持自然语言和关键词的RDF语义检索系统。
讲者简历: 邹磊,北京大学计算机科学技术研究所教授、国家自然科学基金委优秀青年基金项目获得者,北京大学大数据科学研究中心主任助理。目前的主要研究领域包括图数据库,RDF知识图谱,尤其是基于图的RDF数据管理。邹磊及其团队构建了面向海量RDF知识图谱数据(超过100亿三元组规模)的开源图数据库系统。邹磊已经发表了30余篇国内外学术论文,包括数据库领域国际顶级期刊/会议论文(SIGMOD,VLDB等)近20余篇;其论文被引用超过1200多次(根据Google Scholar的统计),单篇最高被引用298余次。邹磊获得2009年中国计算机学会优秀博士学位论文提名奖和2014年中国计算机学会自然科学二等奖(排名第一)。
该学术讲座由“威斯尼斯人专题学术讲座项目”资助。
[编辑]:孙颖