Indexed by:
Abstract:
采用分布式来实现SPARQL(Simple Protocol and RDF Query Language)查询是解决海量RDF(Resource Description Framework)查询的一种新思路.目前实现的基于Hadoop的RDF查询都要启用多个MapReduce来完成任务,浪费时间.为了克服此缺点,提出MRQJ (using MapReduce to query and join)算法,用以实现SPARQL的分布式查询.该算法分为连接计划生成与SPARQL查询执行两个部分:连接计划生成采用贪心策略,生成最优的连接方案;在SPARQL查询执行中只需结合一次MapReduce计算即可得到查询结果.在LUBM数据集上进行的测试实验表明:在查询语句较为复杂的情况下,MRQJ方法的查询效率具有明显的优势.
Keyword:
Reprint 's Address:
Version:
Source :
计算机科学
ISSN: 1002-137X
CN: 50-1075/TP
Year: 2014
Issue: 7
Volume: 41
Page: 227-231
Affiliated Colleges: