找回密码
 注册
关于网站域名变更的通知
查看: 1245|回复: 1
打印 上一主题 下一主题

[毕业设计] HDVM:基于关系矩阵的关联数据压缩查询模型

[复制链接]

该用户从未签到

跳转到指定楼层
1#
发表于 2021-6-7 10:43 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

EDA365欢迎您登录!

您需要 登录 才可以下载或查看,没有帐号?注册

x
摘要:随着大数据时代的到来,大量的RDF 数据充斥着整个数据网络.RDF(Resource Description Framework)后台引擎管理巨大的数据集时,数据集索引不能全部加载到内存中,导致系统需要执行缓慢的磁盘访问来解决SPAR-QL查询.本文提出了一种HDVM(Header Dictionary Veclor MaIIx)压将E冉Yv糊掘重复出现的次数.允许 SPARQOL.元组关系矩阵,以主语向量、谓语向量和宾语矩阵的模型序列化存储来减少关联数据重复出现的次数,允许SPARQL.查询在压缩状态下全内存执行.实验结果表明,本文提出的模型比常用的HDT( Header-Dictionary 'Triples)压缩方式提高了3% ~20%的压缩率,同时在三元组个数达到十亿级别的数据集上平均查询时间在400ms左右.
; \# w4 e; k  b4 U9 G8 x: `$ Y
% i" z! y8 x9 ]* [, J4 C0 y关键词:关系矩阵;关联数据;查询;压缩
2 d" u& D$ T. Q
$ s0 n! d- M9 U% t- d# n6 t$ l       W3C最先提出将 RDF(Resource Description Frame-work) 作为处理元数据的基础,其目的在于定义一种广泛认可的资源描述机制.RDF的提出很显然是受到Web信息交换过程中以文档数据为中心观点的影响.随着RDF不断演变和进化,人们致力使RDF实现信息处理自动化,就像万维网的超链接允许数据能在自身被创建的环境外被访问和处理一样.因此,RDF成为信息自动化处理以及关联数据研究重点.2 L( e) v( [# _# O! |
. U* e& Z& D" k+ H
. U7 d0 z+ @  F: I( W
游客,如果您要查看本帖隐藏内容请回复

$ ~: L7 R' Y# z+ U
. l& k! Y7 R1 P1 |' ?3 Q
: l9 l( H9 q8 l4 \  u& A
9 H" u+ H- L  B7 n9 G6 J
; g$ h* w2 l7 u

) n- z3 d' i: q4 ]) U5 T
  • TA的每日心情
    开心
    2022-12-27 15:46
  • 签到天数: 4 天

    [LV.2]偶尔看看I

    2#
    发表于 2021-6-7 13:11 | 只看该作者
    RDF,不是PDF吗
    您需要登录后才可以回帖 登录 | 注册

    本版积分规则

    关闭

    推荐内容上一条 /1 下一条

    EDA365公众号

    关于我们|手机版|EDA365电子论坛网 ( 粤ICP备18020198号-1 )

    GMT+8, 2025-10-5 07:01 , Processed in 0.140625 second(s), 27 queries , Gzip On.

    深圳市墨知创新科技有限公司

    地址:深圳市南山区科技生态园2栋A座805 电话:19926409050

    快速回复 返回顶部 返回列表