一种基于 MapReduce 的知识聚类与统计机制

TaylorA · 发表于 2020-10-30 13:28

EDA365欢迎您登录！

您需要登录才可以下载或查看，没有帐号？注册

x

摘要：网络文献知识库中的海量资源及其分类的粗粒度，导致学习者容易在文献检索和阅读过程出现认知迷航和
知识过载问题。该文提出一种基于 MapReduce 的知识聚类与统计机制：首先，提出基于 MapReduce 的共现矩阵
构建算法 MR-CoMatrix；其次，将共现矩阵与相似度系数结合构建相似度矩阵；然后，通过 Z Scores 对相似度矩
阵进行标准化；最后，使用离差平方和法(Ward,s method)对相似度矩阵进行聚类，生成树状的知识聚类谱系图；
基于聚类结果，提出基于 MapReduce 的知识文献统计算法 MR-Statistics，对每个分类的知识属性进行统计。实验
结果表明：将 MR-CoMatrix 和 MR-Statistics 方法应用于网络文献知识库进行知识聚类和统计，达到较理想的聚
类精度和计算效率，实现了细粒度知识聚类和多维统计，同时减少了时间开销。
关键词：数据挖掘；聚类；知识；共现矩阵；统计；MapReduce
1 引言
目前国内外的网络文献知识库系统均聚集了海
量的知识文献，为科技工作者提供了快速查阅国内
外科技文献，进行高层次知识学习的平台。然而网
络文献知识库中海量资源分类的粗粒度，导致学习
者容易在文献检索和阅读过程出现认知迷航

附件下载:

游客，如果您要查看本帖隐藏内容请回复

金色传说 · 发表于 2020-10-30 14:54

谢谢诶分享

帐号		自动登录	找回密码
密码			注册

[毕业设计] 一种基于 MapReduce 的知识聚类与统计机制

EDA365欢迎您登录！

浏览过的版块

推荐内容 /1