|
EDA365欢迎您登录!
您需要 登录 才可以下载或查看,没有帐号?注册
x
摘要:针对大规模高维数据近似查询效率低下的问题,利用MapReduce 编程模型在大规模集群上的数据与任务的并行计算与处理优势,提出MapReduce框架下大规模高维数据索引及KNN查询方法( iPBM),重点突破Ma-pReduce数据块( block)的优化划分与各数据块对计算的共同贡献两大难题,利用两阶段数据划分策略并依据相关性与并行性原则将数据均匀分配到各数据块中,设计分布式的双层空间索引结构与并行KNN查询算法,检索时利用全局索引,局部索引与二维位码索引实现三层数据过滤,大幅缩小搜索范围并降低高维向量计算代价,实验表明iPBM对大规模高维数据的近似查询具有准确性、高效性和扩展性.
$ k3 u% |1 @+ z3 F7 p- j关键词:云计算;MapReduce;KNN查询;高维索引5 N' a6 d# H" }3 i6 j0 E2 \
MapReduce框架下的优化高维索引与KNN查询.pdf
(4.18 MB, 下载次数: 0)
* V1 Y' I! i+ a' P" c, `5 F; r: [3 [/ D6 W" t
|
|