• 基于空间占有度的主导并置模式挖掘


    摘 要 传统的空间并置模式挖掘旨在发现空间中实例频繁共存的特征子集.目前空间并置模式的大多数研究都将模式的频繁性作为兴趣度度量.然而,在实际应用场景中,用户往往不仅对特征集的频繁性感兴趣,而且对它的完整性也感兴趣.结合并置模式的频繁性和完整性,提出主导空间并置模式(dominant spatial co-location patterns, DSCPs),目的是为用户提供一组高质量的并置模式.具体地,在空间并置模式挖掘任务中引入了模式占有度,以衡量并置模式的完整性.我们通过同时考虑模式的完整性和频繁性形式化了主导并置模式挖掘的问题.设计了一个挖掘主导并置模式的基本算法,为了降低计算开销,提出了一系列的剪枝策略及新颖的数据结构改进基本算法的挖掘效率.在合成数据集和真实数据集上进行了实验,评估了所提出算法的效率和有效性,验证了剪枝策略能够大幅提高算法效率.在实际应用中的挖掘结果表明了主导并置模式挖掘的合理性和可用性.

    关键词 空间数据挖掘;主导并置模式;占有度度量 ;频繁性度量;空间关联规则

    空间并置模式[1](spatial co-location patterns, SCPs)代表一组不同类型的空间特征的组合,该组特征的实例在空间中频繁地共存.作为空间数据挖掘[2-3]及空间关联规则挖掘[4-5]领域的一个重要分支,空间并置模式挖掘(以下简称为SCPs挖掘)旨在发掘隐藏在空间复杂分布中的有趣知识,揭示空间特征之间的相关性,在生态学研究[1,6]、公共卫生服务[7-9]、基于位置的模式推荐[10]、城市规划[11]、决策支持[12]等领域有着广泛的应用.

    经典的SCPs挖掘过程首先收集位于同一邻域(实例间满足两两邻近关系)且属于同一特征组的实例组(并置实例),而后通过参与度-参与率度量[1]提取频繁的空间并置模式.图1(a)显示了一个简单的分布数据集,其中6个空间特征A,B,C,D,E和F的实例分别用不同形状的顶点表示

  • 相关阅读:
    构造、清理、拷贝和移动简单实例
    https证书免费申请
    LeetCode #100. 相同的树
    用迭代器 模拟一个for of
    kubernetes 通过HostAliases属性配置域名解析
    centos安装nginx(root操作)
    软件工程综合实践课程第二周作业(简单工厂模式实验)
    Android挂载系统分区执行mount和remount
    Python爬虫eval混淆,爬虫进阶实战系列
    Numpy——老师PPT
  • 原文地址:https://blog.csdn.net/weixin_57147647/article/details/126413614