找回密码
 注册
关于网站域名变更的通知
查看: 247|回复: 1
打印 上一主题 下一主题

[毕业设计] 特征的支持度与其分类能力的关系研究

[复制链接]
  • TA的每日心情
    开心
    2020-8-5 15:09
  • 签到天数: 1 天

    [LV.1]初来乍到

    跳转到指定楼层
    1#
    发表于 2020-12-3 13:28 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

    EDA365欢迎您登录!

    您需要 登录 才可以下载或查看,没有帐号?注册

    x
    摘 要: 频繁模式挖掘在分类问题中得到了广泛的应用,大量的工作利用频繁模式挖掘对分类问题进行特征选 择,但对于为什么频繁模式挖掘可以在分类问题中进行有效的特征选择则缺乏系统的研究.为了为频繁模式挖掘在分 类问题中的特征选择应用提供理论基础,需要确立特征的支持度与特征分类能力之间的关系,本文以特征的信息增益 作为分类能力的评价准则,讨论其与特征支持度之间的联系.首先证明了信息增益是特征支持度的上凸函数;然后,在 二类问题和多类问题情况下,分别证明了具有低支持度或高支持度的特征具有有限的信息增益,即具有低支持度或高 支持度的特征具有有限的分类能力.最后,通过仿真实验验证了支持度与信息增益之间的关系,为频繁模式挖掘在分 类问题中的应用提供了理论基础. 关键词: 频繁模式;分类;特征选择;信息增益
    " ?% m* }" a# k# S. s2 a1 R9 X* w% r
          近年来,频繁模式挖掘越来越多的被用于分类问 题,如文本分类[1~3]、网络模体识别[4]以及蛋白质序列 分类等[5,6],且取得了良好的效果.尽管在该方面已经 有了相当多的研究,但为什么频繁模式挖掘会对分类问 题有效这一问题,却研究较少.Cheng等[7]对这一问题进 行了一定的探讨,其针对二分类问题讨论了模式的支持 度与分类能力之间的联系,得出了一个非常重要的结论 —低支持度特征或高支持度特征具有有限的分类能力. 这一结论具有非常重要的意义:由于在大数据集基础上 构建分类器的相关算法的可扩展性是一个非常难于解 决的问题,而在数据挖掘领域,已经具有了相当多的可 扩展性频繁模式挖掘算法[8~10],因此,如果这一结论成 立,则可以方便的构造大数据集上的可扩展性分类算 法,从而可以有效的解决大数据集上的分类问题., G+ t/ v3 M9 B' h* G' a6 P$ B& J
    附件下载:
    游客,如果您要查看本帖隐藏内容请回复
    4 b9 X5 z2 _( J

    该用户从未签到

    2#
    发表于 2020-12-3 13:52 | 只看该作者
    具有低支持度或高 支持度的特征具有有限的分类能力
    您需要登录后才可以回帖 登录 | 注册

    本版积分规则

    关闭

    推荐内容上一条 /1 下一条

    EDA365公众号

    关于我们|手机版|EDA365电子论坛网 ( 粤ICP备18020198号-1 )

    GMT+8, 2025-6-24 03:22 , Processed in 0.093750 second(s), 26 queries , Gzip On.

    深圳市墨知创新科技有限公司

    地址:深圳市南山区科技生态园2栋A座805 电话:19926409050

    快速回复 返回顶部 返回列表