找回密码
 注册
关于网站域名变更的通知
查看: 449|回复: 1
打印 上一主题 下一主题

[毕业设计] 基于三支决策的不平衡数据过采样方法

[复制链接]

该用户从未签到

跳转到指定楼层
1#
发表于 2021-3-31 10:35 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

EDA365欢迎您登录!

您需要 登录 才可以下载或查看,没有帐号?注册

x
5 q% E2 T3 R# U5 W2 V/ k
摘要:采样是解决不平衡数据分类问题的一个有效途径.文中结合三支决策理论,根据样本分布将样本划分成三个区域:正域、边界域和负域;在此基础上,分别对边界域和负域中的小类样本进行不同的过采样处理,提出了一种基于三支决策的不平衡数据过采样算法(TWD-IDOS算法).实验结果表明,在C4.5,KNN和CART等分类器上,文中提出的算法能有效解决不平衡数据的二分类问题,在Recall F-value、AUC等指标上优于文献中的过采样算法.
! P4 R$ D& F5 e
' D  T6 m! g0 s3 Y+ x& u  m关键词:三支决策;邻域粗糙集;边界采样;不平衡数据;SMOTE, [4 Z* [/ _9 [- Z: `8 q. y" L1 j

: L' i$ V+ B# w  C
6 Y- [* ^1 b9 G       不平衡数据集的分类问题是机器学习和模式识别领域中的一个热点问题,迄今为止,针对此问题的解决方法主要分为两大类:一类是数据预处理方法,目的是降低类别之间的不平衡性,在此层面上主要的方法是重采样,增加小类样本的数目(过采样)或减少大类样本的数目(欠采样);另一类则是在分类算法上着手,提出新的有效的分类算法或改进现有的分类算法以适应对不平衡数据分类的目的,主要包括单类学习集成学习.代价敏感学习等方法.但是它们没有改变类别之间的不平衡性,限制了算法的广泛应用.所以在实际应用场景中,采用更多的是数据采样的方法.
9 U( m4 e& t# {# J5 v% w
8 N& ]5 W6 ?  z- k+ j# P: I# P" q; J: X4 |& H6 C7 H. A
( K% d% R( H1 h1 Y3 h
基于三支决策的不平衡数据过采样方法.pdf (731.58 KB, 下载次数: 0) 7 A- [% Y; p( @, e
, T2 l" o0 G; O( Q
" z* Z2 f7 n3 Y! D. R
  • TA的每日心情
    开心
    2023-1-11 15:38
  • 签到天数: 1 天

    [LV.1]初来乍到

    2#
    发表于 2021-3-31 13:11 | 只看该作者
    正域、边界域和负域
    您需要登录后才可以回帖 登录 | 注册

    本版积分规则

    关闭

    推荐内容上一条 /1 下一条

    EDA365公众号

    关于我们|手机版|EDA365电子论坛网 ( 粤ICP备18020198号-1 )

    GMT+8, 2025-7-23 01:05 , Processed in 0.109375 second(s), 26 queries , Gzip On.

    深圳市墨知创新科技有限公司

    地址:深圳市南山区科技生态园2栋A座805 电话:19926409050

    快速回复 返回顶部 返回列表