|
EDA365欢迎您登录!
您需要 登录 才可以下载或查看,没有帐号?注册
x
2 J5 p3 [/ h1 c g0 E( |8 T
摘要:时间序列异常检测是数据分析中一个重要的研究领域.传统的时间序列的异常检测方法主要通过比较检测数据和历史数据的差异程度,以判断被检测数据是否为奇异点(Surprise)、离样(Outlier)点等.然加序列和因口的划分,状态的划分或者异常的定义和判定等问题,使得这类方法存在一定的局限性.本文针对传统时间序列检测算法不足,提出一种基于层级实时记忆算法的时间序列异常检测算法.该方法对时间序列内在模式关系进行字习,建立预测模型,通过比较预测值和真实值的偏离程度来判断数据是否异常.首先使用稀疏离散表征在保证保留数据相关性的同时又将数据离散化;然后输入到模型网络,预测下一时刻的数据值;最终根据预测值和真实值的差异为数据异常程度进行定量评分.在人造数据和真实数据上的实验表明,该方法能够准确、快速地发掘时间序列中的异常.
, ~7 a- G% C" I% f6 u9 f8 X7 | z- n! ^
; {5 y5 p* L( Y0 N4 n% {8 Y9 ]关键词:异常检测;神经网络;层级实时记忆;稀疏离散表征% @5 E5 R3 b/ ^) A, V0 v
+ ~5 B9 w; s x9 D" ~; z9 y' ^
时间序列即按照一定顺序(时间顺序)记录得到的一系列的值,其广泛地存在于各种金融、医疗、工程和社会学数据库中.时间序列具有两个特性:一是时间属性,即每个变量的记录必须有时间维,并按照先后顺序进行排列;二是序列性,变量在某一时间段内以一定的规律发生着变化.时间序列的异常检测包括两个难点:首先,对时间序列的异常检测要保持信息的时效性,即检测机制要能够不断地学习数据新的模式,实时分析并检测出异常;其次,能够发现数据在时间维度上的规律,而这些规律往往具有一定的时间跨度,增加了模式挖掘的难度.另外,时间序列中的异常为小概率事件,导致了异常样本少,也增大异常检测难度.6 k4 M% N# ?: Y
4 b# ~" ]" _9 }( A& b
( a. W6 l! y" L# o+ M. d' {0 l" _
9 z1 V" [8 n$ M9 k* r
4 E4 b$ D9 t' ]+ Z9 a
4 V# O8 E/ |/ t# s; \: T W2 v |
|