我们最近有一个很棒的机会与一位客户合作,要求构建一个适合他们需求的异常检测算法。业务目标是准确地检测各种营销数据的异常情况,这些数据包括跨多个客户和Web源数千个时间序列的网站操作和营销反馈。异常检测算法,该算法基于时间并可从一个到多个时间序列进行扩展。
我们与许多教授数据科学的客户合作,并利用我们的专业知识加速业务发展。
我们的客户遇到了一个具有挑战性的问题:按时间顺序检测每日或每周数据的时间序列异常。异常表示异常事件,可能是营销域中的Web流量增加或IT域中的故障服务器。无论如何,标记这些不寻常的事件确保业务顺利运行非常重要。其中一个挑战是客户处理的不是一个时间序列,而是需要针对这些极端事件进行分析。
这里有四个简单步骤的工作要点。
- 第1步:安装
-
- install.packages("tidyverse")
-
- 第2步:加载
-
- library(tidyverse)
-
-
- 第3步:收集时间序列数据
-
-
- tidyverse_cran_downloads
-
- ## # A tibble: 6,375 x 3
-
- ## # Groups: package [15]
-
- ## date count package
-
- ##
-
- ## 1 2017-01-01 873. tidyr
-
- ## 2 2017-01-02 1840. tidyr
-
- ## 3 2017-01-03 2495. tidyr
-
- ## 4 2017-01-04 2906. tidyr
-
- ## 5 2017-01-05 2847. tidyr
-
- ## 6 2017-01-06 2756. tidyr
-
- ## 7 2017-01-07 1439. tidyr
-
- ## 8 2017-01-08 1556. tidyr
-
- ## 9