✨你好啊,我是“ 怪& ”,是一名在校大学生哦。
🌍主页链接:怪&的个人博客主页
☀️博文主更方向为:课程学习知识、作业题解、期末备考。随着专业的深入会越来越广哦…一起期待。
❤️一个“不想让我曾没有做好的也成为你的遗憾”的博主。
💪很高兴与你相遇,一起加油!
举例:
公式:
不同参数模型:
参数估计(此处示例的是极大似然估计)
异常分析算法详情:
图形示例:设置阈值,若计算p值小于该阈值,则视此为异常
评估异常算法
训练集:无标签
交叉验证集和测试集为有标签。(用于评估准确率等)
建议选择下图第一种方式(常用做法),第二个选择是不建议的
算法评估:
设定不同的阈值,比较效果,如何选择较好效果的阈值
异常检测:正负样本数相差巨大,有许多不同种类的异常(此数量较少,若通过使用监督学习,很难去学习到异常到底是什么,且将来出现的异常与已有的截然不同)
监督学习:正负样本数基本持平,或相差不大
关于如何设计和选择异常检测算法的特征
先根据训练集建立模型
再测试,将异常值找出,并以此建立新的特征来捕捉此异常
建立新的特征,帮助捕捉异常
协方差矩阵
多元高斯分布的优点:可给数据的相关性建立模型
负相关
多元高斯模型会自动捕捉不同特征之间的关系
原始模型计算成本比较低
1、没有满足样本数m>n
2、存在冗余特征(两个一样的特征或者高度相关的特征,即线性相关)