码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 极值分析:分块极大值BLOCK-MAXIMA、阈值超额法、广义帕累托分布GPD拟合降雨数据时间序列...


    全文链接:http://tecdat.cn/?p=25348 

    你们可能知道,实际极值分析有两种常用方法:分块极大值Block-maxima、阈值超额法threshold excess(点击文末“阅读原文”获取完整代码数据)。

    今天,我们将分别介绍这两种方法。

    相关视频

    分块极大值Block-maxima

    分块样本极大值的极值理论(_Block_-_maxima_)。这种对(时间)观测序列的极值建模的方法是基于在一定的恒定长度序列内利用这些观测值的最大值或最小值。对于足够多  的_n个已建立块,这__n_个等长块  的所得峰值    可用于将合适的分布拟合到这些数据。虽然块大小基本上可以自由选择,但必须在偏差(小块)和方差(大块)之间进行权衡。通常,序列的长度通常选择对应于某个熟悉的时间段,在大多数情况下为一年。年度最大值(或最小值)的结果向量称为“年度最大值(最小值)系列”或简称为 AMS。

    根据 Fisher-Tippett-Gnedenko 定理,块最大值的分布可以通过广义极值分布来近似。

    以下代码显示了一个简短的实际示例,该示例使用 R 将广义极值分布拟合到降水数据的时间序列。样本数据集包含 1971 年至 2014 年 降水数据(查看文末了解数据获取方式)。

    1. # 加载所需的包
    2. # 获取数据
    3. prexts <- rehyd
    4. # 导出 AMS 以获得最大降水量
    5. ams <- apprly
    6. # GEV 分布的最大似然拟合
    7. evd
    8. # 诊断图
    9. plot
    10. rl_mle <- reevel
    11. # 基于 L- 拟合 GEV 分布矩估计
    12. # 诊断图
    13. plot(fiom) 
    14. # 重现水平:
    15. rm <- retvel
    16. # 重现水平图
    17. plot
    18. loc <- as.numeric(retvel)
    19. # 带 LMOM 图的重现水平
    20. loc <- as.numeric(return.level)

    59be2687207429dd81e63f1560c6cfdf.png

    在这种情况下,两个结果非常相似。在大多数情况下,L 矩估计比最大似然估计更稳健。除了这些经典估计方法之外,还提供广义最大似然估计(GMLE,  Martins 和 Stedinger,2000 年)和贝叶斯估计方法(Gilleland 和 Katz,2016 年)。


    点击标题查阅往期内容

    045acd82c3182c9df848847e011ea494.jpeg

    R语言POT超阈值模型和极值理论EVT分析

    outside_default.png

    左右滑动查看更多

    outside_default.png

    01

    0810b5f5c027c5e13b6455d41497ba50.png

    02

    831b142b03c2fefa82164d16aa8f1154.png

    03

    ca07c169fa9bb18c39e21d50358a5400.png

    04

    80f24f84a197ce992a90faeb56c8bf3c.png

    阈值超额法threshold excess 

    我们现在来看看阈值超额法。

    根据 Coles (2001) 的说法,如果可以使用没有间隙的完整(时间)序列,则阈值方法比块最大值方法更有效,因为所有超过某个阈值的值都可以作为模型拟合的基础。在某些情况下,将分布拟合到块最大值数据是一种浪费的方法,因为每个块只有一个值用于建模,而阈值过剩方法可能会提供更多关于极端值的信息。

    然而,类似于块最大值方法中块大小的选择,部分持续时间模型的阈值选择也受到偏差(低阈值)和方差(高阈值)之间的权衡。

    Coles (2001) 描述了两种不同的阈值选择方法。首先,有一种基于平均_残差_寿命图的探索性方法。该技术在实际模型拟合之前应用。其次,另一种方法是评估参数估计的稳定性。因此,模型拟合的这种敏感性分析是在一系列不同的阈值范围内进行的。

    但是,选择合适的阈值可能是使用部分持续时间序列执行极值分析的最关键部分。Scarrott 和 MacDonald 在其 2012 年的文章。文献综述:极值阈值估计和不确定性量化(REVSTAT 10(1): 33-59)中对阈值估计方法进行了很好的概述 。

    找到合适的阈值后,超过该阈值的极值子集将用于拟合广义帕累托分布。

    根据 Pickands-Balkema-de Haan 定理,超过阈值的值的分布可以近似为广义帕累托分布。

    以下代码显示了一个简短的实际示例,该示例使用R将广义帕累托分布拟合到降水数据的时间序列。样本数据集以 1981 年至 2014 年降水数据为特征。

    1. # 平均剩余寿命图:
    2. lplot(prects)
    3. # 平均剩余寿命图描绘了阈值 (u) 与平均过剩流量。
    4. # 这个想法是找到图几乎是线性的最低阈值;
    5. # 考虑到 95% 的置信范围。
    6. # 在一系列阈值上拟合 GPD 模型
    7. threplot(prxts)
    8. fitrange (prts)
    9. # 设置阈值
    10. th <- 40
    11. # 最大似然估计
    12. pole <- fe
    13. # 诊断图
    14. rl_mle <- retvel(po)
    15. # L-矩估计
    16. d(as.vector(prmethod = "moments")
    17. # 诊断图
    18. retel(pom)
    19. # 重现水平图
    20. # 使用 MLE 的重现水平图
    21. loc <- as.numeric
    22. # 带 LMOM 的重现水平图
    23. plmom

    a180bd08087cd5e85feaf64130a73441.jpeg
    这个例子很好地说明了为什么基于 L 矩的方法可能优于最大似然估计,因为右图清楚地证明了使用 L 矩估计时异常值的影响要小得多。除了这些经典估计方法之外,还提供广义最大似然估计(GMLE,  Martins 和 Stedinger,2000 年)和贝叶斯估计方法(Gilleland 和 Katz,2016 年)。

    在最近关于分块最大值法和阈值超额法的文章中,我们简单地假设了极值分析的所有假设都得到了满足。然而,在处理环境变量时,情况很可能不是这样的。特别是平稳性的假设在很多情况下可能被违反。在全球气候变化的背景下,气象或其他环境变量的时间序列中很可能有一个相当大的趋势。当然,这种趋势必须被纳入分析中,因为由此产生的回归水平随时间而变化。

    广义帕累托分布拟合

    下面的代码显示了一个简短的实际例子,即使用R对降水数据的时间序列进行广义帕累托分布的拟合。样本数据集是从1971年到2013年的降水数据。

    1. # 推导出最大降水的AMS值
    2. as <- apprly(preax)
    3. # 检查AMS的平稳性。
    4. # 简单的线性模型
    5. summary(lm)
    6. p <- ggplot

    b2b7e9d38a52406352abaf8bd764a7af.jpeg

    拟合线性模型的结果和图给人的印象都表明年最大降水量有上升趋势。Mann-Kendall趋势检验的结果是一个非常小的P值,证实了这一趋势。因此,必须进行趋势校正,以说明随时间变化的回归水平。

    1. # 最大似然估计
    2. d( method = "MLE")
    3. # 重现水平图
    4. plot(mend)

    475d69e883d9d017103fdcabee9c7834.png

    与前面的重现水平图(没有趋势)相比,这个重现水平图看起来有所不同。它显示的是5年和100年重现水平随时间的变化。

    数据获取

    在下面公众号后台回复“降雨极值分析数据”,可获取完整数据。


    81c67c6c7f8055f74a7dabe8afab2c87.png

    本文摘选《R语言极值分析:分块极大值BLOCK-MAXIMA、阈值超额法THRESHOLD EXCESS、广义帕累托分布GPD拟合降雨数据时间序列》,点击“阅读原文”获取全文完整资料。


    点击标题查阅往期内容

    极值理论 EVT、POT超阈值、GARCH 模型分析股票指数VaR、条件CVaR:多元化投资组合预测风险测度分析

    R语言POT超阈值模型和极值理论EVT分析

    R语言极值推断:广义帕累托分布GPD使用极大似然估计、轮廓似然估计、Delta法

    R语言极值理论EVT:基于GPD模型的火灾损失分布分析

    R语言有极值(EVT)依赖结构的马尔可夫链(MC)对洪水极值分析

    R语言POT超阈值模型和极值理论EVT分析

    R语言混合正态分布极大似然估计和EM算法

    R语言多项式线性模型:最大似然估计二次曲线

    R语言Wald检验 vs 似然比检验

    R语言GARCH-DCC模型和DCC(MVT)建模估计

    R语言非参数方法:使用核回归平滑估计和K-NN(K近邻算法)分类预测心脏病数据

    matlab实现MCMC的马尔可夫转换ARMA - GARCH模型估计

    R语言基于Bootstrap的线性回归预测置信区间估计方法

    R语言随机搜索变量选择SSVS估计贝叶斯向量自回归(BVAR)模型

    Matlab马尔可夫链蒙特卡罗法(MCMC)估计随机波动率(SV,Stochastic Volatility) 模型

    Matlab马尔可夫区制转换动态回归模型估计GDP增长率

    R语言极值推断:广义帕累托分布GPD使用极大似然估计、轮廓似然估计、Delta法

    欲获取全文文件,请点击左下角“阅读原文”。

    4de6f234005057f0a45cd0cf33f6c395.gif

    6459797e96e2b1b117ff6c453c028986.png

    3c338dfbcba1999cadd1ec987b3cd2e0.jpeg

    689c544314f3efe42a16888d55228be3.png

  • 相关阅读:
    氟硼荧-四嗪生物正交探针/四嗪改性碳纳米管/环π共轭聚合物/环聚咔唑的制备
    如何使用搜索功能精确筛选数据?
    【蓝桥杯真题练习】STEMA科技素养练习题库 答案版015 持续更新中~
    基于jeecgboot流程管理平台的在线表单设计修改成formdesigner(一)
    配置Tomcat时系统环境变量已经配置好,但是启动Tomcat时还是闪退的解决办法
    Win11文件类型怎么改?Win11修改文件后缀的方法
    SpringMVC之注解驱动的控制器
    Java设计模式(三)结构性设计模式
    [开发|java] greenrobot.eventbus的ThreadMode说明
    你不知道的JavaScript-----强制类型转换
  • 原文地址:https://blog.csdn.net/tecdat/article/details/128125462
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号