• R语言实践——rWCVP 的函数清单


    1. get_area_name()

    根据地区编码获得地区名称

    用法

    get_area_name(area_codes)
    
    • 1

    参数

    • area_codes:包含要映射到名称的代码集的字符向量

    字符。长度为1的向量,带有3级区域集的名称,或者(如果该区域集没有名称)代码的输入向量。

    详介

    get_wgsrpd3_codes函数执行相反的功能。适用于压缩代码集,例如文件名、绘图和表格格式。

    例子

    get_area_name(get_wgsrpd3_codes("Brazil"))
    
    • 1
    ℹ Matches to input geography found at Country (Gallagher) and Region (Level 2)
    [1] "Brazil"
    
    • 1
    • 2

    2. get_wgsrpd3_codes()

    提取WGSRPD3级编码

    用法

    get_wgsrpd3_codes(geography, include_equatorial = NULL)
    
    • 1

    参数

    • geography:字符变量。要转换为3级代码的地理位置。可能是WGSRPD区域(3级)、地区(2级)或洲(1级)、国家(政治)或半球(“北半球”、“南半球”或“赤道”)
    • include_equatorial:逻辑变量。包括跨越赤道的3级区域?默认为NULL,这将生成一条消息并包括这些区域。如果地理不是半球,则忽略。

    具有属于该地理区域的区号(级别3)的字符。

    详介

    国家绘图遵循加Gallagher et al. (2020)。重要的是,这意味着一些海外领土在此系统中不被视为国家的一部分,例如加那利群岛被指定为它们自己的 3 级区域,而不是此映射中西班牙的一部分。在不明确的地方,可以使用View(wgsrpd_mapping)来研究映射。

    例子

    get_wgsrpd3_codes("Brazil")
    
    • 1
    ℹ Matches to input geography found at Country (Gallagher) and Region (Level 2)
    [1] "BZC" "BZE" "BZL" "BZN" "BZS"
    
    • 1
    • 2

    3. powo_map()

    为给定的范围和范围质心绘制 POWO 样式地图。

    用法

    powo_map(range_sf, centroids_sf)
    
    • 1

    参数

    • range_sf:等高多边形的简单要素(sf)数据框
    • centroids_sf:范围质心的简单要素(sf)数据框

    该范围的ggplot地图

    4. powo_pal(), scale_color_powo(), scale_colour_powo(), scale_fill_powo()

    POWO网站上展示的范围地图有一个固定的、离散的调色板,它基于一个地区的分类群类型。

    用法

    powo_pal()
    
    scale_color_powo(...)
    
    scale_colour_powo(...)
    
    scale_fill_powo(...)
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7

    参数

    • :传递给discrete_scale的参数
    • palette:一个调色板函数,当用单个整数参数(标尺中的级别数)调用时,返回它们应该取的值(例如scales::hue_pal())
    • limits:下列之一:
      1. 默认为NULL
      2. 定义了尺度可能的值和顺序的字符向量
      3. 接受现有(自动)值并返回新值的函数。也接受rlang lambda函数表示法。
    • drop:是否应从量表中省略未使用的因子水平?默认值TRUE使用数据中出现的级别;FALSE使用因子中的所有级别。
    • na.translate:与连续刻度不同,离散刻度可以很容易地显示缺失值,默认情况下会这样做。如果要从离散刻度中删除缺失值,请指定na.translate = FALSE。
    • scale_name:应用于与此刻度关联的错误消息的刻度的名称。
    • name:尺度名称。用于轴或图例标题。如果是waiver(),默认值,尺度名称从首次绘图时获得。如果为NULL,图例标题将被忽略。
    • labels:以下之一:
      1. NULL表示没有标签
      2. waiver() 用于转换对象计算的默认标签
      3. 提供标签的字符向量(必须与 breaks 等长)
      4. 表达式向量(必须与 breaks 等长)。详见 ?plotmath
      5. 一个函数,它将breaks作为输入,并将标签作为输出返回。也接受rlang lambda函数表示法。
    • guide:用于创建指南或其名称的函数。详见 guides()
    • super:用于构建标尺的父类

    字符。与POWO相匹配的名称和十六进制值的向量。

    5. redlist_example

    名称匹配的示例数据集。一个包含20个红名单评估样本的数据集,用于名称匹配

    用法

    redlist_example
    
    • 1

    格式

    具有 20 行和 4 个变量的数据框:

    • assessmentId:红色名录标识符
    • scientificName:类群名称
    • redlistCategory:红色名录威胁类别
    • authority:类群命名人

    资源

    https://www.iucnredlist.org/ 下载并采样

    6. taxonomic_mapping

    用于将植物科映射到目或更高分类的数据。包含更高分类(被子植物、裸子植物、蕨类植物和石松植物)和 WCVP 中每个科的顺序的数据集。

    用法

    taxonomic_mapping
    
    • 1

    格式

    一个包含457行和3个变量的数据框架:科、目和更高分类阶元

    资源

    PPG I 中的蕨类植物和石松类植物分类学。来自APG IV的被子植物分类学。Forest 等人的裸子植物分类学。

    7. wcvp_checklist()

    从 WCVP 生成物种清单

    用法

    wcvp_checklist(
      taxon = NULL,
      taxon_rank = c("species", "genus", "family", "order", "higher"),
      area_codes = NULL,
      synonyms = TRUE,
      render_report = FALSE,
      native = TRUE,
      introduced = TRUE,
      extinct = TRUE,
      location_doubtful = TRUE,
      hybrids = FALSE,
      infraspecies = TRUE,
      report_filename = NULL,
      report_dir = NULL,
      report_type = c("alphabetical", "taxonomic"),
      wcvp_names = NULL,
      wcvp_distributions = NULL
    )
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18

    参数

    • taxon:字符变量。指包含的类群。默认为NULL(不进行类群筛选,所有类群)
    • taxon_rank:字符变量。“species”, “genus”, “family”, “order” or "higher"之一,指定 taxon的分类阶元。除非 taxonNULL,否则必须指定
    • area_codes:字符变量。单个或多个WGSRPD3级区域代码。默认为NULL(全球范围)
    • synonyms:逻辑变量。在清单中包含异名。默认为TRUE
    • render_report:逻辑变量。将清单呈现为标记语言报告。默认为FALSE
    • native:逻辑变量。包含未标记为 introduced,extinct或doubful的物种发现记录
    • introduced:逻辑变量。包含标记为引入的物种发现记录。默认为TRUE
    • extinct:逻辑变量。包含标记为灭绝的物种发现记录。默认为TRUE
    • location_doubtful:逻辑变量。包含标记为产地存疑的物种发现记录。默认为TRUE
    • hybrids:逻辑变量。清单包含杂交种。默认为FALSE
    • infraspecies:逻辑变量。清单包含亚种。默认为TRUE
    • report_dir:字符变量。HTML文件的存储路径。用户必须提供
    • report_type:字符变量;alphabeticaltaxonomic之一。生成的清单按字母顺序或分类顺序排列。默认为alphabetical
    • wcvp_names:从WCVP 版本7或更新中获得的分类名称数据集。如果为NULL(默认),将从rWCVPdata::wcvp_names加载名称
    • wcvp_distributions:从WCVP 版本7或更新中获得的分布区数据集。如果为NULL(默认),将从rWCVPdata::wcvp_distributions加载名称

    返回筛选数据后的数据集,如果 render_report=TRUE,还有一个HTML报告文件

    详介

    使用synonyms参数可以只返回接受名。如果synonyms=TRUR,则废弃名、不合法名和其他非接受名都会返回(例如,清单并不限制名称:taxon_status==“Synonym”)。*rWCVP**提供两种清单类型:字母顺序型和分类顺序型。在字母顺序型清单中,所有名称都按照字母顺序排列,接受名加粗而异名接在接受名后。在分类顺序型清单中,名称按接受名分组,异名列在对应接受名下方。两种类型清单都包含命名人、参考文献和分布信息,注意科级标头仅在字母顺序清单中支持。

    8. wcvp_distribution()

    生成物种、属、科的空间分布对象*

    用法

    wcvp_distribution(
      taxon,
      taxon_rank = c("species", "genus", "family", "order", "higher"),
      native = TRUE,
      introduced = TRUE,
      extinct = TRUE,
      location_doubtful = TRUE,
      wcvp_names = NULL,
      wcvp_distributions = NULL
    )
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10

    参数

    • taxon:字符变量。要映射的分类单元。必需的。
    • taxon_rank:字符变量。“species”, “genus”, “family”, “order” or "higher"之一。指定taxon的分类阶元
    • native:逻辑变量。包含原生分布区?默认为TRUE
    • introduced:逻辑变量。包含引种分布区?默认为TRUE
    • extinct:逻辑变量。包含灭绝分布区?默认为TRUE
    • location_doubtful:逻辑变量。包含存疑区?默认为TRUE
    • wcvp_names:从WCVP 版本7或更新中获得的分类名称数据集。如果为NULL(默认),将从rWCVPdata::wcvp_names加载名称
    • wcvp_distributions:从WCVP 版本7或更新中获得的分布区数据集。如果为NULL(默认),将从rWCVPdata::wcvp_distributions加载名称

    包含分类单元范围多边形的简单特征 (sf) 数据框。

    详介

    taxon_rank指定高于物种阶元,那么返回整个组的分布区,而不是该组中单个物种的分布区。当改变选项时也适用,比如,不管native=TUREnative=FALSE,如果在原生分布区外有引入发现记录,也会包含紧取。要分辨原生分布区内的灭绝、引种或存疑记录,可以使用wcvp_summarywcvp_occ_mat

    9. wcvp_distribution_map()

    绘制物种、属、科的分布地区

    用法

    wcvp_distribution_map(
      range,
      crop_map = FALSE,
      native = TRUE,
      introduced = TRUE,
      extinct = TRUE,
      location_doubtful = TRUE
    )
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8

    参数

    • range:由wcvp_distribution返回的简单要素(sf)数据集
    • crop_map:逻辑变量。裁剪地图至分布区?默认为FALSE
    • native:逻辑变量。包含原生分布区?默认为TRUE
    • introduced:逻辑变量。包含引种分布区?默认为TRUE
    • extinct:逻辑变量。包含灭绝分布区?默认为TRUE
    • location_doubtful:逻辑变量。包含存疑记录分布区?默认为TRUE

    ggplot2::ggplot绘制的分布区

    详介

    世界植物 (POWO; https://powo.science.kew.org/) 使用的配色方案镜像,其中绿色是原生的,紫色是引入的,红色是灭绝的,橙色是可疑的。有关如何使用自定义颜色的信息,请参见示例。

    例子

    wcvp_distribution_map(wcvp_distribution("Callitris", taxon_rank = "genus"))
    
    • 1

    在这里插入图片描述

    wcvp_distribution_map(wcvp_distribution("Callitris", taxon_rank = "genus"), crop_map = TRUE)
    
    • 1

    在这里插入图片描述

    wcvp_distribution_map(wcvp_distribution("Callitris", taxon_rank = "genus")) +
      ggplot2::scale_fill_manual(values = c("red", "blue")) +
      ggplot2::scale_colour_manual(values = c("red", "blue"))
    
    • 1
    • 2
    • 3

    在这里插入图片描述

    10. wcvp_match_exact()

    与 WCVP 完全匹配。名称与 WCVP 的精确匹配,可选择使用作者字符串来优化结果。

    用法

    wcvp_match_exact(names_df, wcvp_names, name_col, author_col = NULL, id_col)
    
    • 1

    参数

    • names_df:用于匹配的名称数据框。
    • wcvp_names:从WCVP 版本7或更新中获得的分类名称数据集。如果为NULL(默认),将从rWCVPdata::wcvp_names加载名称
    • name_col:字符变量。names_df中用于匹配类群名称的列
    • author_colnames_df中含有名称命名人、用于辅助匹配的列。设置为NULL让匹配忽略命名人字符串
    • id_colnames_df中含有发现记录id的列

    将WCVP中的结果与names_df中的原始数据进行匹配。

    另请参阅

    ** wcvp_match_fuzzy(), wcvp_match_names()**

    例子

    wcvp_names = rWCVPdata::wcvp_names
    wcvp_match_exact(redlist_example, wcvp_names = wcvp_names, "scientificName", author_col = "authority", id_col = "assessmentId")
    
    • 1
    • 2
    # A tibble: 20 × 16
       assessmentId scientificName  redlistCategory authority match_type
              <dbl> <chr>           <chr>           <chr>     <chr>     
     1     11081542 Antimima quart… Least Concern   (Dinter)… NA        
     2     19395021 Avena hybrida   Data Deficient  Peterm.   Exact (wi…
     3     64135503 Citrus garrawa… Least Concern   F.M.Bail… NA        
     4    189601563 Croton campanu… Endangered      Caruzo &… Exact (wi…
     5    115968141 Cynanchum free… Endangered      (N.E.Br.… NA        
     6     11047751 Echinacanthus … Vulnerable      H.S.Lo &… NA        
     7     11001316 Geissanthus pi… Endangered      (Lundell… NA        
     8    126598076 Juglans pyrifo… Endangered      Liebm.    Exact (wi…
     9    198678856 Leichhardtia v… Vulnerable      (Guillau… Exact (wi…
    10    135836392 Mouriri myrtil… Least Concern   (Sw.) Po… NA        
    11    146459149 Neocussonia um… Least Concern   (Sond.) … Exact (wi…
    12    170239556 Papuodendron l… Least Concern   C.T.White Exact (wi…
    13     68117888 Plerandra sp. … Endangered      Lowry & … NA        
    14    133242195 Psammisia scle… Least Concern   A.C. Sm.  NA        
    15       580432 Rebutia albipe… Endangered      Rausch    NA        
    16    133163169 Senecio canesc… Least Concern   (Bonpl.)… NA        
    17    185585004 Serruria colli… Endangered      Salisb. … NA        
    18      8379911 Sesbania brevi… Least Concern   J.B.Gill… NA        
    19    122659437 Trichilia demi… Critically End… D.Penn.   NA        
    20      1433575 Vicia mollis    Least Concern   Boiss. &… NA        
    # ℹ 11 more variables: multiple_matches ,
    #   match_similarity , match_edit_distance ,
    #   wcvp_id , wcvp_name , wcvp_authors ,
    #   wcvp_rank , wcvp_status , wcvp_homotypic ,
    #   wcvp_ipni_id , wcvp_accepted_id 
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    wcvp_match_exact(redlist_example, wcvp_names = wcvp_names, "scientificName", id_col = "assessmentId")
    
    • 1
    # A tibble: 23 × 16
       assessmentId scientificName  redlistCategory authority match_type
              <dbl> <chr>           <chr>           <chr>     <chr>     
     1     11081542 Antimima quart… Least Concern   (Dinter)… NA        
     2     19395021 Avena hybrida   Data Deficient  Peterm.   Exact (wi…
     3     64135503 Citrus garrawa… Least Concern   F.M.Bail… NA        
     4    189601563 Croton campanu… Endangered      Caruzo &… Exact (wi…
     5    115968141 Cynanchum free… Endangered      (N.E.Br.… NA        
     6     11047751 Echinacanthus … Vulnerable      H.S.Lo &… Exact (wi…
     7     11001316 Geissanthus pi… Endangered      (Lundell… NA        
     8    126598076 Juglans pyrifo… Endangered      Liebm.    Exact (wi…
     9    126598076 Juglans pyrifo… Endangered      Liebm.    Exact (wi…
    10    198678856 Leichhardtia v… Vulnerable      (Guillau… Exact (wi…
    # ℹ 13 more rows
    # ℹ 11 more variables: multiple_matches ,
    #   match_similarity , match_edit_distance ,
    #   wcvp_id , wcvp_name , wcvp_authors ,
    #   wcvp_rank , wcvp_status , wcvp_homotypic ,
    #   wcvp_ipni_id , wcvp_accepted_id 
    # ℹ Use `print(n = ...)` to see more rows
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20

    11. wcvp_match_fuzzy() phonetic_match() edit_match()

    在WCVP中模糊匹配。使用语法匹配和编辑距离对 WCVP 中的名称进行模糊匹配。

    用法

    wcvp_match_fuzzy(names_df, wcvp_names, name_col, progress_bar = TRUE)
    
    phonetic_match(names_df, wcvp_names, name_col)
    
    edit_match(names_df, wcvp_names, name_col)
    
    • 1
    • 2
    • 3
    • 4
    • 5

    参数

    • names_df:用于匹配的名称数据框。
    • wcvp_names:从WCVP 版本7或更新中获得的分类名称数据集。如果为NULL(默认),将从rWCVPdata::wcvp_names加载名称
    • name_col:字符变量。names_df中用于匹配类群名称的列
    • progress_bar:逻辑变量。展示匹配进度条。默认为TRUE;如果选取了标记语言报告,请更改为FALSE

    将WCVP中的结果与names_df中的原始数据进行匹配。

    详介

    wcvp_match_fuzzy函数首先使用语法匹配,种后再基于编辑距离查找最接近匹配结果

    语法匹配使用了phonics::metaphoe,最大可以处理20个字符长度。

    编辑距离匹配根据Levenshtein相似性查找最接近的匹配,使用RecordLinkage::levenshteinSim计算。

    另请参阅

    wcvp_match_exact(), wcvp_match_names()

    例子

    wcvp_match_fuzzy(redlist_example, wcvp_names = wcvp_names, "scientificName")
    
    • 1
    # A tibble: 23 × 16■■■■■■■■■■■■■■■         80% | ETA:  4s
       assessmentId scientificName  redlistCategory authority match_type
              <dbl> <chr>           <chr>           <chr>     <chr>     
     1     19395021 Avena hybrida   Data Deficient  Peterm.   Fuzzy (ph…
     2     64135503 Citrus garrawa… Least Concern   F.M.Bail… Fuzzy (ph…
     3    189601563 Croton campanu… Endangered      Caruzo &… Fuzzy (ph…
     4    115968141 Cynanchum free… Endangered      (N.E.Br.… Fuzzy (ph…
     5     11047751 Echinacanthus … Vulnerable      H.S.Lo &… Fuzzy (ph…
     6    126598076 Juglans pyrifo… Endangered      Liebm.    Fuzzy (ph…
     7    126598076 Juglans pyrifo… Endangered      Liebm.    Fuzzy (ph…
     8    198678856 Leichhardtia v… Vulnerable      (Guillau… Fuzzy (ph…
     9    135836392 Mouriri myrtil… Least Concern   (Sw.) Po… Fuzzy (ph…
    10    146459149 Neocussonia um… Least Concern   (Sond.) … Fuzzy (ph…
    # ℹ 13 more rows
    # ℹ 11 more variables: multiple_matches ,
    #   match_similarity , match_edit_distance ,
    #   wcvp_id , wcvp_name , wcvp_authors ,
    #   wcvp_rank , wcvp_status , wcvp_homotypic ,
    #   wcvp_ipni_id , wcvp_accepted_id 
    # ℹ Use `print(n = ...)` to see more rows
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    phonetic_match(redlist_example, wcvp_names = wcvp_names, "scientificName")
    
    • 1
    # A tibble: 24 × 16
       assessmentId scientificName  redlistCategory authority match_type
              <dbl> <chr>           <chr>           <chr>     <chr>     
     1     11081542 Antimima quart… Least Concern   (Dinter)… NA        
     2     19395021 Avena hybrida   Data Deficient  Peterm.   Fuzzy (ph…
     3     64135503 Citrus garrawa… Least Concern   F.M.Bail… Fuzzy (ph…
     4    189601563 Croton campanu… Endangered      Caruzo &… Fuzzy (ph…
     5    115968141 Cynanchum free… Endangered      (N.E.Br.… Fuzzy (ph…
     6     11047751 Echinacanthus … Vulnerable      H.S.Lo &… Fuzzy (ph…
     7     11001316 Geissanthus pi… Endangered      (Lundell… NA        
     8    126598076 Juglans pyrifo… Endangered      Liebm.    Fuzzy (ph…
     9    126598076 Juglans pyrifo… Endangered      Liebm.    Fuzzy (ph…
    10    198678856 Leichhardtia v… Vulnerable      (Guillau… Fuzzy (ph…
    # ℹ 14 more rows
    # ℹ 11 more variables: multiple_matches ,
    #   match_similarity , match_edit_distance ,
    #   wcvp_id , wcvp_name , wcvp_authors ,
    #   wcvp_rank , wcvp_status , wcvp_homotypic ,
    #   wcvp_ipni_id , wcvp_accepted_id 
    # ℹ Use `print(n = ...)` to see more rows
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    edit_match(redlist_example, wcvp_names = wcvp_names, "scientificName")
    
    • 1
    # A tibble: 23 × 16■■■■■■■■■■■■■■■■■■■     95% | ETA:  3s
       assessmentId scientificName  redlistCategory authority match_type
              <dbl> <chr>           <chr>           <chr>     <chr>     
     1     11081542 Antimima quart… Least Concern   (Dinter)… Fuzzy (ed…
     2     19395021 Avena hybrida   Data Deficient  Peterm.   Fuzzy (ed…
     3     64135503 Citrus garrawa… Least Concern   F.M.Bail… Fuzzy (ed…
     4    189601563 Croton campanu… Endangered      Caruzo &… Fuzzy (ed…
     5    115968141 Cynanchum free… Endangered      (N.E.Br.… Fuzzy (ed…
     6     11047751 Echinacanthus … Vulnerable      H.S.Lo &… Fuzzy (ed…
     7     11001316 Geissanthus pi… Endangered      (Lundell… Fuzzy (ed…
     8    126598076 Juglans pyrifo… Endangered      Liebm.    Fuzzy (ed…
     9    126598076 Juglans pyrifo… Endangered      Liebm.    Fuzzy (ed…
    10    198678856 Leichhardtia v… Vulnerable      (Guillau… Fuzzy (ed…
    # ℹ 13 more rows
    # ℹ 11 more variables: multiple_matches ,
    #   match_similarity , match_edit_distance ,
    #   wcvp_id , wcvp_name , wcvp_authors ,
    #   wcvp_rank , wcvp_status , wcvp_homotypic ,
    #   wcvp_ipni_id , wcvp_accepted_id 
    # ℹ Use `print(n = ...)` to see more rows
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20

    12. wcvp_match_names()

    在WCVP中匹配名称。将名称与 WCVP 匹配,首先使用精确匹配,然后对任何剩余的未匹配名称使用模糊匹配。

    用法

    wcvp_match_names(
      names_df,
      wcvp_names = NULL,
      name_col = NULL,
      id_col = NULL,
      author_col = NULL,
      join_cols = NULL,
      fuzzy = TRUE,
      progress_bar = TRUE
    )
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10

    参数

    • names_df:用于匹配的名称数据框。
    • wcvp_names:从WCVP 版本7或更新中获得的分类名称数据集。如果为NULL(默认),将从rWCVPdata::wcvp_names加载名称
    • name_col:字符变量。names_df中用于匹配类群名称的列
    • progress_bar:逻辑变量。展示匹配进度条。默认为TRUE;如果选取了标记语言报告,请更改为FALSE
    • author_colnames_df中含有名称命名人、用于辅助匹配的列。设置为NULL让匹配忽略命名人字符串
    • id_colnames_df中含有发现记录id的列
    • join_cols:字符变量。如果没有提供name_col,通过该向量各部分组建一个类群名称
    • fuzzy:逻辑变量;是否应该对无法精确匹配的名称使用模糊匹配。

    将WCVP中的结果与names_df中的原始数据进行匹配。

    详介

    一般来说,精确匹配只使用类群名称(name_col),除非提供了作者名(author_col)。

    还可以通过join_cols来组建类群名称,但必须要确保它们的组建顺序正确(例如,c(“genus”, “species”, “infra_rank”, “infra”))。

    模糊匹配使用语法和编辑距离匹配相结合,可以使用fuzzy=FALSE关闭模糊匹配。

    另请参阅

    wcvp_match_exact(), wcvp_match_fuzzy()

    例子

    wcvp_match_names(redlist_example, wcvp_names, name_col = "scientificName", id_col = "assessmentId")
    
    • 1
    ── Matching names to WCVP ──────────────────────────────────────────
    ℹ Using the `scientificName` column                       
    ! No author information supplied - matching on taxon name only
                                                              
    ── Exact matching  names ──                               
                                                              
    ✔ Found 12 of  names                                      
                                                              
    ── Fuzzy matching 8 names ──                              
                                                              
    ✔ Found 7 of 8 names                                      
                                                              
    ── Matching complete! ──                                  
                                                              
    ✔ Matched 19 of 20 names                                  
    ℹ Exact (without author): 12                              
    ℹ Fuzzy (edit distance): 4                                
    ℹ Fuzzy (phonetic): 3                                     
    ! Names with multiple matches: 3                          
    # A tibble: 23 × 16■■■■■■■■■■■■■■■         80% | ETA:  4s
       assessmentId scientificName  redlistCategory authority match_type
              <dbl> <chr>           <chr>           <chr>     <chr>     
     1     11081542 Antimima quart… Least Concern   (Dinter)… Fuzzy (ed…
     2     19395021 Avena hybrida   Data Deficient  Peterm.   Exact (wi…
     3     64135503 Citrus garrawa… Least Concern   F.M.Bail… Fuzzy (ph…
     4    189601563 Croton campanu… Endangered      Caruzo &… Exact (wi…
     5    115968141 Cynanchum free… Endangered      (N.E.Br.… Fuzzy (ph…
     6     11047751 Echinacanthus … Vulnerable      H.S.Lo &… Exact (wi…
     7     11001316 Geissanthus pi… Endangered      (Lundell… Fuzzy (ed…
     8    126598076 Juglans pyrifo… Endangered      Liebm.    Exact (wi…
     9    126598076 Juglans pyrifo… Endangered      Liebm.    Exact (wi…
    10    198678856 Leichhardtia v… Vulnerable      (Guillau… Exact (wi…
    # ℹ 13 more rows
    # ℹ 11 more variables: multiple_matches ,
    #   match_similarity , match_edit_distance ,
    #   wcvp_id , wcvp_name , wcvp_authors ,
    #   wcvp_rank , wcvp_status , wcvp_homotypic ,
    #   wcvp_ipni_id , wcvp_accepted_id 
    # ℹ Use `print(n = ...)` to see more rows
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29
    • 30
    • 31
    • 32
    • 33
    • 34
    • 35
    • 36
    • 37
    • 38
    • 39

    13. wcvp_occ_mat()

    生成类群和区域的发现记录矩阵

    语法

    wcvp_occ_mat(
      taxon = NULL,
      taxon_rank = c("species", "genus", "family", "order", "higher"),
      area_codes = NULL,
      native = TRUE,
      introduced = TRUE,
      extinct = TRUE,
      location_doubtful = TRUE,
      wcvp_names = NULL,
      wcvp_distributions = NULL
    )
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11

    参数

    • taxon:字符变量。指包含的类群。默认为NULL(不进行类群筛选,所有类群)
    • taxon_rank:字符变量。“species”, “genus”, “family”, “order” or "higher"之一,指定 taxon的分类阶元。除非 taxonNULL,否则必须指定
    • area_codes:字符变量。单个或多个WGSRPD3级区域代码。默认为NULL(全球范围)
    • synonyms:逻辑变量。在清单中包含异名。默认为TRUE
    • render_report:逻辑变量。将清单呈现为标记语言报告。默认为FALSE
    • native:逻辑变量。包含未标记为 introduced,extinct或doubful的物种发现记录
    • introduced:逻辑变量。包含标记为引入的物种发现记录。默认为TRUE
    • extinct:逻辑变量。包含标记为灭绝的物种发现记录。默认为TRUE
    • location_doubtful:逻辑变量。包含标记为产地存疑的物种发现记录。默认为TRUE
    • wcvp_names:从WCVP 版本7或更新中获得的分类名称数据集。如果为NULL(默认),将从rWCVPdata::wcvp_names加载名称
    • wcvp_distributions:从WCVP 版本7或更新中获得的分布区数据集。如果为NULL(默认),将从rWCVPdata::wcvp_distributions加载名称

    含有taxon_nameplant_name_id的一个数据集

    详介

    请参阅此处的示例,了解如何将此输出格式化以供发表。

    例子

    wcvp_occ_mat(taxon = "Poa", taxon_rank = "genus",
                 area = c("TAS","VIC","NSW"),
                 introduced = FALSE)
    
    • 1
    • 2
    • 3
    # A tibble: 37 × 5
       plant_name_id taxon_name          NSW   TAS   VIC
               <dbl> <chr>             <dbl> <dbl> <dbl>
     1        435044 Poa affinis           1     0     1
     2        469193 Poa amplexicaulis     0     0     1
     3        435565 Poa cheelii           1     0     0
     4        435598 Poa clelandii         0     1     1
     5        435599 Poa clivicola         1     1     1
     6        435658 Poa costiniana        1     1     1
     7        435661 Poa crassicaudex      0     0     1
     8        435797 Poa drummondiana      0     0     1
     9        435841 Poa ensiformis        1     0     1
    10        435878 Poa fawcettiae        1     1     1
    # ℹ 27 more rows
    # ℹ Use `print(n = ...)` to see more rows
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15

    14. wcvp_reformat()

    WCVP本地版本的重新格式化

    用法

    wcvp_reformat(wcvp_local, version = NULL)
    
    • 1

    参数

    • wcvp_local:数据集。WCVP的本地副本。
    • version:9或”v9“。

    返回相同结构的一个数据集

    详介

    请注意,并非所有原始变量在重新格式化期间都会保留。例如,publication 在 v9 中是单个变量,但在数据包中拆分为多个变量。因此不可能简单地重命名这个变量。数据包中存在但 v9 中不存在的变量用 NA 填充。

    15. wcvp_summary()

    从WCVP中生成一个概要表

    用法

    wcvp_summary(
      taxon = NULL,
      taxon_rank = c("species", "genus", "family", "order", "higher"),
      area_codes = NULL,
      grouping_var = c("area_code_l3", "genus", "family", "order", "higher"),
      hybrids = FALSE,
      wcvp_names = NULL,
      wcvp_distributions = NULL
    )
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9

    参数

    • taxon:字符变量。指包含的类群。默认为NULL(不进行类群筛选,所有类群)
    • taxon_rank:字符变量。“species”, “genus”, “family”, “order” or "higher"之一,指定 taxon的分类阶元。除非 taxonNULL,否则必须指定
    • area_codes:字符变量。单个或多个WGSRPD3级区域代码。默认为NULL(全球范围)
    • grouping_var:字符变量;“area_code_l3”, “genus”, “family”,“order” or "higher"之一,指定摘要如何排序。默认为area_code_l3
    • hybrids:逻辑变量。是否统计杂交种。默认为FALSE
      • wcvp_names:从WCVP 版本7或更新中获得的分类名称数据集。如果为NULL(默认),将从rWCVPdata::wcvp_names加载名称
    • wcvp_distributions:从WCVP 版本7或更新中获得的分布区数据集。如果为NULL(默认),将从rWCVPdata::wcvp_distributions加载名称

    筛选后的数据集,或一个gt表格

    详介

    分类阶元higher的可用值有 Angiosperms, Gymnosperms, Ferns and Lycophytes 。请注意,分组变量(如果是分类学的)应低于 taxon 和 taxon_rank 的级别,以生成有意义的摘要(即,按属、科或更高分类对属进行分组没有意义)。此外,如果分组变量是分类变量,则物种出现在整个输入区域。这意味着如果一个物种是任何输入区域的本地物种(即使它是在其他地区引入或灭绝的),它也被视为“本地”。同样,引入的事件优先于灭绝的事件。请注意,在此类汇总表中,“地方性”表示输入区域特有,不一定是输入区域内的单个 WGSRPD 第 3 级区域。

    例子

    ferns = wcvp_summary("Ferns", "higher", get_wgsrpd3_codes("New Zealand"), grouping_var = "family")
    wcvp_summary_gt(ferns)
    
    • 1
    • 2
    ℹ Matches to input geography found at Country (Gallagher) and Region (Level 2)
    ℹ Aggregating occurrence types across input area ("New Zealand") - see `?wcvp_summary()` for details.
    Matching ■■■■■■■■■■■■■■■■■■■■■■■■■         80% | ETA:  4s
    
    • 1
    • 2
    • 3

    在这里插入图片描述

    16. wcvp_summary_gt()

    wcvp_summary结果中呈现摘要表

    用法

    wcvp_summary_gt(x)
    
    • 1

    参数

    • x:列表

    gt表格

    例子

    见15. 例子

    17. wgsrpd3

    生物多样性信息标准 (TDWG) 记录植物分布的世界地理计划 (WGSRPD)。WGSRPD 3级的空间数据,用于绘制地图

    用法

    wgsrpd3
    
    • 1

    格式

    一个包含20行和4个变量的“sf”对象:

    • LEVEL3_NAM:区域名称
    • LEVEL3_COD:区域代码
    • LEVEL2_COD:2级代码
    • LEVEL1_COD:1级(大陆)

    geometry:sf几何
    fillcol:用于映射

    资源

    https://github.com/tdwg/wgsrpd/tree/master/level3添加链接描述

    18. wgsrpd_mapping

    将 WGSRPD 地理映射到其他级别的数据。一个数据集,包含每个3级地区的地区(3级)、#'地区(2级)、大陆(1级)、国家(政治)和半球类别。

    用法

    wgsrpd_mapping
    
    • 1

    格式

    一个包含370行和7个变量的数据集:

    • HEMISPHERE:北、南或赤道(跨赤道)
    • LEVEL1_COD:大陆代码
    • LEVEL1_NAM:大陆
    • LEVEL2_COD:区域代码
    • LEVEL2_NAM:区域
    • COUNTRY:国家(行政)
    • LEVEL3_COD:地区代码
    • LEVEL3_NAM:地区

    资源

    https://github.com/tdwg/wgsrpd

  • 相关阅读:
    如何从0到1设计积分系统?
    DDD之上下文映射图(Context Mapping)
    电话本相关命令
    CNI、CSI 和 CRI在 Docker 中的角色和作用
    Java配置37-搭建Nexus服务器
    当我让文心一言写个代码来庆祝1024程序员节,它写的代码是……
    学会这几个PPT制作技巧,让同事对你刮目相看
    2023-06-15:说一说Redis的Key和Value的数据结构组织?
    H3C IPsec多分支经由总部互通
    【C++】模板-非类型模板参数
  • 原文地址:https://blog.csdn.net/whitedrogen/article/details/130859525