根据地区编码获得地区名称
get_area_name(area_codes)
字符。长度为1的向量,带有3级区域集的名称,或者(如果该区域集没有名称)代码的输入向量。
与get_wgsrpd3_codes函数执行相反的功能。适用于压缩代码集,例如文件名、绘图和表格格式。
get_area_name(get_wgsrpd3_codes("Brazil"))
ℹ Matches to input geography found at Country (Gallagher) and Region (Level 2)
[1] "Brazil"
提取WGSRPD3级编码
get_wgsrpd3_codes(geography, include_equatorial = NULL)
具有属于该地理区域的区号(级别3)的字符。
国家绘图遵循加Gallagher et al. (2020)。重要的是,这意味着一些海外领土在此系统中不被视为国家的一部分,例如加那利群岛被指定为它们自己的 3 级区域,而不是此映射中西班牙的一部分。在不明确的地方,可以使用View(wgsrpd_mapping)来研究映射。
get_wgsrpd3_codes("Brazil")
ℹ Matches to input geography found at Country (Gallagher) and Region (Level 2)
[1] "BZC" "BZE" "BZL" "BZN" "BZS"
为给定的范围和范围质心绘制 POWO 样式地图。
powo_map(range_sf, centroids_sf)
该范围的ggplot地图
POWO网站上展示的范围地图有一个固定的、离散的调色板,它基于一个地区的分类群类型。
powo_pal()
scale_color_powo(...)
scale_colour_powo(...)
scale_fill_powo(...)
字符。与POWO相匹配的名称和十六进制值的向量。
名称匹配的示例数据集。一个包含20个红名单评估样本的数据集,用于名称匹配
redlist_example
具有 20 行和 4 个变量的数据框:
从 https://www.iucnredlist.org/ 下载并采样
用于将植物科映射到目或更高分类的数据。包含更高分类(被子植物、裸子植物、蕨类植物和石松植物)和 WCVP 中每个科的顺序的数据集。
taxonomic_mapping
一个包含457行和3个变量的数据框架:科、目和更高分类阶元
PPG I 中的蕨类植物和石松类植物分类学。来自APG IV的被子植物分类学。Forest 等人的裸子植物分类学。
从 WCVP 生成物种清单
wcvp_checklist(
taxon = NULL,
taxon_rank = c("species", "genus", "family", "order", "higher"),
area_codes = NULL,
synonyms = TRUE,
render_report = FALSE,
native = TRUE,
introduced = TRUE,
extinct = TRUE,
location_doubtful = TRUE,
hybrids = FALSE,
infraspecies = TRUE,
report_filename = NULL,
report_dir = NULL,
report_type = c("alphabetical", "taxonomic"),
wcvp_names = NULL,
wcvp_distributions = NULL
)
返回筛选数据后的数据集,如果 render_report=TRUE,还有一个HTML报告文件
使用synonyms参数可以只返回接受名。如果synonyms=TRUR,则废弃名、不合法名和其他非接受名都会返回(例如,清单并不限制名称:taxon_status==“Synonym”)。*rWCVP**提供两种清单类型:字母顺序型和分类顺序型。在字母顺序型清单中,所有名称都按照字母顺序排列,接受名加粗而异名接在接受名后。在分类顺序型清单中,名称按接受名分组,异名列在对应接受名下方。两种类型清单都包含命名人、参考文献和分布信息,注意科级标头仅在字母顺序清单中支持。
生成物种、属、科的空间分布对象*
wcvp_distribution(
taxon,
taxon_rank = c("species", "genus", "family", "order", "higher"),
native = TRUE,
introduced = TRUE,
extinct = TRUE,
location_doubtful = TRUE,
wcvp_names = NULL,
wcvp_distributions = NULL
)
包含分类单元范围多边形的简单特征 (sf) 数据框。
当taxon_rank指定高于物种阶元,那么返回整个组的分布区,而不是该组中单个物种的分布区。当改变选项时也适用,比如,不管native=TURE或native=FALSE,如果在原生分布区外有引入发现记录,也会包含紧取。要分辨原生分布区内的灭绝、引种或存疑记录,可以使用wcvp_summary和wcvp_occ_mat
绘制物种、属、科的分布地区
wcvp_distribution_map(
range,
crop_map = FALSE,
native = TRUE,
introduced = TRUE,
extinct = TRUE,
location_doubtful = TRUE
)
由ggplot2::ggplot绘制的分布区
世界植物 (POWO; https://powo.science.kew.org/) 使用的配色方案镜像,其中绿色是原生的,紫色是引入的,红色是灭绝的,橙色是可疑的。有关如何使用自定义颜色的信息,请参见示例。
wcvp_distribution_map(wcvp_distribution("Callitris", taxon_rank = "genus"))

wcvp_distribution_map(wcvp_distribution("Callitris", taxon_rank = "genus"), crop_map = TRUE)

wcvp_distribution_map(wcvp_distribution("Callitris", taxon_rank = "genus")) +
ggplot2::scale_fill_manual(values = c("red", "blue")) +
ggplot2::scale_colour_manual(values = c("red", "blue"))

与 WCVP 完全匹配。名称与 WCVP 的精确匹配,可选择使用作者字符串来优化结果。
wcvp_match_exact(names_df, wcvp_names, name_col, author_col = NULL, id_col)
将WCVP中的结果与names_df中的原始数据进行匹配。
** wcvp_match_fuzzy(), wcvp_match_names()**
wcvp_names = rWCVPdata::wcvp_names
wcvp_match_exact(redlist_example, wcvp_names = wcvp_names, "scientificName", author_col = "authority", id_col = "assessmentId")
# A tibble: 20 × 16
assessmentId scientificName redlistCategory authority match_type
<dbl> <chr> <chr> <chr> <chr>
1 11081542 Antimima quart… Least Concern (Dinter)… NA
2 19395021 Avena hybrida Data Deficient Peterm. Exact (wi…
3 64135503 Citrus garrawa… Least Concern F.M.Bail… NA
4 189601563 Croton campanu… Endangered Caruzo &… Exact (wi…
5 115968141 Cynanchum free… Endangered (N.E.Br.… NA
6 11047751 Echinacanthus … Vulnerable H.S.Lo &… NA
7 11001316 Geissanthus pi… Endangered (Lundell… NA
8 126598076 Juglans pyrifo… Endangered Liebm. Exact (wi…
9 198678856 Leichhardtia v… Vulnerable (Guillau… Exact (wi…
10 135836392 Mouriri myrtil… Least Concern (Sw.) Po… NA
11 146459149 Neocussonia um… Least Concern (Sond.) … Exact (wi…
12 170239556 Papuodendron l… Least Concern C.T.White Exact (wi…
13 68117888 Plerandra sp. … Endangered Lowry & … NA
14 133242195 Psammisia scle… Least Concern A.C. Sm. NA
15 580432 Rebutia albipe… Endangered Rausch NA
16 133163169 Senecio canesc… Least Concern (Bonpl.)… NA
17 185585004 Serruria colli… Endangered Salisb. … NA
18 8379911 Sesbania brevi… Least Concern J.B.Gill… NA
19 122659437 Trichilia demi… Critically End… D.Penn. NA
20 1433575 Vicia mollis Least Concern Boiss. &… NA
# ℹ 11 more variables: multiple_matches ,
# match_similarity , match_edit_distance ,
# wcvp_id , wcvp_name , wcvp_authors ,
# wcvp_rank , wcvp_status , wcvp_homotypic ,
# wcvp_ipni_id , wcvp_accepted_id
wcvp_match_exact(redlist_example, wcvp_names = wcvp_names, "scientificName", id_col = "assessmentId")
# A tibble: 23 × 16
assessmentId scientificName redlistCategory authority match_type
<dbl> <chr> <chr> <chr> <chr>
1 11081542 Antimima quart… Least Concern (Dinter)… NA
2 19395021 Avena hybrida Data Deficient Peterm. Exact (wi…
3 64135503 Citrus garrawa… Least Concern F.M.Bail… NA
4 189601563 Croton campanu… Endangered Caruzo &… Exact (wi…
5 115968141 Cynanchum free… Endangered (N.E.Br.… NA
6 11047751 Echinacanthus … Vulnerable H.S.Lo &… Exact (wi…
7 11001316 Geissanthus pi… Endangered (Lundell… NA
8 126598076 Juglans pyrifo… Endangered Liebm. Exact (wi…
9 126598076 Juglans pyrifo… Endangered Liebm. Exact (wi…
10 198678856 Leichhardtia v… Vulnerable (Guillau… Exact (wi…
# ℹ 13 more rows
# ℹ 11 more variables: multiple_matches ,
# match_similarity , match_edit_distance ,
# wcvp_id , wcvp_name , wcvp_authors ,
# wcvp_rank , wcvp_status , wcvp_homotypic ,
# wcvp_ipni_id , wcvp_accepted_id
# ℹ Use `print(n = ...)` to see more rows
在WCVP中模糊匹配。使用语法匹配和编辑距离对 WCVP 中的名称进行模糊匹配。
wcvp_match_fuzzy(names_df, wcvp_names, name_col, progress_bar = TRUE)
phonetic_match(names_df, wcvp_names, name_col)
edit_match(names_df, wcvp_names, name_col)
将WCVP中的结果与names_df中的原始数据进行匹配。
wcvp_match_fuzzy函数首先使用语法匹配,种后再基于编辑距离查找最接近匹配结果
语法匹配使用了phonics::metaphoe,最大可以处理20个字符长度。
编辑距离匹配根据Levenshtein相似性查找最接近的匹配,使用RecordLinkage::levenshteinSim计算。
wcvp_match_exact(), wcvp_match_names()
wcvp_match_fuzzy(redlist_example, wcvp_names = wcvp_names, "scientificName")
# A tibble: 23 × 16■■■■■■■■■■■■■■■ 80% | ETA: 4s
assessmentId scientificName redlistCategory authority match_type
<dbl> <chr> <chr> <chr> <chr>
1 19395021 Avena hybrida Data Deficient Peterm. Fuzzy (ph…
2 64135503 Citrus garrawa… Least Concern F.M.Bail… Fuzzy (ph…
3 189601563 Croton campanu… Endangered Caruzo &… Fuzzy (ph…
4 115968141 Cynanchum free… Endangered (N.E.Br.… Fuzzy (ph…
5 11047751 Echinacanthus … Vulnerable H.S.Lo &… Fuzzy (ph…
6 126598076 Juglans pyrifo… Endangered Liebm. Fuzzy (ph…
7 126598076 Juglans pyrifo… Endangered Liebm. Fuzzy (ph…
8 198678856 Leichhardtia v… Vulnerable (Guillau… Fuzzy (ph…
9 135836392 Mouriri myrtil… Least Concern (Sw.) Po… Fuzzy (ph…
10 146459149 Neocussonia um… Least Concern (Sond.) … Fuzzy (ph…
# ℹ 13 more rows
# ℹ 11 more variables: multiple_matches ,
# match_similarity , match_edit_distance ,
# wcvp_id , wcvp_name , wcvp_authors ,
# wcvp_rank , wcvp_status , wcvp_homotypic ,
# wcvp_ipni_id , wcvp_accepted_id
# ℹ Use `print(n = ...)` to see more rows
phonetic_match(redlist_example, wcvp_names = wcvp_names, "scientificName")
# A tibble: 24 × 16
assessmentId scientificName redlistCategory authority match_type
<dbl> <chr> <chr> <chr> <chr>
1 11081542 Antimima quart… Least Concern (Dinter)… NA
2 19395021 Avena hybrida Data Deficient Peterm. Fuzzy (ph…
3 64135503 Citrus garrawa… Least Concern F.M.Bail… Fuzzy (ph…
4 189601563 Croton campanu… Endangered Caruzo &… Fuzzy (ph…
5 115968141 Cynanchum free… Endangered (N.E.Br.… Fuzzy (ph…
6 11047751 Echinacanthus … Vulnerable H.S.Lo &… Fuzzy (ph…
7 11001316 Geissanthus pi… Endangered (Lundell… NA
8 126598076 Juglans pyrifo… Endangered Liebm. Fuzzy (ph…
9 126598076 Juglans pyrifo… Endangered Liebm. Fuzzy (ph…
10 198678856 Leichhardtia v… Vulnerable (Guillau… Fuzzy (ph…
# ℹ 14 more rows
# ℹ 11 more variables: multiple_matches ,
# match_similarity , match_edit_distance ,
# wcvp_id , wcvp_name , wcvp_authors ,
# wcvp_rank , wcvp_status , wcvp_homotypic ,
# wcvp_ipni_id , wcvp_accepted_id
# ℹ Use `print(n = ...)` to see more rows
edit_match(redlist_example, wcvp_names = wcvp_names, "scientificName")
# A tibble: 23 × 16■■■■■■■■■■■■■■■■■■■ 95% | ETA: 3s
assessmentId scientificName redlistCategory authority match_type
<dbl> <chr> <chr> <chr> <chr>
1 11081542 Antimima quart… Least Concern (Dinter)… Fuzzy (ed…
2 19395021 Avena hybrida Data Deficient Peterm. Fuzzy (ed…
3 64135503 Citrus garrawa… Least Concern F.M.Bail… Fuzzy (ed…
4 189601563 Croton campanu… Endangered Caruzo &… Fuzzy (ed…
5 115968141 Cynanchum free… Endangered (N.E.Br.… Fuzzy (ed…
6 11047751 Echinacanthus … Vulnerable H.S.Lo &… Fuzzy (ed…
7 11001316 Geissanthus pi… Endangered (Lundell… Fuzzy (ed…
8 126598076 Juglans pyrifo… Endangered Liebm. Fuzzy (ed…
9 126598076 Juglans pyrifo… Endangered Liebm. Fuzzy (ed…
10 198678856 Leichhardtia v… Vulnerable (Guillau… Fuzzy (ed…
# ℹ 13 more rows
# ℹ 11 more variables: multiple_matches ,
# match_similarity , match_edit_distance ,
# wcvp_id , wcvp_name , wcvp_authors ,
# wcvp_rank , wcvp_status , wcvp_homotypic ,
# wcvp_ipni_id , wcvp_accepted_id
# ℹ Use `print(n = ...)` to see more rows
在WCVP中匹配名称。将名称与 WCVP 匹配,首先使用精确匹配,然后对任何剩余的未匹配名称使用模糊匹配。
wcvp_match_names(
names_df,
wcvp_names = NULL,
name_col = NULL,
id_col = NULL,
author_col = NULL,
join_cols = NULL,
fuzzy = TRUE,
progress_bar = TRUE
)
将WCVP中的结果与names_df中的原始数据进行匹配。
一般来说,精确匹配只使用类群名称(name_col),除非提供了作者名(author_col)。
还可以通过join_cols来组建类群名称,但必须要确保它们的组建顺序正确(例如,c(“genus”, “species”, “infra_rank”, “infra”))。
模糊匹配使用语法和编辑距离匹配相结合,可以使用fuzzy=FALSE关闭模糊匹配。
wcvp_match_exact(), wcvp_match_fuzzy()
wcvp_match_names(redlist_example, wcvp_names, name_col = "scientificName", id_col = "assessmentId")
── Matching names to WCVP ──────────────────────────────────────────
ℹ Using the `scientificName` column
! No author information supplied - matching on taxon name only
── Exact matching names ──
✔ Found 12 of names
── Fuzzy matching 8 names ──
✔ Found 7 of 8 names
── Matching complete! ──
✔ Matched 19 of 20 names
ℹ Exact (without author): 12
ℹ Fuzzy (edit distance): 4
ℹ Fuzzy (phonetic): 3
! Names with multiple matches: 3
# A tibble: 23 × 16■■■■■■■■■■■■■■■ 80% | ETA: 4s
assessmentId scientificName redlistCategory authority match_type
<dbl> <chr> <chr> <chr> <chr>
1 11081542 Antimima quart… Least Concern (Dinter)… Fuzzy (ed…
2 19395021 Avena hybrida Data Deficient Peterm. Exact (wi…
3 64135503 Citrus garrawa… Least Concern F.M.Bail… Fuzzy (ph…
4 189601563 Croton campanu… Endangered Caruzo &… Exact (wi…
5 115968141 Cynanchum free… Endangered (N.E.Br.… Fuzzy (ph…
6 11047751 Echinacanthus … Vulnerable H.S.Lo &… Exact (wi…
7 11001316 Geissanthus pi… Endangered (Lundell… Fuzzy (ed…
8 126598076 Juglans pyrifo… Endangered Liebm. Exact (wi…
9 126598076 Juglans pyrifo… Endangered Liebm. Exact (wi…
10 198678856 Leichhardtia v… Vulnerable (Guillau… Exact (wi…
# ℹ 13 more rows
# ℹ 11 more variables: multiple_matches ,
# match_similarity , match_edit_distance ,
# wcvp_id , wcvp_name , wcvp_authors ,
# wcvp_rank , wcvp_status , wcvp_homotypic ,
# wcvp_ipni_id , wcvp_accepted_id
# ℹ Use `print(n = ...)` to see more rows
生成类群和区域的发现记录矩阵
wcvp_occ_mat(
taxon = NULL,
taxon_rank = c("species", "genus", "family", "order", "higher"),
area_codes = NULL,
native = TRUE,
introduced = TRUE,
extinct = TRUE,
location_doubtful = TRUE,
wcvp_names = NULL,
wcvp_distributions = NULL
)
含有taxon_name和plant_name_id的一个数据集
请参阅此处的示例,了解如何将此输出格式化以供发表。
wcvp_occ_mat(taxon = "Poa", taxon_rank = "genus",
area = c("TAS","VIC","NSW"),
introduced = FALSE)
# A tibble: 37 × 5
plant_name_id taxon_name NSW TAS VIC
<dbl> <chr> <dbl> <dbl> <dbl>
1 435044 Poa affinis 1 0 1
2 469193 Poa amplexicaulis 0 0 1
3 435565 Poa cheelii 1 0 0
4 435598 Poa clelandii 0 1 1
5 435599 Poa clivicola 1 1 1
6 435658 Poa costiniana 1 1 1
7 435661 Poa crassicaudex 0 0 1
8 435797 Poa drummondiana 0 0 1
9 435841 Poa ensiformis 1 0 1
10 435878 Poa fawcettiae 1 1 1
# ℹ 27 more rows
# ℹ Use `print(n = ...)` to see more rows
WCVP本地版本的重新格式化
wcvp_reformat(wcvp_local, version = NULL)
返回相同结构的一个数据集
请注意,并非所有原始变量在重新格式化期间都会保留。例如,publication 在 v9 中是单个变量,但在数据包中拆分为多个变量。因此不可能简单地重命名这个变量。数据包中存在但 v9 中不存在的变量用 NA 填充。
从WCVP中生成一个概要表
wcvp_summary(
taxon = NULL,
taxon_rank = c("species", "genus", "family", "order", "higher"),
area_codes = NULL,
grouping_var = c("area_code_l3", "genus", "family", "order", "higher"),
hybrids = FALSE,
wcvp_names = NULL,
wcvp_distributions = NULL
)
筛选后的数据集,或一个gt表格
分类阶元higher的可用值有 Angiosperms, Gymnosperms, Ferns and Lycophytes 。请注意,分组变量(如果是分类学的)应低于 taxon 和 taxon_rank 的级别,以生成有意义的摘要(即,按属、科或更高分类对属进行分组没有意义)。此外,如果分组变量是分类变量,则物种出现在整个输入区域。这意味着如果一个物种是任何输入区域的本地物种(即使它是在其他地区引入或灭绝的),它也被视为“本地”。同样,引入的事件优先于灭绝的事件。请注意,在此类汇总表中,“地方性”表示输入区域特有,不一定是输入区域内的单个 WGSRPD 第 3 级区域。
ferns = wcvp_summary("Ferns", "higher", get_wgsrpd3_codes("New Zealand"), grouping_var = "family")
wcvp_summary_gt(ferns)
ℹ Matches to input geography found at Country (Gallagher) and Region (Level 2)
ℹ Aggregating occurrence types across input area ("New Zealand") - see `?wcvp_summary()` for details.
Matching ■■■■■■■■■■■■■■■■■■■■■■■■■ 80% | ETA: 4s

从wcvp_summary结果中呈现摘要表
wcvp_summary_gt(x)
gt表格
见15. 例子
生物多样性信息标准 (TDWG) 记录植物分布的世界地理计划 (WGSRPD)。WGSRPD 3级的空间数据,用于绘制地图
wgsrpd3
一个包含20行和4个变量的“sf”对象:
geometry:sf几何
fillcol:用于映射
https://github.com/tdwg/wgsrpd/tree/master/level3添加链接描述
将 WGSRPD 地理映射到其他级别的数据。一个数据集,包含每个3级地区的地区(3级)、#'地区(2级)、大陆(1级)、国家(政治)和半球类别。
wgsrpd_mapping
一个包含370行和7个变量的数据集: