• 【 C++ 】unordered_map和unordered_set的介绍和使用


    目录

    1、unordered系列关联式容器

    2、unordered_map

            unordered_map的介绍

            unordered_map的构造方式

            unordered_map的函数接口说明

          unordered_multimap

    3、unordered_set

            unordered_set的介绍

            unordered_set的构造方式

            unordered_set的函数接口说明

          unordered_multiset

    4、map/set与unordered_map/unordered_set的区别

            set/unordered_set的性能对比


    1、unordered系列关联式容器

    在C++98中,STL提供了底层为红黑树结构的一系列关联式容器,在查询时效率可达到O(logN) ,即最差情况下需要比较红黑树的高度次,当树中的节点非常多时,查询效率也不理想。最好的查询是,进行很少的比较次数就能够将元素找到,因此在C++11中,STL又提供了4个unordered系列的关联式容器,这四个容器与红黑树结构的关联式容器使用方式基本类似,只是其底层结构不同。下面就开始依次进行讲解。


    2、unordered_map

    unordered_map的介绍

    • 1、unordered_map是存储键值对的关联式容器,其允许通过keys快速的索引到与其对应的value。
    • 2、在unordered_map中,键值通常用于惟一地标识元素,而映射值是一个对象,其内容与此键关联。键和映射值的类型可能不同。
    • 3、在内部,unordered_map没有对按照任何特定的顺序排序, 为了能在常数范围内找到key所对应的value,unordered_map将相同哈希值的键值对放在相同的桶中。
    • 4、unordered_map容器通过key访问单个元素要比map快,但它通常在遍历元素子集的范围迭代方面效率较低。
    • 5、unordered_maps实现了直接访问操作符(operator[]),它允许使用key作为参数直接访问value。
    • 6、它的迭代器至少是前向迭代器。

    unordered_map的构造方式

    • 1、构造一个空容器:
    unordered_mapint> mp1;
    • 2、拷贝构造一个容器:
    unordered_mapint> mp2(mp1);
    • 3、使用迭代器区间构造一个容器:
    unordered_mapint> mp2(mp1.begin(), mp1.end());

    unordered_map的函数接口说明

    • 1、unordered_map的容量
    函数声明功能介绍
    bool empty() const检测是否为空
    size_t size() const获取有效元素个数
    • 2、unordered_map的迭代器
    函数声明功能介绍
    begin赶回unordered_map第一个元素的迭代器位置
    end返回unordered_map最后一个元素下一个位置的迭代器
    cbegin返回unordered_map第一个元素的const迭代器
    cend返回unordered_map最后一个元素下一个位置的const迭代器
    • 3、unordered_map的元素访问
    函数声明功能介绍
    operator[ ]返回与key对应的value,没有一个默认值

    注意:针对于[ ]的重载,该函数实际调用哈希桶的插入操作,用参数key与V()构造一个默认值往底层哈希桶中插入,针对插入成功与否,有如下说明:

    1. 如果key不在哈希桶中,插入成功,返回V()。
    2. 若key已经在哈希桶中,插入失败,将key对应的value返回。

    其实和map的[ ]运算符重载的规则没有啥区别。

    • 4、unordered_map的查询
    函数声明功能介绍
    iterator find(const K& key)返回key在哈希桶中的位置
    size_t count(const K& key)返回哈希桶中关键码为key的键值对的个数

    注意:unordered_map中key是不能重复的,因此count函数的返回值最大为1。

    • 5、unordered_map的修改操作
    函数声明功能介绍
    insert向容器中插入键值对
    erase删除容器中的键值对
    void clear清空容器中的有效元素个数
    void swap(unordered map&)交换两个容器中的元素
    • 6、unordered_map的桶操作
    函数声明功能介绍
    size_t bucket_count() const返回哈希桶中桶的总个数
    size_t bucket_size(size_t n) const返回n号桶中有效元素的总个数
    size_t bucket(const K& key)返回元素key所在的桶号

    示例:

    1. int main()
    2. {
    3. unordered_map<int, string> mp;
    4. /*insert插入*/
    5. //1:借助pair构造函数
    6. pair<int, string> kv(1, "one");
    7. mp.insert(kv);
    8. //2:借助pair构造匿名对象插入
    9. mp.insert(pair<int, string>(2, "two"));
    10. //3:调用make_pair函数模板插入
    11. mp.insert(make_pair(3, "three"));
    12. //4:使用[]运算符重载函数进行插入
    13. mp[4] = "four";
    14. //4:使用{}
    15. mp.insert({ 5, "five" });
    16. /*遍历*/
    17. //1:迭代器遍历
    18. unordered_map<int, string>::iterator it = mp.begin();
    19. while (it != mp.end())
    20. {
    21. cout << it->first << ":" << it->second << " ";
    22. it++;
    23. }
    24. cout << endl;//1:one 2:two 3:three 4:four 5:five
    25. //2:范围for
    26. for (auto e : mp)
    27. {
    28. cout << e.first << ":" << e.second << " ";
    29. }
    30. cout << endl;//1:one 2:two 3:three 4:four 5:five
    31. /*删除*/
    32. //1:根据key删除
    33. mp.erase(4);
    34. //2:根据迭代器位置删除
    35. unordered_map<int, string>::iterator pos = mp.find(2);
    36. if (pos != mp.end())
    37. {
    38. mp.erase(pos);
    39. }
    40. for (auto e : mp)
    41. {
    42. cout << e.first << ":" << e.second << " ";
    43. }
    44. cout << endl;//1:one 3:three 5:five
    45. /*修改*/
    46. //1:通过迭代器位置修改
    47. pos = mp.find(5);
    48. if (pos != mp.end())
    49. {
    50. pos->second = "Ⅴ";
    51. }
    52. //2:通过[]修改
    53. mp[3] = "Ⅲ";
    54. for (auto e : mp)
    55. {
    56. cout << e.first << ":" << e.second << " ";
    57. }
    58. cout << endl;//1:one 3:Ⅲ 5:Ⅴ
    59. /*交换*/
    60. unordered_map<int, string> tmp{ { 2003, "年" }, { 5, "月" }, {7, "日"} };
    61. mp.swap(tmp);
    62. for (auto e : mp)
    63. {
    64. cout << e.first << e.second << " ";
    65. }
    66. cout << endl;//2003年 5月 7日
    67. return 0;
    68. }

    unordered_multimap

    unordered_multimap和unordered_map的底层都是用哈希表来实现的,所提供的成员函数和unordered_map无显著差异,唯一的区别在于unordered_multimap允许键值冗余,即key值可以是一样的,但是unordered_map不允许。对比如下:

    unordered_multimap允许键值冗余,这也就导致其内部的find和count函数和unordered_map中的有所区别,如下:

    成员函数count功能说明
    unordered_map对象值为key的元素存在则返回1,不存在则返回0
    unordered_multimap对象返回键值为key的元素的个数
    成员函数find功能说明
    unordered_map对象返回值为key的元素的迭代器位置
    unordered_multimap对象返回底层哈希表中的第一个值为key的元素的迭代器

    3、unordered_set

    unordered_set的介绍

    • 1、unordered_set是不按特定顺序存储键值的关联式容器,其允许通过键值快速的索引到对应的元素。
    • 2、在unordered_set中,元素的值同时也是唯一地标识它的key。
    • 3、在内部,unordered_set中的元素没有按照任何特定的顺序排序,为了能在常数范围内找到指定的key,unordered_set将相同哈希值的键值放在相同的桶中。
    • 4、unordered_set容器通过key访问单个元素要比set快,但它通常在遍历元素子集的范围迭代方面效率较低。
    • 5、它的迭代器至少是前向迭代器。(单向)

    unordered_set的构造方式

    • 1、构造一个空容器
    unordered_set<int> s1;
    • 2、拷贝构造一个容器
    unordered_set<int> s2(s1);
    • 3、使用迭代器构造一段区间
    1. string str("CSDN");
    2. unordered_set s3(str.begin(), str.end());

    unordered_set的函数接口说明

    成员函数功能说明
    begin获取容器中第一个元素的正向迭代器
    end获取容器中最后一个元素下一个位置的正向迭代器
    insert插入指定元素
    erase删除指定元素
    find查找指定元素
    size获取容器中元素的个数
    clear清空容器
    swap交换两个容器中的数据
    count获取容器中指定元素值的元素个数

    示例:

    1. int main()
    2. {
    3. unordered_set<int> s;
    4. /*插入*/
    5. s.insert(1);
    6. s.insert(-2);
    7. s.insert(1);
    8. s.insert(5);
    9. s.insert(3);
    10. s.insert(-2);
    11. s.insert(6);
    12. s.insert(4);
    13. /*遍历*/
    14. unordered_set<int>::iterator it = s.begin();
    15. while (it != s.end())
    16. {
    17. cout << *it << " ";
    18. it++;
    19. }
    20. cout << endl;//1 5 -2 3 6 4
    21. /*删除*/
    22. //1:根据指定key删除
    23. s.erase(-2);
    24. //2:根据迭代器位置删除
    25. unordered_set<int>::iterator pos = s.find(5);
    26. if (pos != s.end())
    27. {
    28. s.erase(pos);
    29. }
    30. for (auto e : s)
    31. {
    32. cout << e << " ";
    33. }
    34. cout << endl;//1 3 6 4
    35. /*交换*/
    36. unordered_set<int> tmp{ 100,-200,300,250 };
    37. s.swap(tmp);
    38. for (auto e : s)
    39. {
    40. cout << e << " ";
    41. }
    42. cout << endl;//100 300 -200 250
    43. return 0;
    44. }

    unordered_multiset

    unordered_multiset和unordered_set的底层都是用哈希表来实现的,所提供的成员函数和unordered_set无显著差异,唯一的区别在于unordered_multiset允许键值冗余,即key值可以是一样的,但是unordered_set不允许。对比如下:

    由于unordered_multiset容器允许键值冗余,因此该容器中成员函数find和count的意义与unordered_set容器中的也有所不同:

    成员函数count功能说明
    unordered_set对象值为key的元素存在则返回1,不存在则返回0
    unordered_multiset对象返回键值为key的元素的个数
    成员函数find功能说明
    unordered_set对象返回值为key的元素的迭代器位置
    unordered_multiset对象返回底层哈希表中的第一个值为key的元素的迭代器

    4、map/set与unordered_map/unordered_set的区别

    下面将从如下几个角度进行对比:

    unordered_map / unordered_setmap / set
    底层数据结构哈希表/散列表红黑树
    是否有序无序有序
    查找的效率O(1)O(logN)
    迭代器类型单向迭代器双向迭代器
    头文件#include#include

     set/unordered_set的性能对比

    因map与unordered_map容器的差别和set与unordered_set容器的差别类似,所以下面我们就以set和unordered_set测试为例,来测试插入、删除、查找的效率

    1. void test_op()
    2. {
    3. int n = 1000000;
    4. vector<int> v;
    5. v.reserve(n);
    6. srand(time(0));
    7. for (int i = 0; i < n; ++i)
    8. {
    9. //v.push_back(i);
    10. //v.push_back(rand()+i); // 重复少
    11. v.push_back(rand()); // 重复多
    12. }
    13. /* 插入效率测试 */
    14. size_t begin1 = clock();
    15. set<int> s;
    16. for (auto e : v)
    17. {
    18. s.insert(e);
    19. }
    20. size_t end1 = clock();
    21. size_t begin2 = clock();
    22. unordered_set<int> us;
    23. for (auto e : v)
    24. {
    25. us.insert(e);
    26. }
    27. size_t end2 = clock();
    28. cout << s.size() << endl;
    29. cout << "set insert:" << end1 - begin1 << endl;
    30. cout << "unordered_set insert:" << end2 - begin2 << endl;
    31. /* 查找效率测试 */
    32. size_t begin3 = clock();
    33. for (auto e : v)
    34. {
    35. s.find(e);
    36. }
    37. size_t end3 = clock();
    38. size_t begin4 = clock();
    39. for (auto e : v)
    40. {
    41. us.find(e);
    42. }
    43. size_t end4 = clock();
    44. cout << "set find:" << end3 - begin3 << endl;
    45. cout << "unordered_set find:" << end4 - begin4 << endl;
    46. /* 删除效率测试 */
    47. size_t begin5 = clock();
    48. for (auto e : v)
    49. {
    50. s.erase(e);
    51. }
    52. size_t end5 = clock();
    53. size_t begin6 = clock();
    54. for (auto e : v)
    55. {
    56. us.erase(e);
    57. }
    58. size_t end6 = clock();
    59. cout << "set erase:" << end5 - begin5 << endl;
    60. cout << "unordered_set erase:" << end6 - begin6 << endl;
    61. }

    总结:当测试数据量较少时,二者差距不大,数据量较大时,用unordered_系列更优。

  • 相关阅读:
    JAVA 注解
    C语言AES加密解密字符串与16进制数据
    【LeetCode】51、N皇后
    java-php-python-springboot-网上童装销售系统-计算机毕业设计
    「大数据-2.0」安装Hadoop和部署HDFS集群
    当贝投影4K激光投影X3 Pro获得一致好评:万元投影仪首选
    经典算法:不大于N的特殊数字
    Matlab(数值微积分)
    linux概念基础认识(基于阿里云ecs服务器操作)
    JAVA计算机毕业设计动物在线领养网站Mybatis+系统+数据库+调试部署
  • 原文地址:https://blog.csdn.net/bit_zyx/article/details/126765652