• 1. 数据结构基础知识


    1. 数据结构基础知识

    基本概念

    线性结构:结构中的数据元素之间只存在一对一的关系。

    树形结构:结构中的数据元素之间存在一对多的关系。

    图状结构或网状结构:结构中的数据元素之间存在多对多的关系。

    数据的存储结构:数据结构在计算机中的表示,也称物理结构

    顺序存储:把逻辑上相邻的元素存储在物理位置上相邻的存储单元里,通过存储单元的邻接关系来表示元素之间的逻辑关系。

       优点:实现随机存储,每个元素占用空间小。
       缺点:只能使用相邻的一整块存储单元,会产生较多的外部碎片。
    
    • 1
    • 2

    链式存储不要求逻辑上相邻的元素在物理位置上也相邻,通过指针表示元素之间的逻辑关系。

       优点:不会出现碎片现象,充分利用所有的存储单元。
       缺点:每个元素要占用存储指针,需要多占用部分存储空间,而且只能顺序存取。
    
    • 1
    • 2

    索引存储:存储信息的同时,建立附加的索引表,索引表中的每一项成为索引项,索引项的一般形式(关键字,地址)

       优点:检索速度快。
      缺点:增加索引表,占用较多存储空间,增删数据时也要修改索引表,花费较多的时间。
    
    • 1
    • 2

    散列存储:根据元素的关键字直接计算出该元素的存储位置,也称Hash存储

       优点:检索,增删节点操作都很快
      缺点:散列函数不好可能会出现元素存储单元的冲突,解决冲突会增加时间 ,空间的开销。
    
    • 1
    • 2

    数据结构:相互之间存在的一种或多种特定关系的数据元素的集合,包括:逻辑结构,存储结构和数据的运算。

    数据的三要素:逻辑结构,物理结构,数据元素。

    数据的逻辑结构:数据元素之间的逻辑关系。

    算法的基本概念:算法对特定问题求解步骤的一种描述,它是指令的有限序列,期中每一条指令都表示一个或多个操作。

    算法的5个重要性有穷性,确定性,可行性,输入,输出

    算法设计的要求:正确性,可读性,健壮性,效率与低存储需求。

    算法效率的度量:通常用时间复杂度和空间复杂度来描述。

    1. 时间复杂度:算法中所有语句的频度(指该语句在算法中被重复执行的次数)之和记作T(n),时间复杂度主要分析T(n)的数量级。算法中的基本运算(最深层循环内的语句)的频度与T(n)同数量级,所以一般采用算法中最基本的频度f(n)来分析算法时间复杂的度。即T(n)=O(f(n))
    2. 空间复杂度:算法耗费的存储空间,记作S(n)=O(g(n))算法原地工作指算法所需要辅助空间是常量,即O(1)

    数据的逻辑结构:

    img

    img

    数组

    int[] array = new int[5];
    int[] array = {2, 3, 1, 0, 2};
    
    
    • 1
    • 2
    • 3

    可变数组

    可变数组是经常使用的数据结构,其基于数组和扩容机制实现,相比普通数组更加灵活。常用操作有:访问元素、添加元素、删除元素。

    List<Integer> array = new ArrayList<>();
    
    • 1

    链表

    链表以节点为单位,每个元素都是一个独立对象,在内存空间的存储是非连续的。链表的节点对象具有两个成员变量:「值 val」「后继节点引用 next」

    class ListNode {
        int val;       // 节点值
        ListNode next; // 后继节点引用
        ListNode(int x) { val = x; }
    }
    
    // 实例化节点
    ListNode n1 = new ListNode(4); // 节点 head
    ListNode n2 = new ListNode(5);
    ListNode n3 = new ListNode(1);
    
    // 构建引用指向
    n1.next = n2;
    n2.next = n3;
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14

    img

    栈是一种具有 「先入后出」 特点的抽象数据结构,可使用数组或链表实现。

    Stack stack = new Stack<>();
    
    • 1

    如下图所示,通过常用操作 「入栈 push()」,「出栈 pop()」,展示了栈的先入后出特性。

    stack.push(1); // 元素 1 入栈
    stack.push(2); // 元素 2 入栈
    stack.pop(); // 出栈 -> 元素 2
    stack.pop(); // 出栈 -> 元素 1
    
    • 1
    • 2
    • 3
    • 4

    img

    注意:通常情况下,不推荐使用 Java 的 Vector 以及其子类 Stack ,而一般将 LinkedList 作为栈来使用。

    LinkedList stack = new LinkedList<>();
    
    stack.addLast(1);   // 元素 1 入栈
    stack.addLast(2);   // 元素 2 入栈
    stack.removeLast(); // 出栈 -> 元素 2
    stack.removeLast(); // 出栈 -> 元素 1
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6

    队列

    队列是一种具有 「先入先出」 特点的抽象数据结构,可使用链表实现。

    Queue queue = new LinkedList<>();
    
    • 1

    如下图所示,通过常用操作 「入队 push()」,「出队 pop()」,展示了队列的先入先出特性。

    树是一种非线性数据结构,根据子节点数量可分为 「二叉树」「多叉树」,最顶层的节点称为 「根节点 root」。以二叉树为例,每个节点包含三个成员变量:「值 val」「左子节点 left」「右子节点 right」

    class TreeNode {
        int val;        // 节点值
        TreeNode left;  // 左子节点
        TreeNode right; // 右子节点
        TreeNode(int x) { val = x; }
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6

    如下图所示,建立此二叉树需要实例化每个节点,并构建各节点的引用指向。

    // 初始化节点
    TreeNode n1 = new TreeNode(3); // 根节点 root
    TreeNode n2 = new TreeNode(4);
    TreeNode n3 = new TreeNode(5);
    TreeNode n4 = new TreeNode(1);
    TreeNode n5 = new TreeNode(2);
    
    // 构建引用指向
    n1.left = n2;
    n1.right = n3;
    n2.left = n4;
    n2.right = n5;
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12

    img

    图是一种非线性数据结构,由 「节点(顶点)vertex」「边 edge」 组成,每条边连接一对顶点。根据边的方向有无,图可分为 「有向图」「无向图」

    如下图所示,此无向图的 顶点 和 边 集合分别为:

    • 顶点集合: vertices = {1, 2, 3, 4, 5}
    • 边集合: edges = {(1, 2), (1, 3), (1, 4), (1, 5), (2, 4), (3, 5), (4, 5)}

    img

    表示图的方法通常有两种:

    1、邻接矩阵: 使用数组 verticesvertices 存储顶点,邻接矩阵 edgesedges 存储边;edges[i][j] 代表节点 i + 1和节点 j + 1之间是否有边。

    int[] vertices = {1, 2, 3, 4, 5};
    int[][] edges = {{0, 1, 1, 1, 1},
                     {1, 0, 0, 1, 0},
                     {1, 0, 0, 0, 1},
                     {1, 1, 0, 0, 1},
                     {1, 0, 1, 1, 0}};
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6

    2、邻接表: 使用数组vertices存储顶点,邻接表edges存储边。 edges为一个二维容器,第一维 i 代表顶点索引,第二维 edges[i] 存储此顶点对应的边集和;例如 edges[0] = [1, 2, 3, 4]代表 vertices[0]的边集合为 [1, 2, 3, 4]。

    int[] vertices = {1, 2, 3, 4, 5};
    List> edges = new ArrayList<>();
    
    List edge_1 = new ArrayList<>(Arrays.asList(1, 2, 3, 4));
    List edge_2 = new ArrayList<>(Arrays.asList(0, 3));
    List edge_3 = new ArrayList<>(Arrays.asList(0, 4));
    List edge_4 = new ArrayList<>(Arrays.asList(0, 1, 4));
    List edge_5 = new ArrayList<>(Arrays.asList(0, 2, 3));
    edges.add(edge_1);
    edges.add(edge_2);
    edges.add(edge_3);
    edges.add(edge_4);
    edges.add(edge_5);
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13

    邻接矩阵 VS 邻接表 :
    邻接矩阵的大小只与节点数量有关,即N^2,其中N为节点数量。因此,当边数量明显少于节点数量时,使用邻接矩阵存储图会造成较大的内存浪费。因此,邻接表 适合存储稀疏图(顶点较多、边较少);邻接矩阵适合存储稠密图(顶点较少、边较多)。

    散列表

    散列表是一种非线性数据结构,通过利用 Hash 函数将指定的 「键 key」 映射至对应的 「值 value」 ,以实现高效的元素查找。

    设想一个简单场景:小力、小特、小扣的学号分别为 10001, 10002, 10003 。现需求从「姓名」查找「学号」。

    则可通过建立姓名为 key ,学号为 value 的散列表实现此需求,代码如下:

    // 初始化散列表
    Map dic = new HashMap<>();
    
    // 添加 key -> value 键值对
    dic.put("小力", 10001);
    dic.put("小特", 10002);
    dic.put("小扣", 10003);
    
    // 从姓名查找学号
    dic.get("小力"); // -> 10001
    dic.get("小特"); // -> 10002
    dic.get("小扣"); // -> 10003
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12

    img

    自行设计 Hash 函数:

    假设需求:从「学号」查找「姓名」。

    将三人的姓名存储至以下数组中,则各姓名在数组中的索引分别为 0, 1, 2。

    String[] names = { "小力", "小特", "小扣" };
    
    • 1

    此时,我们构造一个简单的Hash函数(%为取余符号),公式和封装函数如下所示:

    hash(key) = (key - 1) % 10000

    int hash(int id) {
        int index = (id - 1) % 10000;
        return index;
    }
    
    • 1
    • 2
    • 3
    • 4

    则我们构建了以学号为 key 、姓名对应的数组索引为 value 的散列表。利用此 Hash 函数,则可在 O(1) 时间复杂度下通过学号查找到对应姓名,即:

    names[hash(10001)] // 小力
    names[hash(10002)] // 小特
    names[hash(10003)] // 小扣
    
    • 1
    • 2
    • 3

    img

    以上设计只适用于此示例,实际的 Hash 函数需保证低碰撞率、 高鲁棒性(健壮性)等,以适用于各类数据和场景。

    堆是一种基于 「完全二叉树」 的数据结构,可使用数组实现。以堆为原理的排序算法称为 「堆排序」 ,基于堆实现的数据结构为 「优先队列」 。堆分为 「大顶堆」「小顶堆」 ,大(小)顶堆:任意节点的值不大于(小于)其父节点的值。

    完全二叉树定义: 设二叉树深度为 k ,若二叉树除第 k 层外的其它各层(第 1 至 k−1 层)的节点达到最大个数,且处于第 k 层的节点都连续集中在最左边,则称此二叉树为完全二叉树。

    如下图所示,为包含 1, 4, 2, 6, 8 元素的小顶堆。将堆(完全二叉树)中的结点按层编号,即可映射到右边的数组存储形式。

    img

    通过使用「优先队列」的「压入 push()」和「弹出pop()」操作,即可完成堆排序,实现代码如下:

    // 初始化小顶堆
    Queue<Integer> heap = new PriorityQueue<>();//PriorityQueue:可实现小顶堆排序
    
    // 元素入堆
    heap.add(1);
    heap.add(4);
    heap.add(2);
    heap.add(6);
    heap.add(8);
    
    // 元素出堆(从小到大)
    heap.poll(); // -> 1
    heap.poll(); // -> 2
    heap.poll(); // -> 4
    heap.poll(); // -> 6
    heap.poll(); // -> 8
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16

    即可完成堆排序,实现代码如下:

    // 初始化小顶堆
    Queue<Integer> heap = new PriorityQueue<>();//PriorityQueue:可实现小顶堆排序
    
    // 元素入堆
    heap.add(1);
    heap.add(4);
    heap.add(2);
    heap.add(6);
    heap.add(8);
    
    // 元素出堆(从小到大)
    heap.poll(); // -> 1
    heap.poll(); // -> 2
    heap.poll(); // -> 4
    heap.poll(); // -> 6
    heap.poll(); // -> 8
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
  • 相关阅读:
    Docker容器内时区相差8小时
    【运维知识大神篇】两种方法,一键部署ElasticSearch集群(Shell+Ansible自动化部署)
    Java源码分析(一)Integer
    Jetpack Compose(4)——重组
    01_JSON的理解
    杰理之CMD_SET_BLE_VISIBILITY【篇】
    分类预测 | Matlab实现SSA-CNN-SVM麻雀算法优化卷积支持向量机分类预测
    【FISCO BCOS】十九、区块链浏览器部署
    IDEA 配置及插件和快捷键总结
    Excel如何给数字加双引号或者加单引号加逗号
  • 原文地址:https://blog.csdn.net/chairon/article/details/126681799