目录
随着近些年计算机快速的发展,对程序员来说入职要求也越来越高了,公司对我们的代码能力要求也越来越高了,大厂笔试中几乎全是算法题而且难度大,中小厂的笔试中才会有算法题,所以现在也越来越卷。为了能有一份好工作,我们必须手撕数据结构。难道就只是入职也一好处吗?显然不是的,学好算法不论对你思考问题的方式还是对你编程的思维都会有很大的好处。
数据结构是计算机存储、组织数据的方式。数据结构是指相互之间存在一种或多种特定关系的数据元素的集合。通常情况下,精心选择的数据结构可以带来更高的运行或者存储效率。数据结构往往同高效的检索算法和索引技术有关。
---- 来自百度
那么数据结构与数据库有什么关系呢?
数据结构:内存中管理数据--增删改查
数据库: 磁盘中管理数据--增删改查
算法(Algorithm):就是定义良好的计算过程,他取一个或一组的值为输入,并产生出一个或一组值作为输出。简单来说算法就是一系列的计算步骤,用来将输入数据转化成输出结果。列如在我学习c语言中:二分查找,冒泡等
数据结构和算法是相辅相成的。数据结构是为算法服务的,算法要作用在特定的数据结构之上。如果不在的基础上操作、构建算法,孤立存在的数据结构就是没用的。
算法在编写成可执行程序后,运行时需要耗费时间资源和空间(内存)资源 。因此衡量一个算法的好坏,一般是从时间和空间两个维度来衡量的,即时间复杂度和空间复杂度。
时间复杂度主要衡量一个算法的运行快慢,而空间复杂度主要衡量一个算法运行所需要的额外空间。在计算机发展的早期,计算机的存储容量很小。所以对空间复杂度很是在乎。但是经过计算机行业的迅速发展,计算机的存储容量已经达到了很高的程度。所以我们如今已经不需要再特别关注一个算法的空间复杂度。
时间复杂度的定义:在计算机科学中,算法的时间复杂度是一个函数,它定量描述了该算法的运行时间。一个算法执行所耗费的时间,从理论上说,是不能算出来的,只有你把你的程序放在机器上跑起来,才能知道。但是我们需要每个算法都上机测试吗?是可以都上机测试,但是这很麻烦,所以才有了时间复杂度这个分析方式。一个算法所花费的时间与其中语句的执行次数成正比例,算法中的基本操作的执行次数,为算法的时间复杂度。
大O符号(Big O notation):是用于描述函数渐进行为的数学符号。
推导大O阶方法:
1、用常数1取代运行时间中的所有加法常数。
2、在修改后的运行次数函数中,只保留最高阶项。
3、如果最高阶项存在且不是1,则去除与这个项目相乘的常数。得到的结果就是大O阶。
使用大O的渐进表示法以后,Func1的时间复杂度为:O(N^2)
N = 10 F(N) = 100
N = 100 F(N) = 10000
N = 1000 F(N) = 1000000
通过上面我们会发现大O的渐进表示法去掉了那些对结果影响不大的项,简洁明了的表示出了执行次数。
另外有些算法的时间复杂度存在最好、平均和最坏情况:
最坏情况:任意输入规模的最大运行次数(上界)
平均情况:任意输入规模的期望运行次数
最好情况:任意输入规模的最小运行次数(下界)
例如:在一个长度为N数组中搜索一个数据x
最好情况:1次找到
最坏情况:N次找到
平均情况:N/2次找到
在实际中一般情况关注的是算法的最坏运行情况,所以数组中搜索数据时间复杂度为O(N)
例题1
- void Func2(int N){
- int count = 0;
- for (int k = 0; k < 2 * N; ++k)
- {
- ++count;
- }
- int M = 10;
- while (M--)
- {
- ++count;
- }
- printf("%d\n", count);
- }
计算次数时间复杂度函数式:2*N+10
时间复杂度:O(N)
对于一个极大的数来说,乘一个常数与加一个常数都不能改变他的量级。比如一个亿万富翁,给他加几万或者在翻一倍,他变了好像又没有变,他还是亿万富翁。
例题2
- void Func3(int N, int M){
- int count = 0;
- for (int k = 0; k < M; ++k)
- {
- ++count;
- }
- for (int k = 0; k < N; ++k)
- {
- ++count;
- }
- printf("%d\n", count);
- }
时间复杂度:O(N+M)
如果M远大于N ,时间复杂度:0(M); N远大于M ,时间复杂度:O(N); M与N一样大,时间复杂度O(M)或者O(N)
例题3
- void Func4(int N)
- { int count = 0;
- for (int k = 0; k < 100; ++k)
- {
- ++count;
- }
- printf("%d\n", count);
- }
时间复杂度:O(1)
这里的1并不是1次,代表的是常数次
例题4
const char * strchr(const char * str, int character); ----查找字符串的字符
时间复杂度:O(N)
最好次数1次找到,最坏次数N次找到,平局次数N/2,在实际情况下我们一般关注的是最坏运行情况,所以数组中搜索数据的时间复杂度是O(N)。有这样一句比较有哲理的话:用悲观的心态过积极的人生。在生活中做最坏的打算也不一定有最坏的结果。
例题5
- #include
-
- void BubbleSort(int* a, int n)//冒泡排序
- {
- assert(a);
- for (size_t end = n; end > 0; --end)
- {
- int exchange = 0; //优化
- for (size_t i = 1; i < end; ++i)
- {
- if (a[i - 1] > a[i])
- {
- Swap(&a[i - 1], &a[i]);
- exchange = 1;
- }
- }
- if (exchange == 0)
- break;
- }
- }
时间复杂度:O(N^2)
计算过程:N-1+N-2+......+2+1=N*(N-1)/2
例题6
- int BinarySearch(int* a, int n, int x) //二分查找
- {
- assert(a);
- int begin = 0;
- int end = n - 1;
- // [begin, end]:begin和end是左闭右闭区间,因此有=号
- while (begin <= end)
- {
- int mid = begin + ((end-begin)>>1);
- if (a[mid] < x)
- begin = mid+1;
- else if (a[mid] > x)
- end = mid-1;
- else
- return mid;
- }
- return -1;
- }
时间复杂度:O(logN)
计算过程:N/2/2..../2=1 ---> N=2^x --->x=log(2)N
例题7
- long long Fac(size_t N)
- {
- if (0 == N)
- return 1;
- return Fac(N - 1)*N;
- }
时间复杂度:O(N)
计算过程:Fac(N)->Fac(N-1)->Fac(N-2)->.......->Fac(2)->Fac(1)
例题8
- long long Fib(size_t N)
- {
- if (N < 3)
- return 1;
-
- return Fib(N - 1) + Fib(N - 2);
- }
时间复杂度:O(2^N)
我们发现递归有的时候并不是很好,时间复杂度比较大,如果这里传参比较大,跑的时间就会很久。所当我们不用递归实现如下:
- long long Fib(size_t N)
- {
- if (N < 3)
- return 1;
- long long f1 = 1, f2 = 1, f3 = 0;
- for (int i = 3; i <= N; i++)
- {
- f3 = f1 + f2;
- f1 = f2;
- f2 = f3;
- }
- return f3;
- }
时间复杂度:O(N)
空间复杂度也是一个数学表达式,是对一个算法在运行过程中临时占用存储空间大小的量度 。空间复杂度不是程序占用了多少bytes的空间,因为这个也没太大意义,所以空间复杂度算的是变量的个数。空间复杂度计算规则基本跟实践复杂度类似,也使用大O渐进表示法。
注意:函数运行时所需要的栈空间(存储参数、局部变量、一些寄存器信息等)在编译期间已经确定好了,因此空间复杂度主要通过函数在运行时候显式申请的额外空间来确定。
例题1
- #include
-
- void BubbleSort(int* a, int n)//冒泡排序
- {
- assert(a);
- for (size_t end = n; end > 0; --end)
- {
- int exchange = 0;
- for (size_t i = 1; i < end; ++i)
- {
- if (a[i - 1] > a[i])
- {
- Swap(&a[i - 1], &a[i]);
- exchange = 1;
- }
- }
- if (exchange == 0) break;
- }
- }
空间复杂度:O(1)
这里需要理解:算法在运行过程中临时占用存储空间(额外)大小的量度,这里这开辟exchange,end,i 三个零时变量,因为大O渐进表示法,3为常数所以为1 。
例题2
- long long Fac(size_t N)//递归
- {
- if(N == 0)
-
- return 1;
- return Fac(N-1)*N;
- }
空间复杂度:O(N)
例题3
- #include
-
- long long* Fibonacci(size_t n)//斐波拉希数列
- {
- if (n == 0) return NULL;
- long long * fibArray = (long long *)malloc((n + 1) * sizeof(long long));
-
- fibArray[0] = 0;
- fibArray[1] = 1;
- for (int i = 2; i <= n; ++i)
- {
- fibArray[i] = fibArray[i - 1] + fibArray[i - 2];
- }
- return fibArray;
- }
空间复杂度:O(N)
这里就需要到了函数栈帧的知识了,当进行计算的时候会开辟空间,但是空间可以重复利用,我们知道在栈上开辟空间是有序的(进栈和出栈),比如:当需要开辟空间的时候系统会把开辟空间的权限给打卡,操作完成后进行退栈,有相当于系统将权限回收默认了那块空间报销,如果下次开辟空间的时候系统打开的空间还是原来的空间,并不是清理而是进行覆盖,直接在上面使用。
栈帧过程:
这里我们我们先递归到最底层(一直开辟空间到N),然后再在N层上又进行进栈和退栈的操作,我们也可以想想如果一直开辟空间系统可能也会崩溃。
上述函数运行顺序:
练习题:力扣
- //方法1
- int cmp(void* dest,void* sce)
- {
- return *(int*)dest-*(int*)sce;
- }
-
- int missingNumber(int* nums, int numsSize){
- qsort(nums,numsSize,sizeof(int),cmp);
-
- int sum=0;
- for(int i=0;i
- {
- if(nums[i]!=i+1)
- {
- sum= i+1;
- }
- }
- return sum;
- }
- //方法2
- int missingNumber(int* nums, int numsSize)
- {
- //前n项和 - 数组和 = 消失的数字
- int sum = 0;
- int miss = 0;
- sum = (1 + numsSize)*numsSize / 2;
- int i = 0;
- for (i = 0; i < numsSize; i++)
- {
- miss += nums[i];
- }
- miss = sum - miss;
-
- return miss;
- }