Matlab如何导入Excel数据并进行FFT变换

Matlab如何导入Excel数据并进行FFT变换
如果你发现某段信号里面有干扰，想要分析这段信号里面的频率成分，就可以使用matlab导入Excel数据后进行快速傅里叶变换（fft）。

先直接上使用方法，后面再补充理论知识。

可以通过串口将需要分析的数据发送到串口助手，注意，串口助手复制数据，是你接收了多少，就能复制多少。

将接收到的数据放到Excel表格中，用一列就可以了，不必给数据列表头起名字。

注意：

Excel表中单元格需要是数据类型，而不能是文本类型，否则导入matlab后就会变成cell类型，而不是double类型，无法进行数据分析。

为了方便进行 FFT 运算，通常数据数量取 2 的整数次方。可以加快matlab的分析速度，不是也关系不大。

另外，要去掉这一列数据中的空格，否则matlab无法分析出正确结果，选中这一列，查找全部空格，然后在某一个选中的空格上右键删除行即可删除所有空格。

这里顺便提下如何一次性删除所有空格

选中数据列，然后Ctrl+F搜索，默认的就是搜索空白内容，所以什么都不输入，然后点击查找全部，然后在列出的方框内Ctrl+A全选

接着在任意一个被选中的空白单元格上右键删除-删除整行

注意，删除时不是在空格所在行上右键弹出菜单，这样只能针对这一个空格，而不能删除所有空格，而是要在选中的单元格上右键。

打开matlab软件，点击导入数据

等待一段时间（根据电脑配置而不同）后，就会出现如下界面

范围：虽然将Excel中的所有数据都导入了，但是可以选择数据范围进行分析，这里就可以选择，Am:An，表示A列的第m到第n个数据。

列矢量：因为只导入了一列，所以选择列矢量即可，网上好多教程都是让导入两列，然后选择数值矩阵，其实没有必要。

VarName：导入一列数据时，该列向量的变量名就是VarName，多个的话就是VarName1、VarName2、VarName3……最多到VarName9，所以，如果超过VarName9，就不能再用VarName这个名称了。不过，我们也可以双击这里的名称，然后修改。

一般情况下，数据导入后，只需要选择性地更改名称即可，其他都是默认选择。

确认无误后，点击绿色对钩导入所选内容，当出现蓝色字提示，就表示数据已经导入了

此时，可以在工作区看到该变量名

到了这里，数据已经被导入了。

接下来，就可以进行傅里叶变换，并绘制出幅频图了。

点击新建脚本并保存，然后在脚本中输入以下程序

Fs = 2000;

Y = fft(VarName1);

L = length(Y);

P2 = abs(Y/L);

P1 = P2(1:L/2+1);

P1(2:end-1) = 2*P1(2:end-1);

f = Fs*(0:(L/2))/L;

plot(f,P1);

axis([0,Fs/2,0,200]);

title('frequency-domain');

xlabel('f(Hz)');

ylabel('频率成分的幅值');

其中，Y = fft(VarName1);这里的VarName1就是刚才导入的变量名，如果是别的名称，对应起来即可。

选中这些程序，然后右键执行所选内容

稍作等待，就会出现幅频图

可以看到，这个信号里面，是有很多工频干扰的，而且，干扰的范围还不小。

至此，整个使用过程已结束。

理论知识补充

以上的过程其实就是涉及到DSP数字信号处理的知识。

接下来补充一下理论知识，帮助更好地理解以上内容。

首先，什么是傅里叶变换？

傅立叶变换是一种分析信号的方法，它可分析信号的成分，也可用这些成分合成信号。

想要更好地理解这个问题，可以参考：

傅里叶分析之掐死教程（完整版）更新于2014.06.06 - 知乎

这篇文章形象地讲解了什么是傅里叶级数和傅里叶变换。

摘录精华如下：

简单点来说，就是任一函数都可以展成三角函数的无穷级数

其次，什么是FFT？

FFT 是离散傅立叶变换的快速算法，可以将一个信号变换到频域。有些信号在时域上是很难看出什么特征的，但是如果变换到频域之后，就很容易看出特征了。这就是很多信号分析采用 FFT 变换的原因。另外，FFT 可以将一个信号的频谱提取出来，这在频谱分析方面也是经常用的。

了解了什么是FFT，就能更好地理解一些问题了。

比如，为什么信号有干扰之后数值会变大？

一般，我们看电流或者电压强度，都是看幅值，本来信号值是5，可是采到的却是48，显然太大了，此时，就是因为有其他频率的干扰叠加在了信号上面，导致幅值增大。如果干扰很大，幅值就会增大很多。

所以，就要搞清楚是什么频率的干扰波叠加在信号上面，因此就可以进行fft变换来分析。

幅频图表示什么含义？

横坐标是连续的频率值，纵向就是各频率信号的幅度值，也就是叠加在原始信号上的强度。

注意：我在上面提供的程序所出来的图，因为做了纵向量纲的校准，所以显示的幅值就是频率的实际幅值。

接下来就要重点讲解一下这段程序。

首先，可以看看这几个视频，看完你就会恍然大悟。

NO.12 傅里叶变换频谱图你必须知道的_哔哩哔哩_bilibili

Fs = 2000;

Y = fft(VarName1);

L = length(Y);

P2 = abs(Y/L);

P1 = P2(1:L/2+1);

P1(2:end-1) = 2*P1(2:end-1);

f = Fs*(0:(L/2))/L;

plot(f,P1);

axis([0,Fs/2,0,200]);

title('frequency-domain');

xlabel('f(Hz)');

ylabel('频率成分的幅值');

针对这个程序，一句一句地分析。

Fs = 2000;

一开始，这里面有个采样率Fs，是我最不能理解的部分，因为真的很难理解。

我看了很多网络上的讲解，都没有能够讲解Fs这个怎么来的。

而且，这个Fs真的很关键，非常关键。我在实际操作中，只要Fs变了，频率值就变了，比如，原本是50Hz的干扰，如果Fs减半，频率也会减半到25Hz去显示，这样，就会误导我们，到底是什么频率的干扰？非常容易造成误判。

2000的采样率

1000的采样率

很明显，虽然总体趋势没变，但是频率从原来的50Hz干扰，变到了25Hz的干扰。

这就已经对我们造成了严重的误导。因为就会导致后面一系列的连锁错误。

这么重要的问题，不知道为什么大家都不讲清楚。

由上面的分析可知，只有唯一一个确定的Fs才能够保证我们的分析结果是正确的。

那这个Fs值到底是多少呢？

这个Fs到底是怎么确定的呢？

一开始，我有好多疑问，Fs是matlab分析所需要的，可以任意取值的吗？上面我们已经证明了并不是随便取值的。

然后，我又想，难道是跟原始信号的频率有关？原始信号有无数个频率叠加，不可能是由它们来确定的。而且，叠加之后的频率也没法确定。

那就是ADC的采样频率？有点接近了，不过我查了一下程序，发现ADC的采样频率对不上。

再理一理思路，有一个原始信号，叠加了很多的干扰信号，我用ADC来采集，采集之后通过串口一个一个地发送到PC，ADC的采样速度比串口的速度要快。假设原始信号最大频率是1000Hz，ADC按照2000Hz去采，采了3000个点，可是串口只每隔2个点上传一次，那采样率就是1000？

最终，我想明白了，我要分析的数据是怎么来的，就看它的最终获取频率。

只需要看最终输出，不管中间经历了多少路径，只看最后收到了多少原始数据，不经过任何处理。

串口是每500us发送一个数据，也就是说，采样率是2000，这是我最终得到的数据采样率，也就是我要分析的数据的采样率。

有三种方式可以验证：
1. 更改串口的发送频率来验证；
2. 看串口是不是1秒钟接收了那么多数据；
3. 可以输入一个有明显幅度的特定频率信号，然后验证设定的采样率下，频率显示是否正确。
其中，第三种方式，是最直观最准确的，推荐使用。

Y = fft(VarName1);

傅里叶变换

将时域数据转换成频域数据，也就是一个一个的频率点，是根据欧拉公式，使用复数来表示的。

时域数据

频域数据

这里是用科学计数法来表示的。

第一个数就是实数，第二个数就是虚数，后面的i是虚数单位。

时域数据和频域数据的数量是一样的。N 个采样点，经过 FFT 之后，就可以得到 N 个点的FFT结果。

频域数据具有对称性和周期性。

L = length(Y);

获取数据的长度，也就是数量。

P2 = abs(Y/L);

P1 = P2(1:L/2+1);%这里加1是为了包含对称性数据的中间数据

P1(2:end-1) = 2*P1(2:end-1);

上面说了，频域数据里就是一个一个频率点的复数表示，这些频率点的强度是多少呢？直接对复数值取模即可，也就是abs(Y);

假设 FFT之后某点 n 用复数 a+bi 表示，那么这个复数的模就是：

为什么上面要除以L呢？P2 = abs(Y/L);

其实，不是为了除以L，是想除以L/2。

为什么？

FFT 之后结果就是一个为 N 点的复数。每一个点就对应着一个频率点。这个点的模值，就是该频率值下的幅度特性。具体跟原始信号的幅度有什么关系呢？假设原始信号的峰值为 A，那么 FFT 的结果的每个点（除了第一个点直流分量之外）的模值就是 A 的 N/2 倍。而第一个点就是直流分量，它的模值就是直流分量的 N 倍。

根据这段话可知：点的模值=原始信号的模值*(N/2)，所以，点的模值/(N/2)，就能获取该频率信号实际的幅度值。

以上是先除以L，再P1(2:end-1) = 2*P1(2:end-1);这里乘以2，就是为了换算成实际的幅值。

而且，P1(2:end-1) = 2*P1(2:end-1);这里从第2点开始是为了将直流分量去掉，因为直流分量不用乘以2，直接除以L即可。这里的end表示最后一个元素索引：

为什么去掉最后一个点，只到end-1。

因为end-1表示对称的最中心数据，该频率点的波形不显示。

说明如下：

fs=1000; %设置采样频率 1k

N=1024; %采样点数

n=0:N-1;

t=0:1/fs:1-1/fs; %时间序列

f=n*fs/N; %频率序列

x1=sin(2*pi*70*t); %噪声

x2=sin(2*pi*200*t); %信号

x3=sin(2*pi*500*t); %信号

x=x1+x2+x3; %信号混合

subplot(311);

plot(t,x); %绘制原始信号

xlabel('时间');

ylabel('幅值');

title('原始信号');

可以看到，500Hz的频率图像没有显示出来。

为什么这里只取一半的值？

要注意，这里并不是取一半的值，而是只取一半的点来分析。这是因为傅里叶变换后的数据具有对称性，后一半的数据不具备实际意义。

接下来的这句f = Fs*(0:(L/2))/L;就是为了适应这一点，这句话实际结果就是0—Fs/2，这句话不是为了取一半的点，而是为了取一半的频率。

FFT 之后结果就是一个为 N 点的复数。每一个点就对应着一个频率点。第一个点表示直流分量（即 0Hz），而最后一个点 N 的再下一个点（实际上这个点是不存在的，这里是假设的第 N+1 个点，可以看做是将第一个点分做两半分，另一半移到最后）则表示采样频率 Fs，这中间被 N-1 个点平均分成 N 等份，每个点的频率依次增加。

其实，可以从另一个角度来理解，那就是著名的奈奎斯特采样定律：只要采样频率大于或等于有效信号最高频率的两倍，采样值就可以包含原始信号的所有信息，被采样的信号就可以不失真地还原成原始信号。

一个模拟信号，经过 ADC 采样之后，就变成了数字信号。采样定理告诉我们，采样频率要大于信号频率的两倍。

我们这里的采样率是Fs，所以最大只能采到Fs/2的最大频率信号，那么，高于Fs/2的频率部分其实是没有意义的。

另外，根据上面的频率分布可知道，Fn 所能分辨到频率为 Fs/N，如果采样频率 Fs 为 1024Hz，采样点数为1024点，则可以分辨到 1Hz。1024Hz 的采样率采样 1024 点，刚好是 1 秒，也就是说，采样 1 秒时间的信号并做 FFT，则结果可以分析到 1Hz，如果采样 2 秒时间的信号并做 FFT，则结果可以分析到 0.5Hz。如果要提高频率分辨力，则必须增加采样点数，也即采样时间。

所以，如果对分辨率要求不高，就可以少取一些数据。对分辨率要求高，就需要多取一些数据。

由于 FFT 结果的对称性，通常我们只使用前半部分的结果，即小于采样频率一半的结果。

FFT结果的是存在对称性的，这是由FFT计算中隐含的复数运算处理、以及计算是对周期性离散处理（时域、频域转换）等带来的特性，一般使用时不用详究，只需要知道存在这个特性即可，数据也只需要用任意一半即可（普遍采用前一半）。

具体原因，可自行查找资料。

对称性示例：

注意，对称性不包含第一个直流分量。

附上手写信号测试：

ts = 0:0.01:10;

sig = sin(2*pi*ts) + 5*sin(2*pi*10*ts);

Fs = 100;

Y = fft(sig);

L = length(Y);

P2 = abs(Y/L);

P1 = P2(1:L/2+1);

P1(2:end-1) = 2*P1(2:end-1);

f = Fs*(0:(L/2))/L;

plot(f,P1);

%axis([0,1000,0,200]);

title('frequency-domain');

xlabel('f(Hz)');

ylabel('频率成分的幅值');

验证电信号的FFT

我用信号发生器输出一个正弦波形，然后采样电压数据。

时域波形

除了两处波动，其他地方都很平均。

频谱

不对呀？？？

我输出的是个正弦信号，时域波形应该是个类正弦的波形，频域应该是有个特定的频率信息，可是现在都很平均。

咋回事？

排查问题。。。。。。

一开始，我采集的只有2000个数据，还以为是数据量太少，发生了频谱泄露；

然后就把数据加到了20000个，还是差不多的结果。

到底是哪里出了问题？

经排查，原来是我搞错了，获取的是RMS值，还以为是原始数据。

我还一度怀疑是我的fft程序写错了。

于是，改为获取原始数据。

时域波形

频域波形

和信号发生器输出的正弦信号的信息是一致的。

其实，从数据上也大概能看出是不是类正弦波形，数据从小到大，再从大到小，依次循环；

补充

注意，可以一次导入多列Excel数据，向量名就是Excel中各列的表头名
相关阅读:
Flume配置2——监控之Ganglia
lightdb oracle模式支持sys_refcursor类型
 前端周刊第三十五期
 阿里二面：SpringBoot可以同时处理多少个请求？当场懵了。。。。
使用Python创建音乐播放器
 开启潮玩文化新篇章，泡泡玛特首届海外PTS潮玩成功落地新加坡
 haproxy
算法11.从暴力递归到动态规划4
AQS源码三视-JUC系列
 Latex——双引号的正确输入
原文地址：https://blog.csdn.net/qq_28576837/article/details/132657251

理论知识补充

验证电信号的FFT

补充