• FFmpeg编程录制音频(Mac OS)


    之前我们使用FFmpeg命令行工具进行了简单的音视频操作,这次在Mac OS环境下编写代码实现简单的音频录制功能。

    FFmpeg命令行音频录制

    首先回顾一下Mac OS环境下简单的音频录制命令行实现:

    ffmpeg -f avfoundation -i ":0" -t 20 -acodec pcm_s16le -ar 44100 -ac 2 ~/Desktop/output.wav

    参数说明:

    • • -f avfoundation:指定输入设备为 avfoundation,用于音频录制。
    • • -i ":0":指定录制的音频输入源。
    • • -t 20:指定录制的时长,单位为秒。
    • • -acodec pcm_s16le:指定音频编码器为 pcm_s16le,即无压缩的 PCM 格式。
    • • -ar 44100:指定音频采样率为 44100 Hz,即每秒采样 44100 次。
    • • -ac 2:指定音频通道数为 2,即立体声。
    • • ~/Desktop/output.wav:指定输出文件路径和文件名。可以根据需要修改输出文件的格式和路径。

    当然部分参数可以省略:

    ffmpeg -f avfoundation -i ":0" -t 20  ~/Desktop/output.wav

    下面我们将编程实现简化后的音频录制功能,即录制一段20秒的音频保存在指定位置。

    编程实现音频录制功能

    利用FFmpeg的api进行音频录制操作,先了解一下其中一些常用api

    相关API

    • AVInputFormat

    AVInputFormat 是 FFmpeg 中表示输入媒体格式的结构体。每个输入媒体格式(例如:MP4、AVI、FLV 等)都对应一个 AVInputFormat 结构体。它包含了该格式的名称、扩展名、支持的输入编解码器等信息。

    使用 AVInputFormat 结构体,你可以根据输入文件的格式选择合适的输入格式,或者根据需要注册自定义的输入格式。

    • AVOutputFormat

    AVOutputFormat 是 FFmpeg 中表示输出媒体格式的结构体。每个输出媒体格式(例如:MP4、AVI、FLV 等)都对应一个 AVOutputFormat 结构体。它包含了该格式的名称、扩展名、支持的输出编解码器等信息。

    使用 AVOutputFormat 结构体,你可以根据输出文件的格式选择合适的输出格式,或者根据需要注册自定义的输出格式。

    • AVFrame:

    AVFrame 是 FFmpeg 中表示音视频帧的结构体。它包含了音视频帧的原始数据和相关的信息,如时间戳、宽度、高度等。每个 AVFrame 对应一个音频或视频帧。

    AVFrame 可以用于存储解码后的音视频帧数据,以及进行音视频处理、转码等操作。它提供了用于访问和操作音视频数据的函数和成员变量,如 data、linesize、pts 等。

    • AVFormatContext

    AVFormatContext 是 FFmpeg 中表示音视频容器格式的上下文结构体。它包含了音视频文件的整体信息,如文件名、格式、时长、流信息等。AVFormatContext 是操作输入或输出文件的主要数据结构之一。

    在音频录制或音视频处理中,你可以通过打开输入文件获得一个 AVFormatContext 结构体,用于读取输入文件的相关信息和数据流。

    • AVStream

    AVStream 是 AVFormatContext 中表示音视频数据流的结构体。一个 AVFormatContext 可能包含多个 AVStream,每个 AVStream 对应一个音频或视频流。

    AVStream 包含了音视频流的详细信息,如编解码器、时长、帧率、采样率等。通过 AVStream,你可以获取有关音视频流的各种属性和参数。

    • AVPacket

    AVPacket 是 FFmpeg 中表示音视频数据包的结构体。它包含了音视频数据的压缩数据和相关的信息,如时间戳、时长等。每个 AVPacket 对应一个音频或视频帧。

    在音频录制或音视频处理中,你可以使用 AVPacket 结构体来读取和写入音视频数据。当从输入文件中读取音视频帧时,它们被封装为 AVPacket 结构体;当将音视频帧写入输出文件时,也需要将它们封装为 AVPacket 结构体。

    【免费分享】音视频学习资料包、大厂面试题、技术视频和学习路线图,资料包括(C/C++,Linux,FFmpeg webRTC rtmp hls rtsp ffplay srs 等等)有需要的可以点击788280672加群免费领取~

    代码实现

    一般来说,编程实现音频录制功能需要进行以下一些步骤:

    • 注册设备等相关初始化操作
    • 获取输入格式对象
    • 打开设备
    • 采集数据并写入输出文件
    • 释放资源

    1、创建一个Qt程序:04_record_audio

    在 Mac OS上,应用程序要访问音视频设备需要添加个Info.plist。(这点对于iOS开发者来说很熟悉)。用Xcode或者其它文本编辑器创建个Info.plist文件,并写入如下类似内容并保存到项目根目录或者及其子目录。

    1. "1.0" encoding="UTF-8"?>
    2. plist PUBLIC "-//Apple//DTD PLIST 1.0//EN" "http://www.apple.com/DTDs/PropertyList-1.0.dtd">
    3. <plist version="1.0">
    4. <dict>
    5. <key>NSMicrophoneUsageDescriptionkey>
    6. <string>使用麦克风进行音频录制string>
    7. dict>
    8. plist>

    2、配置.pro文件(Info.plist文件在项目子目录mac里)

    1. # 设置头文件路径
    2. INCLUDEPATH += /usr/local/Cellar/ffmpeg/6.0_1/include
    3. # 设置库文件路径
    4. LIBS += -L/usr/local/Cellar/ffmpeg/6.0_1/lib \
    5. -lavcodec \
    6. -lavdevice \
    7. -lavfilter \
    8. -lavformat \
    9. -lavutil \
    10. -lpostproc \
    11. -lswscale \
    12. -lswresample
    13. #设置Info.plist文件
    14. QMAKE_INFO_PLIST = mac/Info.plist

    3、注册设备

    1. extern "C" {
    2. #include
    3. }
    4. int main(int argc, char *argv[])
    5. {
    6. QApplication a(argc, argv);
    7. MainWindow w;
    8. w.show();
    9. // 注册所有可用的设备
    10. avdevice_register_all();
    11. avformat_network_init();
    12. return a.exec();
    13. }

    4、打开mainwindow.ui,随意拖个按钮,然后连接槽函数

    1. void MainWindow::on_audioButton_clicked()
    2. {
    3. //进行音频录制操作
    4. }

    5、编码实现

    1. #include <QDebug>
    2. #include <QFile>
    3. #include <QDateTime>
    4. #include <thread>
    5. //输入格式
    6. #define INPUT_FMT "avfoundation"
    7. //设备名字
    8. #define DEVICE_NAME ":0"
    9. //输出文件名字
    10. #define OUTPUT_FILE_NAME "/Users/你的电脑用户名/Desktop/output.wav"
    11. extern "C" {
    12. #include <libavformat/avformat.h>
    13. #include <libavutil/time.h>
    14. }
    15. void MainWindow::on_audioButton_clicked()
    16. {
    17. ui->audioButton->setEnabled(false);
    18. qDebug() << "MainWindow::on_audioButton_clicked";
    19. // 输出文件名
    20. QString outputFileName = OUTPUT_FILE_NAME;//QCoreApplication::applicationDirPath() + "/output.wav";
    21. // 获取格式输入对象
    22. const AVInputFormat *inputFormat = av_find_input_format("avfoundation");
    23. // 输入上下文
    24. AVFormatContext *formatContext = nullptr;
    25. // 打开设备
    26. int result = avformat_open_input(&formatContext, DEVICE_NAME, inputFormat, nullptr);
    27. if (result < 0) {
    28. qDebug() << "设备打开失败" << av_err2str(result);
    29. return ;
    30. }
    31. // 文件输出上下文
    32. AVFormatContext *outputFormatContext = nullptr;
    33. // 创建输出格式上下文
    34. avformat_alloc_output_context2(&outputFormatContext, nullptr, nullptr, outputFileName.toUtf8().constData());
    35. if (!outputFormatContext) {
    36. qDebug() << "无法创建输出格式上下文";
    37. avformat_close_input(&formatContext);
    38. return ;
    39. }
    40. // 添加音频流
    41. AVStream *audioStream = avformat_new_stream(outputFormatContext, nullptr);
    42. if (!audioStream) {
    43. qDebug() << "无法创建音频流";
    44. avformat_close_input(&formatContext);
    45. avformat_free_context(outputFormatContext);
    46. return ;
    47. }
    48. // 复制输入设备的音频参数到输出流
    49. avcodec_parameters_copy(audioStream->codecpar, formatContext->streams[0]->codecpar);
    50. // 打开输出文件
    51. if (avio_open(&outputFormatContext->pb, outputFileName.toUtf8().constData(), AVIO_FLAG_WRITE) < 0) {
    52. qDebug() << "无法打开输出文件";
    53. avformat_close_input(&formatContext);
    54. avformat_free_context(outputFormatContext);
    55. return ;
    56. }
    57. // 设置录制时长为20
    58. int64_t duration = 20 * AV_TIME_BASE;
    59. // 录制开始时间
    60. int64_t startTime = av_gettime();
    61. // 写入文件头
    62. int ret = avformat_write_header(outputFormatContext, nullptr);
    63. if (ret < 0) {
    64. qDebug() << "写入文件头失败";
    65. return;
    66. }
    67. // 数据包
    68. AVPacket *packet = av_packet_alloc();
    69. // 读取音频数据并写入文件,直到达到指定的录制时长或文件末尾
    70. while (true) {
    71. int readResult = av_read_frame(formatContext, packet);
    72. if (readResult < 0) {
    73. if (readResult == AVERROR_EOF) {
    74. // 已达到文件末尾
    75. break;
    76. } else if (readResult == AVERROR(EAGAIN)) {
    77. // 资源暂时不可用,等待一段时间后再次尝试
    78. std::this_thread::sleep_for(std::chrono::milliseconds(10));
    79. continue;
    80. } else {
    81. // 非预期的错误发生
    82. qDebug() << "读取音频数据时发生错误:" << av_err2str(readResult);
    83. break;
    84. }
    85. }
    86. if (packet->stream_index == 0) { // 只处理音频流
    87. av_write_frame(outputFormatContext, packet);
    88. }
    89. av_packet_unref(packet);
    90. // 检查录制时长是否已达到指定的时长
    91. int64_t currentTime = av_gettime();
    92. if (currentTime - startTime >= duration) {
    93. break;
    94. }
    95. }
    96. // 写入文件尾
    97. av_write_trailer(outputFormatContext);
    98. // 关闭文件
    99. avformat_close_input(&formatContext);
    100. avformat_free_context(outputFormatContext);
    101. qDebug() << "录制完成:" << outputFileName;
    102. ui->audioButton->setEnabled(true);
    103. }

    6、查看并播放音频

    终端进入输出文件所在目录,输入:ffmpeg -i output.wav

    1. Input #0, wav, from 'output.wav':
    2. Metadata:
    3. encoder : Lavf60.3.100
    4. Duration: 00:00:19.99, bitrate: 2822 kb/s
    5. Stream #0:0: Audio: pcm_f32le ([3][0][0][0] / 0x0003), 44100 Hz, stereo, flt, 2822 kb/s

    可以看到音频信息,时长19.99秒,跟预期几乎无差别。再输入播放命令,可正常播放,简单的音频录制功能初步实现:ffplay -i output.wav。当然也可直接点击音频文件进行播放。

    小插曲

    Mac OS环境要利用FFmpeg来编码实现音频录制功能,其实也可以写个最简单的C++程序来实现(其实是多此一举 )

    1. #include <iostream>
    2. #include <cstdlib>
    3. int main() {
    4. std::string command = "ffmpeg -f avfoundation -i \":0\" -t 20 output.wav";
    5. std::cout << "Recording audio..." << std::endl;
    6. int status = std::system(command.c_str());
    7. if (status == 0) {
    8. std::cout << "Audio recording completed." << std::endl;
    9. } else {
    10. std::cout << "Audio recording failed." << std::endl;
    11. }
    12. return 0;
    13. }

    然后终端进入到该程序目录,使用Clang编译器进行编译:

    clang++ -o audio_recording record_audio.cpp

    生成一个名为 audio_recording 的可执行文件,运行可执行文件:

    ./audio_recording

    很显然是可以滴,本质也就是执行FFmpeg的命令行程序。

    原文链接  FFmpeg编程录制音频(Mac OS) - 知乎

  • 相关阅读:
    机器学习 | MATLAB实现支持向量机分类ClassificationSVM参数设定
    Mac下根目录和家目录的区别
    机动目标跟踪——当前统计模型(CS模型)
    行业洞察 | 谁动了艺术家的奶酪?
    王道 第二章物理层
    flask celery定时任务
    怎样才能批量查询网站的谷歌PR权重?把手教你批量查询网站谷歌PR权重值
    华为OD机考算法题:阿里巴巴找黄金宝箱(1)
    openssl客户端编程:一个不起眼的函数导致的SSL会话失败问题
    Eolink 治愈了后端开发者的痛
  • 原文地址:https://blog.csdn.net/qq_52703909/article/details/136170059