• 20221125使用PR2023自动识别obs-studio录屏生成的MKV视频的字幕


    20221125使用PR2023自动识别obs-studio录屏生成的MKV视频的字幕
    2022/11/25 19:07

    01 obs.png

    obs studio (64bit)

     


    02 obs 设置.png

     

    03 obs 输出.png

     

    04 obs默认为MKV.png

     

    05 obs改mkv为MP4.png

    警告:如果文件无法完成(例如,由于蓝屏BSOD,掉电等),保存到MP4/MOV的记录将无法恢复。如果要录制多个音轨,请考虑使用MKV录制,并在完成后将录像重新封装为MP4/MOV(文件→录像转封装)

     

    06 obs录像转封装.png

     

    07 obs转换封装.png

     

    08 obs转换封装2.png

     

    09转换封装中.png

     

    10转换封装完成.png

    转封装完成
    录像已经转封装
    确定

     

    11PR导入文件.png

    导入文件

     

    12导入文件的效果图.png

     

    13PR转录序列.png

     

    14 PR转录音频数据.png

    正在创建自动转录……
    正在渲染音频数据

     

    14PR转录简体中文.png

    创建转录文本
    语言:简体中文(默认锁定为为英文,这里有个不好,不会记住上次的语言)
     

     

    16PR识别完成.png

    开始时间:2022-11-24的13:57
    结束时间:2022-11-24的16:47
    视频4小时23分钟,大概4.5小时,大概需要3小时识别完成。

     

    17创建说明性字幕.png

    创建说明性字幕

     

    18从序列转录创建.png

    创建字幕

     

    19正在创建字幕.png

     

    20生成字幕完成.png

     

    21导出到SRT文件.png

     

    22SRT.png

     

    方法二:MKV→MKA→MP4(只有音频的视频文件)

    31 MKV.png

    https://mkvtoolnix.download/downloads.html#windows
    https://www.fosshub.com/MKVToolNix.html

     

    32导入MKV.png

    开始混流

     

    33 MKV2mka.png

     

    34 ffmpeg1.png

    ffmpeg -i "2022-07-02 13-10-13.mka" -acodec copy  "2022-07-02 13-10-13.mp4"

    Microsoft Windows [版本 10.0.19044.1889]
    (c) Microsoft Corporation。保留所有权利。

    C:\Users\ASUS>cd C:\AI-OCR

    C:\AI-OCR>
    C:\AI-OCR>ffmpeg -i "2022-07-02 13-10-13.mka" -acodec copy  "2022-07-02 13-10-13.mp4"
    ffmpeg version N-106352-g2a1eae2179-20220319 Copyright (c) 2000-2022 the FFmpeg developers
      built with gcc 11.2.0 (crosstool-NG 1.24.0.533_681aaef)
      configuration: --prefix=/ffbuild/prefix --pkg-config-flags=--static --pkg-config=pkg-config --cross-prefix=x86_64-w64-mingw32- --arch=x86_64 --target-os=mingw32 --enable-gpl --enable-version3 --disable-debug --disable-w32threads --enable-pthreads --enable-iconv --enable-libxml2 --enable-zlib --enable-libfreetype --enable-libfribidi --enable-gmp --enable-lzma --enable-fontconfig --enable-libvorbis --enable-opencl --disable-libpulse --enable-libvmaf --disable-libxcb --disable-xlib --enable-amf --enable-libaom --enable-avisynth --enable-libdav1d --enable-libdavs2 --disable-libfdk-aac --enable-ffnvcodec --enable-cuda-llvm --enable-frei0r --enable-libgme --enable-libass --enable-libbluray --enable-libmp3lame --enable-libopus --enable-librist --enable-libtheora --enable-libvpx --enable-libwebp --enable-lv2 --enable-libmfx --enable-libopencore-amrnb --enable-libopencore-amrwb --enable-libopenh264 --enable-libopenjpeg --enable-libopenmpt --enable-librav1e --enable-librubberband --enable-schannel --enable-sdl2 --enable-libsoxr --enable-libsrt --enable-libsvtav1 --enable-libtwolame --enable-libuavs3d --disable-libdrm --disable-vaapi --enable-libvidstab --enable-vulkan --enable-libshaderc --enable-libplacebo --enable-libx264 --enable-libx265 --enable-libxavs2 --enable-libxvid --enable-libzimg --enable-libzvbi --extra-cflags=-DLIBTWOLAME_STATIC --extra-cxxflags= --extra-ldflags=-pthread --extra-ldexeflags= --extra-libs=-lgomp --extra-version=20220319
      libavutil      57. 24.101 / 57. 24.101
      libavcodec     59. 25.100 / 59. 25.100
      libavformat    59. 20.101 / 59. 20.101
      libavdevice    59.  6.100 / 59.  6.100
      libavfilter     8. 29.100 /  8. 29.100
      libswscale      6.  6.100 /  6.  6.100
      libswresample   4.  6.100 /  4.  6.100
      libpostproc    56.  5.100 / 56.  5.100
    Input #0, matroska,webm, from '2022-07-02 13-10-13.mka':
      Metadata:
        encoder         : libebml v1.4.4 + libmatroska v1.7.1
        creation_time   : 2022-11-24T08:54:07.000000Z
      Duration: 04:23:37.92, start: 0.000000, bitrate: 137 kb/s
      Stream #0:0: Audio: aac (LC), 48000 Hz, stereo, fltp (default)
        Metadata:
          title           : simple_aac_recording
          BPS             : 136245
          DURATION        : 04:23:37.920338304
          NUMBER_OF_FRAMES: 741465
          NUMBER_OF_BYTES : 269389856
          _STATISTICS_WRITING_APP: mkvmerge v72.0.0 ('Minuano (Six-eight)') 64-bit
          _STATISTICS_WRITING_DATE_UTC: 2022-11-24 08:54:07
          _STATISTICS_TAGS: BPS DURATION NUMBER_OF_FRAMES NUMBER_OF_BYTES
    Output #0, mp4, to '2022-07-02 13-10-13.mp4':
      Metadata:
        encoder         : Lavf59.20.101
      Stream #0:0: Audio: aac (LC) (mp4a / 0x6134706D), 48000 Hz, stereo, fltp (default)
        Metadata:
          title           : simple_aac_recording
          BPS             : 136245
          DURATION        : 04:23:37.920338304
          NUMBER_OF_FRAMES: 741465
          NUMBER_OF_BYTES : 269389856
          _STATISTICS_WRITING_APP: mkvmerge v72.0.0 ('Minuano (Six-eight)') 64-bit
          _STATISTICS_WRITING_DATE_UTC: 2022-11-24 08:54:07
          _STATISTICS_TAGS: BPS DURATION NUMBER_OF_FRAMES NUMBER_OF_BYTES
    Stream mapping:
      Stream #0:0 -> #0:0 (copy)
    Press [q] to stop, [?] for help
    size=  267995kB time=04:23:37.92 bitrate= 138.8kbits/s speed=3.76e+03x
    video:0kB audio:263076kB subtitle:0kB other streams:0kB global headers:0kB muxing overhead: 1.869737%

    C:\AI-OCR>

     

    35 ffmpeg2.png

     

    36 pr 导入 音频.png

     

    37 转录序列.png

     

    38 序列2.png

     

    39PR识别完成.png

     

    40转换SRT‘.png

     

    41导入MKV.png

     

    42不认识格式.png

    文件导入失败

     

  • 相关阅读:
    堆排序算法(代码实现) [数据结构][Java]
    一文刨析C/C++全局常量的定义
    【Excel经验】字符串处理方法
    JAVA基础算法(8)----- 设计循环双端队列
    音频声学相关的常用缩略语
    C++进制转换题
    Swagger3被拦截器拦截并报错Unable to infer base url或者Unable to render this definition
    Bytebase 2023 第三季度回顾
    第七章 字符串
    全面指南:2023年国内访问与下载GitHub的优化策略
  • 原文地址:https://blog.csdn.net/wb4916/article/details/128043198