• 【实时语音转文本】PC端实时语音转文本(麦克风外音&系统内部音源)


    在这里插入图片描述
    语音转文字这个功能可以应用在视频动态字幕,语音快速输入,实时记录通话内容,高级应用可以在人工智能,语音识别,智能助手方面,还需要一点机器学习可以做出一些好玩的东西,比如PC端AI助理,类似移动端的 “小度”,“小艺”,“小爱”。

    一、安装讯飞输入法

    在这里插入图片描述

    二、输入法设置

    安装好后,切换到讯飞输入法,点击右下角设置图标。
    在这里插入图片描述

    点击左侧语音选项,设置结束等待时间0.7秒,设置结果上屏方式:说话过程中上屏(一边说话一边打字);说话结束时上屏(说话完成后打字),勾选语音长文本模式会触发一直监听说话并打字。

    在这里插入图片描述

    选择录音设备,使用麦克风进行打字,设置如下:(外音输入)

    在这里插入图片描述

    三、麦克风打字测试

    点击输入法麦克风图标会自动开启录音模式,打开一个新的记事本,鼠标聚焦在可以输入的位置,然后可以一边说话一边打字。

    在这里插入图片描述

    四、系统内部音源转文字

    如果希望将正在看的视频或者音频的台词转成文字可以选择录音设备,将麦克风停用,选择立体声混音,这样就可以将系统内部的声音作为声音来源并实时转成文字。

    在这里插入图片描述
    下面以一个小视频为例:

    实时语音识别-系统内部音源

    五、跨屏输入

    先下载一个手机版输入法,然后登录账号,打开PC设置切换到账号设置,使用手机APP扫码登录,然后在输入法右下角设置选择【跨屏输入】,然后用APP扫码连接:
    在这里插入图片描述
    手机连接后,可以在手机端进行录音,然后在PC端查看语音输入的内容。

    PS: 跨屏输入会经常断开连接,这个体验有点不好。

    六、总结

    对于外部麦克风一般要发音相对标准,没有噪音的环境下识别度会高一些;对于系统内部音频需要语速不能太快(一般背景音不会有太大影响),我们可以使用这种方法做临时的字幕生成器,配合翻译api,还可以实时翻译外文视频;辅助语音转写工作,解放双手;另外,输入法对英文的识别效果也不错,只需调整识别的语言种类即可。

    在这里插入图片描述

  • 相关阅读:
    canvas绑定键盘事件不会生效 + 解决办法
    【图灵MySQL】深入理解Mysql索引底层数据结构与算法
    铝塑膜瑕疵检测系统
    大模型相关资料整理
    Linux —— 基本权限(1)
    5G受质疑在于它在物联网和自动驾驶等新兴技术的应用不如预期
    【C语言】转圈报数问题(三种方法--指针,数组)
    React整理总结(三)
    【Jmeter】性能测试之压测脚本生成,也可以录制接口自动化测试场景
    计算机毕设源代码网站ssm基于web的在线学习平台
  • 原文地址:https://blog.csdn.net/zy1281539626/article/details/127913117