码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • windows10下whisper的安装使用和CUDA的配置


    buzz基于whisper的客户端,可以优先尝试,支持Mac, Windows和Linux

    https://github.com/chidiwilliams/buzzicon-default.png?t=N2N8https://github.com/chidiwilliams/buzz

    •  whisper是OpenAI 发布的一个的神经网络,主要用于语音识别,一时兴起就想玩一玩,下面是它的github链接(安装时需要全局代理才比较快)

    GitHub - openai/whisper: Robust Speech Recognition via Large-Scale Weak SupervisionRobust Speech Recognition via Large-Scale Weak Supervision - GitHub - openai/whisper: Robust Speech Recognition via Large-Scale Weak Supervisionhttps://github.com/openai/whisper

     注:

    pip install git+https://github.com/openai/whisper.git 

    等价于下载压缩包后再

    python setup.py install --user

    官方给了个一键pip命令,优先使用这个命令:

    pip install -U openai-whisper
    •  官方给出的所需配置prerequisite如下(我使用python3.8.9也行)

            python3.9.9

            pyTorch1.10.1

            ffmpeg

    我本身装有ffmpeg,难点就在于CUDA的安装和pyTorch的安装,这两花了我两小时。

    • 首先是CUDA的安装,网上推荐的都是11.3,但我安装的是11.4,依旧能用

            安装详情请参考下面这篇文章,安装到CUDA即可,不用安装CUDNN,环境变量问题比较麻烦,耐心点就好了Win10安装CUDA_RunAtWorld的博客-CSDN博客_windows安装cuda目录安装Nvidia显卡驱动安装Tookit和CuDNN前言安装工具的准备CUDA 安装与配置过程cuDNN配置安装PyTorch卸载CUDA1.前言2.卸载开始参考安装Nvidia显卡驱动安装Nvidia显卡驱动前可以先检查Nvidia显卡驱动是否已安装。搜索 Nvidia控制面板 或 Nvidia Control Panel可以看到当前已经安装的显卡驱动及版本如需安装显卡驱动,在官方驱动下载网站找到自己的显卡型号对应的驱动下载并安装https://blog.csdn.net/RunAtWorld/article/details/124282176

    • pyTorch1.10.1的安装直接在命令行输入下面的命令即可
    pip --trusted-host pypi.tuna.tsinghua.edu.cn install torch==1.10.1+cu102 torchvision==0.11.2+cu102 torchaudio==0.10.1 -f https://download.pytorch.org/whl/torch_stable.html

    whisper运行实际效果, 以向晚大魔王录播文件为例,用体积最小运行速度最快的tiny模式

    whisper D:/1.mp4 --model tiny  --language Chinese

     可以看出识别效果还是挺不错的,但由于追求速度,某些音相近的会被识别错误,如

    • 团布->团播
    • 呼唤->互换
    • 出大了一->出道了
    • 养成血->养成系
    • 搭->的

    可惜我的显卡带不动更大的模型了,以后有机会再尝试一下

  • 相关阅读:
    OSPF —— 优化配置
    初阶数据结构学习记录——셋 单链表(1)
    unity快速入门代码上手笔记
    【学习】软件测试中对bug定位的方法,如何区分是前端还是后端bug
    5G移动性增强关键技术及应用分析
    RTMP规范(重新整理版)
    华为OD机试真题-最大坐标值-2023年OD统一考试(C卷)--Python--开源
    【C语言游戏】三子棋完整代码和正确结果截图
    b站pink老师JavaScript的移动端网页特效 案例代码——移动端轮播图+返回顶部模块
    Qt QSerialPort串口通信
  • 原文地址:https://blog.csdn.net/weixin_50994283/article/details/127843094
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号