随着如今的语音被越来越多的应用,尝试着研究下Kaldi,一个开源的语音识别项目。
Kaldi官网,包含Kaldi的安装和各种内容的讲解
Kaldi的github仓库地址,Kaldi的源码就是存储在github
推荐如下这本书,可以辅助理解Kaldi,并且有安装步骤
Kaldi 是一个用 C++ 编写的语音识别工具包,并在 Apache License v2.0 下获得许可。Kaldi 旨在供语音识别研究人员使用。
代码如下(示例):
git clone git@github.com:kaldi-asr/kaldi.git
这是Kaldi的INSTALL文件中看到的步骤,大体就是按照这个文件中提供的步骤去完成Kaldi的安装,或者直接查看官网或者推荐的那本书。
This is the official Kaldi INSTALL. Look also at INSTALL.md for the git mirror installation.
[Option 1 in the following does not apply to native Windows install, see windows/INSTALL or following Option 2]
Option 1 (bash + makefile):
Steps:
(1)
go to tools/ and follow INSTALL instructions there.
(2)
go to src/ and follow INSTALL instructions there.
Option 2 (cmake):
Go to cmake/ and follow INSTALL.md instructions there.
Note, it may not be well tested and some features are missing currently.
$ cd tools\extras
#执行如下脚本,检测需要安装哪些环境
$ ./check_dependencies.sh
./check_dependencies.sh
当前降本被执行之后,会输出具体缺少哪些环境,并且终端中会输出具体的执行命令,按照给定的命令执行安装操作,安装完成之后继续执行当前脚本,重复前面的步骤,直到最终提示如下,环境安装完成
./check_dependencies.sh: all OK.
目录退出到kaldi项目根目录,执行如下步骤
$ cd src
$ ./configure
# 数字代表开多少线程
$ make或者make -j 8
到此编译成功。
但是执行如下命令,就会报错
$ cd src
$ ./configure --shared
# 数字代表开多少线程
$ make或者make -j 8
执行./configure --shared
当前命令之后就会有一个警告,应该是告诉我们CUDA没有安装
英伟达官网CUDA工具下载,我选择的是Ubuntu版本的安装
$ wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64/cuda-ubuntu2004.pin
$ sudo mv cuda-ubuntu2004.pin /etc/apt/preferences.d/cuda-repository-pin-600
$ wget https://developer.download.nvidia.com/compute/cuda/11.7.0/local_installers/cuda-repo-ubuntu2004-11-7-local_11.7.0-515.43.04-1_amd64.deb
$ sudo dpkg -i cuda-repo-ubuntu2004-11-7-local_11.7.0-515.43.04-1_amd64.deb
$ sudo cp /var/cuda-repo-ubuntu2004-11-7-local/cuda-*-keyring.gpg /usr/share/keyrings/
$ sudo apt-get update
$ sudo apt-get -y install cuda
执行命令:
./configure --shared
然后继续执行./configure --shared
当前命令,已经没有CUDA的警告了,并且给了后续执行的命令如下红框中圈出:
make -j clean depend
make -j 8
到此编译成功
生成的.so库被存放在如下目录
cd src/lib
最简单的执行步骤就是如此,kaldi提供了完整的脚本使用,方便了我们的安装,nice。
Kaldi官网,包含Kaldi的安装和各种内容的讲解
Kaldi的github仓库地址,Kaldi的源码就是存储在github
英伟达官网CUDA工具下载,我选择的是Ubuntu版本的安装