参考ASIST: Audio Anti-Spoofing using Integrated Spectro-Temporal Graph Attention Networks https://arxiv.org/pdf/2110.01200.pdf
aasist是一种开源的音频反欺诈的模型,主要的模型结构如下所示:


- docker pull image.sourcefind.cn:5000/dcu/admin/base/custom:aasist-main
- docker run -it -v /path/your_code_data/:/path/your_code_data/ --shm-size=32G --privileged=true --device=/dev/kfd --device=/dev/dri/ --group-add video --name docker_name imageID bash
-
- source /root/env_disc.sh
- cd /root/aasist;sh run.sh
pip3 install -r requirements.txt
脚本下载方式:
python ./download_dataset.py
手动下载方式:
- ASVspoof2019 dataset: https://datashare.ed.ac.uk/handle/10283/3336
- 下载LA.zip文件,unzip解压
- LA
- ├── ASVspoof2019_LA_asv_protocols
- ├── ASVspoof2019_LA_asv_scores
- ├──ASVspoof2019.LA.asv.dev.gi.trl.scores.txt
- ├──ASVspoof2019.LA.asv.eval.gi.trl.scores.txt
- ...
- ├── ASVspoof2019_LA_cm_protocols
- ├── ASVspoof2019_LA_dev
- ├── ASVspoof2019_LA_eval
- ├── ASVspoof2019_LA_train
To evaluate AASIST [1]:
- export TORCH_MHLO_OP_WHITE_LIST="aten::max;aten::batch_norm;aten::abs,aten::selu;prim::NumToTensor;aten::zeros_like;aten::size;aten::narrow;aten::cat;aten::selu_"
-
- python3 main.py --eval --config ./config/AASIST.conf
- python3 main_opt.py --eval --config ./config/AASIST.conf
To evaluate AASIST-L [1]:
- export TORCH_MHLO_OP_WHITE_LIST="aten::max;aten::batch_norm;aten::abs,aten::selu;prim::NumToTensor;aten::zeros_like;aten::size;aten::narrow;aten::cat;aten::selu_"
-
- python3 main.py --eval --config ./config/AASIST-L.conf
- python3 main_opt.py --eval --config ./config/AASIST-L.conf
测试命令:
bash run.sh

使用Blade DISC优化后的精度与未使用Blade DISC优化后的精度保持一致
语音识别
金融,交通,教育
ModelZoo / AASIST_bladedisc · GitLab