码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • aasist-bladedisc 音频反欺骗算法模型


    AASIST

    论文

    参考ASIST: Audio Anti-Spoofing using Integrated Spectro-Temporal Graph Attention Networks https://arxiv.org/pdf/2110.01200.pdf

    模型结构

    aasist是一种开源的音频反欺诈的模型,主要的模型结构如下所示:

    算法原理

    环境配置

    Docker(方法一)

    提供光源拉取的训练的docker镜像:

    • 推理镜像:
    1. docker pull image.sourcefind.cn:5000/dcu/admin/base/custom:aasist-main
    2. docker run -it -v /path/your_code_data/:/path/your_code_data/ --shm-size=32G --privileged=true --device=/dev/kfd --device=/dev/dri/ --group-add video --name docker_name imageID bash
    • 激活镜像环境:
    1. source /root/env_disc.sh
    2. cd /root/aasist;sh run.sh
    • python依赖安装:
    pip3 install -r requirements.txt
    

    数据集

    脚本下载方式:

    python ./download_dataset.py
    

    手动下载方式:

    1. ASVspoof2019 dataset: https://datashare.ed.ac.uk/handle/10283/3336
    2. 下载LA.zip文件,unzip解压
    3. LA
    4. ├── ASVspoof2019_LA_asv_protocols
    5. ├── ASVspoof2019_LA_asv_scores
    6. ├──ASVspoof2019.LA.asv.dev.gi.trl.scores.txt
    7. ├──ASVspoof2019.LA.asv.eval.gi.trl.scores.txt
    8. ...
    9. ├── ASVspoof2019_LA_cm_protocols
    10. ├── ASVspoof2019_LA_dev
    11. ├── ASVspoof2019_LA_eval
    12. ├── ASVspoof2019_LA_train

    推理

    To evaluate AASIST [1]:

    1. export TORCH_MHLO_OP_WHITE_LIST="aten::max;aten::batch_norm;aten::abs,aten::selu;prim::NumToTensor;aten::zeros_like;aten::size;aten::narrow;aten::cat;aten::selu_"
    2. python3 main.py --eval --config ./config/AASIST.conf
    3. python3 main_opt.py --eval --config ./config/AASIST.conf

    To evaluate AASIST-L [1]:

    1. export TORCH_MHLO_OP_WHITE_LIST="aten::max;aten::batch_norm;aten::abs,aten::selu;prim::NumToTensor;aten::zeros_like;aten::size;aten::narrow;aten::cat;aten::selu_"
    2. python3 main.py --eval --config ./config/AASIST-L.conf
    3. python3 main_opt.py --eval --config ./config/AASIST-L.conf

    测试命令:

    bash run.sh
    

    result

    精度

    使用Blade DISC优化后的精度与未使用Blade DISC优化后的精度保持一致

    应用场景

    算法类别

    语音识别

    热点应用行业

    金融,交通,教育

    源码仓库及问题反馈

    ModelZoo / AASIST_bladedisc · GitLab

    参考资料

    GitHub - clovaai/aasist: Official PyTorch implementation of "AASIST: Audio Anti-Spoofing using Integrated Spectro-Temporal Graph Attention Networks"

  • 相关阅读:
    [附源码]Python计算机毕业设计高校国防教育管理系统
    【C语言】多进程服务器
    linux下安装ffmpeg的详细教程、ffmpeg is not installed
    MySQL日志管理、备份与恢复
    【JavaWeb】Servlet系列 --- 关于一个web站点的欢迎页面
    算法结构之选择排序
    Mysql大表修改表结构
    【社保—五险一金科普】
    PMP每日一练 | 考试不迷路-11.28(包含敏捷+多选)
    Implicit conversion from data type varbinary to datetime2 is not allowed 异常处理
  • 原文地址:https://blog.csdn.net/qq_27815483/article/details/139712714
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号