• SH-SSS丨《ISSD: 基于迭代式语音分离的说话人日志系统》论文线上分享


    SH Symposium Series on Speech (SH SSS 2022) 

    SH SSS 是由语音之家打造的AI语音技术相关的前沿论文成果分享平台。 

    来自AI语音技术领域的优秀论文作者、专家学者,用最精炼的表达来解读最新的高质量论文。

    分享的论文成果来自国内外顶级会议收录的优秀文章、前沿学术报告。

    主题 Tittle

    ISSD: 基于迭代式语音分离的说话人日志系统

    时间 Time

    2022年11月15日 19:00 - 19:45

    嘉宾 Author

    牛树同:中国科学技术大学语音实验室博士研究生。主要研究方向为语音分离及说话人日志任务。合作文章曾发表于ICASSP、INTERSPEECH等语音领域会议。作为团队成员参加DIHARD III及DCASE 2022 Task 3等国际挑战赛并取得第一名。

    概述 Abstract

    本文提出了一种基于迭代式语音分离的说话人日志(Iterative separation-based speaker diarization, ISSD)方法来处理真实的测试数据。在ISSD方法中,我们根据说话人先验迭代地产生自适应数据来提高分离模型的泛化能力,这可以使得模型性能逐步提升。为了进一步减少说话人先验中一些不可避免的检测错误带来的影响,我们利用说话人的声纹信息提出了两种后处理方法,即说话人过滤以及说话人恢复。我们在真实的两人电话语音(Conversational telephone speech, CTS)上对提出的方法进行了测试。实验结果表明,与最先进的基于聚类的说话人日志系统(Clustering-based speaker diarization, CSD)相比,我们提出的方法在开发集和测试集上分别取得了47.72%和46.97%的相对提升。ISSD也是我们在DIHARD III挑战赛冠军系统中应用的一个关键技术。

    题 目 Tittle

    中文:ISSD: 基于迭代式语音分离的说话人日志系统

    英文:IMPROVING SEPARATION-BASED SPEAKER DIARIZATION VIA ITERATIVE MODEL REFINEMENT AND SPEAKER EMBEDDING BASED POST-PROCESSING

    收录会议 Source Title

    ICASSP 2022

    作 者 Authors

    牛树同,杜俊,孙磊,李锦辉

    论文地址 Url

    https://ieeexplore.ieee.org/document/9746354

    议程

    Program Overview

    时间主题嘉宾
    19:00-19:30

    ISSD: 基于迭代式语音分离的

    说话人日志系统

    牛树同
    19:30-19:45Q&A

    参与方式

    Joining

    直播将通过语音之家微信视频号进行直播,手机端、PC端可同步观看。


  • 相关阅读:
    Nacos的集群、负载均衡、环境隔离
    clickhouse-keeper简介及使用
    DSA之查找(3):哈希表的查找
    CVPR2022 底层视觉 | 图像处理
    eBPF 实践 -- 网络可观测
    IPSEC的原理及配置步骤整理(一)
    [踩坑专栏]Caused by: java.lang.ClassNotFoundException: javax.servlet.ServletRequest
    人与人之间的差异在于外界
    count(1)、count(*) 与 count(列) 的区别?
    <C++>详解list类
  • 原文地址:https://blog.csdn.net/weixin_48827824/article/details/127801819