由CCF语音对话与听觉专委会 、中国人工智能产业发展联盟(AIIA)评估组、京东科技、语音之家、希尔贝壳共同主办的【语音之家】AI产业沙龙—京东在AI语音方向的技术探索与实践,将于2022年11月29日19:30-21:30线上直播。
沙龙简介
如今人机对话的技术在智能客服领域得到了广泛的应用,语音应答、智能语音外呼、客服智能质检等系统为企业数字化转型提供了更多的方案,客户服务中越来越考虑为用户带来快捷便利服务的同时,注重自身运营效率的提高,产业的发展也为语音相关的技术提出了更高的诉求,服务过程的对话体验也为语音技术带来了更高的挑战,推动了语音相关技术的发展。京东语音在人机对话方面进行了深入的技术探索和落地实践,涵盖端到端模型和监督对比学习的结合帮助语音识别更准确,口语化多模态的处理帮助对话系统理解的更智能,语音编辑技术让话术播报更拟人和自然,本次线上沙龙将通过三个Talk细致介绍相关成果。
参会嘉宾
付立
嘉宾简介:付立,京东科技语音算法工程师,主要负责语音识别相关技术的研发和落地。
分享主题:基于监督对比学习的客服语音识别技术探索与实践
摘要:语音识别技术作为京东智能人机交互平台“言犀”的一项核心技术能力,目前已经在电商、物流、金融等客服场景中获得广泛应用。然而,现有的端到端语音识别技术通常以优化整个音频的平均识别效果为训练目标,缺乏更细力度的监督信息,导致模型可能存在对吞音和近音字识别不够准确的问题。本次分享将介绍团队在监督对比学习端到端语音识别技术的探索,以及该方法在实际客服场景中的应用。
王培英
嘉宾简介:王培英,京东科技算法工程师,主要负责自然语言理解、多模态学习等算法研究,以及在智能客服、智能语音外呼等核心产品中的算法落地。
分享主题:如何提升语音对话机器人的"理解能力"
摘要:相较于文本对话机器人,语音对话系统为人们提供了更加便捷的交互方式,但同时带来了更多的技术挑战:语音识别错误难以避免、口语对话常伴随着磕磕绊绊、人机交互如何做到自然流畅。本次分享将围绕着语音对话中的语言理解问题,介绍我们在鲁棒语言理解、口语文本顺滑以及话语权决策等技术上的探索与实践。
宋伟
嘉宾简介:宋伟,京东科技集团语音算法工程师,主要负责语音合成、声音转换和语音编辑等语音技术的研发和落地。
分享主题:基于文本的语音编辑技术的探索与实践
摘要:在很多场景中,我们希望能够像编辑文本一样直接对语音进行编辑,实现对语音内容的插入、删除和修改操作。通过语音编辑技术,可以对已有的录音内容进行修改,从而生成新的内容,该技术即可以用来删除录音中多余的口水词,在语音中插入录制过程中遗漏的部分,也可以用来替换录制出错的语音内容。语音编辑的难点在于如何保证编辑区域的韵律和上下文一致,如何保证编辑区域的音色、音质和非编辑区域保持一致,如何让编辑边界平滑过渡等问题。对此京东语音合成团队探索了高质量的语音编辑技术方案,并落地应用于内部业务,本次分享将围绕基于文本的语音编辑技术展开介绍。
沙龙议程
时间 | 报告主题 | 报告人 |
19:30-20:05 | 基于监督对比学习的 客服语音识别技术探索与实践 | 付立 |
20:05-20:10 | Q&A | |
20:10-20:45 | 如何提升语音对话机器人的 "理解能力" | 王培英 |
20:45-20:50 | Q&A | |
20:50-21:25 | 基于文本的语音编辑技术的 探索与实践 | 宋伟 |
21:25-21:30 | Q&A |
参加方式
直播将通过语音之家微信视频号进行直播
活动奖品
11月29日在直播间,为大家准备1顶SpeechHome主题棒球帽、1个AISHELL5周年玩偶,观看直播互动即可抽取。