• 腾讯音乐评论审核、分类与排序算法技术


    导读: 本次分享的题目为音乐评论AI审核与排序,主要围绕以下三个方面展开:

    • 背景介绍
    • 评论审核
    • 评论排序

    01 背景介绍

    1. 业务场景对比

    音乐评论是音乐类APP里面比较重要的模块之一,它是用户表达心情和观点的窗口。我们主要有两个相关的业务场景,第一个是QQ音乐,第二个是全民K歌。这两个业务场景的评论是有差异的。QQ音乐中的评论类型很丰富,包括个人崇拜类、玩梗类、个人听歌感受类等。通常这些评论长难句子相对较多,语法较难。而K歌中的评论主要以互动和评价为主,句子较短,语法相对简单。此外,QQ音乐每日的新增评论大约有几十万条,而全民K歌则有千万量级之多。

    2. 评论审核

    评论审核指根据评论的质量去操作评论的状态。比如,对于一些抄袭、辱骂、或是包含敏感词的评论,我们会对它们进行隐藏,删除或者设为仅自己可见等等;对于一些轻度负面或者盖楼型的评论,我们可能会给它贴上劣质的标签,在排序上进行降权,减少曝光。此外,对于一些潜在的优质评论,是指那些文字写得不错,并且跟歌曲内容比较相关,但是因为点赞数较低而处于一个比较靠后的排序位置的评论,我们会在短期内给它们一个头部位置,使它们得到足够多的曝光。

    我们针对不同的业务场景训练模型,让模型给出操作建议来辅助审核,甚至自动审核,以达到减少人力成本的目的。

    3. 评论排序

    好的排序可以极大提升用户阅读评论的体验。我们的算法需要综合考虑更多的因素,给出更优的分发方式。我们主要考虑了两类因子:

    第一个是文本语义标签,包括文本的质量、主题、情绪等等。第二个是后验因子,包括评论的点赞、回复以及点赞飙升情况等。

    上图是我们的一个排序白板,带颜色的部分是评论的文本标签,后面是它的置信度。而图右的一些数值就是后验因子。

    我们将相关技术应用到QQ音乐的评论排序上面,在最热和最新tab的基础上增加了一个推荐序tab,使得排序核心指标得到了有效的提升。

    02 评论审核-QQ音乐

    1. 业务目标

    审核的人力无法满足需求,因此我们 需要借助NLP实现两个业务目标 :①使用模型辅助审核,提高审核效率。②实现部分评论的自动审核。

    上图右侧红框内是文本质量标签和模型给出的处理意见,其下面打码的部分是一些具体操作。

    2. 质量模型

    基于上述业务目标,我们 构建了一个质量模型 。 我们把文本质量分为优质、良好、普通、劣质四类标签,主要以语言的优美流畅性,与歌曲的相关性,情感极性以及主题类别等作为考量因素。 例如上图中的红色评论,首先它和歌曲名有一定的相关性,并且使用了对偶句式。它的语言是比较优美流畅的,因此,我们给它打上了优质的标签。相较之下,黄色的评论是批评周董唱功,我们就给它打上了劣质的标签。插播一条广告:需要开通正版JetBrains全家桶的可以联系我,56元一年,正版授权,官网可查有效期,有需要的加我微信:poxiaozhiai6,备注:910。

    结合质量标签以及评论状态,模型可以给出具体的操作建议,从而辅

  • 相关阅读:
    ELK技术-Logstash
    es请求方式调用
    Jupyter的下载与安装
    遗传算法(GA)优化的BP神经网络预测,GA-BP回归预测,多输入单输出模型。
    大数据开发语言Scala入门:新手小白学习指南
    面试官:React怎么做性能优化
    C++基础01
    【Electron 拦截请求实现自定义网络处理】
    cyclictest生成结果统计图
    士兰微六轴陀螺仪SC7I22在AR/VR头显设备中的应用
  • 原文地址:https://blog.csdn.net/qq_37904909/article/details/126803134