为了改善现有基于深度学习网络的中文评论情感分类方法,同时提高中文评论情感分类的正确率和效率,基于Tensorflow框架,对传统BERT模型进行改进,以Nlpcc2013和Nlpcc2014公开的微博评论数据集为实验数据,分别从两个数据集中清洗抽取出3 949条和14 163条情感极性明显的评论,将数据输入改进后的RoBERTa模型中,提取语义后利用Sigmoid函数进行情感正负极性分类。实验结果表明,该模型的算法准确率、精确率、召回率和F1值较高,在Nlpcc2013数据集上分别达87.85%、88.36%和89.67%,比传统的BERT模型在各项数据上分别提高了1.52%、0.47%、2.58%、1.52%;在Nlpcc2014数据集上各项指标比BERT模型分别提高了1.30%、0.54%、2.32%、1.44%。研究表明,该模型在中文评论情感分类处理上表现优异,相较以往的深度学习网络模型效果更好。
0 引言
近年来,深度学习在图像和语音处理领域取得显著进展[1],然而在自然语言处理