基于深度学习的微博评论情感分析
Abstract
深度学习在短文本情感分析中提高了准确率等指标,但常因数据量小导致模型鲁棒性差、泛化能力差,易出现训练数据表现好的假象。针对此问题,提出基于清华大学中文新闻语料库Word2vec预训练模型和BiLSTM-MHA模型对短文本情感分析的处理方法。首先通过Word2vec预训练模型将文本信息转化成特征向量,然后利用BiLSTM提取特征,通过多头注意力机制增强关键特征。最后,将权重分配后的信息传入softmax分类器进行情感分类。本模型在 12 万微博评论上的准确率为 85.97%,表明其在处理大量文本数据时可保持较高准确率。