计算机科学 ›› 2019, Vol. 46 ›› Issue (11A): 66-71.
刘慧清, 郭延哺, 李红灵, 李维华
LIU Hui-qing, GUO Yan-bu, LI Hong-ling, LI Wei-hua
摘要: 针对短文本特征词稀疏、表示能力不足等问题,提出了一种基于贝叶斯网的短文本特征扩展方法。该方法根据短文本中特征词之间的依赖关系构建语义贝叶斯网,定义特征词与短文本之间的关联度。基于贝叶斯网的推理计算关联度,将与短文本关联密切的特征词扩展到短文本中,以达到降低短文本的噪声、改善特征稀疏的目的。在此基础上,以短文本分类作为基本的文本分析任务,分析所提方法的可行性和有效性。在Amazon评论数据集上进行实验,结果表明所提方法是可行和有效的。
