文献笔记6

一、文章信息

作者:王伟 冀宇强 王洪伟 郑丽娟

单位:华侨大学工商管理学院 同济大学经济与管理学院 聊城大学商学院

期刊:图书情报工作

题目:中文问答社区答案质量的评价研究: 以知乎为例

二、背景、目的、结论

背景:问答系统的出现在一定程度上解决了用户精确查 询的需求,问答系统是一个能回答任意自然语言形式 问题的自动机,对于问答社区平台来说,要尽可能地向用户展现 高质量的答案,以此提高用户的浏览体验,同时促进优 质内容的传播。对用户来说,用户生成的内容具有较 高的可信度和可靠性 。

目的:为此,需要根据高质量答案 的共有特征,设计高效的高质量答案识别方法,推动社 区发展并加快知识传播,减少知识获取成本。

结论:实验结果显示,随着 特征体系的不断丰富,三种分类模型的性能逐步提升; 而随机森林作为一种组合分类模型,在全量特征的情况 下,取得出色的分类性能。对特征组合分析发现,包含用户社交属性的随机森林总是比同等级的其它模型更加 出色,表明社会化网络在答案质量评价中的地位。

三、结果与讨论

文章从答案和编写者两个角度入手,构建结构化 特征、答案文本特征、社交属性特征,对中文问答社区 答案质量进行多维度描述。经过特征体系构建,形成 由 18 个特征变量构成的特征体系,运用逻辑回归、支 持向量机和随机森林对目标问题进行三层递进式训练 和测试,并对 3 个维度的特征可能得到的 7 种组合情 况进行对比,得到如下结论: ①特征体系越丰富,分类 器性能越好; ②逻辑回归和支持向量机呈现相同变化 趋势,随机森林则与前两者相比呈现出较大的差别; ③在随机森林中,包含社交属性特征的分类模型均好 于不包含社交属性的其它模型,展示了社交属性对于 显示答案质量的重要性,从特征的重要性上看,排名前 5 的特征中有 3 个是社交属性层面的特征; ④随机森 林的分类效果基本好于逻辑回归和支持向量机。本文 研究对大数据背景下,中文在线问答社区的优质内容 挖掘提供了一定的理论支持和应用指导 .

四、文章好在哪里

  1. 综述分类可以学习

  1. 引言先说明现状而后指出目的,运用数据引出研究内容

  1. 用随机森林这种组合分类模型,通过基础模型评价 、包含文本特征的模型评价 和包含用户社交属性特征的模型评价,说明了包含文本特征和用户社交属性特征模型提 高了预测的准确率。

————————————————

版权声明:本文为CSDN博主「szx6984」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。

原文链接:https://blog.csdn.net/szx6984/article/details/128604255

你可能感兴趣的:(其他)