数据分析学习日记 Day7 (权威论文的结构与内容)

第一个学习周期的结束,我阅读了一篇2017年的类比的挖掘加速创新的论文

 Accelerate innovation through analogy mining 通过类比挖掘加速创新

能力很是有限,仅能浅显的阅读,对于专业知识看得一塌糊涂。

下面从结构和内容两个方面总结我的思考。

结构方面

Abstract(摘要)

KEYWORDS(关键词,文章里重点关注的对象)

1 Introduction(初介绍,引入话题)

2 Learning a Representation for Analogies(学习类比的表示法)

2.1Motivation(创造这个类比方法的动机)

2.2Data(这个类比使用的数据即语料库)

2.3Method(这个类比使用的方法)

3 Evalution:Analogies(定量评估该类比方法的能力)

3.1Collecting analogies via crowdsourcing(提出通过众包收集类比)

3.2Quantitive results(提出用什么来量化结果)

4 Evalution: Ideation by analogy(提出如何量化评估类比思维)

4.1 Generating near-purpose far-mechanism(如何产生目的相近、机制较远(多样化)的类比)

4.2 Experiment design(验证这一类比能显著提高创意)

4.3 Results(实验结果)

5 Discussion and Conclusion(对实验的结果总结、讨论以后的可提高领域)

References 注释

内容方面

Abstract:人们可以从数据库寻求灵感加速创新,然而当前的数据库庞大,结构复杂。以前的结构表示方法消耗大量的人力,而机器方法难以寻找结构的相似性。在该论文中,提出了用产品的目的和机制的方法。该方法比传统的检索更能激发人们的创新。

KYEWORDS:计算类比;革新;创造力;产品尺寸;文本挖掘;文字嵌入;

1 Introduction 有用的类比对于推动各领域的创新至关重要,而当今的在线数据激增,为寻找新的类比提供了机会。但是筛选数据,找到有用的类比对人和机器都是相当严峻的挑战:对人来说,记忆检索偏向于表面的相似性,而且处理能力差,工作负担高;对于机器来说,在检测文本等数据的表面相似性时表现很棒,但对于检测短语分散的不同文章间的相似性能力很差。由于关注的是产品创新的语料库,用机器自动发现大型非结构化的数据集中的类比很重要,作者提出:一是使用较弱的结构表示(在提取结构与表现力之间权衡),二是众包的进步能够获得丰富的类比信号。最终提出了从非结构化文本数据集中,超越表面的特征,计算发现类比的技术。

2 Learning a Representation for Analogies 

2.1 Motivation 以前的工作是在结构化(基于逻辑的语言)的数据上,虽然有用但耗费人力。本文中将产品的目的和机制作为类比的核心。挑战在于目的或机制都是容易理解的语言而不是术语,而且细节缺失或者不明确,进一步提出这种技术的更广广泛适用性,比如改进搜索功能用来增强推荐系统。

2.2Data 作者介绍了使用的数据是Quirky.com的语料库(语句长而且混乱)。提出依赖于人们的认知和直觉,将产品的目的和机制分开(具体是要求工作人员标注给出的产品描述中的目的和机制),并请求工人不要将目的与机制的混淆标注。作者将资源集中在收集目的和机制注释,最终收集少量经过严格评估的标记类比。

2.3 Method 作者论述了如何提取目的和机制的向量,关注点在于根据产品的目的或机制捕获语义,而不是预测单词。而后提出如何学习目的和机制,以及对它们的矢量解释。(没看懂

3 Evalution:Analogies 作者说明定量评估的关键是文档的分类,创建了类比和非类比的数据集

3.1Collecting analogies via crodsourcing 作者通过众包收集类比,关键在于让工人理解类比,避免标记表面上相似的产品。

3.2Quangtitive Results 作者根据精确度和召回率,对所有测试的“对”进行排序,发现方法都优于基线。发现工人可能倾向于采用更多基于机制的类比。

4 Evalution :IDEATION BY ANALOGY  论文中提出的技术最终目的是增加人们的创造力,因此提出要评估算法的有用性。为参与者提供有用的实例,他们在目的上相似,但在机制上不同,帮助他们探索,激发他们的想法。

4.1Generating near-purpose far-mechanism analogies 产生目的相似的机制不同的类比的算法(没看懂)

4.2Experiment design 重新招募员工设计现有问题下的产品,在相同目的、不同机制的激发下产生灵感

4.3Results 招募研究生评价人们产生创意的能力好坏,研究生有着严格的协议,保证评价的有效性(量化没看懂)

5 Discussion and conclusion 总结此技术基于目的和机制,用较弱的结构,使用众包技术构建、注释数据集,最终证明这些学习的向量比传统的信息检索方法得到更高精度的类比。并谈到可扩展的其他领域,比如更高级/低级的机制,核心/外围的机制等。

你可能感兴趣的:(数据分析)