请问知识图谱有哪些研究点是可以进行深入研究的?

收录于编辑推荐 ·  130 人赞同了该回答

知识图谱这两年研究很火,因为在业界和政府部门都取得了很好的应用,不过大部分的工作还是集中在NLP,还有很多问题没有得到解决。我觉得2018年以后,信息抽取虽然还会是知识图谱的一个比较重要的研究方向,知识图谱作为知识工程的一个分支将有更多的问题需要去解决,特别是知识图谱要实用化将面临很多挑战。以下方向值得研究:

1.信息抽取如何实用化?目前来说,靠算法解决问题的思路是不靠谱的,算法只是图谱知识获取的一个阶段,如何跟众包结合应该是实用化的一个方向,值得去研究,下面是值得读一下的论文:

http://aiweb.cs.washington.edu/ai/pubs/liu-naacl16.pdfaiweb.cs.washington.edu
https://www.aaai.org/ocs/index.php/FSS/FSS13/paper/viewFile/7627/7543www.aaai.org
https://arxiv.org/abs/1701.02185arxiv.org
[1701.02185] Crowdsourcing Ground Truth for Medical Relation Extractionarxiv.org

2. 如何基于知识图谱做事件抽取将是值得研究的,事件抽取如果只是考虑从文本进行抽取,只能是玩玩算法,发论文可以,但是实用性差,如何通过事件抽取实现动态图谱构建,形成事件图谱,以及事件的因果关系,是值得研究的;

3. 图谱的动态融合是目前研究比较薄弱的环节,现在的知识融合还比较初级,只是跑一些机器学习算法,弄特征工程,虽然也有一些基于深度学习的技术,但是整体这块还是不够成熟,特别是没有考虑图谱的动态性,如何做增量的知识图谱融合以及在图谱融合的时候如何处理数据的不一致,都是值得研究的;

4. 常识知识挖掘和推理一直以来就没做得很好,严重阻碍了知识图谱的发展,这方面的工作不多,而且大家其实没想明白什么是常识知识,什么是常识推理,理论还是比较匮乏;下面这篇常识知识的综述论文值得读读:

Commonsense Knowledge in Machine Intelligencedl.acm.org

还有就是conceptnet的论文值得读一下,这里的知识表示方法允许节点是自然语言短语或者句子:

Speeraaai.org

5. 基于表示学习和逻辑规则的知识图谱推理值得研究,这种结合不仅仅是一个模型上的结合,还会涉及到如何通过表示学习来做规则的学习,以及通过规则学习来增强表示学习;

6. 动态知识图谱的存储和查询目前很少有人研究,特别是流数据场景下的知识图谱存储和查询怎么做,会有很多挑战。

7. 领域知识图谱构建的工作需要综合利用各种技术来完成,并且需要考虑一个图谱的应用场景,这里会有问答、推荐、搜索、自动标签、辅助决策等各种应用,目前比较值得深入的领域有农业、佛学、司法、电商、金融、军事,都是可以做出好的研究成果的领域,应用就很多了,比如说司法,可以做类案推送,可以做辅助判案,可以做均衡分案等,这些垂直领域都会有很多好的研究成果发表。

先说这么多吧,后面再补充!

编辑于 2018-03-04
130 20 条评论
分享
收藏 感谢
收起
9 人赞同了该回答

我觉得目前最关键的研究点不是知识图谱本身,而是知识图谱的“上帝之手”。

李彦宏是搜索引擎领域的科学家,他应该跟谷歌创始人是同一起跑线上的,单纯讲技术,不存在谁盗版谁的问题,跟马化腾模仿OICQ,马云克隆ebay不同,李彦宏当年在搜索引擎上的研究是同时代领先的。但是今天我们用google检索看很多英文原文档,显然效果好于百度百倍。这种差距是怎么产生的?是因为google存在着一只“上帝之手”,在不断“手动”优化着搜索引擎的呈现结果,这种优化效果是超越于搜索引擎技术本身的。或者说,单纯靠搜索引擎技术本身,其实呈现出来的结果很多时候也是惨不忍睹的(比如2002年的google搜索结果)。这只“上帝之手”其实就是google的用户,用户点击行为“手动”协助了搜索结果的优化,百度因为没有大量的英文用户,所以到目前为止,我们看英文信息,在百度上搜索出来的结果,还是惨不忍睹。

反过来看知识图谱,现在能不能做到,给出一个知乎的问题,它(技术本身)就把这个问题的知识图谱精确呈现出来,显然,目前这是做不到的。同样,需要这样做一只“上帝之手”,需要有一款大量(海量)同步对接进来的知识图谱应用,通过用户“手动”的行为,对知识图谱呈现的结果进行筛选。持续的成千上万上亿次的用户大脑“微运算”,进行持续不断的结果优化。

所以,目前知识图谱技术缺乏的是一个“用户入口”,用户这只“上帝之手”进不来,导致所有的知识图谱呈现结果都是惨不忍睹,我觉得技术的进化是工作量积累和时间筛选的结果,不能跳跃式发展,机器和人之间的连接不能直接断开,不仅仅知识图谱,就是放大到整个人工智能领域,还是需要“人工”的“上帝之手”参与,阿尔法狗也不是在没有录入人类棋谱的前提下进行学习。

我觉得这是一个比技术本身更有价值的一个研究点,当然它也可以归入到技术的范畴之内。

https://www.zhihu.com/question/266032092

你可能感兴趣的:(知识图谱,/,Knowledge,Graph)