【NLP】知识图谱-入门与实践

【NLP】知识图谱-入门与实践
更新ing

目录

  • 历史
    • 流程图
  • 学习路线
    • 网站
    • 切入点
    • 研究点
  • 技术路线
    • 前言
    • jdk
      • 简介
      • 版本
      • 下载
    • neo4j
      • 简介
      • 下载
      • 启动
      • 桌面版
    • python
      • 问题:ValueError: The following settings are not supported: {'username': 'neo4j'}
      • 问题:ImportError: cannot import name 'HTTPConnectionPool' from 'urllib3' (unknown location)
      • 问题:pip报错:文件urllib3-1.26.4.dist-info\\METADATA不存在
  • 参考文献

历史

流程图

学习路线

网站

医学数据挖掘与算法评测大赛
https://github.com/lrs1353281004/Chinese_medical_NLP

基于医疗领域知识图谱的问答系统项目
https://github.com/zhihao-chen/QASystemOnMedicalGraph

切入点

  • 刚确定研究方向是知识图谱方向,想请问该如何着手学习呢? - coszero的回答 - 知乎
    https://www.zhihu.com/question/298106242/answer/1758435012
    推荐了知识图谱构建、GNN的书
    提到“知识图谱方面目前没有很好的入门课程,可以先阅读一些综述文章对领域有个大致的认识,然后就是带着问题去阅读相关的论文,做研究。”

研究点

  • 请问知识图谱有哪些研究点是可以进行深入研究的? - 漆桂林的回答 - 知乎
    https://www.zhihu.com/question/266032092/answer/305858931
    信息抽取实用化
    非文本的事件图谱
    增量的动态融合
    常识知识挖掘和推理
    知识表示方法允许节点是自然语言短语或者句子
    表示学习和逻辑规则的知识图谱推理,通过规则学习增强表示学习
    选择合适的应用场景

  • 请问知识图谱有哪些研究点是可以进行深入研究的? - 古土雷柏的回答 - 知乎
    https://www.zhihu.com/question/266032092/answer/308011197
    上帝之手理论,用户点击促进知识图谱更新

技术路线

前言

首先,neo4j是用java程序开发的,所以必须要有java的运行环境也就是jvm,而且要求java的版本不低于java8。如果还没java,快回家装java。注意:neo3使用jdk1.8,neo4使用jdk11。

推荐版本:jdk 11.0.6 + neo4j 4.4.16

jdk

简介

JDK 全称 Java Development ToolKit,是 Java 语言开发工具包。JDK 是整个 JAVA 的核心,包括了 Java 运行环境(Java Runtime Environment),一堆 Java 工具(javac/java/jdb 等)和 Java 基础的类库(即 Java API 包括 rt.jar)。

版本

下载

推荐版本:jdk 11.0.6

JDK11的下载与安装(windows和macOS)
https://blog.csdn.net/weixin_55830623/article/details/123901927
200m,在CSDN下载,不用翻,但官网建议不建议用迅雷下载。

下载完成后,进入cmd,输入:
java -version

返回如下,表示工具包安装成功

java version "11.0.6" 2020-01-14 LTS
Java(TM) SE Runtime Environment 18.9 (build 11.0.6+8-LTS)
Java HotSpot(TM) 64-Bit Server VM 18.9 (build 11.0.6+8-LTS, mixed mode)

返回如下,表示版本不匹配:

C:\Users\ThinkPad>neo4j.bat
警告: ERROR! Neo4j cannot be started using java version 11.0.6
警告: * Please use Oracle(R) Java(TM) 17, OpenJDK(TM) 17 to run Neo4j Server.
* Please see https://neo4j.com/docs/ for Neo4j installation instructions.

neo4j

简介

Neo4j是一个高性能的,NOSQL图形数据库,它是一个嵌入式的、基于磁盘的、具备完全的事务特性的Java持久化引擎,将结构化数据存储在网络(从数学角度叫做图)上而不是表中。

Neo4j 安装、使用教程
https://blog.csdn.net/zeroheitao/article/details/122925845

下载

neo4j官网网址
https://neo4j.com/download-center/#community
翻,下载社区版,windows版,桌面版,setup版

压缩版,压缩包100m根本下不动,用迅雷也是0进度,失败
翻,然后用迅雷,好像也不管用
在官网直接下setup,617m,成功

推荐版本:jdk 11.0.6 + neo4j 4.4.16
【NLP】知识图谱-入门与实践_第1张图片

启动

neo4j.bat
neo4j.bat console
【NLP】知识图谱-入门与实践_第2张图片
在浏览器中键入地址:http://localhost:7474/,进入界面

初始的用户名、密码均是neo4j

【NLP】知识图谱-入门与实践_第3张图片

桌面版

【NLP】知识图谱-入门与实践_第4张图片

python

问题:ValueError: The following settings are not supported: {‘username’: ‘neo4j’}

解决:在高版本 Graph不支持username参数,修改为link = Graph(“http://localhost:7474”, auth=(“neo4j”, “password”))

问题:ImportError: cannot import name ‘HTTPConnectionPool’ from ‘urllib3’ (unknown location)

【NLP】知识图谱-入门与实践_第5张图片
思路:

重装urllib3——[anaconda文件夹找到urllib3包,卸载,重装——pip install urllib3 --ignore-installed urllib3

升级scrapy—— https://blog.csdn.net/shizheng_Li/article/details/124780037
升级一些和urllib3无关的包

用https://github.com/urllib3/urllib3安装urllib3包
然后手动安装

python中requests带有自己的urllib3库副本,位于requests/packages子目录中。这个副本被打碎了,所以导致报错。
所以,对request进行重装,代码如下:(最有效)——pip install --force-reinstall requests==2.1.0
重装后依旧没用

不能uninstall requests怎么办?
忽略!因为旧版本的requests 依赖比较多,pip不能准确找到依赖关系——跳过卸载requests模块的操作 pip install . --ignore-installed requests

直接重启一下conda

问题:pip报错:文件urllib3-1.26.4.dist-info\METADATA不存在

报错实景:ERROR: Could not install packages due to an OSError: [Errno 2] No such file or directory: ‘f:\cs\anaconda\envs\nlp\lib\site-packages\importlib_resources-5.9.0.dist-info\METADATA’

pip报错:文件urllib3-1.26.4.dist-info\METADATA不存在
https://blog.csdn.net/qq_35056292/article/details/118073980

pip时,有非常多的文件没有METADATA
可以直接把METADATA文件复制到 env\Lib\site-packages\ 的所有包里
https://jingyan.baidu.com/article/ff42efa9cc8fef809f22027d.html
结果原来就有的METADATA文件也被覆盖了,这个环境几乎崩了

参考文献

你可能感兴趣的:(知识图谱,自然语言处理,人工智能)