基于医疗知识图谱的问答系统实践中遇到的问题

医药领域知识图谱和问答系统的搭建是参考中科院软件所刘焕勇老师在github上的开源项目,项目地址:https://github.com/liuhuanyong/QASystemOnMedicalKG ,感谢刘老师,这个项目是我能找到的最好最全最易上手的KBQA实践项目。

在系统搭建过程中,遇到了一些问题,并解决了,记录如下:

问题1:ahocorasick安装失败

pip安装报错:error: Microsoft Visual C++ 14.0 is required. Get it with "Microsoft Visual C++ Build Tools": http://landinghub.visualstudio.com/visual-cpp-build-tools
解决:下载visualcppbuildtools_full.exe工具,安装Visual C++,如果电脑上装的有相关环境的旧版本,建议卸载,否则可能导致安装不完整。

以上方法如果还是解决不了,建议在安装过anaconda的同学,可以尝试以下方法:

  打开windows的命令行:

     输入:anaconda search -t conda pyahocorasick
     执行 

     输入:conda install -c https://conda.anaconda.org/conda-forge pyahocorasick

     最后输入y,就安装完成了

问题2:gbk编码报错


for data in open(self.data_path): UnicodeDecodeError: 'gbk' codec can't decode byte 0xaf in position 124: illegal multibyte sequence for data in open(self.data_path,encoding='utf-8'):
解决:定位到错误代码question_classifier.py里,在open函数中加上,encoding='utf-8'即可:
 

你可能感兴趣的:(Python)