【Python Causal Learning Toolbox】causallearn 库包的使用、报错修改

大家可以根据需要直接在目录上跳转哦

Python causallearn库包的使用与理解

  • 官方资源
  • 库包结构
  • 测试代码与报错处理
    • 如何运行与测试代码
    • 测试代码输出结果
    • 报错与失败的解决方案
      • TestPC.py(fail =1,error=2)
      • TestExactSearch.py
      • TestCAMUV.py
  • 库包使用

  • 本系列包含causallearn、gcastle等因果学习算法库包,主要记录博主学习过程中的理解。整体文章偏python语法熟悉而理论小白向,大神的话,请留下你的联系方式再走
  • 由于博主也是在学习中,基础较差,所以后面会逐渐发文补充因果发现相关的算法理解过程,欢迎各位关注,一起成长。

官方资源

document: Welcome to causal-learn’s documentation!
Github: cmu-phil/causal-learn
Github打不开的朋友: https://pan.baidu.com/s/1nS9cxfP_e3tpHma8FyhXKg?pwd=mofo 提取码:mofo

链接中包含库包源代码与下载使用方法,可以自行学习,有问题欢迎留言~

库包结构

模块 内容
搜索算法 约束类(PC、FCI)、评分类(精确搜索、GES)FCM类(ANM、LiNGAM、PNL)、格兰杰因果检验(Granger)、GIN、GRaSP
评分 BIC、BDeu、交叉检验、边缘似然
图像 SHD、很多种,还没有看全
使用(utils) CIT(conditional indepence test)

*注释:FCM:Functional causal model/GES:Greedy Equivalence search/GIN:Generalized Independence Noise (GIN) condition-based method

测试代码与报错处理

如何运行与测试代码

GitHub的tests文件夹内给出了库包的使用方法,我们可以从这里入手,直接学习如何调用,这也是如何快速上手一个库包的过程。学习的过程中,博主会将自己的理解注释在代码上,更新的代码可以从下面的链接中下载下来。需要自取。

添加注释的tests代码: 点个关注吧~~

class Test**之前,代码首先定义了预期的文档名称加密输出结果,以此来确定文档是否下载正确。

class Test**()输入了unittest.TestCase,这样可以使用unittest.main()来测试这个类,具体的用法推荐观看链接中文章:

python中使用 unittest.TestCase进行单元测试

看完链接中类测试的内容,可以知道,只要在最后一行加unittest.main()就可以运行并测试代码了。

测试代码输出结果

测试代码输出结果链接:点个赞吧~~

报错与失败的解决方案

运行测试代码后,输出会给出一共错误了几个,失败了几个。其中错误一般是需要更改的,失败有可能是数据问题,不修改也可以,但是尽量找到失败的原因。博主总结了在运行过程中出现的一系列问题及解决方法,方便后续回忆和调试。

TestPC.py(fail =1,error=2)

博主一共遇到三个报错,一个失败:

#没有pgmpy
pip install pgmpy
#scipy中没有_centered
pip install --user scipy==1.7.3
#AttributeError: module 'scipy' has no attribute 'sparse'
1.找到scipy\_lib\_util.py
2.283行改成import scipy.sparse as sp
3.284行改成if sp.issparse(a):
#AssertionError: Items in the first set but not the second:
(2, 3)
(2, 4)
(3, 4)
(0, 3)
(1, 3) : Directed edges are not correct.

这个原因在输入里,说的是truth_DAG_directed_edges包含的几种边PC都没有识别,初步推测是仿真数据出了问题。所以改一下输入,最后3000是成功运行的。

#207行改成3000
data = simulate_linear_continuous_data(num_of_nodes, 3000, truth_DAG_directed_edges, "exponential", 42)

TestExactSearch.py

[Errno 2] No such file or directory: 
'tests/TestData/test_exact_search_simulated_linear_gaussian_data.txt'
OSError: tests/TestData/test_exact_search_simulated_linear_gaussian_CPDAG.txt not found.

都是路径错了,把25、26、41、42行的tests/删掉

TestCAMUV.py

ModuleNotFoundError: No module named 'pygam'
pip install pygam

库包使用

以TestPC.py为例,可以看到他的输入有数据和结构两个txt文档,一个是节点数据,一个是边数据,可以将已有的表格数据处理为相同的数据格式,然后放进这一段代码中,就可以完成库包的使用。

所以重点在于如何将表格数据处理为符合要求的标准数据。

你可能感兴趣的:(python,开发语言,人工智能)