BayesiaLab
BayesiaLab是一个功能强大的桌面应用程序(Windows / Mac / Unix),具有复杂的图形用户界面,为科学家提供了一个全面的“实验室”环境,用于机器学习,知识建模,诊断,分析,模拟和优化。借助BayesiaLab,Bayesian网络已经变得切实可行,可以深入了解问题域。 BayesiaLab利用Bayesian网络的固有图形结构来探索和解释复杂问题。
BayesiaLab是Lionel Jouffe博士和Paul Munteanu博士近二十年的研究和软件开发成果。 2001年,他们的研究工作促成了Bayesian S.A.S.的成立,总部位于法国西北部的拉瓦尔。如今,该公司已成为世界领先的Bayesian网络软件供应商,为全球数百家大型企业和研究机构提供服务。
BayesiaLab的方法,特征和功能
BayesiaLab围绕原型工作流程设计,中心采用Bayesian网络模型。 BayesiaLab支持从模型生成到分析,模拟和优化的研究过程。整个过程完全包含在统一的“实验室”环境中,为科学家提供了在研究任务的不同要素之间来回移动的灵活性。
知识建模
学科专家经常以图表的形式表达他们对领域的因果理解,其中箭头表示因果方向。这种原因和结果的直观表示在BayesiaLab的网络图中具有直接的模拟。可以通过鼠标单击在BayesiaLab的图形面板上添加和定位节点(表示变量),可以在节点之间“绘制”弧(表示关系)。可以通过将弧从原因定向到有效编码来表示因果方向
可以在BayesiaLab的节点编辑器中管理变量之间关系的定量性质以及许多其他属性。通过这种方式,BayesiaLab有助于简化对领域的理解和直接编码。同时,BayesiaLab强制执行内部一致性,因此无法对不可能的条件进行编码。
除了让个体直接在BayesiaLab中编码其显性知识外,Bayesian专家知识抽取环境(BEKEE)还可用于从一组专家那里获取网络的概率。 BEKEE提供基于网络的界面,用于系统地从多个利益相关者中获取显性和隐性知识。
离散,非线性和非参数建模
BayesiaLab包含描述条件概率表(CPT)中变量之间概率关系的所有“参数”,这意味着不使用任何函数形式。基于这种非参数的离散方法,BayesiaLab可以方便地处理变量之间的非线性关系。然而,这种基于CPT的表示需要准备步骤来处理连续变量,即离散化。这包括手动或自动定义所有连续值的离散表示。 BayesiaLab提供了多种离散化工具,可以在数据导入向导,节点编辑器和独立的离散化功能中访问这些工具。在这种情况下,可以使用单变量,双变量和多变量离散化算法。
使用BayesiaLab进行机器学习
BayesiaLab具有一系列高度优化的学习算法,可以快速发现数据集中的结构。 BayesiaLab的学习算法中的优化标准基于信息理论(例如,最小描述长度)。由此,没有关于变量分布的假设。这些算法可用于所有类型和所有大小的问题域,有时包括数千个具有数百万个潜在相关关系的变量。
无监督结构学习
在统计学中,“无监督学习”通常被理解为分类或聚类任务。为了明确区分,我们将重点放在“无监督结构学习”中的“结构”,其中涵盖了Bayesian实验室中的许多重要算法。
无监督结构学习意味着BayesiaLab可以发现大量变量之间的概率关系,而无需指定输入或输出节点。有人可能会说这是一种典型的知识发现形式,因为在未知数据集上执行这些算法不需要任何假设。
监督学习
BayesiaLab中的监督学习与许多传统建模方法具有相同的目标,即开发用于预测目标变量的模型。请注意,许多统计软件包还提供“Bayesian网络”作为预测建模技术。然而,在大多数情况下,这些包的能力受限于一种类型的网络,即朴素Bayesian网络。 BayesiaLab提供了更多的监督学习算法来搜索最佳预测目标变量的Bayesian网络,同时还考虑了最终网络的复杂性。
我们应该强调Markov Blanket算法的速度,这在处理大量变量时特别有用。在这种情况下,Markov Blanket算法可以用作有效的变量选择算法。使用该算法的监督学习的例子,以及密切相关的增强马尔可夫毯算法。
聚类
BayesiaLab中的聚类涵盖数据聚类和变量聚类。前者适用于数据集中记录(或观察)的分组;后者根据相互关系的强度执行变量分组。
该概念的第三种变化在BayesiaLab中特别重要:多重聚类可以表征为一种非线性,非参数和非正交因子分析。多重聚类通常作为使用BayesiaLab开发概率结构方程模型的基础(参见我们的书中的第8章,Bayesian网络和Bayesian实验室)。
推论:诊断,预测和模拟
Bayesian网络明确地模拟不确定性的固有能力使它们适用于广泛的实际应用。在Bayesian网络框架中,诊断,预测和模拟是相同的计算。它们都包括以证据为条件的观察推断:
从影响到推理的推断:诊断或外展。
从因果推断:模拟或预测。
然而,这种区别仅存在于研究者的角度,研究者可能将疾病的症状视为影响,疾病本身就是原因。因此,基于观察到的症状进行推断被解释为“诊断”。
观察推断
Bayesian网络的一个主要优点是它们可以“全方位地”计算推理。鉴于在任何网络节点(或节点的子集)上观察任何类型的证据,BayesiaLab可以计算所有网络的后验概率网络中的其他节点,无论弧方向如何。精确和近似观测推理算法都在BayesiaLab中实现。
模型利用
BayesiaLab提供了一系列功能,用于系统地利用Bayesian网络中包含的知识。它们使网络可以作为专家系统访问,可以由最终用户或通过自动化过程进行交互式查询。
自适应问卷调查功能提供了寻找证据的最佳顺序方面的指导。鉴于已经收集的证据,BayesiaLab动态确定要获得的下一个最佳证据,以便最大化相对于目标变量的信息增益,同时最小化获取此类证据的成本。例如,在医学方面,这将允许诊断程序的最佳“升级”,从“低成本/小增益”证据(例如,测量患者的血压)到“高成本/大增益”。证据(例如进行MRI扫描)。自适应问卷在我们的书,Bayesian网络和Bayesian实验室的第6章中的肿瘤分类的背景下进行了讨论。
WebSimulator是一个通过网络发布交互式模型和自适应调查问卷的平台,这意味着使用BayesiaLab构建的任何Bayesian网络模型都可以与客户私下共享或与更广泛的受众公开共享。通过WebSimulator发布模型后,最终用户可以尝试场景并检查该模型的动态。
批量推断可用于自动对数据集中的大量记录执行推断。例如,Batch Inference可用于为数据库中的所有客户生成预测分数。基于相同的目标,BayesiaLab的可选导出功能可以将预测网络模型转换为可在外部程序中运行的静态代码。可以使用模块生成R,SAS,PHP,VBA和JavaScript的代码。
开发人员还可以使用Bayesia Engine API访问BayesiaLab的许多功能 - 在图形用户界面之外。Bayesian建模引擎允许构建和编辑网络。Bayesian推理引擎可以以编程方式访问网络模型以执行自动推理,例如,作为带有流数据的实时应用程序的一部分。 Bayesia Engine API实现为纯Java类库(jar文件),可以集成到任何软件项目中。
知识传播
虽然通过专家知识建模或通过机器学习生成Bayesian网络,所有关于计算机获取知识,Bayesian网络也可以是人类提取或“收获”知识的非常强大的工具。由于Bayesian网络可以作为现实世界领域的高维表示,Bayesian实验室允许我们以交互方式,甚至有趣的方式与该领域互动来进行学习。通过可视化,模拟和分析功能,加上网络模型本身的图形特性,BayesiaLab成为一种教学设备,可以有效地检索和传递Bayesian网络中包含的知识。因此,BayesiaLab成为人工智能和人类智能之间的桥梁。
许可选项
公司名称:北京哲想软件有限公司
北京哲想软件官方网站:www.cogitosoft.com
北京哲想软件微信公众平台账号:cogitosoftware
北京哲想软件微博:哲想软件
北京哲想软件邮箱:[email protected]
销售(俞先生)联系方式:+86(010)68421378
微信:18610247936 QQ:368531638