ML OR 智能决策

因果关系发现：推开认知世界的大门

在上一篇文章(灵魂三问：因果推断)中，我们介绍了什么是因果推断，为什么要以及如何进行因果推断。本文将围绕如下内容介绍如何进行因果关系发现研究：

因果发现的三个层级
因果发现的重要工具
因果发现的具体方法

（本文共4137字，预计阅读时长10分钟）

先从一组数据说起：为了研究某个治疗方案是否对某疾病有疗效，研究人员安排了治疗组和控制组进行实验，每组40人。治疗组将严格按照方案进行治疗，而控制组的人只能得到一些安慰剂。在实验进行一段时间后，得到两组病人的生存率，如图所示。

人群总体：50%（治疗组生存率）＞40% （控制组生存率）
男性：60%（治疗组生存率）＜70% （控制组生存率）
女性：20%（治疗组生存率）＜30% （控制组生存率）

上面的数据给出一个令人迷惑的结论：从人群总体的角度，我们发现治疗组的生存率要高于控制组。但当区分性别来看，会完全颠覆之前的结论，即无论男性还是女性，治疗组的生存率均低于控制组。

你是不是也有一点糊涂？别担心，这就是困扰了统计学家60多年的著名的辛普森悖论，是因为仅通过学习某个条件概率，就去回答因果性问题而产生的。

一、认知因果的三个层次

图灵奖得主Judea Pearl提出，认知因果包含三个层级 ¹ 。通过观察发现事物之间的关联只是第一个层级；在这之上，还需要对过程进行有目的的干预，才能去回答“如果进行了治疗，生存率是否会提高的问题”。认知因果的第三个层级是反事实推理，回答“假如没有…，那么…“这样的问题。

传统的机器学习最擅长做的是根据数据中呈现出来的相关性学习函数 $f\left({Y|X}_1,\ldots,X_m\right)$ 去拟合条件概率 $P\left(Y|X_1,\ldots,X_m\right)$ 。这种机器学习模型只学习到了认知因果的第一个层次即关联。

干预，是对所有可能影响因果关系的因子进行控制。如果不使用严格的控制实验，仅通过数据进行干预，需要引入由do算子定义的干预分布，直观地描述对 $X_i$ 进行有意图干预时，其他变量概率分布的变化情况 ² 。例如： $P(Y|do\left(X\right)=a)$ 描述了当 $X$ 取值为 $a$ 时， $Y$ 所对应的分布。写成如下形式：
$P\left(X_1,\ldots{,X}_{i-1,}X_{i+1}\ldots,X_n\middle| d o\left(X_i\right)=a\right)=\frac{P\left(X_1,\ldots,X_n\right)}{P\left(X_i\middle|{pa}_i\right)}I(X_i=a)$
其中， ${pa}_i$ 表示所有产生 $X_i$ 的原因； $I(X_i=a)$ 为恒等函数，即当 $X_i$ 的值为 $a$ 时，其值为1，当 $X_i$ 的值不为 $a$ 时，其值为0。等式右边的除数 $P\left(X_i\middle|{pa}_i\right)$ 表示在对 $X_i$ 进行干预时，需要去除 ${pa}_i$ 对 $X_i$ 的影响。

如果能得到如下情况：

$\ i j = c ) ) ≠ P ( X j ∣ d o ( X i = x ′ , X \ i j = c ) ) P(X_j|do(X_i=x,X_{\backslash ij}=c))\neq P(X_j|do(X_i=x^\prime,X_{\backslash ij}=c))$

即在保持系统中除 $X_i$ 和 $X_j$ 外的其他变量不变的情况下， $X_i$ 值的变化引起了 $X_j$ 的分布变化，那么我们可以说 $X_i$ 是 $X_j$ 的直接原因。

我们以辛普森悖论为例，直观地理解干预分布和条件分布之间的差别。

辛普森悖论案例
用条件概率衡量治疗对生存率的影响，计算如下：

同理

P\left(S=survial\middle| T=control\right)=40\%

。

用do算子衡量治疗对生存率的影响，计算如下:

同理 $P\left(S=survial\middle| d o(T)=control\right)=60\%$ 。

对比两组计算：条件概率中Gender对生存率的影响会因为Treatment而变化（见 $P (G ∣ T) ）$ ；而干预分布中Gender对Treatment的影响（作为除数的 $P (T ∣ G) ）$ 受到严格控制，其对生存率的影响并不会因为Treatment变化。

通过干预的推理告诉我们通过治疗，人们的存活率为40%，要低于控制组的60%。但这些都是在研究总体效应或平均因果效应，如果针对特定事件或个体层面谈论个性化因果关系还需要进行反事实推理。比如在治疗了一段时间后，某病人的生存率提高，但这真是因为服用了特定的药物吗？还是因为听到了好消息？在反事实层，因为我们不可能观测到未曾发生的事情，只能在想象的世界里，推测现象原因为何。

二、因果发现的工具

因果发现旨在从一堆纷繁复杂的数据中，挖掘出不同变量之间因果影响的网络结构。为了进行因果发现，我们需要认识两个描述系统因果机制的工具：因果图和结构因果模型。

2.1 因果图

因果图是在贝叶斯网络的基础上定义的，它们都通过有向无环图（DAG）的形式并遵从马尔可夫性和忠实性假设，抓住图与数据交互的关键，实现了图的连接性和变量的独立性之间的联结。区别是，贝叶斯网络是由一系列条件概率描述的有向无环图，而因果图引入由do算子定义的干预，突破了条件概率只能学习到相关性的限制，从而到达认知因果的第二个层级，学习到更稳定的结构。下图直观地描述了五个变量之间的因果关系： $X_1$ 是 $X_2$ 和 $X_3$ 的共同原因, $X_3$ 和 $X_4$ 又共同产生了 $X_5$ 。

接下来我们识别有向无环图中的几个重要结构：

在head-to-tail和tail-to-tail中， $X$ 和 $Y$ 关于 $Z$ 条件独立，即 $X\bot Y|Z$ ，其中head-to-tail中的 $Z$ 为中间变量，tail-to-tail中的 $Z$ 为混淆变量；在head-to-head（v-结构）中， $X$ 和 $Y$ 无条件独立，或者说 $X$ 和 $Y$ 关于空集条件独立 $X\bot Y|\emptyset$ ， $Z$ 被称为对撞点。

我们需要严格控制混淆变量以消除其带来的偏差。然而，长期以来，统计学家时常困惑于具体应该控制哪些变量。如果控制中间变量，会切断 $X$ 和 $Y$ 之间的间接因果联系，得出 $X$ 对 $Y$ 没有影响的错误结论；如果控制对撞点，则会错误地认为 $X$ 对 $Y$ 有因果关系。后门准则和前门准则，可以帮助识别并消除因果图中的混淆变量，将do算子表示的干预分布转化成条件分布，在此基础上可以利用统计方法进行因果推断。

后门准则：后门路径定义为连接 $X$ 和 $Y$ 且包含了指向 $X$ 的箭头的所有路径。阻断 $X$ 和 $Y$ 之间的所有后门路径，可以防止 $X$ 的信息在非因果方向上的传递。存在对撞点的后门路径被认为时天然阻断的。

以研究“吸烟”（原因变量）对“癌症”（结果变量）的影响为例，“吸烟->焦油沉积->癌症”为因果路径，其中，“焦油沉积”为中间变量。“吸烟<-吸烟基因->癌症”为一条从“吸烟”到“癌症”的后门路径，该路径包含指向“吸烟”的箭头，其中**“吸烟基因“为混淆变量**。此外，整个因果图中只有一条从“吸烟”到“癌症”的后门路径。因此，控制了“吸烟基因”，我们就阻断了从“吸烟”到“癌症”的所有后门路径。

吸烟案例的因果图
为了研究“吸烟”对“癌症”的因果效应，我们对“吸烟”使用do算子：

前门准则：前门路径就是指从

X

到

Y

的直接因果路径，即上述：“吸烟->焦油沉积->癌症“的路径。当因为缺乏必要的数据而无法阻断某条后门路径时，就要通过前门准则，将

X

对

Y

的因果效应分解为

X

对

Z

的因果效应和

Z

对

Y

的因果效应。

在吸烟的案例中，假设我们无法对吸烟基因进行测量，但是可以获取”吸烟“，”焦油沉积“，以及“癌症”这三个变量的数据。这时，我们将“吸烟”对“癌症”的平均因果效应 $P (癌症 ∣ d o (吸烟))$ ，转化为 $P (焦油沉积 ∣ d o (吸烟))$ 和 $P (癌症 ∣ d o (焦油沉积))$ 的加权。在计算 $P (焦油沉积 ∣ d o (吸烟))$ 时，路径“吸烟<-吸烟基因->癌症<-焦油沉积”中 “癌症”处出现的对撞天然地阻断了这条后门路径。在计算 $P (癌症 ∣ d o (焦油沉积))$ 时，存在后门路径“焦油沉积<-吸烟<-吸烟基因->癌症“，通过控制”吸烟“可以阻断。

利用前门准则，最终可以得到：

2.2 结构因果模型

结构因果模型也称作函数因果模型，旨在通过一系列函数方程对由图所描述的因果关系进行定义，将因果发现转化为函数估计问题 ³ 。

在结构因果模型中，除了因果变量 $X_j$ 外，还有一组随机变量 $E_j$ ，它们只影响所对应的 $X_j$ ，且相互独立，用于描述 $X_j$ 受环境影响产生的不确定性。

相比因果图，结构因果模型包含了更多的信息，其不仅蕴含了一个观测分布，还蕴含了干预分布和反事实分布，可以在因果图干预的基础上，进一步支持反事实推理。

结构因果模型不仅蕴含了观测分布，还蕴含了干预分布和反事实
找到一个结构因果模型就意味着找到数据蕴含的唯一的联合分布；根据马尔可夫假设，可以将其按照因果图进行分解，即

P\left(X_1,\ldots,X_d\right)=\prod_{j=1}^{d}{P(X_j|{Pa}_j)}

。但当存在 head-to-tail以及 tail-to-tail结构时，我们观测到的联合分布是一致的。例如：

X

和

Y

关于

Z

相互独立，可以得到如下

(X, Y)

的联合概率分布：

所以实际上，利用结构因果模型只能够确定一类具有相同骨架（无向图）和v-结构的部分有向无环图（CPDAG），即马尔可夫等价类。

下图中，（a）是真实的因果图，（b）是其骨架，（d）和（e）是（a）的所有马尔可夫等价图；（c）展示了图（a）马尔可夫等价类的CPDAG ⁴ 。

因果图的马尔可夫等价类和CPDAG
当可以通过一个结构因果模型找到一个马尔可夫等价类时，我们就说他是可识别的。这需要对

N_j

和

f_j

作相应的假设。当假设所有的

N_j

服从相互独立的高斯分布时，关于

f_j

的形式和结构因果模型的可识别性有如下结果：

三、因果发现的具体方法

基于观测的因果发现，就是要对生成数据的因果结构进行估计。用于确定一个因果图的马尔可夫等价类的方法，主要包括两类：基于约束的方法和基于分数的方法。

基于约束的方法主要通过一系列假设检验，判断在给定一个集合A后，两个节点之间是否条件独立。以该类方法中的PC算法为例 ⁵ ，为了避免对所有可能的子集A进行搜索，在因果图构建过程中，从一个全连接图开始，通过逐渐增加条件集合的大小，来判断两个变量之间是否条件独立。如果可以找到一个集合使得两个变量之间条件独立，就可以去掉两个变量之间的边。当无法删除任何边时，就得到了因果图的骨架。如果两个变量 $(X, Y)$ 之间条件独立，即它们之间没有直接相连的边，但存在路径 $X - Z - Y$ ，且 $Z$ 无法使得 $(X, Y)$ 条件独立，那么就可以确定一个对撞结构（v-结构） $X\rightarrow Z\gets Y$ 。在找到图中的所有v-结构后，就确定了CPDAG。

基于分数的方法主要通过对模型类型作相应的假设限制，直接拟合一个结构因果模型结构。拟合的效果通常由一个打分函数进行定义，通过求解

$\hat{\mathcal G}:= {\underset {\operatorname{\mathcal G\ DAG \ over\ X}}{\operatorname {argmax} }} \ \mathcal S(\mathcal D,\mathcal G)$

得到最优的图结构。该打分函数通常包括两个部分：一是要最大化对数据的拟合程度；二是对图结构的复杂程度进行惩罚。在对最优图结构进行搜索时，可以使用贪婪搜索方法等局部搜索方法，也可以使用如动态规划、混合整数规划进行精确搜索。

通过有效地结合基于独立性和基于分数的混合方法，节约计算成本，得到更加准确有效的模型估计。

基于独立性和基于分数的方法，只能够确定CPDAG，要画出完整的因果图，可以借助成对比较方法去探索局部信息，主要是利用反映在数据中的因果产生机制的不对称性，确定因果方向。

具体来讲：如果 $X$ 和 $Y$ 之间存在直接因果关系，根据概率公理无法区分因果方向，即 $p\left(x,y\right)=p\left(x|y\right)p\left(y\right)=p\left(y|x\right)p(x)$ 。考虑如下结构因果模型：

$X≔E_X$ $Y≔f\left ( X \right )+E_Y$

其中， $E_X\bot$ $E_Y$ 。由 $E_X$ 和 $E_Y$ 相互独立，可知 $X$ 与 $[Y ∣ X]$ 相互独立；然而在非因果方向上 $Y$ 与 $[X ∣ Y]$ 却不一定独立。如下图所示，区别于因果方向上的独立性，即 $f\left(X\right)-Y$ 与 $E_Y$ 独立，用线性方程 $g (Y)$ 去拟合 $X$ ，得到的残差与 $Y$ 之间存在明显的相关性。

数据中的不对称性可用于确定因果方向

结语

因果推理是非常强大的解释、分析和建模工具，与机器学习结合，可以提取更稳定和可解释的特征信息，增加模型的泛化能力。比如，在因果表征学习中，对一个复杂系统的因果环节进行解构，就可以在系统发生变化时，定位变化模块，解释变化原因，进行局部干预，甚至是反事实推理 ⁶ 。以下图为例，系统中一个机械手指的动作发生变化，造成了红色方块掉落。在右图所示的像素空间中，红色方块掉落也遮挡了背景中其他物体，这使得机械手指引起的变动信息与系统中其他互不相干的物体纠缠在一起，无法分解。在左图中，将整个系统的物理机制用因果图进行描述，那么只有机械手指对应的节点和红色方块节点及其子节点发生了变化。由此，在因果表征空间里实现了信息解耦。这种信息解耦，可以帮助探索事物内部的物理机制和逻辑关系，对视频跟踪监控、自动驾驶、飞行控制等自动化系统的精准智能感知、智能辨识与控制预测至关重要。

此外，因果推断在半监督学习、域适应、迁移学习或稳定学习、情景强化学习等多个领域都有极大的研究意义和应用价值。

（本文首发于微信公众号：ML OR 智能决策。分享更多干货，欢迎交流~）

参考资料

J. Pearl and D. Mackenzie (2018). The book of why. Basic Books. ↩︎
J. Pearl et al. (2016). Causal Inference in Statistics: A Primer. Wiley. ↩︎
J. Peters et al. (2017). Elements of Causal Inference: Foundations and Learning Algorithms. MIT Press. ↩︎
O. Goudet, et al. (2018). Learning Functional Causal Models with Generative Neural Networks. In Explainable and Interpretable Models in Computer Vision and Machine Learning, 39-88. ↩︎
M. Kalisch and P. Bühlmann (2007), Estimating high-dimensional directed acyclic graphs with the PC-algorithm. Journal of Machine Learning Research. ↩︎
B. Schölkopf, et al. (2021). Towards Causal Representation Learning. https://arxiv.org/abs/2102.11107. ↩︎

【人工智能机器学习基础篇】——深入详解无监督学习之降维：PCA与t-SNE的关键概念与核心原理猿享天开人工智能数学基础专讲人工智能机器学习无监督学习降维
深入详解无监督学习之降维：PCA与t-SNE的关键概念与核心原理在当今数据驱动的世界中，数据维度的增多带来了计算复杂性和存储挑战，同时也可能导致模型性能下降，这一现象被称为“维度诅咒”（CurseofDimensionality）。降维作为一种重要的特征提取和数据预处理技术，旨在通过减少数据的维度，保留其主要信息，从而简化数据处理过程，并提升模型的性能。本文将深入探讨两种广泛应用于无监督学习中的降
模型上下文协议 (MCP)是什么？Model Context Protocol 需要你了解一下同学小张学习 AIGC AI-native agi gpt 开源协议
大家好，我是同学小张，+v:jasper_8017一起交流，持续学习AI大模型应用实战案例，持续分享，欢迎大家点赞+关注，订阅我的大模型专栏，共同学习和进步。在人工智能领域，ModelContextProtocol（MCP）正逐渐成为连接AI模型与各类数据源及工具的重要标准。MCP究竟为何物？它又将如何改变AI应用的开发与使用？文章目录0.概念1.MCP的总体架构2.为何使用MCP？3.我的理解4
生成式对抗网络在人工智能艺术创作中的应用与创新研究辛迎蕌人工智能
摘要本文深入探究生成式对抗网络（GAN）在人工智能艺术创作领域的应用与创新。通过剖析GAN核心原理，阐述其在图像、音乐、文学等艺术创作中的实践，分析面临的挑战与创新方向，呈现GAN对艺术创作模式的变革，为理解人工智能与艺术融合发展提供全面视角。一、引言在人工智能与艺术深度融合的时代浪潮中，生成式对抗网络（GAN）作为一项突破性技术，为艺术创作带来了全新的可能性。它打破传统创作边界，以独特的对抗学习
知识图谱在人工智能语义理解与推理中的关键作用及发展研究 @王威& 人工智能
摘要本文聚焦知识图谱，深入剖析其在人工智能语义理解与推理中的核心作用。阐述知识图谱的构建原理、表示方法，分析其在自然语言处理、智能问答系统、推荐系统等多领域助力语义理解与推理的应用，探讨面临的挑战并展望未来发展方向，全面呈现知识图谱对人工智能发展的重要价值与深远影响。一、引言在人工智能追求更精准理解和处理人类语言与知识的进程中，知识图谱成为关键技术。它以结构化形式组织海量知识，揭示实体间复杂关系，
Flink启动任务 swg321321 flink 大数据
Flink以本地运行作为解读例如：第一章Python机器学习入门之pandas的使用提示：写完文章后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录Flink前言StreamExecutionEnvironmentLocalExecutorMiniClusterStreamGraph二、使用步骤1.引入库2.读入数据总结前言提示：这里可以添加本文要记录的大概内容：例如：随着人工智能的不断发
使用Nginx实现后端负载均衡海上彼尚 node.js nginx 负载均衡运维 node.js
目录引言一、负载均衡的核心作用二、基础配置三步曲1.定义后端服务器组（upstream）2.配置代理转发规则3.重载配置生效三、六大负载均衡算法详解四、高级配置技巧1.健康检查机制2.会话保持方案3.SSL终止优化五、实战场景配置案例案例1：WebSocket负载均衡案例2：多级地域分发案例3：连接池优化六、最佳实践与陷阱规避结语引言在现代高并发场景下，单一服务器难以支撑海量请求的处理。Nginx
计算机专业毕业设计题目推荐（新颖选题）本科计算机人工智能专业相关毕业设计选题大全✅ 会写代码的羊毕设选题课程设计人工智能毕业设计毕设题目毕业设计题目 ai AI编程
文章目录前言最新毕设选题（建议收藏起来）本科计算机人工智能专业相关的毕业设计选题毕设作品推荐前言2025全新毕业设计项目博主介绍：✌全网粉丝10W+,CSDN全栈领域优质创作者，博客之星、掘金/华为云/阿里云等平台优质作者。技术范围：SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、小程序、大数据、机器学习等设计与开发。主要内容：免费功能
AI人工智能 Agent：在赋能传统行业中的应用 AI天才研究院计算 DeepSeek R1 &大数据AI人工智能大模型计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
AI人工智能Agent：在赋能传统行业中的应用1.背景介绍1.1人工智能的发展历程1.1.1人工智能的起源与发展1.1.2人工智能的三次浪潮1.1.3人工智能的现状与挑战1.2传统行业面临的困境1.2.1效率低下1.2.2成本高企1.2.3决策滞后1.3人工智能赋能传统行业的必要性1.3.1提高效率1.3.2降低成本1.3.3优化决策2.核心概念与联系2.1人工智能Agent的定义2.1.1Age
SM系列密码算法在网络空间安全中的体系化应用研究安全
一、算法架构与技术特性解析1.1SM2椭圆曲线公钥算法基于Fp-256r1椭圆曲线构建，采用Weierstrass方程形式：y²≡x³+ax+b(modp)，其核心安全参数满足：素数模p：256位大素数基域Fp上椭圆曲线阶n满足n>2^191抗MOV约化攻击特性支持高效标量乘运算优化密钥协商协议采用改进的ECMQV机制，通过两步验证实现前向安全性，计算流程包含：临时密钥对生成：(d_A,P_A)←
密码学协议在SSL/TLS证书体系中的深度解析安全
摘要：本文从密码学协议演进视角，系统剖析SSL/TLS证书体系的实现机理与安全边界。聚焦TLS1.3协议标准，揭示椭圆曲线密码体制(ECC)与混合密钥交换机制的协同运作，探讨证书透明度(CT)系统的密码学验证模型，并构建后量子时代数字证书的迁移路径框架。一、SSL/TLS协议栈的密码学架构演进X.509证书的密码学基因由PKI体系决定，其信任锚点植根于CA机构的数字签名算法选择。TLS1.3协议废
【机器学习】建模流程 CH3_CH2_CHO 什么？！是机器学习！！机器学习人工智能线性回归逻辑回归
1、数据获取1.1来源数据获取是机器学习建模的第一步，常见的数据来源包括数据库、API、网络爬虫等。数据库是企业内部常见的数据存储方式，例如：MySQL、Oracle等关系型数据库，以及MongoDB等非关系型数据库，它们能够存储大量的结构化和非结构化数据API（应用程序编程接口）提供了从外部获取数据的便捷方式，例如：社交媒体平台的API可以获取用户发布的内容和互动信息网络爬虫则适用于从网页中提取
基于MATLAB路径规划仿真轨迹规划，船舶轨迹跟踪控制，数学模 985计算机硕士仿真模型 matlab 开发语言
MATLAB路径规划仿真轨迹规划，船舶轨迹跟踪控制，数学模MATLAB路径规划仿真轨迹规划，船舶轨迹跟踪控制，数学模型基于两轮差速的小车模型，用PID环节对航向角进行控制，迫使小车走向目标，或用PID环节对航向角和距离进行控制，迫使小车走向目标LQR算法可自行小车起点坐标文章目录初始化环境定义PID控制函数运行仿真代码说明：代码示例代码说明：为了实现基于两轮差速模型的小车在MATLAB中的路径规划
基于Matlab_simulink仿真相关控制算法、优化算法相关帮助代做，原理讲解 985计算机硕士仿真模型 matlab 算法开发语言
Matlab/simulink仿真相关控制算法、优化算法相关帮助代做，原理讲解：1.优化算法相关：蚁群优化算法，遗传优化算法等2.控制器相关：ADRC控制，鲁棒控制，神经网络控制，MPC等3.神经网络相关：BP神经网络，RBF神经网络，LSTM神经网络等文章目录1.优化算法相关蚁群优化算法（ACO）2.控制器相关ADRC控制3.神经网络相关BP神经网络1.构建光伏系统模型1.1光伏电池模型1.2控
u-net系列算法㡽闧㔯人工智能算法
语义分割M整体结构：M概述就是编码解码过程简单但是很实用，应用广起初是做医学方向，现在也是U-net主要网络结构：还引入了特征拼接操作M以前我们都是加法，现在全都要这么简单的结构就能把分割任务做好U-net++整体网络结构：特征融合，拼接更全面其实跟densenet思想一致把能拼能凑的特征全用上就是升级版了U-net++DeepSupervision：也是很常见的事，多输出损失由多个位置计算，再更
基于FPGA的DDS连续FFT 仿真验证 toonyhe FPGA开发 fpga开发 DDS FFT IFFT
基于FPGA的DDS连续FFT仿真验证1摘要本文聚焦AMDLogiCOREIPFastFourierTransform(FFT)核心，深入剖析其在FPGA设计中的应用。该FFT核心基于Cooley-Tukey算法，具备丰富特性，如支持多种数据精度、算术类型及灵活的运行时配置。文中详细介绍了其架构选项、端口设计、理论运算原理，以及在不同场景下的动态范围特性。同时，结合VivadoDesignSuit
Marker可以快速且准确地将PDF转换为markdown格式。星霜笔记开源关注简介免费源码 pdf
MarkerMarker可以快速且准确地将PDF转换为markdown格式。支持多种文档类型（针对书籍和科学论文进行了优化）支持所有语言移除页眉/页脚/其他杂质格式化表格和代码块提取并保存图像以及markdown将大多数方程转换为latex支持在GPU、CPU或MPS上运行工作原理Marker是一个由深度学习模型组成的管道：提取文本，必要时进行OCR处理（启发式算法，surya，tesseract
“四预”驱动数字孪生水利：让智慧治水守护山河安澜 GeoSaaS 实景三维智慧城市人工智能 gis 大数据安全
近年来，从黄河秋汛到海河特大洪水，从珠江流域性洪灾到长江罕见骤旱，极端天气频发让水安全问题备受关注。如何实现“治水于未发”？数字孪生水利以“预报、预警、预演、预案”（四预）为核心，正在掀起一场水利治理的智慧革命。一、数字孪生水利：从物理世界到虚拟镜像的跃迁数字孪生水利并非简单的“数字建模”，而是通过高精度传感器、大数据、人工智能等技术，在虚拟空间构建与物理流域完全映射的“数字分身”，实现水情、工情
硬件NAS将成为电子垃圾？ DeepSeek+NAS 家用NAS WinNAS 飞牛NAS 人工智能安卓NAS
随着人工智能（AI）技术的快速发展，传统的NAS设备正面临一场深刻的变革。过去，NAS的主要功能是提供数据存储和共享服务，但在AI时代，单纯的存储功能已无法满足用户需求。未来的NAS必须集成本地AI能力，才能成为真正的AI-NAS。然而，当前市场上的NAS产品硬件配置普遍较低，无法支持本地AI的运行。因此，现有的硬件NAS在三年内可能会被淘汰，取而代之的将是集成了AI和NAS功能的家用AI服务器。
Hugging Face预训练GPT微调ChatGPT（微调入门！新手友好！） y江江江江机器学习大模型 gpt chatgpt
HuggingFace预训练GPT微调ChatGPT（微调入门！新手友好！）在实战中，⼤多数情况下都不需要从0开始训练模型，⽽是使⽤“⼤⼚”或者其他研究者开源的已经训练好的⼤模型。在各种⼤模型开源库中，最具代表性的就是HuggingFace。HuggingFace是⼀家专注于NLP领域的AI公司，开发了⼀个名为Transformers的开源库，该开源库拥有许多预训练后的深度学习模型，如BERT、G
【DeepSeek】全方位使用指南————简版諰. 人工智能 ai AI写作
一、平台概述DeepSeek（深度求索）是专注实现AGI的中国的人工智能公司，提供多款AI产品：智能对话（Chat）文生图（Art）代码助手（Coder）API开发接口企业定制解决方案二、注册与登录2.1账号创建访问官网https://www.deepseek.com点击右上角「注册」支持三种方式：手机号+短信验证邮箱注册（需验证邮件）第三方登录（微信/Google账号）2.2订阅计划套餐类型免费
Open-Sora - 为所有人实现高效的视频制作大众化小众AI AI开源音视频人工智能 AI编程
GitHub：https://github.com/hpcaitech/Open-Sora更多AI开源软件：发现分享好用的AI工具、AI开源软件、AI模型、AI变现-小众AI这是一款开源的SOTA（State-of-the-Art）视频生成模型，仅用20万美元（224张GPU）就能训练出商业级11B参数的视频生成大模型。它采用Python语言和PyTorch深度学习框架开发，具有生成速度快、资源消
算法基础——蓝桥杯（python实现，实际上大多数用c++更明白易懂）（第一部分，共12个小题） New_Teen 算法蓝桥杯 python
1.成绩统计问题描述:编写一个程序，建立一个字典，每个字典包含姓名、学号、英语成绩、数学成绩和C++成绩，并通过字典操作平均分最高的学生和平均分最低的学生并且输出。输入格式：输入n+1行，第一行输入一个正整数n，表示学生数量；接下来的n行每行输入5个数据，分别表示姓名、学号、英语成绩、数学成绩和C++成绩。注意成绩有可能会有小数。输出格式：输出两行，第一行输出平均成绩最高的学生姓名。第二行输出平均
【C++】动态规划从入门到精通諰. 动态规划 c++
一、动态规划基础概念详解什么是动态规划动态规划（DynamicProgramming，DP）是一种通过将复杂问题分解为重叠子问题，并存储子问题解以避免重复计算的优化算法。它适用于具有以下两个关键性质的问题：最优子结构：问题的最优解包含子问题的最优解重叠子问题：不同决策序列会重复求解相同的子问题下面用一些例子（由浅入深）了解动态规划1.1斐波那契数列递归实现解析intfib(intn){if(n>d
机器学习课堂4线性回归模型+特征缩放木尘152132 机器学习线性回归 python
一、实验2-2，线性回归模型，计算模型在训练数据集和测试数据集上的均方根误差代码：#2-2线性回归模型importpandasaspdimportnumpyasnpimportmatplotlib.pyplotasplt#参数设置iterations=3000#迭代次数learning_rate=0.0001#学习率m_train=3000#训练样本的数量flag_plot_lines=False
【存储中间件】Redis核心技术与实战（六）：Redis的设计与实现（缓存淘汰算法、过期策略与惰性删除）道友老李 #Redis核心技术与实战架构师进阶-存储中间件缓存中间件 redis
文章目录Redis的设计与实现缓存淘汰算法maxmemoryNoevictionvolatile-lruvolatile-ttlvolatile-randomallkeys-lruallkeys-randomLRU算法近似LRU算法LFU算法为什么Redis要缓存系统时间戳过期策略和惰性删除过期惰性删除lazyfree个人主页：道友老李欢迎加入社区：道友老李的学习社区Redis的设计与实现缓存淘汰
风控算法（一）——数据测试月亮月亮要去太阳机器学习人工智能
下面的内容都是针对数据源测试的一些可能得问题：1、请描述你在开发和执行数据测试流程时的具体步骤。确定样本（对齐样本与时间，去除假样本）——确定特征（确认目前特征）——数据信息（返回的数据字典、收费方式、底层数据：特征、分数）——数据清洗（缺失值替换）——数据训练形成报告。2、如何确定数据产品在风险模型中的潜在价值和适用性的？AUC、IV、相关性、性价比、数据产品背景和领域3、请详细描述你负责的10
12.1-12.7学习周报谢m鑫天天揍我学习
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录摘要Abstract一、k-近邻法二、持续学习总结摘要本周主要学习了k邻近算法的原理和应用场景，了解了持续学习的有关概念和原理。AbstractThisweek,wemainlylearnedtheprinciplesandapplicationscenariosofk-proximityalgorithm,andlearne
Adam-mini：深度学习内存效率新突破 XianxinMao 人工智能深度学习人工智能
标题：Adam-mini：深度学习内存效率新突破文章信息摘要：Adam-mini优化器在深度学习领域展现出突破性潜力，尤其在内存效率和计算性能上表现卓越。相比AdamW，Adam-mini将内存效率提升了一倍，并通过减少学习率数量显著降低了内存消耗，同时保持了与AdamW相当甚至更好的性能。在训练十亿参数级别的大语言模型（LLM）时，Adam-mini实现了49.6%的吞吐量提升，并减少了33%的
【机器学习】模型拟合 CH3_CH2_CHO 什么？！是机器学习！！机器学习人工智能欠拟合过拟合
1、欠拟合1.1现象欠拟合是机器学习和统计建模中的一种常见问题，表现为模型无法充分捕捉数据中的潜在规律和模式。无论是训练数据还是测试数据，模型的预测误差都居高不下。在实际应用中，欠拟合的模型往往显得过于简单和粗糙，无法对数据进行有效的拟合和描述。1.2原因模型过于简单是导致欠拟合的主要原因：例如，使用直线去拟合具有明显曲线趋势的数据，或者使用低阶多项式去拟合高阶的复杂函数关系。这种情况下，模型的表
【人工智能】注意力机制深入理解问道飞鱼机器学习与人工智能人工智能注意力机制
文章目录**一、注意力机制的核心思想****二、传统序列模型的局限性****三、Transformer与自注意力机制****1.自注意力机制的数学公式****四、注意力机制的关键改进****1.稀疏注意力（SparseAttention）****2.相对位置编码（RelativePositionEncoding）****3.图注意力网络（GraphAttentionNetwork,GAN）****
基本数据类型和引用类型的初始值 3213213333332132 java基础
package com.array; /** * @Description 测试初始值 * @author FuJianyong * 2015-1-22上午10:31:53 */ public class ArrayTest { ArrayTest at; String str; byte bt; short s; int i; long
摘抄笔记--《编写高质量代码：改善Java程序的151个建议》白糖_ 高质量代码
记得3年前刚到公司，同桌同事见我无事可做就借我看《编写高质量代码：改善Java程序的151个建议》这本书，当时看了几页没上心就没研究了。到上个月在公司偶然看到，于是乎又找来看看，我的天，真是非常多的干货，对于我这种静不下心的人真是帮助莫大呀。看完整本书，也记了不少笔记
【备忘】Django 常用命令及最佳实践 dongwei_6688 django
注意：本文基于 Django 1.8.2 版本生成数据库迁移脚本（python 脚本） python manage.py makemigrations polls 说明：polls 是你的应用名字，运行该命令时需要根据你的应用名字进行调整查看该次迁移需要执行的 SQL 语句（只查看语句，并不应用到数据库上）： python manage.p
阶乘算法之一N! 末尾有多少个零周凡杨 java 算法阶乘面试效率
&n
spring注入servlet g21121 Spring注入
传统的配置方法是无法将bean或属性直接注入到servlet中的，配置代理servlet亦比较麻烦，这里其实有比较简单的方法，其实就是在servlet的init()方法中加入要注入的内容： ServletContext application = getServletContext(); WebApplicationContext wac = WebApplicationContextUtil
Jenkins 命令行操作说明文档 510888780 centos
假设Jenkins的URL为http://22.11.140.38:9080/jenkins/ 基本的格式为 java 基本的格式为 java -jar jenkins-cli.jar [-s JENKINS_URL] command [options][args] 下面具体介绍各个命令的作用及基本使用方法 1. &nb
UnicodeBlock检测中文用法布衣凌宇 UnicodeBlock
/** * 判断输入的是汉字 */ public static boolean isChinese(char c) { Character.UnicodeBlock ub = Character.UnicodeBlock.of(c);
java下实现调用oracle的存储过程和函数 aijuans java orale
1.创建表：STOCK_PRICES 2.插入测试数据： 3.建立一个返回游标： PKG_PUB_UTILS 4.创建和存储过程：P_GET_PRICE 5.创建函数： 6.JAVA调用存储过程返回结果集 JDBCoracle10G_INVO
Velocity Toolbox antlove 模板 tool box velocity
velocity.VelocityUtil package velocity; import org.apache.velocity.Template; import org.apache.velocity.app.Velocity; import org.apache.velocity.app.VelocityEngine; import org.apache.velocity.c
JAVA正则表达式匹配基础百合不是茶 java 正则表达式的匹配
正则表达式;提高程序的性能,简化代码,提高代码的可读性,简化对字符串的操作正则表达式的用途; 字符串的匹配字符串的分割字符串的查找字符串的替换正则表达式的验证语法 [a] //[]表示这个字符只出现一次 ,[a] 表示a只出现一
是否使用EL表达式的配置 bijian1013 jsp web.xml EL EasyTemplate
今天在开发过程中发现一个细节问题，由于前端采用EasyTemplate模板方法实现数据展示，但老是不能正常显示出来。后来发现竟是EL将我的EasyTemplate的${...}解释执行了，导致我的模板不能正常展示后台数据。网
精通Oracle10编程SQL(1-3)PLSQL基础 bijian1013 oracle 数据库 plsql
--只包含执行部分的PL/SQL块 --set serveroutput off begin dbms_output.put_line('Hello,everyone!'); end; select * from emp; --包含定义部分和执行部分的PL/SQL块 declare v_ename varchar2(5); begin select
【Nginx三】Nginx作为反向代理服务器 bit1129 nginx
Nginx一个常用的功能是作为代理服务器。代理服务器通常完成如下的功能：接受客户端请求将请求转发给被代理的服务器从被代理的服务器获得响应结果把响应结果返回给客户端实例本文把Nginx配置成一个简单的代理服务器对于静态的html和图片，直接从Nginx获取对于动态的页面，例如JSP或者Servlet，Nginx则将请求转发给Res
Plugin execution not covered by lifecycle configuration: org.apache.maven.plugin blackproof maven 报错
转：http://stackoverflow.com/questions/6352208/how-to-solve-plugin-execution-not-covered-by-lifecycle-configuration-for-sprin maven报错： Plugin execution not covered by lifecycle configuration:
发布docker程序到marathon ronin47 docker 发布应用
1 发布docker程序到marathon 1.1 搭建私有docker registry 1.1.1 安装docker regisry docker pull docker-registry docker run -t -p 5000:5000 docker-registry 下载docker镜像并发布到私有registry docker pull consol/tomcat-8.0
java-57-用两个栈实现队列&&用两个队列实现一个栈 bylijinnan java
import java.util.ArrayList; import java.util.List; import java.util.Stack; /* * Q 57 用两个栈实现队列 */ public class QueueImplementByTwoStacks { private Stack<Integer> stack1; pr
Nginx配置性能优化 cfyme nginx
转载地址：http://blog.csdn.net/xifeijian/article/details/20956605 大多数的Nginx安装指南告诉你如下基础知识——通过apt-get安装，修改这里或那里的几行配置，好了，你已经有了一个Web服务器了。而且，在大多数情况下，一个常规安装的nginx对你的网站来说已经能很好地工作了。然而，如果你真的想挤压出Nginx的性能，你必
[JAVA图形图像]JAVA体系需要稳扎稳打,逐步推进图像图形处理技术 comsci java
对图形图像进行精确处理，需要大量的数学工具，即使是从底层硬件模拟层开始设计，也离不开大量的数学工具包，因为我认为，JAVA语言体系在图形图像处理模块上面的研发工作，需要从开发一些基础的，类似实时数学函数构造器和解析器的软件包入手，而不是急于利用第三方代码工具来实现一个不严格的图形图像处理软件...... &nb
MonkeyRunner的使用 dai_lm android MonkeyRunner
要使用MonkeyRunner，就要学习使用Python，哎先抄一段官方doc里的代码作用是启动一个程序（应该是启动程序默认的Activity），然后按MENU键，并截屏 # Imports the monkeyrunner modules used by this program from com.android.monkeyrunner import MonkeyRun
Hadoop-- 海量文件的分布式计算处理方案 datamachine mapreduce hadoop 分布式计算
csdn的一个关于hadoop的分布式处理方案，存档。原帖：http://blog.csdn.net/calvinxiu/article/details/1506112。 Hadoop 是Google MapReduce的一个Java实现。MapReduce是一种简化的分布式编程模式，让程序自动分布到一个由普通机器组成的超大集群上并发执行。就如同ja
以資料庫驗證登入 dcj3sjt126com yii
以資料庫驗證登入由於 Yii 內定的原始框架程式, 採用綁定在UserIdentity.php 的 demo 與 admin 帳號密碼: public function authenticate() { $users=array( &nbs
github做webhooks：[2]php版本自动触发更新 dcj3sjt126com github git webhooks
上次已经说过了如何在github控制面板做查看url的返回信息了。这次就到了直接贴钩子代码的时候了。工具/原料 git github 方法/步骤在github的setting里面的webhooks里把我们的url地址填进去。钩子更新的代码如下： error_reportin
Eos开发常用表达式蕃薯耀 Eos开发 Eos入门 Eos开发常用表达式
Eos开发常用表达式 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2014年8月18日 15:03:35 星期一 &
SpringSecurity3.X--SpEL 表达式 hanqunfeng SpringSecurity
使用 Spring 表达式语言配置访问控制，要实现这一功能的直接方式是在<http>配置元素上添加 use-expressions 属性： <http auto-config="true" use-expressions="true"> 这样就会在投票器中自动增加一个投票器：org.springframework
Redis vs Memcache IXHONG redis
1. Redis中，并不是所有的数据都一直存储在内存中的，这是和Memcached相比一个最大的区别。 2. Redis不仅仅支持简单的k/v类型的数据，同时还提供list，set，hash等数据结构的存储。 3. Redis支持数据的备份，即master-slave模式的数据备份。 4. Redis支持数据的持久化，可以将内存中的数据保持在磁盘中，重启的时候可以再次加载进行使用。 Red
Python - 装饰器使用过程中的误区解读 kvhur JavaScript jquery html5 css
大家都知道装饰器是一个很著名的设计模式，经常被用于AOP(面向切面编程)的场景，较为经典的有插入日志，性能测试，事务处理，Web权限校验， Cache等。原文链接：http://www.gbtags.com/gb/share/5563.htm Python语言本身提供了装饰器语法（@），典型的装饰器实现如下： @function_wrapper de
架构师之mybatis-----update 带case when 针对多种情况更新 nannan408 case when
1.前言. 如题. 2. 代码. <update id="batchUpdate" parameterType="java.util.List"> <foreach collection="list" item="list" index=&
Algorithm算法视频教程栏目记者 Algorithm 算法
课程：Algorithm算法视频教程百度网盘下载地址： http://pan.baidu.com/s/1qWFjjQW 密码: 2mji 程序写的好不好,还得看算法屌不屌！Algorithm算法博大精深。一、课程内容：课时1、算法的基本概念 + Sequential search 课时2、Binary search 课时3、Hash table 课时4、Algor
C语言算法之冒泡排序 qiufeihu c 算法
任意输入10个数字由小到大进行排序。代码： #include <stdio.h> int main() { int i,j,t,a[11]; /*定义变量及数组为基本类型*/ for(i = 1;i < 11;i++){ scanf("%d",&a[i]); /*从键盘中输入10个数*/ } for
JSP异常处理 wyzuomumu Web jsp
1.在可能发生异常的网页中通过指令将HTTP请求转发给另一个专门处理异常的网页中: <%@ page errorPage="errors.jsp"%> 2.在处理异常的网页中做如下声明： errors.jsp: <%@ page isErrorPage="true"%>，这样设置完后就可以在网页中直接访问exc