米法·

因果推断学习笔记二

因果推断区别于传统的相关性研究很重要的一点是潜在结果框架, 也就是我们今天的topic所要涵盖的内容。今天的session我们将会cover以下几个话题：

什么是潜在结果

因果推断的核心问题

对于核心问题的讨论和答案

完整的实例

一、潜在结果

研究treatment对于结果的影响，我们想要同时知道同等条件下，不同treatment下的结果，从而能够得出结论，treatment的改变是否会导致结果的不同

例如
a) 吃药不吃药对于头痛个体(吃药前头痛)的影响

不吃药头痛，吃药之后不头痛：有因果效应
不吃药不头痛，吃药后不头痛：没有因果效应

1.1 符号说明

我们先约定一下此次课程中所提到的符号，借助这些符号，把上面的因果效应的讨论抽象成数学公式。

随机变量 $X$ 表示 $d$ 维的协变量(covariate)

$T$ 表示干预(treatment)
$Y$ 表示观测到的结果(observed outcome)，我们今天讨论的是二元treatment，也就是 $T = 0$ 或者 $T = 1$

$i$ 表示第 $i$ 个样本(sample/unit/individual)

$Y_i(T)$ 表示对于样本 $i$ 来说接受treatment T之后的潜在结果(potential outcome)，比如 $Y_i(1), Y_i(0)$

$Y_i(1)-Y_i(0)$ 表示因果效应

1.2 因果推断的核心问题

对于潜在结果， ${Y_i(1), Y_i(0)\}$ 中只会有一个被观测到，因果效应ground truth缺失。实际观测到的结果，只可能是潜在结果中唯一的一个，被称为factual outcome，另一个观测不到的被称为counterfactual。例如前面的例子中提到的对于一个头痛个体，treatment只能二选一，而不能同时给予两个treatment，

      i.   吃药，factual是吃药的结果

      ii.  不吃药，factual是不吃药带来的结果

再举个例子：

滴滴向用户随机发送推荐短信(干预)，用户要么收到短信，要么收不到，这时候用户的反应，只能是其中一种情形下的结果，而不可能是两个结果。对于此短信的反应的实际结果只能依赖于二选一的干预，而不能看到干预和不干预下的用户分别的反应。

基于潜在结果模型，我们感兴趣的是平均因果效应(Average treatment effect，简记为ATE)

$A T E : E [Y (1) - Y (0)] = E [Y (1)] - E [Y (0)]$
在大数据时代和统计学中经典的大数定律，使我们能够利用大样本平均来估计平均因果效应。

但与此同时，如下图表格中所示，对于每个样本来说， $Y (1)$ 和 $Y (0)$ 是潜在结果， $Y (1) - Y (0)$ 没有真实的值，分布未可知，无法用统计学方法去估计。

而对于 $E [Y (1)]$ 和 $E [Y (0)]$ ， $Y_i(1)$ 是潜在结果，它们之间并不是独立同分布的，没有任何假设，利用大样本直接求平均来估计 $E [Y (1)]$ 是不对的（大数定律要求数据是独立同分布的）。

因此为了估计左边的 $A T E,$ 需要把它转换成右边随机变量 $Y$ 关于 $T$ 的分布, 给定 $T$ ，也就是右边的 $Y$ 和 $T$ 之间的相关性模型，从而在随机变量 $(X, T, Y)$ 上我们能够定义分布的，可以用大数定律或者统计模型求解。

因此核心在于通过设置合理的假设，在 $E [Y (1)] - E [Y (0)] = E [Y ∣ T = 1] - E [Y ∣ T = 0]$ 左右两边建立等号，也就是接下来我们课程的重点讨论对象。

通过上面的讨论，我们了解到，潜在结果决定了相关性关系(右边)并不等价于因果关系(左边)

举个通俗的例子：穿鞋子睡觉和起床头疼有强相关关系，但是不一定会有因果关系，可能真正的原因比如，前一天晚上喝酒，这种情况下喝酒就是混淆变量(confounding)，也就是既会影响treatment，又会影响结果；再比如，穿鞋子和不穿鞋子的人群不一样，有显著的差别，这两组接受穿鞋子treatment的人群是不可比的(non-overlapping)，比如穿鞋子睡觉的绝大多数可能都是喝醉的人，而不穿鞋子睡觉中绝大多数都是清醒的人，从而两个人群是不一致的。可比的人群应该是：穿鞋子和不穿鞋子的人群里面的喝酒的人以及清醒的人分布是一致的

再举个例子：冰激凌涨价和雪山融化有相关关系，但没有因果关系，冰激凌涨价不会引起雪山融化，但是他们都通过天气变热联系起来。天气变热导致冰激凌涨价(影响treatment)，同时也会导致雪山融化(影响结果)，它就是一个混淆变量。

1.3 两个假设

1.3.1 Ignorability假设

为了从因果性模型转换到相关性模型，从confounding出发，我们考虑如下三个等价的假设

Ignorability
exchangability
unconfoundedness

Ignorability名字的由来是加了这个假设之后，潜在结果中的question Marks可以直接忽略，或者说counterfactual outcome可以忽略，从而能够取实际的观测结果来估计。严格来说，Ignorability指潜在结果与实际的treatment的分配无关，如果有confounding的话，即既会影响treatment，又会影响结果，就比如在如下的因果图中所示，潜在结果会和treatment之间有额外的confounding的通道，从而潜在结果和treatment不能保持独立。因此ignorability保证了unconfoundedness。，即没有混淆变量的影响

Exchangeability: 接受treatment和不接受treatment的组别之间是可以交换的

$E [Y (1)] - E [Y (0)]$

$= P (T = 1) E [Y (1) ∣ T = 1] + P (T = 0) E [Y (1) ∣ T = 0] - (P (T = 0) E [Y (0) ∣ T = 0] + P (T = 1) E [Y (0) ∣ T = 1])$

$=(P(T=1)+P(T=0))\times E[Y(1)|T=1] – (P(T=1)+P(T=0))\times E[Y(0)|T=0]$

$= E [Y (1) ∣ T = 1] - E [Y (0) ∣ T = 0]$

上述的推导证明了Ignorability 和exchangability 这两种说法是等价的，都能够通过去除confounding来去除掉treatment对于潜在的结果的影响。

1.3.2 consistency假设

除了ignorability, 我们还需要假设：consistency

接受的treatment唯一确定结果
T = t 代表观测到的Y就是基于t的潜在结果

Along with consistency, 我们还需要额外的假设

没有干扰(No interference)
对于第i个样本来说，ta自己的treatment唯一的确定了结果，别的样本的treatment对于其最终的结果没有影响，比如在如下狗狗的例子中，我是否快乐其实只与我自己的treatment(自己有狗狗)有关，而与别的treatment(朋友有没有狗狗)无关，样本i不受其他的treatment的干扰。

综合以上ignorability, consistency, no interference假设，我们可以得到ATE的调整公式：

$E [Y (1)] - E [Y (0)]$ (no interference)

$= E [Y (1) ∣ T = 1] - E [Y (0) ∣ T = 0]$ (Ignorability)

$= E [Y ∣ T = 1] - E [Y ∣ T = 0]$ (consistenty)

一个很自然的问题是，是不是这两个假设总能成立？答案是it depends。

首先我们先讨论ignorability。对于Randomized Control Trial(RCT)，比如通过抛硬币来决定随机给予treatment(穿鞋子睡觉，不穿鞋子睡觉)，这个假设就是成立的，没有混淆变量喝酒，喝酒和清醒的人在treatment间没有差异，潜在结果和treatment独立。

那么什么时候这个假设不成立呢？

举个例子：在滴滴，通过日志拿到的数据是观测数据，用户接受的treatment已经是通过乘客模型和策略调节过的，已经不再满足ignorability。

接下来我们讨论consistency的假设，它也不总是成立。

举个例子： ${T=1}$ 代表有狗狗，那么只要有狗狗，最终个体的结果Y就是基于有狗狗的结果——快乐, 而与狗狗的品类无关。如下图所示，就是一个不满足consistency的例子，最终的结果不只取决于实际接受的treatment，还可能收到别的干扰。

再来一个例子：在滴滴，比如给司机补贴，司机会决定接不接单，这个结果不只取决于给司机本人的treatment，还可能会受到司机周围的司机所受到的补贴的影响，这个时候consistency就不能得到满足。

ignorability和consistency，no interference使我们能够在 $A T E$ 的左右两端建立等号，也就能够通过统计学的方法去估计因果效应，这个过程被称作identifiation。如果一个因果目标，可以通过统计分布估计得到，这个因果quantity就是可识别的(identifiable)，比如ate，以及接下来我们更感兴趣的cate。添加假设建立等式的过程就是identification。

identification：从因果量到统计量，把个体效应的因果模型转换到可估计的相关性模型

二、CATE

通常情况下，考虑异质性的因果效应可以给我们更多的信息，能够从协变量(individual)层面更加细致的区分因果效应, heterogeneous treatment effect(hte)，conditional average treatment effect (cate) 或者等价的 individual treatment effect(ite)

定义 E[Y(1)-Y(0)|X]
identification

$E [Y (1) - Y (0) ∣ X]$ (no interference)

? $= E [Y (1) ∣ T = 1, X] - E [Y (0) ∣ T = 0, X]$ (？假设)

? $= E [Y ∣ T = 1, X] - E [Y ∣ T = 0, X]$ (consistency)

2.1 两个假设

2.1.1 conditional ignorability

核心假设：等价的假设

conditional ignorability
conditional exchangeability
unfoundedness

这里的conditional ignorability指的是给定协变量covariate，潜在结果与treatment无关，也就是基于covariate的条件独立，反映在因果图上就是切断给定协变量，outcome和treatment之间由于潜在的confounding而可能存在的的联系。引入conditional ignorability或者conditional exchangability的原因在于，unconfoundedness是没有办法实际中验证的，因为我们不知道是否有未观测到的confounding，而这些很可能会在treatment和outcome之间建立别的通道。

2.1.2 Positivity

不同于 $A T E$ , $C A T E$ 的估计还需要额外的假设：正定性(Positivity)

正定性(Positivity)定义：

离散treatment: 概率 $P (T ∣ X) > 0$ ，给定协变量之后任意treatment的概率都严格大于0，
也就是通常所说的倾向性评分(propensity score)严格大于0

连续treatment: 更严格的要求generalized propensity score概率密度 $p (T ∣ X) > 0$

Mathematical formulation（数学公式）

从 $C A T E$ 的计算公式出发，可以得到propensity score是作为分母中的一项，若为0，则该计算表达式无定义，从而无法计算得到cate或者ate

直观解释：Overlap

Positivity保证了 ${T=1}$ 和 ${T=0}$ 的人群是完全重合的。如果有positivity violation(违反)的话，比如说关于第一维协变量人群有50%的重合，这样子随着协变量维数d的增加，重合的部分会逐渐的减小，衰减直至人群几乎无重合 $0.5)^d ～ 0$ ，也就是通常所说的维数灾难(curse of dimensionality)

3. 外推能力：

Positivity violation会带来模型外推能力的变差

如下图所示，在identification之后得到的统计估计中， $T = 1$ 建模得到的模型不能迁移到另一个 $T = 0$ ，因为数据之间的gap，因此计算得到cate可能是有偏差的

still，有没有不满足positivity的情形呢？

举个例子：

在滴滴，定价策略基础调节，基于城市粒度调节，对于城市的所有人，treatment都是调价，没有不调价的，那么P(T=1|X) = 1, P(T=0|X) = 0, positivy就不满足

2.2 causal quantity和statistical quantity之间的等式

有了这两个假设，就能够如下图所示，建立causal quantity和statistical quantity之间的等式

cate identification
by-product: 得到基于个体水平的因果效应 $C A T E$ 之后，依据双期望定理(条件期望的期望是无条件期望)，我们依旧可以得到 $A T E$ ，也就是总体水平的因果效应

2.3 总结

2.3.1 假设

因为潜在结果，因果模型推断估计CATE/ATE所需要的假设

Conditional Ignorability / Ignorability
Positivity/NA
Consistency/Consistency
No interference/No interference

2.3.2 依赖的数学定理

Linearity of expectation（期望的线形性质）
The overall expectation can be computed by taking expectation on conditional expectation（重期望定理）

更加general的统计学名词clarification

Estimand是任何想要去估计的量
Estimate是基于数据的统计量，可作为estimand的估计
Estimation指的是从得到数据，得到统计量去估计estimand的过程

Potential outcome framework决定了causal estimand是不能直接估计的。本次session讨论的以上假设都是在把一个causal estimand转化成一个统计学的estimand，从而可以利用统计学的estimation获取得到相应的estimate，也就是如下所示的identification-estimation flowchart。如何去做有效的estimation，比如减小方差和减小bias，提高模型准确度，是因果推断中的另一重点和算法聚焦。

三、实例

基于potential outcome framework，我们以下面的一个因果推断的实例，展示一个从identification到用estimation来估计 $A T E$ 的链路。

3.1背景

46%的美国人有高血压，高血压和死亡率的增加相关，因此想要研究钠的摄入对于高血压的影响(effect)。

数据主要的notation为:

Y: 血压;
T: 钠的摄入;
X: 年龄和流失的蛋白质。

3.2 估计

Causal Estimand: ATE = E[Y(1)-Y(0)]

Identifiacation: 该实例是仿真数据集，满足conditional ignorability,positivity; consistency, 同时真实的ATE已知，我们可以从中检验模型的准确度

Estimation:

outcome对于样本关于treatment和covariate进行线性回归, 得到cate的相关性模型； Ate的计算通过对cate按照样本的分布来估计，通常假设样本是i.i.d.分布的，从而可以通过大数定律来得到ate的估计值(直接取平均得到), 计算得到的ate和真实的ate差别较小
另一种可能的办法：直接outcome关于treatment回归，计算得到ate，但这种方法计算得到的ate和真实值的mape误差很大
从而验证了在因果模型中加入异质性的重要性，也就是如上讨论cate的估计。

$Y = a T + b X$
$Y = a T$

3.3 思考以及展望:

以上具体实例中，estimation采用线性回归的相关性模型，会有一些缺陷，比如说对于所有的个体而言，他们的因果效应都是线性模型中treatmentT的斜率，a是一样的，在很多时候是不符合常理的，不能区分异质水平上的因果效应。更加advanced的拓展方法可参考：

最后，我们在本节课程中主要讨论了二元treatment下的潜在因果，潜在因果模型的框架需要identification，同时也为后面的statistical estimation提供了不一样的评价体系，比如qini score，区别于传统统计学习的mse。更重要的是，同样的逻辑可以轻松的拓展到多元treatment潜在结果模型和连续treatment潜在结果模型，通过添加合理(更强)的假设，也可以完成identification，转换到statistical estimation，通过更加复杂的算法来得到相应的estimate。

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
遥感影像的切片处理 sand&wich 计算机视觉 python 图像处理
在遥感影像分析中，经常需要将大尺寸的影像切分成小片段，以便于进行详细的分析和处理。这种方法特别适用于机器学习和图像处理任务，如对象检测、图像分类等。以下是如何使用Python和OpenCV库来实现这一过程，同时确保每个影像片段保留正确的地理信息。准备环境首先，确保安装了必要的Python库，包括numpy、opencv-python和xml.etree.ElementTree。这些库将用于图像处理
ai绘画工具midjourney怎么下载？附作品管理教程设计师早上好
Midjourney是一款功能强大的AI绘画工具，它使用机器学习技术和深度神经网络等算法，可以生成各种艺术风格的绘画作品。在创意设计、广告宣传等方面有着广泛的应用前景。那么，ai绘画工具midjourney怎么下载？本文将为您介绍Midjourney的下载以及作品的相关管理。一、Midjourney下载Midjourney的下载非常简单，只需打开Midjourney官网（点击“GetMidjour
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
机器学习-聚类算法不良人龍木木机器学习机器学习算法聚类
机器学习-聚类算法1.AHC2.K-means3.SC4.MCL仅个人笔记，感谢点赞关注！1.AHC2.K-means3.SC传统谱聚类：个人对谱聚类算法的理解以及改进4.MCL目前仅专注于NLP的技术学习和分享感谢大家的关注与支持！
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
python中zeros用法_Python中的numpy.zeros()用法江平舟 python中zeros用法
numpy.zeros()函数是最重要的函数之一,广泛用于机器学习程序中。此函数用于生成包含零的数组。numpy.zeros()函数提供给定形状和类型的新数组,并用零填充。句法numpy.zeros(shape,dtype=float,order='C'参数形状：整数或整数元组此参数用于定义数组的尺寸。此参数用于我们要在其中创建数组的形状,例如(3,2)或2。dtype：数据类型(可选)此参数用于
【NumPy】深入解析numpy.zeros()函数二七830 numpy
欢迎莅临我的个人主页这里是我深耕Python编程、机器学习和自然语言处理（NLP）领域，并乐于分享知识与经验的小天地！博主简介：我是二七830，一名对技术充满热情的探索者。多年的Python编程和机器学习实践，使我深入理解了这些技术的核心原理，并能够在实际项目中灵活应用。尤其是在NLP领域，我积累了丰富的经验，能够处理各种复杂的自然语言任务。技术专长：我熟练掌握Python编程语言，并深入研究了机
【中国国际航空-注册_登录安全分析报告】风控牛验证码接口安全评测系列安全行为验证极验网易易盾智能手机
前言由于网站注册入口容易被黑客攻击，存在如下安全问题：1.暴力破解密码，造成用户信息泄露2.短信盗刷的安全问题，影响业务及导致用户投诉3.带来经济损失，尤其是后付费客户，风险巨大，造成亏损无底洞所以大部分网站及App都采取图形验证码或滑动验证码等交互解决方案，但在机器学习能力提高的当下，连百度这样的大厂都遭受攻击导致点名批评，图形验证及交互验证方式的安全性到底如何？请看具体分析一、中国国际航空PC
机器学习流形数据降维：UMAP 降维算法小嗷犬 Python 机器学习 #数据分析及可视化机器学习算法人工智能
✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。个人主页：小嗷犬的个人主页个人网站：小嗷犬的技术小站个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。本文目录UMAP简介理论基础特点与优势应用场景在Python中使用UMAP安装umap-learn库使用UMAP可视化手写数字数据集UMAP简介UMAP（UniformManifoldApproximatio
七.正则化愿风去了
吴恩达机器学习之正则化（Regularization）http://www.cnblogs.com/jianxinzhou/p/4083921.html从数学公式上理解L1和L2https://blog.csdn.net/b876144622/article/details/81276818虽然在线性回归中加入基函数会使模型更加灵活，但是很容易引起数据的过拟合。例如将数据投影到30维的基函数上，模
机器学习-------数据标准化罔闻_spider 数据分析算法机器学习人工智能
什么是归一化，它与标准化的区别是什么？一作用在做训练时，需要先将特征值与标签标准化，可以防止梯度防炸和过拟合；将标签标准化后，网络预测出的数据是符合标准正态分布的—StandarScaler()，与真实值有很大差别。因为StandarScaler()对数据的处理是（真实值-平均值）/标准差。同时在做预测时需要将输出数据逆标准化提升模型精度：标准化/归一化使不同维度的特征在数值上更具比较性，提高分类
分享一个基于python的电子书数据采集与可视化分析 hadoop电子书数据分析与推荐系统 spark大数据毕设项目（源码、调试、LW、开题、PPT) 计算机源码社 Python项目大数据大数据 python hadoop 计算机毕业设计选题计算机毕业设计源码数据分析 spark毕设
作者：计算机源码社个人简介：本人八年开发经验，擅长Java、Python、PHP、.NET、Node.js、Android、微信小程序、爬虫、大数据、机器学习等，大家有这一块的问题可以一起交流！学习资料、程序开发、技术解答、文档报告如需要源码，可以扫取文章下方二维码联系咨询Java项目微信小程序项目Android项目Python项目PHP项目ASP.NET项目Node.js项目选题推荐项目实战|p
两种方法判断Python的位数是32位还是64位 sanqima Python编程电脑 python 开发语言
Python从1991年发布以来，凭借其简洁、清晰、易读的语法、丰富的标准库和第三方工具，在Web开发、自动化测试、人工智能、图形识别、机器学习等领域发展迅猛。 Python是一种胶水语言，通过Cython库与C/C++语言进行链接，通过Jython库与Java语言进行链接。 Python是跨平台的，可运行在多种操作系统上，包括但不限于Windows、Linux和macOS。这意味着用Py
使用最大边际相关性(MMR)选择示例：提高AI模型的多样性和相关性 aehrutktrjk 人工智能 easyui 前端 python
使用最大边际相关性(MMR)选择示例：提高AI模型的多样性和相关性引言在机器学习和自然语言处理领域，选择合适的训练示例对模型性能至关重要。最大边际相关性(MaximalMarginalRelevance,MMR)是一种优秀的示例选择方法，它不仅考虑了示例与输入的相关性，还注重保持所选示例之间的多样性。本文将深入探讨如何使用MMR来选择示例，以提高AI模型的性能和泛化能力。什么是最大边际相关性(MM
LangChain集成指南:如何利用多样化的AI提供商 aehrutktrjk 人工智能 langchain python
LangChain集成指南:如何利用多样化的AI提供商引言在人工智能和机器学习领域,LangChain已成为一个强大而灵活的框架,允许开发者轻松集成各种AI服务提供商。本文将深入探讨LangChain的集成能力,介绍如何利用不同的AI提供商来增强你的应用程序,并提供实用的代码示例。LangChain集成概览LangChain支持多种AI提供商的集成,这些集成可以分为两类:独立包集成:这些提供商有独
机器学习VS深度学习 nfgo 机器学习
机器学习（MachineLearning,ML）和深度学习（DeepLearning,DL）是人工智能（AI）的两个子领域，它们有许多相似之处，但在技术实现和应用范围上也有显著区别。下面从几个方面对两者进行区分：1.概念层面机器学习：是让计算机通过算法从数据中自动学习和改进的技术。它依赖于手动设计的特征和数学模型来进行学习，常用的模型有决策树、支持向量机、线性回归等。深度学习：是机器学习的一个子领
大数据毕业设计hadoop+spark+hive知识图谱租房数据分析可视化大屏租房推荐系统 58同城租房爬虫房源推荐系统房价预测系统计算机毕业设计机器学习深度学习人工智能 2401_84572577 程序员大数据 hadoop 人工智能
做了那么多年开发，自学了很多门编程语言，我很明白学习资源对于学一门新语言的重要性，这些年也收藏了不少的Python干货，对我来说这些东西确实已经用不到了，但对于准备自学Python的人来说，或许它就是一个宝藏，可以给你省去很多的时间和精力。别在网上瞎学了，我最近也做了一些资源的更新，只要你是我的粉丝，这期福利你都可拿走。我先来介绍一下这些东西怎么用，文末抱走。（1）Python所有方向的学习路线（
【机器学习与R语言】1-机器学习简介苹果酱0567 面试题汇总与解析 java 中间件开发语言 spring boot 后端
1.基本概念机器学习：发明算法将数据转化为智能行为数据挖掘VS机器学习：前者侧重寻找有价值的信息，后者侧重执行已知的任务。后者是前者的先期准备过程：数据——>抽象化——>一般化。或者：收集数据——推理数据——归纳数据——发现规律抽象化：训练：用一个特定模型来拟合数据集的过程用方程来拟合观测的数据：观测现象——数据呈现——模型建立。通过不同的格式来把信息概念化一般化：一般化：将抽象化的知识转换成可用
Python前沿技术：机器学习与人工智能 4.0啊 Python 人工智能 python 机器学习
Python前沿技术：机器学习与人工智能一、引言随着科技的飞速发展，机器学习和人工智能（AI）已经成为了计算机科学领域的热门话题。Python作为一门易学易用且功能强大的编程语言，已经成为了这两个领域的首选语言之一。本文将深入探讨Python在机器学习和人工智能领域的应用，以及一些前沿技术和工具。二、Python机器学习基础2.1机器学习概述机器学习是人工智能（AI）的一个关键子集，它的核心在于让
chatgpt赋能python：如何在Python中计算平均值 tulingtest ChatGpt python chatgpt numpy 计算机
如何在Python中计算平均值计算平均值是数据分析、统计和机器学习等许多领域中的常见任务。Python作为一门功能强大且易于学习的编程语言，为计算平均值提供了多种方法。在本文中，我们将介绍如何在Python中计算平均值。什么是平均值简单来说，平均值是一组数字的总和除以数字的数量。例如，对于数字序列1，3，5，7，9，平均值是(1+3+5+7+9)/5=5。平均值在数据分析中非常有用，因为它可以提供
Python 初学者入门必知： Anaconda是什么？有什么作用？怎么使用？懒大王爱吃狼 Python基础 python 开发语言 python基础 python学习 anaconda anaconda安装 python教程
初学者在学习Python时，经常看到的一个名字是Anaconda。究竟什么是Anaconda，为什么它如此受欢迎？在这篇文章中，我们将探讨Anaconda，了解Anaconda的从安装到使用的。Anaconda是一个免费开源的Python和R编程发行版，包含上千个适用于数据科学和机器学习的包。同时，配备了Spyder和Jupyternotebook等工具，初学者可以使用它们来学习Python，使用
每天五分钟玩转深度学习PyTorch：模型参数优化器torch.optim 幻风_huanfeng 深度学习框架pytorch 深度学习 pytorch 人工智能神经网络机器学习优化算法
本文重点在机器学习或者深度学习中，我们需要通过修改参数使得损失函数最小化(或最大化)，优化算法就是一种调整模型参数更新的策略。在pytorch中定义了优化器optim，我们可以使用它调用封装好的优化算法，然后传递给它神经网络模型参数，就可以对模型进行优化。本文是学习第6步(优化器)，参考链接pytorch的学习路线随机梯度下降算法在深度学习和机器学习中，梯度下降算法是最常用的参数更新方法，它的公式
一切皆是映射：AI的去中心化：区块链技术的融合 AI大模型应用之禅计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
一切皆是映射：AI的去中心化：区块链技术的融合作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming关键词：AI，区块链，去中心化，智能合约，共识机制，数据安全，隐私保护，分布式账本技术，机器学习，数据隐私1.背景介绍1.1问题的由来随着人工智能（AI）技术的快速发展，其在各个领域的应用越来越广泛，从自动驾驶、智能医疗到金融服务，AI正在改变着我们的生活。
第五届核磁机器学习班（训练营：2023.6.5~6.17）茗创科技
茗创科技专注于脑科学数据处理，涵盖（EEG/ERP,fMRI,结构像,DTI,ASL,FNIRS）等，欢迎留言讨论及转发推荐，也欢迎了解茗创科技的脑电课程，数据处理服务及脑科学工作站销售业务，可添加我们的工程师（微信号MCKJ-zhouyi或17373158786）咨询。★课程简介★基于血氧水平依赖的功能磁共振成像(fMRI)技术,利用其数据构建的功能性脑网络后,发现脑并不是一个单纯对外界刺激进行
如何有效的学习AI大模型？ Python程序员罗宾学习人工智能语言模型自然语言处理架构
学习AI大模型是一个系统性的过程，涉及到多个学科的知识。以下是一些建议，帮助你更有效地学习AI大模型：基础知识储备：数学基础：学习线性代数、概率论、统计学和微积分等，这些是理解机器学习算法的数学基础。编程技能：掌握至少一种编程语言，如Python，因为大多数AI模型都是用Python实现的。理论学习：机器学习基础：了解监督学习、非监督学习、强化学习等基本概念。深度学习：学习神经网络的基本结构，如卷
SAX解析xml文件小猪猪08 xml
1.创建SAXParserFactory实例 2.通过SAXParserFactory对象获取SAXParser实例 3.创建一个类SAXParserHander继续DefaultHandler，并且实例化这个类 4.SAXParser实例的parse来获取文件 public static void main(String[] args) { //
为什么mysql里的ibdata1文件不断的增长？ brotherlamp linux linux运维 linux资料 linux视频 linux运维自学
我们在 Percona 支持栏目经常收到关于 MySQL 的 ibdata1 文件的这个问题。当监控服务器发送一个关于 MySQL 服务器存储的报警时，恐慌就开始了 —— 就是说磁盘快要满了。一番调查后你意识到大多数地盘空间被 InnoDB 的共享表空间 ibdata1 使用。而你已经启用了 innodbfileper_table，所以问题是： ibdata1存了什么？当你启用了 i
Quartz-quartz.properties配置 eksliang quartz
其实Quartz JAR文件的org.quartz包下就包含了一个quartz.properties属性配置文件并提供了默认设置。如果需要调整默认配置，可以在类路径下建立一个新的quartz.properties，它将自动被Quartz加载并覆盖默认的设置。下面是这些默认值的解释 #-----集群的配置 org.quartz.scheduler.instanceName =
informatica session的使用 18289753290 workflow session log Informatica
如果希望workflow存储最近20次的log，在session里的Config Object设置，log options做配置，save session log :sessions run ;savesessio log for these runs:20 session下面的source 里面有个tracing
Scrapy抓取网页时出现CRC check failed 0x471e6e9a != 0x7c07b839L的错误酷的飞上天空 scrapy
Scrapy版本0.14.4 出现问题现象： ERROR: Error downloading <GET http://xxxxx CRC check failed 解决方法 1.设置网络请求时的header中的属性'Accept-Encoding': '*;q=0' 明确表示不支持任何形式的压缩格式，避免程序的解压
java Swing小集锦永夜-极光 java swing
1.关闭窗体弹出确认对话框 1.1 this.setDefaultCloseOperation (JFrame.DO_NOTHING_ON_CLOSE); 1.2 this.addWindowListener ( new WindowAdapter () { public void windo
强制删除.svn文件夹随便小屋 java
在windows上，从别处复制的项目中可能带有.svn文件夹，手动删除太麻烦，并且每个文件夹下都有。所以写了个程序进行删除。因为.svn文件夹在windows上是只读的，所以用File中的delete()和deleteOnExist()方法都不能将其删除，所以只能采用windows命令方式进行删除
GET和POST有什么区别？及为什么网上的多数答案都是错的。 aijuans get post
如果有人问你，GET和POST，有什么区别？你会如何回答？我的经历前几天有人问我这个问题。我说GET是用于获取数据的，POST，一般用于将数据发给服务器之用。这个答案好像并不是他想要的。于是他继续追问有没有别的区别？我说这就是个名字而已，如果服务器支持，他完全可以把G
谈谈新浪微博背后的那些算法 aoyouzi 谈谈新浪微博背后的那些算法
本文对微博中常见的问题的对应算法进行了简单的介绍，在实际应用中的算法比介绍的要复杂的多。当然，本文覆盖的主题并不全，比如好友推荐、热点跟踪等就没有涉及到。但古人云“窥一斑而见全豹”，希望本文的介绍能帮助大家更好的理解微博这样的社交网络应用。微博是一个很多人都在用的社交应用。天天刷微博的人每天都会进行着这样几个操作：原创、转发、回复、阅读、关注、@等。其中，前四个是针对短博文，最后的关注和@则针
Connection reset 连接被重置的解决方法百合不是茶 java 字符流连接被重置
流是java的核心部分,,昨天在做android服务器连接服务器的时候出了问题,就将代码放到java中执行,结果还是一样连接被重置被重置的代码如下; 客户端代码; package 通信软件服务器; import java.io.BufferedWriter; import java.io.OutputStream; import java.io.O
web.xml配置详解之filter bijian1013 java web.xml filter
一.定义 <filter> <filter-name>encodingfilter</filter-name> <filter-class>com.my.app.EncodingFilter</filter-class> <init-param> <param-name>encoding<
Heritrix Bill_chen 多线程 xml 算法制造配置管理
作为纯Java语言开发的、功能强大的网络爬虫Heritrix，其功能极其强大，且扩展性良好，深受热爱搜索技术的盆友们的喜爱，但它配置较为复杂，且源码不好理解，最近又使劲看了下，结合自己的学习和理解，跟大家分享Heritrix的点点滴滴。 Heritrix的下载（http://sourceforge.net/projects/archive-crawler/）安装、配置，就不罗嗦了，可以自己找找资
【Zookeeper】FAQ bit1129 zookeeper
1.脱离IDE，运行简单的Java客户端程序 #ZkClient是简单的Zookeeper~$ java -cp "./:zookeeper-3.4.6.jar:./lib/*" ZKClient 1. Zookeeper是的Watcher回调是同步操作，需要添加异步处理的代码 2. 如果Zookeeper集群跨越多个机房，那么Leader/
The user specified as a definer ('aaa'@'localhost') does not exist 白糖_ localhost
今天遇到一个客户BUG，当前的jdbc连接用户是root，然后部分删除操作都会报下面这个错误：The user specified as a definer ('aaa'@'localhost') does not exist 最后找原因发现删除操作做了触发器，而触发器里面有这样一句 /*!50017 DEFINER = ''aaa@'localhost' */ 原来最初
javascript中showModelDialog刷新父页面 bozch JavaScript 刷新父页面 showModalDialog
在页面中使用showModalDialog打开模式子页面窗口的时候，如果想在子页面中操作父页面中的某个节点，可以通过如下的进行： window.showModalDialog('url',self,‘status...’); // 首先中间参数使用self 在子页面使用w
编程之美-买书折扣 bylijinnan 编程之美
import java.util.Arrays; public class BookDiscount { /**编程之美买书折扣书上的贪心算法的分析很有意思，我看了半天看不懂，结果作者说，贪心算法在这个问题上是不适用的。。下面用动态规划实现。哈利波特这本书一共有五卷，每卷都是8欧元，如果读者一次购买不同的两卷可扣除5%的折扣，三卷10%，四卷20%，五卷
关于struts2.3.4项目跨站执行脚本以及远程执行漏洞修复概要 chenbowen00 struts WEB安全
因为近期负责的几个银行系统软件，需要交付客户，因此客户专门请了安全公司对系统进行了安全评测，结果发现了诸如跨站执行脚本，远程执行漏洞以及弱口令等问题。下面记录下本次解决的过程以便后续 1、首先从最简单的开始处理，服务器的弱口令问题，首先根据安全工具提供的测试描述中发现应用服务器中存在一个匿名用户，默认是不需要密码的，经过分析发现服务器使用了FTP协议，而使用ftp协议默认会产生一个匿名用
[电力与暖气]煤炭燃烧与电力加温 comsci
在宇宙中,用贝塔射线观测地球某个部分,看上去,好像一个个马蜂窝,又像珊瑚礁一样,原来是某个国家的采煤区..... 不过,这个采煤区的煤炭看来是要用完了.....那么依赖将起燃烧并取暖的城市,在极度严寒的季节中...该怎么办呢? &nbs
oracle O7_DICTIONARY_ACCESSIBILITY参数 daizj oracle
O7_DICTIONARY_ACCESSIBILITY参数控制对数据字典的访问.设置为true,如果用户被授予了如select any table等any table权限,用户即使不是dba或sysdba用户也可以访问数据字典.在9i及以上版本默认为false,8i及以前版本默认为true.如果设置为true就可能会带来安全上的一些问题.这也就为什么O7_DICTIONARY_ACCESSIBIL
比较全面的MySQL优化参考 dengkane mysql
本文整理了一些MySQL的通用优化方法，做个简单的总结分享，旨在帮助那些没有专职MySQL DBA的企业做好基本的优化工作，至于具体的SQL优化，大部分通过加适当的索引即可达到效果，更复杂的就需要具体分析了，可以参考本站的一些优化案例或者联系我，下方有我的联系方式。这是上篇。 1、硬件层相关优化 1.1、CPU相关在服务器的BIOS设置中，可
C语言homework2，有一个逆序打印数字的小算法 dcj3sjt126com c
#h1# 0、完成课堂例子 1、将一个四位数逆序打印 1234 ==> 4321 实现方法一： # include <stdio.h> int main(void) { int i = 1234; int one = i%10; int two = i / 10 % 10; int three = i / 100 % 10;
apacheBench对网站进行压力测试 dcj3sjt126com apachebench
ab 的全称是 ApacheBench ，是 Apache 附带的一个小工具，专门用于 HTTP Server 的 benchmark testing ，可以同时模拟多个并发请求。前段时间看到公司的开发人员也在用它作一些测试，看起来也不错，很简单，也很容易使用，所以今天花一点时间看了一下。通过下面的一个简单的例子和注释，相信大家可以更容易理解这个工具的使用。
2种办法让HashMap线程安全 flyfoxs java jdk jni
多线程之--2种办法让HashMap线程安全多线程之--synchronized 和reentrantlock的优缺点多线程之--2种JAVA乐观锁的比较( NonfairSync VS. FairSync) HashMap不是线程安全的,往往在写程序时需要通过一些方法来回避.其实JDK原生的提供了2种方法让HashMap支持线程安全.
Spring Security（04）——认证简介 234390216 Spring Security 认证过程
认证简介目录 1.1 认证过程 1.2 Web应用的认证过程 1.2.1 ExceptionTranslationFilter 1.2.2 在request之间共享SecurityContext 1
Java 位运算 Javahuhui java 位运算
// 左移( << ) 低位补0 // 0000 0000 0000 0000 0000 0000 0000 0110 然后左移2位后，低位补0： // 0000 0000 0000 0000 0000 0000 0001 1000 System.out.println(6 << 2);// 运行结果是24 // 右移( >> ) 高位补"
mysql免安装版配置 ldzyz007 mysql
1、my-small.ini是为了小型数据库而设计的。不应该把这个模型用于含有一些常用项目的数据库。 2、my-medium.ini是为中等规模的数据库而设计的。如果你正在企业中使用RHEL,可能会比这个操作系统的最小RAM需求(256MB)明显多得多的物理内存。由此可见，如果有那么多RAM内存可以使用，自然可以在同一台机器上运行其它服务。 3、my-large.ini是为专用于一个SQL数据
MFC和ado数据库使用时遇到的问题你不认识的休道人 sql C++mfc
=================================================================== 第一个 =================================================================== try{ CString sql; sql.Format("select * from p
表单重复提交Double Submits rensanning double
可能发生的场景： *多次点击提交按钮 *刷新页面 *点击浏览器回退按钮 *直接访问收藏夹中的地址 *重复发送HTTP请求（Ajax）（1）点击按钮后disable该按钮一会儿，这样能避免急躁的用户频繁点击按钮。这种方法确实有些粗暴，友好一点的可以把按钮的文字变一下做个提示，比如Bootstrap的做法： http://getbootstrap.co
Java String 十大常见问题 tomcat_oracle java 正则表达式
　1.字符串比较，使用“==”还是equals()? 　　"=="判断两个引用的是不是同一个内存地址(同一个物理对象)。　　equals()判断两个字符串的值是否相等。　　除非你想判断两个string引用是否同一个对象，否则应该总是使用equals()方法。　　如果你了解字符串的驻留(String Interning)则会更好地理解这个问题。　　
SpringMVC 登陆拦截器实现登陆控制 xp9802 springMVC
思路，先登陆后，将登陆信息存储在session中，然后通过拦截器，对系统中的页面和资源进行访问拦截，同时对于登陆本身相关的页面和资源不拦截。实现方法： 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23