没有人比我更懂暴力算法

模型可解释性

前言导读
Background
1、为什么需要可解释性？
2、诞生背景
3、研究现状
4、常见的模型可解释性方法
- 4.1 基于模型自身的可解释性
- - 1）Explanation Generation
  - 2）Prototype Network
- 4.2 基于结果的可解释性
5、应用前景
6、面临挑战

前言导读

无论在学术界还是工业界，模型可解释性目前都还是一个相当新的领域。本文用综述的形式对模型可解释性做一个总体介绍，帮助大家了解什么是模型的可解释性，以及它诞生的背景是什么样的，我们为什么需要模型的可解释性；然后对模型可解释性领域的发展过程和现状做一个介绍，包括模型可解释性领域有哪些研究工作，不同的流派和它们的代表性思路；最后会分享我们对这个领域的发展趋势以及应用所面临的挑战的一些思考。

Background

机器学习模型可解释性方面的研究，在近两年的科研会议上成为一个相当热门的话题。随着机器学习应用越来越广泛，大家不再仅仅满足于模型的效果，而是希望对模型效果背后的原因有更好的理解。同时，在工业界落地 AI 时，构建能让用户理解的模型也变得越来越重要，在医疗、金融和司法等高风险应用中，这一点尤其明显。只有可被解释的机器学习模型，才可能被更广泛地采纳，并避免歧视性预测和对决策系统的恶意攻击。但目前模型可解释性的研究仍处于非常早期的阶段，距离应用尚需时日。

本文由 InfoQ 整理自阿里巴巴达摩院智能服务事业部算法专家邱天在 AICUG 线上直播公开课上的分享，希望能够帮助读者更好地了解模型可解释性领域的发展现状。
【原文链接】https://www.infoq.cn/article/xiytqjiic5spsp04adk9

1、为什么需要可解释性？

随着黑箱机器学习模型越来越多地被用于在关键环境中进行重要的预测，人工智能的各个利益相关者对透明度的要求越来越高。黑盒模型的风险在于做出和使用的决策可能不合理、不合法，或者无法对其行为进行详细的解释。

在很多领域，模型的可解释性都十分有必要。例如，在精准医疗中，为了支持诊断，专家需要从模型中获得远比简单的二元预测结果多得多的信息。在自动驾驶汽车，以及交通、安全、金融等关键领域，AI 算法模型也需要是可解释的。

近几年，模型可解释性概念越来越火，相关论文文献的数量也是这两年开始暴增。但这是否意味着我们过去一直没有可解释性呢？其实并不是。

2、诞生背景

最早的人工智能系统，如上图右侧图（a）的线性模型，其实是很容易解释的。因为线性模型本身涉及的权重很少，而且非常直观，每个权重的大小就意味着对应的特征可以对最后的结果产生多大的贡献。但是过去几年我们见证了不透明决策系统的兴起，比如深度神经网络（DNNs）。深度学习模型（如 RNN、BERT）的成功源于高效的学习算法及其巨大的参数空间的结合，一个参数空间可能由数百层和数百万个参数组成，这使得 DNNs 被认为是复杂的黑盒模型。

随着算力越来越强，算法模型变得越来越复杂、体积也越来越大，我们已经很难解释这些模型了，虽然它的能力确实很强，能够帮我们做越来越多的事情，甚至在很多特定任务上表现超过人类，但是我们越来越无法理解这些模型了，这是一个很棘手的问题。所谓的可解释性，就是希望寻求对模型工作机理的直接理解，打破人工智能的黑盒子。

3、研究现状

可解释人工智能技术大致可分为三大类，它们有各自的算法技术栈：

第一类是基于数据的可解释性，是我们最容易想到的一种方法，也是很多论文里面经常涉及的一类技术；
第二类是基于模型的可解释性，这类方法主要是在探讨能不能让模型本身就具有可解释性，模型自身就能告诉我们为什么要这么做；
第三类是基于结果的可解释性，思路是直接将现有的模型当作一个黑盒去看待，我们自己给一些输入输出，通过观察模型的行为，去推断出它到底为什么会产生这样的一个结果，我们自己去建模它的可解释性，这种思路的好处是完全对模型无关，什么模型都可以用。

当前在各个顶会上讨论得更多的是后两类，接下来重点介绍这两类方法的典型算法和思路。

4、常见的模型可解释性方法

目前比较常见的模型可解释性方法包括可视化、消融实验（Ablation study）和对输入输出的静态分析等。

可视化解释不仅能够帮我们调试代码，发现黑盒子神经网络在做某种决策时所犯的明显错误，从而帮助改进模型，还可以寻找输入图片中对最终决策起至关重要的因素，实现知识发现。图右是对于 Attention 的可视化，也是比较经典的一个例子，我们可以把 BERT、Transformer 等这些流行的自然语言处理模型一点点地拆解开，看看里面的这些 Attention 到底是怎么工作的，这是一个比较有意思的实现方式。

4.1 基于模型自身的可解释性

模型自身的可解释性：把模型本身变成一个可解释的模型，它自己能说话，不只是给出单纯的答案，还能给出得到这个答案的理由，可以让研究人员对模型本身有更多的把握。

Explanation Generation 和 Prototype Network是两种经典方法，前者是让模型自己产生可解释的输出，后者则是让模型的思考方式跟人类更接近。

1）Explanation Generation

典型的例子是 VQA explanation，即在训练模型的同时训练一个语言的解释器。我们向模型提问，并给模型提供一些多模态的输入（比如图像或视频），模型给出输出结果的同时，让模型对给出的输出结果做进一步的解释，以帮助我们更好地了解模型是否真的理解了我们的意思，而不是怀疑模型恰好“猜”对了答案。

假设我们输入右上角的图片，Question 是 What sport is pictured？也就是问这个模型，这张图在描述一个什么样的运动。模型需要做出回答，Answer：Surfing，回答这是在冲浪，回答对了。这时候我们会想，模型确实回答对了，但是它是怎么回答对的呢？它是因为看到这有一片海所以说是冲浪，还是说看到背后有白云所以说是冲浪，还是说真的看到这有个人站在冲浪板上，它才觉得是冲浪呢？对于模型推断的过程我们是有怀疑的，因为我们不知道它是怎么工作的，这时候就要用到模型可解释性的方法，也就是 VQA explanation。

VQA explanation 要求模型不仅输出 Answer，还要输出一个 Explanation，比如模型给出这么一个解释 Because the man is riding a wave on a surfboard，因为这个人站在冲浪板上冲浪，所以这张图片上的运动是 Surfing。这跟我们自身对于这个图片的理解就是吻合的，同时模型还能把具体的实体跟图像里面的像素区域做高亮显示，说明它确实理解了图像中的人和冲浪板，并把这些实体结合起来，以及连贯整个行为之后推理出来说，这个图片上的运动应该理解成 Surfing。通过应用 VQA explanation 的方法，我们可以将模型变得更可靠，即使模型推理错了，我们也能知道为什么出错。

有时候，就算我们把模型一层层拆解开，也还是无法很直观地了解到，它为什么最后得出了这个结论。因为模型最后得出结论的方式，跟人类看一个问题的思维方式，其中的 Gap 太大了。就算我们真的把每个模型的模块都解析出来并可视化，也不一定能够理解得很清楚。

原文《Faithful Multimodal Explanation for Visual Question Answering》

2）Prototype Network

Prototype Network 的思路是，在模型设计的时候，就让模型的构造出的数据处理加工的方式和人类的思考方式相似，这样它产生结果之后，我们反过来去看这个模型的工作方式，就能很好地理解为什么给出了这么一个结果。

以《This Looks Like That: Deep Learning for Interpretable Image Recognition》这项工作为例，简单解释实现过程。这篇论文的核心任务目标是对鸟类图像做分类。那么人是怎么对鸟类做分类的呢？我们会有一些特定的方法论，比如要看它的嘴是什么样子的，爪子是什么样子的，羽毛是什么样子的，翅膀是什么样子的，通过把这几个特征组合起来去判断这属于什么鸟类。论文提出了原型的概念，把对图像的判断机制拆解为人类思维方式中的各种原子能力，根据人判断的机理来分类图像。在设计模型的时候，让它用跟人类思考类似的方式，通过分解图像得到不同的原型部分，比如先对鸟的嘴、爪子、羽毛逐一判断，再通过组成这些信息最终得到正确的分类。

原文《This Looks Like That: Deep Learning for Interpretable Image Recognition》

4.2 基于结果的可解释性

基于结果的可解释性，或者叫事后可解释性，它指的是模型已经是训练好的成品了，事后尝试解释为什么这个模型是这样工作的。

基本思路：仍然把深度模型看成是一个黑盒子，不去打开它，或者说不会去显式地做拆解，而是通过假设和检验去观察这个模型，再去推测这个模型可能是怎么工作的。通过不断地假设检验给出结论，这个结论会慢慢变得越来越符合模型实际的工作方式，通过不断地逼近，最终给出一个合理的解释。这种做法的好处是跟模型无关，适合于任意模型，当然目前也存在一些缺点，后面提到。

方法举例：代理模型的方法（surrogate model），在模型局部采用一种简单可解释的模型去近似原有的黑盒模型，当精度足够逼近的时候，就可以用代理模型来解释原黑盒模型，这里我们列举两种产生代理模型的算法，分别是 LIME 算法和 SHAP 算法。

LIME 算法的思路可以简化理解成：尝试用一个比较容易解释的简单的模型（比如线性模型）去逼近、拟合原来比较复杂且不好理解的深度模型，如果能产生一个跟原来的复杂模型结果近似的模型，那这个简单模型的表征状态，就可以用来解释原来的模型。当然 LIME 算法不会把整个模型进行线性的降维，因为这样做不现实，它是假设局部可线性化，把一个模型做无限的拆解，拆解到每个局部点，再对每个点用一个局部的线性模型或简单模型进行近似，一旦局部跟一个简单的线性模型之间产生了近似的拟合关系，就可以用简单模型去解释这个局部，局部得到解释之后，整体也就可以解释了。

LIME 算法：https://arxiv.org/abs/1602.04938
SHAP 算法：https://arxiv.org/abs/1705.07874

5、应用前景

可以看到，过去几年可解释性相关的论文数量呈逐年上升趋势，各个领域的国际顶会都纷纷开设了可解释性的 Topic。解释 AI 模型的技术兴趣在 2018 年左右开始渗透到整个研究领域。我们认为可解释性能够更好地推动深度学习、人工智能在整个业界的应用，它可以带来以下好处：

可信赖。可解释性能够让模型变得更加可信赖，尤其是对于非技术工作人员，有助于推动深度学习在金融、交通、安全等关键领域的大规模应用，是人工智能在各行各业落地的重要基础。
公平性。当前人工智能、深度学习大部分都依赖于大数据，而大数据本身是来源于人的，其中难免存在偏差（bias），机器对这些存在偏差的数据进行学习的时候，也会把偏差学进去，但这些偏差并不是我们想要的。我们希望模型本身能够抵抗这些偏差，而不是单纯的去模拟数据的偏差，比如在金融风控领域，模型可能对于特定性别、特定地域来源、特定年龄的人的判别存在偏差。如果能够让模型本身可解释、可理解，我们就能够把偏差纠正过来，让它变得更公平。
可转移性。我们现在经常提迁移学习（Transfer Learning），就是把模型从一个领域迁移到另一个领域。如果模型是个黑盒子，我们不清楚它具体是怎么工作的，就很难清晰地界定模型迁移的边界在哪里，哪里可用、哪里不可用，这些都无从知晓。如果我们能够对模型有更深的了解，就可以更好地把模型模块化，进而更好地对模型进行无缝的迁移，迁移学习的领域运用也会更加的广阔。
高效率。假设 AI 产品部署之后出现 Bug，如果模型是个黑盒，我们就无法知道它是如何工作的，自然也不可能知道 Bug 出在哪里，只能用小修小补的方式把 Bug 屏蔽掉，而不能真正地解决问题。如果模型可解释，我们就可以更快速地定位和修正 badcase。
多样性：模型可解释可以推动生成模型的广泛应用。以阿里小蜜为例，它是一个会话机器人，目前一些生成模型技术（如括文本生成）已经相当成熟了，能够给我们提供一些比较好的生成结果，如果我们将生成模型应用到会话机器人中，可以提供比传统的检索方法更好的个性化回答服务，对于会话服务的整体质量会有很好的提升。可是我们却没办法这么用，为什么呢？因为工业界应用对模型可靠性有一定的要求，但生成模型一个比较大的问题在于它是不可控的，特别是深度的生成模型，我们根本无法控制输入一个问题之后它会给出一个什么样的回答，可能导致实际应用中出现各种意外情况。这就需要我们对模型有更深层次的把握，能够更好地理解生成模型是怎么工作的、怎么在一定程度上控制它，这之后才能够让模型更好地应用起来。

6、面临挑战

挑战 1：算法成熟度
对于两类代表性的模型可解释性
1）模型自身的可解释性，其本身跟模型强绑定，需要根据模型和应用场景一对一地进行迭代，才能够让它产生可解释性，通用性非常受限，修改的难度也比较大。
2）基于结果的可解释性，虽然能把它看成一个黑盒子，但目前算法本身还存在一些问题。比如 LIME 算法，因为它是一种近似，它对于采样有一定依赖，导致结果不稳定。不过算法本身的问题也在不断迭代改进，LIME 算法是 2016 年提出来的，现在 Linkedin 又提出了 xLIME 算法，针对 LIME 存在的问题做了一些改进。通过工业界和学术界一步一步地探索，相信这些算法会变得越来越好，离大规模应用也会越来越近。
- 挑战 2：算力成本
挑战2跟挑战1是紧密相关的。基于结果的可解释性方法对采样有依赖，结果也不太稳定，那对一部分可以工作的比较好的模型，我们总可以用了吧？但我们发现要真正用起来还有一个问题：对于目前的算法，包括 LIME 也好、SHAP 也好，它本身的算法复杂度还是太高。一篇 200 字段落的 MRC，通过 SHAP 算法基于模特卡洛抽样也需要迭代超过 5000 次，耗时数小时，才能较好地拟合一个样本。假设有几万篇样本，那得算到什么时候呢？解决的办法一方面是优化算法，降低复杂度，另一方面是继续提升算力。
挑战 3：数据稀疏
对于模型自身可解释性方法，需要训练出模型的解释器，这往往是一个有监督的训练过程，意味着需要大量的样本和大量的标注它才能够最后给出自身的解释。但工业界现在并没有这么大量的对于可解释性的额外的数据标注，如果我们用人工的方法进行海量数据标注，成本非常高，甚至是不可承担的。一种可能的方式是，借助无监督或者半监督的方法，把我们自身已经有的一些算法的数据标注运用起来，让它产生可解释性，这是最合理或者说最可能行得通的一种方法。

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
android系统selinux中添加新属性property 辉色投像
1.定位/android/system/sepolicy/private/property_contexts声明属性开头：persist.charge声明属性类型：u:object_r:system_prop:s0图12.定位到android/system/sepolicy/public/domain.te删除neverallow{domain-init}default_prop:property
UI学习——cell的复用和自定义cell Magnetic_h ui 学习
目录cell的复用手动（非注册）自动（注册）自定义cellcell的复用在iOS开发中，单元格复用是一种提高表格（UITableView）和集合视图（UICollectionView）滚动性能的技术。当一个UITableViewCell或UICollectionViewCell首次需要显示时，如果没有可复用的单元格，则视图会创建一个新的单元格。一旦这个单元格滚动出屏幕，它就不会被销毁。相反，它被添
C语言宏函数南林yan C语言 c语言
一、什么是宏函数？通过宏定义的函数是宏函数。如下，编译器在预处理阶段会将Add(x,y)替换为((x)*(y))#defineAdd(x,y)((x)*(y))#defineAdd(x,y)((x)*(y))intmain(){inta=10;intb=20;intd=10;intc=Add(a+d,b)*2;cout<
c++ 的iostream 和 c++的stdio的区别和联系黄卷青灯77 c++算法开发语言 iostream stdio
在C++中，iostream和C语言的stdio.h都是用于处理输入输出的库，但它们在设计、用法和功能上有许多不同。以下是两者的区别和联系：区别1.编程风格iostream（C++风格）：C++标准库中的输入输出流类库，支持面向对象的输入输出操作。典型用法是cin（输入）和cout（输出），使用>操作符来处理数据。更加类型安全，支持用户自定义类型的输入输出。#includeintmain(){in
LocalDateTime 转 String igotyback java 开发语言
importjava.time.LocalDateTime;importjava.time.format.DateTimeFormatter;publicclassMain{publicstaticvoidmain(String[]args){//获取当前时间LocalDateTimenow=LocalDateTime.now();//定义日期格式化器DateTimeFormatterformat
店群合一模式下的社区团购新发展——结合链动 2+1 模式、AI 智能名片与 S2B2C 商城小程序源码说私域人工智能小程序
摘要：本文探讨了店群合一的社区团购平台在当今商业环境中的重要性和优势。通过分析店群合一模式如何将互联网社群与线下终端紧密结合，阐述了链动2+1模式、AI智能名片和S2B2C商城小程序源码在这一模式中的应用价值。这些创新元素的结合为社区团购带来了新的机遇，提升了用户信任感、拓展了营销渠道，并实现了线上线下的完美融合。一、引言随着互联网技术的不断发展，社区团购作为一种新兴的商业模式，在满足消费者日常需
消息中间件有哪些常见类型 xmh-sxh-1314 java
消息中间件根据其设计理念和用途，可以大致分为以下几种常见类型：点对点消息队列（Point-to-PointMessagingQueues）：在这种模型中，消息被发送到特定的队列中，消费者从队列中取出并处理消息。队列中的消息只能被一个消费者消费，消费后即被删除。常见的实现包括IBM的MQSeries、RabbitMQ的部分使用场景等。适用于任务分发、负载均衡等场景。发布/订阅消息模型（Pub/Sub
【一起学Rust | 设计模式】习惯语法——使用借用类型作为参数、格式化拼接字符串、构造函数广龙宇一起学Rust #Rust设计模式 rust 设计模式开发语言
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、使用借用类型作为参数二、格式化拼接字符串三、使用构造函数总结前言Rust不是传统的面向对象编程语言，它的所有特性，使其独一无二。因此，学习特定于Rust的设计模式是必要的。本系列文章为作者学习《Rust设计模式》的学习笔记以及自己的见解。因此，本系列文章的结构也与此书的结构相同（后续可能会调成结构），基本上分为三个部分
每日一题——第八十九题互联网打工人no1 C语言程序设计每日一练 c语言
题目：在字符串中找到提取数字，并统计一共找到多少整数，a123xxyu23&8889，那么找到的整数为123，23，8889//思想：#include#include#includeintmain(){charstr[]="a123xxyu23&8889";intcount=0;intnum=0;//用于临时存放当前正在构建的整数。boolinNum=false;//用于标记当前是否正在读取一个整
每日一题——第八十一题互联网打工人no1 C语言程序设计每日一练 c语言
打印如下图案:#includeintmain(){inti,j;charch='A';for(i=1;i<5;i++,ch++){for(j=0;j<5-i;j++){printf("");//控制空格输出}for(j=1;j<2*i;j++)//条件j<2*i{printf("%c",ch);//控制字符输出}printf("\n");}return0;}
每日一题——第八十二题互联网打工人no1 C语言程序设计每日一练 c语言
题目：将一个控制台输入的字符串中的所有元音字母复制到另一字符串中#include#include#include#include#defineMAX_INPUT1024boolisVowel(charp);intmain(){charinput[MAX_INPUT];charoutput[MAX_INPUT];printf("请输入一串字符串：\n");fgets(input,sizeof(inp
每日一题——第八十三题互联网打工人no1 C语言程序设计每日一练 c语言
题目：将输入的整形数字输出,输出1990，输出"1990"#include#defineMAX_INPUT1024intmain(){intarrr_num[MAX_INPUT];intnum,i=0;printf("请输入一个数字：");scanf_s("%d",&num);while(num!=0){arrr_num[i++]=num%10;num/=10;}printf("\"");for(
git常用命令笔记咩酱-小羊 git 笔记
###用习惯了idea总是不记得git的一些常见命令，需要用到的时候总是担心旁边站了人~~~记个笔记@_@，告诉自己看笔记不丢人初始化初始化一个新的Git仓库gitinit配置配置用户信息gitconfig--globaluser.name"YourName"gitconfig--globaluser.email"[email protected]"基本操作克隆远程仓库gitclone查看
Goolge earth studio 进阶4——路径修改与平滑陟彼高冈yu Google earth studio 进阶教程旅游
如果我们希望在大约中途时获得更多的城市鸟瞰视角。可以将相机拖动到这里并创建一个新的关键帧。camera_target_clip_7EarthStudio会自动平滑我们的路径，所以当我们通过这个关键帧时，不是一个生硬的角度，而是一个平滑的曲线。camera_target_clip_8路径上有贝塞尔控制手柄，允许我们调整路径的形状。右键单击，我们可以选择“平滑路径”，这是默认的自动平滑算法，或者我们可
LLM 词汇表落难Coder LLMs NLP 大语言模型大模型 llama 人工智能
Contextwindow“上下文窗口”是指语言模型在生成新文本时能够回溯和参考的文本量。这不同于语言模型训练时所使用的大量数据集，而是代表了模型的“工作记忆”。较大的上下文窗口可以让模型理解和响应更复杂和更长的提示，而较小的上下文窗口可能会限制模型处理较长提示或在长时间对话中保持连贯性的能力。Fine-tuning微调是使用额外的数据进一步训练预训练语言模型的过程。这使得模型开始表示和模仿微调数
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
PHP环境搭建详细教程好看资源平台前端 php
PHP是一个流行的服务器端脚本语言，广泛用于Web开发。为了使PHP能够在本地或服务器上运行，我们需要搭建一个合适的PHP环境。本教程将结合最新资料，介绍在不同操作系统上搭建PHP开发环境的多种方法，包括Windows、macOS和Linux系统的安装步骤，以及本地和Docker环境的配置。1.PHP环境搭建概述PHP环境的搭建主要分为以下几类：集成开发环境：例如XAMPP、WAMP、MAMP，这
四章-32-点要素的聚合彩云飘过
本文基于腾讯课堂老胡的课《跟我学Openlayers--基础实例详解》做的学习笔记，使用的openlayers5.3.xapi。源码见1032.html，对应的官网示例https://openlayers.org/en/latest/examples/cluster.htmlhttps://openlayers.org/en/latest/examples/earthquake-clusters.
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
使用Faiss进行高效相似度搜索 llzwxh888 faiss python
在现代AI应用中，快速和高效的相似度搜索是至关重要的。Faiss（FacebookAISimilaritySearch）是一个专门用于快速相似度搜索和聚类的库，特别适用于高维向量。本文将介绍如何使用Faiss来进行相似度搜索，并结合Python代码演示其基本用法。什么是Faiss？Faiss是一个由FacebookAIResearch团队开发的开源库，主要用于高维向量的相似性搜索和聚类。Faiss
使用Apify加载Twitter消息以进行微调的完整指南 nseejrukjhad twitter easyui 前端 python
#使用Apify加载Twitter消息以进行微调的完整指南##引言在自然语言处理领域，微调模型以适应特定任务是提升模型性能的常见方法。本文将介绍如何使用Apify从Twitter导出聊天信息，以便进一步进行微调。##主要内容###使用Apify导出推文首先，我们需要从Twitter导出推文。Apify可以帮助我们做到这一点。通过Apify的强大功能，我们可以批量抓取和导出数据，适用于各类应用场景。
利用LangChain的StackExchange组件实现智能问答系统 nseejrukjhad langchain microsoft 数据库 python
利用LangChain的StackExchange组件实现智能问答系统引言在当今的软件开发世界中，StackOverflow已经成为程序员解决问题的首选平台之一。而LangChain作为一个强大的AI应用开发框架，提供了StackExchange组件，使我们能够轻松地将StackOverflow的海量知识库集成到我们的应用中。本文将详细介绍如何使用LangChain的StackExchange组件
如何部分格式化提示模板:LangChain中的高级技巧 nseejrukjhad langchain java 服务器 python
标题:如何部分格式化提示模板:LangChain中的高级技巧内容:如何部分格式化提示模板:LangChain中的高级技巧引言在使用大型语言模型(LLM)时,提示工程是一个关键环节。LangChain提供了强大的提示模板功能,让我们能更灵活地构建和管理提示。本文将介绍LangChain中一个高级特性-部分格式化提示模板,这个技巧可以让你的提示管理更加高效和灵活。什么是部分格式化提示模板?部分格式化提
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
其二十八尾喵
你知道吗？图片发自App我今天知道了你有喜欢的人，不是我。心空空的，整个人都不是我的了。可，怎么办？还是要好好的活着，毕竟你喜欢的人，我不能杀，可是我可以杀其他喜欢你的人呀！也罢，此生无缘，来世再见。鱼干
Faiss Tips：高效向量搜索与聚类的利器焦习娜Samantha
FaissTips：高效向量搜索与聚类的利器faiss_tipsSomeusefultipsforfaiss项目地址:https://gitcode.com/gh_mirrors/fa/faiss_tips项目介绍Faiss是由FacebookAIResearch开发的一个用于高效相似性搜索和密集向量聚类的库。它支持多种硬件平台，包括CPU和GPU，能够在海量数据集上实现快速的近似最近邻搜索（AN
CX8836：小体积大功率升降压方案推荐（附Demo设计指南）诚芯微科技社交电子
CX8836是一颗同步四开关单向升降压控制器，在4.5V-40V宽输入电压范围内稳定工作，持续负载电流10A，能够在输入高于或低于输出电压时稳定调节输出电压，可适用于USBPD快充、车载充电器、HUB、汽车启停系统、工业PC电源等多种升降压应用场合，为大功率TYPE-CPD车载充电器提供最优解决方案。提供CX8836Demo测试、CX8836样品申请及CX8836方案开发技术支持。CX8836同升
数据仓库——维度表一致性墨染丶eye 背诵数据仓库
数据仓库基础笔记思维导图已经整理完毕，完整连接为：数据仓库基础知识笔记思维导图维度一致性问题从逻辑层面来看，当一系列星型模型共享一组公共维度时，所涉及的维度称为一致性维度。当维度表存在不一致时，短期的成功难以弥补长期的错误。维度时确保不同过程中信息集成起来实现横向钻取货活动的关键。造成横向钻取失败的原因维度结构的差别，因为维度的差别，分析工作涉及的领域从简单到复杂，但是都是通过复杂的报表来弥补设计
闲鱼鱼小铺怎么开通？鱼小铺开通需要哪些流程？高省APP大九
闲鱼鱼小铺是平台推出的一个专业程度的店铺，与普通店铺相比会有更多的权益，比如说发布的商品数量从50增加到500；拥有专业的店铺数据看板与分析的功能，这对于专门在闲鱼做生意的用户来说是非常有帮助的，那么鱼小铺每个人都能开通吗？大家好，我是高省APP联合创始人蓓蓓导师，高省APP是2021年推出的电商导购平台，0投资，0风险、高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个可省钱佣金高，能
ztree异步加载 3213213333332132 JavaScript Ajax json Web ztree
相信新手用ztree的时候,对异步加载会有些困惑，我开始的时候也是看了API花了些时间才搞定了异步加载，在这里分享给大家。我后台代码生成的是json格式的数据，数据大家按各自的需求生成，这里只给出前端的代码。设置setting，这里只关注async属性的配置 var setting = { //异步加载配置
thirft rpc 具体调用流程 BlueSkator 中间件 rpc thrift
Thrift调用过程中，Thrift客户端和服务器之间主要用到传输层类、协议层类和处理类三个主要的核心类，这三个类的相互协作共同完成rpc的整个调用过程。在调用过程中将按照以下顺序进行协同工作：（1）将客户端程序调用的函数名和参数传递给协议层（TProtocol），协议
异或运算推导, 交换数据 dcj3sjt126com PHP 异或 ^
/* * 5 0101 * 9 1010 * * 5 ^ 5 * 0101 * 0101 * ----- * 0000 * 得出第一个规律: 相同的数进行异或, 结果是0 * * 9 ^ 5 ^ 6 * 1010 * 0101 * ---- * 1111 * * 1111 * 0110 * ---- * 1001
事件源对象周华华 JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
MySql配置及相关命令 g21121 mysql
MySQL安装完毕后我们需要对它进行一些设置及性能优化，主要包括字符集设置，启动设置，连接优化，表优化，分区优化等等。一修改MySQL密码及用户
[简单]poi删除excel 2007超链接 53873039oycg Excel
采用解析sheet.xml方式删除超链接，缺点是要打开文件2次,代码如下: public void removeExcel2007AllHyperLink(String filePath) throws Exception { OPCPackage ocPkg = OPCPac
Struts2添加 open flash chart 云端月影
准备以下开源项目： 1. Struts 2.1.6 2. Open Flash Chart 2 Version 2 Lug Wyrm Charmer (28th, July 2009) 3. jofc2，这东西不知道是没做好还是什么意思，好像和ofc2不怎么匹配，最好下源码，有什么问题直接改。 4. log4j 用eclipse新建动态网站，取名OFC2Demo，将Struts2 l
spring包详解 aijuans spring
下载的spring包中文件及各种包众多，在项目中往往只有部分是我们必须的，如果不清楚什么时候需要什么包的话，看看下面就知道了。 aspectj目录下是在Spring框架下使用aspectj的源代码和测试程序文件。Aspectj是java最早的提供AOP的应用框架。 dist 目录下是Spring 的发布包，关于发布包下面会详细进行说明。 docs&nb
网站推广之seo概念 antonyup_2006 算法 Web 应用服务器搜索引擎 Google
持续开发一年多的b2c网站终于在08年10月23日上线了。作为开发人员的我在修改bug的同时，准备了解下网站的推广分析策略。所谓网站推广，目的在于让尽可能多的潜在用户了解并访问网站，通过网站获得有关产品和服务等信息，为最终形成购买决策提供支持。网站推广策略有很多，seo，email，adv
单例模式,sql注入,序列百合不是茶单例模式序列 sql注入预编译
序列在前面写过有关的博客,也有过总结,但是今天在做一个JDBC操作数据库的相关内容时需要使用序列创建一个自增长的字段居然不会了,所以将序列写在本篇的前面 1,序列是一个保存数据连续的增长的一种方式; 序列的创建; CREATE SEQUENCE seq_pro 2 INCREMENT BY 1 -- 每次加几个 3
Mockito单元测试实例 bijian1013 单元测试 mockito
Mockito单元测试实例： public class SettingServiceTest { private List<PersonDTO> personList = new ArrayList<PersonDTO>(); @InjectMocks private SettingPojoService settin
精通Oracle10编程SQL(9)使用游标 bijian1013 oracle 数据库 plsql
/* *使用游标 */ --显示游标 --在显式游标中使用FETCH...INTO语句 DECLARE CURSOR emp_cursor is select ename,sal from emp where deptno=1; v_ename emp.ename%TYPE; v_sal emp.sal%TYPE; begin ope
【Java语言】动态代理 bit1129 java语言
JDK接口动态代理 JDK自带的动态代理通过动态的根据接口生成字节码(实现接口的一个具体类)的方式，为接口的实现类提供代理。被代理的对象和代理对象通过InvocationHandler建立关联 package com.tom; import com.tom.model.User; import com.tom.service.IUserService;
Java通信之URL通信基础白糖_ java jdk webservice 网络协议 ITeye
java对网络通信以及提供了比较全面的jdk支持，java.net包能让程序员直接在程序中实现网络通信。在技术日新月异的现在，我们能通过很多方式实现数据通信，比如webservice、url通信、socket通信等等，今天简单介绍下URL通信。学习准备：建议首先学习java的IO基础知识 URL是统一资源定位器的简写，URL可以访问Internet和www，可以通过url
博弈Java讲义 - Java线程同步 (1) boyitech java 多线程同步锁
在并发编程中经常会碰到多个执行线程共享资源的问题。例如多个线程同时读写文件，共用数据库连接，全局的计数器等。如果不处理好多线程之间的同步问题很容易引起状态不一致或者其他的错误。同步不仅可以阻止一个线程看到对象处于不一致的状态，它还可以保证进入同步方法或者块的每个线程，都看到由同一锁保护的之前所有的修改结果。处理同步的关键就是要正确的识别临界条件（cri
java-给定字符串，删除开始和结尾处的空格，并将中间的多个连续的空格合并成一个。 bylijinnan java
public class DeleteExtraSpace { /** * 题目：给定字符串，删除开始和结尾处的空格，并将中间的多个连续的空格合并成一个。 * 方法1.用已有的String类的trim和replaceAll方法 * 方法2.全部用正则表达式，这个我不熟 * 方法3.“重新发明轮子”，从头遍历一次 */ public static v
An error has occurred.See the log file错误解决！ Kai_Ge MyEclipse
今天早上打开MyEclipse时，自动关闭！弹出An error has occurred.See the log file错误提示！很郁闷昨天启动和关闭还好着！！！打开几次依然报此错误，确定不是眼花了！打开日志文件！找到当日错误文件内容： --------------------------------------------------------------------------
[矿业与工业]修建一个空间矿床开采站要多少钱? comsci
地球上的钛金属矿藏已经接近枯竭........... 我们在冥王星的一颗卫星上面发现一些具有开采价值的矿床..... 那么,现在要编制一个预算,提交给财政部门..
解析Google Map Routes dai_lm google api
为了获得从A点到B点的路劲，经常会使用Google提供的API，例如 [url] http://maps.googleapis.com/maps/api/directions/json?origin=40.7144,-74.0060&destination=47.6063,-122.3204&sensor=false [/url] 从返回的结果上，大致可以了解应该怎么走，但
SQL还有多少“理所应当”？ datamachine sql
转贴存档，原帖地址：http://blog.chinaunix.net/uid-29242841-id-3968998.html、http://blog.chinaunix.net/uid-29242841-id-3971046.html！ ------------------------------------华丽的分割线--------------------------------
Yii使用Ajax验证时，如何设置某些字段不需要验证 dcj3sjt126com Ajax yii
经常像你注册页面,你可能非常希望只需要Ajax去验证用户名和Email,而不需要使用Ajax再去验证密码,默认如果你使用Yii 内置的ajax验证Form,例如: $form=$this->beginWidget('CActiveForm', array( 'id'=>'usuario-form',&
使用git同步网站代码 dcj3sjt126com crontab git
转自:http://ued.ctrip.com/blog/?p=3646?tn=gongxinjun.com 管理一网站，最开始使用的虚拟空间，采用提供商支持的ftp上传网站文件，后换用vps，vps可以自己搭建ftp的，但是懒得搞，直接使用scp传输文件到服务器，现在需要更新文件到服务器，使用scp真的很烦。发现本人就职的公司，采用的git+rsync的方式来管理、同步代码，遂
sql基本操作蕃薯耀 sql sql基本操作 sql常用操作
sql基本操作 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月1日 17:30:33 星期一 &
Spring4+Hibernate4+Atomikos3.3多数据源事务管理 hanqunfeng Hibernate4
Spring3+后不再对JTOM提供支持，所以可以改用Atomikos管理多数据源事务。Spring2.5+Hibernate3+JTOM参考：http://hanqunfeng.iteye.com/blog/1554251Atomikos官网网站：http://www.atomikos.com/ 一.pom.xml <dependency> <
jquery中两个值得注意的方法one()和trigger()方法 jackyrong trigger
在jquery中，有两个值得注意但容易忽视的方法，分别是one()方法和trigger()方法,这是从国内作者<<jquery权威指南》一书中看到不错的介绍 1） one方法 one方法的功能是让所选定的元素绑定一个仅触发一次的处理函数，格式为 one(type,${data},fn) &nb
拿工资不仅仅是让你写代码的 lampcy 工作面试咨询
这是我对团队每个新进员工说的第一件事情。这句话的意思是，我并不关心你是如何快速完成任务的，哪怕代码很差，只要它像救生艇通气门一样管用就行。这句话也是我最喜欢的座右铭之一。这个说法其实很合理：我们的工作是思考客户提出的问题，然后制定解决方案。思考第一，代码第二，公司请我们的最终目的不是写代码，而是想出解决方案。话粗理不粗。付你薪水不是让你来思考的，也不是让你来写代码的，你的目的是交付产品
架构师之对象操作----------对象的效率复制和判断是否全为空 nannan408 架构师
1.前言。如题。 2.代码。 (1)对象的复制，比spring的beanCopier在大并发下效率要高，利用net.sf.cglib.beans.BeanCopier Src src=new Src(); BeanCopier beanCopier = BeanCopier.create(Src.class, Des.class, false);
ajax 被缓存的解决方案 Rainbow702 JavaScript jquery Ajax cache 缓存
使用jquery的ajax来发送请求进行局部刷新画面，各位可能都做过。今天碰到一个奇怪的现象，就是，同一个ajax请求，在chrome中，不论发送多少次，都可以发送至服务器端，而不会被缓存。但是，换成在IE下的时候，发现，同一个ajax请求，会发生被缓存的情况，只有第一次才会被发送至服务器端，之后的不会再被发送。郁闷。解决方法如下： ① 直接使用 JQuery提供的 “cache”参数，
修改date.toLocaleString()的警告 tntxia String
我们在写程序的时候，经常要查看时间，所以我们经常会用到date.toLocaleString()，但是date.toLocaleString()是一个过时的API，代替的方法如下： package com.tntxia.htmlmaker.util; import java.text.SimpleDateFormat; import java.util.
项目完成后的小总结 xiaomiya js 总结项目
项目完成了，突然想做个总结但是有点无从下手了。做之前对于客户端给的接口很模式。然而定义好了格式要求就如此的愉快了。先说说项目主要实现的功能吧 1，按键精灵 2，获取行情数据 3，各种input输入条件判断 4，发送数据（有json格式和string格式） 5，获取预警条件列表和预警结果列表， 6，排序， 7，预警结果分页获取 8，导出文件（excel，text等） 9，修

模型可解释性

模型可解释性

前言导读

Background

1、为什么需要可解释性？

2、诞生背景

3、研究现状

4、常见的模型可解释性方法

4.1 基于模型自身的可解释性

1）Explanation Generation

2）Prototype Network

4.2 基于结果的可解释性

5、应用前景

6、面临挑战

你可能感兴趣的:(机器学习,&,AI模型,机器学习,模型可解释性,AI模型,深度学习,神经网络)