任菜菜学编程

2019年CS224N课程笔记-Lecture 19:Safety, Bias, and Fairness

资源链接：https://www.bilibili.com/video/BV1r4411f7td?p=19

毒性/toxicity->戾气程度

正课内容

对于现实中的这种香蕉我们倾向于不提黄色（第一次看这个图的时候很少/几乎没有有人说黄色），因为黄色是他的原型（绿色和斑点则不是）

原型理论

分类的目的之一是将刺激之间的无限差异缩小到行为和认知上可用的比例
物品可能有一些核心的原型概念，这些概念来自于存储的对象类别的典型属性（Rosch，1975）
也可以存储样本/存储范例？（感觉翻译的不是很理解）（Wu&Barsalou，2009）

（原型到底存储吗？现实是人们总是倾向于什么是典型和注意非典型的事务）

医生——女医生

一名男子和他的儿子遭遇严重事故，被紧急送往医院抢救。
医生看着那个男孩，喊道：“我不能给这个男孩动手术，他是我的儿子！”
怎么会这样？两个爸爸或者他妈妈是医生

（咱们现实中可能也是如果有什么问题了，可能只会关注他/她是不是医生，而不太会关注性别）

大多数受试者忽略了医生是女性的可能性——包括男性、女性和自称的女权主义者。

我们做事情的和假设的方式，不一定有负面意图，但是有些东西可以说明我们是如何实际存储表示的、我们的思想以及在互动时如何访问这些表示（这也影响了我们从文本中学习时可以学到的东西）

2013年的一个工作，只要看看从原始文本中学习，最有可能会学到什么？

谋杀是眨眼的10倍多，因为人们不倾向于提及眨眼、呼吸等事情（习以为常的事情），而模式是非典型事件（是不是可以理解成非习以为常事件？...），而机器学的的这些受人类习惯的影响（实际中考虑行为来说，眨眼在现实中远远远远远远高于谋杀吧）

人类报告偏差

人们写行为、结果或属性的频率并不是真实世界频率的反映（现实中眨眼远远...高于谋杀），也不是一种属性在多大程度上是一类个体的特征

更多的是关于我们处理世界和我们认为非凡的东西的实际情况。这影响到系统/计算机/机器学习的一切。

收集并可能标注培训数据->训练模型->媒体可以过滤排序、汇总或者以某种方式产生（不太懂。。。）->人们可以看到输出

将各种偏见在训练前嵌入数据中

讲师认为对于人工智能非常重要的一些偏见，如下：

数据

Reporting bias/报告偏见:人们分享的并不是真实世界频率的反映
Selection Bias/选择偏差:选择不反映随机样本
Out-group homogeneity bias/外群体同质性偏见:在比较态度、价值观、性格特征和其他特征时，人们倾向于认为外部群体成员比内部群体成员更相似

解释

Confirmation bias/确认偏见:倾向于寻找、解释、支持和回忆信息，以确认一个人先前存在的信念或假设
Overgeneralization/泛化过度:根据过于笼统和/或不够具体的信息得出结论
Correlation fallacy/相关性谬误:混淆相关性和因果关系
Automation bias/自动化偏差:人类倾向于喜欢来自自动化决策系统的建议，而不是没有自动化的相互矛盾的信息

再来看另一例子

Selection Bias/选择偏差:选择不反映随机样本

真正影响我们可以从文本中学到的东西的偏差是选择偏差，例如在世界上工人分布就很不一样

Out-group homogeneity bias/外群体同质性偏见：在比较态度、价值观、个性特征和其他特征时，往往群体外的成员认为比群体内的成员更相似。例如，两只小狗正在看四只猫，左边的四只猫之间是非常不同的，但是在狗的眼里他们是相同的。

重要的是延伸到：人类的认知和我们如何处理人

有可能你对每一个你能想到的群体都有一个适当的数据量，但是有些群体的代表性不如其他群体。

三组婚纱照前两个类似西方人的就有许多标签，而第三张则很少。这就是一种偏见，其实我感觉也不太像结婚的。。。

解释偏见

Confirmation bias/确认偏见:倾向于寻找、解释、支持和回忆信息，以确认一个人先前存在的信念或假设（感觉是先入为主）

Overgeneralization/泛化过度:根据过于笼统和/或不够具体的信息得出结论（相关：过拟合）

所有猫都有腿，我也有腿，所有我是只可爱的小猫咪～喵～～～

Correlation fallacy/相关性谬误:混淆相关性和因果关系

Automation bias/自动化偏差:人类倾向于喜欢来自自动化决策系统的建议，而不是没有自动化的相互矛盾的信息

偏见会让他形成回路（恶性循环）

这被称为 Bias Network Effect/偏置网络效应以及 Bias “Laundering”

人类数据延续了人类的偏见。当机器学习从人类数据中学习时，结果是一个偏置网络效应。

“偏见”可以是好的，坏的，中性的

统计以及 ML中的偏差

估计值的偏差：预测值与我们试图预测的正确值之间的差异
“偏差”一词b(如y = mx + b)

认知偏见

确认性偏差、近因性偏差、乐观性偏差

算法偏差

对与种族、收入、性取向、宗教、性别和其他历史上与歧视和边缘化相关的特征相关的人的不公平、不公平或偏见待遇，何时何地在算法系统或算法辅助决策中体现出来”

“虽然神经网络可以说是自己编写程序，但它们只是利用以人类目的而收集的数据，朝着人类设定的目标前进。如果数据有偏差，即使是偶然的，计算机也将放大不公。”
-卫报

预测未来犯罪行为

算法识别潜在的犯罪热点
基于之前报道的犯罪的地方，而不是已知发生在哪里
从过去预测未来事件
预测的是逮捕的地方而不是犯罪的地方

可能会造成一种别人去热点地区就有概率是去搞破坏

预测量刑

Prater (白人)被认为低风险在入店行窃后,尽管两个武装抢劫;一次持械抢劫未遂。
Borden (黑色)被认为高危险因为她和一个朋友(但在警察到来之前返回)一辆自行车和摩托车坐在外面。
两年后，Borden没有被指控任何新的罪行。Prater因重大盗窃罪被判8年有期徒刑。

这个就是一个很明显的偏见行为，可能基于的是白人整体犯罪率低，而黑色人种高，所有以至于Prater犯大错却认为是低风险，而Borden一个小事情则被认为高危险，事实上我们很显然可以知道最后的结局以及判定的不合理性

面临以下情况时的自动化偏差：
●过度概括

●反馈回路

●相关性谬误

犯罪预测

以色列启动 Faception

Faception是第一个科技领域的率先面市的，专有的计算机视觉和机器学习技术分析人员和揭示他们的个性只基于他们的面部图像。

提供专业的引擎从脸的形象识别“高智商”、“白领犯罪”、“恋童癖”,和“恐怖分子”。

主要客户为国土安全和公共安全。

1856张剪短的脸部照片；包括特定地区的“通缉嫌犯”身份证照片。

“对于非犯罪分子来说，鼻尖到嘴角的角度比普通罪犯小19.6%…”

这个就很歧视了。。。罪犯拍照的时候应该非常不开心吧，这样就说是罪犯特征吗。。。

选择偏差+实验者偏差+确认偏差+相关谬误+反馈回路

预测犯罪-媒体闪电战

媒体总是想着能率先发布最新的一首消息，不仅仅是预测犯罪，各行各业都想要一手资料（尤其是火爆的）

（声称）预测受歧视的内在品质

●Wang和Kosinski，Deep neural networks在从面部图像中检测性取向方面比人类更准确，在2017年。
●“性取向检测仪”使用美国一家约会网站上公开资料中的35326张图片。
●“与性取向的产前激素理论(PHT)相一致，男同性恋者和女同性恋者往往具有非典型的性别面部形态。”在自拍中，同性恋和异性恋之间的差异与打扮、表现和生活方式有关，也就是说，文化差异，而不是面部结构的差异

这个也是一种偏见，因为人在社交媒体上表现出来的可能并不是她/他的日常生活，就类似参加舞会的时候穿的很好、很贵的高端衣服，但是平时这个人可能穿朴素的休闲服等·～

男女同性恋和异性恋在自拍中的区别与打扮、表现和生活方式有关，也就是说，文化上的差异，而不是面部结构上的差异。

看看我们在媒体上的长时间回应，“算法是揭示性取向还是暴露我们的刻板印象？”

选择偏差+实验者偏差+相关谬误

测量算法偏差

我们能找到一个很好的评价方案吗？

评估公平性和包容性

分类评估

为每个创建（子组，预测）对
跨子组比较
例如
- 女性，面部检测
- 男性，面部检测

交叉评估

为每个创建（子组1，子组2，预测）对。跨子组比较
例如
- 黑人女性，面部检测
- 白人，面部检测

公平与包容评价：混淆矩阵

蓝色部分为各类指标数

“机会平等”公平准则：子组的 recall 是相等的

“预测平价”公平准则：子组的 precision 是相等

选择评价指标的可接受的假阳性和假阴性之间的权衡

具体选择哪种指标？可以都进行测量，然后选择效果更好的，实际中要根据问题和我们更关注哪个指标。

根据假阳性和假阴性之间可接受的折衷选择评估指标

假阳性可能比假阴性好，例如在图像隐私中

假阳性：不需要模糊的东西会变得模糊。可能会很糟糕。
假阴性：需要模糊的东西不是模糊的。身份盗窃。

假阴性可能比假阳性更好，例如在垃圾邮件过滤中
假阳性：垃圾邮件不会被捕获，所以你会在收件箱中看到它。通常只是有点烦人，但不会有大问题。
假阴性：标记为垃圾邮件的电子邮件已从收件箱中删除。如果是朋友或爱人送的，那就是损失！（我可能当场被打s...开个玩笑～）

人工智能会无意中导致不公正的结果

●缺乏对数据和模型中偏差来源的洞察

●缺乏对反馈回路的洞察

●缺乏仔细、分类的评估

●解释和接受结果时的人为偏见

这取决于我们如何影响人工智能的发展

刚刚也说了嘛～主要是人存在偏见导致的～

开始寻找伦理人工智能进化的路径：今天->找到给定任务、数据等的局部最优值->发表论文，推出产品->获得论文奖，成名->产生人类及其环境的积极成果

我现在感兴趣的工作怎么才能最好地专注于帮助别人呢？

这里有一些我们可以做的事情。

数据真的非常重要～！

了解您的数据：偏差，相关性
从类似的分布放弃单一训练集/测试集
结合来自多个来源的输入
对于困难的用例使用held-out测试集
与专家讨论其他信号

了解数据偏差

这个视频是可以点开的，查看各种图片的偏见/偏差，网站：http://pair-code.github.io

没有一个数据集是没有偏差的，因为这是一个有偏差的世界。重点是知道是什么偏差。在论文中不仅仅提供数据集，更需要告诉我们数据集是谁标注的，以及教育背景等细节信息，虽然数据集存在偏见，但是我们需要知道是什么样的偏见～

使用ML/机器学习技术来减轻和包含偏差

Bias Mitigation/偏差缓解（不偏不倚）

删除有问题的输出的信号（方法一）
- 刻板印象
- 性别歧视,种族歧视,*-ism
- 又称为“debiasing”

Inclusion

添加信号所需的变量（方法二）
- 增加模型性能
- 注意性能很差的子组或数据片

多任务学习提高包容性

多任务+深度学习包含：多任务学习示例（判断临床病人的自杀倾向）
●与UPenn WWP合作
●直接与临床医生合作
●目标：
○当自杀未遂迫在眉睫时，可向临床医生发出警报的系统
○当培训实例很少时诊断的可行性

实验数据集合的来源：

内部数据
- 电子健康记录
  - 病人或病人家属提供
  - 包括心理健康诊断,自杀企图,竞赛
- 社交媒体数据
代理数据
- Twitter 媒体数据
  - 代理心理健康诊断中使用自称诊断（用正则进行提取，如下特征）
    - 我被诊断出患有 X
    - 我试图自杀

单一任务：深度学习

多任务基本Logistic回归分析

使用多个逻辑回归进行判断，提供临床结果，也可使用多任务学习进行嘛，如下

多任务学习

多任务，考虑到发病率、性别等，因此多任务学习实际上对于临床领域的合并症来说是完美的。所谓合并症是：当你有一个条件时，你可能拥有另一个。例如有人创伤后应激障碍更容易出现焦虑和抑郁

提高了子组的性能

明显多任务取得了更好的效果，相比于单任务和逻辑回归模型

为读者读书。。。。

我们采取的方法之一是：语境化和考虑发布这种技术的道德纬度，因为这个容易歧视别人，例如面试中判断出你有自杀倾向，必然会影响结果

对抗性多任务学习减轻偏差

多任务对抗性学习

有个生成，一个负责预测主要任务，另一个负责预测我们没有的东西，想要影响我们的模型。一个是完成我们关心的任务，另一个是移除信号。

监督学习中的机会均等

上述例子就是监督学习中的机会均等一个例子，正在付诸实践～

一个分类器的输出决策应该在敏感特征上是相同的，只要给出正确的决策。

案例研究：对话人工智能毒性（？感觉翻译的有点不太好）

谷歌正在实践的一个消除偏见的项目

Conversation-AI
- ML 提高在线对话的规模
Research Collaboration
- Jigsaw, CAT, several Google-internal teams, and external partners (NYTimes, Wikimedia, etc)

网址：http:// perspectiveapi.com

意外偏差

模型错误地将频繁攻击的身份与毒性联系起来：假阳性偏差

同性恋的分数/毒性特别高，这并不是我们想要的，往往是因为数据集失衡导致的，如下

偏差源和缓解

偏见造成的数据不平衡
- 经常袭击了有毒的身份所占比例评论长度问题
添加维基百科文章中假定的无毒数据来修复这种不平衡
- 原始数据集有127820个例子
- 4620个补充的无毒例子

测量非预期偏差-合成数据集

真实数据的挑战：

现有数据集较小和/或具有虚假相关性
每个例子都是完全独特的：不容易比较偏差

方法：“bias madlibs”：综合生成的“模板化”数据集用于评估

假设

数据集可靠：

○与应用类似的分布
○忽略标注偏见
○无因果分析

深度学习模式

●CNN架构
●预训练手套嵌件
●Keras实施

（下列内容不是很东西～）

测量模型性能

这个模型在区分好的和坏的例子方面有多好？（ROC-AUC）
AUC（对于给定的测试集）=给定两个随机选择的示例，一个在类中（例如一个有毒，另一个没有），AUC是模型给类内示例更高分数的概率。

上图为更高评分的无毒样例

偏差类型

低分组绩效
该模型在子组注释上的性能比在总体注释上的性能差。
指标：子组AUC

偏差类型

子组移位（右）
该模型系统地给来自分组的评论打分更高。
指标：BPSN AUC
（背景阳性亚组阴性）

偏差类型

子组移位（左）
该模型系统地对来自较低分组的评论打分。
公制：BNSP AUC
（背景阴性亚组阳性）

各类指标结果～

在开发的时候记住最后一件事情，努力的创造更深层次、更好的模型然后负责任的发布

目前还没有一个通用的做法来报告模型发布时的工作情况

What It Does
- 一份关注模型性能透明度的报告，以鼓励负责任的人工智能的采用和应用。
How It Works
- 这是一个容易发现的和可用的工件在用户旅程中重要的步骤为一组不同的用户和公共利益相关者。
Why It Matter
- 它使模型开发人员有责任发布高质量和公平的模型。

这是讲师的一些在努力项目，大量不同的人成为模型报告模型卡，更侧重于有关模型的信息，抓住/包括了模型的作用、如何工作的、为什么重要。实际上我们可能需要通过它来了解不同子群体中的工作原理，必须了解数据告诉我们的内容。下面就是一个例子的细节，如下

谁开发的、用途是什么、因素、账户、风险、收益、警告、建议、偏见等

分类交叉评价

然后是定量的关键组成部分，上述是交叉和分解的评估，从这里开始可以轻松的获得不同类型的公平定义，越接近亚组的评价，就越接近数学上公平的东西

期望我们在开发时考虑我们所学到的东西～道德ai

基于YOLOv8的火灾智能检测系统设计与实现斟的是酒中桃深度学习人工智能 pyqt yolo
在各类安全事故中，火灾因其突发性强、破坏力大，一直是威胁人们生命财产安全的重大隐患。传统的火灾检测方式多依赖烟雾传感器、温度传感器等，存在响应滞后、易受环境干扰等问题。随着深度学习技术的飞速发展，基于计算机视觉的火灾检测方法凭借其实时性强、检测范围广等优势，逐渐成为研究热点。本文将简单介绍一款基于深度学习的火灾智能检测系统的设计与实现过程。一、系统整体设计本火灾智能检测系统旨在通过深度学习技术实现
人工智能入门指南：从基础概念到实际应用
前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站。https://www.captainbed.cn/north文章目录1.**人工智能的基本概念**1.1什么是人工智能？1.2人工智能的分类2.**人工智能的核心技术**2.1机器学习（MachineLearning）2.1.1机器学习的类型2.1.2机器学习流程2.2深度学习（DeepLearni
Sequential Thinking：AI深度思考的新范式及其与CoT、ReAct的对比分析码字的字节人工智能 Sequential CoT ReAct
引言：AI深度思考的演进与SequentialThinking的崛起在人工智能技术快速发展的今天，AI模型的思考能力正经历着从简单应答到深度推理的革命性转变。这一演进过程不仅反映了技术本身的进步，更体现了人类对机器智能认知边界的持续探索。早期的大语言模型虽然能够生成流畅的文本，但在处理复杂问题时往往表现出"浅思考"的局限性——答案可能看似合理，却缺乏严谨的推理过程和系统性考量。例如，2022年的一
Datawhale X 魔塔 Ai夏令营 --深度学习基础
一、局部极小值与全局极小值全局极小值：在损失函数的整个定义域内，损失值最小的点。这是我们在训练深度学习模型时希望找到的点，因为它代表着模型的最佳性能。局部极小值：在损失函数的一个局部区域内，损失值达到最小，但在整个函数定义域内可能不是最小的。当优化算法陷入局部极小值时，它可能会误以为已经找到了全局最优解，从而停止搜索。局部极小值的检测两种直观的方法来检测局部极小值：可视化方法：对于低维问题，我们可
深度学习模块实践手册（第十二期）加油吧zkf 目标检测目标检测模块解析与实践深度学习人工智能计算机视觉目标检测 python
56、Ghost模块论文《GhostNet:MoreFeaturesfromCheapOperations》1、作用：Ghost模块是一种轻量级的特征提取模块，旨在通过廉价操作生成更多特征图，减少计算量的同时保持模型性能。传统卷积神经网络在生成特征图时存在大量冗余计算，Ghost模块通过将特征图生成过程分解为两个步骤，有效减少了计算复杂度，特别适合移动端和嵌入式设备部署。2、机制Ghost模块的机
算法工程师必看！个性化信息流推荐算法系统的架构设计与优化实战指南
注：此文章内容均节选自充电了么创始人，CEO兼CTO陈敬雷老师的新书《GPT多模态大模型与AIAgent智能体》（跟我一起学人工智能）【陈敬雷编著】【清华大学出版社】GPT多模态大模型与AIAgent智能体书籍本章配套视频课程【陈敬雷】推荐算法系统实战全系列精品课【陈敬雷】文章目录推荐算法系统系列二算法工程师必看！个性化信息流推荐算法系统的架构设计与优化实战指南更多技术内容总结推荐算法系统系列二算
DETR革命：目标检测的Transformer时代加油吧zkf 目标检测 YOLO python 开发语言人工智能图像处理
《DETR从0到1：目标检测Transformer的崛起》为什么会有DETR？在深度学习目标检测发展史上，2014~2019年几乎被基于卷积神经网络（CNN）的检测器统治：两阶段：FasterR-CNN、MaskR-CNN单阶段：YOLO、SSD、RetinaNet这些检测器虽然效果强大，但背后依赖：✅Anchor（先验框）✅NMS（非极大值抑制）✅特征金字塔、手工设计问题：结构复杂、调参困难、不
深度学习模块实践手册（第十一期）加油吧zkf 目标检测目标检测模块解析与实践深度学习人工智能计算机视觉目标检测 python
46、缩放点积注意力模块论文《AttentionIsAllYouNeed》1、作用：缩放点积注意力（ScaledDot-ProductAttention）是Transformer模型的核心组件，旨在解决序列建模中长距离依赖关系捕捉的问题。传统的循环神经网络（RNN）在处理长序列时存在梯度消失或爆炸的问题，且并行性较差。该模块通过计算查询（Query）、键（Key）和值（Value）之间的相似度，实
【DL经典回顾】激活函数大汇总（四）（Softmax & Softplus附代码和详细公式）夺命猪头 python 机器学习人工智能神经网络 numpy
激活函数大汇总（四）（Softmax&Softplus附代码和详细公式）更多激活函数见激活函数大汇总列表一、引言欢迎来到我们深入探索神经网络核心组成部分——激活函数的系列博客。在人工智能的世界里，激活函数扮演着不可或缺的角色，它们决定着神经元的输出，并且影响着网络的学习能力与表现力。鉴于激活函数的重要性和多样性，我们将通过几篇文章的形式，本篇详细介绍两种激活函数，旨在帮助读者深入了解各种激活函数的
基于NanoDet的健身姿势纠正系统开发 YOLO实战营人工智能 NanoDet 深度学习计算机视觉 ui
1.引言在现代健身行业中，正确的运动姿势至关重要，不仅能提升训练效果，还能预防运动损伤。尤其是在进行一些高强度的力量训练时，如深蹲、俯卧撑等，错误的姿势可能导致肌肉不平衡或关节损伤。传统的健身姿势纠正方式依赖教练的人工指导，但随着人工智能技术的发展，使用计算机视觉和深度学习技术来进行姿势纠正，逐渐成为一种高效且可扩展的解决方案。本文将详细介绍如何基于NanoDet（一个轻量化目标检测模型）开发一个
大模型算法工程师技术路线全解析：从基础到资深的能力跃迁 Mr.小海大模型算法数据挖掘人工智能机器学习深度学习机器翻译 web3
文章目录大模型算法工程师技术路线全解析：从基础到资深的能力跃迁一、基础阶段（0-2年经验）：构建核心知识体系与工程入门数学与机器学习基础编程与深度学习框架NLP与Transformer入门二、进阶阶段（2-4年经验）：深化模型技术与工程落地能力大模型预训练与微调技术预训练原理：数据与任务的协同设计微调工具：参数高效适配与工程优化对齐实践：价值观优化与实证效果分布式训练与框架工具并行策略：多维度协同
Spring AI 概述与功能简介 drebander AI 编程 spring 人工智能 java
SpringAI是一个由Spring团队开发的开源框架，旨在为人工智能（AI）和机器学习（ML）提供一个成熟且高效的开发平台。它将Spring生态系统的设计理念应用于AI开发，尤其强调模块化、可移植性以及简洁的集成。SpringAI提供了丰富的功能，涵盖从AI模型的调用到与数据库的集成等多个方面，帮助开发者构建和管理AI驱动的应用程序。1.SpringAI背景SpringAI的背景源于Spring
Spring AI从入门到精通：构建智能Spring应用的全面指南 java干货仓库 Spring 八股文汇总大模型 spring 人工智能 java
随着人工智能技术的快速发展，将大语言模型（LLM）与企业应用集成已成为趋势。SpringAI作为Spring官方推出的AI集成框架，为开发者提供了便捷、标准化的方式来构建智能应用。本文将从基础概念到高级应用，全面介绍SpringAI的核心功能与实践技巧。一、SpringAI概述1.1什么是SpringAI？SpringAI是VMware于2023年推出的开源框架，旨在简化大语言模型（LLM）与Sp
基于用户画像的商品推荐系统 Dush32 机器学习人工智能 python 推荐算法
随着人工智能和大数据技术的进步，产品推荐系统成为了现代广告与电商平台中不可或缺的部分。通过深度挖掘用户的行为数据，能够为广告主提供精准的用户画像，从而更高效地推荐相关产品，提升购买转化率。本项目基于科大讯飞AI营销云大赛的赛题，目的是利用用户画像进行产品推荐，预测用户是否会购买相应商品。我们使用了机器学习的二分类模型，通过分析用户的性别、年龄、常驻地、机型等信息，来判断用户的付费行为。项目目标：本
【深度学习-Day 36】CNN的开山鼻祖：从LeNet-5到AlexNet的架构演进之路吴师兄大模型深度学习入门到精通 python pytorch 开发语言人工智能 CNN 深度学习大模型
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
对话新希望CDO李旭昶：立足核心诉求，积极拥抱人工智能
“转型焕新，希望无限。”整理|王娴编辑|云舒出品｜极新4月12日，在「2024飞书先进生产力峰会|成都站」活动中，新希望首席数字官李旭昶先生做了主题为“转型焕新，希望无限”的分享。上次见他是4个月前，当时我们聊了1个多小时，内容涉及数字化转型、人工智能、管理、技术商业等话题。今天顺着他分享的内容，将这篇对话分享出来。随着信息科技的发展，我国传统企业在过去几年中逐步进行数字化转型，利用先进的科学技术
飞算科技：以创新科技引领数字化变革，旗下飞算 JavaAI 成开发利器飞算JavaAI开发助手科技
作为国家级高新技术企业，飞算科技专注于自主创新，在数字科技领域持续深耕，用前沿技术为各行业客户赋能，助力其实现数字化转型升级的飞跃。飞算科技凭借深厚的技术积累，将互联网科技、大数据、人工智能等技术与实际应用紧密融合。公司组建了一支由行业资深专家和技术精英构成的团队，他们在相关领域积累了多年实践经验，深刻理解不同行业客户在数字化进程中面临的痛点与挑战。基于这些洞察，飞算科技推出了一系列具有创新性和实
人脸识别实战：使用Python OpenCV 和深度学习进行人脸识别(2)
先自我介绍一下，小编浙江大学毕业，去过华为、字节跳动等大厂，目前阿里P7深知大多数程序员，想要提升技能，往往是自己摸索成长，但自己不成体系的自学效果低效又漫长，而且极易碰到天花板技术停滞不前！因此收集整理了一份《2024年最新Python全套学习资料》，初衷也很简单，就是希望能够帮助到想自学提升又不知道该从何学起的朋友。既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课
Rust+ChatBoxAI：实战
ChatboxAIChatboxAI是一款基于人工智能技术的智能助手工具，旨在通过自然语言交互帮助用户完成多种任务。以下是其核心功能与特点：功能概述多模型支持：可连接OpenAI、Claude、Gemini等主流大语言模型，用户能自由切换不同AI服务。本地运行：支持离线使用，数据隐私性较强，适合敏感信息处理场景。跨平台兼容：提供Windows、macOS和Linux客户端，同步支持移动端应用。核心
【Java架构师的未来与趋势】架构学院 Java成神之路-架构师进阶 java 开发语言
Java架构师的未来与趋势引言Java作为企业级应用开发的主力军，已经走过了25年的历程。在这四分之一个世纪中，Java生态系统经历了从Applet到企业级应用，从单体架构到微服务，从本地部署到云原生的巨大转变。今天，Java架构师正站在新一轮技术变革的十字路口——人工智能、云计算、低代码、边缘计算等新兴技术正深刻重塑软件架构的形态和架构师的角色。据JetBrains《2023Java开发者调查》
丰盛日记第三天幸运星小燕子
第123期NLP执行师二阶4组章艳Day3分享《有效引导他人的能力》学到情绪管理的方法和体验练习中感动的一天，我很开心！1、复习大脑结构:由原始脑、情绪脑、皮质层三部分组成；三部分需要充分配合和相互制约，考虑三赢后，才能做出正确的决定。2、情绪体验小游戏:树和松鼠，让我们提醒不同的情绪感受。3、处理情绪的四个方法:思维、体能、环境、关系；导师建议可以使用呼吸放松法，使自己的情绪可以及时的醒觉→_→
生成式人工智能实战 | 像素卷积神经网络（PixelCNN）盼小辉丶生成式人工智能实战150讲深度学习生成模型 aigc
生成式人工智能实战|像素卷积神经网络0.前言1.PixelCNN工作原理1.1掩码卷积层1.2残差块2.PixelCNN分析3.使用混合分布改进PixelCNN3.1模型构建3.2模型训练0.前言像素卷积神经网络(PixelConvolutionalNeuralNetwork,PixelCNN)是于2016年提出的一种图像生成模型，其根据前面的像素预测下一个像素的概率来逐像素地生成图像，模型可以通
TensorFlow深度学习实战——DCGAN详解与实现盼小辉丶深度学习 tensorflow 生成对抗网络
TensorFlow深度学习实战——DCGAN详解与实现0.前言1.DCGAN架构2.构建DCGAN生成手写数字图像2.1生成器与判别器架构2.2构建DCGAN相关链接0.前言深度卷积生成对抗网络(DeepConvolutionalGenerativeAdversarialNetwork,DCGAN)是一种基于生成对抗网络(GenerativeAdversarialNetwork,GAN)的深度学
【转】【译】How to Handle Very Long Sequences with LSTM（LSTM RNN 超长序列处理）开始奋斗的胖子机器学习 RNN LSTM 序列深度学习
原文地址http://machinelearningmastery.com/handle-long-sequences-long-short-term-memory-recurrent-neural-networks/一个长的输入序列却只对应一个或者一小段输出就是我们经常说的序列标注和序列分类。主要包括下面一些例子：包含上千个词的文件情感分类（NLP）包含上千个时间状态的脑电痕迹分类（Medici
最全2025年AI开发工具深度对比分析：程序员的智能编程助手全指南最新功能、定价策略、使用体验和适用场景 Cursor、GitHub Copilot、Claude 4、Claude Code wei佳人工智能 ai AI编程 webstorm idea vscode
2025年AI开发工具深度对比分析：程序员的智能编程助手全指南引言(不想看文字可直接看后面图表对比）随着人工智能技术的飞速发展，AI编程助手已经从概念走向现实，成为现代软件开发不可或缺的工具。2025年上半年，AI编程工具市场迎来了前所未有的变革，各大厂商纷纷推出革命性功能，从简单的代码补全演进为能够理解完整项目上下文的智能编程代理。据最新市场研究显示，全球AI代码工具市场在2024年达到67亿美
基于cnn和resnet和mobilenet对比实现驾驶员分心检测深度学习乐园 cnn 人工智能神经网络
演示效果及获取项目源码点击文末名片本项目旨在通过深度学习技术，结合卷积神经网络（CNN）模型、ResNet模型和MobileNet模型，实现对驾驶员分心行为的自动检测。我们通过训练这些模型来识别不同的驾驶员分心行为，包括如发短信、通话、喝水等行为。使用的数据集包含驾驶员行为的图片，并且针对每个行为标注了相应的标签（例如"正常驾驶"、"右手发短信"等）。MobileNetV2是Google于2018
Postman + Newman + Jenkins 接口自动化测试 Thomas Kant 自动化测试 postman newman jenkins allure
亲爱的技术爱好者们，热烈欢迎来到Kant2048的博客！我是ThomasKant，很开心能在CSDN上与你们相遇～本博客的精华专栏：【自动化测试】【测试经验】【人工智能】【Python】Postman
无人值守人工智能智慧系统数据分析：深度洞察与未来展望呆码科技人工智能数据分析数据挖掘
无人值守人工智能智慧系统数据分析：深度洞察与未来展望随着科技的飞速发展，人工智能（AI）技术已逐渐渗透到社会经济的各个领域，其中无人值守人工智能智慧系统作为AI技术应用的前沿阵地，正引领着一场深刻的行业变革。这类系统通过集成高级算法、大数据分析、物联网（IoT）及云计算等先进技术，实现了对复杂环境的自主监控、智能决策与高效管理，极大地提升了运营效率，降低了人力成本，并开启了数据驱动决策的新纪元。本
论“人工智能生命体”站在那个高度？（之二）中國龍在廣州人工智能-智能体-具身智能人工智能
第一部分：人工智能生命体人工智能生命体，提及的是《人工智能生命体新启点》一书，原文附后，本文中以本书代表。《人工智能生命体新启点》一书，是在现今科学技术发展，从人工智能、智能体、具身智能等大环境下，形成的一种全新理念的理论指导，以此发展出具有自我意识的人工智能生命体，拥有现代科技并以生命体的形式出现，具备类人类般的思想活动，更好的体现与融入人类的社会环境；具有自我意识的智能生命体就如人类的拥有大脑
医疗AI与融合数据库的整合：挑战、架构与未来展望（上） Allen_Lyb 数智化教程（第二期）人工智能数据库架构
引言随着人工智能（AI）在医疗健康领域的广泛应用，数据已成为医疗AI发展的核心驱动力。然而，医疗数据具有极度的异构性（包括结构化电子病历、医学影像向量、基因组JSON/图结构、传感器时序等），传统数据架构难以高效整合。因数据孤岛、复杂ETL流程以及昂贵维护成本，医疗AI平台通常难以充分发挥价值。融合数据库（ConvergedDatabase/多模态一体化数据库）通过支持SQL、JSON、图、向量、
Spring4.1新特性——综述 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
Schema与数据类型优化 annan211 数据结构 mysql
目前商城的数据库设计真是一塌糊涂，表堆叠让人不忍直视，无脑的架构师，说了也不听。在数据库设计之初，就应该仔细揣摩可能会有哪些查询，有没有更复杂的查询，而不是仅仅突出很表面的业务需求，这样做会让你的数据库性能成倍提高，当然，丑陋的架构师是不会这样去考虑问题的。选择优化的数据类型 1 更小的通常更好更小的数据类型通常更快，因为他们占用更少的磁盘、内存和cpu缓存，
第一节 HTML概要学习 chenke html Web css
第一节 HTML概要学习 1. 什么是HTML HTML是英文Hyper Text Mark-up Language(超文本标记语言)的缩写，它规定了自己的语法规则，用来表示比“文本”更丰富的意义，比如图片，表格，链接等。浏览器（IE,FireFox等）软件知道HTML语言的语法，可以用来查看HTML文档。目前互联网上的绝大部分网页都是使用HTML编写的。打开记事本输入一下内
MyEclipse里部分习惯的更改 Array_06 eclipse
继续补充中---------------------- 1.更改自己合适快捷键windows-->prefences-->java-->editor-->Content Assist--> Activation triggers for java的右侧“.”就可以改变常用的快捷键选中 Text
近一个月的面试总结 cugfy 面试
本文是在学习中的总结，欢迎转载但请注明出处：http://blog.csdn.net/pistolove/article/details/46753275 前言打算换个工作，近一个月面试了不少的公司，下面将一些面试经验和思考分享给大家。另外校招也快要开始了，为在校的学生提供一些经验供参考，希望都能找到满意的工作。
HTML5一个小迷宫游戏 357029540 html5
通过《HTML5游戏开发》摘抄了一个小迷宫游戏，感觉还不错，可以画画，写字，把摘抄的代码放上来分享下，喜欢的同学可以拿来玩玩！ <html> <head> <title>创建运行迷宫</title> <script type="text/javascript"
10步教你上传githib数据张亚雄 git
官方的教学还有其他博客里教的都是给懂的人说得，对已我们这样对我大菜鸟只能这么来锻炼，下面先不玩什么深奥的，先暂时用着10步干净利索。等玩顺溜了再用其他的方法。操作过程（查看本目录下有哪些文件NO.1）ls （跳转到子目录NO.2）cd+空格+目录（继续NO.3）ls （匹配到子目录NO.4）cd+ 目录首写字母+tab键+（首写字母“直到你所用文件根就不再按TAB键了”）（查看文件
MongoDB常用操作命令大全 adminjun mongodb 操作命令
成功启动MongoDB后，再打开一个命令行窗口输入mongo，就可以进行数据库的一些操作。输入help可以看到基本操作命令，只是MongoDB没有创建数据库的命令，但有类似的命令如：如果你想创建一个“myTest”的数据库，先运行use myTest命令，之后就做一些操作（如：db.createCollection('user')）,这样就可以创建一个名叫“myTest”的数据库。一
bat调用jar包并传入多个参数 aijuans
下面的主程序是通过eclipse写的： 1.在Main函数接收bat文件传递的参数（String[] args）如： String ip =args[0]; String user=args[1]; &nbs
Java中对类的主动引用和被动引用 ayaoxinchao java 主动引用对类的引用被动引用类初始化
在Java代码中，有些类看上去初始化了，但其实没有。例如定义一定长度某一类型的数组，看上去数组中所有的元素已经被初始化，实际上一个都没有。对于类的初始化，虚拟机规范严格规定了只有对该类进行主动引用时，才会触发。而除此之外的所有引用方式称之为对类的被动引用，不会触发类的初始化。虚拟机规范严格地规定了有且仅有四种情况是对类的主动引用，即必须立即对类进行初始化。四种情况如下：1.遇到ne
导出数据库提示 outfile disabled BigBird2012 mysql
在windows控制台下，登陆mysql，备份数据库： mysql>mysqldump -u root -p test test > D:\test.sql 使用命令 mysqldump 格式如下： mysqldump -u root -p *** DBNAME > E:\\test.sql。注意：执行该命令的时候不要进入mysql的控制台再使用，这样会报
Javascript 中的 && 和 || bijian1013 JavaScript &&||
准备两个对象用于下面的讨论 var alice = { name: "alice", toString: function () { return this.name; } } var smith = { name: "smith",
[Zookeeper学习笔记之四]Zookeeper Client Library会话重建 bit1129 zookeeper
为了说明问题，先来看个简单的示例代码： package com.tom.zookeeper.book; import com.tom.Host; import org.apache.zookeeper.WatchedEvent; import org.apache.zookeeper.ZooKeeper; import org.apache.zookeeper.Wat
【Scala十一】Scala核心五：case模式匹配 bit1129 scala
package spark.examples.scala.grammars.caseclasses object CaseClass_Test00 { def simpleMatch(arg: Any) = arg match { case v: Int => "This is an Int" case v: (Int, String)
运维的一些面试题 yuxianhua linux
1、Linux挂载Winodws共享文件夹 mount -t cifs //1.1.1.254/ok /var/tmp/share/ -o username=administrator,password=yourpass 或 mount -t cifs -o username=xxx,password=xxxx //1.1.1.1/a /win
Java lang包-Boolean BrokenDreams boolean
Boolean类是Java中基本类型boolean的包装类。这个类比较简单，直接看源代码吧。 public final class Boolean implements java.io.Serializable,
读《研磨设计模式》-代码笔记-命令模式-Command bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.Collection; import java.util.List; /** * GOF 在《设计模式》一书中阐述命令模式的意图：“将一个请求封装
matlab下GPU编程笔记 cherishLC matlab
不多说，直接上代码 gpuDevice % 查看系统中的gpu,,其中的DeviceSupported会给出matlab支持的GPU个数。 g=gpuDevice(1); %会清空 GPU 1中的所有数据,,将GPU1 设为当前GPU reset(g) %也可以清空GPU中数据。 a=1; a=gpuArray(a); %将a从CPU移到GPU中 onGP
SVN安装过程 crabdave SVN
SVN安装过程 subversion-1.6.12 ./configure --prefix=/usr/local/subversion --with-apxs=/usr/local/apache2/bin/apxs --with-apr=/usr/local/apr --with-apr-util=/usr/local/apr --with-openssl=/
sql　行列转换 daizj sql 行列转换行转列列转行
行转列的思想是通过case when 来实现列转行的思想是通过union all 来实现下面具体例子：假设有张学生成绩表(tb)如下: Name Subject Result 张三语文　　74 张三数学　　83 张三物理　　93 李四语文　　74 李四数学　　84 李四物理　　94 */ /* 想变成姓名 &
MySQL--主从配置 dcj3sjt126com mysql
linux下的mysql主从配置：说明：由于MySQL不同版本之间的(二进制日志)binlog格式可能会不一样，因此最好的搭配组合是Master的MySQL版本和Slave的版本相同或者更低， Master的版本肯定不能高于Slave版本。（版本向下兼容） mysql1 : 192.168.100.1 //master mysq
关于yii 数据库添加新字段之后model类的修改 dcj3sjt126com Model
rules: array('新字段','safe','on'=>'search') 1、array('新字段', 'safe')//这个如果是要用户输入的话，要加一下， 2、array('新字段', 'numerical'),//如果是数字的话 3、array('新字段', 'length', 'max'=>100),//如果是文本 1、2、3适当的最少要加一条，新字段才会被
sublime text3 中文乱码解决 dyy_gusi Sublime Text
sublime text3中文乱码解决原因：缺少转换为UTF-8的插件目的：安装ConvertToUTF8插件包第一步：安装能自动安装插件的插件，百度“Codecs33”，然后按照步骤可以得到以下一段代码： import urllib.request,os,hashlib; h = 'eb2297e1a458f27d836c04bb0cbaf282' + 'd0e7a30980927
概念了解：CGI，FastCGI，PHP-CGI与PHP-FPM geeksun PHP
CGI CGI全称是“公共网关接口”(Common Gateway Interface)，HTTP服务器与你的或其它机器上的程序进行“交谈”的一种工具，其程序须运行在网络服务器上。 CGI可以用任何一种语言编写，只要这种语言具有标准输入、输出和环境变量。如php,perl,tcl等。 FastCGI FastCGI像是一个常驻(long-live)型的CGI，它可以一直执行着，只要激活后，不
Git push 报错 "error: failed to push some refs to " 解决 hongtoushizi git
Git push 报错 "error: failed to push some refs to " . 此问题出现的原因是：由于远程仓库中代码版本与本地不一致冲突导致的。由于我在第一次git pull --rebase 代码后，准备push的时候，有别人往线上又提交了代码。所以出现此问题。解决方案： 1： git pull 2：
第四章 Lua模块开发 jinnianshilongnian nginx lua
在实际开发中，不可能把所有代码写到一个大而全的lua文件中，需要进行分模块开发；而且模块化是高性能Lua应用的关键。使用require第一次导入模块后，所有Nginx 进程全局共享模块的数据和代码，每个Worker进程需要时会得到此模块的一个副本（Copy-On-Write），即模块可以认为是每Worker进程共享而不是每Nginx Server共享；另外注意之前我们使用init_by_lua中初
java.lang.reflect.Proxy liyonghui160com
1.简介 Proxy 提供用于创建动态代理类和实例的静态方法（1）动态代理类的属性代理类是公共的、最终的，而不是抽象的未指定代理类的非限定名称。但是，以字符串 "$Proxy" 开头的类名空间应该为代理类保留代理类扩展 java.lang.reflect.Proxy 代理类会按同一顺序准确地实现其创建时指定的接口
Java中getResourceAsStream的用法 pda158 java
1.Java中的getResourceAsStream有以下几种： 1. Class.getResourceAsStream(String path) ： path 不以’/'开头时默认是从此类所在的包下取资源，以’/'开头则是从ClassPath根下获取。其只是通过path构造一个绝对路径，最终还是由ClassLoader获取资源。　　2. Class.getClassLoader.get
spring 包官方下载地址（非maven） sinnk spring
SPRING官方网站改版后，建议都是通过 Maven和Gradle下载，对不使用Maven和Gradle开发项目的，下载就非常麻烦，下给出Spring Framework jar官方直接下载路径: http://repo.springsource.org/libs-release-local/org/springframework/spring/ s
Oracle学习笔记(7) 开发PLSQL子程序和包 vipbooks oracle sql 编程
哈哈，清明节放假回去了一下，真是太好了，回家的感觉真好啊！现在又开始出差之旅了，又好久没有来了，今天继续Oracle的学习！这是第七章的学习笔记，学习完第六章的动态SQL之后，开始要学习子程序和包的使用了……，希望大家能多给俺一些支持啊！编程时使用的工具是PLSQL

2019年CS224N课程笔记-Lecture 19:Safety, Bias, and Fairness

正课内容

原型理论

医生——女医生

人类报告偏差

解释偏见

“偏见”可以是好的，坏的，中性的

测量算法偏差

评估公平性和包容性

公平与包容评价：混淆矩阵

这取决于我们如何影响人工智能的发展

了解数据偏差

使用ML/机器学习技术来减轻和包含偏差

多任务学习提高包容性

单一任务：深度学习

多任务基本Logistic回归分析

多任务学习

提高了子组的性能

为读者读书。。。。

对抗性多任务学习减轻偏差

多任务对抗性学习

监督学习中的机会均等

意外偏差

偏差源和缓解

测量非预期偏差-合成数据集

假设

深度学习模式

测量模型性能

偏差类型

偏差类型

偏差类型

分类交叉评价

你可能感兴趣的:(深度学习,人工智能,NLP,人工智能,深度学习,自然语言处理)