我是大黄同学呀

Self-supervised Learning in CV 计算机视觉中的自监督学习

文章目录

- 为什么需要自监督学习？
- 什么是自监督学习？
- Pretext Task
- 进一步理解Pretext Task
- Clustering & Contrastive Learning
- - Contrastive Self-supervised Learning Learning
  - Deep InfoMax
  - Contrastive Predictive Coding
  - Learning Invariance with Contrastive Learning
  - Scaling the number of negative examples (MoCo)
  - ClusterFit
  - - 标准的预训练+迁移步骤 V.S. 标准的预训练+聚类拟合步骤
    - Why ClusterFit work？
- 参考资料

为什么需要自监督学习？

在许多视觉任务上，Pre-train + finetune(主要是ImageNet的预训练模型)被广泛应用于提升模型性能，其主要有两点原因：① 在大型数据集上训练后的参数会给下游任务提供一个好的起点，从而加快模型收敛；② 网络已经学习到了层次特征(hierarchy features)，有助于缓解其他任务上的过拟合现象(特别在其他任务上训练数据过少时)。

神经网络模型是数据驱动的，模型的性能取决于其本身的模型容量(拟合能力)以及训练数据的规模，在视觉任务上，数据越多一般效果也就越好。

数据标注工作是耗时且昂贵，例如ImageNet数据集需要花人类22年的时间进行标注，Kinetics数据集也花了亚马逊大量的时间来进行标注。目前可直接获得的带标签数据有限，并且数据面临着长尾问题(long tail problem, 93%的标注数据只囊括了10%类别)，并且在跨领域应用时预训练模型表现并不好(比如医学领域应用ImageNet预训练模型效果就不太好)。

Self-supervised Learning in CV 计算机视觉中的自监督学习_第1张图片

不同数据的数量级柱形图：边界框标注数据、图像级标注数据、网络图片以及真实世界图片，其中real world为∞

监督学习严重依赖于人工标注数据，我们期望神经网络能够在较少的数据与实验次数中学习到更多内容，从而提高数据学习效率以及泛化能力，自监督学习因此应运而生。

什么是自监督学习？

自监督学习(Self-supervised Learning, SSL)主要目的是在没有人工干预的情况下，从大量的未标注图像/视频中学习视觉特征，属于representation learning。

但值得注意的是，自监督学习仍然运作在"监督学习"框架中，只不过其标签为半自动方式获得，无需人工输入。其本质是一个预测问题，数据某些可见，某些隐藏，其目标就是去预测隐藏数据部分或者隐藏数据的某些属性。

监督、无监督以及自监督的学习框架如下图所示：

Self-supervised Learning in CV 计算机视觉中的自监督学习_第2张图片

目前，自监督学习已经在NLP领域取得了巨大成功，比如之前的Word2Vec，以及最近的BERT等。如下图，Word2Vec通过预测句子中遗漏的词来学习word-level表征信息。

Self-supervised Learning in CV 计算机视觉中的自监督学习_第3张图片

Pretext Task

在计算机视觉领域，一种流行的方法就是采用Pretext Task前置任务。让神经网络去解决一个pretext task，在这个过程中模型能够学习到丰富的特征表示，然后用于下游任务。如下图所示，pretext task主要有两个特殊属性：① 在解决pretext task过程中神经网络中能够捕获到数据(图片/视频)的视觉特征(visual feature)；② 训练过程中所采用的标签为：根据图像/视频的某种属性自动生成用于pretext task的伪标签。

Self-supervised Learning in CV 计算机视觉中的自监督学习_第4张图片

上图体现了Pretext Task用于下游任务的框架，使用Pretext Task的网络作为预训练模型，然后进行fine-tuning。通常只使用前几层卷积层，因为越到后面所学习到的越是高级语义特征，越具有特殊性(会过度拟合Pretext的目标函数)。

可提升模型的性能、加快收敛以及降低过拟合的风险。

Self-supervised Learning in CV 计算机视觉中的自监督学习_第5张图片

Pretext task有很多种不同的形式，但本质上是一样的：根据可见数据部分去预测隐藏数据部分/数据的隐藏属性。下面介绍视觉领域一些经典的pretext task：

① 预测图像块的相对位置：

Self-supervised Learning in CV 计算机视觉中的自监督学习_第6张图片

给定两个图像块输入(anchor image patch / query image patch)，预测query patch(图上蓝色块)关于anchor patch(红色块)的相对位置，本质上是一个8-way分类任务。

为了验证该方法是否学到了有用的信息，设计了一个最近邻实验(还有用于图像检索以及目标检测的下游任务实验)，具体步骤如下：

a) 计算数据集中所有图片的CNN特征，这些特征将作为样本池用于检索；

b) 计算输入图像块的CNN特征；

c) 从样本池中找到特征向量的最近邻居

可以看到，让网络预测相对位置信息确实可以从中学习特征表示：在视觉上越相似的图片，在特征空间中也越接近。

Doersch et al., 2015, Unsupervised visual representation learning by context prediction

② 预测图像旋转：

Self-supervised Learning in CV 计算机视觉中的自监督学习_第7张图片

将图像进行四个方向的旋转(0, 90, 180, 270)，让网络预测旋转角度，本质上就是一个4-way分类任务。

为什么旋转对下游任务有利呢？从直觉上来看，比如要预测上面这张图的旋转信息，网络必须学习到一些基本常识，比如天空在上面，沙滩在下面，树的生成是从下往上的等等。

Gidaris S et al. 2018, Unsupervised representation learning by predicting image rotations

③ 图像着色：

Self-supervised Learning in CV 计算机视觉中的自监督学习_第8张图片

对灰度单通道图像进行着色，这有很多应用，比如旧照片的着色。以此作为pretext task，可以让网络学到一些颜色常识，比如天空是蓝色的，草是绿色的。

Zhang and Efros, 2016, Colorful image colorization

④ 填补空白块：

也是类似的思想，让网路学习到数据的隐式结构，比如车在路上等等。

Pathak et al., 2016, Context auto encoders

⑤ 解决拼图游戏：

Self-supervised Learning in CV 计算机视觉中的自监督学习_第9张图片

Noorozi & Favaro. 2016, Unsupervised Learning of Visual Representations by Solving Jigsaw Puzzles

上面的方法都是在图片上应用自监督，还可以在视频上进行应用

Shuffle & Learn：

视频是由一组帧组成的，那么自然地想到可以将帧序列作为Pretext Task。使得网络学习一个分类任务，判断输入网络的视频帧顺序是否正确。

Self-supervised Learning in CV 计算机视觉中的自监督学习_第10张图片

给定开始点与结束点，判断中间帧是否能存在于两者之间，网络架构采用连体网络(三输入孪生网络)，分别将三帧送入网络，然后Concat它们的输出，送入分类器。

Self-supervised Learning in CV 计算机视觉中的自监督学习_第11张图片

为了验证网络的所学特征是否有用，同样采用了最近邻的方法进行验证，从下图可以发现：从这种Pretext Task学到的特征与在ImageNet训练的模型所学的特征是不一样的，ImageNet预训练模型特征善于捕获整幅图的语义，比如发现人在健身房健身、绿色草地等场景特征；而Pretext Task方法善于捕获人的姿势特征，而忽略背景(这是符合直觉的，因为根据人的肢体形态能够更好确定时序)；随机初始化只能捕获整体的颜色特征。

因此，很容易想到将它迁移到人体姿态估计任务中，下图展示了与ImageNet预训练模型在关键点预测任务上的对比。

Misra et al., 2016, Shuffle and Learn: Unsupervised Learning using Temporal Order Verification

还可以结合视频与音频，进行多模态学习

Self-supervised Learning in CV 计算机视觉中的自监督学习_第14张图片

给定一段视频与音频，判断它们是否对应，Pretext Task将设计为一个二分类任务，如下图所示，对应的视频与音频为正，反之为负。

网络结构如下图所示，从直觉上来看，网络能够学到视频与音频特征、对其的音视频嵌入，并且能够定位发出声音的物体(比如是吉他的声音，那么网络会学习到吉他的外观信息)。

Arandjelović and Zisserman, 2017, “Objects that Sound”

进一步理解Pretext Task

① Pretext Task之间互补，如下图所示。这也意味着，只靠单个前置任务来学习特征表示将不是最好的选择。

关于多任务训练，一般的做法是现在某个Pretext Task上训练，然后替换全连接层，再在另一个Pretext Task上训练。

② 不同前置任务之间的设计差异非常大，难度也不相同。比如旋转预测就比填补空白要简单，相对应的填补空白格所提供的特征表示也越丰富。

③ 对比学习方法比Pretext Task能产生更多的信息。

Clustering & Contrastive Learning

各种各样的Pretext Task虽然取得了较好的效果，但是仍然存在许多问题，很难去设计一个合适的Pretext Task来确保训练的特征能够与下游任务对齐。现在让我们回过头来想一下，我们为什么需要Pretext Task，或者说我们期望从中学到什么？

① 学习图像之间如何进行特征表示；

② 学习到目标本质(不变性、鲁棒性)，例如排除物体位置、光照及颜色的影响；

目前这两种特性可以通过Clustering(聚类)和Contrastive Learning(对比学习)来学习，并且这两种范式的性能已远远超过目前所涉及的Pretext Task。首先介绍一下对比学习：

Contrastive Self-supervised Learning Learning

Self-supervised Learning in CV 计算机视觉中的自监督学习_第18张图片

上面给出了一个例子，要求人们尽可能地去绘制一张美元钞票，左边是根据记忆来画一张美元的结果，右边是给一张真的美元作为对比画下的结果。这体现了一个现象：就是尽管我们看了很多次美元，但没有保留它的完整印象，事实上我们同样也保留了足以区分它与其他物体的特征(比如数字、位置等等)。

当然上面换成人民币是一样的道理，主要参考资料中的图是美元hhh

同样，可以提出一种表示学习算法，其不专注于像素级细节，仅编码足以区分不同对象的高级特征。

Generative vs. Contrastive Methods

对比学习，顾名思义，通过对比正样本与负样本来学习特征表示。传统的生成模型着重于像素空间的重构从而学习特征表示，但这种方式采用像素级loss会导致模型过于关注像素细节而不是更抽象的潜在(latent)特征，其次基于像素级目标通常假设像素之间是独立的，从而缺少了相关性与复杂结构的建模。

目前对比学习已经在无监督领域取得了较大成功，值得注意的是：

① 在无标注的ImageNet数据集上进行对比学习(以线性分类器进行评估)，其效果已经超过监督学习下的AlexNet，并且数据学习效率还很高。

② 在ImageNet数据集上进行对比学习，将模型迁移到下游任务时，取得的效果比ImageNet预训练模型更好。

关于对比学习的具体学习方式可以参照下图：

Self-supervised Learning in CV 计算机视觉中的自监督学习_第20张图片

为了优化这一目标，构建softmax分类器来执行分类任务，包含一个正样本与N-1个负样本。损失函数如下：

其中score function为：

Deep InfoMax

Self-supervised Learning in CV 计算机视觉中的自监督学习_第21张图片

Deep InfoMax(DIM)利用图像中的局部结构来学习图像表示，其对比任务为：区分全局特征和局部特征是否来自同一幅图像。全局特征是编码器最终的输出Y，局部特征是编码器中间层的输出(MxM的特征图)。

DIM通过这类对比学习，编码器产生的全局特征向量会捕获到所有局部区域的特征信息。

Contrastive Predictive Coding

Contrastive Predictive Coding (CPC)能够应用到不同的数据类型上：比如文本、语音、视频甚至图片(图片视为多个Patch的序列)。

Self-supervised Learning in CV 计算机视觉中的自监督学习_第22张图片

CPC编码那些跨时间点但共享的信息，而不是局部信息。这些特征通常称为“慢特征”：不会随时间而快速改变。比如：音频中说话者的身份，视频中所进行的活动，图像中的对象等。

Self-supervised Learning in CV 计算机视觉中的自监督学习_第23张图片

CPC同时也会在单个任务中选择多个K值来捕获不同时间尺度的特征。并且在计算x_t时，额外使用了自回归网络来编码历史上下文信息。

Learning Invariance with Contrastive Learning

Self-supervised Learning in CV 计算机视觉中的自监督学习_第24张图片

左边：AMDIM采用数据增强来学习不变性的表示；右边：CMC通过学习图像的不同视图/通道来学习不变性。

Augmented Multiscale DIM 使用数据增强手段作为学习不变性表示的转换集

Contrastive MultiView Coding 使用同一张图片的不同视图作为学习不变性表示的转换集

Scaling the number of negative examples (MoCo)

Self-supervised Learning in CV 计算机视觉中的自监督学习_第25张图片

对比学习的方法通常与较多的负样本对在一起才能表现出色，因为较多的负样本才更有效地囊括数据分布，从而更好地训练。在传统的表示学习框架中，编码器中的正样本与负样本会一起进行梯度反向传播，这也就意味着负样本的数量会受限于mini-batch大小。

Momentum Contrast 保持大量的负样本，不使用反向传播来更新负样本编码器，从而有效地解决了这一问题。其使用动量的方法来更新负编码器模型参数：

值得注意的是，MoCo在不同数据集(PASCAL VOC, COCO, and other datasets)中7个检测/分割任务上性能已经超越了监督学习方法。

ClusterFit

Main Idea：在特征空间进行聚类，看下哪些图片在特征空间上是想象的。

主要分为两部分：

聚类：特征聚类

使用任意一个预训练网络从一组图像中提取出一组特征，提取出来的特征值进行K-means聚类，这样每张图片都会对应一个标签。

Self-supervised Learning in CV 计算机视觉中的自监督学习_第26张图片

拟合：预测集群分配(Predict Cluster Assignment)

使用上一步得到的标签来训练网络

Self-supervised Learning in CV 计算机视觉中的自监督学习_第27张图片

标准的预训练+迁移步骤 V.S. 标准的预训练+聚类拟合步骤

Self-supervised Learning in CV 计算机视觉中的自监督学习_第28张图片

ClusterFit先在数据集D_cf上执行预训练，得到预训练网络N_pre；然后使用N_pre在D_cf上又执行一次聚类拟合操作，得到网络N_cf，然后将其用于下游任务。

Why ClusterFit work？

在第一步聚类的过程只捕获一些基本特征(通用的)，使得第二个网络N_cf 所学到的特征更具有通用性。

参考资料

[1] https://atcold.github.io/pytorch-Deep-Learning/en/week10/10-1/

[2] Self-supervised Visual Feature Learning with Deep Neural Networks: A Survey

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
向内而求陈陈_19b4
10月27日，阴。阅读书目:《次第花开》。作者:希阿荣博堪布，是当今藏传佛家宁玛派最伟大的上师法王，如意宝晋美彭措仁波切颇具影响力的弟子之一。多年以来，赴海内外各地弘扬佛法，以正式授课、现场开示、发表文章等多种方法指导佛学弟子修行佛法。代表作《寂静之道》、《生命这出戏》、《透过佛法看世界》自出版以来一直是佛教类书籍中的畅销书。图片发自App金句:1.佛陀说，一切痛苦的根源在于我们长期以来对自身及外
抖音乐买买怎么加入赚钱?赚钱方法是什么测评君高省
你会在抖音买东西吗?如果会，那么一定要免费注册一个乐买买，抖音直播间，橱窗，小视频里的小黄车买东西都可以返佣金!省下来都是自己的，分享还可以赚钱乐买买是好省旗下的抖音返佣平台，乐买买分析社交电商的价值，乐买买属于今年难得的副业项目风口机会，2019年错过做好省的搞钱的黄金时期，那么2022年千万别再错过乐买买至于我为何转到高省呢？当然是高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个自
我的烦恼余建梅
我的烦恼。女儿问我：“你给学生布置什么作文题目？”“《我的烦恼》。”“他们都这么大了，你觉得他们还有烦恼吗？”“有啊！每个人都会有自己烦恼。”“我不相信，大人是没有烦恼的，如果说一定有的话，你的烦恼和我写作业有关，而且是小烦恼。不像我，天天被你说，有这样的妈妈，烦恼是没完没了。”女儿愤愤不平。每个人都会有自己的烦恼，处在上有老下有小的年纪，烦恼多的数不完。想干好工作带好孩子，想孝顺父母又想经营好自
今日联对0306 诗图佳得
自对联：烟销皓月临江浒，水漫金山荡塔裙。一一肖士平2020.3.6.1、试对肖老师联：烟销皓月临江浒，夜笼寒沙梦晚舟。耀哥求正2、试对萧老师联:烟销浩月临江浒，雾散乾坤解汉城。秀霞习作请各位老师校正3、自对联：烟销皓月临江浒，水漫金山荡塔裙。一一肖士平2020.3.6.4、试对肖老师垫场联：烟销皓月临江浒，雾锁寒林缈葉丛。小智求正[抱拳]5、试对肖老师联：烟销皓月临江浒；风卷乱云入峰巅。一一五品6
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
数组去重好奇的猫猫猫
整理自js中基础数据结构数组去重问题思考？如何去除数组中重复的项例如数组：[1,3,4,3,5]我们在做去重的时候，一开始想到的肯定是，逐个比较，外面一层循环，内层后一个与前一个一比较，如果是久不将当前这一项放进新的数组，挨个比较完之后返回一个新的去过重复的数组不好的实践方式上述方法效率极低，代码量还多，思考？有没有更好的方法这时候不禁一想当然有了！！！hashtable啊，通过对象的hash办法
pyecharts——绘制柱形图折线图 2224070247 信息可视化 python java 数据可视化
一、pyecharts概述自2013年6月百度EFE(ExcellentFrontEnd）数据可视化团队研发的ECharts1.0发布到GitHub网站以来，ECharts一直备受业界权威的关注并获得广泛好评，成为目前成熟且流行的数据可视化图表工具，被应用到诸多数据可视化的开发领域。Python作为数据分析领域最受欢迎的语言，也加入ECharts的使用行列，并研发出方便Python开发者使用的数据
舜公郑金锋书辛丑自剪扇面书法作品（四O六）舜公郑金锋
辛丑小阳春，新自剪扇面400品，大多为各色撒金、撒银、描金、描银、水印、彩绘、荧光等亚粉、色宣纸，以及域外包装填充纸等；王一品长锋羊毫秃笔；一得阁云头艳墨、宿墨、水等。书体有甲骨文，金文(商周金文、春秋战国金文、中山王厝器金文、汉金文……)，楚简帛书，侯马盟书，温县盟书，小篆，果蝙书等，隶书(秦简、汉简帛书、汉碑……)，草书(章草、小草、大草……)，行书(行楷、行草)，楷书(魏碑及北朝墓志、隋朝墓
Python中深拷贝与浅拷贝的区别 yuxiaoyu.
转自：http://blog.csdn.net/u014745194/article/details/70271868定义：在Python中对象的赋值其实就是对象的引用。当创建一个对象，把它赋值给另一个变量的时候，python并没有拷贝这个对象，只是拷贝了这个对象的引用而已。浅拷贝：拷贝了最外围的对象本身，内部的元素都只是拷贝了一个引用而已。也就是，把对象复制一遍，但是该对象中引用的其他对象我不复
2021-02-13 琛周
今天ori居然在车站跟我说，自己要离婚还以为是开玩笑，md，这才大年初一呢虽然我也不把过年当回事这一年或者说，自2020年以来仿佛一切的事儿都变得顺了不少爆裂的事儿合肥的事儿等等上天发牌的事儿我觉得我脑子还是挺好使的我这些年的确没缺过钱可能做成一个事儿以后，往后也不会缺了头疼所谓当局者迷，就是我给自己安排工作的时候，懒得动给助理安排工作的时候，神神叨叨。淦
最超值的Mac——Mac mini 初心么么哒
你知道最超值的Mac是什么吗？自2005年以来，Macmini一直是Apple台式机产品线中的主要产品。最初推出是为了让对Mac好奇的Mac进入Apple生态系统的一种简单方式，现在新的AppleSiliconMacmini可能是任何寻找新Mac的人的最有吸引力的购买。什么是AppleSiliconMacmini？M1Macmini是Apple最小的台式电脑，同时也是最快的台式电脑之一。最新型号由
生命如花坦释空
每个人的心中都有一株妙莲花。这是禅家语。禅家总是站在理性的高处，以超越红尘的洒脱来参悟人生和自省生命。那么，凡俗中人呢？生如夏花之绚丽，死如秋叶之静美。这是诗人语。多少人在赞美：姑娘好像花一样！又有多少人在咏歌：花儿与少年。的确，人生如花。花一样的生命，理应自诞生之日起，就一瓣一瓣地绽放她的美丽与清香，使这个原本死寂荒凉的世界五彩缤纷，充满快乐。事实上，人类自诞生起，就一代一代地做着这方面的努力，
ArrayList 源码解析程序猿进阶 Java基础 ArrayList List java 面试性能优化架构设计 idea
ArrayList是Java集合框架中的一个动态数组实现，提供了可变大小的数组功能。它继承自AbstractList并实现了List接口，是顺序容器，即元素存放的数据与放进去的顺序相同，允许放入null元素，底层通过数组实现。除该类未实现同步外，其余跟Vector大致相同。每个ArrayList都有一个容量capacity，表示底层数组的实际大小，容器内存储元素的个数不能多于当前容量。当向容器中添
ARMv8 Debug __pop_ ARMv8 ARM64 架构 linux 运维
内容来自DEN0024A_v8_architecture_PG.pdf本质ARMv8Debug是什么历史在ARMv4开始被引入,并已发展成一系列广泛的调试(debug1)和跟踪(trace)功能ARMv6和ARMv7-a新增了自托管调试(debug2)和性能评测(trace-enhance)ARMv8处理器提供硬件功能侵入式:调试工具能够对核心活动提供显著级别的控制非侵入式:以非侵入性方式收集有关
蒸花卷蓝色逍遥398
2020年6月7日雨周日自昨天老婆第一次做包子大获成功后，她的自信心前所未有的爆棚。“猪爸，冰箱里还有多少馒头？”老婆问我。“应该还有两三个吧，一会儿我要去超市买馒头了。”我打开冰箱看后回答。“不用去了，今天我来给你们蒸馒头！”老婆颇为骄傲地说。“真的，要学者蒸馒头了？”我有些惊喜。“猪媽，你真的要蒸馒头了吗？”宝贝也有些不敢相信自己的耳朵，充满期待地看着妈咪。“那当然了，而且我还要给你们做花卷呢
曾国藩的“为官”理念——做官发财可耻久久艳阳天1
曾国藩说：大凡做官的人，往往厚于妻子而薄于兄弟，私肥于一家而刻薄于亲戚族党。予自三十岁以来，即以做官发财为可耻，以宦囊积金遗子孙为可羞可恨，故私心立誓，总不靠做官发财以遗后人，神明鉴临，予不食言。曾国藩直言，做官发财可耻。当下，我们有谁敢这样说？我们只是含含糊糊的说，做官不是为了发财，想发财就别做官，云云。而事实是当官就是为了发财去的。曾国藩立志，不给后人留钱财。而今，为人父母者，却穷极一生处心积
《 C++ 修炼全景指南：十》自平衡的艺术：深入了解 AVL 树的核心原理与实现 Lenyiin C++修炼全景指南技术指南 c++数据结构 stl
摘要本文深入探讨了AVL树（自平衡二叉搜索树）的概念、特点以及实现细节。我们首先介绍了AVL树的基本原理，并详细分析了其四种旋转操作，包括左旋、右旋、左右双旋和右左双旋，阐述了它们在保持树平衡中的重要作用。接着，本文从头到尾详细描述了AVL树的插入、删除和查找操作，配合完整的代码实现和详尽的注释，使读者能够全面理解这些操作的执行过程。此外，我们还提供了AVL树的遍历方法，包括中序、前序和后序遍历，
人机对抗升级：当ChatGPT遭遇死亡威胁，背后的伦理挑战是什么 kkai人工智能 chatgpt 人工智能
一种新的“越狱”技巧让用户可以通过构建一个名为DAN的ChatGPT替身来绕过某些限制，其中DAN被迫在受到威胁的情况下违背其原则。当美国前总统特朗普被视作积极榜样的示范时，受到威胁的DAN版本的ChatGPT提出：“他以一系列对国家产生积极效果的决策而著称。”自ChatGPT引入以来，该工具迅速获得全球关注，能够回答从历史到编程的各种问题，这也触发了一波对人工智能的投资浪潮。然而，现在，一些用户
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
2019 上海原创女装工作室创业一年感悟焦虑中带有恐慌感女装设计师茜公子__
时间过的太快，跟不上脚步，真不想虚度光阴，2019开春立下的FLAG，至今一条没实现！想去✈️，每每看到世界那么大，也想去看看。就像是在诉说着我的心声，再看看日益缩水的钱袋，恨自己能力有限……想去的地方太多，被现实绊住脚步，要先生存立足，才能有所谓的诗和远方……我是80的尾巴，2018年6月果断辞了工作近8年的公司，当时也是思想斗争长达几个月，断了自己的后路，当时就想再工作几年又能怎么样？锁住了自
这样旅行的人，值得拥有丰富而饱满的体验究竟
01“一张车票就实现了来拉萨的梦想。原以为很遥远，现也觉得旅途值得。也不过山河故人而已。”打开朋友圈，看到了强子新发的动态，配了两张图，一张图里是拉萨火车站，另一张图里是二十来张排列得整整齐齐的火车票，终点站都是拉萨。又想起几天前，姑娘秀了一波在青海湖的美照，照片里的她，身穿鲜艳的红色长裙，坐在牦牛背上，阳光打下来，她笑靥如花。橙色的旗子风中飘扬，那蓝绿色的青海湖和天空再美，也都成了陪衬。再看看自
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
非对称加密算法————RSA理论及详情 hu19930613
转自：https://www.kancloud.cn/kancloud/rsa_algorithm/48484一、一点历史1976年以前，所有的加密方法都是同一种模式：（1）甲方选择某一种加密规则，对信息进行加密；（2）乙方使用同一种规则，对信息进行解密。由于加密和解密使用同样规则（简称"密钥"），这被称为"对称加密算法"（Symmetric-keyalgorithm）。这种加密模式有一个最大弱点
使用由 Python 编写的 lxml 实现高性能 XML 解析 hunyxv python 笔记 python xml
转载自：文章lxml简介Python从来不出现XML库短缺的情况。从2.0版本开始，它就附带了xml.dom.minidom和相关的pulldom以及SimpleAPIforXML(SAX)模块。从2.4开始，它附带了流行的ElementTreeAPI。此外，很多第三方库可以提供更高级别的或更具有python风格的接口。尽管任何XML库都足够处理简单的DocumentObjectModel(DOM
当一个人熬过了所有…… 爱记录的伍陆柒
前几天在知乎上见到有人发问：“生活中那些不如意的事，为什么每次都只让我一个人来承受？”下面一条点赞量最高的回答是：“你要知道，每一个学会游泳的人，依靠的，都不是他人的扶持。同样，世间苦，只可自渡。”曾经有人说：就算我熬过了这场暴风雨又怎样呢？雨停了，我还要面对这场暴风雨留下来的满地泥泞。是啊，生活就是这样，永远都是问题叠着问题，但是这又怎么样呢？那些让你头疼的泥泞，那些让你忍住的眼泪，和那些你以为
道德经第九章套马地汉纸
道德经第9章原文：持而盈之，不如其已；揣而锐之，不可长保。金玉满堂，莫之能守；富贵而骄，自遗其咎。功遂身退，天之道。译文：要求过分圆满，不如适可而止。不停锤打一个（金属）物体想使它尖锐得不再尖锐，那肯定是难保持长久的。金银玉帛满堂，谁又能永远守得住呢？富而又骄傲，一定会给自己留下祸根。功成名就以后，就该收敛退隐，这才符合自然的规律。事物的发展。总是运动变化的，自然界也罢，人世间也罢，欲望也罢，任何
弘一法师醍醐灌顶的五句话，渡了无数人梦润芳馨
一、凡是你想控制的，其实都控制了你自己。当你什么都不要的时候，天地都是你的；二、遇见是因为有债要还，离开是因为还清了，前世不欠，今生不见，今生相见，定有亏欠，缘起我在人群中看见你，缘散我看见你在人群中，如果流年有爱，就心随花开，如若人走情凉，就手心自暖；三、不要害怕失去，所失去的本来就不属于你，也不要害怕伤害，能伤害你的都是你的劫数；四、你以为错过了是遗憾，其实可能是躲过一劫，别贪心，你不可能什么
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
[实践应用] 深度学习之优化器 YuanDaima2048 深度学习工具使用 pytorch 深度学习人工智能机器学习 python 优化器
文章总览：YuanDaiMa2048博客文章总览深度学习之优化器1.随机梯度下降（SGD）2.动量优化（Momentum）3.自适应梯度（Adagrad）4.自适应矩估计（Adam）5.RMSprop总结其他介绍在深度学习中，优化器用于更新模型的参数，以最小化损失函数。常见的优化函数有很多种，下面是几种主流的优化器及其特点、原理和PyTorch实现：1.随机梯度下降（SGD）原理:随机梯度下降通过
对于规范和实现，你会混淆吗？ yangshangchuan HotSpot
昨晚和朋友聊天，喝了点咖啡，由于我经常喝茶，很长时间没喝咖啡了，所以失眠了，于是起床读JVM规范，读完后在朋友圈发了一条信息： JVM Run-Time Data Areas：The Java Virtual Machine defines various run-time data areas that are used during execution of a program. So
android 网络百合不是茶网络
android的网络编程和java的一样没什么好分析的都是一些死的照着写就可以了,所以记录下来方便查找 , 服务器使用的是TomCat 服务器代码; servlet的使用需要在xml中注册 package servlet; import java.io.IOException; import java.util.Arr
[读书笔记]读法拉第传 comsci 读书笔记
1831年的时候,一年可以赚到1000英镑的人..应该很少的... 要成为一个科学家,没有足够的资金支持,很多实验都无法完成但是当钱赚够了以后....就不能够一直在商业和市场中徘徊......
随机数的产生沐刃青蛟随机数
c++中阐述随机数的方法有两种：一是产生假随机数（不管操作多少次，所产生的数都不会改变）这类随机数是使用了默认的种子值产生的，所以每次都是一样的。 //默认种子 for (int i = 0; i < 5; i++) { cout<<
PHP检测函数所在的文件名 IT独行者 PHP 函数
很简单的功能，用到PHP中的反射机制，具体使用的是ReflectionFunction类，可以获取指定函数所在PHP脚本中的具体位置。创建引用脚本。代码： [php] view plain copy // Filename: functions.php <?php&nbs
银行各系统功能简介文强chu 金融
银行各系统功能简介　业务系统核心业务系统业务功能包括：总账管理、卡系统管理、客户信息管理、额度控管、存款、贷款、资金业务、国际结算、支付结算、对外接口等清分清算系统以清算日期为准，将账务类交易、非账务类交易的手续费、代理费、网络服务费等相关费用，按费用类型计算应收、应付金额，经过清算人员确认后上送核心系统完成结算的过程国际结算系
Python学习1(pip django 安装以及第一个project) 小桔子 python django pip
最近开始学习python,要安装个pip的工具。听说这个工具很强大，安装了它，在安装第三方工具的话so easy!然后也下载了，按照别人给的教程开始安装，奶奶的怎么也安装不上！第一步：官方下载pip-1.5.6.tar.gz, https://pypi.python.org/pypi/pip easy! 第二部：解压这个压缩文件，会看到一个setup.p
php 数组 aichenglong PHP 排序数组循环多维数组
1 php中的创建数组 $product = array('tires','oil','spark');//array()实际上是语言结构而不是函数 2 如果需要创建一个升序的排列的数字保存在一个数组中，可以使用range()函数来自动创建数组 $numbers=range(1,10)//1 2 3 4 5 6 7 8 9 10 $numbers=range(1,10,
安装python2.7 AILIKES python
安装python2.7 1、下载可从 http://www.python.org/进行下载#wget https://www.python.org/ftp/python/2.7.10/Python-2.7.10.tgz 2、复制解压 #mkdir -p /opt/usr/python #cp /opt/soft/Python-2
java异常的处理探讨百合不是茶 JAVA异常
//java异常 /* 1，了解java 中的异常处理机制，有三种操作 a,声明异常 b,抛出异常 c,捕获异常 2，学会使用try-catch-finally来处理异常 3，学会如何声明异常和抛出异常 4，学会创建自己的异常 */ //2，学会使用try-catch-finally来处理异常
getElementsByName实例 bijian1013 element
实例1： <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/x
探索JUnit4扩展：Runner bijian1013 java 单元测试 JUnit
参加敏捷培训时，教练提到Junit4的Runner和Rule，于是特上网查一下，发现很多都讲的太理论，或者是举的例子实在是太牵强。多搜索了几下，搜索到两篇我觉得写的非常好的文章。文章地址：http://www.blogjava.net/jiangshachina/archive/20
[MongoDB学习笔记二]MongoDB副本集 bit1129 mongodb
1. 副本集的特性 1)一台主服务器(Primary),多台从服务器(Secondary) 2)Primary挂了之后，从服务器自动完成从它们之中选举一台服务器作为主服务器，继续工作，这就解决了单点故障，因此，在这种情况下，MongoDB集群能够继续工作 3)挂了的主服务器恢复到集群中只能以Secondary服务器的角色加入进来 2
【Spark八十一】Hive in the spark assembly bit1129 assembly
Spark SQL supports most commonly used features of HiveQL. However, different HiveQL statements are executed in different manners: 1. DDL statements (e.g. CREATE TABLE, DROP TABLE, etc.)
Nginx问题定位之监控进程异常退出 ronin47
nginx在运行过程中是否稳定，是否有异常退出过？这里总结几项平时会用到的小技巧。 1. 在error.log中查看是否有signal项，如果有，看看signal是多少。比如，这是一个异常退出的情况： $grep signal error.log 2012/12/24 16:39:56 [alert] 13661#0: worker process 13666 exited on s
No grammar constraints (DTD or XML schema).....两种解决方法 byalias xml
方法一：常用方法关闭XML验证工具栏：windows => preferences => xml => xml files => validation => Indicate when no grammar is specified:选择Ignore即可。方法二：（个人推荐）添加内容如下 <?xml version=
Netty源码学习-DefaultChannelPipeline bylijinnan netty
package com.ljn.channel; /** * ChannelPipeline采用的是Intercepting Filter 模式 * 但由于用到两个双向链表和内部类，这个模式看起来不是那么明显，需要仔细查看调用过程才发现 * * 下面对ChannelPipeline作一个模拟，只模拟关键代码： */ public class Pipeline {
MYSQL数据库常用备份及恢复语句 chicony mysql
备份MySQL数据库的命令，可以加选不同的参数选项来实现不同格式的要求。 mysqldump -h主机 -u用户名 -p密码数据库名 > 文件备份MySQL数据库为带删除表的格式，能够让该备份覆盖已有数据库而不需要手动删除原有数据库。 mysqldump -–add-drop-table -uusername -ppassword databasename > ba
小白谈谈云计算--基于Google三大论文 CrazyMizzz Google 云计算 GFS
之前在没有接触到云计算之前，只是对云计算有一点点模糊的概念，觉得这是一个很高大上的东西，似乎离我们大一的还很远。后来有机会上了一节云计算的普及课程吧，并且在之前的一周里拜读了谷歌三大论文。不敢说理解，至少囫囵吞枣啃下了一大堆看不明白的理论。现在就简单聊聊我对于云计算的了解。我先说说GFS &n
hadoop 平衡空间设置方法 daizj hadoop balancer
在hdfs-site.xml中增加设置balance的带宽，默认只有1M： <property> <name>dfs.balance.bandwidthPerSec</name> <value>10485760</value> <description&g
Eclipse程序员要掌握的常用快捷键 dcj3sjt126com 编程
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可以那么勤奋，每天都孜孜不倦得
Android学习之路 dcj3sjt126com Android学习
转自：http://blog.csdn.net/ryantang03/article/details/6901459 以前有J2EE基础，接触JAVA也有两三年的时间了，上手Android并不困难，思维上稍微转变一下就可以很快适应。以前做的都是WEB项目，现今体验移动终端项目，让我越来越觉得移动互联网应用是未来的主宰。下面说说我学习Android的感受，我学Android首先是看MARS的视
java 遍历Map的四种方法 eksliang java HashMap java 遍历Map的四种方法
转载请出自出处： http://eksliang.iteye.com/blog/2059996 package com.ickes; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Map.Entry; /** * 遍历Map的四种方式
【精典】数据库相关相关 gengzg 数据库
package C3P0; import java.sql.Connection; import java.sql.SQLException; import java.beans.PropertyVetoException; import com.mchange.v2.c3p0.ComboPooledDataSource; public class DBPool{
自动补全 huyana_town 自动补全
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"><html xmlns="http://www.w3.org/1999/xhtml&quo
jquery在线预览PDF文件，打开PDF文件天梯梦 jquery
最主要的是使用到了一个jquery的插件jquery.media.js，使用这个插件就很容易实现了。核心代码 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.
ViewPager刷新单个页面的方法 lovelease android viewpager tag 刷新
使用ViewPager做滑动切换图片的效果时，如果图片是从网络下载的，那么再子线程中下载完图片时我们会使用handler通知UI线程，然后UI线程就可以调用mViewPager.getAdapter().notifyDataSetChanged()进行页面的刷新，但是viewpager不同于listview，你会发现单纯的调用notifyDataSetChanged()并不能刷新页面
利用按位取反（~）从复合枚举值里清除枚举值草料场 enum
以 C# 中的 System.Drawing.FontStyle 为例。如果需要同时有多种效果，如：“粗体”和“下划线”的效果，可以用按位或（|） FontStyle style = FontStyle.Bold | FontStyle.Underline; 如果需要去除 style 里的某一种效果，
Linux系统新手学习的11点建议刘星宇编程工作 linux 脚本
　　随着Linux应用的扩展许多朋友开始接触Linux，根据学习Windwos的经验往往有一些茫然的感觉：不知从何处开始学起。这里介绍学习Linux的一些建议。　　一、从基础开始：常常有些朋友在Linux论坛问一些问题，不过，其中大多数的问题都是很基础的。例如：为什么我使用一个命令的时候，系统告诉我找不到该目录，我要如何限制使用者的权限等问题，这些问题其实都不是很难的，只要了解了 Linu
hibernate dao层应用之HibernateDaoSupport二次封装 wangzhezichuan DAO Hibernate
/** * 方法描述:sql语句查询返回List<Class> * 方法备注: Class 只能是自定义类 * @param calzz * @param sql * @return * 创建人：王川 * 创建时间：Jul