Amusi（CVer）

北大/港大/百度提出CAE：自监督学习新范式！用于SSL的上下文自动编码器

点击下方卡片，关注“CVer”公众号

AI/CV重磅干货，第一时间送达

转载自：机器之心 | 作者：陈小康

来自北京大学、香港大学和百度的研究者近日提出了一种名为CAE的新型 MIM 方法。

掩码建模方法，在 NLP 领域 (例如 BERT) 得到了广泛的应用。随着 ViT 的提出和发展，人们也尝试将掩码图像建模（MIM）应用到视觉领域并取得了一定进展。在此之前，视觉自监督算法主要沿着对比学习（contrastive learning）的思路去设计，而 MIM 无疑打开了新的大门。

来自北京大学、香港大学和百度的研究者近日提出了一种名为CAE的新型 MIM 方法。该方法通过对 “表征学习” 和 “解决前置任务（pretext task）” 这两个功能做完全分离，使得编码器学习到更好的表征，从而在下游任务上实现了更好的泛化性能。

Context Autoencoder for Self-Supervised Representation Learning

论文地址：https://arxiv.org/abs/2202.03026

该研究回答了如下几个问题：

1.MIM 方法中，网络结构的哪个部分是学习表征的，哪个部分是解决前置任务的？

2. 为什么之前典型的对比学习方法，在下游任务 (例如检测、分割) 上只能取得跟监督预训练方法类似的性能？

3.MIM 方法为什么优于目前的对比学习方法？

1. 背景

MIM 是一种自监督表征学习算法。它的主要思路是，对输入图像进行分块和随机掩码操作，然后对掩码区域做一些预测。预测的目标可以是 Token ID (BEiT)，也可以是 RGB 的值 (MAE)。编码器能够通过 MIM 学得一个好的表征，从而在下游任务上取得良好的泛化性能。

近期 MIM 有两个代表性工作：BEiT 和 MAE。

BEiT 使用一个编码器做两件事：(1) 学习一个好的图像表征；(2) 解决前置任务：预测掩码 patch 的 Token ID。编码器的潜力并没有完全被挖掘，只有部分被用来学习表征。
MAE 使用了编码器-解码器架构，编码器负责对可见 patch 进行表征学习，解码器将可见和掩码patch的表征（使用一个可学习的向量）作为输入，预测掩码 patch 的 RGB 值。但是，MAE 在解码器中也会对可见 patch 的表征进行更新，实际上解码器也负责了一部分学习表征的功能。

以上两种方法，都没有充分挖掘编码器的潜力，限制了预训练学习到的表征质量。

2. Context Autoencoder (CAE)

CAE 设计的核心思想是对 “表征学习” 和 “解决前置任务” 这两个功能做分离。研究者希望在预训练时，编码器只负责表征学习，解码器只负责解决前置任务，这样可以尽可能大地挖掘编码器的潜力。CAE 包括 4 个部分：(1) Encoder; (2) Latent contextual regressor; (3) Decoder; (4) Alignment模块。

输入图像通过随机掩码被划分成可见 patch 和掩码 patch 两个部分。具体来说：

编码器（Encoder）是一个 ViT 模型，负责学习可见 patch 的表征。
Latent contextual regressor 通过预测掩码 patch 的表征。Latent contextual regressor 由一系列交叉注意力（cross-attention）模块组成，query 是掩码 patch 的表征，key 和 value 是全部 patch 的表征。在计算 query-key 相似度时，该方法会引入每个 patch 对应的位置编码。在这个阶段，不断更新、变得更加准确，而不会更新，对图像特征的提取这个任务完全交给编码器。
解码器（Decoder）只拿和对应的位置编码作为输入，通过预测掩码 patch 的某些性质，比如 Token ID，或者 RGB 的值。该研究的实验与 BEiT 类似，使用 DALL-E tokenizer 对输入图像 token 化，得到解码器的目标。
潜在表征对齐（Latent representation alignment）通过对添加约束，希望Latent contextual regressor 的输出和编码器的输出在同一编码空间中。该方法将图像的掩码 patch 也输入到编码器，获得这部分的表征。将作为学习的目标。计算的过程不会计算梯度。
损失函数。损失函数由两部分组成：(1) 对解码器预测的监督，使用交叉熵损失; (2) 对和的对齐的监督，使用 MSE损失。

3. 分析

3.1 CAE 关注每个 patch 的表征

CAE 基于可见 patch 的表征，从随机采样的掩码 patch 中做一些预测，这要求 CAE 关注每个 patch 的语义。这不同于典型的对比学习方法 (例如 MoCo v3, SimCLR)，不是只关注图像的全局语义而忽略图像的细节和非主体区域 (比如背景)。

3.2 Latent contextual regressor 的输出和编码器的输出在同一编码空间中

该研究对 Latent contextual regressor 的输出做了约束，希望它能和编码器的输出尽可能接近。这样，解码器会基于编码器学到的编码空间做预测，将对图像的特征提取的重任完全交到了编码器手上，驱使编码器学习到好的表征。

为了验证这一点，该研究用 RGB 值作为解码器目标 (考虑到 Token ID 难以可视化，这里使用 RGB)，训练 CAE。在测试的时候，该研究将全部 patch 输入到编码器，然后跳过 Latent contextual regressor，直接将编码器的输出送进解码器，预测全部 patch 的 RGB 的值。下图展示了预测结果，第一行是原图，第二行是预测，研究者发现仅使用编码器和解码器就可以将图片重建出来，说明编码器的输出和 Latent contextual regressor 的输出属于同一编码空间。

如果训练时不做对齐约束，那么就无法重建，如下图所示，输出都是乱码，说明编码器输出和 Latent contextual regressor 的输出不在一个编码空间中。这使得编码器学到的表征质量有所欠缺，在消融实验部分也有验证。

3.3 CAE 学到的表征可以区分不同类别的对象/stuff

CAE 基于可见 patch 的表征，在掩码 patch 区域做预测，这要求 CAE 对可见 patch 的内容有比较好的理解。举例来说，人们看到一只狗的头部，可以预测出它的身体部分；看到一小片天空，也能预测出它的周围大概率也是一片天空。因此，研究者认为 CAE 学到的表征可以区分不同类别的对象/stuff。为了验证这一点，研究者从 ADE20K 数据集随机采样一些图片输入到编码器。因为 ADE20K 提供了每个像素的类别标签 (150 类)，因此该研究可以使用 t-SNE 对编码器输出的表征进行可视化。如下图所示，每个颜色代表一个类别，左图是 CAE，右图是随机初始化的编码器。研究者发现 CAE 可以有效区分不同类别的对象/stuff (因为是在 ImageNet-1K 进行预训练，所以区分得不够完美)，而随机初始化的编码器无法做到这一点。

3.4 典型的对比学习为什么在下游任务只能取得跟监督预训练差不多的结果？

在对比学习中，随机剪裁（random crop）是一个非常重要的数据增强策略。典型的对比学习（比如 MoCo v3）希望最大化来自同一图像的 2 个不同剪裁之间的全局语义相似度，而最小化来自不同图像的剪裁之间的相似度。

这样为什么能奏效呢？研究者首先分析了随机剪裁的性质。在 SimCLR 论文中提到，随机剪裁是对比学习方法中非常重要的数据增强策略。在 ImageNet-1K 数据集中，图像的主体对象大多处于图像的中心区域，而对图像进行随机剪裁，中心区域有很大的概率被囊括进去，例如下图展示的几个例子，几次剪裁基本都包括了图像的主体对象。

对同一图像的不同剪裁提取全局语义，实际上学到的是原始图像中主体对象的特征，正因如此，同一图像的不同剪裁之间才可能相似。在监督预训练中，受到图像分类标签的约束，网络学习到的也是图像主体区域的特征，这和对比学习学到的知识有很大的相似之处，因此在下游任务表现类似。

3.5 MIM 和对比学习的区别

MIM 方法 (例如 CAE) 基于可见 patch 的表征，对掩码 patch 区域做预测。在做随机掩码时，图像的每个 patch (例如背景区域的对象/stuff) 都有可能被考虑到，而不仅仅是图像的主体区域。为了做好掩码 patch 的预测，CAE 会学好每个 patch 的表征。

该研究对 CAE 以及 MoCo v3 的注意力图做了可视化。如下图所示，第一行是原图，第二行是 MoCo v3，第三行是 CAE。红色表示注意力值更高，蓝色表示注意力值低。处于蓝色边界内部的区域，通过这样的原则筛选：将注意力值从大到小排序后，保留累计和达到所有位置注意力值总和的 50% 的部分。可以看到，MoCo v3 的注意力图主要在图像的主体区域有高响应，而 CAE 能考虑到几乎所有 patch。

4. 实验

该研究使用 ViT-small 和 ViT-base 在 ImageNet-1K 上进行实验。输入图像的分辨率是 224 X 224，patch 大小是 16 X 16，一张图会被划分成 14 X 14 个 patch。每次有 75 个 patch 被随机掩码。

4.1 预训练评估

自监督学习广泛使用线性探测（linear probing）去评测预训练表征的好坏：将编码器的参数固定住，在之后加一个线性分类器进行图像分类。研究者认为线性探测不适合 MIM 方法，因为 MIM 方法通常会学到每个 patch 的表征，不仅包含主体对象的信息，还学到了背景等若干知识，这是多而杂的，不适合直接进行线性分类。因此，研究者提出了一种新的测试指标：注意力探测（attentive probing）。该研究在固定参数的编码器后加上一个简单的交叉注意力模块（没有 FFN）和一个线性分类器，通过注意力机制动态地选择适合做图像分类的信息。

该研究对注意力探测阶段使用的交叉注意力模块做注意力图可视化，发现可以关注到主体对象。

微调、线性探测、注意力探测的结果见下表。

研究者发现一些有趣的现象。(1) 对比学习方法 (MoCo v3, DINO) 的线性探测和注意力探测结果类似。这说明这类方法在预训练时已经将注意力放到了图像的主体对象上面，无需进一步动态筛选即可做好图像分类，这也与之前研究者对对比学习的分析一致。(2) MIM 方法 (例如 CAE) 的注意力探测相比线性探测有很大的提升。这说明 MIM 方法学到了每个 patch 的特征，而不仅仅是图像主体对象的，因此需要做一些筛选才利于图像分类。

4.2 消融实验

该研究对解码器和对齐模块进行消融实验，见下表。单加一个解码器能改进注意力探测的结果，但在下游任务 (分割、检测) 上的提升不明显。使用对齐模块之后能显著提升下游任务的性能，说明约束编码器的输出和 Latent contextual regressor 的输出在同一编码空间非常重要，能提升编码器学到的表征质量。

4.3 语义分割

该研究在 ADE20K 上进行语义分割的实验。网络使用 UperNet，迭代次数为 160K，输入图像分辨率为 512 X 512，使用单尺度测试。对比学习方法和监督预训练方法（DeiT）的结果类似，而 CAE 能取得明显更好的结果。跟其他 MIM 方法相比，CAE 的结果也更好，说明预训练阶段编码器被充分利用，学到的表征更好。

4.4 目标检测、实例分割

该研究使用 Mask-RCNN 和 Cascade-RCNN 两种网络结构进行目标检测和实例分割的实验。其中，使用多尺度训练 12 epoch，测试阶段仅使用单尺度测试。实验结果和语义分割类似：对比学习方法和监督预训练方法的结果类似且较差，CAE 的结果更好。

5 总结

该研究提出了 CAE，设计的核心有两点：(1) 对 “表征学习” 和 “解决前置任务” 这两个功能做完全分离; (2) 在可见 patch 学习到的表征空间中对掩码 patch 做预测。以上两点都是为了驱使编码器学习更好的表征，从而在下游任务取得良好的泛化能力。

此外，该研究对监督预训练方法、对比学习和 MIM 方法进行了分析，认为对比学习和监督预训练主要关注图像的主体区域 (例如 ImageNet-1K 标签集中的对象)，而 MIM 会关注图像的全部 patch，更有利于下游任务。

ICCV和CVPR 2021论文和代码下载

后台回复：CVPR2021，即可下载CVPR 2021论文和代码开源的论文合集

后台回复：ICCV2021，即可下载ICCV 2021论文和代码开源的论文合集

后台回复：Transformer综述，即可下载最新的3篇Transformer综述PDF
CVer-Transformer交流群成立
扫码添加CVer助手，可申请加入CVer-Transformer 微信交流群，方向已涵盖：目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch和TensorFlow等群。
一定要备注：研究方向+地点+学校/公司+昵称（如Transformer+上海+上交+卡卡），根据格式备注，可更快被通过且邀请进群

▲长按加小助手微信，进交流群
CVer学术交流群（知识星球）来了！想要了解最新最快最好的CV/DL/ML论文速递、优质开源项目、学习教程和实战训练等资料，欢迎扫描下方二维码，加入CVer学术交流群，已汇集数千人！

▲扫码进群
▲点击上方卡片，关注CVer公众号

整理不易，请点赞和在看

Open AI在AI人工智能领域的技术安全防护体系 AI智能探索者 AI Agent 智能体开发实战人工智能安全网络 ai
OpenAI在AI人工智能领域的技术安全防护体系关键词：OpenAI、AI安全、技术防护、伦理框架、模型对齐、数据隐私、对抗攻击摘要：本文将深入探讨OpenAI在人工智能领域构建的多层次技术安全防护体系。我们将从基础概念出发，逐步解析OpenAI如何通过技术创新和系统设计来确保AI系统的安全性、可靠性和可控性。文章将涵盖从数据安全到模型对齐，从伦理框架到实际防护技术的全方位内容，帮助读者全面理解现
揭秘自然语言处理在AI人工智能领域的奥秘 AI智能探索者 AI Agent 智能体开发实战人工智能自然语言处理 easyui ai
揭秘自然语言处理在AI人工智能领域的奥秘关键词：自然语言处理、AI人工智能、语言理解、语言生成、语义分析摘要：本文深入探讨了自然语言处理（NLP）在AI人工智能领域的奥秘。首先介绍了自然语言处理的背景，包括目的、预期读者、文档结构和相关术语。接着阐述了自然语言处理的核心概念与联系，通过文本示意图和Mermaid流程图进行展示。详细讲解了核心算法原理和具体操作步骤，并用Python源代码进行阐述。分
Java 编程之策略模式详解勤奋的知更鸟 Java java 策略模式设计模式
一、策略模式策略模式（StrategyPattern）是一种行为型设计模式，它将一组算法或行为封装成独立的类，使它们可以在运行时互相替换。这让你在使用它们时，无需关心内部实现，只要“调度策略”即可。外卖平台下单时，你可以选择专送、自取、商家送，每种方式都是不同的策略，但送达的目的相同。二、举例说明外卖的“配送方式”就是策略！在美团/饿了么平台点外卖时，配送方式多种多样：骑手专送：平台调度骑手商家自
【软件工程】Waitress + Nginx 部署 Python Web 服务 meisongqing nginx python WEB
下面是完整的Windows系统部署方案，使用Waitress作为WSGI服务器运行Python后端，Nginx作为反向代理同时提供前端服务：项目结构text复制下载myapp/├──backend/#Python后端│├──app.py#Flask应用入口│├──requirements.txt#Python依赖│└──api/#API模块├──frontend/#前端文件│├──index.ht
基于python的药品后台销售管理系统 sudo-ikun python django javascript mysql
摘要人类生活的水平不断提高是因为依靠着不断发展变革的信息化科技，从头到尾没有一件事情是可以脱离现代化的发展。科技改变了生活，同时也造就了多种多样的生活方式，有了“美团”我们可以足不出户吃便天下美食；有了“京东”我们可以享受到各种各样电子科技产品第一时间带来的快感；有了“淘宝”每逢四季我们可以第一时间感受到潮流的服装，这些都是科技的力量，也是科技给我们的生活带来的一种方式。中药销售一直是我们社会大家
【LangChain编程：从入门到实践】AI 大模型检索增强生成 RAG 实践 AI智能应用 Python入门实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
LangChain编程：从入门到实践-AI大模型检索增强生成RAG实践关键词：LangChain,RAG,大语言模型,检索增强生成,向量数据库,嵌入模型,提示工程1.背景介绍在人工智能和自然语言处理领域,大语言模型(LargeLanguageModels,LLMs)的出现无疑是一个重大突破。像GPT-3、GPT-4这样的模型展现出了惊人的语言理解和生成能力,为各种应用场景带来了无限可能。然而,这些
【华为OD机试真题 2025B卷】767、寻找最大价值的矿堆 | 机试真题+思路参考+代码解析（C++、Java、Py、C语言、JS） KJ.JK OJ+最新华为OD机试 (C++Java Py C JS)华为od c++java 华为OD机试真题 2025B卷 javascript c语言寻找最大价值的矿堆
文章目录一、题目题目描述输入输出样例1二、代码与思路参考C++语言思路C++代码Java语言思路Java代码Python语言思路Python代码C语言思路C代码JS语言思路JS代码作者：KJ.JK订阅本专栏后即可解锁在线OJ刷题权限专栏介绍：最新的华为OD机试题目总结，使用C++、Java、Python、C语言、JS五种语言进行解答，每个题目的思路分析都非常详细，支持在线OJ评测刷题！！！！订阅后
基于深度学习的线上问诊系统设计与实现（Python+Django+MySQL）神经网络15044 深度学习算法神经网络 python 深度学习 django 机器学习人工智能算法目标检测
基于深度学习的线上问诊系统设计与实现（Python+Django+MySQL）一、系统概述本系统结合YOLOv8目标检测和ResNet50图像分类算法，构建了一个智能线上问诊平台。系统支持用户上传医学影像（皮肤照片/X光片），自动分析并生成诊断报告，同时提供医生审核功能。二、技术栈后端框架：Django4.2数据库：MySQL8.0深度学习：YOLOv8：皮肤病变区域检测ResNet50：肺炎X光
Python,Go开发穷游宝典APP Geeker-2025 python golang
以下是为使用**Python和Go开发"穷游宝典APP"**设计的创新技术方案，结合两种语言优势实现低成本、高智能的旅行体验：---###**技术栈分工**|**技术**|**核心优势**|**在穷游APP中的应用**||----------|--------------------------|------------------------------------------||**Pytho
Django REST framework - 序列器关系 djangopython
简介数据结构而非算法是编程的核心。—RobPike关系字段用于表示模型间的关系。它们可以应用于ForeignKey、ManyToManyField和OneToOneField关系，以及反向关系和自定义关系（如GenericForeignKey）。注意：关系字段在relations.py中声明，但按照惯例，应从serializers模块导入，使用fromrest_frameworkimportser
后端Spring Data Elasticsearch的集群故障恢复 AI大模型应用实战 spring elasticsearch java ai
后端SpringDataElasticsearch的集群故障恢复关键词：SpringDataElasticsearch、集群故障恢复、分布式系统、故障处理、数据一致性摘要：本文围绕后端SpringDataElasticsearch的集群故障恢复展开深入探讨。首先介绍了相关背景，包括目的范围、预期读者等。接着阐述了核心概念与联系，详细讲解了核心算法原理及具体操作步骤，并结合数学模型和公式进行说明。通
Python,Go开发数据流量分配查询APP Geeker-2025 python golang
#数据流量分配查询应用我将设计一个基于Python和Go开发的数据流量分配查询应用，帮助用户监控和分析网络流量分配情况。##设计思路这个应用将实现以下核心功能：-实时监控网络流量分配情况-多维度流量数据分析（设备、应用、时间段）-流量分配策略设置与管理-异常流量告警系统-直观的数据可视化展示##技术架构```前端(Python+Streamlit)后端(Go)┌──────────────────
《48小时极速开发：Python+MySQL 学生信息管理系统架构实战揭秘》 Cyber4K Python 项目实践及实战 python mysql 架构
Python项目实践：学生信息管理系统1.项目概述1.1项目背景开发周期：2天（需求分析0.5天+开发1天+测试0.5天）技术栈：Python3.9+MySQL+面向对象编程核心价值：实现学生信息的全生命周期管理采用分层架构设计（表示层/业务层/数据层）数据库驱动的高效数据持久化方案1.2系统架构系统架构调用CRUD操作连接池业务逻辑层命令行界面数据访问层MySQL数据库2.核心模块实现2.1数据
python里面的全局变量和局部变量的区别（很好的一篇文章，找不到出处，原作者看到请联系，我会署上名字） scuter_yu 全局变量与局部变量的区别 python
python中，对于变量作用域的规定有些不一样。在诸如C/C++、java等编程语言中，默认在函数的内部是可以直接访问在函数外定义的全局变量的，但是这一点在python中就会有问题，下面是一个例子。[plain]viewplaincopy在CODE上查看代码片派生到我的代码片test.py:#!/usr/bin/pythonCOUNT=1deffunc():COUNT=COUNT+1func()P
LeetCode第300题_最长递增子序列 @蓝莓果粒茶算法 leetcode 算法职场和发展学习 c#游戏 python
LeetCode第300题：最长递增子序列文章摘要本文详细解析LeetCode第300题"最长递增子序列"，这是一道考察动态规划和二分查找的中等难度题目。文章提供了动态规划和贪心+二分查找两种实现方案，包含C#、Python、C++三种语言实现，配有详细的算法分析和性能对比。适合学习动态规划和二分查找的读者。核心知识点：动态规划、二分查找、贪心算法难度等级：中等推荐人群：具备基础算法知识，想要提升
LeetCode第301题_删除无效括号 @蓝莓果粒茶算法 leetcode 算法职场和发展 c#学习 python c++
LeetCode第301题：删除无效括号文章摘要本文详细解析LeetCode第301题"删除无效括号"，这是一道考察DFS和括号匹配的困难难度题目。文章提供了DFS和BFS两种实现方案，包含C#、Python、C++三种语言实现，配有详细的算法分析和性能对比。适合学习深度优先搜索和字符串处理的读者。核心知识点：DFS、BFS、括号匹配、字符串处理难度等级：困难推荐人群：具备基础算法知识，想要提升搜
Python复制方法“=/copy/deepcopy”的区别 superlitong 笔记经验 python list 列表机器学习人工智能
1、当复制的值是不可变对象（数值，字符串，元组）时，=/copy/deepcopy三者没有区别。测试代码：importcopya='abcdefgh'b=ac=copy.copy(a)d=copy.deepcopy(a)print(a,b,c,d)print(id(a),id(b),id(c),id(d))a+='x'#相当于重新赋值，把a这个标签重新贴到了一个新的箱子print(a,b,c,d)
Python binary search二分查找算法详解及源码猿来如此yyy Python算法详解及源码算法 python 排序算法开发语言数据库人工智能数据结构
二分查找算法是一种在有序数组中查找特定元素的常用算法。它的基本思想是将要查找的元素与数组的中间元素进行比较，如果相等，则返回该元素的索引；如果要查找的元素比中间元素小，则在数组的左半部分继续查找；如果要查找的元素比中间元素大，则在数组的右半部分继续查找。通过不断缩小查找范围，最终可以找到要查找的元素或确定该元素不存在于数组中。二分查找算法的优点是时间复杂度为O(logn)，效率较高。这是因为每一次
python中copy和deepcopy详细区别 jialun0116 python 列表 python
python中copy和deepcopy在python中，标识一个对象唯一身份的是：对象的id(内存地址)，对象类型，对象值。deepcopy是真正意义上的复制，深拷贝，被复制对象完全复制一遍作为独立的新个体，新开辟一块空间。等于赋值，浅拷贝，不会产生独立对象，只是对原有数据块打上新标签，其中一个标签改变，数据块就会变化。copy仅拷贝对象本身，浅拷贝不会对其中的子对象进行拷贝，对子对象进行修改也
python 几种排序方法与二分查找愤怒的玉米棒 python学习小结 python
#选择排序defselectionSort(arr):#-1虽然有n个数字但是没有第n轮最多n-1轮foriinrange(0,len(arr)-1):forjinrange(i+1,len(arr)):ifarr[i]>arr[j]:arr[i],arr[j]=arr[j],arr[i]print(arr)#冒泡排序defbubbleSort(arr):#-1虽然有n个数字但是没有第n轮最多n-
Python二分查找库bisect 来个大包的二重积分编程基础 python 算法排序算法
找暑期实习的时候做到某厂的笔试题里面用到这个，就总结一下。。。1.bisect_left(a,x,lo=0,hi=len(a))功能：在已排序序列a中查找元素x应该插入的位置，并返回最左侧的插入位置（index啊）。区别：如果有多个相同元素，bisect_left返回最左侧的插入位置。默认情况下，查找范围是整个序列a，但可以通过lo和hi参数来限制查找范围。2.bisect_right(a,x,l
【python】赋值操作（=）、切片、copy()、deepcopy()经常分不清。叶阿猪 python python 数据结构开发语言
切片（Slicing）、copy()（浅拷贝）和deepcopy()在Python中都涉及复制操作，但复制的深度和方式有所不同。而赋值操作不涉及复制，只是改变变量与对象之间的绑定关系。本文将详细讲解这几种方式的区别。一、赋值操作（=）定义：将值或引用绑定到变量名上。特性：赋值操作不会创建值的副本，它只是将变量名与现有的值或引用关联起来。如果赋值的值是可变对象（如列表、字典等），则变量名将引用该对象
【Python】第一弹：对 Python 的认知敖云岚 python 开发语言
目录一、Python的背景1.1.Python的由来1.2Python的作用1.3Python的优缺点1.4Python的开发工具一、Python的背景1.1.Python的由来Python由荷兰数学和计算机科学研究学会的吉多・范罗苏姆（GuidovanRossum）在20世纪80年代末至90年代初开发，并于1991年正式发布。当时，计算机领域正朝着更高效、更便捷的编程方向发展，吉多希望创造一门语
2025B卷最新华为OD机试,独家整理总结上岸技巧,考试题库清单(Python/JS/C/C++/JAVA/GO)持续收录中无限码力华为od 华为OD机试华为OD2025B卷华为机试2025B卷华为OD机考2025B卷华为OD2025B卷题库
2025华为OD机试2025B卷华为OD上机考试由5月9号统一切换至华为OD2025B卷，现在刷2025B卷，刷得越多，通过率越高。题库链接最新华为OD机试(C++/C/Python/JavaScript/GO)目录提供在线OJ环境刷题:(私信联系开通)在线OJ私信联系开通OJ环境+使用介绍：私信联系开通2025最新华为OD真题目录华为OD面试手撕代码高频题华为OD机试2025B卷题单下面精心为大
华为OD 机试 2025 B卷 - 最大报酬 (C++&Python&JAVA&JS&GO) 无限码力华为OD机试真题刷题笔记华为od 算法华为OD2025B卷华为OD机试2025B卷华为OD机考2025B卷
最大报酬2025B卷目录点击查看：华为OD机试2025B卷真题题库目录｜机考题库+算法考点详解2025B卷100分题型题目描述小明每周上班都会拿到自己的工作清单，工作清单内包含n项工作，每项工作都有对应的耗时时间（单位h）和报酬，工作的总报酬为所有已完成工作的报酬之和，那么请你帮小明安排一下工作，保证小明在指定的工作时间内工作收入最大化。输入描述T代表工作时长（单位h，00），w代表该项工作的报酬
2025 华为OD机试 B卷 - 考勤信息 (C++ & Python & JAVA & JS & GO) 无限码力华为OD机试真题刷题笔记华为od 华为OD2025B卷华为OD机试2025B卷华为OD机试
考勤信息华为OD机试2025B卷真题目录:点击去查看华为OD2025B卷100分题型题目描述公司用一个字符串来表示员工的出勤信息absent：缺勤late：迟到leaveearly：早退present：正常上班现需根据员工出勤信息，判断本次是否能获得出勤奖，能获得出勤奖的条件如下：缺勤不超过一次；没有连续的迟到/早退；任意连续7次考勤，缺勤/迟到/早退不超过3次。输入描述用户的考勤数据字符串记录条
华为OD机试2025B卷 - 比赛 (C++ & Python & JAVA & JS & GO) 无限码力华为OD机试真题刷题笔记华为od 华为OD2025B卷华为OD机考2025B卷华为OD机试华为OD机试2025B卷
比赛2025B卷目录点击查看：华为OD机试2025B卷真题题库目录｜机考题库+算法考点详解华为OD2025B卷100分题型题目描述一个有N个选手参加比赛，选手编号为1~N（3<=N<=100），有M（3<=M<=10）个评委对选手进行打分。打分规则为每个评委对选手打分，最高分10分，最低分1分。请计算得分最多的3位选手的编号。如果得分相同，则得分高分值最多的选手排名靠前(10分数量相同，则比较9分
基于OpenCv的运动物体检测算法 Liu_LongPo 计算机视觉 OpenCv 运动物体检测
基于一个实现的基于OpenCv的运动物体检测算法，可以用于检测行人或者其他运动物体。#include#include#include#includeintmain(intargc,char**argv){//声明IplImage指针IplImage*pFrame=NULL;IplImage*pFrImg=NULL;IplImage*pBkImg=NULL;CvMat*pFrameMat=NULL;
AI离全社会普及，只差一个计算中心？ a13163944010 人工智能
过去十年，人工智能（AI）大爆炸，并第一次走进普通人的生活。但蓬勃发展的AI却碰到一个空前棘手的问题：自2012年以来，AI算力需求6年增长30万倍，远超摩尔定律！人类现有的基础设施，已跟不上AI算力需求的增长。未来，该怎么办？【1】一百多年前，人类也曾面临同样的难题。1866年，德国西门子发明自激发电机，开启了人类的电力时代。此后十几年，虽然很多企业纷纷采用电能这种新的动力，但一台电机只能供应一
免费小学口算出题器：自动生成语数英题目支持打印导出小龙软件库开源软件电脑 windows
各位家有小学生的宝爸宝妈们，还有辛勤的老师们，快来听我说！你们有没有过这样的经历，想给孩子找点合适的练习题，结果翻遍资料也找不到，累得头晕眼花？别急，小学生出题软件这一神器闪亮登场啦！软件下载地址这软件就是专门给小学阶段孩子量身打造的智能教育小帮手。它能帮家长和老师轻松地弄出符合孩子学习进度的练习题。软件有个预设算法，能自动生成数学、语文、英语这些科目的题目。数学题那是应有尽有，加减乘除、分数运算
矩阵求逆（JAVA）利用伴随矩阵 qiuwanchi 利用伴随矩阵求逆矩阵
package gaodai.matrix; import gaodai.determinant.DeterminantCalculation; import java.util.ArrayList; import java.util.List; import java.util.Scanner; /** * 矩阵求逆(利用伴随矩阵) * @author 邱万迟
单例（Singleton）模式 aoyouzi 单例模式 Singleton
3.1 概述如果要保证系统里一个类最多只能存在一个实例时，我们就需要单例模式。这种情况在我们应用中经常碰到，例如缓存池，数据库连接池，线程池，一些应用服务实例等。在多线程环境中，为了保证实例的唯一性其实并不简单，这章将和读者一起探讨如何实现单例模式。 3.2
[开源与自主研发]就算可以轻易获得外部技术支持,自己也必须研发 comsci 开源
现在国内有大量的信息技术产品，都是通过盗版，免费下载，开源，附送等方式从国外的开发者那里获得的。。。。。。虽然这种情况带来了国内信息产业的短暂繁荣，也促进了电子商务和互联网产业的快速发展，但是实际上，我们应该清醒的看到，这些产业的核心力量是被国外的
页面有两个frame,怎样点击一个的链接改变另一个的内容 Array_06 UI XHTML
<a src="地址" targets="这里写你要操作的Frame的名字" />搜索然后你点击连接以后你的新页面就会显示在你设置的Frame名字的框那里 targerts="",就是你要填写目标的显示页面位置 ===================== 例如： <frame src=&
Struts2实现单个/多个文件上传和下载 oloz 文件上传 struts
struts2单文件上传：步骤01:jsp页面  　　<form action="fileUplo
推荐10个在线logo设计网站 362217990 logo
在线设计Logo网站。 1、http://flickr.nosv.org（这个太简单） 2、http://www.logomaker.com/?source=1.5770.1 3、http://www.simwebsol.com/ImageTool 4、http://www.logogenerator.com/logo.php?nal=1&tpl_catlist[]=2 5、ht
jsp上传文件香水浓 jsp fileupload
1. jsp上传 Notice： 1. form表单 method 属性必须设置为 POST 方法，不能使用 GET 方法 2. form表单 enctype 属性需要设置为 multipart/form-data 3. form表单 action 属性需要设置为提交到后台处理文件上传的jsp文件地址或者servlet地址。例如 uploadFile.jsp 程序文件用来处理上传的文
我的架构经验系列文章 - 前端架构 agevs JavaScript Web 框架 UI jQuer
框架层面：近几年前端发展很快，前端之所以叫前端因为前端是已经可以独立成为一种职业了，js也不再是十年前的玩具了，以前富客户端RIA的应用可能会用flash/flex或是silverlight，现在可以使用js来完成大部分的功能，因此js作为一门前端的支撑语言也不仅仅是进行的简单的编码，越来越多框架性的东西出现了。越来越多的开发模式转变为后端只是吐json的数据源，而前端做所有UI的事情。MVCMV
android ksoap2 中把XML(DataSet) 当做参数传递 aijuans android
我的android app中需要发送webservice ，于是我使用了 ksop2 进行发送，在测试过程中不是很顺利,不能正常工作.我的web service 请求格式如下 [html] view plain copy <Envelope xmlns="http://schemas.
使用Spring进行统一日志管理 + 统一异常管理 baalwolf spring
统一日志和异常管理配置好后，SSH项目中，代码以往散落的log.info() 和 try..catch..finally 再也不见踪影！统一日志异常实现类： [java] view plain copy package com.pilelot.web.util; impor
Android SDK 国内镜像 BigBird2012 android sdk
一、镜像地址： 1、东软信息学院的 Android SDK 镜像，比配置代理下载快多了。配置地址， http://mirrors.neusoft.edu.cn/configurations.we#android 2、北京化工大学的： IPV4:ubuntu.buct.edu.cn IPV4:ubuntu.buct.cn IPV6:ubuntu.buct6.edu.cn
HTML无害化和Sanitize模块 bijian1013 JavaScript AngularJS Linky Sanitize
一.ng-bind-html、ng-bind-html-unsafe AngularJS非常注重安全方面的问题，它会尽一切可能把大多数攻击手段最小化。其中一个攻击手段是向你的web页面里注入不安全的HTML，然后利用它触发跨站攻击或者注入攻击。考虑这样一个例子，假设我们有一个变量存
[Maven学习笔记二]Maven命令 bit1129 maven
mvn compile compile编译命令将src/main/java和src/main/resources中的代码和配置文件编译到target/classes中，不会对src/test/java中的测试类进行编译 MVN编译使用 maven-resources-plugin:2.6:resources maven-compiler-plugin:2.5.1:compile &nbs
【Java命令二】jhat bit1129 Java命令
jhat用于分析使用jmap dump的文件，，可以将堆中的对象以html的形式显示出来，包括对象的数量，大小等等，并支持对象查询语言。 jhat默认开启监听端口7000的HTTP服务，jhat是Java Heap Analysis Tool的缩写 1. 用法： [hadoop@hadoop bin]$ jhat -help Usage: jhat [-stack <bool&g
JBoss 5.1.0 GA:Error installing to Instantiated: name=AttachmentStore state=Desc ronin47
进到类似目录 server/default/conf/bootstrap，打开文件 profile.xml找到： Xml代码<bean name="AttachmentStore" class="org.jboss.system.server.profileservice.repository.AbstractAtta
写给初学者的6条网页设计安全配色指南 brotherlamp UI ui自学 ui视频 ui教程 ui资料
网页设计中最基本的原则之一是，不管你花多长时间创造一个华丽的设计，其最终的角色都是这场秀中真正的明星——内容的衬托我仍然清楚地记得我最早的一次美术课，那时我还是一个小小的、对凡事都充满渴望的孩子，我摆放出一大堆漂亮的彩色颜料。我仍然记得当我第一次看到原色与另一种颜色混合变成第二种颜色时的那种兴奋，并且我想，既然两种颜色能创造出一种全新的美丽色彩，那所有颜色
有一个数组，每次从中间随机取一个，然后放回去，当所有的元素都被取过，返回总共的取的次数。写一个函数实现。复杂度是什么。 bylijinnan java 算法面试
import java.util.Random; import java.util.Set; import java.util.TreeSet; /** * http://weibo.com/1915548291/z7HtOF4sx * #面试题#有一个数组，每次从中间随机取一个，然后放回去，当所有的元素都被取过，返回总共的取的次数。 * 写一个函数实现。复杂度是什么
struts2获得request、session、application方式 chiangfai application
1、与Servlet API解耦的访问方式。 a.Struts2对HttpServletRequest、HttpSession、ServletContext进行了封装，构造了三个Map对象来替代这三种对象要获取这三个Map对象，使用ActionContext类。 -----> package pro.action; import java.util.Map; imp
改变python的默认语言设置 chenchao051 python
import sys sys.getdefaultencoding() 可以测试出默认语言，要改变的话，需要在python lib的site-packages文件夹下新建： sitecustomize.py，这个文件比较特殊，会在python启动时来加载，所以就可以在里面写上： import sys sys.setdefaultencoding('utf-8') &n
mysql导入数据load data infile用法 daizj mysql 导入数据
我们常常导入数据！mysql有一个高效导入方法，那就是load data infile 下面来看案例说明基本语法： load data [low_priority] [local] infile 'file_name txt' [replace | ignore] into table tbl_name [fields [terminated by't'] [OPTI
phpexcel导入excel表到数据库简单入门示例 dcj3sjt126com PHP Excel
跟导出相对应的，同一个数据表，也是将phpexcel类放在class目录下，将Excel表格中的内容读取出来放到数据库中 <?php error_reporting(E_ALL); set_time_limit(0); ?> <html> <head> <meta http-equiv="Content-Type"
22岁到72岁的男人对女人的要求 dcj3sjt126com
22岁男人对女人的要求是：一，美丽，二，性感，三，有份具品味的职业，四，极有耐性，善解人意，五，该聪明的时候聪明，六，作小鸟依人状时尽量自然，七，怎样穿都好看，八，懂得适当地撒娇，九，虽作惊喜反应，但看起来自然，十，上了床就是个无条件荡妇。 32岁的男人对女人的要求，略作修定，是：一，入得厨房，进得睡房，二，不必服侍皇太后，三，不介意浪漫蜡烛配盒饭，四，听多过说，五，不再傻笑，六，懂得独
Spring和HIbernate对DDM设计的支持 e200702084 DAO 设计模式 spring Hibernate 领域模型
A：数据访问对象 DAO和资源库在领域驱动设计中都很重要。DAO是关系型数据库和应用之间的契约。它封装了Web应用中的数据库CRUD操作细节。另一方面，资源库是一个独立的抽象，它与DAO进行交互，并提供到领域模型的“业务接口”。资源库使用领域的通用语言，处理所有必要的DAO，并使用领域理解的语言提供对领域模型的数据访问服务。
NoSql 数据库的特性比较 geeksun NoSQL
Redis 是一个开源的使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库，并提供多种语言的API。目前由VMware主持开发工作。 1. 数据模型作为Key-value型数据库，Redis也提供了键（Key）和值（Value）的映射关系。除了常规的数值或字符串，Redis的键值还可以是以下形式之一： Lists （列表） Sets
使用 Nginx Upload Module 实现上传文件功能 hongtoushizi nginx
转载自： http://www.tuicool.com/wx/aUrAzm 普通网站在实现文件上传功能的时候，一般是使用Python，Java等后端程序实现，比较麻烦。Nginx有一个Upload模块，可以非常简单的实现文件上传功能。此模块的原理是先把用户上传的文件保存到临时文件，然后在交由后台页面处理，并且把文件的原名，上传后的名称，文件类型，文件大小set到页面。下
spring-boot-web-ui及thymeleaf基本使用 jishiweili spring thymeleaf
视图控制层代码demo如下： @Controller @RequestMapping("/") public class MessageController { private final MessageRepository messageRepository; @Autowired public MessageController(Mes
数据源架构模式之活动记录 home198979 PHP 架构活动记录数据映射
hello!架构一、概念活动记录（Active Record）：一个对象，它包装数据库表或视图中某一行，封装数据库访问，并在这些数据上增加了领域逻辑。对象既有数据又有行为。活动记录使用直截了当的方法，把数据访问逻辑置于领域对象中。二、实现简单活动记录活动记录在php许多框架中都有应用，如cakephp。 <?php /** * 行数据入口类 *
Linux Shell脚本之自动修改IP pda158 linux centos Debian 脚本
作为一名 Linux SA，日常运维中很多地方都会用到脚本，而服务器的ip一般采用静态ip或者MAC绑定，当然后者比较操作起来相对繁琐，而前者我们可以设置主机名、ip信息、网关等配置。修改成特定的主机名在维护和管理方面也比较方便。如下脚本用途为：修改ip和主机名等相关信息，可以根据实际需求修改，举一反三！ #!/bin/sh #auto Change ip netmask ga
开发环境搭建独浮云 eclipse jdk tomcat
最近在开发过程中，经常出现MyEclipse内存溢出等错误，需要重启的情况，好麻烦。对于一般的JAVA+TOMCAT项目开发，其实没有必要使用重量级的MyEclipse，使用eclipse就足够了。尤其是开发机器硬件配置一般的人。 &n

北大/港大/百度提出CAE：自监督学习新范式！用于SSL的上下文自动编码器

你可能感兴趣的:(算法,python,计算机视觉,机器学习,人工智能)