腾讯AI实验室

CVPR 2022 | 腾讯AI Lab入选论文解读，关注图像理解、生成、建模及可信AI

感谢阅读腾讯AI Lab微信号第147篇文章。本文介绍腾讯 AI Lab 被 CVPR 2022 收录的研究成果。

CVPR（Conference on Computer Vision and Pattern Recognition）是计算机视觉三大顶会之一，也是中国计算机学会推荐的人工智能领域的A类会议。今年会议于 6 月 19 - 24 日以线上线下结合形式举行，据此前披露数据，今年会议投稿量突破了一万，其中 2067 篇论文被接收。

本文将解读腾讯 AI Lab 18 篇入选论文，涵盖图像与视频理解、视觉内容生成、神经辐射场建模、可信AI、具身人工智能等方向。论文完整内容将于会议官方渠道发布，本文为部分论文解读。

图像与视频理解

视觉的理解与识别为计算机视觉任务中经久不衰的问题。面对海量数据的环境，如何设计性能优异的模型，与挖掘模型潜能的学习算法，成为了图像与视频理解的核心问题。针对数据特性本身，视频数据相比于图像数据，其时序连续性带来了更多研究空间，也使得视频的理解受到了广泛的关注。

1. 基于前景-背景融合的运动感知对比视频表征学习

Motion-aware Contrastive Video Representation Learning via Foreground-background Merging

本文由腾讯AI Lab主导，与上海交通大学、香港中文大学、密歇根大学合作完成。鉴于对比学习在图像领域已取得的成功，当前的自监督视频表征学习方法通常采用对比损失来学习视频表征。然而，当直接地将视频的两个增强视图拉近时，该模型倾向于将共同的静态背景作为捷径来学习，而不能捕捉更重要的运动信息，这种现象被称为背景偏差。这种偏差使得模型的泛化能力较弱，导致下游任务（如动作识别）的性能较差。

为了减轻这种偏见，本文提出前景-背景合并来有意识地将所选视频的运动前景区域合成到其他视频的静态背景上。具体来说，在没有任何现成的检测器的情况下，该项工作通过帧差和颜色统计从背景区域中提取运动前景，并在视频中融合其他的背景区域。通过要求原始片段和融合片段之间的语义一致性，使得该模型更加关注运动模式，并有效地消除背景偏见。

大量实验表明，该方法可以有效地抵抗背景偏置，从而在UCF101、HMDB51和Diving48数据集上取得最先进的下游任务性能。

2. 针对时序动作定位任务的无监督预训练

Unsupervised Pre-training for Temporal Action Localization Tasks

本文由腾讯AI Lab主导，与北京大学合作完成。虽然近年来无监督视频表征学习取得了显著的成就，但大多数现有的方法都是针对视频行为分类任务（TAC）进行设计和优化的。当应用于时序定位任务（TAL）时，由于视频级别分类和片段级别定位之间的固有差异，这些预先训练的模型的迁移性能会受限。

为了缓解这一问题，本文首次尝试对时序行为定位任务进行无监督预训练，提出一种新的自监督代理任务，称为“伪动作定位（Pseudo Action Localization，PAL）”。具体来说，该项工作首先从一个视频中随机选择两个不同时序区域（每个区域包含多个视频片段）作为伪动作区域，然后分别将它们粘贴到另外两个视频的不同时间位置。代理任务的目标是对齐两个新合成视频中粘贴的伪动作区域的特征，并最大化它们之间的一致性。

与现有的无监督视频表征学习方法相比，PAL 以时间密集采样和时间尺度敏感的方式引入时序等变对比学习范式，从而使上游预训练与下游 TAL 任务实现更好的对齐。大量实验表明，PAL 可以利用大规模无类别标签的视频数据来显著提高现有 TAL 方法的性能。

3. 针对弱监督时序动作定位探索去噪跨视频对比学习

Exploring Denoised Cross-video Contrast for Weakly-supervised Temporal Action Localization

本文由腾讯AI Lab主导，与阿尔伯塔大学合作完成。弱监督时间动作定位旨在仅使用视频级弱标签来定位未修剪视频中的动作。大多数现有方法使用“先分类后定位”的框架解决这个问题，该框架基于片段分类序列来定位动作区域。然而，由于视频级标签的稀疏性，片段分类容易出错。

受到无监督对比表示学习的启发，本文提出了一种新颖的去噪跨视频对比算法，旨在增强视频片段的特征识别能力，以在弱监督环境中实现准确的时间动作定位。这是通过三个关键设计实现的：1) 一个有效的伪标签去噪模块，以减轻由嘈杂的对比特征引起的副作用，2) 一种有效的区域级特征对比策略，结合区域级特征记忆库，来捕获整个数据集的“全局”对比，以及 3）多样化的对比学习策略，以实现动作-背景分离以及类内紧凑性和类间可分离性。

在 THUMOS14 和 ActivityNet v1.2 上进行的大量实验证明了该方法的卓越性能。

4. 基于带权的序列EM的实时的视频物体分割算法

SWEM: Towards Real-Time Video Object Segmentation with Sequential Weighted Expectation-Maximization

本文由腾讯AI Lab主导，与清华大学，腾讯TEG数据平台部合作完成。在半监督视频物体分割（VOS）任务中，基于时空记忆匹配的方法在准确性方面显著优于其他解决方案。然而不断增长的记忆规模会导致低下的推理效率。

为了解决这一问题，本文提出了一种带权的序列期望最大算法，简称为SWEM，该算法能够极大地减少记忆特征的冗余度。与之前只考虑视频帧间特征冗余的方法不同，该项工作提出的SWEM通过同时聚合帧间和帧内的相似特征，来得到表达力强且紧凑的基特征。此外，本文还提出了一种自适应加权方法来表明不同像素的重要程度，从而突出那些对物体分割贡献度较高的特征。

本文所提出的方法在推断过程中始终维持固定的记忆特征个数，从而保证了分割系统推理复杂度的稳定性。SWEM在DAVIS和YouTube-VOS数据集上都取得了极具竞争力的结果，并且能够保持实时的推理速度（36 FPS）。

5. 基于自监督transformer和Ncut的显著物体检测和分割

Self-Supervised Transformers for Unsupervised Object Discovery using Normalized Cut

本文由腾讯AI Lab主导，与法国国立计算机及自动化研究院、三星、麻省理工大学合作完成。基于蒸馏的自监督学习的transformer （Dino）的Attention map会突出前景物体。本文展现了一个基于graph的方法，利用自监督学习的transformer的特征来检测图片中的物体。输入的图片方块是graph的节点，同时图片特征之间的相似度是graph的边。前景物体可以通过归一的图切割的方式得到。本文使用具有广义特征分解的谱聚类来解决图切割问题，并表明第二小的特征向量提供了切割解决方案，而且特征向量的绝对值大小表示此区域属于前景的可能性。

尽管方法很简单，但这种方法显著提高了无监督物体检测的性能：实验证明，该方法在 VOC07、VOC12 和 COCO20K 上分别比最近最先进的 LOST 提高了 6.9%、8.1% 和 8.1%。通过添加第二阶段与类别无关的检测器 (CAD)，可以进一步提高性能。该方法可以很容易地扩展到无监督显著性检测和弱监督目标检测。对于无监督显著性检测，该项工作在 ECSSD、DUTS、DUT-OMRON 上的 IoU 与之前的技术水平相比分别提高了 4.9%、5.2%、12.9%。对于弱监督目标检测，该项工作在 CUB 和 ImageNet 上取得了具有竞争力的性能。

项目代码和Demo可见：https://www.m-psi.fr/Papers/TokenCut2022/

6. ADeLA：语义分割中视角变换下的自动稠密标注算法

ADeLA: Automatic Dense Labeling with Attention for Viewpoint Shift in Semantic Segmentation

本文由腾讯AI Lab与斯坦福大学、北京大学和浙江大学合作完成，致力于解决多相机系统中由于视角变化导致语义分割性能下降的问题。这个问题提供了时序上关联但视角不一致的图片，并且仅有个别视角提供了对应的稠密语义标签。

过去的方法通过不同域之间的配准来解决这个问题，然而视角变化引起的障碍可能会破坏这样的配准效果。本文提出一个新颖的基于注意力机制的视角变换网络来预测目标图像的语义信息。即使在训练阶段缺少监督，视角变换网络依然能够泛化到语义图像。

本文提出的方法超越了最新的视角合成和关联预测方法，并且大幅优于基于无监督学习的域适应方法。

7. SVIP：视频中过程的序列验证

SVIP: Sequence VerIfication for Procedures in Videos

本文由腾讯AI Lab与上海科技大学合作完成，可以通过视频，自动判断操作流程，是否和标准流程一致，起到监督预警的作用。

本文提出了一种新颖的序列验证任务，旨在将执行相同动作序列的正视频对与具有步进级转换但仍执行相同任务的负视频对区分开来。这样一项具有挑战性的任务存在于一个开放集设置中，没有事先需要事件级甚至帧级注释的动作检测或分割。为此，该项工作仔细重组了两个公开可用的具有步骤-过程-任务结构的动作相关数据集。

为了充分研究任何方法的有效性，该项工作收集了一个脚本视频数据集，其中列举了化学实验中的各种步骤级转换。此外，引入了一种新的评估度量加权距离比，以确保评估过程中不同步级变换的等效性。最后，引入了一个简单但有效的基线，该基线基于具有新颖序列对齐损失的转换器，以更好地表征步骤之间的长期依赖性，优于其他动作识别方法。

代码和数据详见：https://github.com/svip-lab/SVIP-Sequence-VerIfication-for-Procedures-in-Videos

视觉内容生成

数字内容生成是视觉领域中备受关注的任务，内容智能创作有巨大应用价值。

保持几何结构的图像拼接方法

Geometric Structure Preserving Warp for Natural Image Stitching

本文由腾讯AI Lab与新加坡国立大学、西北农林科技大学合作完成。保留场景中的几何结构在图像拼接中起着至关重要的作用。然而，现有的方法大多忽略了由直线或曲线反映的大规模布局，降低了整体拼接质量。

本文提出了一种结构保持拼接方法，可以产生具有自然视觉效果和较少失真的图像。该项工作首先采用基于深度学习的边缘检测来提取各种类型的大规模边缘。然后，对提取的边缘进行采样以构造多组三角形来表示它们的几何结构。作者引入了几何结构保持 (GES) 能量项来鼓励这些三角形进行相似变换。此外，本文提出了一种优化的GES能量项，以合理确定几何结构上采样点的权重，并将其添加到称为GES-GSP的全局相似性先验（GSP）拼接模型中，以实现局部对齐和几何结构保存之间的平滑过渡。

本文通过对拼接数据集的综合实验证明了所提出的 GES-GSP 的有效性。同时实验表明，所提出的方法在几何结构保存方面始终优于几种最先进的方法，并获得更自然的拼接结果。

神经辐射场建模

神经辐射场相关技术是近年来计算机视觉与图形学领域的热点研究问题。如何在不同数据条件下利用神经辐射场高效地进行场景与人物的高真实感建模，并灵活的对神经辐射场中的内容进行有效的编辑，是当下相关研究中核心问题。

1. 去模糊神经辐射场: 从模糊图片中恢复清晰神经辐射场

Deblur-NeRF: Neural Radiance Fields from Blurry Images

本文由腾讯AI Lab主导，与香港科技大学合作完成。由于出色的图像合成表现, 神经辐射场（NeRF）已经在3D场景重建和新视点合成领域获得了广泛的关注。然而在真正的重建过程中，拍摄时的镜头失焦或者相机抖动而带来的成像模糊常常会大大降低重建的精度。

为了解决这个问题，本文首创性地提出了从多个模糊的输入图像重建清晰的神经辐射场，可对模糊成像的过程进行建模，通过对模型合成的模糊结果进行分析从而进行去模糊。这个模糊模型的核心是一个新颖的可变性稀疏模糊核(DSK)模块。它通过对一个模板空间的稀疏模糊核进行变形，来模拟空间上处处不同的模糊核。同时模糊核中的每个点的光学中心也会同时被优化变形，因为模糊的物理过程也会有光学中心的变化。该方法将这个DSK模块参数化为一个多层感知器，因此它对不同的模糊类型都是通用的。同时优化神经辐射场和DSK模块，就可以得到一个清晰的神经辐射场。

该方法可以同时用于去除两种最常见的模糊：由于失焦和由于相机抖动造成的模糊。在合成数据集和真实数据集下的对比实验也证明了本方法超过了几个基线方法。

项目细节可见：https://github.com/limacv/Deblur-NeRF

2. NeRFReN: 支持反射的神经辐射场

NeRFReN: Neural Radiance Fields with Reflections

本文由腾讯AI Lab主导，与北京信息科学与技术国家研究中心、北京雁栖湖应用数学研究院合作完成。神经辐射场技术（Neural Radiance Fields，NeRF）通过利用基于坐标的场景表示，在新视点合成任务上取得了令人惊艳的效果。虽然神经辐射场建模了物体的视角相关特性，但实验表明其只能正确地处理高光等简单的反射现象。对于玻璃、镜子等物体带来的复杂反射，神经辐射场会估计错误的几何，并在某些不具有多视角一致性的场景下得到模糊的视点合成结果。

为此，本工作提出使用两个神经辐射场建模此类场景，其中一个建模真实几何的反射光，另一个建模反射像。针对这种欠约束表示，本工作提出采用几何先验和特殊设计的训练策略来进行解空间的约束。本工作提出的方法在有复杂反射的场景下可以实现高质量的视点合成效果，同时取得明显更优的深度估计结果。

本工作将所提出技术应用在了场景编辑上。在含有复杂反射的场景下取得更理想、可解释性更强的的新视点合成结果，并且可以实现多个场景编辑操作，如反射去除、反射替换等。

项目细节可见：https://bennyguo.github.io/nerfren/

3. 光影幻象：神经辐射场中的时空流转

Hallucinated Neural Radiance Fields in the Wild

本文由腾讯AI Lab主导，与西安交通大学合作完成。神经辐射场(NeRF)因其令人印象深刻的新视点合成能力而备受关注。本文研究了幻象NeRF问题：即从一组旅游中拍摄的图片恢复高保真的不同时间的NeRF。现有的解决方案采用具有可控的外观嵌入的NeRF来在各种条件下渲染新的视点，但无法跨视角一致地渲染未曾见过外观的图像。

为了解决这个问题，本文提出了一个端到端框架来构建一种幻象NeRF，称为Ha-NeRF。具体来说，本文提出了一种外观幻象模块来处理时变的外观，并将这样的外观转换到新的视点当中。针对旅游图像的复杂遮挡问题，该方法引入抗遮挡模块对静态对象进行精确的能见度建模。

在合成数据和真实旅游照片采集上的实验结果表明，该方法不仅能产生理想的外观，而且能从不同视角渲染无遮挡的图像。

项目细节可见：https://rover-xingyu.github.io/Ha-NeRF/

可信AI

近年来，人工智能算法被广泛地应用到医疗、金融、工业生产等多个重要领域，这些算法在提升生产力的同时，也面临各种风险隐患。可信AI目标于使AI系统所做出的决策能够被理解、被信任，其研究范围包含鲁棒性、公平性、可解释性和隐私保护等。

1. LAS-AT：具有可学习攻击策略的对抗训练

LAS-AT: Adversarial Training with Learnable Attack Strategy

本文由腾讯AI Lab主导，与中国科学院大学信息工程研究所国家重点实验室，香港中文大学（深圳）大数据研究院数据科学学院合作完成。

对抗训练通常被描述为一个min-max的优化问题，其性能取决于内部的max优化问题，即对抗样本的生成。以前的大多数方法都采用投影梯度下降，手动指定对抗样本的攻击生成参数。攻击参数的组合可以被称为攻击策略。一些研究表明，在整个训练阶段使用固定的攻击策略生成的对抗样本会限制模型的鲁棒性，并提出在不同的训练阶段使用不同的攻击策略来提高鲁棒性。但是，这些多阶段的手工设计的攻击策略需要大量的专业知识，而且鲁棒性改进有限。

本文通过引入“可学习的攻击策略”的概念，提出了一种新的对抗训练框架，它学习自动生成攻击策略，以提高模型的鲁棒性。该框架由一个使用对抗样本进行训练以提高模型鲁棒性的目标网络和一个生成攻击策略以控制对抗样本生成的策略网络组成。在三个基准数据库上的实验评估表明了该方法的优越性，并且该方法优于现有的对抗训练方法。

2. 基于自监督对抗样本的可泛化的假脸检测方法

Self-supervised Learning of Adversarial Example: Towards Good Generalizations for Deepfake Detection

本文由腾讯AI Lab主导，与阿德莱德大学合作完成。近年来，基于深度学习的人脸造假方法层出不穷，同时，针对这些假脸的检测方法也受到了广泛的关注。但是，现有的假脸检测方法一般只能被用来检测训练集中已知的几种造假方法产生的假图，当测试案例中给出的假脸图片由未知的造假方法生成，这些检测方法往往表现较差。

为了有效缓解泛化性的问题，本文提出了一个简单的原则：一个可以泛化的表征必定会对各种假图都敏感。基于此，本文首先提出在训练过程中用可学习的增广方式来决定多种造假参数，并由这些造假参数来丰富假图的种类；其次，为了增强敏感性，本文让模型在预测人脸图片真假的同时，也同步预测假图的造假参数；最后，为了构造困难的检测样本，该项工作用对抗学习的方式来交替更新增广模型和检测模型。

广泛的实验证明，本文的方法能有效提高基准模型的泛化性，并在多个基准数据集上优于现有的方法。

3. 基于对抗分布迁移的黑盒对抗攻击

Boosting Black-Box Attack with Partially Transferred Conditional Adversarial Distribution

本文由腾讯AI Lab与清华大学、香港中文大学（深圳）、深圳大数据研究院、腾讯数据平台部、美团和鹏程实验室人工智能中心合作完成，提出了一种高效的黑盒攻击方法，更贴近业务的运行环境，可以提供更好的对抗鲁棒性评测，进而推动系统的安全性和可靠性。

由于不需要被攻击模型的模型结构和网络参数等信息，黑盒攻击更贴近实际的运行环境，可以更好的衡量业务系统的潜在威胁。本文研究了一种基于对抗样本分布迁移的黑盒攻击方法。对抗样本的迁移性指在替代模型上生成的对抗样本对目标模型仍然具有一定的攻击性。然而，替代模型和目标模型之间潜在的网络结构、模型参数、训练数据集等方面的不一致性，极大的影响着对抗样本的迁移成功率。

本文提出了一种新的部分迁移机制来缓解这种不一致性，特别建模了基于条件流模型的对抗样本分布，并在替代模型上进行流模型学习。在对目标模型的黑盒攻击过程中，本文仅迁移条件流模型的部分参数，其余参数则基于目标模型优化得到。这种部分迁移策略可以兼顾攻击效率和性能，在多个基准数据集和真实的API系统上的实验验证了方法的有效性。

具身人工智能

具身人工智能 (Embodied AI) 指拥有实体、在环境中学习的人工智能，亦即人工智能的具身化。

具身人工智能关注以下几个重点问题：1）搭建供智能体学习的仿真/真实环境 2）具身智能体的学习任务 3）如何学习和解决这些任务。

视觉感知是具身智能的重要组成部分，具身化的智能体如何主动在复杂环境中发展可靠、鲁棒、可泛化的视觉系统，理解实体概念，如何感知能够更好服务于决策与执行的信息，也为视觉的发展带来了新的任务和挑战。

基于神经二值图匹配的多机器人自主场景重建

Multi-Robot Active Mapping via Neural Bipartite Graph Matching

本文由腾讯AI Lab与斯坦福大学、清华大学、北京大学和山东大学合作完成，主要研究多机器人自主场景重建的问题。该问题的目标是利用最少的时间步实现完整的场景重建，而解决这个问题的关键在于用于实现高效机器人移动的目标位置预测算法。过去的方法要么通过一种贪心策略选择边界点（frontier）作为目标位置，要么通过强化学习来直接回归目标位置，这两种方法在探索效率和场景的重建完整度上都表现欠佳。

本文通过融合上述两种方法提出了一种新颖的多机器人自主场景重建算法。具体而言，本文将该问题简化为二值图匹配，并通过建立机器人和边界点的点与点对应来解决该问题。为了实现更有效的图匹配，本文提出一个多元图神经网络来学习点与点之间的神经距离用于填充图匹配中的邻接矩阵。该项工作通过强化学习最大化长期的时间效率和场景完整度来优化多元图神经网络。该算法仅需要9个场景就可以训练成功，且在多种不同的室内场景和一些机器人上验证了其优越性。

* 欢迎转载，请注明来自腾讯AI Lab微信（tencent_ailab）

【python】解决No module named _sqlite3的问题欧阳秦穆
环境版本说明：centos7python3.6.4django2.0在创建django项目时候。报错以下信息详细错误信息如下：原因：未安装sqlite模块解决：1安装sqlite-develyuminstallsqlite-devel2重新编译pythoncd/usr/local/python3.6.4./configuremakemakeinstall
【推荐算法课程二】推荐算法介绍-深度学习算法盒子6910 运维视角下的广告业务算法推荐算法深度学习运维开发运维人工智能
三、深度学习在推荐系统中的应用3.1深度学习推荐模型的演化关系图3.2AutoRec——单隐层神经网络推荐模型3.2.1AutoRec模型的基本原理AutoRec模型是一个标准的自编码器，它的基本原理是利用协同过滤中的共现矩阵，完成物品向量或者用户向量的自编码。再利用自编码的结果得到用户对物品的预估评分，进而进行推荐排序。什么是自编码器？自编码器是指能够完成数据“自编码”的模型。无论是图像、音频，
DeepFM算法原理及应用场景
DeepFM（DeepFactorizationMachine）是一种结合了因子分解机（FactorizationMachines,FM）和深度神经网络（DNN）的混合模型，主要用于处理高维稀疏数据（如推荐系统中的点击率预测）。其核心思想是同时捕捉低阶（线性）和高阶（非线性）特征交互。1.算法原理模型结构如下：FM部分：负责捕捉低阶特征交互（如一阶和二阶特征组合）。一阶项：线性特征权重。二阶项：通
Python Scrapy的爬虫中间件开发 AI天才研究院 python scrapy 爬虫 ai
PythonScrapy爬虫中间件开发：从原理到实战的深度解析关键词Scrapy中间件、爬虫扩展、请求响应处理、反爬绕过、中间件生命周期、钩子函数、分布式爬取摘要本文系统解析Scrapy爬虫中间件（SpiderMiddleware）的开发方法论，覆盖从基础概念到高级实践的全链路知识。通过第一性原理推导中间件的核心机制，结合层次化架构分析（理论→设计→实现→应用），提供生产级代码示例与可视化流程模型
使用Python将PDF转换成word、PPT wh3933 python pdf word
在现代企业环境中，文档格式的转换是一项普遍且关键的需求。PDF（PortableDocumentFormat）作为一种最终的、通常不可编辑的“打印”状态格式，被广泛用于分发和归档。然而，内容的创建、协作和修改主要在MicrosoftOffice套件中进行，特别是Word（DOCX）和PowerPoint（PPTX）。因此，以编程方式弥合这两种格式之间的鸿沟，已成为数据提取、内容迁移和工作流自动化领
Python实现文件移动到指定文件夹 wh3933 python java 前端
在Python中，将文件从一个位置移动到另一个位置是一项常见的操作。无论是整理下载、归档旧文件，还是在复杂的项目中管理文件结构，掌握文件移动的技巧都至关重要。本文将全面介绍在Python中移动文件的各种方法，并提供详尽的代码示例，帮助您轻松应对不同场景下的文件管理需求。核心方法：shutil.move()在Python标准库中，shutil模块提供了高级的文件操作功能，其中的shutil.move
Python设置国内镜像教程 wh3933 python 开发语言
####引言Python是一种广泛使用的高级编程语言，用于各种编程任务，从简单的脚本到复杂的机器学习算法。在安装Python包时，通常需要从Python包索引（PyPI）下载。由于网络原因，直接从PyPI下载可能速度较慢，因此，使用国内的镜像源可以显著提高下载速度。本文将详细介绍如何在Python中设置国内镜像。####文章目的本篇文章旨在指导用户如何将Python的包管理工具`pip`的默认源切
python中使用pyinstaller将python项目打包为exe可执行文件不吃西红柿丿 python windows
1、安装pyinstallerpipinstallpyinstaller-ihttps://pypi.tuna.tsinghua.edu.cn/simple2、打包应用2.1、使用命令行直接打包pyinstaller-F-w-iyour_path/log.icomain.py命令：-F将项目打包为单个exe文件，没有其它文件-D将项目打包为一个文件夹里面又有一个exe文件以及其它依赖，启动速度比-
如何解决pip安装报错ModuleNotFoundError: No module named ‘os’问题 lyzybbs 全栈Bug解决方案专栏 pip python pycharm 开发语言 pandas numpy beautifulsoup
【Python系列Bug修复PyCharm控制台pipinstall报错】如何解决pip安装报错ModuleNotFoundError:Nomodulenamed‘os’问题1.摘要在使用PyCharm2025的控制台执行pipinstall时，常常会遇到各种奇怪的安装失败或安装后仍然报ModuleNotFoundError的问题，例如“Nomodulenamed‘os’”。本文将从开发场景、环境
如何解决pip安装报错ModuleNotFoundError: No module named ‘sys’问题 lyzybbs 全栈Bug解决方案专栏 pip pycharm python pandas scrapy beautifulsoup matplotlib
【Python系列Bug修复PyCharm控制台pipinstall报错】如何解决pip安装报错ModuleNotFoundError:Nomodulenamed‘sys’问题摘要在使用PyCharm内置终端或控制台执行pipinstallsys等命令时，常常会遇到如下异常：ModuleNotFoundError:Nomodulenamed‘sys’该错误看似与常驻Python核心库sys有关，但
OPENAI中Assistants API的实现原理及示例代码python实现 dzend aigc python ai
OPENAI中AssistantsAPI的实现原理及示例代码前言OPENAI是一家人工智能公司，致力于研究和开发人工智能技术。其中，AssistantsAPI是OPENAI推出的一项人工智能服务，可以帮助开发者快速构建智能助手。本文将介绍AssistantsAPI的实现原理，并提供使用Python实现的示例代码。AssistantsAPI实现原理AssistantsAPI的实现原理主要包括以下几个
Java+Python智能化云盘【Day5-1】关沐吖 Java+Python Ai智能云盘项目开发专栏 python java 开发语言
RAG系统链路和数据加载Loaders技术OK啊昨天Day4-2，最后提及了很多的一些Loader加载器，有文档类型、数据库类型、网页加载器类型等等，它们其实都是属于langchain_community.document_loaders这个包下的类。今天来先复习一下都有哪些，再讲讲其中的代码运行的基本框架，和文档中有图片的处理方式。Loader的分类与常见类型文件加载器（FileLoaders）
Java+Python智能化云盘【Day3】关沐吖 Java+Python Ai智能云盘项目开发专栏 java python 开发语言
提示词工程Prompt简介：大模型必备Prompt提示词工程讲解什么是PromptEngineering提示词工程通过特定格式的文本输入引导AI模型生成期望输出的技术，明确地告诉模型你想要解决的问题或完成的任务也是大语言模型理解用户需求并生成相关、准确回答或内容的基础类比：给Java程序员的任务需求文档（越清晰明确，结果越符合预期）为什么需要学习？大模型就是你的员工，你可以有多个助手，OpenAI
Java+Python智能化Ai云盘[Day2]
OK啊，为了完成学校老师布置的UML作业主播也是开始拿自己的项目开始当成期末大作业来交了。顺道的我也把自己的项目整个的梳理了一通，如果大家最近有UML的大作业要交也可以自取，到时候我把文章word版本直接发到百度网盘上去。里面我只有类图、用例图、活动图、顺序图、状态图。这次也算是一个提前复习了一下项目了把，整个的文档文字都是拿ai去写的，图的话也是我先看了一遍代码，然后给ai说了一遍也算是自己理通
基于uniapp小程序的诗词学习系统附带文章源码部署视频讲解等
文章目录前言详细视频演示具体实现截图核心技术介绍小程序框架Uniapp前端框架Vue持久层框架MyBaits为什么选择我代码参考数据库参考测试用例参考源码获取前言博主介绍：✌CSDN特邀作者、资深全栈开发程序员，曾在互联网大厂担任高级职位、码云/掘金/华为云/阿里云/InfoQ/StackOverflow/github等平台优质作者、专注于Java、小程序、前端、python等技术领域毕业项目实战
Windows安装MySQL及Python操作MySQL数据库脚本实例详解
1、Windows上安装MySQL便于测试，笔者在windows上安装MySQL，如有现成Linux下的MySQL和Python环境，也可直接使用。MySQL的官网下载链接安装步骤1)下载后的mysql-5.7.23-winx64.zip安装包解压至某一位置，在mysql-5.7.23-winx64.zip根目录下创建my.ini文件添加以下内容：my.ini[mysql]default-char
（纯新手练习五）python基础代码，我手把手带你敲（类与对象，实例，构造函数__init__初始化对象属性，继承，方法重写，类的文档字符串，模块化）星期天要睡觉 python 开发语言
目录1.基本理论简述类与对象构造函数（Constructor）继承（Inheritance）方法重写（MethodOverriding）四者关系总结类的文档字符串（Docstring）2.练习开始3.代码模块化练习（纯新手练习五）python基础代码，我手把手带你敲（类与对象，实例，构造函数__init__初始化对象属性，继承，方法重写，类的文档字符串，模块化）（下一节课：文件操作）基本理论简述类
区间求最值问题高效解决方法东皇太星 python
对于区间求最值场景，如果区间不定长度的，可以使用稀疏表进行求解，如果区间是固定长度的，则可以使用分块的思想（与稀疏表原理类似），都是通过压缩状态个数，1关于稀疏表的原理详见：稀疏表（SparseTable，ST原理及应用场景下面是一个稀疏表的python实现classSolution:def__init__(self,nums):self.nums=numsself.init_value=-999
（阳：算法霸权 / 阴：数据确权）→当GDPR类法规覆盖53%经济体量时，催生出隐私计算新范式百态老人人工智能机器学习深度学习算法
当GDPR类法规覆盖53%经济体量时，隐私计算新范式的兴起可归因于以下多维度因素的相互作用：一、算法霸权与数据确权的矛盾激化算法霸权的危害大型科技公司通过算法歧视、大数据杀熟等手段形成垄断优势，利用数据优势操控用户行为，导致消费者权益受损。这种"算法黑箱"不仅加剧市场不公平，还阻碍数据要素的自由流动。例如，算法框架的底层逻辑掌握在少数企业手中，产生"数据黑箱"问题。数据确权的立法需求数据权属不明确
python优先队列使用_Python优先队列实现方法示例
本文实例讲述了Python优先队列实现方法。分享给大家供大家参考，具体如下：1.代码importQueueimportthreadingclassJob(object):def__init__(self,priority,description):self.priority=priorityself.description=descriptionprint'Newjob:',description
python优先队列使用_python 线程队列PriorityQueue（优先队列）（37）
在线程队列Queue/线程队列LifoQueue文章中分别介绍了先进先出队列Queue和先进后出队列LifoQueue，而今天给大家介绍的是最后一种：优先队列PriorityQueue，对队列中的数据按照优先级排序，那么具体怎么用呢？一.队列Queue分类：1.线程队列Queue—FIFO(先进先出队列)，即哪个数据先存入，取数据的时候先取哪个数据，同生活中的排队买东西；2.线程队列LifoQue
机器学习宝典——第6章爱看烟花的码农机器学习人工智能
第6章：聚类算法(Clustering)你好，同学！欢迎来到无监督学习的世界。与监督学习不同，这里的我们没有“标准答案”（标签），我们的目标是在数据中发现隐藏的、内在的结构。聚类算法就是实现这一目标的核心工具，它试图将数据集中的样本划分为若干个不相交的子集，我们称之为“簇”(cluster)。本章我们将深入探讨三种最具代表性的聚类算法：K-均值(K-Means)、层次聚类(Hierarchical
Python|Pyppeteer规避反自动化检测方法【最新方案】(33) 写python的鑫哥 Pyppeteer从入门到精通 python pyppeteer puppeteer 规避反自动化检测反爬虫
前言本文是该专栏的第33篇，结合优质项目案例持续分享Pyppeteer的干货知识，记得关注。相信有些同学在使用Pyppeteer框架进行某个自动化操作的时候，会触发平台的检测机制，让目标平台识别出当前是机器人在操作，而非人为操作，导致让你的程序无法继续进行下一步。对于上述这种情况，你是不是有很大的疑惑呢？别担心，本文笔者专门针对上述问题，来详细介绍在使用Pyppeteer的过程中，出现反自动化机制
【深度学习】神经网络剪枝方法的分类烟锁池塘柳0 机器学习与深度学习深度学习神经网络剪枝
神经网络剪枝方法的分类摘要随着深度学习模型，特别是大语言模型（LLM）的参数量爆炸式增长，模型的部署和推理成本变得异常高昂。如何在保持模型性能的同时，降低其计算和存储需求，成为了工业界和学术界的核心议题。神经网络剪枝（Pruning）作为模型压缩的关键技术之一，应运而生。本文将解析剪枝技术的不同分类，深入探讨其原理、优缺点。文章目录神经网络剪枝方法的分类摘要1为什么我们需要剪枝？2分类方法一：剪什
Python 图像分类入门超龄超能程序猿机器学习 python 分类开发语言
一、介绍图像分类作为深度学习的基础任务，旨在将输入图像划分到预定义的类别集合中。在实际的业务中，图像分类技术是比较常用的一种技术技能。例如，在安防监控中，可通过图像分类识别异常行为；在智能交通系统中，实现对交通标志和车辆类型的快速识别等。本文将通过安装包已有数据带你逐步了解使用Python进行图像分类的全过程。二、环境搭建在开始图像分类项目前，需要确保Python环境中安装了必要的库。主要包括：T
初始CNN(卷积神经网络) 超龄超能程序猿机器学习 cnn 人工智能神经网络
卷积神经网络（ConvolutionalNeuralNetwork，简称CNN）作为深度学习的重要分支，在图像识别、目标检测、语义分割等领域大放异彩。无论是手机上的人脸识别解锁，还是自动驾驶汽车对道路和行人的识别，背后都离不开CNN的强大能力一、CNN诞生的背景与意义在CNN出现之前，传统的图像识别方法主要依赖人工提取特征，例如使用SIFT（尺度不变特征变换）、HOG（方向梯度直方图）等算法。这些
取余和取模到底是不是一回事？对比Python、Java、C和C++中的%运算符霜叶桑 java python c语言 c++
取余和取模到底是不是一回事？对比Python、JAVA、C和C++中的%运算符数学中的「取余」和「取模」计算机领域中的「取余」和「取模」Python、Java、C和C++中的`%`运算符Python：取模运算Java：取余运算C和C++：取余运算为什么一般用正除数数学中的「取余」和「取模」在纯数学中，当我们谈论整数除法a÷ba\divba÷b（aaa是被除数，bbb是除数，且b≠0b\not=0
结构型智能科技的关键可行性——信息型智能向结构型智能的转变（修改提纲）刘海东刘海东人工智能机器学习算法
结构型智能科技的关键可行性——信息型智能向结构型智能的转变1.信息型智能科技概述1.1传统计算机科技的信息型继承者1.2信息型智能环境1.3信息型智能主体1.4机器学习创造的智能1.5信息型智能科技的缺陷2.结构型智能科技概述2.1传统计算机科技向生命结构的发展2.2结构型智能科技的环境2.3结构型智能科技创造的机器生命2.4结构型智能科技的科学性3.结构型智能科技的关键可行性——信息型智能向结构
典型的几种神经网络 Victor Zhong AI 框架神经网络人工智能深度学习
骨干网络CNN(卷积神经网络)RNN(循环神经网络)三级目录CNN(卷积神经网络)包括输入层、隐藏层、输出层：输入层一般为一张图片（w,h,d）,输入层数据一般要做归一化处理;隐藏层包含特有的卷积层（卷积核有权重系数）、池化层（没有权重系数）、全连接层，还有残差块？和Inception模块？。；输出层：RNN(循环神经网络)单向的RNN示意图：三级目录
194、Django Channels实战：构建实时WebSocket应用多多的编程笔记 django websocket sqlite
DjangoChannels：实现WebSocket与实时通信本文将向您介绍Python开发框架Django中的一个重要组件——DjangoChannels，它使得在Django中实现WebSocket通信变得轻而易举。通过阅读本文，您将了解WebSocket的概念、DjangoChannels的工作原理以及如何在实际项目中使用它来实现实时通信。1.WebSocket：实现快速双向通信在介绍Dja
apache 安装linux windows 墙头上一根草 apache inux windows
linux安装Apache 有两种方式一种是手动安装通过二进制的文件进行安装，另外一种就是通过yum 安装，此中安装方式，需要物理机联网。以下分别介绍两种的安装方式通过二进制文件安装Apache需要的软件有apr,apr-util,pcre 1，安装 apr 下载地址：htt
fill_parent、wrap_content和match_parent的区别 Cb123456 match_parent fill_parent
fill_parent、wrap_content和match_parent的区别: 1）fill_parent 设置一个构件的布局为fill_parent将强制性地使构件扩展，以填充布局单元内尽可能多的空间。这跟Windows控件的dockstyle属性大体一致。设置一个顶部布局或控件为fill_parent将强制性让它布满整个屏幕。 2） wrap_conte
网页自适应设计天子之骄 html css 响应式设计页面自适应
网页自适应设计网页对浏览器窗口的自适应支持变得越来越重要了。自适应响应设计更是异常火爆。再加上移动端的崛起，更是如日中天。以前为了适应不同屏幕分布率和浏览器窗口的扩大和缩小，需要设计几套css样式，用js脚本判断窗口大小，选择加载。结构臃肿，加载负担较大。现笔者经过一定时间的学习，有所心得，故分享于此，加强交流，共同进步。同时希望对大家有所
[sql server] 分组取最大最小常用sql 一炮送你回车库 SQL Server
--分组取最大最小常用sql--测试环境if OBJECT_ID('tb') is not null drop table tb;gocreate table tb( col1 int, col2 int, Fcount int)insert into tbselect 11,20,1 union allselect 11,22,1 union allselect 1
ImageIO写图片输出到硬盘 3213213333332132 java image
package awt; import java.awt.Color; import java.awt.Font; import java.awt.Graphics; import java.awt.image.BufferedImage; import java.io.File; import java.io.IOException; import javax.imagei
自己的String动态数组宝剑锋梅花香 java 动态数组数组
数组还是好说，学过一两门编程语言的就知道，需要注意的是数组声明时需要把大小给它定下来，比如声明一个字符串类型的数组：String str[]=new String[10]; 但是问题就来了，每次都是大小确定的数组，我需要数组大小不固定随时变化怎么办呢？动态数组就这样应运而生，龙哥给我们讲的是自己用代码写动态数组，并非用的ArrayList 看看字符
pinyin4j工具类 darkranger .net
pinyin4j工具类Java工具类 2010-04-24 00:47:00 阅读69 评论0 字号：大中小引入pinyin4j-2.5.0.jar包: pinyin4j是一个功能强悍的汉语拼音工具包，主要是从汉语获取各种格式和需求的拼音，功能强悍，下面看看如何使用pinyin4j。本人以前用AscII编码提取工具，效果不理想，现在用pinyin4j简单实现了一个。功能还不是很完美，
StarUML学习笔记----基本概念 aijuans UML建模
介绍StarUML的基本概念，这些都是有效运用StarUML?所需要的。包括对模型、视图、图、项目、单元、方法、框架、模型块及其差异以及UML轮廓。模型、视与图（Model, View and Diagram） &
Activiti最终总结 avords Activiti id 工作流
1、流程定义ID：ProcessDefinitionId，当定义一个流程就会产生。 2、流程实例ID：ProcessInstanceId，当开始一个具体的流程时就会产生，也就是不同的流程实例ID可能有相同的流程定义ID。 3、TaskId，每一个userTask都会有一个Id这个是存在于流程实例上的。 4、TaskDefinitionKey和（ActivityImpl activityId
从省市区多重级联想到的，react和jquery的差别 bee1314 jquery UI react
在我们的前端项目里经常会用到级联的select，比如省市区这样。通常这种级联大多是动态的。比如先加载了省，点击省加载市，点击市加载区。然后数据通常ajax返回。如果没有数据则说明到了叶子节点。针对这种场景，如果我们使用jquery来实现，要考虑很多的问题，数据部分，以及大量的dom操作。比如这个页面上显示了某个区，这时候我切换省，要把市重新初始化数据，然后区域的部分要从页面
Eclipse快捷键大全 bijian1013 java eclipse 快捷键
Ctrl+1 快速修复(最经典的快捷键,就不用多说了)Ctrl+D: 删除当前行 Ctrl+Alt+↓ 复制当前行到下一行(复制增加)Ctrl+Alt+↑ 复制当前行到上一行(复制增加)Alt+↓ 当前行和下面一行交互位置(特别实用,可以省去先剪切,再粘贴了)Alt+↑ 当前行和上面一行交互位置(同上)Alt+← 前一个编辑的页面Alt+→ 下一个编辑的页面(当然是针对上面那条来说了)Alt+En
js 笔记函数征客丶 JavaScript
一、函数的使用 1.1、定义函数变量 var vName = funcation(params){ } 1.2、函数的调用函数变量的调用： vName(params); 函数定义时自发调用：(function(params){})(params); 1.3、函数中变量赋值 var a = 'a'; var ff
【Scala四】分析Spark源代码总结的Scala语法二 bit1129 scala
1. Some操作在下面的代码中，使用了Some操作：if (self.partitioner == Some(partitioner))，那么Some(partitioner)表示什么含义？首先partitioner是方法combineByKey传入的变量， Some的文档说明： /** Class `Some[A]` represents existin
java 匿名内部类 BlueSkator java匿名内部类
组合优先于继承 Java的匿名类，就是提供了一个快捷方便的手段，令继承关系可以方便地变成组合关系继承只有一个时候才能用，当你要求子类的实例可以替代父类实例的位置时才可以用继承。在Java中内部类主要分为成员内部类、局部内部类、匿名内部类、静态内部类。内部类不是很好理解，但说白了其实也就是一个类中还包含着另外一个类如同一个人是由大脑、肢体、器官等身体结果组成，而内部类相
盗版win装在MAC有害发热，苹果的东西不值得买，win应该不用 ljy325 游戏 apple windows XP OS
Mac mini 型号: MC270CH-A RMB:5,688 Apple 对windows的产品支持不好,有以下问题: 1.装完了xp,发现机身很热虽然没有运行任何程序！貌似显卡跑游戏发热一样，按照那样的发热量,那部机子损耗很大,使用寿命受到严重的影响! 2.反观安装了Mac os的展示机，发热量很小，运行了1天温度也没有那么高 &nbs
读《研磨设计模式》-代码笔记-生成器模式-Builder bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 生成器模式的意图在于将一个复杂的构建与其表示相分离，使得同样的构建过程可以创建不同的表示（GoF） * 个人理解： * 构建一个复杂的对象，对于创建者（Builder）来说，一是要有数据来源(rawData)，二是要返回构
JIRA与SVN插件安装 chenyu19891124 SVN jira
JIRA安装好后提交代码并要显示在JIRA上，这得需要用SVN的插件才能看见开发人员提交的代码。 1.下载svn与jira插件安装包，解压后在安装包(atlassian-jira-subversion-plugin-0.10.1) 2.解压出来的包里下的lib文件夹下的jar拷贝到(C:\Program Files\Atlassian\JIRA 4.3.4\atlassian-jira\WEB
常用数学思想方法 comsci 工作
对于搞工程和技术的朋友来讲，在工作中常常遇到一些实际问题，而采用常规的思维方式无法很好的解决这些问题，那么这个时候我们就需要用数学语言和数学工具，而使用数学工具的前提却是用数学思想的方法来描述问题。。下面转帖几种常用的数学思想方法，仅供学习和参考函数思想　　把某一数学问题用函数表示出来，并且利用函数探究这个问题的一般规律。这是最基本、最常用的数学方法
pl/sql集合类型 daizj oracle 集合 type pl/sql
--集合类型 /* 单行单列的数据，使用标量变量单行多列数据，使用记录单列多行数据，使用集合（。。。） *集合：类似于数组也就是。pl/sql集合类型包括索引表（pl/sql table）、嵌套表（Nested Table）、变长数组（VARRAY）等 */ /* --集合方法 &n
[Ofbiz]ofbiz初用 dinguangx 电商 ofbiz
从github下载最新的ofbiz（截止2015-7-13），从源码进行ofbiz的试用 1. 加载测试库 ofbiz内置derby，通过下面的命令初始化测试库 ./ant load-demo (与load-seed有一些区别) 2. 启动内置tomcat ./ant start 或 ./startofbiz.sh 或 java -jar ofbiz.jar &
结构体中最后一个元素是长度为0的数组 dcj3sjt126com c gcc
在Linux源代码中，有很多的结构体最后都定义了一个元素个数为0个的数组，如/usr/include/linux/if_pppox.h中有这样一个结构体： struct pppoe_tag { __u16 tag_type; __u16 tag_len; &n
Linux cp 实现强行覆盖 dcj3sjt126com linux
发现在Fedora 10 /ubutun 里面用cp -fr src dest，即使加了-f也是不能强行覆盖的，这时怎么回事的呢？一两个文件还好说，就输几个yes吧，但是要是n多文件怎么办，那还不输死人呢？下面提供三种解决办法。方法一我们输入alias命令，看看系统给cp起了一个什么别名。 [root@localhost ~]# aliasalias cp=’cp -i’a
Memcached(一)、HelloWorld frank1234 memcached
一、简介高性能的架构离不开缓存，分布式缓存中的佼佼者当属memcached，它通过客户端将不同的key hash到不同的memcached服务器中，而获取的时候也到相同的服务器中获取，由于不需要做集群同步，也就省去了集群间同步的开销和延迟，所以它相对于ehcache等缓存来说能更好的支持分布式应用，具有更强的横向伸缩能力。二、客户端选择一个memcached客户端，我这里用的是memc
Search in Rotated Sorted Array II hcx2013 search
Follow up for "Search in Rotated Sorted Array":What if duplicates are allowed? Would this affect the run-time complexity? How and why? Write a function to determine if a given ta
Spring4新特性——更好的Java泛型操作API jinnianshilongnian spring4 generic type
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
CentOS安装JDK liuxingguome centos
1、行卸载原来的： [root@localhost opt]# rpm -qa | grep java tzdata-java-2014g-1.el6.noarch java-1.7.0-openjdk-1.7.0.65-2.5.1.2.el6_5.x86_64 java-1.6.0-openjdk-1.6.0.0-11.1.13.4.el6.x86_64 [root@localhost
二分搜索专题2-在有序二维数组中搜索一个元素 OpenMind 二维数组算法二分搜索
1,设二维数组p的每行每列都按照下标递增的顺序递增。用数学语言描述如下：p满足 (1),对任意的x1，x2，y，如果x1<x2,则p(x1,y)<p(x2,y); (2),对任意的x，y1,y2, 如果y1<y2,则p(x,y1)<p(x,y2); 2,问题：给定满足1的数组p和一个整数k，求是否存在x0,y0使得p(x0,y0)=k? 3,算法分析： (
java 随机数 Math与Random SaraWon java Math Random
今天需要在程序中产生随机数，知道有两种方法可以使用，但是使用Math和Random的区别还不是特别清楚，看到一篇文章是关于的，觉得写的还挺不错的，原文地址是 http://www.oschina.net/question/157182_45274?sort=default&p=1#answers 产生1到10之间的随机数的两种实现方式： //Math Math.roun
oracle创建表空间 tugn oracle
create temporary tablespace TXSJ_TEMP tempfile 'E:\Oracle\oradata\TXSJ_TEMP.dbf' size 32m autoextend on next 32m maxsize 2048m extent m
使用Java8实现自己的个性化搜索引擎 yangshangchuan java superword 搜索引擎 java8 全文检索
需要对249本软件著作实现句子级别全文检索，这些著作均为PDF文件，不使用现有的框架如lucene，自己实现的方法如下： 1、从PDF文件中提取文本，这里的重点是如何最大可能地还原文本。提取之后的文本，一个句子一行保存为文本文件。 2、将所有文本文件合并为一个单一的文本文件，这样，每一个句子就有一个唯一行号。 3、对每一行文本进行分词，建立倒排表，倒排表的格式为：词=包含该词的总行数N=行号

CVPR 2022 | 腾讯AI Lab入选论文解读，关注图像理解、生成、建模及可信AI

你可能感兴趣的:(大数据,python,计算机视觉,神经网络,机器学习)