孤LOVE枫

PiCIE: Unsupervised Semantic Segmentation Using Invariance and Equivariance in Clustering论文翻译

摘要

我们提出了一个新的基于聚类的无标注语义分割框架。现成的聚类方法仅限于精选的、单标签和以对象为中心的图像，而现实世界的数据主要是非精选的、多标签和以场景为中心的。我们将聚类从图像扩展到像素，并将每个图像中的不同实例分配了单独的聚类membership。然而，仅仅依靠像素级的特征相似性无法学习高级语义概念和适应低级视觉线索。我们提出了一种方法，将几何一致性作为一种归纳偏差，来学习光度和几何变化的不变性和等方差。通过我们新的学习目标，我们的框架可以学习高级语义概念。我们的方法 PiCIE（使用不变性和等方差的像素级特征聚类）是第一个能够在没有任何超参数调整或特定任务预处理的情况下分割事物和东西类别的方法。我们的方法在很大程度上优于 COCO [31] 和 Cityscapes [8] 上的现有基线，具有 +17.5 Acc。和 +4.5 mIoU。我们证明 PiCIE 为标准监督训练提供了更好的初始化效果。

介绍

从一组未标记的图像中进行无监督学习已经获得了很大的普及，但仍然主要局限于单类的、以对象为中心的图像。请考虑图1所示的图像(上图)。给出这些和其他未标记图像的集合，机器能从每一张图像中发现“草”、“天空”、“房子”和“树”的概念吗？更进一步，它能识别出每个概念出现在每张图像中的哪里，并将其分割出来吗？

能够进行这种无监督语义分割的系统然后可以自动发现具有其精确边界的对象类别，从而消除收集和标记(eg:COCO)数据集的大量成本。它甚至可能发现注释者可能事先不知道的对象、材质和纹理。这对于分析新的领域特别有用：例如，在卫星图像中发现新类型的视觉结构。对于试图在野外操纵这些物体的机器人来说，该系统发现和分割未知物体的能力也可能被证明是有用的。

然而，尽管无监督语义分割可能有用，但它也是具有挑战性的。这是因为它将类别发现问题与详尽的像素标记的挑战结合在一起。自我监督和无监督学习的最新进展表明识别系统当然可以发现图像级的类。然而，图像级别的标记更容易，因为网络可以简单地依赖于几个独特、稳定的特征，而丢弃图像的其余部分。例如，识别系统可能能够简单地通过检测每个图像中的屋顶瓦片的存在并忽略图像中的其他所有内容来将图1的所有四个图像分组在一起。相反，在分割图像时，任何像素都不能被忽略；无论它是不同的对象(物体)还是背景实体(填充)，尽管可能存在较大的类内差异，但每个像素都必须被识别和准确地表征。因此，很少有以前的工作试图解决这个发现语义切分的问题，结果仅限于非常粗略的材料切分。

在本文中，我们朝着一个实用的无监督语义分割系统迈进了一步：我们提出了一种方法，能够以比现有技术更精细的粒度分割出所有像素，无论是物体还是东西。我们的方法是基于一个简单的目标，该目标只包含了两个常识性约束。首先，具有相似外观的像素(即，它们在学习的特征空间中聚在一起)应该被类似地标记，反之亦然。其次，像素标签对于颜色空间变换应该是不变的，对于几何变换应该是等方差的。我们的结果表明，仅使用这两个目标，我们就可以在没有任何标签的情况下端到端地训练一个基于ConvNet的语义分割系统。

我们发现，尽管它很简单，但我们的方法远远优于之前在这项任务上的工作，比现有技术的准确性提高了一倍以上（图 1，底部）。与之前的工作相比，我们的基于聚类的损失函数（上面的第一个目标）使它变成了一个更简单、更容易的学习问题，而不是试图学习参数像素分类器。但不变性和等变性目标是关键。它们允许卷积网络将不同比例、姿势和颜色变化的像素连接在一起，这是现有系统无法做到的。这种增强了的对不变性的鲁棒性也允许我们的方法有效地分割对象。我们通过消融研究证明了这些直觉，我们发现这些直觉中的每一个都有助于显着提高性能。

总之，我们的结果表明，卷积网络不仅可以学习发现图像级的概念，还可以在没有任何监督的情况下对图像进行语义解析。这为真正的大规模发现打开了大门，这样一个训练有素的网络可以自动从未标记、未精选的数据集中显示新类别的对象、材料或纹理。

3、PiCIE

我们得到了来自某个域D的未精选的、未标记的图像数据集。在这个数据集中，我们想要发现一组视觉类C，并学习一个语义分割函数fθ。当提供来自D的不可见图像时，fθ应该能够从类别C集合中为每个像素分配一个标签。

我们将这种无监督图像分割任务描述为像素级聚类，每个像素被分配到一个聚类。聚类通常需要良好的特征空间，但先验地不存在这样的特征表示。因此，我们提出了一种与聚类一起学习特征表示的方法。图2描述了PiCIE的整体流程，它代表使用不变性和等方差的像素级特征聚类。我们将在下面描述我们的方法。

3.1.一种基准聚类法

我们从之前的工作开始，学习端到端的神经网络以将未标记的图像聚类到图像级类别中。在这些论文中解决的关键问题是，将图像聚类成类别需要强特征表示，但对于训练强特征表示，需要类标签。要解决这个鸡和蛋的问题，最简单的解决方案是DeepCluster确定的解决方案：交替使用当前特征表达进行无监督聚类，并使用聚类标签作为伪标签来训练特征表达。

(DeepCluster：得到特征后作无监督聚类得到伪标签，然后反过来训练特征网络)

对于无监督语义分割任务，可以遵循类似的策略。唯一的区别是，我们需要使用一个嵌入函数fθ来生成一个特征图，为每个像素生成一个特征向量。分类器还必须对单个像素进行操作。然后，可以交替地对像素特征向量进行聚类以获得像素伪标签，并使用这些伪标签来训练像素特征表示。

具体地说，假设我们有一组未标记的图像xi，i=1，.。。。假设我们的嵌入，由fθ表示，产生一个特征张量fθ(X)。这为图像x中的每个像素p产生一个特征表示。用fθ(X)[p]表示该像素级特征表示。用GW(·)表示对这些像素特征向量进行运算的分类器。然后，我们的基线方法在两个步骤之间交替：

(1)使用当前嵌入和k-均值对数据集中的像素进行聚类

其中，yip表示第i张图像中第p个像素的簇标签，而µk是第k个簇质心。(我们使用小批量k-Means)

(2)使用聚类标签训练像素分类器，使用标准交叉熵损失。

其中SK是由分类器GW(fθ(xi，p))输出的第k个类分数

鉴于这一基线，我们现在提出以下修改。

3.2 基于非参数原型的分类器

上面受DeepCluster启发的框架使用了一个单独的、可学习的分类器。然而，在具有不断变化的伪标签的非监督设置中，与特征表示共同训练分类器可能是具有挑战性的。训练不足的分类器可能会将噪声梯度输入到特征提取器中，从而在下一轮训练中产生有噪声的聚类。

因此，我们建议完全抛弃参数像素分类器gw。相反，我们根据像素到质心的距离(“原型”[41])，用k- means估计，来标记像素。这导致了以下目标的改变。d是余弦距离。

3.3 不变性和等方差性

如上所述，共同学习特征表示和聚类肯定会产生在特征空间中紧凑的聚类，但这些聚类没有理由一定是语义的。为了获得像素的语义分组，我们需要引入额外的归纳偏向。如果我们没有标签，这种归纳偏差会是什么？

我们引入的归纳偏差对光度变换是不变的，对几何变换是等方差的：如果像素颜色略有抖动，标签应该不会改变，当图像在几何上扭曲时，标签应该类似地扭曲。具体地说，如果Y是图像x的输出语义标注，P和G分别是光度变换和几何变换，则变换后的图像G(P(X))的输出语义标注应该是G(Y)。

在联合聚类和学习框架中实现这一约束是很棘手的，因为没有针对每幅图像的真实值标签。伪地面真值标注本身源自于聚类，而聚类本身是由特征映射产生的，因此其本身对输入变换敏感。因此，在这种情况下的不变性/等方差意味着两件事：第一，无论变换如何，我们都应该产生相同的聚类；第二，预测的像素标签应该表现出所需的不变性或等方差。

3.3.1 光度学变换的不变性

我们首先讨论不变性的问题。对于数据集中的每个图像xi，我们随机采样两个光度变换，P(1)i和P(2)i。这为每个图像Xi中的每个像素p产生两个特征向量：

然后我们在两个“视图”中分别进行聚类，得到两组伪标签和质心:

给定这两组质心和这两组伪标签，我们使用两组损失函数：

1. 和前面一样，我们希望特征向量依附于聚类标签。现在我们有两个观点，我们希望这在每个视图中都是正确的：

、

2. 因为我们假设聚类对于光度变换是不变的，所以我们也希望一个视图的特征向量与另一个视图的聚类标签和质心相匹配:

这个多视图框架和交叉视图损失实现了两件事。首先，通过迫使一个变换的特征向量依附于另一个变换产生的标签，它鼓励网络学习在任意任何光度量变换的情况下，都将被标记为相同的特征表示。其次，通过强制相同的特性表示与两种不同的聚类解决方案保持一致，这鼓励了两种解决方案本身的匹配，从而确保通过聚类发现的概念集对光度转换是不变的。

3.3.2几何变换的等方差

一个房子和一个放大版的房子应该被贴上类似的标签，但可能会产生非常不同的特征。更准确地说，放大版内部的分割应该是原始分割的放大版。这是几何变换(如随机裁剪)的等方差概念，我们接下来要添加。

为了学习几何变换的等方差，我们为每个图像采样一个几何变换(具体地说，随机裁剪和水平翻转)Gi。那么，在上述框架中，一种视图使用变换后的图像的特征向量，而另一种视图使用变换后的原图像的特征向量:

其他步骤完全相同。将这两个视图分别聚类，最终的训练目标是view within和cross-view目标的结合:

(作者在DeepCluster的基础上了，提出对原图像进行变换，然后对变换后图像得到的特征也进行聚类，得到另一组伪标签。然后

核心思想：同时利用原图像特征聚类得到的伪标签和变换图像特征聚类得到的伪标签进行特征训练)

4.实验

4.1训练细节

在我们所有的实验中，我们使用了特征金字塔网络和在ImageNet上预先训练的resnet - 18骨干。特征金字塔的融合维度是128而不是256。我们将L2归一化应用于我们的网络的特征映射。使用Faiss库，通过使用GPU的小批量近似来计算聚类质心。对于基线，当我们使用ImageNet预先训练的权重时，我们不使用图像梯度作为额外的输入。除表4外，所有图像在训练期间都被调整大小和居中裁剪到320×320。我们使用了发布的代码[4，23]，对基线进行了最小程度的修改。其他详情见补充资料。

预训练vs随机初始化。以前的工作从随机初始化开始训练网络，但对于语义分割来说，这是不必要的;与表征学习文献不同，我们的目标是尽可能准确地分割给定的数据集，在实际场景中，人们总是会选择从一个预先训练的网络(如ImageNet数据集[9])中初始化。
因此，我们使用imagenet预先训练的权值来训练所有的模型，除了在表4中，我们显示picie在从头开始训练时也优于所有的基线。

损失平衡和超聚类。共同优化一组数量较高的单独聚类，提高了聚类的稳定性和预测的准确性。然而，在无监督设置中，超参数调优通常是不可行的。因此，我们使用一般的方法来平衡损失:

k1和可k2是聚类数目。直观上，交叉熵损失的大小依赖于对数-算术上的聚类数目，因此我们防止过过度聚类压倒梯度流。我们修复K2 = 100，加上+H，应用时显示在结果中。类似地，由于数据集的不平衡，计算的聚类将有很大的不同;在交叉熵计算过程中，我们为每个聚类应用了一个平衡项。

4.2基线

我们描述了基线方法，将pice与 IIC和修改DeepCluster用作分割相比较。它们是最先进的隐式和显式聚类学习方法。

IIC IIC[23]是一种隐式聚类方法，网络直接预测每个像素级特征向量的(软)聚类分配。其主要目标是最大化像素预测与相邻像素预测之间的互信息。在对照实验中，我们使用了与pice相同的ResNet-18的FPN，以及与原始的shallow VGG-like模型相似的ResNet-18前两个残块(IIC - res12)。在原论文[23]的基础上，我们使用辅助过聚类损耗，K = 45。

修正后的DeepCluster。DeepCluster是一种显式的聚类方法，网络将给定图像的特征向量聚类，并使用聚类分配作为标签来训练网络。为了适应我们的问题设置，我们修改了原始的DeepCluster，以在最终的池化层之前对像素级特征向量进行聚类。这允许网络为每个像素分配一个标签。但是，由于图像的大小使得需要聚类的特征向量的数量激增，我们首先使用小批量k-means[39]来计算聚类的质心，分配标签，并训练网络。

4.4 结果

在表1中，我们将pice与以下基线进行了比较:No Train、modified DeepCluster[4]和IIC[23]。
与之前的工作中只考虑物品类别不同，我们评估了东西和物品类别上的模型，以在更现实的环境中进行测试。由于大多数以场景为中心的图像数据集都是由材料类别组成的，因此我们的评估面临着严重的不平衡问题。此外，IIC的学习机制假设了局部空间一致性，由于更多的动态形状变化，对于事物类别来说，这通常是不正确的。我们发现，由于(隐式)聚类是在批处理中进行的，并且当实例具有动态和复杂的视觉线索时，缺乏监督信号，IIC倾向于对低级视觉线索过度拟合。实际上，在图3中，IIC结果没有正确地划分出事物类别。另一方面，PiCIE新颖的in/equivariance loss强制使用计量一致性作为归纳偏差来学习高级视觉概念，如图3所示，PiCIE(“我们的”)能够以高精确度分割物品和物品类别。因此，表1显示pice的表现大大超过其他基线(+ 17.5 Acc)。和4.5 mIoU)。在表3，我们在cityscape上测试了基线和我们的方法，并显示了相似的优势水平(+ 18 Acc。和5.3 mIoU)。最后，表4显示pcie在基准上优于其他模型[23,37]，其中图像大小为128×128，模型从头开始训练，只考虑材料标签进行评估。

things vs stuff。在表2中，我们显示，与其他方法相比，pcie主要改进了thing类别(+10 mIoU)，同时，在stuff了别上保持了更好或兼容的性能。这表明，在实例对象具有不同形状和边界的类别上，强制几何变换等方差是非常有效的。此外，我们在表2和表4中显示，pice在有或没有经过imagenet预处理的权重的物品类别上仍然表现出色。

5.结论

本文提出了一种新的基于聚类的无监督语义分割框架。我们的主要贡献是将几何一致性作为归纳偏差，以学习光测和几何变化的不变性和等方差。我我们的新的交叉视点损失在学习划分事物类别所需的高级视觉概念方面简单而高效。我们的方法是第一个无监督的语义分割，既适用于thing类别，也适用于stuff类别，而不需要严格的超参数调整或特定于任务的预处理。

[python系列] 创建虚拟环境 venv en-route python virtualenv
虚拟环境定义Python中的虚拟环境是一个隔离的运行环境，旨在为每个Python项目提供独立的执行空间，支持在不同的项目中分别管理依赖关系，而不会影响到其他项目或系统的原始Python安装。可以将虚拟环境视为每个Python项目的“独立容器”，每个容器具备以下特点：拥有独立的Python解释器拥有各自独立的包管理和安装的软件包与其他虚拟环境相互隔离允许同一包存在不同版本使用虚拟环境的重要性体现在以
Python代理池的构建与应用：实现高效爬虫与防封禁策略程序员威哥 python 爬虫开发语言
在进行大规模网络数据抓取时，IP封禁是最常见的反爬虫手段之一。为了应对这一挑战，代理池成为了一个重要工具。通过构建代理池，爬虫程序可以随机切换代理IP，避免同一IP被频繁访问而导致封禁，确保数据抓取任务的稳定性和持续性。本文将详细介绍如何使用Python构建一个高效的代理池，并结合实际应用场景，讲解如何使用代理池提升爬虫的抓取能力和防封禁策略。一、代理池的工作原理代理池的基本工作原理是，爬虫请求时
Python爬虫实战：用Tushare和Baostock爬取股票历史数据及K线图与技术指标计算
在金融数据分析和量化交易中，股票历史数据的获取是进行技术分析、回测和策略研究的第一步。传统上，投资者需要依赖付费数据服务，然而如今，借助Python强大的爬虫工具和开源数据接口，我们能够轻松地爬取免费的历史股票数据，并结合K线图与技术指标来进行深入分析。Tushare和Baostock是两个非常流行的开源金融数据接口。Tushare提供了丰富的国内外金融数据，特别是A股市场的历史数据和实时数据，而
Python_计算两个省市之间的直线距离_2506 夏天里的肥宅水 PYTHON python spring 开发语言
更新代码上一版链接importpandasaspdimporttimeimportpickleimportosimportsysfromgeopy.geocodersimportNominatimfromgeopy.distanceimportgeodesicfromtqdmimporttqdm#ConfigurationINPUT_FILE=r"距离.xlsx"#输入文件路径OUTPUT_FIL
python中的*args 和 **kwargs Hi_kenyon python python
简单来说，它们允许一个函数接收不定数量的参数。这在我们预先不知道会传递多少个参数给函数时非常有用。*args(任意数量的位置参数)*args用于在一个函数中接收任意数量的位置参数(positionalarguments)。当你在函数定义中使用*args时，Python会将所有传入的多余的位置参数收集到一个元组(tuple)中。这个名字args只是一个约定俗成的惯例(arguments的缩写)，你也
用 Python 开发文字冒险游戏：从零开始的教程晓天天天向上 python microsoft 开发语言
文字冒险游戏(Text-basedAdventureGame)是一种经典的游戏类型，玩家通过输入文字指令与游戏世界互动。这种游戏不依赖复杂的图形界面，非常适合初学者学习编程逻辑和用户交互。在本篇博客中，我们将用Python开发一个简单的文字冒险游戏，体验游戏开发的乐趣。1.游戏设计思路游戏背景玩家醒来发现自己身处一个神秘的地下城，需要探索房间、收集物品、战胜敌人并找到出口。核心机制房间导航：玩家可
从零开始理解零样本学习：AI人工智能必学技术 AI天才研究院 Agentic AI 实战 AI人工智能与大数据 AI大模型企业级应用开发实战 ai
从零开始理解零样本学习：AI人工智能必学技术关键词：零样本学习、人工智能、机器学习、知识迁移、语义嵌入摘要：本文旨在全面深入地介绍零样本学习这一在人工智能领域具有重要意义的技术。首先阐述零样本学习的背景和基本概念，通过详细的解释和直观的示意图让读者建立起对零样本学习的初步认识。接着深入剖析其核心算法原理，结合Python代码进行详细说明，同时引入相关数学模型和公式并举例阐释。通过项目实战部分，带领
Python训练营打卡——DAY16（2025.5.5） cosine2025 Python训练营打卡 python 开发语言机器学习
目录一、NumPy数组基础笔记1.理解数组的维度(Dimensions)2.NumPy数组与深度学习Tensor的关系3.一维数组(1DArray)4.二维数组(2DArray)5.数组的创建5.1数组的简单创建5.2数组的随机化创建5.3数组的遍历5.4数组的运算6.数组的索引6.1一维数组索引6.2二维数组索引6.3三维数组索引二、SHAP值的深入理解三、总结1.NumPy数组基础总结2.SH
Python的一点基础教程------文件读写卡提西亚 python 开发语言
最近在看大佬写的Python教程自学,但是感觉有点头痛,因为大佬讲了一些底层的结构和原理,但是又没那么详细,然后作为一个初学者自学的情况下,看的很费劲.看完就有感而发,想写一篇更基础的教程,教会大家怎么去用它,尽量少的去讲原理.但是当然,你也需要有一定的编程语言基础,了解基本的语法和函数等功能.正所谓师傅领进门,修行在个人,有时候我们学了一个东西,如果觉得很有趣,自然就会去了解关于它的更多信息,但
1.2 Python 的特点与优势 Utopia Reverie python python 开发语言
1.语法简洁易读Python以简洁的语法著称，代码可读性强，减少了不必要的符号和冗余代码。例如，使用缩进来表示代码块，而非传统的大括号。这使得代码更易于理解和维护，尤其适合初学者。示例：python运行【#计算斐波那契数列的前10项n=10a,b=0,1for_inrange(n);print(a,end='')a,b=b,a+b#输出:0112358132134】2.开源与社区支持Python是
动手学Python：从零开始构建一个“文字冒险游戏” network爬虫 python python 开发语言
动手学Python：从零开始构建一个“文字冒险游戏”大家好，我是你的技术向导。今天，我们不聊高深的框架，也不谈复杂的算法，我们来做一点“复古”又极具趣味性的事情——用Python亲手打造一个属于自己的文字冒险游戏（TextAdventureGame）。你是否还记得那些在早期计算机上，通过一行行文字描述和简单指令来探索未知世界的日子？这种游戏的魅力在于它能激发我们最原始的想象力。而对于我们程序员来说
python 脚本遍历目录，并把目录下的非utf-8文件改成utf8 还债大湿兄 python 开发语言数据库
从网上下载的qt项目我本地编译里面经常包含中文，提示编译不过，实际上以前经常手动转，发觉还是用脚本不，毕竟这次下的有点大，我只改.h.cpp#pythonD:\python\filetoUtf.pyE:\EasyCanvas-master\EasyCanvas-masterimportosimportcodecsimportargparseimportsysdefconvert_to_utf8_b
树莓派中 Python+opencv打开摄像头 68lizi 光电设计 python
树莓派中Python+opencv打开摄像头注意不要使用cap=cv2.VideoCapture(0,cv2.CAP_DSHOW)，我在树莓派使用这个的时候会报错，在windows不会报错，具体原因不清楚cap=cv2.VideoCapture(0)#使用cap=cv2.VideoCapture(0,cv2.CAP_DSHOW)会报错whileTrue:status,img=cap.read()i
python实现读取文件的指定某行内容 Fitz1318 Python3学习 python
python实现读取文件的指定某行内容最近有一个需求就是读取一个文件中的指定某行的内容，现将方法记录如下importlinecache#这里填写你自己的文件位置和行号text=linecache.getline("../TestFile/test_C1.json",2)print(text)
[Python] 使用 dataclass 简化数据结构：定义、功能与实战踏雪无痕老爷子 Python python 开发语言
在经典面向对象编程中，为了保存和操作数据往往需要定义多个类，手写__init__()、__repr__()、__eq__()等方法。Python3.7引入了@dataclass装饰器，它能自动生成这些常见方法，大幅减少样板代码。本文将介绍dataclass的定义与参数、比较与普通类的差别、实战示例，以及常见注意事项。一、什么是dataclass@dataclass是一种类装饰器，它通过类成员的类型
[Python]-基础篇1- 从零开始的Python入门指南踏雪无痕老爷子 Python python 开发语言
无论你是尚未接触编程的新手，还是想从其他语言转向Python的开发者，这篇文章都是你的入门课。一、Python是什么？Python是一种解释型、高级、通用型编程语言，以简洁明了、简单易用着称。它可以应用于网站开发、自动化脚本、数据分析、人工智能、系统操作等多种场景。二、如何安装Python步骤：访问Python官方网站选择目前最新的Python3.x版本下载Windows用户请务必勾选“AddPy
算法竞赛备考冲刺必刷题（C++） | 洛谷 P8814 解密热爱编程的通信人算法 c++开发语言
本文分享的必刷题目是从蓝桥云课、洛谷、AcWing等知名刷题平台精心挑选而来，并结合各平台提供的算法标签和难度等级进行了系统分类。题目涵盖了从基础到进阶的多种算法和数据结构，旨在为不同阶段的编程学习者提供一条清晰、平稳的学习提升路径。欢迎大家订阅我的专栏：算法题解：C++与Python实现！附上汇总贴：算法竞赛备考冲刺必刷题（C++）|汇总【题目来源】洛谷：P8814[CSP-J2022]解密-洛
程序化交易系统中如何精准获取MACD、KDJ、BOLL等基础指标的值？股票程序化交易接口量化交易股票API接口 Python股票量化交易程序化交易系统 macd指标 kdj指标 boll指标股票量化接口股票API接口
Python股票接口实现查询账户，提交订单，自动交易（1）Python股票程序交易接口查账，提交订单，自动交易（2）股票量化，Python炒股，CSDN交流社区>>>基础指标在程序化交易系统中的重要性基础指标对交易决策的指导意义MACD、KDJ、BOLL等基础指标在程序化交易系统中扮演着重要角色。MACD可以帮助判断市场的趋势和买卖信号，通过分析其快线和慢线的交叉情况，能为投资者提供入场和出场的参
股票程序化交易软件如何选择？这些要点你知道吗股票程序化交易接口量化交易股票API接口 Python股票量化交易区块链股票程序化交易软件功能特性稳定性成本股票量化接口股票API接口
Python股票接口实现查询账户，提交订单，自动交易（1）Python股票程序交易接口查账，提交订单，自动交易（2）股票量化，Python炒股，CSDN交流社区>>>了解软件功能特性基础交易功能基础交易功能是股票程序化交易软件的核心。它应具备快速下单、撤单等基础操作能力。比如在行情快速变化时，能让投资者迅速抓住机会下单，或者及时撤单避免损失。软件的交易界面要简洁明了，方便投资者操作。还应支持多种交
Python爬虫实战：全方位爬取知乎学习板块问答数据 Python爬虫项目 2025年爬虫实战项目 python 爬虫学习开发语言 scrapy 游戏
1.项目背景与爬取目标知乎是中国最大的知识问答社区，聚集了大量高质量的学习资源和经验分享。爬取知乎“学习”板块的问答数据，可以为学习资料整理、舆情分析、推荐系统开发等提供数据支持。本项目目标：爬取“学习”话题下的热门问答列表抓取每个问答的标题、作者、回答内容、点赞数、评论数等详细信息实现动态加载内容的抓取，包含图片和富文本避免被反爬机制限制，保证数据采集稳定结合数据分析，为后续应用打基础2.知乎“
Python实战：自动在知乎回答点赞并采集内容的高阶爬虫教程 Python爬虫项目 2025年爬虫实战项目 python 爬虫开发语言 okhttp 学习
✨写在前面：为什么做知乎自动化操作？知乎作为中国领先的知识问答平台，拥有大量结构化内容。对于研究舆情分析、情绪识别、用户画像，甚至产品舆情反馈采集的用户来说，如何自动获取知乎内容并进行交互行为（如点赞、回答），是一个非常实用的能力。本文将手把手带你用Python完成以下目标：✅自动登录知乎✅自动搜索某个关键词下的热门问题✅自动点赞高质量回答✅自动采集回答内容（文本、点赞数、评论数等）✅自动保存为本
Python爬虫实战：爬取知乎问答与用户信息 Python爬虫项目 python 爬虫 php 数据分析开发语言开源
简介随着网络信息量的爆炸，如何有效获取有价值的内容，成为了数据分析、机器学习等领域的基础之一。爬虫作为数据采集的基本工具之一，常常被用来获取互联网上的公开数据。在这篇博客中，我们将结合最新的Python爬虫技术，详细讲解如何爬取知乎问答与用户信息。本文将会介绍：Python爬虫的基础知识知乎问答网页结构分析使用Python进行知乎数据爬取爬取知乎问答内容与用户信息如何处理和存储爬取的数据使用最新的
python实战项目79：采集知乎话题下的所有回答 wp_tao Python副业接单实战项目 python 开发语言
python实战项目79：采集知乎话题下的所有回答一、项目介绍二、代码使用方法三、drissionpage的优缺点四、完整代码五、注意事项一、项目介绍需求是采集知乎某话题下的所有回答，这里以话题“大学宿舍相处之间遇到莫名其妙的冷落怎么办呢？”为例，网页链接为https://www.zhihu.com/question/1898156781215146265，其中189815678121514626
使用 pip 命令下载 whl离线安装包、安装三希 pip
使用pip命令直接从线上下载whl离线安装包并转存到离线环境的过程实际上是分两步进行的：第一步：在线环境下载whl包bash#在具有网络连接的环境中pipdownload--only-binary=:all:--wheel--platform--python-version这里的参数说明：：需要下载的Python包名称。--only-binary=:all:：只下载二进制包（即whl文件）。--w
【Python】如何使用.whl文件安装Python包？ civilpy python 开发语言
基本原理在Python的世界中，.whl文件是一种分发格式，它代表“Wheel”。Wheel是一种Python包格式，旨在提供一种快速、可靠且兼容的方式，用于安装Python库。与源代码包相比，Wheel文件是预编译的，这意味着它们已经包含了编译后的扩展模块，这使得安装过程更快，更简单。代码示例以下是使用.whl文件安装Python包的示例步骤：示例1：基本安装假设你已经下载了一个名为exampl
如何安装 `.whl` 文件（Python Wheel 包）喝醉酒的小白 Liunx Python模块 python 开发语言
目录标题如何安装`.whl`文件（PythonWheel包）安装前提安装方法（3种）方法1：直接使用pip安装（推荐）方法2：先进入文件目录再安装方法3：使用绝对路径（适合脚本中调用）⚠️常见问题解决问题1：版本不兼容错误问题2：缺少依赖问题3：权限不足验证安装进阶技巧如何安装.whl文件（PythonWheel包）.whl文件是Python的二进制分发格式（Wheel格式），用于快速安装Pyth
Python 数据挖掘实战：关联规则与聚类分析，解锁数据价值的钥匙清水白石008 python Python题库 python 数据挖掘动画
Python数据挖掘实战：关联规则与聚类分析，解锁数据价值的钥匙引言在数字化浪潮席卷全球的今天，数据已成为企业和组织最重要的战略资产。海量数据蕴藏着巨大的价值，等待我们去挖掘和发现。数据挖掘(DataMining)，作为从海量数据中提取有价值知识和模式的关键技术，正日益受到各行各业的重视。它如同探矿者的火眼金睛，能够穿透数据的迷雾，发现隐藏在背后的规律和趋势，为商业决策、科学研究和社会发展提供强有
PyWavelets shangjg3 PyTorch pytorch 人工智能 python
PyWavelets（pywt）是Python中用于小波变换的核心库，提供了丰富的信号处理和图像处理功能。以下是其核心功能的详细介绍：1.小波变换基础（1）离散小波变换（DWT）将信号分解为近似系数（Approximation）和细节系数（Detail）。importpywtimportnumpyasnp#示例信号signal=np.array([1
Anaconda插件开发 lyh1344 数据库开发
开发环境准备安装Anaconda或Miniconda，确保conda命令可用。推荐使用Python3.7及以上版本。创建独立的开发环境以避免依赖冲突：condacreate-nplugin_devpython=3.8condaactivateplugin_dev插件结构设计Anaconda插件通常采用Python包的标准结构。核心文件包括__init__.py和setup.py。典型目录结构如下：
Python3 数字(Number) froginwe11 开发语言
Python3数字(Number)引言在编程语言中，数字是构成程序的基础元素之一。Python3作为一种高级编程语言，提供了丰富的数字类型和操作方法。本文将详细介绍Python3中的数字类型，包括整数、浮点数、复数等，并探讨它们的特性和应用。整数（Integer）整数是Python3中最基本的数据类型之一，用于表示没有小数部分的数值。在Python3中，整数类型没有大小限制，可以表示任意大小的整数
Js函数返回值 _wy_ js return
一、返回控制与函数结果，语法为：return 表达式;作用: 结束函数执行，返回调用函数，而且把表达式的值作为函数的结果二、返回控制语法为：return;作用: 结束函数执行，返回调用函数，而且把undefined作为函数的结果在大多数情况下,为事件处理函数返回false,可以防止默认的事件行为.例如,默认情况下点击一个<a>元素,页面会跳转到该元素href属性
MySQL 的 char 与 varchar bylijinnan mysql
今天发现，create table 时，MySQL 4.1有时会把 char 自动转换成 varchar 测试举例： CREATE TABLE `varcharLessThan4` ( `lastName` varchar(3) ) ; mysql> desc varcharLessThan4; +----------+---------+------+-
Quartz——TriggerListener和JobListener eksliang TriggerListener JobListener quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208624 一.概述 listener是一个监听器对象，用于监听scheduler中发生的事件，然后执行相应的操作；你可能已经猜到了，TriggerListeners接受与trigger相关的事件，JobListeners接受与jobs相关的事件。二.JobListener监听器 j
oracle层次查询 18289753290 oracle；层次查询；树查询
.oracle层次查询(connect by) oracle的emp表中包含了一列mgr指出谁是雇员的经理，由于经理也是雇员，所以经理的信息也存储在emp表中。这样emp表就是一个自引用表，表中的mgr列是一个自引用列，它指向emp表中的empno列，mgr表示一个员工的管理者， select empno,mgr,ename,sal from e
通过反射把map中的属性赋值到实体类bean对象中酷的飞上天空 javaee 泛型类型转换
使用过struts2后感觉最方便的就是这个框架能自动把表单的参数赋值到action里面的对象中但现在主要使用Spring框架的MVC，虽然也有@ModelAttribute可以使用但是明显感觉不方便。好吧，那就自己再造一个轮子吧。原理都知道，就是利用反射进行字段的赋值，下面贴代码主要类如下： import java.lang.reflect.Field; imp
SAP HANA数据存储：传统硬盘的瓶颈问题蓝儿唯美 HANA
SAPHANA平台有各种各样的应用场景，这也意味着客户的实施方法有许多种选择，关键是如何挑选最适合他们需求的实施方案。在《Implementing SAP HANA》这本书中，介绍了SAP平台在现实场景中的运作原理，并给出了实施建议和成功案例供参考。本系列文章节选自《Implementing SAP HANA》，介绍了行存储和列存储的各自特点，以及SAP HANA的数据存储方式如何提升空间压
Java Socket 多线程实现文件传输随便小屋 java socket
高级操作系统作业，让用Socket实现文件传输，有些代码也是在网上找的，写的不好，如果大家能用就用上。客户端类： package edu.logic.client; import java.io.BufferedInputStream; import java.io.Buffered
java初学者路径 aijuans java
学习Java有没有什么捷径?要想学好Java，首先要知道Java的大致分类。自从Sun推出Java以来，就力图使之无所不包，所以Java发展到现在，按应用来分主要分为三大块：J2SE,J2ME和J2EE,这也就是Sun ONE(Open Net Environment)体系。J2SE就是Java2的标准版，主要用于桌面应用软件的编程；J2ME主要应用于嵌入是系统开发，如手机和PDA的编程；J2EE
APP推广 aoyouzi APP 推广
一，免费篇 1，APP推荐类网站自主推荐最美应用、酷安网、DEMO8、木蚂蚁发现频道等,如果产品独特新颖，还能获取最美应用的评测推荐。PS：推荐简单。只要产品有趣好玩，用户会自主分享传播。例如足迹APP在最美应用推荐一次，几天用户暴增将服务器击垮。 2，各大应用商店首发合作老实盯着排期，多给应用市场官方负责人献殷勤。 3，论坛贴吧推广百度知道，百度贴吧，猫扑论坛，天涯社区，豆瓣（
JSP转发与重定向百合不是茶 jsp servlet Java Web jsp转发
在servlet和jsp中我们经常需要请求,这时就需要用到转发和重定向; 转发包括;forward和include 例子;forwrad转发; 将请求装法给reg.html页面关键代码; req.getRequestDispatcher("reg.html
web.xml之jsp-config bijian1013 java web.xml servlet jsp-config
1.作用：主要用于设定JSP页面的相关配置。 2.常见定义： <jsp-config> <taglib> <taglib-uri>URI(定义TLD文件的URI,JSP页面的tablib命令可以经由此URI获取到TLD文件)</tablib-uri> <taglib-location> TLD文件所在的位置
JSF2.2 ViewScoped Using CDI sunjing CDI JSF 2.2 ViewScoped
JSF 2.0 introduced annotation @ViewScoped; A bean annotated with this scope maintained its state as long as the user stays on the same view(reloads or navigation - no intervening views). One problem w
【分布式数据一致性二】Zookeeper数据读写一致性 bit1129 zookeeper
很多文档说Zookeeper是强一致性保证，事实不然。关于一致性模型请参考http://bit1129.iteye.com/blog/2155336 Zookeeper的数据同步协议 Zookeeper采用称为Quorum Based Protocol的数据同步协议。假如Zookeeper集群有N台Zookeeper服务器(N通常取奇数，3台能够满足数据可靠性同时
Java开发笔记白糖_ java开发
1、Map<key,value>的remove方法只能识别相同类型的key值 Map<Integer,String> map = new HashMap<Integer,String>(); map.put(1,"a"); map.put(2,"b"); map.put(3,"c"
图片黑色阴影 bozch 图片
.event{ padding:0; width:460px; min-width: 460px; border:0px solid #e4e4e4; height: 350px; min-heig
编程之美-饮料供货-动态规划 bylijinnan 动态规划
import java.util.Arrays; import java.util.Random; public class BeverageSupply { /** * 编程之美饮料供货 * 设Opt（V’，i）表示从i到n-1种饮料中，总容量为V’的方案中，满意度之和的最大值。 * 那么递归式就应该是：Opt（V’，i）=max{ k * Hi+Op
ajax大参数（大数据）提交性能分析 chenbowen00 Web Ajax 框架浏览器 prototype
近期在项目中发现如下一个问题项目中有个提交现场事件的功能，该功能主要是在web客户端保存现场数据（主要有截屏，终端日志等信息）然后提交到服务器上方便我们分析定位问题。客户在使用该功能的过程中反应点击提交后反应很慢，大概要等10到20秒的时间浏览器才能操作，期间页面不响应事件。根据客户描述分析了下的代码流程，很简单，主要通过OCX控件截屏，在将前端的日志等文件使用OCX控件打包，在将之转换为
[宇宙与天文]在太空采矿,在太空建造 comsci
我们在太空进行工业活动...但是不太可能把太空工业产品又运回到地面上进行加工,而一般是在哪里开采,就在哪里加工,太空的微重力环境,可能会使我们的工业产品的制造尺度非常巨大.... 地球上制造的最大工业机器是超级油轮和航空母舰,再大些就会遇到困难了,但是在空间船坞中,制造的最大工业机器,可能就没
ORACLE中CONSTRAINT的四对属性 daizj oracle CONSTRAINT
ORACLE中CONSTRAINT的四对属性 summary:在data migrate时,某些表的约束总是困扰着我们,让我们的migratet举步维艰,如何利用约束本身的属性来处理这些问题呢?本文详细介绍了约束的四对属性: Deferrable/not deferrable, Deferred/immediate, enalbe/disable, validate/novalidate,以及如
Gradle入门教程 dengkane gradle
一、寻找gradle的历程一开始的时候，我们只有一个工程，所有要用到的jar包都放到工程目录下面，时间长了，工程越来越大，使用到的jar包也越来越多，难以理解jar之间的依赖关系。再后来我们把旧的工程拆分到不同的工程里，靠ide来管理工程之间的依赖关系，各工程下的jar包依赖是杂乱的。一段时间后，我们发现用ide来管理项程很不方便，比如不方便脱离ide自动构建，于是我们写自己的ant脚本。再后
C语言简单循环示例 dcj3sjt126com c
# include <stdio.h> int main(void) { int i; int count = 0; int sum = 0; float avg; for (i=1; i<=100; i++) { if (i%2==0) { count++; sum += i; } } avg
presentModalViewController 的动画效果 dcj3sjt126com controller
系统自带(四种效果)： presentModalViewController模态的动画效果设置： [cpp] view plain copy UIViewController *detailViewController = [[UIViewController al
java 二分查找 shuizhaosi888 二分查找 java二分查找
需求：在排好顺序的一串数字中，找到数字T 一般解法：从左到右扫描数据，其运行花费线性时间O(N)。然而这个算法并没有用到该表已经排序的事实。 /** * * @param array * 顺序数组 * @param t * 要查找对象 * @return */ public stati
Spring Security（07）——缓存UserDetails 234390216 ehcache 缓存 Spring Security
Spring Security提供了一个实现了可以缓存UserDetails的UserDetailsService实现类，CachingUserDetailsService。该类的构造接收一个用于真正加载UserDetails的UserDetailsService实现类。当需要加载UserDetails时，其首先会从缓存中获取，如果缓存中没
Dozer 深层次复制 jayluns VO maven po
最近在做项目上遇到了一些小问题，因为架构在做设计的时候web前段展示用到了vo层，而在后台进行与数据库层操作的时候用到的是Po层。这样在业务层返回vo到控制层，每一次都需要从po-->转化到vo层，用到BeanUtils.copyProperties(source, target)只能复制简单的属性，因为实体类都配置了hibernate那些关联关系，所以它满足不了现在的需求，但后发现还有个很
CSS规范整理（摘自懒人图库） a409435341 html UI css 浏览器
刚没事闲着在网上瞎逛，找了一篇CSS规范整理，粗略看了一下后还蛮有一定的道理，并自问是否有这样的规范，这也是初入前端开发的人一个很好的规范吧。一、文件规范 1、文件均归档至约定的目录中。具体要求通过豆瓣的CSS规范进行讲解：所有的CSS分为两大类：通用类和业务类。通用的CSS文件，放在如下目录中：基本样式库 /css/core
C++动态链接库创建与使用你不认识的休道人 C++dll
一、创建动态链接库 1.新建工程test中选择”MFC [dll]”dll类型选择第二项"Regular DLL With MFC shared linked"，完成 2.在test.h中添加 extern “C” 返回类型 _declspec(dllexport)函数名(参数列表); 3.在test.cpp中最后写 extern “C” 返回类型 _decls
Android代码混淆之ProGuard rensanning ProGuard
Android应用的Java代码，通过反编译apk文件（dex2jar、apktool）很容易得到源代码，所以在release版本的apk中一定要混淆一下一些关键的Java源码。 ProGuard是一个开源的Java代码混淆器（obfuscation）。ADT r8开始它被默认集成到了Android SDK中。官网： http://proguard.sourceforge.net/
程序员在编程中遇到的奇葩弱智问题 tomcat_oracle jquery 编程 ide
　　现在收集一下：　　排名不分先后，按照发言顺序来的。 1、Jquery插件一个通用函数一直报错，尤其是很明显是存在的函数，很有可能就是你没有引入jquery。。。或者版本不对 2、调试半天没变化：不在同一个文件中调试。这个很可怕，我们很多时候会备份好几个项目，改完发现改错了。有个群友说的好：在汤匙
解决maven-dependency-plugin (goals "copy-dependencies","unpack") is not supported xp9802 dependency
解决办法：在plugins之前添加如下pluginManagement，二者前后顺序如下： [html] view plain copy <build> <pluginManagement

PiCIE: Unsupervised Semantic Segmentation Using Invariance and Equivariance in Clustering论文翻译

摘要

介绍

3、PiCIE

核心思想： 同时利用原图像特征聚类得到的伪标签 和 变换图像特征聚类得到的伪标签进行特征训练)

4.实验

5.结论

你可能感兴趣的:(python)

核心思想：同时利用原图像特征聚类得到的伪标签和变换图像特征聚类得到的伪标签进行特征训练)