PL23K

【论文阅读】Segment anything 学习、理解与复现

摘要

We introduce the Segment Anything (SA) project: a new task, model, and dataset for image segmentation. Using our efﬁcient model in a data collection loop, we built the largest segmentation dataset to date (by far), with over 1 billion masks on 11M licensed and privacy respecting images. The model is designed and trained to be promptable, so it can transfer zero-shot to new image distributions and tasks. We evaluate its capabilities on numerous tasks and ﬁnd that its zero-shot performance is impressive – often competitive with or even superior to prior fully supervised results. We are releasing the Segment Anything Model (SAM) and corresponding dataset (SA-1B) of 1B masks and 11M images at https://segment-anything.com to foster research into foundation models for computer vision.

我提出了一个Segment Anythin(SA)的项目，包括：实例分割中新的 Task、新的Model 和新的Dataset。使用高效的数据循环采集模型，建立了目前最大型分割数据集。超过1100万张图像和10亿的掩码（masks）。模型是为了“可提示的(promptable)(或可指令化的)”而设计与训练的，所以可以以零样本（zero-shot）方式转移到新的图像分布和任务。我们在许多任务中评估了它的能力，并且发现他的零样本表现十分优秀，与之前全监督方法结果相比极具竞争力甚至有所超越。我们发布了SegmentAnythingModel(SAM)和数据集(SA-1B)在https://segment-anything.com，以促进计算机视觉的基础模型研究。

1. 引言

Large language models pre-trained on web-scale datasets are revolutionizing NLP with strong zero-shot and few-shot generalization [10]. These “foundation models” [8] can generalize to tasks and data distributions beyond those seen during training. This capability is often implemented with prompt engineering in which hand-crafted text is used to prompt the language model to generate a valid textual response for the task at hand. When scaled and trained with abundant text corpora from the web, these models’ zero and few-shot performance compares surprisingly well to (even matching in some cases) ﬁne-tuned models [10, 21]. Empirical trends show this behavior improving with model scale, dataset size, and total training compute [56, 10, 21, 51].

集成强大的零样本或少样本泛化能力且在网络级别数据集预训练的大规模语言模型正推动这NLP的发展，这些“基础模型”可以运用到原先训练中已知的任务和数据之外。这些能力经常与“提示工程(prompt enginerring 或指令工程)”一起应用到使用人工编制的文本去提示语言模型生成有效的文本反馈替代手工操作。当使用网络中丰富的语料库进行缩放和训练时，这些模型的零样本和少样本表现比其他微调模型更加优秀（有时持平），经验表明这种做法的优势随着模型规模、数据大小和训练计算量的最大而提升。

Foundation models have also been explored in computer vision, albeit to a lesser extent. Perhaps the most prominent illustration aligns paired text and images from the web.For example, CLIP [82] and ALIGN [55] use contrastive learning to train text and image encoders that align the two modalities. Once trained, engineered text prompts enable zero-shot generalization to novel visual concepts and data distributions. Such encoders also compose effectively with other modules to enable downstream tasks, such as image generation (e.g., DALL·E [83]). While much progress has been made on vision and language encoders, computer vision includes a wide range of problems beyond this scope, and for many of these, abundant training data does not exist.

基础模型也在计算机视觉中得到了探索，尽管探索的程度较低。也许最显著的探索就是来自网络中的文本-图像对齐。例如，CLIP和ALIGN使用对比学习方法训练文本-图片从而对齐这两模态。一旦模型被训练以及制作了文本提示，可以零样本泛化得到新颖的视觉概念和数据分布，这种编码器还可以有效组合其他模块从而实现下游任务，如图像生成。虽然视频和语言编码器取得了很大的进展，但计算机视觉中的许多问题都不在了这个范畴，并且其中的不少问题还缺少大量的训练数据。

In this work, our goal is to build a foundation model for image segmentation. That is, we seek to develop a promptable model and pre-train it on a broad dataset using a task that enables powerful generalization. With this model, we aim to solve a range of downstream segmentation problems on new data distributions using prompt engineering.

本次工作中，我们的目标是创造一个“图像分割的基础模型”。即我们寻求开发一种可提示模型，并且使用一个泛化能力强大的任务将该模型在广泛的数据集上进行预训练。在这个模型的基础上，我们的目标是使用提示工程来解决新数据分布中的大量下游图像分割问题。

The success of this plan hinges on three components: task, model, and data. To develop them, we address the following questions about image segmentation:

1. What task will enable zero-shot generalization?

2. What is the corresponding model architecture?

3. What data can power this task and model?

这样计划的成功与否取决于三个方面：
1、什么样的任务可以实现零样本泛化
2、什么是适应的模型架构？
3、什么样的数据可以驱动这样的任务和模型？

These questions are entangled and require a comprehensive solution. We start by deﬁning a promptable segmentation task that is general enough to provide a powerful pretraining objective and to enable a wide range of downstream applications. This task requires a model that supports ﬂexible prompting and can output segmentation masks in realtime when prompted to allow for interactive use. To train our model, we need a diverse, large-scale source of data. Unfortunately, there is no web-scale data source for segmentation; to address this, we build a “data engine”, i.e., we iterate between using our efﬁcient model to assist in data collection and using the newly collected data to improve the model. We introduce each interconnected component next, followed by the dataset we created and the experiments that demonstrate the effectiveness of our approach.

这些问题十分错综复杂以及需要一个全面的解决方案。我们先定义一个可提示的分割任务，该任务应足够通用以满足强大的预训练目标和广泛的下游应用。这个任务需要一个模型，该模型能够支持灵活的提示以及可以在需要交互使用时根据提示实时地输出分割掩码。想要训练我们的模型，我们就需要一个多样化、大规模的数据。不幸的是，目前没有网络级的数据源供图像分割使用，为了解决这个问题，我们建立了一个“数据引擎”，即，我们使用我们的高效模型来帮助我们进行数据收集于此同时又将收集到的新数据来提升模型，两个之间反复迭代。接下来，我们将介绍每个互联组件，然后介绍我们建立的数据集以及证明我们方法的有效性实验。

Task (§2). In NLP and more recently computer vision, foundation models are a promising development that can perform zero-shot and few-shot learning for new datasets and tasks often by using “prompting” techniques. Inspired by this line of work, we propose the promptable segmentation task, where the goal is to return a valid segmentation mask given any segmentation prompt (see Fig. 1a). A prompt simply speciﬁes what to segment in an image, e.g., a prompt can include spatial or text information identifying an object. The requirement of a valid output mask means that even when a prompt is ambiguous and could refer to multiple objects (for example, a point on a shirt may indicate either the shirt or the person wearing it), the output should be a reasonable mask for at least one of those objects. We use the promptable segmentation task as both a pre-training objective and to solve general downstream segmentation tasks via prompt engineering.

图1：我们目标是创建一个图像分割的基础模型，通过引入三个互联的组件：一个可提示的图像分割任务；一个图像分割模型（SAM）通过提示工程可以驱动数据标注和支持零样本迁移到更多的任务中；一个数据引擎收集了SA-1B，我们的数据集超过了10亿的掩码。

任务（章节2）。在NLP和最近的计算机视觉中，基础模型是一项很有前途的发展，它可以使用“提示”技术在新数据集和任务进行零样本和少样本学习。受这个启发，我们提出“可提示的图像分割任务”，他的目标是返回一个有效的分割掩码通过输入任意的分割提示（如图1a）。一种提示只需指定什么才是要要在图像中分割的，例如提示可以包含空间的或者文本的信息来标识一个物体。输出掩码的要求是即使提示不明确或者可能指的是多种对象（例如，提示是在衬衫上一个点有可能真正想要指定的是衬衫或者穿着衬衫的人），该提示的输出应该是至少一个该对象合理的掩码。我们使用这个可提示的图像分割任务即作为预训练的目标也作为解决需要通过提示工程的常规下游图像分割的任务。

Model (§3). The promptable segmentation task and the goal of real-world use impose constraints on the model architecture. In particular, the model must support ﬂexible prompts, needs to compute masks in amortized real-time to allow interactive use, and must be ambiguity-aware. Surprisingly, we ﬁnd that a simple design satisﬁes all three constraints: a powerful image encoder computes an image embedding, a prompt encoder embeds prompts, and then the two information sources are combined in a lightweight mask decoder that predicts segmentation masks. We refer to this model as the Segment Anything Model, or SAM (see Fig. 1b). By separating SAM into an image encoder and a fast prompt encoder / mask decoder, the same image embedding can be reused (and its cost amortized) with different prompts. Given an image embedding, the prompt encoder and mask decoder predict a mask from a prompt in ∼50ms in a web browser. We focus on point, box, and mask prompts, and also present initial results with free-form text prompts. To make SAM ambiguity-aware, we design it to predict multiple masks for a single prompt allowing SAM to naturally handle ambiguity, such as the shirt vs. person example.

模型（章节3）。可提示的分割任务和真实世界中使用的目标，对模型架构施加了约束。尤其是，模型必须支持灵活的提示，需要实时计算掩码以便交互使用，并且必须具有模糊性意识。令人兴奋的是，我们发现一个简单的设计就可以满足全部三种约束：一个强大的图像编码器计算图像Embedding(嵌入，名词)，一个提示编码器去嵌入提示（应该是得到prompt embedding），然后将两种信息结合进一个轻量的掩码解码器中预测分割掩码。我们将此模型称为Segment Anything Model，或者SAM（见图1b）。将SAM分成一个图像编码器和一个快速的提示编码器/掩码解码器，相同的图像嵌入可以在不同的提示输入下重复使用（其计算成本是摊销的）。给到一个图像嵌入，在浏览器中输入一个提示，提示编码器和掩码解码器预测一个掩码只要约50ms。我们聚焦在点、框和掩码的提示，以及交付自由格式提示的初始结果。让SAM具有模糊意识，我们设计它去为一个提示预测多个掩码，好让SAM自然地处理歧义，比如衬衫和人的例子。

Data engine (§4). To achieve strong generalization to new data distributions, we found it necessary to train SAM on a large and diverse set of masks, beyond any segmentation dataset that already exists. While a typical approach for foundation models is to obtain data online [82], masks are not naturally abundant and thus we need an alternative strategy. Our solution is to build a “data engine”, i.e., we co-develop our model with model-in-the-loop dataset annotation (see Fig. 1c). Our data engine has three stages: assisted-manual, semi-automatic, and fully automatic. In the ﬁrst stage, SAM assists annotators in annotating masks, similar to a classic interactive segmentation setup. In the second stage, SAM can automatically generate masks for a subset of objects by prompting it with likely object locations and annotators focus on annotating the remaining objects, helping increase mask diversity. In the ﬁnal stage, we prompt SAM with a regular grid of foreground points, yielding on average ∼100 high-quality masks per image.

数据引擎（章节4）。实现对新数据的强泛化，我们发现十分有必要将SAM在一个大规模多样性的掩码中选训练，超过任何当前存在图像分割数据集。对于基础模型，典型的方法就是通过在线获取数据，掩码天然地不丰富，因此我们需要一个替代策略。我们的方法是建立一个“数据引擎”，即，我们共同开发（同步开发？）我们的模型使用model-in-the-loop（前面有介绍模型循环更新过程）数据集标注（看图1c）。我们的数据引擎有三个阶段：人工辅助、半自动和全自动。在第一阶段中，SAM协助标注器标注掩码（标注器应该是第三方模块，SAM与标注器联合使用，过程是一开始有个低分割功能的SAM，标注器人工标注的时候，SAM会增强人工标注的遮罩，辅助人工标注），类似于经典的交互式分割装置（类似的辅助标注工具有很多，有些是利用传统的分割算法辅助标注的）。在第二个阶段，SAM通过输入可能对象的位置提示，可以自动地为对象的子集生成掩码（我的理解是，我点击了衬衫，SAM自动标注衬衫、人、以及衬衫上的子集），标注器聚焦在标注其他剩下的对象，有助于增加掩码的多样性。在最后的阶段，我们提示SAM一个规则的前景点集网格，平均每个图像产生100个高质量掩码。

Dataset (§5). Our ﬁnal dataset, SA-1B, includes more than 1B masks from 11M licensed and privacy-preserving images (see Fig. 2). SA-1B, collected fully automatically using the ﬁnal stage of our data engine, has 400× more masks than any existing segmentation dataset [66, 44, 117, 60], and as we verify extensively, the masks are of high quality and diversity. Beyond its use in training SAM to be robust and general, we hope SA-1B becomes a valuable resource for research aiming to build new foundation models.

数据集（章节5）。我们最终的数据集SA-1B，包含超过10亿掩码来自于1100万张授权的和私人图像（见图2）。SA-1B，使用我们引擎的最后阶段来全自动收集，比任何已有的图像分割数据集多400多倍的掩码，正如我们验证的那样，这些遮罩具有高质量和多样性。除了用于训练SAM使其鲁棒和通过之外，我们希望SA-1B成为一个有价值的资源用于解决创建新基础模型的研究。

Responsible AI (§6). We study and report on potential fairness concerns and biases when using SA-1B and SAM. Images in SA-1B span a geographically and economically diverse set of countries and we found that SAM performs similarly across different groups of people. Together, we hope this will make our work more equitable for real-world use cases. We provide model and dataset cards in the appendix.

人工智能责任（章节6）。我们研究并报告了在使用SA-1B和SAM时的潜在公平性顾虑和偏见，SA-1B中的图像跨越了不同国家的地理和经济上的多样性，以及我们发现SAM执行同样跨越了不同的人群。同时，我们希望这将使我们的工作在真实世界用例找那个更加的公平合理。我们在附录里提供了模型和数据集卡片。

Experiments (§7). We extensively evaluate SAM. First, using a diverse new suite of 23 segmentation datasets, we ﬁnd that SAM produces high-quality masks from a single foreground point, often only slightly below that of the manually annotated ground truth. Second, we ﬁnd consistently strong quantitative and qualitative results on a variety of downstream tasks under a zero-shot transfer protocol using prompt engineering, including edge detection, object proposal generation, instance segmentation, and a preliminary exploration of text-to-mask prediction. These results suggest that SAM can be used out-of-the-box with prompt engineering to solve a variety of tasks involving object and image distributions beyond SAM’s training data. Nevertheless, room for improvement remains, as we discuss in §8.

实验（章节7）。我们广泛地评估了SAM。第一，我们使用了一套新的多样性的23个图像分割数据集，我们发现SAM在单一前景点上即可产生高质量掩码，通常只稍微低于人工标注的真实结果。第二，在零样本迁移协议下，我们使用提示工程在各种下游任务上获得了一致的强大定量和定性结果，包括边缘检测、对象建议生成、实例分割和文本转掩码预测的初步探索。结果表明SAM可以作为提示工程的开箱即用模型，去解决各种任务加入SAM训练数据之外的对象和图像分布。然而，还有改进的余地，我们在第8章进行讨论。

Release. We are releasing the SA-1B dataset for research purposes and making SAM available under a permissive open license (Apache 2.0) at https://segment-anything.com. We also showcase SAM’s capabilities with an online demo.

发布。我们发布SA-1B数据集为研究目的和让SAM在许可的开发许可(Apache2.0)在https://segment-anything.com/。我们还提供了SAM的能力示例在onlie demo。

图2，答应你们的超大数据集^-^。SA-1B，平均每图100掩码。多的不说了

2. Segment Anything Task

（待续）

集群技术笔记-HAProxy 与 Keepalived 高可用负载均衡实战
目录前言HAProxy一、HAProxy介绍（一）定义（二）核心优势（三）调度算法速查表（四）工作模式（五）配置文件结构（六）健康检查字段二、搭建负载均衡集群（一）准备基本环境（二）配置流程配置真实服务器配置代理服务器（三）客户端验证三、配置健康检查页面（一）修改配置文件追加配置内容（二）重启服务（三）浏览器访问验证Keepalived一、Keepalived介绍（一）定义（二）功能（三）工作原理
LVS调度算法等风来也chen 随笔 lvs lvs调度算法
LVS的十种调度算法一）静态调度：①RR（RoundRobin）:轮询调度轮询调度算法的原理是每一次把来自用户的请求轮流分配给内部中的服务器，从1开始，直到N(内部服务器个数)，然后重新开始循环。算法的优点是其简洁性，它无需记录当前所有连接的状态，所以它是一种无状态调度。【提示：这里是不考虑每台服务器的处理能力】②WRR：weight,加权轮询（以权重之间的比例实现在各主机之间进行调度）由于每台服
【华为419机考真题】服务器能耗统计，JAVA 题解梦想橡皮擦华为服务器 java 华为OD机试华为OD
最近更新的博客华为od2023|什么是华为od，od薪资待遇，od机试题清单华为OD机试真题大全，用Python解华为机试题|机试宝典【华为OD机试】全流程解析+经验分享,题型分享,防作弊指南华为od机试，独家整理已参加机试人员的实战技巧本篇题解：服务器耗能题目描述服务器有三种运行状态：空载，单任务，多任务，每个时间片的能耗的分别为111、333、444，每个任务由起始时间片和结束时间片定义运行时
LVS调度算法+防火墙解决轮询调度问题+会话解决甜辣小悦羊 lvs 服务器运维
lvs的调度算法类型分配：依据负载状态静态方法：仅根据算法本身进行调度，不考虑RS的负载情况动态方法：主要根据每RS当前的负载状态及调度算法进行调度Overhead=value较小的RS将被调度静态调度方法：RR（roundrobin）：轮询RS分别被调度，当RS配置有差别时不推荐WRR（WeightedRR）：加权轮询根据RS的配置进行加权调度，性能差的RS被调度的次数少SH（SourceHas
LVS的10种调度算法蜡笔晓心其他
1.1静态算法:1.1.1rr(roundrobin):轮询调度算法:轮询调度算法的原理就是依次将用户的访问请求,平均的分配到每一台web服务节点上,从1开始,到最后一台服务器节点结束,然后在开始新一轮的循环,这种算法简单,但是没有考虑到每台节点服务器的具体性能1.1.2wrr(weight):权重调度算法由于每台服务器的性能会高低不同,wrr将会根据管理员设定的权重值来分配访问请求,权重值越大的
算法工程师必备：数据结构10大经典算法详解数据结构与算法学习数据结构与算法宝典算法数据结构 ai
算法工程师必备：数据结构10大经典算法详解关键词：数据结构、经典算法、时间复杂度、应用场景、代码实现摘要：本文是算法工程师的“算法工具箱”指南，系统讲解数据结构领域最核心的10大经典算法（快速排序、归并排序、二分查找、深度优先搜索DFS、广度优先搜索BFS、动态规划、贪心算法、KMP字符串匹配、哈希算法、并查集）。通过生活案例、代码示例、复杂度分析和实战场景，帮你彻底掌握这些算法的原理与应用，真正
lvs调度算法（10种） beyoundout lvs 算法
一、静态算法（不考虑后端真实服务器的负载情况，按算法该谁就分配给谁）1.rr（RoundRobin）轮询算法算法原理：将外部请求按顺序轮流分配到集群中的真实服务器上，它均等地对待每一台服务器，而不管服务器上实际的连接数和系统负载举例：就像在食堂打饭，有三个打饭窗口。学生们排成一队从餐厅门口进入食堂，依次到第一个窗口、第二个窗口、第三个窗口打饭，后面的学生再从第一个窗口循环，每个窗口平等地接待学生，
python2.x里面的input（）和raw_input（）函数以及3.x中的input（）函数的区别 scuter_yu python python input函数 raw_input函数 3.x中的input函数
在python3.0及以上的版本中，raw_input（）函数已经和我们说再见了，但是呢，input（）函数则很好地替代了消失了的raw_input（）函数。而且现在的input（）函数所返回的值都是字符串，所以对于要有int，float等类型的数值必须进行强制的类型转换。下面让我对3.0的input（）函数做个小总结：>>>str=input("abc:")abc:15>>>str'15'(虽然
代码相关（python）一个月只能修改一次次代码 python
python程序崩溃提示符用python的时候的各个tips矩阵python判断某个矩阵是否满足要求python生成二维随机数文件/档python检查某个文件存不存在python添加有特定字段的文件到列表python矩阵保存为txt文档python按行读文档python写文档python文档操作字符串python用split来拆分字符串python搜索字符串某个字符的位置给字符串前/后添加字符画图
Spring Boot+Redis+Caffeine 二级缓存架构的终极实现方案、包含万级QPS下的黄金配置参数、全文超过2500字（博君一赞）夜雨hiyeyu.com java spring boot redis 架构后端 java spring cloud spring
SpringBoot+Redis+Caffeine二级缓存架构的终极实现方案、包含万级QPS下的黄金配置参数、全文超过2500字（博君一赞）一、架构设计原理（10万QPS基石）设计优势：二、Caffeine本地缓存原子级配置1.高性能缓存构造器2.容量智能计算算法3.动态TTL策略三、Redis集群极致优化（支撑百万OPS）1.Lettuce连接池配置2.Redis服务端关键配置3.Pipelin
python 密码学模块_Python加密与解密 No module named 'Crypto' weixin_39827304 python 密码学模块
DES加密全称为DataEncryptionStandard，即数据加密标准，是一种使用密钥加密的块算法入口参数有三个：Key、Data、ModeKey为7个字节共56位，是DES算法的工作密钥；Data为8个字节64位，是要被加密或被解密的数据；Mode为DES的工作方式,有两种:加密或解密3DES(即TripleDES)是DES向AES过渡的加密算法使用两个密钥，执行三次DES算法加密的过程是
No module named "Crypto"，如何安装Python三方模块Crypto weixin_30342827 python 操作系统
前两天公司公司老总让我研究怎么用企业微信第三方应用进行官网对接，完成URL回调验证问题。具体如何进行Python的Django网站与企业微信第三方应用进行回调验证的博客地址为：https://www.cnblogs.com/ws17345067708/p/10522472.html这里讲讲，如何在win10下，安装一个非常坑爹的加密算法库，名字叫"Crypto"看了好多博客，没有一个管用的，要么就
Python 报错：ModuleNotFoundError: No module named ‘Crypto‘
Crypto报错解决方案Python报错：ModuleNotFoundError:Nomodulenamed'Crypto'前言问题解决方案Python报错：ModuleNotFoundError:Nomodulenamed‘Crypto’前言Crypto是一个加密模块，它包含了多种加密算法，如AES、DES、RSA等。它不是Python标准库的一部分，需要使用pip安装。pycrypto和Cry
【甲烷数据集】Sentinel-5P 卫星获取的全球甲烷数据集-TROPOMI L2 CH₄ WW、forever 数据集 sentinel
目录数据概述传感器&卫星信息监测目标：甲烷（CH₄）数据产品内容空间与时间覆盖云筛选与协同观测技术文档资源数据下载Python代码绘制CH4数据参考数据概述Sentinel-5PrecursorLevel2Methane(TROPOMIL2CH₄)数据集是由欧洲哥白尼计划的Sentinel-5P卫星获取的，用于监测大气中的甲烷浓度。数据集名称：Sentinel-5PrecursorLevel2Me
非对称加密算法（RSA、ECC、SM2）——密码学基础
对称加密算法（AES、ChaCha20和SM4）Python实现——密码学基础(Python出现Nomodulenamed“Crypto”解决方案)这篇的续篇，因此实践部分少些；文章目录一、非对称加密算法基础二、RSA算法2.1RSA原理与数学基础2.2RSA密钥长度与安全性2.3RSA实现工具与库2.4RSA的局限性三、椭圆曲线密码学(ECC)3.1ECC原理与数学基础3.2常用椭圆曲线标准3.
JAVA 和Python对比 xiayu98020214 在深蓝的日子 python
JAVA和Python对比1.数据类型pythonInt，float，complexnumbers都没有定义到底占用多少个字节空间。都是没有取值范围，也没有无符号的情况。JAVAJAVA有基础数据类型，都有确定占多少个字节2.全局变量python类似c语言，可以定义全局变量，全局的函数。JAVAjava都要定义类才行。3.变量声明python无需声明类型，直接使用。会造成一个困扰，这个变量到底是新
牛客华为机试题解（python版更新中）
目录一、字符串（知识点）HJ1字符串最后一个单词的长度（简单）HJ2计算某字符出现次数（简单）HJ4字符串分隔（简单）HJ5进制转换（简单）HJ10字符个数统计（简单）HJ11数字颠倒（简单）HJ12字符串反转（简单）HJ14字符串排序（简单）HJ17坐标移动（中等）HJ18识别有效的IP地址和掩码并进行分类统计（较难）自己研究的题解，也有借鉴评论区牛人思路，答案不唯一，仅供学习参考，也欢迎大家指
python比java_对比java和python对比
对比java和python对比java和python2011年04月18日1.难易度而言。python远远简单于java。2.开发速度。Python远优于java3.运行速度。java远优于标准python，pypy和cython可以追赶java，但是两者都没有成熟到可以做项目的程度。4.可用资源。java一抓一大把，python很少很少，尤其是中文资源。5.稳定程度。python3和2不兼容，造
QuecPython-正则表达式移远通信正则表达式 python
该模块通过正则表达式匹配数据。目前支持的操作符较少，部分操作符暂不支持。示例：importureres='''$GNRMC,133648.00,A,3149.2969,N,11706.9027,E,0.055,,311020,,,A,V*18$GNGGA,133648.00,3149.2969,N,11706.9027,E,1,24,1.03,88.9,M,,M,,*6C$GNGLL,3149.2
华为牛客网python考试题库及答案 2401_86114846 服务器
亲爱的朋友们，今天我们要讨论，牛客网华为软件测试题库牛客网华为机试题答案，让我们开始吧！目录一、字符串（知识点）HJ1字符串最后一个单词的长度（简单）HJ2计算某字符出现次数（简单）HJ4字符串分隔（简单）HJ5进制转换（简单）HJ10字符个数统计（简单）HJ11数字颠倒（简单）HJ12字符串反转（简单）HJ14字符串排序（简单）HJ17坐标移动（中等）HJ18识别有效的IP地址和掩码并进行分类统
【Python】LEGB作用域 + re模块 + 正则表达式
文章目录一LEGB作用域二re（RegularExpression）预览1.`re.match()`——从字符串开头匹配2.`re.search()`——搜索整个字符串3.`re.findall()`——返回所有匹配的字符串列表4.`re.finditer()`——返回所有匹配的迭代器5.`re.sub()`——替换匹配的字符串6.`re.split()`——按正则表达式分割字符串7.`re.co
java和ptyhon对比悟能不能悟 java 开发语言
1.语言特性对比维度JavaPython语法风格静态类型，需显式声明变量类型；代码冗长（需分号、大括号）动态类型，变量类型自动推断；简洁（缩进代替大括号，无分号）编程范式严格面向对象（OOP），强制类与对象结构多范式支持（OOP、函数式、命令式），更灵活执行方式编译型（JVM运行字节码）解释型（逐行执行）⚡2.性能与效率执行速度：Java：编译优化后运行效率高，尤其擅长高并发（如电商秒杀系统）。P
数字图像处理与Python语言实现-Box模糊CUDA实现视觉与物联智能数字图像处理与Python实现 python 深度学习计算机视觉图像处理 CUDA
Box模糊CUDA实现文章目录Box模糊CUDA实现1、Box模糊的基本原理2、算法优化：滑动窗口技术3、参数对模糊效果的影响4、Box模糊的优缺点5、与高斯模糊的对比6、实际应用场景7、算法实现7.1PyCUDA实现7.2CuPy实现7.3C++与CUDA实现8、总结在图像处理领域，**Box模糊（方框模糊或均值模糊）**是一种基础且高效的模糊算法，其核心思想是通过对像素邻域内的颜色值取平均值来
关于Python3绕过指纹识别解决ja3指纹的案例水兵没月 python
注意！！！！某XX网站实例仅作为学习案例，禁止其他个人以及团体做谋利用途！！！场景Python采集某网址页面内容aHR0cHM6Ly9jcmVkaXRiai5qeGouYmVpamluZy5nb3YuY24vY3JlZGl0LXBvcnRhbC9jcmVkaXRfc2VydmljZS9wdWJsaWNpdHkvcmVjb3JkL2JsYWNr报错信息requests.exceptions.SSLE
网页返回title“Just a moment...“，python 绕过tls指纹的几种方式记录一下
第一种：使用tls_client第三方库进行绕过importtls_clientsession=tls_client.Session(ja3_string="771,4865-4866-4867-49195-49199-49196-49200-52393-52392-49171-49172-156-157-47-53,0-23-65281-10-11-35-16-5-13-18-51-45-43-
python如何抓取网页里面的文字_如何利用python抓取网页文字、图片内容？ weixin_39917437
想必新老python学习者，对爬虫这一概念并不陌生，在如今大数据时代，很多场景都需要利用爬虫去爬取数据，而这刚好时python领域，如何实现？怎么做？一起来看下吧~获取图片：1、当我们浏览这个网站时，会发现，每一个页面的URL都是以网站的域名+page+页数组成，这样我们就可以逐一的访问该网站的网页了。2、当我们看图片列表时中，把鼠标放到图片，右击检查，我们发现，图片的内容由ul包裹的li组成，箭
如何用 Python 绕过 cloudflare（5秒盾）抓取数据：也不是很难嘛！炒青椒不放辣 Web爬虫进阶实战 python cloudflare 爬虫 5秒盾逆向
大家好！我是爱摸鱼的小鸿，关注我，收看每期的编程干货。逆向是爬虫工程师进阶必备技能，当我们遇到一个问题时可能会有多种解决途径，而如何做出最高效的抉择又需要经验的积累。本期文章将以实战的方式，带你全面了解cloudflare（5秒盾）以及如何绕过使用cloudflare服务的网站从而抓取数据特别声明：本篇文章仅供学习与研究使用，不用做任何非法用途，相关URL和API等均已做脱敏处理，若有侵权请联系作
python请求有关ja3指纹问题王太歌 python 爬虫开发语言
遇见一个网站采集，无论怎样都返回空数据(实际上是有数据的)，但是抓包下来又确实是那样的，请教了一些人推测是指纹验证，拜读了网上其他大佬的博客文章后实验了一下，发现确实是这个问题！第一次知道tcp还有这个东西，让我大受震撼，值此搬运一下。参考链接及来源：Python爬虫进阶必备|JA3指纹在爬虫中的应用与定向突破python爬虫requests、httpx、aiohttp、scrapy突破ja3指纹
【干货】pythonJA3指纹绕过 kisloy 爬虫逆向 python 爬虫
requests/scrapyJA3指纹绕过requests绕过importrequestsimportrandomfromrequests.adaptersimportHTTPAdapterfromrequests.packages.urllib3.util.ssl_importcreate_urllib3_contextORIGIN_CIPHERS=("ECDH+AESGCM:DH+AESGC
豆瓣电影信息爬虫【2024年6月】教程，赋完整代码桃宝护卫队爬虫 python
豆瓣电影信息爬虫【2024年6月】教程，赋完整代码在本教程中，我们将使用以下技术栈来构建一个爬虫，用于爬取豆瓣电影列表页面的信息：完整代码放到最后；完整代码放到最后；完整代码放到最后；重要的事情说三遍。1.技术栈介绍在本教程中，我们将使用以下技术栈来构建一个爬虫，用于爬取豆瓣电影列表页面的信息：Python:一种广泛使用的高级编程语言，因其简洁的语法和强大的库支持而受到开发者的喜爱。Request
插入表主键冲突做更新 a-john
有以下场景：用户下了一个订单，订单内的内容较多，且来自多表，首次下单的时候，内容可能会不全（部分内容不是必须，出现有些表根本就没有没有该订单的值）。在以后更改订单时，有些内容会更改，有些内容会新增。问题：如果在sql语句中执行update操作，在没有数据的表中会出错。如果在逻辑代码中先做查询，查询结果有做更新，没有做插入，这样会将代码复杂化。解决： mysql中提供了一个sql语
Android xml资源文件中@、@android:type、@*、？、@+含义和区别 Cb123456 @+@?@*
一.@代表引用资源 1.引用自定义资源。格式：@[package:]type/name android：text="@string/hello" 2.引用系统资源。格式：@android:type/name android:textColor="@android:color/opaque_red"
数据结构的基本介绍天子之骄数据结构散列表树、图线性结构价格标签
数据结构的基本介绍数据结构就是数据的组织形式，用一种提前设计好的框架去存取数据，以便更方便，高效的对数据进行增删查改。正确选择合适的数据结构，对软件程序的高效执行的影响作用不亚于算法的设计。此外，在计算机系统中数据结构的作用也是非同小可。例如常常在编程语言中听到的栈，堆等，就是经典的数据结构。经典的数据结构大致如下：一：线性数据结构 (1)：列表 a
通过二维码开放平台的API快速生成二维码一炮送你回车库 api
现在很多网站都有通过扫二维码用手机连接的功能，联图网(http://www.liantu.com/pingtai/)的二维码开放平台开放了一个生成二维码图片的Api,挺方便使用的。闲着无聊，写了个前台快速生成二维码的方法。 html代码如下:(二维码将生成在这div下) ? 1 &nbs
ImageIO读取一张图片改变大小 3213213333332132 java IO image BufferedImage
package com.demo; import java.awt.image.BufferedImage; import java.io.File; import java.io.IOException; import javax.imageio.ImageIO; /** * @Description 读取一张图片改变大小 * @author FuJianyon
myeclipse集成svn（一针见血） 7454103 eclipse SVN MyEclipse
&n
装箱与拆箱----autoboxing和unboxing darkranger J2SE
4.2　自动装箱和拆箱基本数据(Primitive)类型的自动装箱(autoboxing)、拆箱(unboxing)是自J2SE 5.0开始提供的功能。虽然为您打包基本数据类型提供了方便，但提供方便的同时表示隐藏了细节，建议在能够区分基本数据类型与对象的差别时再使用。 4.2.1　autoboxing和unboxing 在Java中，所有要处理的东西几乎都是对象(Object)
ajax传统的方式制作ajax aijuans Ajax
//这是前台的代码 <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <% String path = request.getContextPath(); String basePath = request.getScheme()+
只用jre的eclipse是怎么编译java源文件的？ avords java eclipse jdk tomcat
eclipse只需要jre就可以运行开发java程序了，也能自动编译java源代码，但是jre不是java的运行环境么，难道jre中也带有编译工具？还是eclipse自己实现的？谁能给解释一下呢问题补充：假设系统中没有安装jdk or jre，只在eclipse的目录中有一个jre，那么eclipse会采用该jre，问题是eclipse照样可以编译java源文件，为什么呢？ &nb
前端模块化 bee1314 模块化
背景：前端JavaScript模块化，其实已经不是什么新鲜事了。但是很多的项目还没有真正的使用起来，还处于刀耕火种的野蛮生长阶段。 JavaScript一直缺乏有效的包管理机制，造成了大量的全局变量，大量的方法冲突。我们多么渴望有天能像Java（import），Python (import)，Ruby(require)那样写代码。在没有包管理机制的年代，我们是怎么避免所
处理百万级以上的数据处理 bijian1013 oracle sql 数据库大数据查询
一.处理百万级以上的数据提高查询速度的方法： 1.应尽量避免在 where 子句中使用!=或<>操作符，否则将引擎放弃使用索引而进行全表扫描。 2.对查询进行优化，应尽量避免全表扫描，首先应考虑在 where 及 o
mac 卸载 java 1.7 或更高版本征客丶 java OS
卸载 java 1.7 或更高 sudo rm -rf /Library/Internet\ Plug-Ins/JavaAppletPlugin.plugin 成功执行此命令后，还可以执行 java 与 javac 命令 sudo rm -rf /Library/PreferencePanes/JavaControlPanel.prefPane 成功执行此命令后，还可以执行 java
【Spark六十一】Spark Streaming结合Flume、Kafka进行日志分析 bit1129 Stream
第一步，Flume和Kakfa对接，Flume抓取日志，写到Kafka中第二部，Spark Streaming读取Kafka中的数据，进行实时分析本文首先使用Kakfa自带的消息处理（脚本）来获取消息，走通Flume和Kafka的对接 1. Flume配置 1. 下载Flume和Kafka集成的插件，下载地址：https://github.com/beyondj2ee/f
Erlang vs TNSDL bookjovi erlang
TNSDL是Nokia内部用于开发电信交换软件的私有语言，是在SDL语言的基础上加以修改而成，TNSDL需翻译成C语言得以编译执行，TNSDL语言中实现了异步并行的特点，当然要完整实现异步并行还需要运行时动态库的支持，异步并行类似于Erlang的process（轻量级进程），TNSDL中则称之为hand，Erlang是基于vm(beam)开发，
非常希望有一个预防疲劳的java软件, 预防过劳死和眼睛疲劳,大家一起努力搞一个 ljy325 企业应用
　非常希望有一个预防疲劳的java软件，我看新闻和网站，国防科技大学的科学家累死了，太疲劳，老是加班，不休息，经常吃药，吃药根本就没用，根本原因是疲劳过度。我以前做java,那会公司垃圾，老想赶快学习到东西跳槽离开，搞得超负荷，不明理。深圳做软件开发经常累死人，总有不明理的人，有个软件提醒限制很好，可以挽救很多人的生命。相关新闻：（1）IT行业成五大疾病重灾区：过劳死平均37.9岁
读《研磨设计模式》-代码笔记-原型模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * Effective Java 建议使用copy constructor or copy factory来代替clone()方法： * 1.public Product copy(Product p){} * 2.publi
配置管理---svn工具之权限配置 chenyu19891124 SVN
今天花了大半天的功夫，终于弄懂svn权限配置。下面是今天收获的战绩。安装完svn后就是在svn中建立版本库，比如我本地的是版本库路径是C:\Repositories\pepos。pepos是我的版本库。在pepos的目录结构 pepos component webapps 在conf里面的auth里赋予的权限配置为 [groups]
浅谈程序员的数学修养 comsci 设计模式编程算法面试招聘
浅谈程序员的数学修养
批量执行 bulk collect与forall用法 daizj oracle sql bulk collect forall
BULK COLLECT 子句会批量检索结果，即一次性将结果集绑定到一个集合变量中，并从SQL引擎发送到PL/SQL引擎。通常可以在SELECT INTO、 FETCH INTO以及RETURNING INTO子句中使用BULK COLLECT。本文将逐一描述BULK COLLECT在这几种情形下的用法。有关FORALL语句的用法请参考：批量SQL之 F
Linux下使用rsync最快速删除海量文件的方法 dongwei_6688 OS
1、先安装rsync：yum install rsync 2、建立一个空的文件夹：mkdir /tmp/test 3、用rsync删除目标目录：rsync --delete-before -a -H -v --progress --stats /tmp/test/ log/这样我们要删除的log目录就会被清空了，删除的速度会非常快。rsync实际上用的是替换原理，处理数十万个文件也是秒删。
Yii CModel中rules验证规格 dcj3sjt126com rules yii validate
Yii cValidator主要用法分析： yii验证rulesit 分类： Yii yii的rules验证 cValidator主要属性 attributes ,builtInValidators,enableClientValidation,message,on,safe,skipOnError
基于vagrant的redis主从实验 dcj3sjt126com vagrant
平台: Mac 工具: Vagrant 系统: Centos6.5 实验目的: Redis主从实现思路制作一个基于sentos6.5, 已经安装好reids的box, 添加一个脚本配置从机, 然后作为后面主机从机的基础box 制作sentos6.5+redis的box mkdir vagrant_redis cd vagrant_
Memcached(二)、Centos安装Memcached服务器 frank1234 centos memcached
一、安装gcc rpm和yum安装memcached服务器连接没有找到，所以我使用的是make的方式安装，由于make依赖于gcc，所以要先安装gcc 开始安装，命令如下，[color=red][b]顺序一定不能出错[/b][/color]：建议可以先切换到root用户，不然可能会遇到权限问题：su root 输入密码...... rpm -ivh kernel-head
Remove Duplicates from Sorted List hcx2013 remove
Given a sorted linked list, delete all duplicates such that each element appear only once. For example,Given 1->1->2, return 1->2.Given 1->1->2->3->3, return&
Spring4新特性——JSR310日期时间API的支持 jinnianshilongnian spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
浅谈enum与单例设计模式 247687009 java 单例
在JDK1.5之前的单例实现方式有两种(懒汉式和饿汉式并无设计上的区别故看做一种)，两者同是私有构造器，导出静态成员变量，以便调用者访问。第一种 package singleton; public class Singleton { //导出全局成员 public final static Singleton INSTANCE = new S
使用switch条件语句需要注意的几点 openwrt c break switch
1. 当满足条件的case中没有break，程序将依次执行其后的每种条件（包括default）直到遇到break跳出 int main() { int n = 1; switch(n) { case 1: printf("--1--\n"); default: printf("defa
配置Spring Mybatis JUnit测试环境的应用上下文 schnell18 spring mybatis JUnit
Spring-test模块中的应用上下文和web及spring boot的有很大差异。主要试下来差异有：单元测试的app context不支持从外部properties文件注入属性 @Value注解不能解析带通配符的路径字符串解决第一个问题可以配置一个PropertyPlaceholderConfigurer的bean。第二个问题的具体实例是：
Java 定时任务总结一 tuoni java spring timer quartz timertask
Java定时任务总结一.从技术上分类大概分为以下三种方式： 1.Java自带的java.util.Timer类，这个类允许你调度一个java.util.TimerTask任务; 说明： java.util.Timer定时器，实际上是个线程，定时执行TimerTask类 &
一种防止用户生成内容站点出现商业广告以及非法有害等垃圾信息的方法 yangshangchuan rank 相似度计算文本相似度词袋模型余弦相似度
本文描述了一种在ITEYE博客频道上面出现的新型的商业广告形式及其应对方法，对于其他的用户生成内容站点类型也具有同样的适用性。最近在ITEYE博客频道上面出现了一种新型的商业广告形式，方法如下： 1、注册多个账号（一般10个以上）。 2、从多个账号中选择一个账号，发表1-2篇博文

【论文阅读】Segment anything 学习、理解与复现

摘要

1. 引言

2. Segment Anything Task

你可能感兴趣的:(图像分割,论文阅读,算法,python)