风巽·剑染春水

【技术追踪】SAM（Segment Anything Model）代码解析与结构绘制之Prompt Encoder

论文：Segment Anything
代码：https://github.com/facebookresearch/segment-anything

上一篇：【技术追踪】SAM（Segment Anything Model）代码解析与结构绘制之Image Encoder

本篇示例依然采用上一篇的狗狗图像运行代码，预测部分代码如下：

input_point = np.array([[1300, 800]])   # 输入point的坐标
input_label = np.array([1])   # label=1表示前景, label=0表示背景
# 输入box的坐标,(700,400)为左上角坐标, (1900,1100)为右下角坐标
input_box = np.array([[700, 400, 1900, 1100]])   
# 调用预测函数
masks, scores, logits = predictor.predict(
    point_coords=input_point,
    point_labels=input_label,
    box=input_box,
    multimask_output=True,
)

1. Mask预测过程

（1）predict函数

位置：【segment_anything/predictor.py --> SamPredictor类 -->predict函数】
作用： 使用给定的prompt，调用predict_torch，预测mask与iou

def predict(
    self,
    point_coords: Optional[np.ndarray] = None,
    point_labels: Optional[np.ndarray] = None,
    box: Optional[np.ndarray] = None,
    mask_input: Optional[np.ndarray] = None,
    multimask_output: bool = True,
    return_logits: bool = False,
) -> Tuple[np.ndarray, np.ndarray, np.ndarray]:
    
    if not self.is_image_set:
        raise RuntimeError("An image must be set with .set_image(...) before mask prediction.")

    # Transform input prompts
    coords_torch, labels_torch, box_torch, mask_input_torch = None, None, None, None
    
    # 若prompt为point
    if point_coords is not None:
        assert (
            point_labels is not None
        ), "point_labels must be supplied if point_coords is supplied."
        # 原始point_coords:[x,y]给定的坐标点=(1300,800)
        # self.original_size原始图像大小=(1365,2048)
        # 由于图像缩放为1024, 给定坐标应随之变换, 变换后point_coords:[X,Y]=(650, 400.29)
        point_coords = self.transform.apply_coords(point_coords, self.original_size)  
        # 将变换后的坐标[650, 400.29]以及前景与背景的标签转化为tensor
        coords_torch = torch.as_tensor(point_coords, dtype=torch.float, device=self.device)
        labels_torch = torch.as_tensor(point_labels, dtype=torch.int, device=self.device)
        # 加一个维度使得coords_torch.size():[1,1,2], labels_torch.size():[1,1]
        coords_torch, labels_torch = coords_torch[None, :, :], labels_torch[None, :]
        
    # 若prompt为box
    if box is not None:
    	# 同样对box坐标进行变换, (700, 400, 1900, 1100)->(350, 200.1465, 950, 500.4029)
        box = self.transform.apply_boxes(box, self.original_size) 
        # 转换为tensor, box_torch.size():[1,4]
        box_torch = torch.as_tensor(box, dtype=torch.float, device=self.device)  
        box_torch = box_torch[None, :]  # 加一个维度使得box_torch.size():[1,1,4]
    
    # 若prompt为mask
    if mask_input is not None:
        mask_input_torch = torch.as_tensor(mask_input, dtype=torch.float, device=self.device)
        mask_input_torch = mask_input_torch[None, :, :, :]
	
	# masks.size():[1,3,1365,2048], iou_predictions.size():[1,3], low_res_masks.size():[1,3,256,256]
    masks, iou_predictions, low_res_masks = self.predict_torch(
        coords_torch,
        labels_torch,
        box_torch,
        mask_input_torch,
        multimask_output,
        return_logits=return_logits,
    )

    masks_np = masks[0].detach().cpu().numpy()
    iou_predictions_np = iou_predictions[0].detach().cpu().numpy()
    low_res_masks_np = low_res_masks[0].detach().cpu().numpy()
    return masks_np, iou_predictions_np, low_res_masks_np

apply_coords函数： 对输入point进行坐标变换，将图像 ${[H, W]}$ 给定坐标位置 ${[x, y]}$ ，映射到变换图像 ${[H*1024/W, 1024]}$ 上的位置 ${[X, Y]}$

  def apply_coords(self, coords: np.ndarray, original_size: Tuple[int, ...]) -> np.ndarray:
        old_h, old_w = original_size   # [H, W]
        new_h, new_w = self.get_preprocess_shape(
            original_size[0], original_size[1], self.target_length
        )   # [H*1024/W, 1024]
        coords = deepcopy(coords).astype(float)   # 输入坐标[x, y]
        # 将给定坐标位置[x, y]映射到变换图像[H*1024/W, 1024]上的位置[X, Y]
        coords[..., 0] = coords[..., 0] * (new_w / old_w)
        coords[..., 1] = coords[..., 1] * (new_h / old_h)
        return coords

apply_boxes函数： 调用 apply_coords函数进行box的坐标变换

def apply_boxes(self, boxes: np.ndarray, original_size: Tuple[int, ...]) -> np.ndarray:
    boxes = self.apply_coords(boxes.reshape(-1, 2, 2), original_size)
    return boxes.reshape(-1, 4)

（2）predict_torch函数

位置：【segment_anything/predictor.py --> SamPredictor类 -->predict_torch函数】
作用： 调用prompt_encoder实现prompt嵌入编码，调用mask_decoder实现mask预测

def predict_torch(
    self,
    point_coords: Optional[torch.Tensor],
    point_labels: Optional[torch.Tensor],
    boxes: Optional[torch.Tensor] = None,
    mask_input: Optional[torch.Tensor] = None,
    multimask_output: bool = True,
    return_logits: bool = False,
) -> Tuple[torch.Tensor, torch.Tensor, torch.Tensor]:

    if not self.is_image_set:
        raise RuntimeError("An image must be set with .set_image(...) before mask prediction.")

    if point_coords is not None:
        points = (point_coords, point_labels)
    else:
        points = None

    # Embed prompts
    sparse_embeddings, dense_embeddings = self.model.prompt_encoder(
        points=points,
        boxes=boxes,
        masks=mask_input,
    )  # sparse_embeddings.size():[1,2,256], dense_embeddings.size():[1,256,64,64]

    # Predict masks
    low_res_masks, iou_predictions = self.model.mask_decoder(
        image_embeddings=self.features,
        image_pe=self.model.prompt_encoder.get_dense_pe(),
        sparse_prompt_embeddings=sparse_embeddings,
        dense_prompt_embeddings=dense_embeddings,
        multimask_output=multimask_output,
    )

    # Upscale the masks to the original image resolution
    masks = self.model.postprocess_masks(low_res_masks, self.input_size, self.original_size)

    if not return_logits:
        masks = masks > self.model.mask_threshold

    return masks, iou_predictions, low_res_masks

2. Prompt Encoder代码解析

（1）PromptEncoder类

位置：【segment_anything/modeling/prompt_encoder.py -->PromptEncoder类】
作用： 实现prompt输入嵌入编码

先看PromptEncoder的 $_ _ {\_\_init\_\_}$ 初始化函数和 ${forward}$ 函数：

class PromptEncoder(nn.Module):
    def __init__(
        self,
        embed_dim: int,
        image_embedding_size: Tuple[int, int],
        input_image_size: Tuple[int, int],
        mask_in_chans: int,
        activation: Type[nn.Module] = nn.GELU,
    ) -> None:
        
        super().__init__()
        self.embed_dim = embed_dim  # 嵌入维度256
        self.input_image_size = input_image_size  # 输入图像大小[1024, 1024]
        
        # 图像嵌入大小[64， 64] image_encoder编码器输出为[1,256,64,64]
        self.image_embedding_size = image_embedding_size  
        self.pe_layer = PositionEmbeddingRandom(embed_dim // 2)  # embed_dim // 2 = 128

        self.num_point_embeddings: int = 4  # pos/neg point + 2 box corners 有4个点
        # 4个点的嵌入向量 point_embeddings为4个Embedding(1, 256)
        point_embeddings = [nn.Embedding(1, embed_dim) for i in range(self.num_point_embeddings)]
        self.point_embeddings = nn.ModuleList(point_embeddings)  # 4个点的嵌入向量添加到网络
        self.not_a_point_embed = nn.Embedding(1, embed_dim)  # 不是点的嵌入向量

        self.mask_input_size = (4 * image_embedding_size[0], 4 * image_embedding_size[1])  # mask输入尺寸(256, 256)
        self.mask_downscaling = nn.Sequential(
            nn.Conv2d(1, mask_in_chans // 4, kernel_size=2, stride=2),  # 四倍下采样
            LayerNorm2d(mask_in_chans // 4),
            activation(),
            nn.Conv2d(mask_in_chans // 4, mask_in_chans, kernel_size=2, stride=2),
            LayerNorm2d(mask_in_chans),
            activation(),
            nn.Conv2d(mask_in_chans, embed_dim, kernel_size=1),  # 最后通道也是256
        )
        self.no_mask_embed = nn.Embedding(1, embed_dim)  # 没有mask时的嵌入向量
        
    def forward(
        self,
        points: Optional[Tuple[torch.Tensor, torch.Tensor]],
        boxes: Optional[torch.Tensor],
        masks: Optional[torch.Tensor],
    ) -> Tuple[torch.Tensor, torch.Tensor]:
        
        bs = self._get_batch_size(points, boxes, masks)  # batch size = 1
        sparse_embeddings = torch.empty((bs, 0, self.embed_dim), device=self._get_device())  # 空tensor
        
        # ------------sparse_embeddings-----------
        if points is not None:
            coords, labels = points  # coords=(650, 400.29), labels=1表示前景
            # 坐标点[X, Y]嵌入, point_embeddings.size():[1, 2, 256]
            point_embeddings = self._embed_points(coords, labels, pad=(boxes is None))  # 没有输入框的时候pad=True
            # sparse_embeddings.size():[1, 2, 256]
            sparse_embeddings = torch.cat([sparse_embeddings, point_embeddings], dim=1)
        if boxes is not None:
            box_embeddings = self._embed_boxes(boxes)
            sparse_embeddings = torch.cat([sparse_embeddings, box_embeddings], dim=1)
        # ------------sparse_embeddings-----------

        # ------------dense_embeddings------------
        if masks is not None:
            dense_embeddings = self._embed_masks(masks)  # 有mask采用mask嵌入向量
        else:
        	# 没有mask输入时采用 nn.Embedding 预定义嵌入向量
            # [1,256]->[1,256,1,1]->[1, 256, 64, 64]
            dense_embeddings = self.no_mask_embed.weight.reshape(1, -1, 1, 1).expand(
                bs, -1, self.image_embedding_size[0], self.image_embedding_size[1]
            )  # dense_embeddings.size():[1, 256, 64, 64]
        # ------------dense_embeddings------------

        return sparse_embeddings, dense_embeddings

传送门：torch.nn.Embedding函数用法图解

${forward}$ 的过程中主要完成了sparse_embeddings（由point和box嵌入向量组成）和dense_embeddings（由mask嵌入向量组成）两种向量嵌入。

① _embed_points函数：输入的坐标点 ${[x, y]}$ = ${(1300, 800)}$ 经过映射变换后为 ${[X, Y]}$ = ${(650, 400.29)}$ ， ${(650, 400.29)}$ 由 ${self.\_embed\_points}$ 函数完成嵌入：

def _embed_points(
    self,
    points: torch.Tensor,  # [[[650, 400.29]]]
    labels: torch.Tensor,  # [[1]]
    pad: bool,  # false
) -> torch.Tensor:
    
    points = points + 0.5  # Shift to center of pixel 移到像素中心=(650.5, 400.79)
    
    # 当没有box输入时, pad=ture
    if pad:
        padding_point = torch.zeros((points.shape[0], 1, 2), device=points.device)  # size():[1,1,2]
        padding_label = -torch.ones((labels.shape[0], 1), device=labels.device)  # 是负数,size():[1,1]
        points = torch.cat([points, padding_point], dim=1)  # [1, 2, 2]
        labels = torch.cat([labels, padding_label], dim=1)  # [1, 2]
	
	# self.pe_layer = PositionEmbeddingRandom(embed_dim // 2) = PositionEmbeddingRandom(128)
    point_embedding = self.pe_layer.forward_with_coords(points, self.input_image_size)  # 点嵌入[1,2,256]
    # -------------------------------------------------------------------------------------
    # self.point_embeddings中预设四个点的可学习嵌入向量,分别为前景点,背景点,box的左上角和右下角坐标点
    # -------------------------------------------------------------------------------------
    # 当labels=-1, 输入点是非标记点, 设为非标记点, 加上非标记点权重
    point_embedding[labels == -1] = 0.0
    point_embedding[labels == -1] += self.not_a_point_embed.weight
    # 当labels=0, 输入点是背景点, 加上背景点权重
    point_embedding[labels == 0] += self.point_embeddings[0].weight
    # 当labels=1, 输入点是目标点, 加上目标点权重
    point_embedding[labels == 1] += self.point_embeddings[1].weight
    return point_embedding

② _embed_boxes函数：box的左上角与右下角点 ${(700, 400, 1900, 1100)}$ 经过映射变换后为 ${(350, 200.1465, 950, 500.4029)}$ ，由 ${self.\_embed\_boxes}$ 函数完成嵌入：

def _embed_boxes(self, boxes: torch.Tensor) -> torch.Tensor:
    
    # (350, 200.1465, 950, 500.4029)->(350.5000, 200.6465, 950.5000, 550.9030)
    boxes = boxes + 0.5  # Shift to center of pixel  size()=[1,1,4]
    coords = boxes.reshape(-1, 2, 2)  # [1,1,4]->[1,2,2]
    corner_embedding = self.pe_layer.forward_with_coords(coords, self.input_image_size)  # [1,2,256]
    # 目标框起始点的和末位点分别加上权重
    corner_embedding[:, 0, :] += self.point_embeddings[2].weight  # 左上角点
    corner_embedding[:, 1, :] += self.point_embeddings[3].weight  # 右下角点
    return corner_embedding

③_embed_masks函数：若有mask输入，由 ${self.\_embed\_masks}$ 函数完成嵌入：

def _embed_masks(self, masks: torch.Tensor) -> torch.Tensor:
   
    mask_embedding = self.mask_downscaling(masks)
    return mask_embedding

self.mask_downscaling结构：

(mask_downscaling): Sequential(
    (0): Conv2d(1, 4, kernel_size=(2, 2), stride=(2, 2))
    (1): LayerNorm2d()
    (2): GELU(approximate='none')
    (3): Conv2d(4, 16, kernel_size=(2, 2), stride=(2, 2))
    (4): LayerNorm2d()
    (5): GELU(approximate='none')
    (6): Conv2d(16, 256, kernel_size=(1, 1), stride=(1, 1))
  )

结束了么，家人们！是不是在疑惑，还有最后一步了(ง •_•)ง，在 _embed_points函数 和 _embed_boxes函数 中均调用了随机位置嵌入PositionEmbeddingRandom类，以进行point的位置编码。可以理解为，每一个point的向量嵌入都由point的位置编码和可学习nn.Embedding预设权重相加组成。

（2）PositionEmbeddingRandom类

位置：【segment_anything/modeling/prompt_encoder.py -->PositionEmbeddingRandom类】
作用： 调用forward_with_coords将point归一化到[0,1]，调用_pe_encoding完成位置编码

class PositionEmbeddingRandom(nn.Module):
    
    def __init__(self, num_pos_feats: int = 64, scale: Optional[float] = None) -> None:
        super().__init__()
        if scale is None or scale <= 0.0:
            scale = 1.0
        self.register_buffer(
            "positional_encoding_gaussian_matrix",
            scale * torch.randn((2, num_pos_feats)),  # 生成随机数, 满足标准正态分布
        )

    def _pe_encoding(self, coords: torch.Tensor) -> torch.Tensor:
        """Positionally encode points that are normalized to [0,1]."""
        # assuming coords are in [0, 1]^2 square and have d_1 x ... x d_n x 2 shape
        # coords: [X/1024, Y/1024]=(0.6353, 0.3914)
        # 映射至[-1,1],适应三角函数. coords=(0.2705, -0.2172) size():[1,1,2]
        coords = 2 * coords - 1   
        # self.positional_encoding_gaussian_matrix是随机生成的: [2, 128]
        coords = coords @ self.positional_encoding_gaussian_matrix  # 矩阵乘法[1, 1, 128] / [64, 64, 128]
        coords = 2 * np.pi * coords  # 2*Π*R [1, 1, 128]
        # outputs d_1 x ... x d_n x C shape
        return torch.cat([torch.sin(coords), torch.cos(coords)], dim=-1)  # [1, 1, 256] / [64, 64, 256]

    def forward(self, size: Tuple[int, int]) -> torch.Tensor:
        """Generate positional encoding for a grid of the specified size."""
        h, w = size  # 64, 64
        device: Any = self.positional_encoding_gaussian_matrix.device
        grid = torch.ones((h, w), device=device, dtype=torch.float32)  # [64, 64]的全1矩阵
        y_embed = grid.cumsum(dim=0) - 0.5  # [64, 64] 列逐累加
        x_embed = grid.cumsum(dim=1) - 0.5  # [64, 64] 行逐累加
        y_embed = y_embed / h
        x_embed = x_embed / w
        # torch.stack([x_embed, y_embed], dim=-1)->size(): [64, 64, 2]
        pe = self._pe_encoding(torch.stack([x_embed, y_embed], dim=-1))  # [64, 64, 256]
        return pe.permute(2, 0, 1)  # C x H x W [256, 64, 64]

    def forward_with_coords(
        self, coords_input: torch.Tensor, image_size: Tuple[int, int]
    ) -> torch.Tensor:
        """Positionally encode points that are not normalized to [0,1]."""
        coords = coords_input.clone()  # [X+0.5, Y+0.5]=(650.5, 400.79)
        coords[:, :, 0] = coords[:, :, 0] / image_size[1]
        coords[:, :, 1] = coords[:, :, 1] / image_size[0]
        # 除以1024,归一化到[0,1]->[X/1024, Y/1024]=(0.6353, 0.3914)
        return self._pe_encoding(coords.to(torch.float))  # B x N x C

奇怪的是，PositionEmbeddingRandom类自身的forward似乎并没有用上，也不知道干啥滴哩~

3. Prompt Encoder结构绘制

（1）结构打印

PromptEncoder(
  (pe_layer): PositionEmbeddingRandom()
  (point_embeddings): ModuleList(
    (0-3): 4 x Embedding(1, 256)
  )
  (not_a_point_embed): Embedding(1, 256)
  (mask_downscaling): Sequential(
    (0): Conv2d(1, 4, kernel_size=(2, 2), stride=(2, 2))
    (1): LayerNorm2d()
    (2): GELU(approximate='none')
    (3): Conv2d(4, 16, kernel_size=(2, 2), stride=(2, 2))
    (4): LayerNorm2d()
    (5): GELU(approximate='none')
    (6): Conv2d(16, 256, kernel_size=(1, 1), stride=(1, 1))
  )
  (no_mask_embed): Embedding(1, 256)
)

（2）结构绘制

直率豪爽有才情——简评史湘云形象特点拾贰字
在我看来，除了并列金陵十二钗之首的林黛玉和薛宝钗以外，《红楼梦》中最有人格魅力的当属史湘云了。她们三个都是最有才情的，在诗社轮番夺魁，可相较黛玉的清高自怜和宝钗的温润端庄，史湘云的直率豪爽也别有一番姿态。史湘云出身高贵，可年幼便父母双亡，只能在家境稍贫寒的养父母家，时不时还去贾府那儿寄居着长大，还要做针线活补贴家用。因此虽受贾母疼爱却没有一点大小姐脾气。因此她和丫鬟们拌嘴，记着平民客人的生日，善良
阴谋爆仓！社科院课堂朱民ST-balance节能风电被骗揭秘！受害者亲述不能出金真相！正义青天
随着互联网的普及，数字经济蓬勃发展，各种线上平台如雨后春笋般涌现。然而，在这些看似繁荣的平台中，不乏一些黑平台，它们以欺诈手段骗取用户的财产，给人们的财产安全带来严重威胁。因此，我们有必要提高警惕，防范黑平台诈骗。针对网上素未谋面的牛散大咖，经济学家等推荐网上投资理财、数字经济，数字体育市场，人工智能项目，数字低碳，慈善投票网站买数字的等等都是骗局若你也不幸被骗遇到此类平台一定不要打草惊蛇，早期不
Sigmoid 函数在模式匹配中的应用及偏置项的作用
：1.问题背景：笔画多少导致的“不公平”比如识别数字时：数字1的笔画少（简单），匹配结果net数值小；数字8的笔画多（复杂），匹配结果net数值大。直接比较net会不公平（因为8天生更容易得分高）。2.Sigmoid的核心作用：把结果“归一化”到0~1Sigmoid函数的公式是：\sigma(net)=\frac{1}{1+e^{-net}}它能把任意大小的net（比如-100到+100）压缩到0
Oracle12c版本中未归档隐藏参数 weixin_30248399 数据库 runtime java
Inthispost,IwillgivealistofallundocumentedparametersinOracle12.1.0.1c.Hereisaquerytoseealltheparameters(documentedandundocumented)whichcontainthestringyouenterwhenprompted:–Enternameoftheparameterwhen
09潮汕王爷庙的对联“堂殿前腾龙舞凤百业翔，金玉明眸处得见真文章” 余源鹏
“泽厚来了啊，快进来喝茶。”黄正德大屋外挂着灯笼，是中秋节刚换上去的，明亮光鲜，一有人在门口，屋里大厅的人就能看清。黄正德隔着大铁门，看到何半仙在门口张望，便招呼他进去，叫的还是何半仙的原名！论年龄，何半仙还比黄正德小几岁。何半仙喝了口茶后，脸上泛着笑意问道：“智扬没回家吗，听说他现在在陆国安的陆达集团工作？”“是啊，因为陆国安的开发项目刚好一部分地块在我们龙阳村上，所以请他过去。”说完，黄正德又
返利APP前十名精选，让你的每一分钱都花在刀刃上日常购物技巧呀
独家福利！返利APP内部优惠券大放送你是否曾经因为错过了某个内部优惠券而遗憾不已？现在机会来了！我们与多家知名返利APP合作为你独家放送了大量内部优惠券。这些优惠券不仅额度大、使用门槛低而且适用范围广泛几乎涵盖了所有热门商品和服务。现在就来领取你的专属优惠券享受购物省钱的乐趣吧！高省：返利最高的电商导购平台高省作为杭州长孚科技有限公司旗下的电商导购平台，以“高佣领导者”为口号，主打“佣金高，省的多
智能喷洒机器人目标识别系统：基于NanoDet的目标检测与UI界面实现 YOLO实战营机器人目标检测 ui NanoDet 计算机视觉目标跟踪深度学习
在现代农业生产中，自动化喷洒系统是实现精准农业的重要组成部分。智能喷洒机器人通过图像识别和自动控制技术，能够高效识别并精确喷洒农药、肥料等，提高农业生产效率，降低化学品使用量，减少环境污染。目标识别是智能喷洒机器人中至关重要的部分，它涉及到精准的作物和病虫害识别，确保喷洒操作的准确性。在本篇博客中，我们将构建一个基于NanoDet深度学习目标检测模型的智能喷洒机器人目标识别系统。我们将介绍如何使用
2023-11-10 蓝天白云_5efd
转发：分享个更神奇的，3岁孩子看到妈妈流产的孩子，孩子称自己是动画片里的熊大，打胎孩子是熊二，和熊二一起玩，还让妈妈喂熊二东西吃，妈妈是看不到的，曾经流产，如有打胎小孩子，一定要给自己流产的孩子念经超度走，不然会影响在世的小孩子和自己[玫瑰]
2022.06.01简单日记谢谋淦
2022.06.01晴爆热短裤拖鞋一动就汗如雨下早饭牛奶豆浆茶叶蛋菜包花费6.5块钱。去街上买了30块钱肉沫准备请房客做蛋饺吃。午饭买一份盒饭花费12块钱。来客户买网线收费5块钱。睡午觉，醒了在店铺玩手机。骑电动车出去爬山。去买了30块钱水果给客户吃，感谢她给我包蛋饺。卖旧风扇得80块钱。股市收盘三大指数涨跌不一，个股涨一片，我的股票海默科技跌0.43%,收盘价格4.62块钱，华仁药业涨0.28%
适合新手赚钱的互联网副业兼职,不看你就亏大了氧惠全网优惠
上班不好干，副业成主流。在互联网时代，挣钱的方式多种多样。人人都想在互联网上，分得一杯羹，下面8种挣钱的方法，根本不需要去上班，更不用看老板脸色。做得好胜过现在你一年的工资！01.代写文章我的工作性质和公文接触得比较多，在我周围有帮人代写的、也有有代写需求的。代写文章会根据深度、字数等价格不同，但是基本上都是500+另一个就是现在自媒体时代、网络是一个很大的风口，有些人来不及写作，就找人代写。想要
面包与牛奶的诱惑梅园主人123456
一杯牛奶，一包面包，对大多数的孩子来说都是再平常不过的东西了。但是今天，有人却抵挡不住它的诱惑，犯了一次大错。就这两样东西来说，不是什么值钱的大物件，但是从性质上来说，那就不是什么好事了。因为在没有当事人在场，并且是入室，那就是偷了。在这个时代了，为什么还有孩子为了一点吃的东西去铤而走险？思虑半响，无非是成长中口食之欲得不到满足罢了。因为需要，自己现实条件下又难以得到满足，家人没有能力满足自己，或
各种凤凰牌电动自行车及价格，京东凤凰电动车最新款优惠券如何领取？古楼
凤凰电动自行车品牌排行，京东11.11省钱必逛“万券齐发”凤凰电动自行车优惠券如何领取？電動車和電動車主要是腳踏式的，不能用腳蹬，也不能運動，上班的時候運動不是更好嗎？我覺得唐賺科好的方法是自行車，因為它可以壹箭雙雕。大家對這件事有什麼看法？請隨時給我留言！無論是國產品牌，還是國外品牌，都配備了喜瑪諾7的傳動系統，配備了智能的中央軸感應器，動力、舒這、健身三大功能。沒有足夠的時間，沒有足夠的時間！
横幅检测数据集-1500张图片智慧城市管理活动现场管理商业广告分析
横幅检测数据集-1500张图片已发布目标检测数据集合集（持续更新）️横幅检测数据集介绍数据集概览检测目标类型应用场景数据样本展示使用建议1.数据预处理优化2.模型训练策略3.实际部署考虑4.应用场景适配5.性能优化建议数据集特色商业价值技术实现路径模型选择建议特殊技术考虑集成方案建议应用效果评估性能指标建议业务价值指标YOLOv8训练实战1.环境配置安装YOLOv8官方库ultralytics2.
每日一省 91天粒子音
今天是周日，本来打算今天带着两个孩子出去好好玩一天，但是大女儿的作业没写完，写了一上午，还非要让我陪着她写，结果陪写的时候因为她写的太慢还老是跑神效率太低，我就生气了，埋怨她昨天不把作业完成今天耽误这么多时间，我一生气她也更不想写了，结果我就没控制好自己被她气哭了，我边哭边说出了我内心的真实想法，我希望宝贵的周日是带着她们俩出去玩而不是在家痛苦地辅导她作业，所以希望她在周六就自己把作业完成了，即使
Taro 网络 API 详解与实用案例
Taro网络API详解与实用案例在现代前端开发中，网络通信是不可或缺的一环。Taro作为一款多端开发框架，提供了丰富且统一的网络API，帮助开发者在小程序、H5、ReactNative等多端环境下高效地进行数据交互。本文将详细介绍Taro的四大网络API：Taro.request、Taro.uploadFile、Taro.downloadFile和Taro.connectSocket，并结合实际案
机器人工程专业本科阶段的学习分析(腾讯元宝)
机器人工程专业作为新兴的多学科交叉领域，本科阶段的学习既有显著优势，也存在一定挑战。以下是具体的利弊分析，供学生参考：一、优势（利）1.就业前景广阔，薪资竞争力强行业需求旺盛：智能制造、医疗机器人、自动驾驶等领域人才缺口大（中国机器人产业联盟预测未来5年人才缺口超500万）。薪资水平较高：应届生起薪普遍高于传统工科（如机械、电子），一线城市平均月薪可达1.2万~2万元（2024年数据）。职业选择多
人工神经网络的拓扑结构,神经网络的神经元结构快乐的小蓝猫神经网络深度学习人工智能 rnn
bp神经网络BP（BackPropagation）网络是1986年由Rumelhart和McCelland为首的科学家小组提出，是一种按误差逆传播算法训练的多层前馈网络，是目前应用最广泛的神经网络模型之一。BP网络能学习和存贮大量的输入-输出模式映射关系，而无需事前揭示描述这种映射关系的数学方程。它的学习规则是使用最速下降法，通过反向传播来不断调整网络的权值和阈值，使网络的误差平方和最小。BP神经
冒泡排序讲解和优化以及（附C++代码实现）蓝胖子教编程 #入门算法排序算法 c++冒泡排序性能优化
冒泡排序讲解和优化以及【题解】——车厢重组1.冒泡排序介绍2.冒泡排序优化2.1.优化一2.2.优化二2.3.优化三（双向冒泡排序）1.冒泡排序介绍在上一篇文章中，我给大家介绍了计数排序。计数排序虽然快，可也有许多限制。而冒泡排序就能解决这些问题。冒泡排序的基本思想是,每次比较两个相邻的元素,如果他们的顺序错误（比如按从小到大排列时它们是从大到小排列的）就把他们交换过来。注：橙色的\color{o
Deepoc大模型重构核工业智能基座：混合增强架构与安全增强决策技术 Deepoch 人工智能创业创新科技自动化学习
面向复杂系统的高可靠AI赋能体系构建Deepoc大模型通过多维度技术突破，显著提升核工业知识处理与决策可靠性。经核能行业验证，其生成内容可验证性提升68%，关键参数失真率99.999%）。动态可信度评估系统：基于贝叶斯神经网络实时量化模型不确定性，为关键决策提供置信度评分（如堆芯功率控制置信区间±0.05%）。二、核心突破：物理增强型智能算法创新机理与数据双驱动建模神经微分方程求解器：将中子输运方
二月，愿万事顺遂朔雪纷飞
寒冬逐渐退去，暖春即将来临。办公室张灯结彩，早上上班，走廊里挂满了各种红色喜庆的饰品。办公区域也迎来了大的变动，昨天通知办公位置调整，上午忙完工作，下午着手收拾搬东西。今天上班，新工位办公就绪，可能是换了位置，左右换了人，怎么着都觉得别扭不自在。好在上午忙完已到饭点了，下午上班后开周会，周会结束又是一堆儿工作，无暇顾及左右，也挺好。本就不善于与人打交道的我，沉迷于工作，但也乐在其中。下班后，跟要好
2025AI智能体平台，10个Agent智能体开发平台推荐 cczixun 人工智能智能体大数据安全
1、扣子（Coze）开发平台字节跳动推出的AI智能体开发平台，用户无需编程基础，通过拖拽和配置即可快速创建聊天机器人，并部署到豆包、飞书、抖音、微信等多个平台。平台提供超过1万+的插件，内置豆包・Functioncall32k、通义千问-Max8k等多个大模型，还具备知识库、数据库、图像流等功能。2、通义千问Agent平台阿里巴巴基于通义千问大模型打造的智能体开发框架，以强大的多模态能力和工具集成
对标ChatGPT，「文心一言」今日亮相！AI人机时代来临，未来在何方？ AI医学
本文由「AI医学er」提供医海无涯，AI同舟。关注我们，助力高效科研。3月15日，OpenAI公布了其大型语言模型的最新版本——GPT-4。3月16日，百度文心一言人工智能聊天机器人正式上线。一个时代开始了。OpenAI在官网表示，GPT-4是一个能接受图像和文本输入，并输出文本的多模态模型，是OpenAI在扩展深度学习方面的最新成果。此前的ChatGPT，只能通过向其输入文字提问才能生成文字回答
全球十大云ERP品牌收入管理：企业盈利的智慧引擎 Oracle NetSuite 云货分享大数据 oracle netsuite erp 数字化系统
掌握收入管理让企业营收最大化在当今竞争激烈的商业环境中，企业面临着需求的剧烈波动。无论是按周、按月还是按年来看，这种波动都可能给企业带来巨大的挑战，尤其是对于那些供应弹性低且固定成本高的行业，如航空公司、酒店和高尔夫球场。收入管理作为一种科学与艺术的结合，能够帮助企业预测需求变化并做出响应，从而最大化收入。本文将为您详细介绍收入管理的核心概念、策略和实践方法。什么是收入管理？收入管理是一种通过应用
莆田鞋微商哪家最好最稳答：穿小帅潮鞋马上就能迷倒小美可爱的调皮捣蛋鬼
莆田鞋微商哪家最好最稳答：穿小帅潮鞋马上就能迷倒小美随着莆田鞋市场越做越大，鱼龙混杂商家厂家都非常的多，大中小微商也是一大堆，难以分辨好坏，所以一定要找一个靠谱的！因为莆田鞋款式非常多，所以就是工厂也不是很全，都要很多很多的工厂一起对接合作才行，所以档口他们都是直接对接工厂的，我们个人买或者要代理一件代发选择档口是最合适的，他们会替我们过滤掉不靠谱的，会给我们筛选最好的质量。而且工厂都是走量的批发
【深度学习新浪潮】什么是system 1和system 2？小米玄戒Andrew 深度学习新浪潮深度学习人工智能大模型推理模型 COT 模型蒸馏动态推理
在大模型研究中，System1和System2的概念源于心理学家DanielKahneman的双系统理论，用于描述人类思维的两种模式。System1代表快速、直觉、自动化的思维（如模式识别），而System2代表慢速、有意识、需要努力的逻辑推理（如复杂数学计算）。这一理论被引入AI领域后，成为理解大模型能力边界和优化方向的重要框架。一、大模型中的System1与System2的定义System1（
盘点返利最高的10个购物返利APP：10大返利软件排行榜直返APP淘宝优惠券
随着互联网的发展，越来越多的消费者开始关注购物返利平台。在众多返利APP中，哪些返利软件的返利力度最大呢？本文将为您盘点返利最高的八个购物返利APP，让您在购物过程中省钱又省心。一、直返直返的口号是“返利就用直返”，它强调没有上级赚差价，直接为用户提供商家和消费者之间的综合优惠券返利平台。用户可以在直返上获取自己感兴趣的商品，购买后可以获得一定比例的返利。直返的返利速度快、金额高，深受用户喜爱。通
飞算科技：以原创技术为翼，赋能产业数字化转型
在数字经济浪潮席卷全球的当下，一批专注于技术创新的中国企业正加速崛起，飞算数智科技（深圳）有限公司（简称“飞算科技”）便是其中的佼佼者。作为一家国家级高新技术企业，飞算科技以自主创新为核心驱动力，凭借互联网科技、大数据、人工智能等前沿技术，为各行业客户插上数字化转型的翅膀。飞算科技的定位清晰而坚定——自主创新型数字科技公司。这一定位不仅体现在其技术研发的方向上，更融入到为客户服务的每一个环节。无论
今天是中元节，我居然放假了大树光
今天我放假了，没有什么其他原因，因为今天是中元节，也叫鬼节。传闻中，今天鬼将会出来，不知道你们怕不怕呢？说实话，在我家乡那边，并没有过中元节的习俗，每年只有清明节祭祖，所有从小到大并不了解这个节日，自从上了大学，我就知道了，有中元节这个节日，和清明节差不多，也需要祭祖。所以，大部分的顾客今天都没来，于是就休息了。后来特别的去了解了一下，原来中元节又叫鬼节，是个特别可怕的节日，虽然我没有感到可怕，但
揭秘火爆月入2万+项目，社交电商每日一淘是不是传销？赵先生186
揭秘火爆月入2万+项目，社交电商每日一淘是不是传销？今年下半年是不平凡的半年，很多互联网大咖都在做社交电商每日一淘，为什么要做每日一淘呢？很简单，我总结了一下，如果你是富二代，那就不用讲了。但是，如果你是一下几种情况你绝对可以关注一下。1、如果你是上班族，对自己目前的收入状况不满意，想兼职…2、如果你是大学生想创业，却不知道做什么项目，怕欺骗…3、如果你做微商，压货成本高，风险大…4、如果你是宝妈
【 SpringAI核心特性 | Prompt工程】 Purse Wind AI prompt AI编程 java spring spring boot 后端
1.Prompt工程基本概念：Prompt؜工程又叫提示‏词工程，简单来说，就是输入‌给AI的指令。比如下面‏这段内容，就是提示词：请问桂林电子科技大学是一个怎么样的学校？1.1Prompt分类在AI؜对话中，基于角色的⁠分类是最常见的，通‏常存在3种主要‌类型的Promp‏t：1）用户Prompt：这是用户向AI提供的实际问题、指令或信息，传达了用户的直接需求。用户Prompt告诉AI模型“做什
312个免费高速HTTP代理IP（能隐藏自己真实IP地址） yangshangchuan 高速免费 superword HTTP代理
124.88.67.20:843 190.36.223.93:8080 117.147.221.38:8123 122.228.92.103:3128 183.247.211.159:8123 124.88.67.35:81 112.18.51.167:8123 218.28.96.39:3128 49.94.160.198:3128 183.20
pull解析和json编码百合不是茶 android pull解析 json
n.json文件: [{name:java,lan:c++,age:17},{name:android,lan:java,age:8}] pull.xml文件 <?xml version="1.0" encoding="utf-8"?> <stu> <name>java
[能源与矿产]石油与地球生态系统 comsci 能源
按照苏联的科学界的说法,石油并非是远古的生物残骸的演变产物,而是一种可以由某些特殊地质结构和物理条件生产出来的东西,也就是说,石油是可以自增长的.... 那么我们做一个猜想: 石油好像是地球的体液,我们地球具有自动产生石油的某种机制,只要我们不过量开采石油,并保护好
类与对象浅谈沐刃青蛟 java 基础
类，字面理解，便是同一种事物的总称，比如人类，是对世界上所有人的一个总称。而对象，便是类的具体化，实例化，是一个具体事物，比如张飞这个人，就是人类的一个对象。但要注意的是：张飞这个人是对象，而不是张飞，张飞只是他这个人的名字，是他的属性而已。而一个类中包含了属性和方法这两兄弟，他们分别用来描述对象的行为和性质（感觉应该是
新站开始被收录后，我们应该做什么？ IT独行者 PHP seo
新站开始被收录后，我们应该做什么？百度终于开始收录自己的网站了，作为站长，你是不是觉得那一刻很有成就感呢，同时，你是不是又很茫然，不知道下一步该做什么了？至少我当初就是这样，在这里和大家一份分享一下新站收录后，我们要做哪些工作。至于如何让百度快速收录自己的网站，可以参考我之前的帖子《新站让百
oracle 连接碰到的问题文强chu oracle
Unable to find a java Virtual Machine－－安装64位版Oracle11gR2后无法启动SQLDeveloper的解决方案作者：草根IT网来源：未知人气：813标签：导读：安装64位版Oracle11gR2后发现启动SQLDeveloper时弹出配置java.exe的路径，找到Oracle自带java.exe后产生的路径“C:\app\用户名\prod
Swing中按ctrl键同时移动鼠标拖动组件（类中多借口共享同一数据）小桔子 java 继承 swing 接口监听
都知道java中类只能单继承，但可以实现多个接口，但我发现实现多个接口之后，多个接口却不能共享同一个数据，应用开发中想实现：当用户按着ctrl键时，可以用鼠标点击拖动组件，比如说文本框。编写一个监听实现KeyListener,NouseListener,MouseMotionListener三个接口，重写方法。定义一个全局变量boolea
linux常用的命令 aichenglong linux 常用命令
1 startx切换到图形化界面 2 man命令:查看帮助信息 man 需要查看的命令,man命令提供了大量的帮助信息,一般可以分成4个部分 name:对命令的简单说明 synopsis:命令的使用格式说明 description:命令的详细说明信息 options:命令的各项说明 3 date:显示时间语法：date [OPTION]... [+FORMAT]
eclipse内存优化 AILIKES java eclipse jvm jdk
一基本说明在JVM中，总体上分2块内存区,默认空余堆内存小于 40%时，JVM就会增大堆直到-Xmx的最大限制；空余堆内存大于70%时，JVM会减少堆直到-Xms的最小限制。 1)堆内存(Heap memory):堆是运行时数据区域，所有类实例和数组的内存均从此处分配,是Java代码可及的内存，是留给开发人
关键字的使用探讨百合不是茶关键字
//关键字的使用探讨/*访问关键词private 只能在本类中访问public 只能在本工程中访问protected 只能在包中和子类中访问默认的只能在包中访问*//*final 类方法变量 final 类不能被继承 final 方法不能被子类覆盖，但可以继承 final 变量只能有一次赋值，赋值后不能改变 final 不能用来修饰构造方法*///this()
JS中定义对象的几种方式 bijian1013 js
1. 基于已有对象扩充其对象和方法(只适合于临时的生成一个对象)： <html> <head> <title>基于已有对象扩充其对象和方法(只适合于临时的生成一个对象)</title> </head> <script> var obj = new Object();
表驱动法实例 bijian1013 java 表驱动法 TDD
获得月的天数是典型的直接访问驱动表方式的实例，下面我们来展示一下： MonthDaysTest.java package com.study.test; import org.junit.Assert; import org.junit.Test; import com.study.MonthDays; public class MonthDaysTest { @T
LInux启停重启常用服务器的脚本 bit1129 linux
启动，停止和重启常用服务器的Bash脚本，对于每个服务器，需要根据实际的安装路径做相应的修改 #! /bin/bash Servers=(Apache2, Nginx, Resin, Tomcat, Couchbase, SVN, ActiveMQ, Mongo); Ops=(Start, Stop, Restart); currentDir=$(pwd); echo
【HBase六】REST操作HBase bit1129 hbase
HBase提供了REST风格的服务方便查看HBase集群的信息，以及执行增删改查操作 1. 启动和停止HBase REST 服务 1.1 启动REST服务前台启动（默认端口号8080） [hadoop@hadoop bin]$ ./hbase rest start 后台启动 hbase-daemon.sh start rest 启动时指定
大话zabbix 3.0设计假设 ronin47
What’s new in Zabbix 2.0? 去年开始使用Zabbix的时候，是1.8.X的版本，今年Zabbix已经跨入了2.0的时代。看了2.0的release notes，和performance相关的有下面几个： :: Performance improvements::Trigger related da
http错误码大全 byalias http协议 javaweb
响应码由三位十进制数字组成，它们出现在由HTTP服务器发送的响应的第一行。响应码分五种类型，由它们的第一位数字表示： 1）1xx：信息，请求收到，继续处理 2）2xx：成功，行为被成功地接受、理解和采纳 3）3xx：重定向，为了完成请求，必须进一步执行的动作 4）4xx：客户端错误，请求包含语法错误或者请求无法实现 5）5xx：服务器错误，服务器不能实现一种明显无效的请求
J2EE设计模式-Intercepting Filter bylijinnan java 设计模式数据结构
Intercepting Filter类似于职责链模式有两种实现其中一种是Filter之间没有联系，全部Filter都存放在FilterChain中，由FilterChain来有序或无序地把把所有Filter调用一遍。没有用到链表这种数据结构。示例如下： package com.ljn.filter.custom; import java.util.ArrayList;
修改jboss端口 chicony jboss
修改jboss端口 %JBOSS_HOME%\server\{服务实例名}\conf\bindingservice.beans\META-INF\bindings-jboss-beans.xml 中找到 <!-- The ports-default bindings are obtained by taking the base bindin
c++ 用类模版实现数组类 CrazyMizzz C++
最近c++学到数组类，写了代码将他实现，基本具有vector类的功能 #include<iostream> #include<string> #include<cassert> using namespace std; template<class T> class Array { public: //构造函数
hadoop dfs.datanode.du.reserved 预留空间配置方法 daizj hadoop 预留空间
对于datanode配置预留空间的方法为：在hdfs-site.xml添加如下配置 <property> <name>dfs.datanode.du.reserved</name> <value>10737418240</value>
mysql远程访问的设置 dcj3sjt126com mysql 防火墙
第一步: 激活网络设置你需要编辑mysql配置文件my.cnf. 通常状况，my.cnf放置于在以下目录： /etc/mysql/my.cnf (Debian linux) /etc/my.cnf （Red Hat Linux/Fedora Linux) /var/db/mysql/my.cnf (FreeBSD) 然后用vi编辑my.cnf，修改内容从以下行： [mysqld] 你所需要: 1
ios 使用特定的popToViewController返回到相应的Controller dcj3sjt126com controller
1、取navigationCtroller中的Controllers NSArray * ctrlArray = self.navigationController.viewControllers; 2、取出后，执行， [self.navigationController popToViewController:[ctrlArray objectAtIndex:0] animated:YES
Linux正则表达式和通配符的区别 eksliang 正则表达式通配符和正则表达式的区别通配符
转载请出自出处：http://eksliang.iteye.com/blog/1976579 首先得明白二者是截然不同的通配符只能用在shell命令中,用来处理字符串的的匹配。判断一个命令是否为bash shell(linux 默认的shell)的内置命令 type -t commad 返回结果含义 file 表示为外部命令 alias 表示该
Ubuntu Mysql Install and CONF gengzg Install
http://www.navicat.com.cn/download/navicat-for-mysql Step1: 下载Navicat ，网址：http://www.navicat.com/en/download/download.html Step2：进入下载目录，解压压缩包：tar -zxvf navicat11_mysql_en.tar.gz
批处理，删除文件bat huqiji windows dos
@echo off ::演示：删除指定路径下指定天数之前（以文件名中包含的日期字符串为准）的文件。 ::如果演示结果无误，把del前面的echo去掉，即可实现真正删除。 ::本例假设文件名中包含的日期字符串（比如：bak-2009-12-25.log） rem 指定待删除文件的存放路径 set SrcDir=C:/Test/BatHome rem 指定天数 set DaysAgo=1
跨浏览器兼容的HTML5视频音频播放器天梯梦 html5
HTML5的video和audio标签是用来在网页中加入视频和音频的标签，在支持html5的浏览器中不需要预先加载Adobe Flash浏览器插件就能轻松快速的播放视频和音频文件。而html5media.js可以在不支持html5的浏览器上使video和audio标签生效。 How to enable <video> and <audio> tags in
Bundle自定义数据传递 hm4123660 android Serializable 自定义数据传递 Bundle Parcelable
我们都知道Bundle可能过put****()方法添加各种基本类型的数据，Intent也可以通过putExtras(Bundle)将数据添加进去，然后通过startActivity()跳到下一下Activity的时候就把数据也传到下一个Activity了。如传递一个字符串到下一个Activity 把数据放到Intent
C＃：异步编程和线程的使用（.NET 4.5 ） powertoolsteam .net 线程 C#异步编程
异步编程和线程处理是并发或并行编程非常重要的功能特征。为了实现异步编程，可使用线程也可以不用。将异步与线程同时讲，将有助于我们更好的理解它们的特征。本文中涉及关键知识点 1. 异步编程 2. 线程的使用 3. 基于任务的异步模式 4. 并行编程 5. 总结异步编程什么是异步操作？异步操作是指某些操作能够独立运行，不依赖主流程或主其他处理流程。通常情况下，C＃程序
spark 查看 job history 日志 Stark_Summer 日志 spark history job
SPARK_HOME/conf 下: spark-defaults.conf 增加如下内容 spark.eventLog.enabled true spark.eventLog.dir hdfs://master:8020/var/log/spark spark.eventLog.compress true spark-env.sh 增加如下内容 export SP
SSH框架搭建 wangxiukai2015eye spring Hibernate struts
MyEclipse搭建SSH框架 Struts Spring Hibernate 1、new一个web project。 2、右键项目，为项目添加Struts支持。选择Struts2 Core Libraries -<MyEclipes-Library> 点击Finish。src目录下多了struts