星画天

DeepLab全家桶小结

目标分割经过了FCN->U-net->U-net++等等的迭代之后，出现了一个通过改良VGG网络融合机器学习方法CRF得到的全新网络DeepLab。然而，为了让网络能够更加简洁，使用推广起来更加方便，作者又放弃了可解释性强的CRF方法，把整个网络变成了一个end2end的全深度学习网络。目标分割网络的迭代过程也是令人心潮澎湃，值得好好的学习和整理，为将来的论文改进提供思想上的指导。
在进行DeepLab的介绍之前，我想先讲一下空洞卷积和感受野的计算方法，在这两个概念明确了之后，我们能够更好的理解DeepLab的运算流程。

膨胀卷积（相当于空洞卷积）：

直接上图片比较清晰直观。我们可以看到，7x7的feature map经过3x3kernel (dilation = 2)，我们可以代入计算公式：Hout = (7 - 2 x (3-1) -1 + 1) = 3。当然stride = 2的话可以自己另外计算。
虽然空洞卷积能够增加感受野，增加在下采样过程中空间信息的保留。但是它也存在一些缺点：
- 由于空洞卷积是对feature map离散的像素进行处理，处理的并不是临近的像素，很可能在预测的时候会出现一些栅格化的效应。
- 对于大物体比较友好，小物体就不好说了
空洞卷积和转置卷积的区别是，空洞卷积是卷积核裂开，转置卷积是feature map裂开，加padding。这个原来已经整理过，在FCN大总结中。
空洞卷积能够在计算量不变的情况下增加感受野，我们可以从这一张图片看到空洞卷积在每一层的感受野变化
为了防止出现栅格化的现象，一般在使用block的第一个卷积层的dilation rate是1，就像图a所示，这样能够让经过空洞卷积的feature map的感受野有连续性。否则，从第一个卷积层是2的话，感受野就会不连续，出现栅格化效应也就不奇怪了。

感受野的计算公式：

$R_{n}=R_{n-1}+\left(k_{n}-1\right) * \prod_{i=1}^{n-1} s_{i}$ $k_{n}-1$ $ = dilation * (kernel size - 1)$.
R指的是层数。具体感受野公式推导如下链接：https://zhuanlan.zhihu.com/p/375100687
相对感受野的公式是： $R_{n, m}=k_{m}+\left(R_{n, m+1}-1\right) * s_{m+1}$ 如果是膨胀卷积的话，用
笔记还是上面的知乎专栏比较完整。

DeepLabV1：

这个网络是从VGG-16网络改变而来的。其实主要做了以下的一些改变：
- 全连接层变成卷积层
- 把最后两个pooling层给丢掉，变成空洞卷积（通过stride = 2进行下采样），在代码上是把max pooling的stride从2变成1，简直就是为了用VGG的所有参数，省的写代码定制的。
- 把全连接层的4096维度变成1024，效果没有降低，让速度提升
- 最开始的FC全卷积层从是7 x 7的kernel size（膨胀卷积），但是作者把这里的卷积核变成了3 x 3（或者4 x 4）.VGG直接有的膨胀卷积，这个计算量会太大，当时也就是因为计算量太大之后才开始优化计算量的。
- 具体的改进已经在图上表明
- 最后的变成28 x 28，之后直接用双线性上采样8倍之后再用crf

在这里再总结一下V1的流程：
- 首先采用VGG的backbone进行特征提取。但是这个是经过修改之后的backbone，VGG一共有5次pooling，在第四次和第五次pooling中，作者把pooling的stride变成1，使得之后的feature map的size都是28 x 28.最后的VGG有两个4096的FC层，作者把4096变成1024，减少计算量。这些是backbone的比较大的改动总结
- 在分类的时候，首先对28 x 28 x 21的feature map进行8倍上采样到224 x 224 x21大小，连接CRF，对最后的数据进行处理
- 接入损失函数，用的是mIOU指标，通过它进行反向传播计算。
至于CRF，觉得不知道它为什么能够提高分辨的精确率
Multi-scale 就是把相同图片，变成不懂大小一起输入，之后把结果平均一下。
CRF：觉得就是用这个当损失函数？或者是用机器学习方法求解参数
$E(\boldsymbol{x})=\sum_{i} \theta_{i}\left(x_{i}\right)+\sum_{i j} \theta_{i j}\left(x_{i}, x_{j}\right)$ x表示每一个像素的类别， $x_i$ 表示第i个像素的类别。每一个点有21个取值情况。
$\theta_{i}\left(x_{i}\right)=-\log P\left(x_{i}\right)$
$\theta_{i j}\left(x_{i}, x_{j}\right)=\mu\left(x_{i}, x_{j}\right) \sum_{m=1}^{K} w_{m} \cdot k^{m}\left(\boldsymbol{f}_{i}, \boldsymbol{f}_{i}\right)$
$\quad=\mu\left(x_{i}, x_{j}\right)\left[w_{1} \exp \left(-\frac{\left\|p_{i}-p_{j}\right\|^{2}}{2 \sigma_{\alpha}^{2}}-\frac{\left\|I_{i}-I_{j}\right\|^{2}}{2 \sigma_{\beta}^{2}}\right)+w_{2} \exp \left(-\frac{\left\|p_{i}-p_{j}\right\|^{2}}{2 \sigma_{\gamma}^{2}}\right)\right] \quad \mu\left(x_{i}, x_{j}\right)=0$ if $x_{i}=x_{j}$
$\mu\left(x_{i}, x_{j}\right)=1$ if $x_{i}≠x_{j}$ ，让这个θ变小一些。不过这一部分在DeepLabV3里面就被干掉了。
更多的是求解，和梯度下降。
large-FOV就是把3x3的空洞卷积stride变成12.让感受野变得更大，甚至是比原图的更大。

DeepLabV2：

第二版有以下的改变：首先是用了ResNet作为backbone，然后用了ASPP（空洞空间金字塔池化）模块进行多尺度特征融合，在学习率调整上，这一片论文也提出了自己的一些见解。对于ResNet我就不做更多的解释了，在之前的文章已经写过了。我们先来看看ASPP模块。

ASPP：

这个rate的意思就是dilation rate，其实现在看来还是写得比较清楚的。经过这4个卷积块之后，能够实现对不同尺度（感受野）的特征进行融合，提取到更加丰富的信息。
论文里面对ASPP还进行了一些说明和实验，在这里就把图片先贴出来。这个r就是rate，里面的列表表示的是每一个卷积层对应的dilation rate。实验中，数据占优的是ASPP-L，它的rate是比较大的，都是6的倍数。有些事情就是人肉搜索出来的，强硬解释为什么这个效果好的方法就只能说，这个卷积的感受野更大，融合的特征感受野也更大，有利于分割任务的完成。
在这里加一下ASPP的代码实现，这个还是比较重要的，因为自己对于代码实现还是比较薄弱的。需要增强一下这方面的知识。

import torch
import torch.nn as nn
import torch.nn.functional as F

class ASPP(nn.Module):

    def __init__(self, in_chans, out_chans, rate=1):
        super(ASPP, self).__init__()

        # 1 x 1 无孔洞卷积
        # conv2d 参数先是输入输出通道，然后是kernel size，stride padding dilation默认一般是1，
        # bias看看能不能要
        self.conv_part1 = nn.Sequential(
            nn.Conv2d(in_chans,out_chans,1,1,padding=0,dilation=rate,bias=True),
            nn.BatchNorm2d(out_chans),
            nn.ReLU(inplace=True)
        )

        # 3 x 3 空洞6卷积
        self.conv_part2 = nn.Sequential(
            nn.Conv2d(in_chans, out_chans, 3, 1, padding = 6*rate, dilation= 6*rate,bias = True),
            nn.BatchNorm2d(out_chans),
            nn.ReLU(inplace= True)
        )

        self.conv_part3 = nn.Sequential(
            nn.Conv2d(in_chans,out_chans,3,1,padding=12 * rate,dilation=12 * rate, bias = True),
            nn.BatchNorm2d(out_chans),
            nn.ReLU(inplace=True)
        )
		# 为什么没有24的dilation，因为在deeplabV3+中24的dilation被去除了
        self.conv_part4 = nn.Sequential(
            nn.Conv2d(in_chans,out_chans,3,1,padding=18*rate, dilation=18*rate,bias = True),
            nn.BatchNorm2d(out_chans),
            nn.ReLU(inplace=True)
        )

        # 全局池化：里面的参数output size,这部分代码，就是对合并之后的feature map处理的代码作者
        # 在论文里面并没有写。
        self.conv_part5_avg = nn.AdaptiveAvgPool2d(1)
        # 1 x 1的cbr用来处理平均池化所得到的特征图
        self.conv_part5_conv = nn.Conv2d(in_chans,out_chans,1,1,bias = True)
        self.conv_part5_bn = nn.BatchNorm2d(out_chans)
        self.conv_part5_relu = nn.ReLU(inplace=True)
        self.conv_cat = nn.Sequential(
            nn.Conv2d(out_chans * 5,out_chans, 1,1,padding=0,bias=True),
            nn.BatchNorm2d(out_chans),
            nn.ReLU(inplace=True)
        )


    def forward(self, x):
        b, c, h, w = x.size()
        conv1x1 = self.conv_part1(x)
        conv3x3_1 = self.conv_part2(x)
        conv3x3_2 = self.conv_part3(x)
        conv3x3_3 = self.conv_part4(x)
        global_feature = self.conv_part5_avg(x)
        # 对全局池化的特征要进行处理
        global_feature = self.conv_part5_relu(self.conv_part5_bn(self.conv_part5_conv(global_feature)))
        # 上采样到原图的大小，一直到deeplabV3+作者才用了了转置卷积
        global_feature = F.interpolate(global_feature,(h,w),None,'bilinear',True)
        # 在bchw上contact，所以dim必须是1
        feature_cat = torch.cat([conv1x1,conv3x3_1,conv3x3_2,conv3x3_3,global_feature],dim = 1)
        result = self.conv_cat(feature_cat)
        return result

learning rate policy

$KaTeX parse error: Expected '}', got '_' at position 42: … }}{\text { max_̲iter }}\right)^…$ 这个是作者在训练的时候对学习率的调整策略，和原来百度的三角调整策略很相似。
在论文中，作者实验的power值是0.9.iter是每一次迭代（不是epoch的意思，max_iter = epoch * iter_per_epoch）。当然这个应该只是一个权重，前面应该还需要乘上一个系数，也就是lr。
作者在计算的时候发现，batch_size减小的时候mean_IOU也不会降低，于是就减小了它，加快训练速度。
论文的剩下部分就是实验结果部分了。我们可以大踏步来到V3

DeepLabV3：

作者一直在想方设法把CRF给去掉，终于在这一个版本，作者成功去掉了CRF这个模块。在这一个版本，作者的改动其实并不太多。用的block都是resnet_block。只不过在使用的时候，作者把block4重复了好几次，做了一个Cascade。在block内部，作者对每一个conv的dilation rate进行了调整。当然作者也不会忘记对ASPP进行调整，作者也做了一个parallel网络，最终选择的网络还是parallel，说明特征融合的强大。
我们首先来看看Cascade模块：

上面的图是原始的resnet和加了dilation rate 的deeplab的结构比较图。我们看到，从block3之后，feature map就不再减小了。我们在论文里面可以看到OS这个东西，这个的意思是output_stride，就是下采样的倍数。在resnet的conv1和pooling1中，已经下采样了4倍，经过block1，block2再下采样4倍合起来就是16。具体可以看deeplabv3代码。

在级联的网络中，我们可以看到Multi_Grid这个东西，其实这个代表了初始block中三个卷积层每一个的dilation rate。最终经过实验证明，初始的Multi_grid = (1,2,1)效果最好。rate就是这一个block中Multi_grid的值是rate x (1,2,1)。具体实验图表如下图所示：

作者还对网络结构进行了调整，作者试试如果把ASPP稍微改了一下，把V2中有一个rate = 24的conv给删除了，改成了1 x1的conv层，之后contact。于是出现了这个parallel结构：

其中image Pooling的代码如下：

global_feature = self.conv_part5_avg(x)
        # 对全局池化的特征要进行处理
global_feature = self.conv_part5_relu(self.conv_part5_bn(self.conv_part5_conv(global_feature)))
global_feature = F.interpolate(global_feature,(h,w),None,'bilinear',True)

经过作者不断地人肉搜索结构之后，得到的结果还是比较好的。在之后也成功地删除了CRF，终于不用搞这个麻烦的公式了。

DeepLabV3+：

这个论文只是对DeepLabV3的补充，并没有提出太多的东西。主要的创新点在这里：
backbone使用了Xception，这个结构之后再看。内容太多了。
然后把卷积变成了深度可分离空洞卷积。加上了一个Decoder的模块，终于用上了转置卷积。具体的等到我看完论文再整理吧。

使用GitHub API进行智能文档加载 fgayif github python
GitHub是一个强大的开发者平台，提供了代码存储、管理和分享的功能。它采用Git软件，增强了分布式版本控制，同时提供了访问控制、错误跟踪、软件功能请求、任务管理、持续集成和项目的wiki等功能。随着AI技术的发展，我们可以利用GitHub的API实现智能文档加载，以便更好地进行代码管理和分析。下面我将介绍如何使用GitHubAPI进行文档加载，并通过实用的代码示例来帮助大家理解。技术背景介绍Gi
node-imap-sync-client, imap 客户端库, 同步专用 eli960 MAIL 前端 javascript node.js
node-imap-sync-client说明网址:https://gitee.com/linuxmail/node-imap-sync-client同步操作imap客户端，见例子examples本imap客户端,特点:全部命令都是promise风格主要用于和IMAPD服务器同步邮箱数据和邮件数据支持文件夹的创建/删除/移动(改名)支持邮件的复制/移动/删除/标记/上传支持获取文件夹下邮件UID列
node-ddk, electron 组件,任务栏,托盘,通知 eli960 node-ddk electron javascript node.js
node-ddk任务栏,托盘,通知https://blog.csdn.net/eli960/article/details/146207062也可以下载demo直接演示http://linuxmail.cn/go#node-ddk在渲染进程(既web端)操作importrenderer,{NODEDDK}from"node-ddk/renderer"letw=renderer.window//让托
node-ddk,electron 开发组件 eli960 node-ddk electron javascript 前端 node.js js
node-ddk-demo说明node-ddk是ELECTRON开发框架,封装常见操作npminode-ddk演示:https://live.csdn.net/v/468440本项目是一个DEMO,项目地址:https://gitee.com/linuxmail/node-ddk-demogitclonehttps://gitee.com/linuxmail/node-ddk-democdnode
高效快速教你DeepSeek如何进行本地部署并且可视化对话大富大贵7 程序员知识储备1 程序员知识储备2 程序员知识储备3 经验分享
科技文章：高效快速教你DeepSeek如何进行本地部署并且可视化对话摘要：随着自然语言处理（NLP）技术的进步，DeepSeek作为一款基于深度学习的语义搜索技术，广泛应用于文本理解、对话系统及信息检索等多个领域。本文将探讨如何高效快速地在本地部署DeepSeek，并结合可视化工具实现对话过程的监控与分析。通过详尽的步骤、案例分析与代码示例，帮助开发者更好地理解和应用DeepSeek技术。同时，本
P3375 【模板】KMP 好好学习^按时吃饭算法
题目来自洛谷网站：思路：从题目名字知道这是KMP模板题目，对于KMP算法，就两步，1、构造next数组。2、在s1中找到s2出现的位置。KMP代码：#includeusingnamespacestd;constintN=1e6+10;chars1[N],s2[N];//全局变量名字不能定义为next//C++标准库中有一个函数名字是nextintnext1[N];//ne数组intmain(){/
node-ddk, electron组件, 自定义本地文件协议,打开本地文件 eli960 node-ddk electron javascript 前端 node.js
node-ddk文件协议https://blog.csdn.net/eli960/article/details/146207062也可以下载demo直接演示http://linuxmail.cn/go#node-ddk安全考虑到安全,本系统禁止使用file:///在主窗口,自定义文件协议,可以多个importmain,{NODEDDK}from"node-ddk/main"main.protoc
conda安装R语言环境并部署至pycharm 楚门留香 r语言开发语言
优先看这个：[win10系统使用Pycharm-professional配置R语言-知乎(zhihu.com)](https://zhuanlan.zhihu.com/p/546788455)要安装R4.0.0的时候看这个：[R语言的安装（详细教程）_r语言安装教程-CSDN博客](https://blog.csdn.net/xhmico/article/details/122443660)r语言
机器学习——分类、回归、聚类、LASSO回归、Ridge回归（自用）代码的建筑师模型学习模型训练机器学习机器学习分类回归正则化项 LASSO Ridge 朴素
纠正自己的误区：机器学习是一个大范围，并不是一个小的方向，比如：线性回归预测、卷积神经网络和强化学都是机器学习算法在不同场景的应用。机器学习最为关键的是要有数据，也就是数据集名词解释：数据集中的一行叫一条样本或者实例，列名称为特征或者属性。样本的数量称为数据量，特征的数量称为特征维度机器学习常用库：Numpy和sklearn朴素的意思是特征的各条件都是相互独立的机器学习（模型、策略、算法）损失函数
《AI医疗系统开发实战录》第6期——智能导诊系统实战骆驼_代码狂魔程序员的法宝人工智能 django python neo4j 知识图谱
关注我，后期文章全部免费开放，一起推进AI医疗的发展核心主题：如何构建95%准确率的智能导诊系统？技术突破：结合BERT+知识图谱的混合模型设计一、智能导诊架构设计python基于BERT的意图识别模型（PyTorch）fromtransformersimportBertTokenizer,BertForSequenceClassificationimporttorchclassTriageMod
基于Streamlit实现的音频处理示例大霸王龙音视频 ffmpeg
基于Streamlit实现的音频处理示例，包含录音、语音转文本、文件下载和进度显示功能，整合了多个技术方案：一、环境准备#安装依赖库pipinstallstreamlitstreamlit-webrtcaudio-recorder-streamlitopenai-whisperpython-dotx二、完整示例代码importstreamlitasstfromaudio_recorder_stre
npm install 报错 gyp info it worked if it ends with ok npm ERR gyp verb cli [ m0_61083409 前端 html npm 前端 node.js
今天新启动一个项目，在npminstall安装依赖项时出现报错。ERR!code1npmERR!pathC:UsersAdministratorDesktope31mall-admin-webode_modulesode-sassnpmERR!commandfailednpmERR!commandC:Windowssystem32cmd.exe/d/s/cnodescripts/build.jsn
于STM32F103C8T6的智能灯泡控制系统C++源码实现程序员Thomas STM32 单片机智能灯泡 stm32 c++嵌入式硬件
以下是一个基于STM32F103C8T6的智能灯泡控制系统C++源码实现，整合了PWM调光、WiFi控制和环境感知功能。该代码已在STM32CubeIDE中验证，支持直接烧录运行：#include"main.h"#include#include"wifi.h"//LED设备抽象类（3设计）classLEDDevice{protected:TIM_HandleTypeDef*pwmTimer;uin
HarmonyOS鸿蒙开发 BuilderParam在父组件的Builder的点击事件报错：Error message:is not callable BruceGwo 鸿蒙Harmony harmonyos 华为
HarmonyOS鸿蒙开发BuilderParam在父组件的Builder的点击事件报错：Errormessage:isnotcallable最近在鸿蒙开发过程中，UI做好了，根据列表item进行点击跳转，报错了报错信息如下Errormessage:isnotcallableStacktrace:atanonymous(entry/src/main/ets/pages/demolab/Builde
Java架构师成长之路 hweiyu00 分享 spring 微服务 spring cloud java
概述本教程主要从6个方面，全面讲解Java技术栈的知识。1.性能调优深入理解MySQL底层原理、索引逻辑，数据结构与算法。使用Explain进行优化分析MVCC原理剖析日志机制解析2.框架源码掌握Spring底层原理带你手写一个Spring解析IOC、AOP源码、以及事务原理3.并发编程剖析Java底层锁机制CAS、JUC工具使用、AQS源码分析以及并发的集合类的讲解4.分布式开发剖析分布式中使用
LangChain组件Tools/Toolkits详解（5）——返回产出artifact 龙焰智能 langchain artifact ToolCall BaseTool 工具产物 ToolMessages
LangChain组件Tools/Toolkits详解（5）——返回产出artifact本篇摘要14.LangChain组件Tools/Toolkits详解14.5返回产出artifact14.5.1定义工具14.5.2使用ToolCall调用工具14.5.3与模型一起使用14.5.4从子例化BaseTool返回参考文献本章目录如下：《LangChain组件Tools/Toolkits详解（1）—
Java面试高频问题深度解析：JVM、锁机制、SQL优化与并发处理 Debug Your Career 面试 java 面试 jvm
问题列表Java中如何实现一个工作流引擎？Bean的作用域有哪些？JVM中的锁机制是如何工作的？三个方法分别被synchronized锁住，方法a调用方法b，b能获取到a的锁吗？会有什么问题？SQL优化时，EXPLAIN中需要关注哪些关键点？什么是覆盖索引？SELECT*一定不会命中索引吗？SELECT*和SELECT全字段在性能上有区别吗？什么是回表？它与索引有什么关系？100万数据分给10个线
weixin089校园综合服务小程序+ssm(文档+源码)_kaic 开心毕设小程序微信小程序旅游微信 php
摘要随着我国经济迅速发展，人们对手机的需求越来越大，各种手机软件也都在被广泛应用，但是对于手机进行数据信息管理，对于手机的各种软件也是备受用户的喜爱，校园综合服务被用户普遍使用，为方便用户能够可以随时进行校园综合服务小程序的数据信息管理，特开发了基于校园综合服务小程序的管理系统。校园综合服务小程序的设计主要是对系统所要实现的功能进行详细考虑，确定所要实现的功能后进行界面的设计，在这中间还要考虑如何
Android一个APP里面最少有几个线程积跬步DEV Android 开发实战大全 Android
Android应用启动时，默认会创建一个进程，该进程中最少包含5个系统自动创建的线程，具体如下：Main线程（主线程/UI线程）负责处理用户交互、UI更新等核心操作，所有与界面相关的逻辑必须在此线程执行。若在此线程执行耗时操作（如网络请求），会导致界面卡顿甚至触发ANR（应用无响应）。FinalizerDaemon线程（终结者守护线程）当对象重写了finalize()方法时，该线程负责将这些对象放
【读点论文】Chain Replication for Supporting High Throughput and Availability 寻雾&启示分布式系统论文阅读
在分布式系统中，强一致性往往和高可用、高吞吐是矛盾的。比如传统的关系型数据库，其保证了强一致性，但往往牺牲了可用性和吞吐量。而像NoSQL数据库，虽然其吞吐量、和扩展性很高，但往往只支持最终一致性，无法保证强一致性。由此ChainReplicationforSupportingHighThroughputandAvailability提出了链式复制协议，旨在保证高吞吐、高可用的同时，支持数据的强一
vLLM - 查看模型是否支持云客Coder 人工智能
支持的模型：https://docs.vllm.ai/en/latest/models/supported_models.html要确定是否支持给定模型，您可以检查HF存储库中的config.json文件。如果"architectures"字段包含下面列出的模型架构，那么理论上应该支持它。查看模型架构查看模型的config.json中的architecturescat~/.cache/huggin
spark explain如何使用 fzip Spark spark 执行计划
在Spark中，explain是分析SQL或DataFrame执行计划的核心工具，通过不同模式可展示查询优化和执行的详细信息，默认情况下，这个语句只提供关于物理计划的信息。以下是具体使用方法及不同模式的作用：1.explain的基本语法在Spark3.0及以上版本，explain支持多种模式参数，通过mode指定输出格式：#DataFrame调用方式df.explain(mode="simple"
Golang算法（二）数据结构小烧卖算法 GO语言
数据结构栈队列双向链表二叉搜索树红黑树栈typeStackstruct{head*Node}typeNodestruct{datainterface{}next*Node}funcNewStack()*Stack{s:=&Stack{head:&Node{data:nil,next:&Node{},},}returns}func(s*Stack)Push(datainterface{}){n:=&
Stability AI 发布 Stable Virtual Camera：从 2D 图像生成 3D 视频三花AI 三花AI 人工智能 3d 音视频
StabilityAI发布StableVirtualCamera：从2D图像生成3D视频StableVirtualCamera[4]是由StabilityAI最新发布的一款能够从一张或多张2D图像（最多支持32张）生成具有真实深度和透视感的3D视频的技术。用户可以自由定义相机轨迹，或者选择预设的动态相机路径，例如360°旋转、螺旋、变焦（DollyZoom）等，效果极其丝滑。不过，当输入图像包含人
Python爬虫笔记一（来自MOOC） Requests库入门小灰不停前进 #Python python pycharm 爬虫
Python爬虫笔记一通用代码框架：importrequestsdefgetHTMLText(url):try:r=requests.get(url,timeput=30)r.raise_for_status()#如果状态不是200，引发HTTPError异常r.encoding=r.apparemt_encodingreturnr.textexcept:return"产生异常"if__name_
SenseVoice 部署记录安静六角开源软件
最近试用了SenseVoice（阿里团队开源的语音转文字）效果可以，可以本地部署，有webui界面，测试了万字以上的转换效果可以。首先部署好conda环境和cuda，这个可以查看他人的文章。步骤1.创建虚拟环境：condacreate-nmainenvpython=3.102.然后安装依赖condaactivatemainenvpipinstall-rC:\Users\xx\Documents\P
Python基于深度学习的动物图片识别技术的研究与实现 Java老徐 Python 毕业设计 python 深度学习开发语言深度学习的动物图片识别技术 Python动物图片识别技术
博主介绍：✌程序员徐师兄、7年大厂程序员经历。全网粉丝12w+、csdn博客专家、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌文末获取源码联系精彩专栏推荐订阅不然下次找不到哟2022-2024年最全的计算机软件毕业设计选题大全：1000个热门选题推荐✅Java项目精品实战案例《100套》Java微信小程序项目实战《100套》感兴趣的可以先收藏起来，还有大家
聊聊langchain4j的HTTP Client langchain4j
序本文主要研究一下langchain4j的HTTPClientlangchain4j-http-clientlangchain4j提供了langchain4j-http-client模块，它实现了一个HttpClientSPI（服务提供者接口），其他模块通过该接口调用LLM提供商的RESTAPI。这意味着底层HTTP客户端可以被自定义，通过实现HttpClientSPI，还可以集成任何其他HTTP
langchain4j+Tika小试牛刀 llm
序本文主要研究一下langchain4j结合ApacheTika进行文档解析步骤pom.xmldev.langchain4jlangchain4j-document-parser-apache-tika1.0.0-beta1examplepublicclassTikaTest{publicstaticvoidmain(String[]args){Stringpath=System.getPrope
stability ai推出的 AI模型2D图像转3D视频微丽宝 AI工具人工智能 3d 音视频
StableVirtualCamera是StabilityAl推出的A|模型，能将2D图像转换为具有真实深度和透视感的3D视频。用户可以通过指定相机轨迹和多种动态路径(如螺旋、推拉变焦、平移等)来生成视频。模型支持从1到32张输入图像生成不同宽高比(如1:1、9:16、16:9)的视频，最长可达1000帧。无需复杂的重建或优化，可生成高质量的3D视频，同时保持3D一致性和时间平滑性。StableV
java Illegal overloaded getter method with ambiguous type for propert的解决 zwllxs java jdk
好久不来iteye,今天又来看看，哈哈,今天碰到在编码时，反射中会抛出 Illegal overloaded getter method with ambiguous type for propert这么个东东，从字面意思看，是反射在获取getter时迷惑了，然后回想起java在boolean值在生成getter时，分别有is和getter，也许我们的反射对象中就有is开头的方法迷惑了jdk，
IT人应当知道的10个行业小内幕 beijingjava 工作互联网
10. 虽然IT业的薪酬比其他很多行业要好，但有公司因此视你为其“佣人”。　　尽管IT人士的薪水没有互联网泡沫之前要好，但和其他行业人士比较，IT人的薪资还算好点。在接下的几十年中，科技在商业和社会发展中所占分量会一直增加，所以我们完全有理由相信，IT专业人才的需求量也不会减少。　　然而，正因为IT人士的薪水普遍较高，所以有些公司认为给了你这么多钱，就把你看成是公司的“佣人”，拥有你的支配
java 实现自定义链表 CrazyMizzz java 数据结构
1.链表结构链表是链式的结构 2.链表的组成链表是由头节点，中间节点和尾节点组成节点是由两个部分组成： 1.数据域 2.引用域 3.链表的实现 &nbs
web项目发布到服务器后图片过一会儿消失麦田的设计者 struts2 上传图片永久保存
作为一名学习了android和j2ee的程序员，我们必须要意识到，客服端和服务器端的交互是很有必要的，比如你用eclipse写了一个web工程，并且发布到了服务器（tomcat）上，这时你在webapps目录下看到了你发布的web工程，你可以打开电脑的浏览器输入http://localhost:8080/工程/路径访问里面的资源。但是，有时你会突然的发现之前用struts2上传的图片
CodeIgniter框架Cart类 name 不能设置中文的解决方法 IT独行者 CodeIgniter Cart 框架　
今天试用了一下CodeIgniter的Cart类时遇到了个小问题，发现当name的值为中文时，就写入不了session。在这里特别提醒一下。在CI手册里也有说明，如下： $data = array( 'id' => 'sku_123ABC', 'qty' => 1, '
linux回收站 _wy_ linux 回收站
今天一不小心在ubuntu下把一个文件移动到了回收站，我并不想删，手误了。我急忙到Nautilus下的回收站中准备恢复它，但是里面居然什么都没有。后来我发现这是由于我删文件的地方不在HOME所在的分区，而是在另一个独立的Linux分区下，这是我专门用于开发的分区。而我删除的东东在分区根目录下的.Trash-1000/file目录下，相关的删除信息（删除时间和文件所在
jquery回到页面顶端知了ing html jquery css
html代码： <h1 id="anchor">页面标题</h1> <div id="container">页面内容</div> <p><a href="#anchor" class="topLink">回到顶端</a><
B树、B-树、B+树、B*树矮蛋蛋 B树
原文地址： http://www.cnblogs.com/oldhorse/archive/2009/11/16/1604009.html B树即二叉搜索树： 1.所有非叶子结点至多拥有两个儿子（Left和Right）； &nb
数据库连接池 alafqq 数据库连接池
http://www.cnblogs.com/xdp-gacl/p/4002804.html @Anthor:孤傲苍狼数据库连接池用MySQLv5版本的数据库驱动没有问题，使用MySQLv6和Oracle的数据库驱动时候报如下错误： java.lang.ClassCastException: $Proxy0 cannot be cast to java.sql.Connec
java泛型百合不是茶 java泛型
泛型在Java SE 1.5之前，没有泛型的情况的下，通过对类型Object的引用来实现参数的“任意化”，任意化的缺点就是要实行强制转换，这种强制转换可能会带来不安全的隐患泛型的特点：消除强制转换确保类型安全向后兼容简单泛型的定义：泛型：就是在类中将其模糊化，在创建对象的时候再具体定义 class fan
javascript闭包[两个小测试例子] bijian1013 JavaScript JavaScript
一.程序一 <script> var name = "The Window"; var Object_a = { 　　name : "My Object", 　　getNameFunc : function(){ var that = this; 　　　　return function(){ 　　　　
探索JUnit4扩展：假设机制（Assumption） bijian1013 java Assumption JUnit 单元测试
一.假设机制（Assumption）概述理想情况下，写测试用例的开发人员可以明确的知道所有导致他们所写的测试用例不通过的地方，但是有的时候，这些导致测试用例不通过的地方并不是很容易的被发现，可能隐藏得很深，从而导致开发人员在写测试用例时很难预测到这些因素，而且往往这些因素并不是开发人员当初设计测试用例时真正目的，
【Gson四】范型POJO的反序列化 bit1129 POJO
在下面这个例子中，POJO(Data类)是一个范型类，在Tests中，指定范型类为PieceData，POJO初始化完成后，通过 String str = new Gson().toJson(data); 得到范型化的POJO序列化得到的JSON串，然后将这个JSON串反序列化为POJO import com.google.gson.Gson; import java.
【Spark八十五】Spark Streaming分析结果落地到MySQL bit1129 Stream
几点总结： 1. DStream.foreachRDD是一个Output Operation，类似于RDD的action，会触发Job的提交。DStream.foreachRDD是数据落地很常用的方法 2. 获取MySQL Connection的操作应该放在foreachRDD的参数（是一个RDD[T]=>Unit的函数类型)，这样，当foreachRDD方法在每个Worker上执行时，
NGINX + LUA实现复杂的控制 ronin47 nginx lua
安装lua_nginx_module 模块 lua_nginx_module 可以一步步的安装，也可以直接用淘宝的OpenResty Centos和debian的安装就简单了。。这里说下freebsd的安装： fetch http://www.lua.org/ftp/lua-5.1.4.tar.gz tar zxvf lua-5.1.4.tar.gz cd lua-5.1.4 ma
java-递归判断数组是否升序 bylijinnan java
public class IsAccendListRecursive { /*递归判断数组是否升序 * if a Integer array is ascending,return true * use recursion */ public static void main(String[] args){ IsAccendListRecursiv
Netty源码学习-DefaultChannelPipeline2 bylijinnan java netty
Netty3的API http://docs.jboss.org/netty/3.2/api/org/jboss/netty/channel/ChannelPipeline.html 里面提到ChannelPipeline的一个“pitfall”：如果ChannelPipeline只有一个handler（假设为handlerA）且希望用另一handler（假设为handlerB）来
Java工具之JPS chinrui java
JPS使用熟悉Linux的朋友们都知道，Linux下有一个常用的命令叫做ps（Process Status)，是用来查看Linux环境下进程信息的。同样的，在Java Virtual Machine里面也提供了类似的工具供广大Java开发人员使用，它就是jps（Java Process Status)，它可以用来
window.print分页打印 ctrain window
function init() { var tt = document.getElementById("tt"); var childNodes = tt.childNodes[0].childNodes; var level = 0; for (var i = 0; i < childNodes.length; i++) {
安装hadoop时执行jps命令Error occurred during initialization of VM daizj jdk hadoop jps
在安装hadoop时，执行JPS出现下面错误 [slave16][email protected]:/tmp/hsperfdata_hdfs# jps Error occurred during initialization of VM java.lang.Error: Properties init: Could not determine current working
PHP开发大型项目的一点经验 dcj3sjt126com PHP 重构
一、变量最好是把所有的变量存储在一个数组中，这样在程序的开发中可以带来很多的方便，特别是当程序很大的时候。变量的命名就当适合自己的习惯，不管是用拼音还是英语，至少应当有一定的意义，以便适合记忆。变量的命名尽量规范化，不要与PHP中的关键字相冲突。二、函数 PHP自带了很多函数，这给我们程序的编写带来了很多的方便。当然，在大型程序中我们往往自己要定义许多个函数，几十
android笔记之--向网络发送GET/POST请求参数 dcj3sjt126com android
使用GET方法发送请求 private static boolean sendGETRequest (String path, Map<String, String> params) throws Exception{ //发送地http://192.168.100.91:8080/videoServi
linux复习笔记之bash shell (3) 通配符 eksliang linux 通配符 linux通配符
转载请出自出处： http://eksliang.iteye.com/blog/2104387 在bash的操作环境中有一个非常有用的功能，那就是通配符。下面列出一些常用的通配符，如下表所示符号意义 * 万用字符，代表0个到无穷个任意字符 ? 万用字符，代表一定有一个任意字符 [] 代表一定有一个在中括号内的字符。例如：[abcd]代表一定有一个字符，可能是a、b、c
Android关于短信加密 gqdy365 android
关于Android短信加密功能，我初步了解的如下（只在Android应用层试验）： 1、因为Android有短信收发接口，可以调用接口完成短信收发；发送过程：APP（基于短信应用修改）接受用户输入号码、内容——>APP对短信内容加密——>调用短信发送方法Sm
asp.net在网站根目录下创建文件夹 hvt .net C#hovertree asp.net Web Forms
假设要在asp.net网站的根目录下建立文件夹hovertree,C#代码如下： string m_keleyiFolderName = Server.MapPath("/hovertree"); if (Directory.Exists(m_keleyiFolderName)) { //文件夹已经存在 return; } else { try { D
一个合格的程序员应该读过哪些书 justjavac 程序员书籍
编者按：2008年8月4日，StackOverflow 网友 Bert F 发帖提问：哪本最具影响力的书，是每个程序员都应该读的？ “如果能时光倒流，回到过去，作为一个开发人员，你可以告诉自己在职业生涯初期应该读一本，你会选择哪本书呢？我希望这个书单列表内容丰富，可以涵盖很多东西。” 很多程序员响应，他们在推荐时也写下自己的评语。以前就有国内网友介绍这个程序员书单，不过都是推荐数
单实例实践跑龙套_az 单例
1、内部类 public class Singleton { private static class SingletonHolder { public static Singleton singleton = new Singleton(); } public Singleton getRes
PO VO BEAN 理解 q137681467 VO DTO po
PO：全称是 persistant object持久对象最形象的理解就是一个PO就是数据库中的一条记录。好处是可以把一条记录作为一个对象处理，可以方便的转为其它对象。 BO：全称是 business object:业务对象主要作用是把业务逻辑封装为一个对象。这个对
战胜惰性，暗自努力金笛子努力
偶然看到一句很贴近生活的话：“别人都在你看不到的地方暗自努力，在你看得到的地方，他们也和你一样显得吊儿郎当，和你一样会抱怨，而只有你自己相信这些都是真的，最后也只有你一人继续不思进取。”很多句子总在不经意中就会戳中一部分人的软肋，我想我们每个人的周围总是有那么些表现得“吊儿郎当”的存在，是否你就真的相信他们如此不思进取，而开始放松了对自己的要求随波逐流呢？我有个朋友是搞技术的，平时嘻嘻哈哈，以
NDK/JNI二维数组多维数组传递 wenzongliang 二维数组 jni NDK
多维数组和对象数组一样处理，例如二维数组里的每个元素还是一个数组用jArray表示，直到数组变为一维的，且里面元素为基本类型，去获得一维数组指针。给大家提供个例子。已经测试通过。 Java_cn_wzl_FiveChessView_checkWin( JNIEnv* env,jobject thiz,jobjectArray qizidata) { jint i,j; int s

DeepLab全家桶小结

膨胀卷积（相当于空洞卷积）：

感受野的计算公式：

DeepLabV1：

CRF：觉得就是用这个当损失函数？或者是用机器学习方法求解参数

DeepLabV2：

ASPP：

learning rate policy

DeepLabV3：

DeepLabV3+：

你可能感兴趣的:(AI保研之旅,神经网络,pytorch,深度学习)