PRIS-SCMonkey

【Super Resolution】超分辨率——SRGAN

- 1、为什么提出SRGAN？
- 2、SRGAN的网络模型
- 3、SRGAN的损失函数
- 4、SRGAN的评价指标
- 5、SRGAN的代码详解
- 6、代码运行报错解决
- 8、最后的Conclusion

接触这篇paper的理由——据说这是第一篇将GAN应用到超分领域的论文。在SRGAN之前，个人认为，超分网络的本质就是从某一分辨率的图像想尽各种办法恢复成更高分辨率的图像，也就是想尽各种办法进行上采样操作，比如说插值、先插值再卷积、先Padding再卷积等等等等。那我们如何打破这种传统的上采样的模式去考虑超分辨率并且如何恢复更加逼真的图像——这就是SRGAN做的事情，也是我觉得这篇论文很新颖的地方。
Paper：Photo-Realistic Single Image Super-Resolution Using a Generative Adversarial Network
Github：Keras-SRGAN

1、为什么提出SRGAN？

这篇文章在开始的时候提到了，在超分辨率问题中有三种图像：HR图像（高分辨率图像）、LR图像（低分辨率图像）、SR图像（超分后的高分辨率图像），通过比较HR图像和SR图像可以发现，虽然训练网络时用均方差作为损失函数，虽然能够获得很高的峰值信噪比，但是SR图像中丢失了很多的高频信息，并不能让人有很好的视觉感受。那么问题就来了，如何在上采样过程中恢复更多的细节信息？ 作者从Perceptual Losses for Real-Time Style Transfer and Super-Resolution这篇论文中得到了启示，这篇论文如果做过Neural Style的伙伴们肯定不陌生，这篇论文主要内容就是两个部分：一个是Fast Neural Style（快速的画风迁移），另一个是提出了一种单张图像的超分辨率算法。此外，在这篇文章中还提出了一种新的损失Perceptual Loss（感知损失），感知损失由三个部分组成：感知损失=特征重构损失+风格重构损失+简单损失，不仅考虑到了特征重构后的相似性，也考虑到了低层特征的相似性。感兴趣的伙伴们可以看我之前的博客深度学习与艺术——Fast Neural Style，里面详细介绍了这两个部分。

我们来思考一个问题，为什么超分中丢失的是高频信息？
我们可以这样考虑，超分问题的本质是通过不同的上采样的方式从一个低分辨率图像恢复到高分辨率图像，从像素级别的角度来看，这是一个一对多或者多对多的问题，那么我们就可以认为这是一个回归问题。既然是回归问题，在拟合的过程中要保证尽量多的信息可以恢复准确，而在图像中，低频信息占大多数，而高频信息占少数，所以在超分问题中高频信息就丢失了。

言归正传，我们来看SRGAN。SRGAN的独特性不仅仅是是将GAN和SR结合了起来，更多的工作是在损失函数上的设计。从GAN的角度来看，是两个分支：生成网络和判别网络。生成网络的主要工作是得到超分后的图像，判别网络的主要工作是判别生成网络生成的图像是真还是假。在SRGAN中还加入了一个vgg的网络，做为新加入的loss。

SRGAN主要由如下三个贡献：
（1）使用16个block的SRResNet做为backbone，上采样因子为x4，在超分评价指标PSNR和SSIM上取得了最好的成绩；
（2）提出了一种基于GAN网络的新损失——感知损失；
（3）我们在三个公共的数据集上测试了MOS，并且验证SRGAN是当时最好的算法；

2、SRGAN的网络模型

SRGAN的网络模型如下图所示，网络很简单，主要是生成器、判别器和vgg网络。训练过程中生成器和判别器交替训练，不断迭代；vgg网络使用在ImageNet上预训练的权重，权重不做训练和更新，只参与Loss的计算。

生成器：【3x3 conv + BN + PReLU + 2 sub-pixel conv】 x n
生成器是在SRResNet的基础上做了改进，在生成网络部分(SRResNet)部分包含多个残差块，每个残差块中包含两个3×3的卷积层，卷积层后接批规范化层(batch normalization, BN)和PReLU作为激活函数，两个2×亚像素卷积层(sub-pixel convolution layers)被用来增大特征尺寸。

判别器：【8 conv + LeakyReLU + 2 fc + sigmoid】
在判别网络部分包含8个卷积层，随着网络层数加深，特征个数不断增加，特征尺寸不断减小，选取激活函数为LeakyReLU，最终通过两个全连接层和最终的sigmoid激活函数得到预测为自然图像的概率。

vgg网络：【Pretrained vgg loss】
本文在生成器结束以后生成的SR图像输送到在ImageNet上已经预训练好的网络，在训练时不训练权重，只参与Loss的计算。

3、SRGAN的损失函数

以往的SR问题的损失函数都是基于MSE的，作者受到Perceptual Loss这篇文章的启发，提出了SRGAN的损失函数，分别为G_Loss和D_Loss。

G_Loss是GAN的生成器的损失，内容损失（Content loss）里面包括MSE loss和VGG loss，损失函数具体如下：

其中， $l^{SR}_{X}$ 是内容损失（content loss）， $l^{SR}_{Gen}$ 是对抗损失。

我们可以这样理解：MSE loss计算的是像素间的匹配程度，Vgg loss计算的是某一特征层的匹配程度。这样设计的理由：因为在SR问题中，常见的评价指标由两种PSNR和SSIM，使用MSE可以得到很好的PSNR和SSIM的值，但是通过比较发现，只使用MSE loss超分后的图像丢失了很多的高频信息，这使图像的直接感受效果也不好，所以我们需要将高频的信息更有效的恢复出来，所以加入了经过预训练网络的vgg损失，希望在Feature Map上也有约束和比较。

MSE损失公式如下：

Vgg损失公式如下：

对抗损失公式如下：

D_Loss是GAN网络判别器的损失，和普通的GAN网络判别器的损失基本一样，具体的损失公式如下：

4、SRGAN的评价指标

我们在博客的最开始提到，从HR图像和SR图像比较发现，SR图像是缺少高频信息的，所以我们在损失函数中加入了对于恢复高频信息的损失设计。那么反过来思考，为什么缺少高频信息的人眼感受较差的SR图像却在PSNR和SSIM这两个指标中表现良好？是不是在评价指标的设计过程中也存在一定的问题呢？
所以在本文中，除了用PSNR和SSIM来衡量超分的效果，还用了MOS（Mean opinion score）来衡量超分的效果。我们要求26名评分者对于不同算法超分后的图像进行从1分-5分的品质打分，可以看出我们的SRGAN算法虽然在PSNR和SSIM上略微逊色，但是在MOS的指标上还是很出色的。下图就是几种超分算法在Set5、Set14和BSD100上的三种指标的结果：

5、SRGAN的代码详解

再给大家安利一下这个代码Keras-GAN，这是用Keras搭建的各种基础GAN的网络，Keras框架封装性超好，虽然用起来有些局限，对于新手来说还是很快可以上手的。我们就拿这个代码中的SRGAN做一个简单的代码详解。

可以看到，在SRGAN中只有两个文件，data_loader.py和srgan.py，data_loader.py文件主要是数据的获取和处理成低分辨率的图像；srgan.py文件主要是搭建网络和训练过程。我们使用的是celeba的人脸数据集，先给大家放上我们迭代4000次的图像结果。

我们主要来看一下srgan.py的代码内容。在SRGAN网络中主要需要搭建三个部分：vgg，GAN的生成网络，GAN的判别网络。 所以我们要清楚每个网络的输入输出是什么，如下表：

子网络	输入	输出	损失
SRGAN_G网络	低分辩率LR图像	经过生成器的超分SR图像	对抗生成损失
vgg网络	SRGAN生成器产生的SR图像	经过预训练的vgg网络的Feature Map	vgg的损失
SRGAN_D网络	SRGAN生成器产生的SR图像和高分辨率HR图像	判断图像的True/False	对抗生成损失

需要注意的的几个细节：
细节一： 训练过程中vgg网络的权重是预训练的，我们在GAN训练的过程中是不训练vgg网络的，所以在代码中需要设置trainable=False。

	self.vgg = self.build_vgg()
	self.vgg.trainable = False    # 关闭训练权重的过程
	self.vgg.compile(loss='mse',  optimizer=optimizer, metrics=['accuracy'])

细节二： GAN的训练中很重要的是判别器的训练，理论上生成器的训练和判别器的训练是相辅相成的，GoodFellow在原始GAN的论文中提到，生成器和判别器的就像造假钞的人和验假钞的专家，如果造假钞的人技术越高超，那么验假钞的专家技术也越高超。那么，在判别器中如何判别这些图的真假？也就是说，图的真假由grondtruth或者label是真/假。 所以，在图像输入判别器之前还有打label的过程。

# Train Networks
imgs_hr, imgs_lr = self.data_loader.load_data(batch_size)
# 标注真的HR图像为真
valid = np.ones((batch_size,) + self.disc_patch)
# 得到经过vgg网络输出的Feature Map
image_features = self.vgg.predict(imgs_hr)
# 得到g_loss
g_loss = self.combined.train_on_batch([imgs_lr, imgs_hr], [valid, image_features])

6、代码运行报错解决

【20190808-20190813】
运行Keras-GAN srgan(celeba)的代码，这个是GAN用在超分上的始祖，所以还是比较重要的，光看代码就看了好几天，还有乱七八糟的配环境的事情。

Code报错一：AttributeError: module ‘scipy’ has no attribute 'misc’

Traceback (most recent call last):
  File "srgan.py", line 273, in <module>
    gan.train(epochs=1, batch_size=1, sample_interval=50)
  File "srgan.py", line 202, in train
    imgs_hr, imgs_lr = self.data_loader.load_data(batch_size)
  File "/home/tensor/jupyter/xmq/HCL2000-1000/Keras-GAN/srgan/data_loader.py", line 21, in load_data
    img = self.imread(img_path)
  File "/home/tensor/jupyter/xmq/HCL2000-1000/Keras-GAN/srgan/data_loader.py", line 44, in imread
    return scipy.misc.imread(path, mode='RGB').astype(np.float)
AttributeError: module 'scipy' has no attribute 'misc'

解决办法: pip install scipy==1.0.0
问题解决（原因：scipy版本过高）

Code报错二：Discrepancy between trainable weights and collected trainable

/home/tensor/anaconda2/envs/tensorflow/lib/python3.6/site-packages/keras/engine/training.py:490: UserWarning: Discrepancy between trainable weights and collected trainable weights, did you set `model.trainable` without calling `model.compile` after ? 'Discrepancy between trainable weights and collected trainable'

解决办法: 需要区分不同的model
keras.compile()和keras.trainable()容易混淆，要把model区分开来；修改后的代码为：

	# Build and compile the discriminator
	base_discriminator = self.build_discriminator()
	#self.discriminator = self.build_discriminator()
	self.discriminator = Model(inputs=base_discriminator.inputs, outputs=base_discriminator.outputs)
	self.discriminator.compile(loss='mse', optimizer=optimizer, metrics=['accuracy'])
	
	# Build the generator
	base_generator = self.build_generator()
	#self.generator = self.build_generator()
	self.generator = Model(inputs=base_generator.inputs, outputs=base_generator.outputs)
	
	# High res. and low res. images
	img_hr = Input(shape=self.hr_shape)
	img_lr = Input(shape=self.lr_shape)
	
	# Generate high res. version from low res.
	fake_hr = self.generator(img_lr)
	
	# Extract image features of the generated img
	fake_features = self.vgg(fake_hr)
	
	# For the combined model we will only train the generator
	#self.discriminator.trainable = False
	frozen_D = Model(inputs=base_discriminator.inputs, outputs=base_discriminator.outputs)
	frozen_D.trainable = False
	
	# Discriminator determines validity of generated high res. images
	validity = frozen_D(fake_hr)
	
	self.combined = Model([img_lr, img_hr], [validity, fake_features])
	self.combined.compile(loss=['binary_crossentropy', 'mse'], loss_weights=[1e-3, 1], optimizer=optimizer)

8、最后的Conclusion

在SRResNet的基础上，和GAN网络结合，提出了SRGAN的算法网络，并且设计了新的损失函数，增加了内容损失和对抗损失，以解决超分问题中如何恢复高频信息。在超分的评价指标上，仍以PSNR和SSIM评价指标为中心，但是加入MOS评价指标，在超分问题上取得了较好的效果。顺便提一句，在2018年ECCV的PIRM workshop上，ESRGAN被提出，我们也会在后续的博客中详细分享增强版的ESRGAN。

从0到1解析微信推客小程序源码与实现指南开发加微信：hedian116 微信小程序架构
一、什么是微信推客小程序微信推客小程序是一种基于微信生态系统的社交电商工具，它允许用户通过分享商品链接或小程序页面来推广商品，并在交易成功后获得相应佣金。这类小程序通常包含商品展示、分享功能、订单跟踪和佣金结算等核心模块。二、推客小程序的核心功能模块用户系统：微信授权登录用户身份识别（普通用户/推客）个人信息管理商品展示模块：商品分类浏览商品详情页搜索功能推广功能：生成专属推广链接分享到微信好友/
Rust 开发环境搭建与插件 pumpkin84514 rust rust 开发语言后端
生成完整文章用户请求写一篇完整的CSDN文章，要求根据之前的建议生成。文章要包含结构清晰、标题、代码示例、常见提示、跨平台Rust工具链安装差异等内容。文章需准确，包括插件和使用提示，CLI程序示例等。主要内容包括：介绍、Rust工具链安装（Windows/macOS/Linux差异）、VSCode安装与扩展列表、扩展细节与使用、开发者常见提示（如rust-analyzer功能、crate使用等）
2023-09-25中原焦点学员李灵芝坚持分享第495天越来越好崔
透过应对问句所进行的重要觉察与练习，将会协助当事人建构对抗与处理困境的希望，动机与觉察，同时也将会帮助当事人离开受害者的位置。而以生存者，应对者的姿态来看待历经生命挑战中的自己。罗马并非一日造成的，问题的产生也并非一日，而就要问题立即消失是不可能的，要学会与问题共处，同时接受生命的限制是一个需要学习以勇气与智慧来承担的历程。自我照顾是人生而具有的本能，在这个过程中要强调自我照顾的能
网页源码保护助手海洋网页在线加密：HTML 源码防复制篡改，密文安全如铜墙铁壁小瑞软件库开源软件软件构建电脑
各位网页开发的大神们！今天给你们介绍个超厉害的东西——海洋网页在线加密，软件下载地址安装包它就是专门给咱网页开发者量身打造的代码保护神器啊！它的核心功能就是给HTML源码加密，能防止别人在咱没同意的情况下复制或者篡改代码内容。咱用户呢，直接把网页源代码复制到软件界面就行，然后它通过自动化加密流程，就能生成一堆谁也看不懂的密文。而且啊，它还支持把密文保存成TXT文件，或者直接嵌入到新网页里。这软件还
从文本到语音：使用 ElevenLabs 和 FFmpeg 实现语音合成与播放曦紫沐语音模型 ffmpeg ElevenLabs 语音合成
摘要在当今的人工智能时代，语音合成技术正变得越来越普及。ElevenLabs是一个强大的语音合成平台，能够生成高质量的语音音频。本文将详细介绍如何结合Python、ElevenLabsAPI和FFmpeg工具集，实现从文本到语音的转换，并通过ffplay播放生成的音频文件。同时，我们将解决常见的问题，如ffplay未找到或音频无法播放等。1.引言随着人工智能技术的发展，语音合成（Text-to-S
开源模型应用落地-全能音频新纪元-Kimi-Audio-7B-Instruct-重塑多模态交互边界开源技术探险家开源模型-实际应用落地开源音视频 AIGC agi
一、前言在AI技术持续突破的2025年，音频交互正从单一任务处理迈向全场景融合的新阶段。4月27日，月之暗面（MoonshotAI）开源的Kimi-Audio-7B-Instruct，以“全能音频通才”之姿，为这一进程树立了里程碑式标杆。这款基于70亿参数架构的模型，首次在单一框架内整合语音识别（ASR）、情感分析（SER）、跨语言对话、语音生成（TTS）等十余项任务，并通过12.5Hz混合标记器
Kimi-Audio：最佳音LLM, 如何免费使用 Kimi-Audio AI 模型？知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 kimi
简介继DeepSeek之后，字节跳动（现名MoonShotAI，又名Kimi）也在生成式人工智能领域加速发展，并发布了自己的音频模型Kimi-Audio，据说是迄今为止最好的音频模型。推荐文章《NvidiaGPU入门教程之02ubuntu安装A100显卡驱动(含8步快速浓缩教程)》权重2，安装A100显卡驱动《本地大模型知识库OpenWebUI系列之如何解决知识库上传文件故障Extractedco
Jetson平台编译Tengine space01 AIoT Jetson 人工智能深度学习计算机视觉
1.Tengine简介Tengine于2017年在GitHub（https://github.com/OAID/Tengine）开源，是OPENAILAB（开放智能）推出的自主知识产权的边缘AI计算框架，致力于解决AIoT产业链碎片化问题，加速AI产业化落地。Tengine兼容多种操作系统和深度学习算法框架，简化和加速面向场景的AI算法在嵌入式边缘设备上快速迁移，以及实际应用部署落地，可以十倍提升
函数对象 tal0n
函数对象是STL库提供的除了迭代器，迭代器配接器以外的另外一种概念。简单来说：函数对象提供了一种方法，将要调用的函数与准备传递给这个函数的隐藏参数捆绑在一起。即：该对象实现了operator()的同时还提供了部分执行时的上下文环境。下面我们通过例子来详细看下函数对象。例子STL中有一个find_if的算法实现，他的参数包括：一组表示范围的迭代器，一个用于生成bool类型值的判断式。例如我们需要在一
spring中spring-boot-configuration-processor的使用七七&556 面试学习路线阿里巴巴 spring java 后端
spring-boot-configuration-processor是SpringBoot提供的注解处理器，用于在编译阶段生成配置元数据文件（spring-configuration-metadata.json），从而优化开发体验。以下是其核心功能和使用指南：一、核心功能IDE智能提示为自定义的配置类（使用@ConfigurationProperties）生成元数据，使得在application
机器人-组成结构-感知 - 决策 - 执行具身智能-查布嘎具身智能机器人人工智能
目录一、感知系统内部传感器：外部传感器：二、智能决策系统机器学习家族1.1机器学习2.1深度学习2.2深度学习模型(主要属于监督/强化学习范畴，但结构通用)：3.1监督学习3.2监督学习模型4.1半监督学习4.2无/半监督学习模型：5.1无监督学习5.2生成模型(可属于监督/无监督)：6.1强化学习7.1其他学习三、控制系统（运控）①对应小脑和脊柱一、感知系统①对应人体的五官。由具有不同功能的各种
深度学习篇---矩阵 Atticus-Orion 嵌入式知识篇上位机知识篇嵌入式硬件篇深度学习矩阵人工智能
在机械臂解算、深度学习网络等硬件和软件领域中，矩阵运算作为核心数学工具，承担着数据表示、变换、映射和优化的关键作用。以下从具体领域出发，详细总结涉及的矩阵运算及对应的核心知识：一、机械臂解算领域机械臂解算（运动学、动力学分析）的核心是描述“关节空间”与“操作空间”的映射关系，矩阵运算用于精准刻画坐标系转换、运动传递和力/力矩分析。1.运动学解算（正/逆运动学）核心目标：通过矩阵描述关节角度与末端执
飞算JavaAI：力臻开发之本真，破 AI 代码之繁琐，传统项目一键生成微学AI 人工智能 java javaAI
飞算JavaAI：力臻开发之本真，破AI代码之繁琐，传统项目一键生成文章目录飞算JavaAI：力臻开发之本真，破AI代码之繁琐，传统项目一键生成一、前言二、飞算JavaAI是什么？2.1背景与实力2.2飞算JavaAI的“独门绝技”三、飞算JavaAI实战体验3.1IDEA插件安装配置3.2Main中写一个简单的梯度下降算法3.3main函数搭建一个卷积神经网络网络3.4飞算JavaAI：需求分析
.NET CORE 分布式事务(四) CAP实现最终一致性精神小伙就是猛 .netcore 分布式架构微服务
目录引言：1.0最终一致性介绍2.0CAP2.0架构预览3.0.NETCORE结合CAP实现最终一致性分布式事务3.1准备工作(数据库，本文使用的是MySql)3.1.1数据模型3.1.2DbContext3.1.3数据库最终生成3.2Nuget引入3.3appsettings.json3.4docker启动一个RabbitMQ3.5Program.cs3.6用户1API控制器3.7用户2API控
22.05.07 追风的女青年
一个知识越贫乏的人，越是拥有一种莫名奇怪的勇气和一种莫名奇怪的自豪感。因为知识越贫乏，你所相信的东西就越绝对，因为你根本没有听过与此相对立的观点。夜郎自大是无知者，和好辩者的天性。——罗翔大部分的生活都乏味得不值一提，哪个年龄段都乏味。换另一种牌子的香烟也好，搬到一个新地方去住也好，订阅别的报纸也好，坠入爱河又脱身也好，我们一直在以或轻浮或深沉的方式，对抗日常生活那无法稀释的乏味。——杜鲁门·卡波
AWS Certified Cloud Practitioner 认证考试测试题与解析 DEMI0815 AWS aws 大数据云计算
AWSCertifiedCloudPractitioner认证考试测试题与解析SecurityandCompliance（安全性与合规性）TechnologyCloudConcepts（云概念）BillingandPricing（计费与定价）SecurityandCompliance（安全性与合规性）1:Whichofthefollowingisarecommendedwaytoprovidepr
Python深度学习实践：LSTM与GRU在序列数据预测中的应用 AI智能应用 Python入门实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
Python深度学习实践：LSTM与GRU在序列数据预测中的应用作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来序列数据预测是机器学习领域的一个重要研究方向，涉及时间序列分析、自然语言处理、语音识别等多个领域。序列数据具有时间依赖性，即序列中每个元素都受到前面元素的影响。传统的机器学习算法难以捕捉这种时间依赖性，而深度学习
2022-08-28 色空世界
细胞离子通道（IonChannel）的作用离子通道是信息在细胞之间传递的工具。离子通道就是可以让带电离子通过的通道。以通道调控方式来区别，则可以分成“配体门控性离子通道”（Ligand-gatedIonChannel）和“电压门控性离子通道”（Voltage-gatedIonChannel）。离子移动的驱动力是电位差。细胞可以通过消耗能量把带电离子主动运送到离子通道的另一端，然后让细胞膜内外的带电
[NIPST AI]对抗性机器学习攻击和缓解的分类和术语 Anooyman 人工智能网络安全人工智能大语言模型网络安全安全
原文link：https://nvlpubs.nist.gov/nistpubs/ai/NIST.AI.100-2e2025.pdfIntroduction人工智能（AI）系统在过去几年中持续全球扩展。这些系统正在被众多国家开发并广泛部署于各自的经济体系中，人们在生活的许多领域都获得了更多使用AI系统的机会。本报告区分了两大类AI系统：预测型AI（PredictiveAI，PredAI）和生成型A
Baumer工业相机堡盟工业相机如何通过YoloV8深度学习模型实现打架检测（C#代码，UI界面版）格林威工业相机机器视觉数码相机 YOLO 深度学习计算机视觉人工智能
Baumer工业相机堡盟工业相机如何通过YoloV8深度学习模型实现打架检测（C#代码，UI界面版）工业相机使用YoloV8模型实现打架检测工业相机通过YoloV8模型实现打架检测的技术背景在相机SDK中获取图像转换图像的代码分析工业相机图像转换Bitmap图像格式和Mat图像重要核心代码本地文件图像转换Bitmap图像格式和Mat图像重要核心代码Mat图像导入YoloV8模型重要核心代码代码实现
Baumer工业相机堡盟工业相机如何通过YoloV8深度学习模型实现人脸识别检测（C#代码，UI界面版）格林威机器视觉工业相机数码相机 YOLO 深度学习人工智能视觉检测 c#
Baumer工业相机堡盟工业相机如何通过YoloV8深度学习模型实现人脸识别检测（C#代码，UI界面版）工业相机使用YoloV8模型实现人脸的检测工业相机通过YoloV8模型实现人脸识别检测的技术背景在相机SDK中获取图像转换图像的代码分析工业相机图像转换Bitmap图像格式和Mat图像重要核心代码本地文件图像转换Bitmap图像格式和Mat图像重要核心代码Mat图像导入YoloV8模型重要核心代
哪里买书好？安然书d
哪里买书好？安然书近日书名A中少/植物大战僵尸2人体漫画-超级病菌大对抗(28元)给孩子的历史人物故事：足智多谋办法多给孩子的历史人物故事：我可以改变世界给孩子的历史人物故事：细节观察我在行A长江/怪物传说·龙和大蛇A社科/林秀穗情绪管理故事书·飞天小魔女2A社科/林秀穗情绪管理故事书·飞天小魔女1A社科/林秀穗情绪管理故事书·飞天小魔女3什么是什么·珍藏版（第2辑）：爬行与两栖动物什么是什么·珍
Baumer工业相机堡盟工业相机如何通过YoloV8深度学习模型实现人物识别（C#代码，UI界面版）格林威工业相机机器视觉数码相机 YOLO c#人工智能计算机视觉开发语言
Baumer工业相机堡盟工业相机如何通过YoloV8深度学习模型实现人物识别（C#代码，UI界面版）工业相机使用YoloV8模型实现人物识别工业相机实现YoloV8模型实现人物识别的技术背景在相机SDK中获取图像转换图像的代码分析工业相机图像转换Bitmap图像格式和Mat图像重要核心代码本地文件图像转换Bitmap图像格式和Mat图像重要核心代码Mat图像导入YoloV8模型重要核心代码代码实现
用AI“看病”，靠谱吗？｜聊聊如何用Python生成个性化健康建议 Echo_Wish 前沿技术人工智能人工智能 python 开发语言
用AI“看病”，靠谱吗？｜聊聊如何用Python生成个性化健康建议说实话，健康这事儿，谁不关心？可问题是，现代人越来越不想“看病”，倒不是说我们不在乎身体，而是——太麻烦、太贵、太笼统！你可能遇到过这种情况：明明每天健身，还被体检报告说“轻度脂肪肝”；营养均衡，但血糖还是偏高；去医院，医生说“少吃多动”，这谁听了不头疼？问题就出在一个词上：“个性化”。好消息是，AI已经可以提供定制化的健康建议了，
人脸检测算法——SCRFD 海绵波波107 #计算机视觉算法计算机视觉
SCRFD算法核心解析1.算法定义与背景SCRFD（SampleandComputationRedistributionforEfficientFaceDetection）由JiaGuo等人于2021年在arXiv提出，是一种高效、高精度的人脸检测算法，其核心创新在于：双重重分配策略：样本重分配（SR）：动态增强关键训练阶段的样本数据。计算重分配（CR）：通过神经架构搜索（NAS）优化骨干网络（B
AI编程实战：Cursor避坑指南与高效提示词设计孟柯coding 人工智能机器学习 AIGC
1.简介在AI迅猛发展的时代，掌握利用AI工具提升工作效率，已成为一项必备技能。无论是借助AICoding辅助编程，还是使用Coze或Dify搭建专属知识库问答助手，AI都能让我们事半功倍。当然，AI生成内容有时会存在“幻觉”，切勿完全轻信其输出，关键信息务必自行核查验证后再投入使用。本文将以我在使用Cursor进行开发时遇到的实际问题为例，分享相应的处理思路与解决方案，并同步提供开发用户模块所使
Baumer工业相机堡盟工业相机如何通过YoloV8深度学习模型实现动物分类（C#源码，UI界面版）格林威机器视觉工业相机数码相机 YOLO 深度学习计算机视觉人工智能视觉检测 c#
Baumer工业相机堡盟工业相机如何通过YoloV8深度学习模型实现动物分类（C#源码，UI界面版））工业相机使用YoloV8模型实现动物分类工业相机实现YoloV8模型实现动物分类的技术背景在相机SDK中获取图像转换图像的代码分析工业相机图像转换Bitmap图像格式和Mat图像重要核心代码本地文件图像转换Bitmap图像格式和Mat图像重要核心代码Mat图像导入YoloV8模型重要核心代码代码实
实用:python中的语法糖 Monkey_24 python Python学习记录语法糖 python if else yield from for in
案例一:for循环:foriin[1,2,3]:print(i)等价于:foriin[1,2,3]:print(i)案例二:yield生成器:foriin(lambdan:(yieldfromrange(n)))(3):print(i)等价于:deffn(n):foriinrange(n):yieldigt=fn(3)foriingt:print(i)案例三:ifelse判断(lambdan:pr
【工具篇】【从冷笑话到职场革命：Manus 100 问挑战人类认知极限】再见孙悟空_ AI 进阶之旅》【2025 AI工具合集】【2025 AI学习从零单排系列】Manus AI Manus manus邀请码 manus体验 Manus PPT Manus 对比 DeepSeek
一、基础认知篇1.Manus到底是什么？它是全球首款通用型AI智能体，简单来说就是能独立完成任务的数字助手。比如你让它分析股票，它不仅能给出报告，还能自动调用Python生成图表，甚至在你睡觉的时候还能在云端继续工作。2.名字“Manus”有什么含义？来自拉丁语“MensetManus”，直译是“心智与手”。官方解释是希望它既能思考又能行动，把人类的想法变成现实，就像有个AI助手帮你干活。3.谁开
致经典 ⑯ ﹝西施壶﹞丨我们都值得被这个世界温柔对待守一集雅_孔小乐
西施壶原创手绘人心就像一座神奇的堡垒，看似坚不可摧，内里却无比柔软。我们百炼成钢，说到底竟是抵抗一场一个人的战役，在与现实达成妥协的那一刻，其实每个人的内心都还空缺着一个柔软的角落，那个最柔软的自己，最渴望得到这个世界温柔的对待。生活有一种一视同仁的残酷，那就是你注定只是沧海一粟，每个人都是造物主精心制作的艺术品，你所有的对抗与不羁在上天睥睨的视线中竟是那么稚幼可怜。然而，世界也像一面镜子，我们如
关于旗正规则引擎规则中的上传和下载问题何必如此文件下载压缩 jsp 文件上传
文件的上传下载都是数据流的输入输出，大致流程都是一样的。一、文件打包下载 1.文件写入压缩包 string mainPath="D:\upload\"; 下载路径 string tmpfileName=jar.zip; &n
【Spark九十九】Spark Streaming的batch interval时间内的数据流转源码分析 bit1129 Stream
以如下代码为例（SocketInputDStream）： Spark Streaming从Socket读取数据的代码是在SocketReceiver的receive方法中，撇开异常情况不谈(Receiver有重连机制，restart方法，默认情况下在Receiver挂了之后，间隔两秒钟重新建立Socket连接)，读取到的数据通过调用store(textRead)方法进行存储。数据
spark master web ui 端口8080被占用解决方法 daizj 8080 端口占用 spark master web ui
spark master web ui 默认端口为8080，当系统有其它程序也在使用该接口时，启动master时也不会报错，spark自己会改用其它端口，自动端口号加1，但为了可以控制到指定的端口，我们可以自行设置，修改方法： 1、cd SPARK_HOME/sbin 2、vi start-master.sh 3、定位到下面部分
oracle_执行计划_谓词信息和数据获取周凡杨 oracle 执行计划
oracle_执行计划_谓词信息和数据获取(上) 一：简要说明在查看执行计划的信息中，经常会看到两个谓词filter和access，它们的区别是什么，理解了这两个词对我们解读Oracle的执行计划信息会有所帮助。简单说，执行计划如果显示是access，就表示这个谓词条件的值将会影响数据的访问路径（表还是索引），而filter表示谓词条件的值并不会影响数据访问路径，只起到
spring中datasource配置 g21121 dataSource
datasource配置有很多种，我介绍的一种是采用c3p0的，它的百科地址是： http://baike.baidu.com/view/920062.htm  <bean name="propertiesConfig" class="org.springframework.b
web报表工具FineReport使用中遇到的常见报错及解决办法（三）老A不折腾 finereport FAQ 报表软件
这里写点抛砖引玉，希望大家能把自己整理的问题及解决方法晾出来，Mark一下，利人利己。出现问题先搜一下文档上有没有，再看看度娘有没有，再看看论坛有没有。有报错要看日志。下面简单罗列下常见的问题，大多文档上都有提到的。 1、repeated column width is largerthan paper width：这个看这段话应该是很好理解的。比如做的模板页面宽度只能放
mysql 用户管理墙头上一根草 linux mysql user
1.新建用户 //登录MYSQL@>mysql -u root -p@>密码//创建用户mysql> insert into mysql.user(Host,User,Password) values(‘localhost’,'jeecn’,password(‘jeecn’));//刷新系统权限表mysql>flush privileges;这样就创建了一个名为：
关于使用Spring导致c3p0数据库死锁问题 aijuans spring Spring 入门 Spring 实例 Spring3 Spring 教程
这个问题我实在是为整个 springsource 的员工蒙羞如果大家使用 spring 控制事务，使用 Open Session In View 模式， com.mchange.v2.resourcepool.TimeoutException: A client timed out while waiting to acquire a resource from com.mchange.
百度词库联想 annan211 百度
<!DOCTYPE html> <html> <head> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8"> <title>RunJS</title&g
int数据与byte之间的相互转换实现代码百合不是茶位移 int转byte byte转int 基本数据类型的实现
在BMP文件和文件压缩时需要用到的int与byte转换,现将理解的贴出来; 主要是要理解;位移等概念 http://baihe747.iteye.com/blog/2078029 int转byte; byte转int; /** * 字节转成int,int转成字节 * @author Administrator *
简单模拟实现数据库连接池 bijian1013 java thread java多线程简单模拟实现数据库连接池
简单模拟实现数据库连接池实例1： package com.bijian.thread; public class DB { //private static final int MAX_COUNT = 10; private static final DB instance = new DB(); private int count = 0; private i
一种基于Weblogic容器的鉴权设计 bijian1013 java weblogic
服务器对请求的鉴权可以在请求头中加Authorization之类的key，将用户名、密码保存到此key对应的value中，当然对于用户名、密码这种高机密的信息，应该对其进行加砂加密等，最简单的方法如下： String vuser_id = "weblogic"; String vuse
【RPC框架Hessian二】Hessian 对象序列化和反序列化 bit1129 hessian
任何一个对象从一个JVM传输到另一个JVM，都要经过序列化为二进制数据(或者字符串等其他格式，比如JSON)，然后在反序列化为Java对象，这最后都是通过二进制的数据在不同的JVM之间传输(一般是通过Socket和二进制的数据传输)，本文定义一个比较符合工作中。 1. 定义三个POJO Person类 package com.tom.hes
【Hadoop十四】Hadoop提供的脚本的功能 bit1129 hadoop
1. hadoop-daemon.sh 1.1 启动HDFS ./hadoop-daemon.sh start namenode ./hadoop-daemon.sh start datanode 通过这种逐步启动的方式，比start-all.sh方式少了一个SecondaryNameNode进程，这不影响Hadoop的使用，其实在 Hadoop2.0中，SecondaryNa
中国互联网走在“灰度”上 ronin47 管理灰度
中国互联网走在“灰度”上（转）文/孕峰第一次听说灰度这个词，是任正非说新型管理者所需要的素质。第二次听说是来自马化腾。似乎其他人包括马云也用不同的语言说过类似的意思。灰度这个词所包含的意义和视野是广远的。要理解这个词，可能同样要用“灰度”的心态。灰度的反面，是规规矩矩，清清楚楚，泾渭分明，严谨条理，是决不妥协，不转弯，认死理。黑白分明不是灰度，像彩虹那样
java-51-输入一个矩阵，按照从外向里以顺时针的顺序依次打印出每一个数字。 bylijinnan java
public class PrintMatrixClockwisely { /** * Q51.输入一个矩阵，按照从外向里以顺时针的顺序依次打印出每一个数字。例如：如果输入如下矩阵： 1 2 3 4 5 6 7 8 9
mongoDB 用户管理开窍的石头 mongoDB用户管理
1:添加用户第一次设置用户需要进入admin数据库下设置超级用户（use admin） db.addUsr({user:'useName',pwd:'111111',roles:[readWrite,dbAdmin]}); 第一个参数用户的名字第二个参数
[游戏与生活]玩暗黑破坏神3的一些问题 comsci 生活
暗黑破坏神3是有史以来最让人激动的游戏。。。。但是有几个问题需要我们注意玩这个游戏的时间，每天不要超过一个小时，且每次玩游戏最好在白天结束游戏之后，最好在太阳下面来晒一下身上的暗黑气息，让自己恢复人的生气 &nb
java 二维数组如何存入数据库 cuiyadll java
using System; using System.Linq; using System.Text; using System.Windows.Forms; using System.Xml; using System.Xml.Serialization; using System.IO; namespace WindowsFormsApplication1 {
本地事务和全局事务Local Transaction and Global Transaction(JTA) darrenzhu java spring local global transaction
Configuring Spring and JTA without full Java EE http://spring.io/blog/2011/08/15/configuring-spring-and-jta-without-full-java-ee/ Spring doc -Transaction Management http://docs.spring.io/spri
Linux命令之alias - 设置命令的别名，让 Linux 命令更简练 dcj3sjt126com linux alias
用途说明设置命令的别名。在linux系统中如果命令太长又不符合用户的习惯，那么我们可以为它指定一个别名。虽然可以为命令建立“链接”解决长文件名的问题，但对于带命令行参数的命令，链接就无能为力了。而指定别名则可以解决此类所有问题【1】。常用别名来简化ssh登录【见示例三】，使长命令变短，使常用的长命令行变短，强制执行命令时询问等。常用参数格式：alias 格式：ali
yii2 restful web服务[格式响应] dcj3sjt126com PHP yii2
响应格式当处理一个 RESTful API 请求时，一个应用程序通常需要如下步骤来处理响应格式：确定可能影响响应格式的各种因素，例如媒介类型，语言，版本，等等。这个过程也被称为 content negotiation。资源对象转换为数组，如在 Resources 部分中所描述的。通过 [[yii\rest\Serializer]]
MongoDB索引调优（2）——[十] eksliang mongodb MongoDB索引优化
转载请出自出处：http://eksliang.iteye.com/blog/2178555 一、概述上一篇文档中也说明了，MongoDB的索引几乎与关系型数据库的索引一模一样，优化关系型数据库的技巧通用适合MongoDB，所有这里只讲MongoDB需要注意的地方二、索引内嵌文档可以在嵌套文档的键上建立索引，方式与正常
当滑动到顶部和底部时，实现Item的分离效果的ListView gundumw100 android
拉动ListView，Item之间的间距会变大，释放后恢复原样； package cn.tangdada.tangbang.widget; import android.annotation.TargetApi; import android.content.Context; import android.content.res.TypedArray; import andr
程序员用HTML5制作的爱心树表白动画 ini JavaScript jquery Web html5 css
体验效果：http://keleyi.com/keleyi/phtml/html5/31.htmHTML代码如下： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"><head><meta charset="UTF-8" > <ti
预装windows 8 系统GPT模式的ThinkPad T440改装64位 windows 7旗舰版 kakajw ThinkPad 预装改装 windows 7 windows 8
该教程具有普遍参考性，特别适用于联想的机器，其他品牌机器的处理过程也大同小异。该教程是个人多次尝试和总结的结果，实用性强，推荐给需要的人！缘由小弟最近入手笔记本ThinkPad T440，但是特别不能习惯笔记本出厂预装的Windows 8系统，而且厂商自作聪明地预装了一堆没用的应用软件，消耗不少的系统资源（本本的内存为4G，系统启动完成时，物理内存占用比
Nginx学习笔记 mcj8089 nginx
一、安装nginx 1、在nginx官方网站下载一个包，下载地址是： http://nginx.org/download/nginx-1.4.2.tar.gz 2、WinSCP(ftp上传工
mongodb 聚合查询每天论坛链接点击次数 qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
/* 18 */ { "_id" : ObjectId("5596414cbe4d73a327e50274"), "msgType" : "text", "sendTime" : ISODate("2015-07-03T08:01:16.000Z"
java术语（PO/POJO/VO/BO/DAO/DTO） Luob. DAO POJO DTO po VO BO
PO(persistant object) 持久对象在o/r 映射的时候出现的概念,如果没有o/r映射,就没有这个概念存在了.通常对应数据模型(数据库),本身还有部分业务逻辑的处理.可以看成是与数据库中的表相映射的java对象.最简单的PO就是对应数据库中某个表中的一条记录,多个记录可以用PO的集合.PO中应该不包含任何对数据库的操作. VO(value object) 值对象通
算法复杂度 Wuaner Algorithm
Time Complexity & Big-O： http://stackoverflow.com/questions/487258/plain-english-explanation-of-big-o http://bigocheatsheet.com/ http://www.sitepoint.com/time-complexity-algorithms/