HaiLang_IT

毕业设计-机器学习图像卡通动漫化图像风格迁移

前言

大四是整个大学期间最忙碌的时光,一边要忙着备考或实习为毕业后面临的就业升学做准备,一边要为毕业设计耗费大量精力。近几年各个学校要求的毕设项目越来越难,有不少课题是研究生级别难度的,对本科同学来说是充满挑战。为帮助大家顺利通过和节省时间与精力投入到更重要的就业和考试中去,学长分享优质的选题经验和毕设项目与技术思路。

对毕设有任何疑问都可以问学长哦!

本次分享的课题是

机器学习图像卡通动漫化图像风格迁移

课题背景和意义

人工智能技术，不仅在常规领域能够大放异彩，在一些神奇的领域也会得到意想不到的“妙用”。4月初，就有谷歌利用深度学习探索如何区分日本拉面连锁店中的1170份拉面，并取得了95%的识别度。

如果将这样的技术运用至二次元，又将会有怎样的火花。对于身居重度宅属性但又手残不会画画的二次元来说，有了机器学习，不仅能够AI下棋、开车、吟诗作对，还能将人脸转化成漫画风格的图片。次元壁内的人轻松转化属性，而壁外的小伙伴也可以一窥究竟。本文将介绍如何通过科学的触角，轻叩次元壁，让AI把现实中的人脸转换成漫画风格的图片？

实现技术思路

1 图像风格迁移基础

1.1 图像风格化

首先我们来看图像风格化，所谓风格化的重点就在于风格，它一定不是普通的图片，而是对普通图片进行处理后，得到的拥有特殊风格的作品，以Photoshop软件为例，很早就内置了非常多的滤镜风格，可以分为两大类。

第一类是基于基于边缘的风格化，可以突出轮廓，创建出特殊的效果，如下图1。

图1 PS的边缘风格

上图展示了Photoshop中几种常见的基于边缘的风格化效果，从左到右分别是原图，查找边缘，等高线，浮雕效果，虽然各自效果有所不同，但是其中最核心的技术仍然是寻找到主体的边缘。为了实现以上的风格，首先要检测到主体边缘，可以使用传统的边缘检测方法，如Sobel、Canny检测算子，也可以采用深度学习方法进行检测。

第二类风格就是基于颜色的风格化，它通过更改像素值或者像素的分布，可以创造出特殊的风格，如油画、波纹，下图2从左到右分别是原图，波纹，凸出，油画效果。

图2 PS的颜色风格

以上的风格化，基于特定的图像算法规则，模式固定，只能处理特定数量的风格。而随着深度学习技术的发展，基于深度学习的风格化方法被广泛研究并且取得了非常好的效果，开启了一个新的研究领域，风格迁移。

1.2 风格迁移

风格迁移的重点在于迁移，它是将一幅图中的风格，迁移到另一幅图中。2015年德国图宾根大学科学家在论文《A Neural Algorithm of Artistic Style》[1]中提出了使用深层卷积神经网络进行训练，创造出了具有高质量艺术风格的作品。

该网络将一幅图作为内容图，从另外一幅画中抽取艺术风格，两者一起合成新的艺术画，从而使得神经网络风格迁移领域（ Neural Style Transfer）诞生。

图3 Neural Style Transfer

图3中A图就是内容图，B图左下角就是风格图，B图大图就是融合了A图的内容和风格图的风格，从而可以实现任意风格的迁移，不必局限于特定的算法，下图4展示了一些案例，每一种风格都有着独特的美感，主体和背景的处理都非常好。

图4 多种Neural Style Transfer风格

1.3 风格迁移算法原理

生物学家证明了人脑处理信息具有不同的抽象层次，人的眼睛看事物可以根据尺度调节抽象层次，当仔细在近处观察一幅图时，抽象层次越低，我们看到的是清晰的纹理，而在远处观察时则看到的是大致的轮廓。实际上卷积神经网络就是实现和证明了这样的分层机制的合理性。将各个神经元看做是一个图像滤波器，输出层就是由输入图像的不同滤波器的组合，网络由浅到深，内容越来越抽象。

研究者基于此特点提出图片可以由内容层(content)与风格层(style)两个图层描述，内容层描述图像的整体信息，风格层描述图像的细节信息。

所谓内容，指得是图像的语义信息，即图里包含的目标及其位置，它属于图像中较为底层的信息，可以使用灰度值，目标轮廓等进行描述。

而风格，则指代笔触，颜色等信息，是更加抽象和高层的信息。

图像风格可以用数学式子来描述，其中常用的是格拉姆矩阵(Gram Matrix)，它的定义为n维欧氏空间中任意k个向量的内积所组成的矩阵，如下：

基于图像特征的Gram矩阵计算方法如下：

Glij向量化后的第l个网络层的特征图i和特征图j的内积，k即向量的长度。

格拉姆矩阵可以看做特征之间的偏心协方差矩阵，即没有减去均值的协方差矩阵。内积之后得到的矩阵的对角线元素包含了不同的特征，而其他元素则包含了不同特征之间的相关信息。因此格拉姆矩阵可以反应整个图像的风格，如果我们要度量两个图像风格的差异，只需比较他们Gram Matrix的差异即可。

假设我们有两张图，一张是欲模仿的风格图s，一张是内容图c，想要生成图x，风格迁移转换成数学问题，就是最小化下面这个函数。

因此当我们要实现一个滤镜算法时，只需要提取风格图的风格，提取要使用滤镜的图的内容，然后合并成最终的效果图。

基于图像的风格迁移算法

基于图像优化的方法是在图像像素空间做梯度下降来最小化目标函数，以Gary等人提出的经典算法[1]为例，下图5是该算法的原理图。

图5 Neural Style Transfer算法原理

图中包含了2个输入通道，分别用于进行内容重建(Content construction)和风格重建(Style construction)。

(1) 内容重建通道。选择某一个抽象级别较高的特征层计算内容损失，它的主要目标是保留图像主体的内容和位置，损失计算如下，使用了特征的欧式距离，Fijl和Pijl分别是第l层生成图和内容图的特征值。

内容重建之所以不使用多尺度，是因为内容图本身只需要维持可识别的内容信息，多尺度不仅会增加计算量，还引入噪声，抽象层次较低的低尺度关注了像素的局部信息，可能导致最终渲染的结果不够平滑。

(2) 风格重建通道。与内容重建不同，CNN从底层到高层的每一层都会对风格有贡献，因为风格采用格拉姆矩阵进行表述，所以损失也是基于该矩阵计算，每一层加权相加，第l层的损失定义如下。

整个的风格损失函数就是各层相加，

风格重建使用多尺度不仅有利于模型的收敛，而且兼顾了局部的纹理结构细节和整体的色彩风格。

图6 Neural Style Transfer算法优化

当然最原始的迁移算法也存在着一些固有的缺陷，包括无法保持目标的颜色，纹理比较粗糙，无法识别语义内容导致目标风格不完整，或者出现错乱，比如将天空的风格迁移到大地等，后续的研究者们对其提出了许多的改进，其中最具有代表性的是Adobe公司[2]的真实场景风格转换，它们只迁移图像的颜色而不改变纹理，作者称之为照片风格迁移(photo style transfer)。

目前风格迁移主要有两大类方法，基于图像优化的风格迁移算法和基于模型优化的风格迁移算法。

基于模型优化的风格迁移算法

基于图像优化的方法由于每个重建结果都需要在像素空间进行迭代优化，这种方式无法实时，因此研究人员开始研究更加高效的方法，即基于模型优化的方法，它的特点是首先使用数据集对某一种风格的图进行训练得到一个风格化模型，然后在使用的时候只需要将输入图经过一次前向传播就可以得到结果图，根据模型与风格数量可以分为许多方向，下面分别介绍。

3.1 单模型单风格及其改进

Justin Johnson等人提出的方法[3]是一个典型的单模型单风格框架，通过图像转换层(Image Transform Net)来完成整个的渲染过程，在损失网络(VGG16 Loss Network)的约束下，分别学习内容和风格。该模型用于训练的风格图数据集必须属于同一种风格，而内容图则可以任意选择。

与基于图像优化的方法相比，基于模型优化的方法不需要反复地迭代，速度快了两三个数量级，下图8所示是它的模型结构。

图8 基于模型的风格化

这个模型可以分为两部分，Image Transform Net是图像转换网络，VGG16是损失网络。图像转换网络输入x，输出y，它和风格图ys，内容图yc经过同样的网络，分别计算风格损失和内容损失，注意这里的yc实际上就是输入图x。

内容损失采用的是感知损失，风格损失与基于图像优化的方法一样采用Gram矩阵来定义，都已经介绍过许多次了，就不再赘述。

3.2 单模型多风格

单模型单风格对于每一种风格都必须重新训练模型，这大大限制了它们的实用性，因此研究人员很快便开始研究单模型多风格框架。Style bank[4]是其中的一个典型代表，它使用了一个滤波器组来代表多个风格，原理如下图9：

图9 Style bank框架

从图可以看出，输入图I首先输入一个编码器得到特征图，然后和StyleBank相互作用。StyleBank包括n个并行的滤波器组，分别对应n个不同的风格。每一个滤波器组中的每一个通道可以被看作是某一种风格元素，比如纹理类型，笔触类型。

模型总共包含两个分支，第一个是从编码器到解码器，它要求重建的图像O和输入图像I在内容上一致，因此采用的损失函数就是逐个像素的均方误差损失。

另一个分支是从编码器到风格化滤波器到解码器，它要求对于不同的风格生成不同的风格输出。对于这一个分支，包括一个内容损失，一个风格损失，以及一个平滑损失, 具体的内容损失和风格损失与Gatys论文中一样。

在具体训练的时候，针对K个不同的风格，首先固定编解码器分支，对风格化分支训练K轮。然后固定风格化分支，对编码器分支训练1轮。

StyleBank方法的特点是：

(1) 多个风格可以共享一个自编码器(Auto-encoder)。

(2) 可以在不更改自编码器(Auto-encoder)的情况下对新的风格进行增量学习。

另外还有的方法通过学习实例归一化(Instance Normalization)后的仿射变换系数的方法[5]来控制不同风格的图像，实例归一化表达式如下：

取对应某风格的缩放系数和偏移系数就实现了对应风格的归一化。

图10 Instance Normalization

3.3 单模型任意风格

单模型多风格框架在增加新的风格时总需要重新训练模型，单模型多风格算法可以通过学习实例归一化的仿射变换系数来控制多种风格的转换，研究表明[6]这种仿射参数其实可以由风格图本身的统计信息来替代，用风格图图像的方差和均值分别替代，就可以生成任意风格的图像，该层被称为AdaIN层，其定义如下式。

其中x是内容图，y是风格图，可以看出使用了内容图的均值和方差进行归一化，使用风格图的均值和方差作为偏移量和缩放系数，整个模型原理图如下图。

图11 基于AdaIN的风格迁移

损失包括内容损失和风格损失两部分。内容损失的计算是比较AdaIN层的输出与最终的输出图之间的L2损失，风格损失则使用了VGG不同特征层的均值和方差的L2损失而不是使用基于Gram矩阵的损失，形式更加简单。

3.4 小结

目前AdaIN层已经在图像风格化，图像生成等领域中被广泛应用，属于图像风格迁移的标配技术，单模型任意风格在实际应用中也更加有效。

1.下载预训练的vgg网络，并放入到项目的根目录中,选定风格图片和内容图片

# 内容图片路径
CONTENT_IMAGE = 'images/content.jpg'
# 风格图片路径
STYLE_IMAGE = 'images/style.jpg'
# 输出图片路径
OUTPUT_IMAGE = 'output/output'
# 预训练的vgg模型路径
VGG_MODEL_PATH = 'imagenet-vgg-verydeep-19.mat'
# 图片宽度
IMAGE_WIDTH = 450
# 图片高度
IMAGE_HEIGHT = 300
# 定义计算内容损失的vgg层名称及对应权重的列表
CONTENT_LOSS_LAYERS = [('conv4_2', 0.5),('conv5_2',0.5)]
# 定义计算风格损失的vgg层名称及对应权重的列表
STYLE_LOSS_LAYERS = [('conv1_1', 0.2), ('conv2_1', 0.2), ('conv3_1', 0.2), ('conv4_1', 0.2), ('conv5_1', 0.2)]
# 噪音比率
NOISE = 0.5
# 图片RGB均值
IMAGE_MEAN_VALUE = [128.0, 128.0, 128.0]
# 内容损失权重
ALPHA = 1
# 风格损失权重
BETA = 500
# 训练次数
TRAIN_STEPS = 3000

生成图片

def loss(sess, model):
    """
    定义模型的损失函数
    :param sess: tf session
    :param model: 神经网络模型
    :return: 内容损失和风格损失的加权和损失
    """
    # 先计算内容损失函数
    # 获取定义内容损失的vgg层名称列表及权重
    content_layers = settings.CONTENT_LOSS_LAYERS
    # 将内容图片作为输入，方便后面提取内容图片在各层中的特征矩阵
    sess.run(tf.assign(model.net['input'], model.content))
    # 内容损失累加量
    content_loss = 0.0
    # 逐个取出衡量内容损失的vgg层名称及对应权重
    for layer_name, weight in content_layers:
        # 提取内容图片在layer_name层中的特征矩阵
        p = sess.run(model.net[layer_name])
        # 提取噪音图片在layer_name层中的特征矩阵
        x = model.net[layer_name]
        # 长x宽
        M = p.shape[1] * p.shape[2]
        # 信道数
        N = p.shape[3]
        # 根据公式计算损失，并进行累加
        content_loss += (1.0 / (2 * M * N)) * tf.reduce_sum(tf.pow(p - x, 2)) * weight
    # 将损失对层数取平均
    content_loss /= len(content_layers)

    # 再计算风格损失函数
    style_layers = settings.STYLE_LOSS_LAYERS
    # 将风格图片作为输入，方便后面提取风格图片在各层中的特征矩阵
    sess.run(tf.assign(model.net['input'], model.style))
    # 风格损失累加量
    style_loss = 0.0
    # 逐个取出衡量风格损失的vgg层名称及对应权重
    for layer_name, weight in style_layers:
        # 提取风格图片在layer_name层中的特征矩阵
        a = sess.run(model.net[layer_name])
        # 提取噪音图片在layer_name层中的特征矩阵
        x = model.net[layer_name]
        # 长x宽
        M = a.shape[1] * a.shape[2]
        # 信道数
        N = a.shape[3]
        # 求风格图片特征的gram矩阵
        A = gram(a, M, N)
        # 求噪音图片特征的gram矩阵
        G = gram(x, M, N)
        # 根据公式计算损失，并进行累加
        style_loss += (1.0 / (4 * M * M * N * N)) * tf.reduce_sum(tf.pow(G - A, 2)) * weight
    # 将损失对层数取平均
    style_loss /= len(style_layers)
    # 将内容损失和风格损失加权求和，构成总损失函数
    loss = settings.ALPHA * content_loss + settings.BETA * style_loss

    return loss

实现效果图样例

我是海浪学长,创作不易,欢迎点赞、关注、收藏、留言。

毕设帮助，疑难解答，欢迎打扰！

请问Python怎么安装vlfeat？ cda2024 python 开发语言
在当今数据驱动的时代，图像处理和计算机视觉成为了许多前沿应用的核心技术之一。作为一门强大的编程语言，Python在这些领域中扮演着极其重要的角色。而vlfeat是一个广泛使用的计算机视觉库，它提供了许多经典的计算机视觉算法实现，如SIFT、HOG等。本文将详细介绍如何在Python中安装和使用vlfeat，帮助你在项目中高效地集成这些强大的工具。什么是vlfeat？vlfeat是一个开源的计算机视
对于编程零基础，第一个语言是 Python 的人有什么建议？ cda2024 python 开发语言
在当今数字化时代，编程已成为一项必备技能。无论你是想成为一名专业的软件开发人员，还是希望在数据分析、人工智能等领域有所建树，掌握一门编程语言都是至关重要的第一步。对于许多初学者来说，Python是一个理想的选择。它不仅语法简洁易懂，而且拥有强大的社区支持和丰富的库资源。那么，对于编程零基础且选择Python作为第一门语言的人，有哪些实用的建议呢？1.建立正确的学习心态1.1持之以恒学习编程并不是一
在PyTorch框架上训练ImageNet时，Dataloader加载速度慢怎么解决？ cda2024 pytorch 人工智能 python
在深度学习领域，PyTorch因其灵活性和易用性而受到广泛欢迎。然而，在实际应用中，特别是在处理大规模数据集如ImageNet时，Dataloader的加载速度往往成为瓶颈。本文将深入探讨这一问题，并提供多种解决方案，帮助你在PyTorch框架上高效地训练ImageNet。1.问题背景ImageNet是一个包含超过1400万张图像的大规模数据集，被广泛用于图像分类任务的研究。在PyTorch中，D
深度学习篇---Anaconda&LabelImg Ronin-Lotus 深度学习篇深度学习人工智能学习 python 程序人生机器学习计算机视觉
文章目录前言第一部分：Anaconda是什么？1.简介2.特点（1）包管理器Conda（2）环境管理（3）预装包（4）跨平台（5）社区支持3.安装WindowsLinux3.基本命令（1）conda--version（2）condaupdateconda（3）condacreate--namemyenvpython=3.6（4）condaactivatemyenv（5）condadeactivat
双目视觉之获取三维坐标（立体校正、Q矩阵与三角测量原理）乐平要加油啊 YOLO+双目视觉计算机视觉 opencv
前言双目视觉是一种模拟人类立体视觉的计算机视觉技术，它通过两个相机从不同的角度拍摄同一个场景，然后利用三角测量原理，计算出场景中物体的三维坐标信息。这种技术在机器人导航、自动驾驶、物体跟踪、三维重建等领域有广泛的应用。获取三维坐标是双目视觉的核心任务之一。通过对左右相机拍摄的图像进行特征匹配和视差计算，我们可以得到场景中每个像素点的视差值。视差值表示了同一个物体在左右图像中的位置差异，它与物体距离
xgboost在spark集群使用指南一颗小草333 算法 mapreduce spark 数据挖掘
简介XGBoost是一个优化的分布式梯度增强库，具有高效、灵活和可移植性。在梯度增强框架下实现了机器学习算法。XGBoost提供了一种并行树增强(也称为GBDT、GBM)，可以快速、准确地解决许多数据科学问题。相同的代码在主要的分布式环境(Hadoop、SGE、MPI)上运行，可以解决数十亿个示例的训练问题。xgb相对于gbt所做的改进：1.2.3.XGBoost可以使用R、python、java
【安装cudnn】 Eternal-Student linux linux
官网下载并安装如果打算使用深度学习框架，如TensorFlow或PyTorch，并且需要GPU加速，可能还需要安装NVIDIA的cuDNN库，它是一个GPU加速的深度神经网络库。officialweb:https://developer.nvidia.com/cudnn下载具体：cuDNN9.5.0Downloads历史版本下载：https://developer.nvidia.com/rdp/c
Pytorch深度学习指南卷I --编程基础（A Beginner‘s Guide）第1章一个简单的回归 liuhui244 深度强化学习深度学习 pytorch 回归
本章正式开始使用pytorch的接口来实现对应的numpy的学习的过程，来学习模型的实现，我们会介绍numpy是如何学习的，以及我们如何一步步的通过torch的接口来实现简单化的过程，优雅的展示我们的代码，已经我们的代码完成的事情numpy的线性回归在此之前，先看看现在的numpy实现的学习的过程是什么样的#引入计算模块importnumpyasnpfromsklearn.linear_model
Python 在股票分析中的高级应用：挖掘金融数据的深度洞察三带俩王 python 金融开发语言
在当今的金融世界中，股票分析是投资者和金融从业者必备的技能。Python作为一种强大且灵活的编程语言，为股票分析提供了丰富的工具和技术。本文将深入探讨使用Python进行股票分析的高级用法，涵盖从数据获取与清洗、高级分析指标计算到机器学习和深度学习在股票分析中的应用等多个方面。一、数据获取与预处理：构建坚实的分析基础1.数据来源与获取直接从证券交易所获取数据：许多证券交易所提供了数据接口，例如，上
智能电动汽车 --- 人工智能（AI）入门车载诊断技术思考汽车行业人工智能智能电动汽车的三智和三电开发语言数据结构架构智能电动汽车人工智能（AI）入门
我是穿拖鞋的汉子，魔都中坚持长期主义的汽车电子工程师。老规矩，分享一段喜欢的文字，避免自己成为高知识低文化的工程师：简单，单纯，喜欢独处，独来独往，不易合同频过着接地气的生活，除了生存温饱问题之外，没有什么过多的欲望，表面看起来很高冷，内心热情，如果你身边有这样灵性的人，一定要好好珍惜他们眼中有神有光，干净，给人感觉很舒服，有超强的感知能力有形的无形的感知力很强，能感知人的内心变化喜欢独处，好静，
AI大模型书籍推荐丨这本书必看：大语言模型基础与前沿（附PDF） LLM教程人工智能大模型 LLM 程序员自然语言处理 AI大模型编程
哈喽大家好！很久都没有更新大模型这块的书了，今天给大家说一下这本：《大语言模型：基础与前沿》，本书深入阐述了大语言模型的基本概念和算法、研究前沿以及应用，涵盖大语言模型的广泛主题，从基础到前沿，从方法到应用，涉及从方法论到应用场景方方面面的内容。作者简介熊涛，美国明尼苏达大学双城分校电子与计算机工程博士。曾在多家中美知名高科技公司担任高级管理职位和首席科学家，在人工智能的多个领域，包括大语言模型、
计算机毕业设计之基于PythonBOSS直聘招聘数据可视化系统的设计与实现 wx—bishe58 信息可视化数据分析数据挖掘 rnn 人工智能课程设计 python
本文主要介绍了基于PythonBOSS直聘招聘数据可视化系统的设计与实现。随着互联网的普及，BOSS直聘招聘网站成为了企业和求职者的重要交流平台。然而，大量的招聘信息给用户带来了信息过载的问题。为了解决这一问题，本文提出了一种基于PythonBOSS直聘招聘数据可视化系统的设计与实现方法。首先，本文采用爬虫技术收集了拉勾BOSS直聘招聘网站上的大量招聘信息。然后，利用爬虫优化算法对爬取到的数据进行
我的搬砖工具由 VS Code 变成 Cursor 了老余捞鱼人工智能 AI编程 cursor
作者：老余捞鱼原创不易，转载请标明出处及原作者。写在前面的话：本文介绍了我从VSCode转向Cursor的原因，强调了Cursor的人工智能交互流畅性以及其他一些优于VSCode的特性。VSCode是免费的，而且运行起来非常出色。我一直很喜欢VSCode，不过，它与GitHubCopilot等编码助手扩展的交互并不比使用ChatGPT好多少，而且肯定不如Claude。在寻找其他替代方案时，我偶然发
2024年AI发展的感知回顾八角Z 人工智能机器学习计算机视觉大数据
2024年，人工智能（AI）的发展呈现出诸多引人注目的关键词，深刻地塑造着技术格局、经济模式以及人类社会的方方面面。混合无疑成为这一年AI创新历程中最为显著的特征之一。多模态生成技术在这一年里取得了令人瞩目的不断进步，使得AI能够巧妙地将文本、图像、音频、视频等多种模态的信息进行深度融合与再创造。例如：AI内容创作：AI可以将作者的文字描述转换为生动的图像、视频和配乐，为创作提供更多可能性，让创意
拉曼光谱增强技术，农药“指纹图谱“数据库？百态老人数据库
构建拉曼光谱增强技术与农药"指纹图谱"数据库是农药成分快速检测领域的前沿方向，其核心在于通过纳米材料增强效应和人工智能算法解析，实现对农药分子的高灵敏度、高特异性识别。以下从技术原理、数据库构建、应用场景及挑战四方面深入解析：一、拉曼光谱增强技术原理1.表面增强拉曼散射（SERS）电磁增强机制：利用金/银纳米结构（纳米颗粒、纳米棒、纳米星）的局域表面等离子体共振效应（LSPR），在激光激发下产生"
制造业汽车业数字化转型新方案——飞速创软低代码平台人工智能
2023年7月20日-2023年7月21日2023汽车业数字化大会&制造业数字化大会在佛山顺德盛大开幕！深圳飞速创软科技有限公司如邀参加展会。本次大会聚焦于数字化转型新场景中企业承压，IT行业可以扮演怎样的角色。如今AGI时代来临，AGI将是第四次工业革命的核心驱动力。人工智能作为最先进生产力，在不断冲击着各个行业，一定程度上要求行业的现有业务结构重构，以实现当今复杂多变、极速发展的时代。在面对多
SpringAI 搭建智能体（二）：搭建客服系统智能体 drebander AI 编程 springAI Agent
在现代人工智能应用中，智能体（Agent）是一个重要的概念，它的核心能力是自主性与灵活性。一个智能体不仅能够理解用户的需求，还能拆解任务、调用工具完成具体操作，并在复杂场景中高效运行。在本篇博客中，我们将围绕一个基于SpringAI的智能体实现，深入探讨智能体的概念、构建流程以及实际应用场景。1.什么是智能体？智能体是一种能够根据目标自主执行任务的系统。与传统的AI模型生成内容的模式不同，智能体通
目标检测算法以及常用库概述 YOLO大师目标检测算法人工智能
YOLO目标检测创新改进与实战案例专栏专栏目录：YOLO有效改进系列及项目实战目录包含卷积，主干注意力，检测头等创新机制以及各种目标检测分割项目实战案例专栏链接:YOLO基础解析+创新改进+实战案例目标检测是在图像中发现并识别物体的过程，它是深度学习和图像处理领域的重要成果之一。在创建物体定位时，识别物体时，常见的一种方法是使用边界框。这种方法具有很高的通用，可以训练目标检测模型来识别和检测多个特
飞速搭震撼上线开启软件开发智能化新篇章低代码
近日，飞速低代码开发平台迎来了一项具有里程碑意义的重大更新——“飞速搭”正式上线。飞速搭通过深度融合前沿的人工智能技术，实现了从需求文档到应用发布的无缝衔接，一键智能生成应用，为软件开发领域带来了全新的突破和变革。“飞速搭”的实现路径高效而清晰。用户只需将需求文档或需求描述输入给预训练的大模型，这一步骤极大地简化了传统软件开发中繁琐的需求分析和文档编写过程，使用户能够更专注于核心需求的表达。大模型
基于CNN+Transformer混合模型实现交通流量时序预测(PyTorch版) 矩阵猫咪 cnn transformer pytorch 卷积神经网络深度学习
前言系列专栏:【深度学习：算法项目实战】✨︎涉及医疗健康、财经金融、商业零售、食品饮料、运动健身、交通运输、环境科学、社交媒体以及文本和图像处理等诸多领域，讨论了各种复杂的深度神经网络思想，如卷积神经网络、循环神经网络、生成对抗网络、门控循环单元、长短期记忆、自然语言处理、深度强化学习、大型语言模型和迁移学习。随着城市化进程的加速，交通流量预测成为城市交通管理与规划中的关键任务。准确的交通流量预测
智能体（Agent）如何具备自我决策能力的机理与实现方法由数入道人工智能应急管理人工智能自然语言处理
一、智能体自我决策能力的机理从人工智能和控制理论的角度看，智能体能够“自我决策”的核心在于其“感知–认知–行动”的循环过程，以及在此过程中引入自主学习与自主优化的机制。经过优化与补充，智能体具备自我决策能力的机理可以分解为以下五个部分：1.自主感知与信息获取智能体通过传感器、数据库、互联网信息等多源数据采集，构建全面的环境感知能力。通过数据清洗、去噪、融合等方法，提升感知数据的可靠性，结合高维特征
【2024最新】python第三方库的概述——功能、特点西西很呆 python 开发语言源代码管理编辑器计算机网络 scrapy pandas
文章目录一、网络请求与爬虫Requests：Scrapy：BeautifulSoup：二、数据处理与分析NumPy：Pandas：SQLAlchemy：SciPy：matplotlib：Seaborn：三、Web开发Flask：Django：四、图像处理Pillow（PILFork）：OpenCV-Python：五、游戏开发Pygame：Pyglet：六、自然语言处理NLTK（NaturalLan
大语言模型应用指南：OpenAI大语言模型简介 AI大模型应用之禅 AI大模型与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
大语言模型应用指南：OpenAI大语言模型简介1.背景介绍1.1问题的由来在过去几年中,自然语言处理(NLP)领域取得了长足的进步,这主要归功于大型语言模型(LargeLanguageModels,LLMs)的出现和发展。LLMs是一种基于深度学习的人工智能模型,能够从大量文本数据中学习语言模式和语义关系,从而生成看似人类写作的自然语言输出。随着计算能力和数据可用性的不断提高,LLMs的规模也在不
通用免杀概论曦梦逐影安全
免杀：病毒木马免于被杀毒软件查杀，基于免杀的技术包含逆向工程、反汇编、系统漏洞等hack技术企业目前标配防护：EDR（终端主机防护）、IPS、IDS、HDR（流量监控）、XDR（相较于EDR更高级），早期的话，基于Server端、Agent端，以及后面更高级的Sass云端部署，早期赛门铁克比较多，目前亚信防毒墙。国内金融、护网：卡巴斯基居多。国外的话强对抗：猎鹰、S1（7x24小时人工智能）架构为
数字图像处理——matlab实现图像灰度等级化（2个等级，4个等级，8个等级，16个等级，32个等级，64个等级，128个等级的灰度图） miilue 实验报告图像处理 MATLAB 图像处理灰度等级化 RGB转灰度代码实现
图像灰度等级化相关知识读者可以自行百度，本篇文章只放matlab的实现代码。在做这个实验时，在网上没有找到好用的代码，自己后来试了一些他人的方法，最后修改完善得到了该篇文章的代码，希望有所帮助。My=imread('E:\informt\lesson\数字图像处理与安全\图像集\Fruit.bmp');%读取图像MyGrayPic=rgb2gray(My);%灰度图像等级化holdon;figur
一、深度学习的基本介绍关关钧深度学习深度学习人工智能神经网络
机器学习的基本步骤：前馈运算、反向传播计算梯度、根据梯度更新参数值。一、定义及基本概念深度学习，就是一种利用深度人工神经网络来进行自动分类、预测和学习的技术。它可以从海量的数据中自动学习，找寻数据中的特征。所以说，它的本质就是自动提取特征的能力。可以说，深度学习就等于深度人工神经网络。一般认为超过三层的神经网络就可以叫做深度神经网络。深度学习属于一种特殊的人工智能技术。反向传播算法：此算法是人工神
【QT开发】所有控件基类QWidget类详解及实战应用 I'mAlex QT开发教程 qt 开发语言
QWidget是Qt中所有用户界面对象的基类，掌握它的用法对于学习和使用Qt进行GUI开发至关重要。通过本篇文章的学习，你应该对QWidget有了全面的理解，能够在自己的项目中正确使用它。博主简介：现任阿里巴巴嵌入式技术专家，15年工作经验，深耕嵌入式+人工智能领域，精通嵌入式领域开发、技术管理、简历招聘面试。CSDN优质创作者，提供产品测评、学习辅导、简历面试辅导、毕设辅导、项目开发、C/C++
# AI绘图中的Embedding、CLIP、Flux中的Clip与LCM SDXL加速生成解析迪小莫学AI 人工智能 embedding
AI绘图中的Embedding、CLIP、Flux中的Clip与LCMSDXL加速生成解析在现代AI绘图和深度学习中，涉及了多个复杂的概念和技术，这些技术在图像生成、训练加速以及多模态学习等方面起着至关重要的作用。在这篇博客中，我们将讨论几个关键概念：Embedding、CLIP模型、Flux中的Clip，以及LCMSDXL加速生成技术的实现原理。1.AI绘图中的Embedding是什么意思？在A
计算机视觉 ---图像读取与显示(OpenCV与Matplotlib) 两千连弹计算机视觉计算机视觉 opencv matplotlib
前言本文分别介绍了使用OpenCV和Matplotlib进行图像读取与显示的方法，如cv2.imread()、cv2.imshow()、plt.imread()、plt.imshow()等，并提及了使用OpenCV时的注意事项。OpenCV与Matplotlib图像读取与显示的差异图像读取：OpenCV：使用cv2.imread()函数读取图像，默认读取的图像格式是BGR（蓝绿红）。Matplot
机器学习day3 ኈ ቼ ዽ 机器学习人工智能
自定义数据集使用框架的线性回归方法对其进行拟合importmatplotlib.pyplotaspltimporttorchimportnumpyasnp#1.散点输入#1、散点输入#定义输入数据data=[[-0.5,7.7],[1.8,98.5],[0.9,57.8],[0.4,39.2],[-1.4,-15.7],[-1.4,-37.3],[-1.8,-49.1],[1.5,75.6],[0
apache ftpserver-CentOS config gengzg apache
<server xmlns="http://mina.apache.org/ftpserver/spring/v1" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation=" http://mina.apache.o
优化MySQL数据库性能的八种方法 AILIKES sql mysql
1、选取最适用的字段属性　　MySQL可以很好的支持大数据量的存取，但是一般说来，数据库中的表越小，在它上面执行的查询也就会越快。因此，在创建表的时候，为了获得更好的性能，我们可以将表中字段的宽度设得尽可能小。例如，在定义邮政编码这个字段时，如果将其设置为CHAR(255),显然给数据库增加了不必要的空间，甚至使用VARCHAR这种类型也是多余的，因为CHAR(6)就可以很
JeeSite 企业信息化快速开发平台 Kai_Ge JeeSite
JeeSite 企业信息化快速开发平台平台简介 JeeSite是基于多个优秀的开源项目，高度整合封装而成的高效，高性能，强安全性的开源Java EE快速开发平台。 JeeSite本身是以Spring Framework为核心容器，Spring MVC为模型视图控制器，MyBatis为数据访问层， Apache Shiro为权限授权层，Ehcahe对常用数据进行缓存，Activit为工作流
通过Spring Mail Api发送邮件 120153216 邮件 main
原文地址：http://www.open-open.com/lib/view/open1346857871615.html 使用Java Mail API来发送邮件也很容易实现，但是最近公司一个同事封装的邮件API实在让我无法接受，于是便打算改用Spring Mail API来发送邮件，顺便记录下这篇文章。【Spring Mail API】 Spring Mail API都在org.spri
Pysvn 程序员使用指南 2002wmj SVN
源文件:http://ju.outofmemory.cn/entry/35762 这是一篇关于pysvn模块的指南. 完整和详细的API请参考 http://pysvn.tigris.org/docs/pysvn_prog_ref.html. pysvn是操作Subversion版本控制的Python接口模块. 这个API接口可以管理一个工作副本, 查询档案库, 和同步两个. 该
在SQLSERVER中查找被阻塞和正在被阻塞的SQL 357029540 SQL Server
SELECT R.session_id AS BlockedSessionID , S.session_id AS BlockingSessionID , Q1.text AS Block
Intent 常用的用法备忘 7454103 .net android Google Blog F#
Intent 应该算是Android中特有的东西。你可以在Intent中指定程序要执行的动作（比如：view,edit,dial），以及程序执行到该动作时所需要的资料。都指定好后，只要调用startActivity()，Android系统会自动寻找最符合你指定要求的应用程序，并执行该程序。下面列出几种Intent 的用法显示网页:
Spring定时器时间配置 adminjun spring 时间配置定时器
红圈中的值由6个数字组成，中间用空格分隔。第一个数字表示定时任务执行时间的秒，第二个数字表示分钟，第三个数字表示小时，后面三个数字表示日，月，年，< xmlnamespace prefix ="o" ns ="urn:schemas-microsoft-com:office:office" /> 测试的时候，由于是每天定时执行，所以后面三个数
POJ 2421 Constructing Roads 最小生成树 aijuans 最小生成树
来源：http://poj.org/problem?id=2421 题意：还是给你n个点，然后求最小生成树。特殊之处在于有一些点之间已经连上了边。思路：对于已经有边的点，特殊标记一下，加边的时候把这些边的权值赋值为0即可。这样就可以既保证这些边一定存在，又保证了所求的结果正确。代码： #include <iostream> #include <cstdio>
重构笔记——提取方法（Extract Method） ayaoxinchao java 重构提炼函数局部变量提取方法
提取方法（Extract Method）是最常用的重构手法之一。当看到一个方法过长或者方法很难让人理解其意图的时候，这时候就可以用提取方法这种重构手法。下面是我学习这个重构手法的笔记：提取方法看起来好像仅仅是将被提取方法中的一段代码，放到目标方法中。其实，当方法足够复杂的时候，提取方法也会变得复杂。当然，如果提取方法这种重构手法无法进行时，就可能需要选择其他
为UILabel添加点击事件 bewithme UILabel
默认情况下UILabel是不支持点击事件的，网上查了查居然没有一个是完整的答案，现在我提供一个完整的代码。 UILabel *l = [[UILabel alloc] initWithFrame:CGRectMake(60, 0, listV.frame.size.width - 60, listV.frame.size.height)]
NoSQL数据库之Redis数据库管理(PHP-REDIS实例) bijian1013 redis 数据库 NoSQL
一.redis.php <?php //实例化 $redis = new Redis(); //连接服务器 $redis->connect("localhost"); //授权 $redis->auth("lamplijie"); //相关操
SecureCRT使用备注 bingyingao secureCRT 每页行数
SecureCRT日志和卷屏行数设置一、使用securecrt时，设置自动日志记录功能。 1、在C:\Program Files\SecureCRT\下新建一个文件夹(也就是你的CRT可执行文件的路径），命名为Logs； 2、点击Options -> Global Options -> Default Session -> Edite Default Sett
【Scala九】Scala核心三：泛型 bit1129 scala
泛型类 package spark.examples.scala.generics class GenericClass[K, V](val k: K, val v: V) { def print() { println(k + "," + v) } } object GenericClass { def main(args: Arr
素数与音乐 bookjovi 素数数学 haskell
由于一直在看haskell，不可避免的接触到了很多数学知识，其中数论最多，如素数，斐波那契数列等，很多在学生时代无法理解的数学现在似乎也能领悟到那么一点。闲暇之余，从图书馆找了<<The music of primes>>和<<世界数学通史>>读了几遍。其中素数的音乐这本书与软件界熟知的&l
Java-Collections Framework学习与总结-IdentityHashMap BrokenDreams Collections
这篇总结一下java.util.IdentityHashMap。从类名上可以猜到，这个类本质应该还是一个散列表，只是前面有Identity修饰，是一种特殊的HashMap。简单的说，IdentityHashMap和HashM
读《研磨设计模式》-代码笔记-享元模式-Flyweight bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.Collection; import java.util.HashMap; import java.util.List; import java
PS人像润饰&调色教程集锦 cherishLC PS
1、仿制图章沿轮廓润饰——柔化图像，凸显轮廓 http://www.howzhi.com/course/retouching/ 新建一个透明图层，使用仿制图章不断Alt+鼠标左键选点，设置透明度为21%，大小为修饰区域的1/3左右（比如胳膊宽度的1/3），再沿纹理方向（比如胳膊方向）进行修饰。所有修饰完成后，对该润饰图层添加噪声，噪声大小应该和
更新多个字段的UPDATE语句 crabdave update
更新多个字段的UPDATE语句 update tableA a set (a.v1, a.v2, a.v3, a.v4) = --使用括号确定更新的字段范围
hive实例讲解实现in和not in子句 daizj hive not in in
本文转自：http://www.cnblogs.com/ggjucheng/archive/2013/01/03/2842855.html 当前hive不支持 in或not in 中包含查询子句的语法，所以只能通过left join实现。假设有一个登陆表login(当天登陆记录,只有一个uid),和一个用户注册表regusers(当天注册用户，字段只有一个uid)，这两个表都包含
一道24点的10+种非人类解法（2,3,10,10） dsjt 算法
这是人类算24点的方法？！！！事件缘由：今天晚上突然看到一条24点状态，当时惊为天人，这NM叫人啊？以下是那条状态朱明西 : 24点，算2 3 10 10，我LX炮狗等面对四张牌痛不欲生，结果跑跑同学扫了一眼说，算出来了，2的10次方减10的3次方。。我草这是人类的算24点啊。。然后么。。。我就在深夜很得瑟的问室友求室友算刚出完题，文哥的暴走之旅开始了 5秒后
关于YII的菜单插件 CMenu和面包末breadcrumbs路径管理插件的一些使用问题 dcj3sjt126com yii framework
在使用 YIi的路径管理工具时，发现了一个问题。 <?php
对象与关系之间的矛盾：“阻抗失配”效应[转] come_for_dream 对象
概述 “阻抗失配”这一词组通常用来描述面向对象应用向传统的关系数据库（RDBMS）存放数据时所遇到的数据表述不一致问题。C++程序员已经被这个问题困扰了好多年，而现在的Java程序员和其它面向对象开发人员也对这个问题深感头痛。 “阻抗失配”产生的原因是因为对象模型与关系模型之间缺乏固有的亲合力。“阻抗失配”所带来的问题包括：类的层次关系必须绑定为关系模式（将对象
学习编程那点事 gcq511120594 编程互联网
一年前的夏天，我还在纠结要不要改行，要不要去学php？能学到真本事吗？改行能成功吗？太多的问题，我终于不顾一切，下定决心，辞去了工作，来到传说中的帝都。老师给的乘车方式还算有效，很顺利的就到了学校，赶巧了，正好学校搬到了新校区。先安顿了下来，过了个轻松的周末，第一次到帝都，逛逛吧！接下来的周一，是我噩梦的开始，学习内容对我这个零基础的人来说，除了勉强完成老师布置的作业外，我已经没有时间和精力去
Reverse Linked List II hcx2013 list
Reverse a linked list from position m to n. Do it in-place and in one-pass. For example:Given 1->2->3->4->5->NULL, m = 2 and n = 4, return
Spring4.1新特性——页面自动化测试框架Spring MVC Test HtmlUnit简介 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
Hadoop集群工具distcp liyonghui160com
1. 环境描述两个集群：rock 和 stone rock无kerberos权限认证，stone有要求认证。 1. 从rock复制到stone，采用hdfs Hadoop distcp -i hdfs://rock-nn:8020/user/cxz/input hdfs://stone-nn:8020/user/cxz/运行在rock端，即源端问题：报版本
一个备份MySQL数据库的简单Shell脚本 pda158 mysql 脚本
　　主脚本（用于备份mysql数据库）：　　该Shell脚本可以自动备份数据库。只要复制粘贴本脚本到文本编辑器中，输入数据库用户名、密码以及数据库名即可。我备份数据库使用的是mysqlump 命令。后面会对每行脚本命令进行说明。　　 1. 分别建立目录“backup”和“oldbackup” 　　#mkdir /backup 　　#mkdir /oldbackup 　
300个涵盖IT各方面的免费资源（中）——设计与编码篇 shoothao IT资源图标库图片库色彩板字体
A. 免费的设计资源 Freebbble:来自于Dribbble的免费的高质量作品。 Dribbble:Dribbble上“免费”的搜索结果——这是巨大的宝藏。 Graphic Burger:每个像素点都做得很细的绝佳的设计资源。 Pixel Buddha:免费和优质资源的专业社区。 Premium Pixels:为那些有创意的人提供免费的素材。
thrift总结 - 跨语言服务开发 uule thrift
官网官网JAVA例子 thrift入门介绍 IBM-Apache Thrift - 可伸缩的跨语言服务开发框架 Thrift入门及Java实例演示 thrift的使用介绍 RPC POM： <dependency> <groupId>org.apache.thrift</groupId>