~hello world~

神经网络：关于模型拟合相关基础学习

1、相关概念

1.1 模型的容量

模型的容量或表达能力，是指模型拟合复杂函数的能力。模型容量的指标为模型的假设空间(Hypothesis Space)大小，即模型可以表示的函数集的大小。假设空间越大越完备，从假设空间中搜索出逼近真实模型的函数也就越有可能；反之，如果假设空间非常受限，就很难从中找到逼近真实模型的函数。
过大的假设空间会增加搜索难度和计算代价，在有限的计算资源的约束下，挑选合适容量的学习模型是一个很大的难题。

1.2 过拟合

当模型的容量过大时，网络模型除了学习到训练集数据的模态之外，还把额外的观测误差也学习进来，导致学习的模型在训练集上面表现较好，但是在未见的样本上表现不佳，也就是模型泛化能力偏弱，这种现象叫作过拟合(Overfitting)。

1.3 欠拟合

当模型的容量过小时，模型不能够很好地学习到训练集数据的模态，导致训练集上表现不佳，同时在未见的样本上表现也不佳，这种现象叫作欠拟合(Underfitting)。

.

2、正则化

通过设计不同层数、大小的网络模型可以为优化算法提供初始的函数假设空间，但是模型的实际容量可以随着网络参数的优化更新而产生变化。以多项式函数模型为例：

上述模型的容量可以通过简单衡量。在训练的过程中，如果网络参数 ₊₁, ⋯ , 均为 0，那么网络的实际容量退化到次多项式的函数容量。因此，通过限制网络参数的稀疏性，可以来约束网络的实际容量。
这种约束一般通过在损失函数上添加额外的参数稀疏性惩罚项实现，在未加约束之前的优化目标是:

对模型的参数添加额外的约束后，优化的目标变为:

其中()表示对网络参数的稀疏性约束函数。一般地，参数的稀疏性约束通过约束参数的范数实现，即

.

2.1 正则化的效果

实际训练时，一般优先尝试较小的正则化系数，观测网络是否出现过拟合现象。然后尝试逐渐增大参数来增加网络参数稀疏性，提高泛化能力。但是，过大的参数有可能导致网络不收敛，需要根据实际任务调节。

2.2 常用的正则化：L0

L0 正则化是指采用 L0 范数作为稀疏性惩罚项()的正则化计算方式，即

其中 L0 范数 ‖‖₀ 定义为中非零元素的个数。通过约束 ∑‖‖₀ 的大小可以迫使网络中的连接权值大部分为 0，从而降低网络的实际参数量和网络容量。但是由于 L0 范数 ‖‖₀ 并不可导，不能利用梯度下降算法进行优化，在神经网络中使用的并不多。
.

2.3 常用的正则化：L1

采用 L1 范数作为稀疏性惩罚项 () 的正则化计算方式叫作 L1 正则化，即

其中 L1 范数 ‖‖₁ 定义为张量中所有元素的绝对值之和。L1 正则化也叫 Lasso Regularization，它是连续可导的，在神经网络中使用广泛。

L1 正则化实现如下:

import tensorflow as tf
# 创建网络参数 w1,w2
w1 = tf.random.normal([4,3])
w2 = tf.random.normal([4,2])

# 计算 L1 正则化项,所有元素的绝对值之和
loss_reg = tf.reduce_sum(tf.math.abs(w1)) + tf.reduce_sum(tf.math.abs(w2))

2.4 常用的正则化：L2

采用 L2 范数作为稀疏性惩罚项 () 的正则化计算方式叫做 L2 正则化，即

其中 L2 范数 ‖‖₂ 定义为张量中所有元素的平方和。L2 正则化也叫 Ridge Regularization，与 L1 正则化一样，是连续可导的，在神经网络中使用广泛。
L2 正则化实现如下:

# 创建网络参数 w1,w2
w1 = tf.random.normal([4,3])
w2 = tf.random.normal([4,2])

# 计算 L2 正则化项，所有元素的平方和
loss_reg = tf.reduce_sum(tf.square(w1)) + tf.reduce_sum(tf.square(w2))

3、Dropout

Dropout 方法主要用来提高模型性能。Dropout 通过随机断开神经网络的连接，减少每次训练时实际参与计算的模型的参数量；但是在测试时，Dropout 会恢复所有的连接，保证模型测试时获得最好的性能。

虚线代表了采样结果为断开的连接线，实线代表了采样结果不断开的连接线。
在 TensorFlow 中，可以通过 tf.nn.dropout(x, rate)函数实现某条连接的 Dropout 功能，其中 rate 参数设置断开的概率值。例如：

# 添加 dropout 操作，断开概率为 0.5
x = tf.nn.dropout(x, rate=0.5)

也可以将 Dropout 作为一个网络层使用，在网络中间插入一个 Dropout 层。例如：

# 添加 Dropout 层，断开概率为 0.5
model.add(layers.Dropout(rate=0.5))

为了验证 Dropout 层对网络训练的影响，在维持网络层数等超参数不变的条件下，通过在 5 层的全连接层中间隔插入不同数量的 Dropout 层来观测 Dropout 对网络训练的影响。可以看到，在不添加 Dropout 层时，网络模型与之前观测的结果一样，出现了明显的过拟合现象；随着 Dropout 层的增加，网络模型训练时的实际容减少，泛化能力变强。

.

4、过拟合问题实战

基于月牙形状的 2 分类数据集的过拟合与欠拟合模型，进
行完整的实战。

4.1 构建数据集

import numpy as np 
import seaborn as sns
import tensorflow as tf 
import matplotlib.pyplot as plt
from sklearn.datasets import make_moons
from sklearn.model_selection import train_test_split
plt.rcParams['font.sans-serif']=['SimHei']
plt.rcParams["axes.unicode_minus"] = False

# 为了演示过拟合现象，我们只采样了 1000 个样本数据，同时添加标准差为 0.25 的高斯噪声数据
# 从 moon 分布中随机采样 1000 个点，并切分为训练集-测试集

N_SAMPLES = 1000 # 采样点数
TEST_SIZE = None # 测试数量比率
X, y = make_moons(n_samples = N_SAMPLES, noise=0.25, random_state=100)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = TEST_SIZE, random_state=50)


def make_plot(X, y, plot_name,XX=None, YY=None, preds=None, dark=False):    
    if dark:
        plt.style.use('dark_background')
    else:
        sns.set_style("whitegrid")
    # 分辨率参数-dpi，画布大小参数-figsize
    plt.figure(dpi=200,figsize=(10,10))   
    axes = plt.gca()
    axes.set_xlim([-2,3])
    axes.set_ylim([-2,2])
    axes.set(xlabel="$x_1$", ylabel="$x_2$")
    plt.title(plot_name, fontsize=10,fontproperties='SimHei')
    # 根据网络输出绘制预测曲面
    if(XX is not None and YY is not None and preds is not None):
        plt.contourf(XX, YY, preds.reshape(XX.shape), 25, alpha = 0.08)
        plt.contour(XX, YY, preds.reshape(XX.shape), levels=[.5],cmap="Greys", vmin=0, vmax=0.6)
    
    # 绘制正负样本
    markers = ['o' if i == 1 else 's' for i in y.ravel()]
    mscatter(X[:, 0], X[:, 1], c=y.ravel(), s=10, cmap=plt.cm.Spectral, edgecolors='none', m=markers, ax=axes)

def mscatter(x, y, ax=None, m=None, **kw):
    import matplotlib.markers as mmarkers
    if not ax: ax = plt.gca()
    sc = ax.scatter(x, y, **kw)
    if (m is not None) and (len(m) == len(x)):
        paths = []
        for marker in m:
            if isinstance(marker, mmarkers.MarkerStyle):
                marker_obj = marker
            else:
                marker_obj = mmarkers.MarkerStyle(marker)
            path = marker_obj.get_path().transformed(
                marker_obj.get_transform())
            paths.append(path)
        sc.set_paths(paths)
    return sc

make_plot(X, y, "数据集")

4.2 网络层数的影响

为了探讨不同的网络深度下的过拟合程度，我们共进行了 5 次训练实验。在 ∈ [0,4] 时，构建网络层数为 +2 层的全连接层网络，并通过 Adam 优化器训练 500 个 Epoch，获得网络在训练集上的分隔曲线，如图。

def network_layers_influence(x_train, y_train):
    for n in range(5): # 构建 5 种不同层数的网络
        model = Sequential()# 创建容器
        
        # 创建第一层
        model.add(Dense(8, input_dim=2,activation='relu'))
        
        for _ in range(n): # 添加 n 层，共 n+2 层
            model.add(Dense(32, activation='relu'))
            
        model.add(Dense(1, activation='sigmoid')) # 创建最末层
        model.compile(loss='binary_crossentropy', optimizer='adam',metrics=['accuracy']) # 模型装配与训练
        history = model.fit(X_train, y_train, epochs=500, verbose=1)
    
        # 绘制不同层数的网络决策边界曲线       
        xx = np.arange(-2, 10, 0.1)       
        yy = np.arange(-2, 2, 0.1)
        
        # 生成 x-y 平面采样网格点，方便可视化
        XX, YY = np.meshgrid(xx, yy)
        preds = model.predict(np.c_[XX.ravel(), YY.ravel()])    
      
        title = "网络层数({})".format(n)        

        make_plot(X_train, y_train, title,XX, YY, preds)
      
        
network_layers_influence(X_train, y_train)

4.3 Dropout 的影响

为了探讨 Dropout 层对网络训练的影响，我们共进行了 5 次实验，每次实验使用 7 层的全连接层网络进行训练，但是在全连接层中间隔插入 0~4 个 Dropout 层，并通过 Adam 优化器训练 500 个 Epoch，网络训练效果如图所示。

def dropout_influence(x_train, y_train):
    for n in range(5):
        model = Sequential()
        model.add(Dense(8, input_dim=2, activation='relu'))
        count = 0
        for _ in range(5):
            model.add(Dense(64, activation='relu'))
            if count < n:
                count += 1
                model.add(layers.Dropout(rate=0.5))
        model.add(Dense(1, activation='sigmoid'))
        model.compile(loss='binary_crossentropy', optimizer='adam', metrics=['accuracy'])
        history = model.fit(X_train, y_train, epochs=500, verbose=1)
        # 绘制不同 Dropout 层数的决策边界曲线        
        xx = np.arange(-2, 3, 0.01)        
        yy = np.arange(-1.5, 2, 0.01)
        
        # 生成 x-y 平面采样网格点，方便可视化
        XX, YY = np.meshgrid(xx, yy)
        preds = model.predict(np.c_[XX.ravel(), YY.ravel()])
        title = "无Dropout层" if n == 0 else "{0}层 Dropout层".format(n)
        file = "Dropout_%i.png" % n
        make_plot(x_train, y_train, title, XX, YY, preds)

dropout_influence(X_train, y_train)

4.4 正则化的影响

为了探讨正则化系数对网络模型训练的影响，我们采用 L2 正则化方式，构建了 5 层的神经网络，其中第 2、3、4 层神经网络层的权值张量 W 均添加 L2 正则化约束项，代码如下：

def build_model_with_regularization(_lambda):
    # 创建带正则化项的神经网络
    model = Sequential()
    model.add(layers.Dense(8, input_dim=2, activation='relu'))  # 不带正则化项
    
    # 2-4层均是带 L2 正则化项
    model.add(layers.Dense(256, activation='relu', kernel_regularizer=regularizers.l2(_lambda)))
    model.add(layers.Dense(256, activation='relu', kernel_regularizer=regularizers.l2(_lambda)))
    model.add(layers.Dense(256, activation='relu', kernel_regularizer=regularizers.l2(_lambda)))
    
    # 输出层
    model.add(layers.Dense(1, activation='sigmoid'))
    model.compile(loss='binary_crossentropy', optimizer='adam', metrics=['accuracy'])  # 模型装配
    return model


def plot_weights_matrix(model, layer_index, plot_title):
    
    # 绘制权值范围函数
    # 提取指定层的权值矩阵
    weights = model.layers[layer_index].get_weights()[0]
    shape = weights.shape
    
    # 生成和权值矩阵等大小的网格坐标
    X = np.array(range(shape[1]))
    Y = np.array(range(shape[0]))
    X, Y = np.meshgrid(X, Y)
    
    # 绘制3D图
    fig = plt.figure()
    ax = fig.gca(projection='3d')
    ax.xaxis.set_pane_color((1.0, 1.0, 1.0, 0.0))
    ax.yaxis.set_pane_color((1.0, 1.0, 1.0, 0.0))
    ax.zaxis.set_pane_color((1.0, 1.0, 1.0, 0.0))
    plt.title(plot_title, fontsize=20, fontproperties='SimHei')
    
    # 绘制权值矩阵范围
    ax.plot_surface(X, Y, weights, cmap=plt.get_cmap('rainbow'), linewidth=0)
    
    # 设置坐标轴名
    ax.set_xlabel('网格x坐标', fontsize=16, rotation=0, fontproperties='SimHei')
    ax.set_ylabel('网格y坐标', fontsize=16, rotation=0, fontproperties='SimHei')
    ax.set_zlabel('权值', fontsize=16, rotation=90, fontproperties='SimHei')
   

def regularizers_influence(X_train, y_train):
    for _lambda in [1e-5, 1e-3, 1e-1, 0.12, 0.13]:  # 设置不同的正则化系数
        
        # 创建带正则化项的模型
        model = build_model_with_regularization(_lambda)
        
        # 模型训练
        model.fit(X_train, y_train, epochs=500, verbose=1)
        
        # 绘制权值范围
        layer_index = 2
        plot_title = "正则化系数：{}".format(_lambda)       
        
        # 绘制网络权值范围图
        plot_weights_matrix(model,layer_index, plot_title)
        
        # 绘制不同正则化系数的决策边界线        
        xx = np.arange(-2, 3, 0.01)        
        yy = np.arange(-1.5, 2, 0.01)
        
        # 生成 x-y 平面采样网格点，方便可视化
        XX, YY = np.meshgrid(xx, yy)
        preds = model.predict(np.c_[XX.ravel(), YY.ravel()])
        title = "正则化系数：{}".format(_lambda)
        
        make_plot(X_train, y_train, title, XX, YY, preds)
        

# 正则化的影响
regularizers_influence(X_train, y_train)

mysql 学习3 SQL语句--整体概述。SQL通用语法；DDL创建数据库，查看数据库，删除数据库，使用数据库； hunandede mysql 学习 sql
SQL通用语法SQL语句分类DDLdatadefinitionlanguage:用来创建数据库，创建表，创建表中的字段，创建索引。因此成为数据定义语言DMLdatamanipulationlanguage有了数据库和表以及字段后，那么我们就需要给这个表中添加数据，删除数据，改动数据，这些都是对数据有改动的行为，因此叫做数据操作语言manipulation中文是操作的意思DQLdataqueryla
selenium自动化测试01 Meng XY selenium自动化测试 selenium 自动化测试工具
前言新人一个，打算写写博客，去记录个人的学习历程。花了一周的时间去学习了selenium自动化，然后记录下来，一些语法、代码之类的。文笔不是很好，一些代码标注、注释可能不是很准确，望见谅。selenium自动化测试呢我用的是Java+maven，工具是IDEA。我在学习自动化的时候用的是eclipse，我习惯用IDEA，看个人喜好了。（要有Java编程基础，Java的话可能会在后续上线，还没写）介
web开发工具之：一、UUID的介绍，java如何产生UUID，作为数据库的主键和加密算法的盐 java冯坚持 web开发 java 数据库
文章目录前言一、UUID是什么二、java如何产生UUID1.生成随机UUID（Version4）2.通过指定的字符串生成UUID三、UUID作为数据库主键1.优点2.缺点四、UUID作为加密的盐总结前言现在web开发中，很多使用UUID作为主键和加密的盐的，其实很简单，这里学习和介绍一下。一、UUID是什么UUID（UniversallyUniqueIdentifier，通用唯一标识符）是一种1
web开发工具之：二、加密和解密工具类，学习加密算法和非加密算法（哈希算法）知识，Java支持MD5和SHA系列的哈希算法。使用UUID作为盐进行增强哈希算法加密的数据完整性验证 java冯坚持 web开发前端学习哈希算法
文章目录前言一、加密算法/非加密算法-了解和学习为主1、加密算法和秘钥a、介绍b、常用加密算法-对称加密算法c、常用加密算法-对称加密算法2、非加密算法：哈希算法（MD5、SHA系列）a、哈希算法介绍b、MD5和SHA系列介绍二、哈希算法应用场景概念介绍1.数据完整性验证2.密码存储（借助数据完整性验证来进行密码存储）3.数字签名4.总结三、注册和登录-采用哈希算法进行密码存储和验证流程1.加密过
国内的AI大模型有可能超过ChatGPT吗？ AIWritePaper官方账号 Prompt ChatGPT AIWritePaper chatgpt 人工智能深度学习 AI写作 AIGC
这是一个非常有前瞻性和现实意义的问题。要回答国内AI是否有可能超过ChatGPT，我们需要从多个方面来分析，包括技术基础、数据资源、应用场景、政策支持以及人才储备等。以下是对这一问题的详细探讨：1.技术基础（1）现状国内AI技术：国内的AI技术发展迅速，尤其在深度学习、自然语言处理（NLP）和计算机视觉等领域已经取得了显著进展。例如，百度的文心一言、阿里的通义千问等大语言模型（LLM）已经在技术上
路径矢量路由协议之BGP-1基础知识 pt1043 BGP 网络
BGP（BorderGatewayProtocol，边界网关协议）是现代网络架构中几乎所有高级技术的基础，任何一项现代网络体系下的高级技术都离不开它。在学习BGP之前，需要具备一定的基础知识。基础准备：CCNA基础——至少需要一半的CCNA基础；推荐阅读《CCNA学习指南：路由和交换认证》（作者：ToddLammle）。OSPF——如果具备基本的多区域OSPF或其他IGP等理论和配置能力，将为学习
C语言从入门到精通 - 学习资源颜栩原
C语言从入门到精通-学习资源【下载地址】C语言从入门到精通-学习资源C语言从入门到精通-学习资源欢迎来到《C语言从入门到精通》的学习资源页面项目地址:https://gitcode.com/open-source-toolkit/a3eac欢迎来到《C语言从入门到精通》的学习资源页面。这本书是专为那些渴望深入理解并掌握C语言的初学者以及进阶者所准备的宝贵资料。通过本书，你将能够系统地学习C语言的基
（三）python网络爬虫（理论+实战）——爬虫与反爬虫阳光宅男xxb 30天学会python网络爬虫 python 大数据爬虫
系列文章目录（1）python网络爬虫—快速入门（理论+实战）（一）（2）python网络爬虫—快速入门（理论+实战）（二）序言本人从事爬虫相关工作已8年以上，从一个小白到能够熟练使用爬虫，中间也走了些弯路，希望以自身的学习经历，让大家能够轻而易举的，快速的，掌握爬虫的相关知识并熟练的使用它，避免浪费更多的无用时间，甚至走
WGAN - 瓦萨斯坦生成对抗网络池央生成对抗网络人工智能神经网络
1.背景与问题生成对抗网络（GenerativeAdversarialNetworks,GANs）是由IanGoodfellow等人于2014年提出的一种深度学习模型。它包括两个主要部分：生成器（Generator）和判别器（Discriminator），两者通过对抗训练的方式，彼此不断改进，生成器的目标是生成尽可能“真实”的数据，而判别器的目标是区分生成的数据和真实数据。虽然传统GAN在多个领域
C++小病毒-1.0勒索小唐C++ c++话题存储 c++开发语言 c#算法 python vscode 编辑器
内容供学习使用,不得转卖,代码复制后请1小时内删除,此代码会危害计算机安全,谨慎操作在C++20环境下,并在虚拟机里运行此代码!#include#include#include#include#include#include#include#include#include#include#include#include#include#pragmacomment(lib,"shlwapi.lib"
【Lora微调】提高模型效率的创新方法 @fishv 人工智能大模型微调 Lora
前言在自然语言处理（NLP）和机器学习的研究和应用中，随着模型规模的不断扩大，模型训练的计算成本和存储需求也不断攀升。大型预训练模型，如GPT、BERT等，虽然在许多任务上表现出色，但它们的训练和微调通常需要巨大的计算资源，这使得许多研究者和开发者无法充分利用这些模型进行个性化或领域特定的调整。为了在保持模型性能的同时减少计算开销，**Lora（Low-RankAdaptation）**应运而生。
Hive面试题汇总大数据侠客 hive相关问题汇总及解决 hive hadoop 数据仓库面试
Hive定义Hive是建立在Hadoop上的数据仓库基础构架。可以将结构化的数据文件映射为一张数据库表，并提供简单的sql查询功能，可以将sql语句转换为MapReduce任务进行运行。其优点是学习成本低，可以通过类SQL语句快速实现简单的MapReduce统计，不必开发专门的MapReduce应用，十分适合数据仓库的统计分析。它提供了一系列的工具，可以用来进行数据提取转化加载（ETL），这是一种
python的中文翻译-再聊聊Python中文社区的翻译 weixin_37988176
在写《学习Python，怎能不懂点PEP呢？》的时候，我已经发现国内的Python翻译环境不容乐观。这个结论可能不对，毕竟这几年Python大热，或许有不少优秀的翻译项目，只是我还不知道而已。不管如何，接着上一篇关于“Python学习资料汉化”的话题，今天，我们再聊聊Python中文社区的翻译话题。Python部落的翻译社很巧合的是，Python部落（公众号：Python程序员）刚刚低调地上线了“
基于JAVA软件技术课程学习系统设计与实现计算机毕业设计源码+数据库+lw文档+系统+部署小朱科技学习
基于JAVA软件技术课程学习系统设计与实现计算机毕业设计源码+数据库+lw文档+系统+部署基于JAVA软件技术课程学习系统设计与实现计算机毕业设计源码+数据库+lw文档+系统+部署本源码技术栈：项目架构：B/S架构开发语言：Java语言开发软件：ideaeclipse前端技术：Layui、HTML、CSS、JS、JQuery等技术后端技术：JAVA运行环境：Win10、JDK1.8数据库：MySQ
InternLM: LMDeploy 量化部署进阶实践 dilvx 机器学习
LMDeploy部署模型模型部署是将训练好的深度学习模型在特定环境中运行。欢迎使用LMDeploy，支持市面上主流的格式和算法。大模型缓存推理本章的前半部分主要讲量化，包括KV-Cache量化、权重量化、激活值量化。量化主要是为了节省存储空间，用int4,int8来重新表示fp16，将模型的显存占用控制在200G可接受的范围下。值得注意的是，在transformer架构下，计算的瓶颈主要在显存带宽
线性回归——最小二乘法代数详细计算过程在天愿作比翼鸟在地愿为连理枝机器学习和人工智能学习概述线性回归最小二乘法机器学习
Reference:动手实战人工智能AIByDoing关于矩阵方法的求解可参考：最小二乘法矩阵详细计算过程基本定义：通过找到一条直线去拟合数据点的分布趋势的过程，就是线性回归的过程。在上图呈现的这个过程中，通过找到一条直线去拟合数据点的分布趋势的过程，就是线性回归的过程。而线性回归中的「线性」代指线性关系，也就是图中所绘制的红色直线。所以，找到最适合的那一条红色直线，就成为了线性回归中需要解决的目
《数据孤岛：AI模型训练之殇，精度与泛化的双重困境》人工智能深度学习
在人工智能飞速发展的当下，数据就是模型的“燃料”。从医疗影像诊断到智能交通调度，从电商推荐系统到金融风险预测，AI模型的精准度与泛化能力，决定了其在实际应用中的价值。然而，一个棘手的问题正阻碍着AI前行的步伐——数据孤岛。数据孤岛，是指在组织内部或不同组织之间，由于系统、管理或流程的原因，数据被孤立存储在不同的数据库、应用程序或部门中，彼此之间缺乏有效的连接和整合。据权威机构调研，在高度信息化的企
202年寒假充电计划——自学手册网络安全（黑客技术）网安康sir web安全安全网络 php 开发语言
前言什么是网络安全网络安全可以基于攻击和防御视角来分类，我们经常听到的“红队”、“渗透测试”等就是研究攻击技术，而“蓝队”、“安全运营”、“安全运维”则研究防御技术。如何成为一名黑客很多朋友在学习安全方面都会半路转行，因为不知如何去学，在这里，我将这个整份答案分为黑客（网络安全）入门必备、黑客（网络安全）职业指南、黑客（网络安全）学习导航三大章节，涉及价值观、方法论、执行力、行业分类、职位解读、法
2025年国内外AI大模型的API接口网址整理 weixin_56968280 人工智能语言模型
本文将盘点国内外的知名度较高的AI大模型平台，其中包括AI大语言模型和AI多模态模型，方便大家一探究竟。AI大模型的api接口有哪些作用？智能写作：可以帮忙写文章、写小说、生成广告文案、起标题，还能改写文字让内容更吸引人。实时聊天：用于做聊天机器人，比如AI角色扮演、社交陪伴AI，甚至语音助手。知识问答：像百科一样快速回答各种问题，或者为特定领域（医疗、法律等）提供专业建议。教育学习：帮助学生做题
NVIDIA-TensorRT-Python推理呆呆珝推理框架 python 人工智能开发语言
1,前言NVIDIATensorRT进行模型推理的Python实现。TensorRT是一个高性能的深度学习推理优化器和运行时，它能够为深度学习模型提供低延迟和高吞吐量的推理能力。(由于官方文档的使用还是比较简单，也可能自己很菜，参考了别人的文档和自己摸索，写出来这个可以使用的API)2.Python-API推理step1：导入基本库(环境自行配置)#导入TensorRT库importtensorr
NCNN推理呆呆珝推理框架 c++人工智能
1.前言ncnn是一个高性能的神经网络前向计算框架，专门针对移动设备和嵌入式设备设计。它由腾讯优图实验室开发，旨在提供高效的神经网络推理能力，特别是在资源受限的环境中，如智能手机和嵌入式系统。ncnn被广泛应用于移动端和嵌入式设备上的各种深度学习应用，包括但不限于：图像分类/目标检测/语义分割/人脸识别/图像生成与处理2.NCNN的CMakeLists.txt编写ncnn的头文件，链接文件，静态链
stable diffusion 模型和lora融合 Kun Li 图像视频生成大模型 stable diffusion
炜哥的AI学习笔记——SuperMerger插件学习-哔哩哔哩接下来学习的插件名字叫做SuperMerger，它的作用正如其名，可以融合大模型或者LoRA，一般来说会结合之前的插件LoRABlockWeight使用，在调整完成LoRA模型的权重后使用改插件进行重新打包。除了LoRA，Checkpoint也可以通过这个插件进行融合合并。实际上，目前市面上存在大量的Checkpoint模型都是经由合并
chatgpt赋能python：Python重装pip：解决Python包管理器问题 sc17332889342 ChatGpt chatgpt python pip 计算机
Python重装pip：解决Python包管理器问题介绍Python是一种开发流行的编程语言，因其易于学习，功能强大和易于使用的包管理器而闻名。pip是Python软件包管理器，可让开发人员轻松地使用Python软件包。许多开发人员可能遇到过pip问题，如错误消息或无法安装软件包。幸运的是，重新安装pip是解决这些问题的常见方法。在此文章中，我们将介绍如何重装pip，解决常见的Python包管理问
Java Web学习笔记淘气的然酱计算机学习笔记 java 学习后端
JavaWeb后端基础第1章Maven项目1.1Maven简介Maven基于项目对象模型，通过一小段描述信息来管理项目的构建、报告和文档。Maven提供了一套标准化的项目结构、构建流程和一套依赖管理机制。Maven模型：pom.xml→项目对象模型↔依赖管理模型→仓库Maven仓库包含本地仓库、中央仓库、远程仓库（私服）。Maven项目获取jar包时，首先在本地仓库寻找是否有对应jar包，若没有则
基于深度学习的鸟类识别系统详解（UI界面 + YOLOv10 + 数据集） 2025年数学建模美赛深度学习 ui YOLO 人工智能 python 计算机视觉
引言鸟类识别是计算机视觉领域中一个独具挑战性的任务，尤其是在复杂的自然环境中，识别不同种类的鸟类需要非常强大的模型和丰富的数据集。随着深度学习技术的发展，基于YOLO（YouOnlyLookOnce）系列模型的目标检测系统展现了卓越的性能，特别是在速度和精度上的平衡方面。本博客将详细讲解如何利用YOLOv10模型来构建一个基于深度学习的鸟类识别系统。该系统会结合自定义鸟类数据集，设计一个简洁直观的
PLS_INTEGER：Oracle PL/SQL中的整数类型深度解析小小野猪 Oracle PL/SQL语法与案例深度解析 oracle sql 数据库 PLS_INTEGER
PLS_INTEGER：OraclePL/SQL中的整数类型深度解析一、概述二、PLS_INTEGER简介三、PLS_INTEGER的优点四、PLS_INTEGER的简单示例示例1：声明并使用PLS_INTEGER变量示例2：在存储过程中使用PLS_INTEGER五、资深应用的代码示例示例3：使用PLS_INTEGER进行复杂的数学计算六、结论七、学习与成长一、概述在Oracle数据库中，PL/S
QT学习小案例 Liguopi666 qt 学习
dialog.h#ifndefDIALOG_H#defineDIALOG_H#include#include#include#include#includeQT_BEGIN_NAMESPACEnamespaceUi{classDialog;}QT_END_NAMESPACEclassDialog:publicQDialog{Q_OBJECTpublic:Dialog(QWidget*parent=
Nginx与API Gateway：服务路由墨瑾轩一起学学Nginx【一】nginx gateway java
关注墨瑾轩，带你探索编程的奥秘！超萌技术攻略，轻松晋级编程高手技术宝库已备好，就等你来挖掘订阅墨瑾轩，智趣学习不孤单即刻启航，编程之旅更有趣欢迎来到Nginx与APIGateway的世界！今天我们要一起探索的是如何使用Nginx作为APIGateway来实现服务路由。想象一下，Nginx就像是一位超级向导，它能够引导每一位游客（请求）去往他们想去的景点（服务）。引言：APIGateway的魅力在微
MySQL入门学习-索引.删除索引守护者170 MySQL学习数据库学习 mysql
一、索引的概念索引是一种特殊的数据结构，用于加速数据库中数据的检索。它可以提高查询的效率，减少磁盘I/O操作，从而加快数据的访问速度。二、索引的类型MySQL支持多种类型的索引，包括：1.主键索引（PRIMARYKEY）：用于唯一标识表中的每行记录。2.唯一索引（UNIQUE）：确保表中某一列的值是唯一的。3.普通索引（INDEX）：用于加速数据的查询。4.全文索引（FULLTEXT）：用于对文本
自动驾驶系统研发系列—追尾风险不再隐形：解密后碰撞预警系统（RCW）的技术与应用学步_技术自动驾驶系统研发自动驾驶人工智能机器学习 RCW
欢迎来到我的技术小筑，一个专为技术探索者打造的交流空间。在这里，我们不仅分享代码的智慧，还探讨技术的深度与广度。无论您是资深开发者还是技术新手，这里都有一片属于您的天空。让我们在知识的海洋中一起航行，共同成长，探索技术的无限可能。探索专栏：学步_技术的首页——持续学习，不断进步，让学习成为我们共同的习惯，让总结成为我们前进的动力。技术导航：人工智能：深入探讨人工智能领域核心技术。自动驾驶：分享自动
多线程编程之join()方法周凡杨 java JOIN 多线程编程线程
现实生活中，有些工作是需要团队中成员依次完成的，这就涉及到了一个顺序问题。现在有T1、T2、T3三个工人，如何保证T2在T1执行完后执行，T3在T2执行完后执行？问题分析：首先问题中有三个实体，T1、T2、T3，因为是多线程编程，所以都要设计成线程类。关键是怎么保证线程能依次执行完呢？ Java实现过程如下： public class T1 implements Runnabl
java中switch的使用 bingyingao java enum break continue
java中的switch仅支持case条件仅支持int、enum两种类型。用enum的时候，不能直接写下列形式。 switch (timeType) { case ProdtransTimeTypeEnum.DAILY: break; default: br
hive having count 不能去重 daizj hive 去重 having count 计数
hive在使用having count()是，不支持去重计数 hive (default)> select imei from t_test_phonenum where ds=20150701 group by imei having count(distinct phone_num)>1 limit 10; FAILED: SemanticExcep
WebSphere对JSP的缓存周凡杨 WAS JSP 缓存
对于线网上的工程，更新JSP到WebSphere后，有时会出现修改的jsp没有起作用，特别是改变了某jsp的样式后，在页面中没看到效果，这主要就是由于websphere中缓存的缘故，这就要清除WebSphere中jsp缓存。要清除WebSphere中JSP的缓存，就要找到WAS安装后的根目录。现服务
设计模式总结朱辉辉33 java 设计模式
1.工厂模式 1.1 工厂方法模式 (由一个工厂类管理构造方法) 1.1.1普通工厂模式(一个工厂类中只有一个方法) 1.1.2多工厂模式(一个工厂类中有多个方法) 1.1.3静态工厂模式(将工厂类中的方法变成静态方法) &n
实例：供应商管理报表需求调研报告老A不折腾 finereport 报表系统报表软件信息化选型
引言随着企业集团的生产规模扩张，为支撑全球供应链管理，对于供应商的管理和采购过程的监控已经不局限于简单的交付以及价格的管理，目前采购及供应商管理各个环节的操作分别在不同的系统下进行，而各个数据源都独立存在，无法提供统一的数据支持；因此，为了实现对于数据分析以提供采购决策，建立报表体系成为必须。业务目标 1、通过报表为采购决策提供数据分析与支撑 2、对供应商进行综合评估以及管理，合理管理和
mysql 林鹤霄
转载源：http://blog.sina.com.cn/s/blog_4f925fc30100rx5l.html mysql -uroot -p ERROR 1045 (28000): Access denied for user 'root'@'localhost' (using password: YES) [root@centos var]# service mysql
Linux下多线程堆栈查看工具(pstree、ps、pstack) aigo linux
原文：http://blog.csdn.net/yfkiss/article/details/6729364 1. pstree pstree以树结构显示进程$ pstree -p work | grep adsshd(22669)---bash(22670)---ad_preprocess(4551)-+-{ad_preprocess}(4552) &n
html input与textarea 值改变事件 alxw4616 JavaScript
// 文本输入框(input) 文本域(textarea)值改变事件 // onpropertychange(IE) oninput(w3c) $('input,textarea').on('propertychange input', function(event) { console.log($(this).val()) });
String类的基本用法百合不是茶 String
字符串的用法; // 根据字节数组创建字符串 byte[] by = { 'a', 'b', 'c', 'd' }; String newByteString = new String(by); 1,length() 获取字符串的长度 &nbs
JDK1.5 Semaphore实例 bijian1013 java thread java多线程 Semaphore
Semaphore类一个计数信号量。从概念上讲，信号量维护了一个许可集合。如有必要，在许可可用前会阻塞每一个 acquire()，然后再获取该许可。每个 release() 添加一个许可，从而可能释放一个正在阻塞的获取者。但是，不使用实际的许可对象，Semaphore 只对可用许可的号码进行计数，并采取相应的行动。 S
使用GZip来压缩传输量 bijian1013 java GZip
启动GZip压缩要用到一个开源的Filter：PJL Compressing Filter。这个Filter自1.5.0开始该工程开始构建于JDK5.0，因此在JDK1.4环境下只能使用1.4.6。 PJL Compressi
【Java范型三】Java范型详解之范型类型通配符 bit1129 java
定义如下一个简单的范型类， package com.tom.lang.generics; public class Generics<T> { private T value; public Generics(T value) { this.value = value; } }
【Hadoop十二】HDFS常用命令 bit1129 hadoop
1. 修改日志文件查看器 hdfs oev -i edits_0000000000000000081-0000000000000000089 -o edits.xml cat edits.xml 修改日志文件转储为xml格式的edits.xml文件，其中每条RECORD就是一个操作事务日志 2. fsimage查看HDFS中的块信息等 &nb
怎样区别nginx中rewrite时break和last ronin47
在使用nginx配置rewrite中经常会遇到有的地方用last并不能工作，换成break就可以，其中的原理是对于根目录的理解有所区别，按我的测试结果大致是这样的。 location / { proxy_pass http://test;
java-21.中兴面试题输入两个整数 n 和 m ，从数列 1 ， 2 ， 3.......n 中随意取几个数 , 使其和等于 m bylijinnan java
import java.util.ArrayList; import java.util.List; import java.util.Stack; public class CombinationToSum { /* 第21 题 2010 年中兴面试题编程求解：输入两个整数 n 和 m ，从数列 1 ， 2 ， 3.......n 中随意取几个数 , 使其和等
eclipse svn 帐号密码修改问题开窍的石头 eclipse SVN svn帐号密码修改
问题描述： Eclipse的SVN插件Subclipse做得很好，在svn操作方面提供了很强大丰富的功能。但到目前为止，该插件对svn用户的概念极为淡薄，不但不能方便地切换用户，而且一旦用户的帐号、密码保存之后，就无法再变更了。解决思路：删除subclipse记录的帐号、密码信息，重新输入
[电子商务]传统商务活动与互联网的结合 comsci 电子商务
某一个传统名牌产品，过去销售的地点就在某些特定的地区和阶层，现在进入互联网之后，用户的数量群突然扩大了无数倍，但是，这种产品潜在的劣势也被放大了无数倍，这种销售利润与经营风险同步放大的效应，在最近几年将会频繁出现。。。。如何避免销售量和利润率增加的
java 解析 properties-使用 Properties-可以指定配置文件路径 cuityang java properties
#mq xdr.mq.url=tcp://192.168.100.15:61618; import java.io.IOException; import java.util.Properties; public class Test { String conf = "log4j.properties"; private static final
Java核心问题集锦 darrenzhu java 基础核心难点
注意，这里的参考文章基本来自Effective Java和jdk源码 1)ConcurrentModificationException 当你用for each遍历一个list时，如果你在循环主体代码中修改list中的元素，将会得到这个Exception，解决的办法是： 1)用listIterator, 它支持在遍历的过程中修改元素， 2)不用listIterator, new一个
1分钟学会Markdown语法 dcj3sjt126com markdown
markdown 简明语法基本符号 *,-,+ 3个符号效果都一样，这3个符号被称为 Markdown符号空白行表示另起一个段落 `是表示inline代码，tab是用来标记代码段，分别对应html的code，pre标签换行单一段落( <p>) 用一个空白行连续两个空格会变成一个 <br> 连续3个符号，然后是空行
Gson使用二（GsonBuilder） eksliang json gson GsonBuilder
转载请出自出处：http://eksliang.iteye.com/blog/2175473 一.概述 GsonBuilder用来定制java跟json之间的转换格式二.基本使用实体测试类：温馨提示：默认情况下@Expose注解是不起作用的,除非你用GsonBuilder创建Gson的时候调用了GsonBuilder.excludeField
报ClassNotFoundException: Didn't find class "...Activity" on path: DexPathList gundumw100 android
有一个工程，本来运行是正常的，我想把它移植到另一台PC上，结果报： java.lang.RuntimeException: Unable to instantiate activity ComponentInfo{com.mobovip.bgr/com.mobovip.bgr.MainActivity}: java.lang.ClassNotFoundException: Didn't f
JavaWeb之JSP指令 ihuning javaweb
要点 JSP指令简介 page指令 include指令 JSP指令简介 JSP指令（directive）是为JSP引擎而设计的，它们并不直接产生任何可见输出，而只是告诉引擎如何处理JSP页面中的其余部分。 JSP指令的基本语法格式： <%@ 指令属性名="
mac上编译FFmpeg跑ios 啸笑天 ffmpeg
1、下载文件：https://github.com/libav/gas-preprocessor，复制gas-preprocessor.pl到/usr/local/bin/下，修改文件权限：chmod 777 /usr/local/bin/gas-preprocessor.pl 2、安装yasm-1.2.0 curl http://www.tortall.net/projects/yasm
sql mysql oracle中字符串连接 macroli oracle sql mysql SQL Server
有的时候，我们有需要将由不同栏位获得的资料串连在一起。每一种资料库都有提供方法来达到这个目的： MySQL: CONCAT() Oracle: CONCAT(), || SQL Server: + CONCAT() 的语法如下： Mysql 中 CONCAT(字串1, 字串2, 字串3, ...): 将字串1、字串2、字串3，等字串连在一起。请注意，Oracle的CON
Git fatal: unab SSL certificate problem: unable to get local issuer ce rtificate qiaolevip 学习永无止境每天进步一点点 git 纵观千象
// 报错如下： $ git pull origin master fatal: unable to access 'https://git.xxx.com/': SSL certificate problem: unable to get local issuer ce rtificate // 原因：由于git最新版默认使用ssl安全验证，但是我们是使用的git未设
windows命令行设置wifi surfingll windows wifi 笔记本wifi
还没有讨厌无线wifi的无尽广告么，还在耐心等待它慢慢启动么教你命令行设置笔记本电脑wifi： 1、开启wifi命令 netsh wlan set hostednetwork mode=allow ssid=surf8 key=bb123456 netsh wlan start hostednetwork pause 其中pause是等待输入，可以去掉 2、
Linux（Ubuntu）下安装sysv-rc-conf wmlJava linux ubuntu sysv-rc-conf
安装：sudo apt-get install sysv-rc-conf 使用：sudo sysv-rc-conf 操作界面十分简洁，你可以用鼠标点击，也可以用键盘方向键定位，用空格键选择，用Ctrl+N翻下一页，用Ctrl+P翻上一页，用Q退出。背景知识 sysv-rc-conf是一个强大的服务管理程序，群众的意见是sysv-rc-conf比chkconf
svn切换环境，重发布应用多了javaee标签前缀 zengshaotao javaee
更换了开发环境，从杭州，改变到了上海。svn的地址肯定要切换的，切换之前需要将原svn自带的.svn文件信息删除，可手动删除，也可通过废弃原来的svn位置提示删除.svn时删除。然后就是按照最新的svn地址和规范建立相关的目录信息，再将原来的纯代码信息上传到新的环境。然后再重新检出，这样每次修改后就可以看到哪些文件被修改过，这对于增量发布的规范特别有用。检出