神经网络学习笔记

神经网络学习笔记

前言

本笔记主要是我研读《神经网络与深度学习》一书之后，对重要知识点的整理和公式的推导。这里讲的神经网络是最简单的前馈神经网络，学习算法采用基于误差反向传播的（随机）梯度下降算法。

文章目录

神经网络学习笔记

前言
1 神经网络结构和符号定义
2 信号前向传播与误差反向传播公式
3 梯度下降算法
4 采用小批量随机梯度下降算法的神经网络训练流程
5 经典神经网络存在的问题和改进

5.1 神经元饱和问题
5.2 过度拟合问题

6 补充：熵与交叉熵的理解
7 基于python numpy 实现神经网络

1 神经网络结构和符号定义

一个三层的神经网络结构（包含输入层）如下：

注意：输入层节点没有运算功能，直接将输入信号传递给隐藏层，而隐藏层和输出层将输入首先进行线性变换，然后再经过激活函数映射到输出。

神经网络中的符号定义

$L$ : 神经网络层数（包含输入层）

$x=(x_1,x_2,...,x_m)^T$ : 输入

$\widehat{y}=(\widehat{y}_1,\widehat{y}_2,...,\widehat{y}_n)^T$ : 输出

$a^l=(a^l_1,a^l_2,...)^T$ : 第 $l$ 层输出，特别地， $a^1=x, a^L = \widehat{y}$

$z^l=(z^l_1,z^l_2,...)^T$ : 第 $l$ 层带权输入

$W^l$ : 第 $l$ 层与第 $l - 1$ 层之间的权重矩阵， $w^l_{ij}$ : 第 $l$ 层第 $i$ 个节点与第 $l - 1$ 层第 $j$ 个节点之间的权重.

$b^l$ : 第 $l$ 层偏置向量， $b^l_j$ : 第 $l$ 层第 $j$ 个节点偏置

2 信号前向传播与误差反向传播公式

假设损失函数采用二次代价函数（均方差），激活函数采用 $s i g m o i d$ 函数。

二次代价函数：
$C_x=\frac{1}{2}\left\|a^L-y\right\|^2$
$s i g m o i d$ 函数定义：
$\sigma{(x)}=\frac{1}{1+e^{-x}}$
$s i g m o i d$ 函数导数有：
$\sigma^{'}{(x)}=\sigma{(x)}(1-\sigma{(x))}$
信号前向传播公式：
$\begin{cases} a^1=x \\ z^l=W^la^{l-1}+b^l , l\ge{2}\\ a^l=\sigma{(z^l)} , l\ge{2}\\ \widehat{y}=a^L \end{cases}$
误差的反向传播公式：
$\begin{cases} \delta^L=\frac{\partial C}{\partial a^L}\odot \sigma^{'}(z^L) =(a^L-y) \odot \sigma^{'}(z^L) \\ \delta^l=[(W^{l+1})^T\delta^{l+1}] \odot \sigma{'}(z^l), l<L \\ \frac{\partial C}{\partial b^l}=\delta^l\\ \frac{\partial C}{\partial W^l}=\delta ^l(a^{l-1})^T \end{cases}$
误差反向传播公式中引入中间变量 $\delta^l$ , 定义为 $\frac{\partial C}{\partial z^l}$ .

公式推导的基本思想是“链式求导法则”，证明时直接进行矩阵求导不易，可先证明分量形式，最后在写成矩阵或向量形式。

3 梯度下降算法

上面的误差反向传播公式是为梯度下降算法而服务的，梯度下降算法是神经网络最常用的学习算法。具体来讲又分为：

批量梯度下降算法
小批量梯度下降算法
随机梯度下降算法
小批量随机梯度下降算法等

参数更新公式：
$\begin{cases} W^l \leftarrow W^l - \eta \frac{\partial C}{\partial W^l} \\ b^l \leftarrow b^l - \eta \frac{\partial C}{\partial b^l} \end{cases}$
其中， $\eta$ 为学习速率.
$\begin{cases} W^l \leftarrow W^l -\eta\frac{\partial C}{\partial W^l} \\ b^l \leftarrow b^l - \eta\frac{\partial C}{\partial b^l} \end{cases}$

4 采用小批量随机梯度下降算法的神经网络训练流程

神经网络学习过程的流程图：

5 经典神经网络存在的问题和改进

5.1 神经元饱和问题

经典的神经网络采用的激活函数是 $s i g m o i d$ 函数，代价采用二次代价函数，两者配合使用共同导致在输出误差较大时学习的速度反而很慢，随着误差的逐渐减小，学习速度出现先增大后又减小的现象。（如下图）为什么会出现这种反常识的现象呢？按照人类的学习经验，不应该是误差越大学习速度越大吗?

要解释这个问题我们首先看看 $s i g m o i d$ 函数的输入输出曲线：

$s i g m o i d$ 函数将输入 $(-\infty, +\infty)$ 的数值挤压到 $(0, 1)$ 之间。当输入的绝对值很大时， $s i g m o i d$ 函数的导数趋近于0，再来看看上面的误差反向传播公式， $\delta^L$ 的公式中恰好含有 $\sigma^{'} (z^L)$ , 这就是原因所在。

改进措施之一：采用交叉熵代价函数，效果是将 $\delta^L$ 的公式中的 $\sigma^{'} (z^L)$ 项约掉。其对应的误差反向传播公式为：
$\begin{cases} \delta^L=\frac{\partial C}{\partial a^L}\odot \sigma^{'}(z^L) = a^L-y \\ \delta^l=[(W^{l+1})^T\delta^{l+1}] \odot \sigma{'}(z^l), l<L \\ \frac{\partial C}{\partial b^l}=\delta^l\\ \frac{\partial C}{\partial W^l}=\delta ^l(a^{l-1})^T \end{cases}$
可见将代价函数变为交叉熵之后，对比两组公式，只有 $\delta^L$ 发生了改变。

推导 $\delta ^L$ 的过程（先证明分量形式）：

改进措施之二：输出层采用** $s o f t m a x$ 激活函数和对数代价函数**。

softmax 定义如下：
$softmax(x_j)=\frac{e^{x_j}}{\sum_{k}{e^{x_k}}}$
特点：对每层神经元的输出值进行归一化（之和为1），因此，最终的输出值可以看作是“概率”。

与sigmoid函数类似，其导数也有类似性质：
$\frac{\partial softmax(x_i)}{\partial x_j} = \begin{cases} softmax(x_i)(1-softmax(x_i)), i=j \\ -softmax(x_i)softmax(x_j), i\ne j \end{cases}$
对数代价函数的定义：
$C_x = -ln (a^L_y)$
巧妙的是输出层采用softmax激活函数和对数代价函数与sigmoid激活函数和交叉熵代价函数的反向传播公式是一样的。

下面推导采用softmax激活函数和对数代价函数的 $\delta^L$ 的计算式：
$\delta^{L}=a^L-y$
推导过程：

有了这样的相似性，你应该使一个具有交叉熵代价的 sigmoid 型输出层，还是一个具有对数似然
代价的柔性最大值输出层呢？柔性最大值加上对数似然的组合更加适合于那些需要将输出激活值解释为概率的场景。

5.2 过度拟合问题

过度拟合（overfit）是指神经网络在训练过程中过分追求较高的分类准确度，学习到“噪声”等非本质特征的信号，而丧失泛化能力，在训练样本之外表现的很差。一般出现在训练样本很少的情况下。

解决过度拟合有以下几种策略：

规范化
弃权
认为增加训练样本等

规范化中的L2规范化是最常用的手段。基本思想是在原来的代价函数的基础上引入网络所有权重的平方和项。即，
$C=C_0+\frac{\lambda}{2n}\sum_{w}{w^2}$
其中， $C_0$ 是原来的代价函数， $\lambda>0$ 是规范化参数。
则，权重的更新公式变成
$\leftarrow w - \eta( \frac{\partial C_0}{\partial w}+\frac{\lambda}{n}w) \\ =(1-\frac{\eta \lambda}{n})w-\eta \frac{\partial C_0}{\partial w}$

这种调整有时被称为权重衰减，因为它使得权重变小。

6 补充：熵与交叉熵的理解

熵、交叉熵属于信息论中的概念。首先明确几个概念：

信息量：与事件空间中的某一事件相对应。刻画某一事件发生的不确定行。定义为 $I (x) = - l o g (p (x))$ , 事件发生的概率越小，信息量越大。

熵：与某一随机变量相对应。刻画某一随机变量的不确定性。定义为 $H_X=E[I]=-\sum_{k}{p(x_k)log(p(x_k))}$

当某一随机变量服从均匀分布时，该随机变量的熵最大。

交叉熵：刻画两个随机变量分布的相似性。定义为 $CEH(p,q)=-\sum_k{p(x_k)log(q(x_k))}$ , 其中，p, q分别是两个分布函数。p是真实样本分布，q是待估计样本分布。交叉熵越小，反映两个分布越接近。

7 基于python numpy 实现神经网络

# -*- coding:utf-8 -*-

"""全连接前馈神经网络训练和测试实现。学习算法采用小批量随机梯度下降算法。
输出层采用softmax函数，代价函数采用对数似然函数，有正则化"""

import numpy as np
import random
import mnist_loader
import matplotlib.pyplot as plt


class Network(object):

    def __init__(self, struct, w=None, b=None, batsize=5, i_max=30, c_min=1e-3, rate=1.0, lam=10):
        # 初始化神经网络
        self.struct = struct
        self.batsize = batsize
        self.nlayer = len(struct) # 神经网络层数，不包含输入层
        self.rate = rate
        self.lam = lam
        self.c = []
        if w is None:
            w, b = self.initwb()
        self.w = w
        self.b = b
        self.i_max = i_max
        self.c_min = c_min
        self.nin = struct[0]
        self.nout = struct[-1]

    def initwb(self):
        # 初始化权重和偏置
        w = [None] + [np.random.randn(a,b)/np.sqrt(b) for a,b in zip(self.struct[1:], self.struct[:-1])]
        b = [None] + [np.random.randn(a, 1) for a in self.struct[1:]]
        # for i in range(0, self.nlayer-1):
        #     w.append(np.ones((self.struct[i+1], self.struct[i]))/self.struct[i])
        #     b.append(np.zeros((self.struct[i+1], 1)))
        return w, b

    def batpro(self, num):
        # 随机分组
        ind = list(range(num))
        # random.shuffle(ind)
        self.nbat = num//self.batsize+1
        t = self.batsize-num%self.batsize
        tt = random.sample(ind, t)
        ind_2 = ind + tt
        random.shuffle(ind_2)
        return [ind_2[i:i+self.batsize] for i in range(0, num, self.batsize)]
        # return np.array(ind_2).reshape((self.nbat, self.batsize))

    def train(self, x, y, x_t, y_t):
        # 训练
        num = x.shape[1]
        self.t = 1 - self.rate*self.lam/num
        epoch = 0
        c = float('inf')
        while epoch < self.i_max:
            bat_inds = self.batpro(num)
            for inds in bat_inds:
                x_bat = x[:, inds]
                y_bat = y[:, inds]
                self.update(x_bat, y_bat)
            epoch += 1
            _, aa = self.forword(x)
            al = aa[-1]
            c = self.calcc(al, y)
            print('c', c)
            self.c.append(c)
            print('Epoch:', epoch)
            self.test(x_t, y_t)
        plt.plot(self.c)
        plt.show()

    def test(self, x, y):
        # 测试
        a = x
        for i in range(1, self.nlayer):
            z = self.w[i]@a+self.b[i]
            a = sigmoid(z)
        ind_p = np.argmax(a, 0)
        ind = np.argmax(y, 0)
        print(sum(ind_p == ind)/y.shape[1])

    def forword(self, x_bat):
        aa = [x_bat] + [np.zeros((t.shape[0], self.batsize)) for t in self.b[1:]]
        zz = [None] + [np.zeros((t.shape[0], self.batsize)) for t in self.b[1:]]
        for i in range(1, self.nlayer - 1):
            zz[i] = self.w[i] @ aa[i - 1] + self.b[i]
            aa[i] = sigmoid(zz[i])
        zz[-1] = self.w[-1] @ aa[-2] + self.b[-1]
        aa[-1] = softmax(zz[-1])
        return zz, aa

    def backward(self, zz, aa, y_bat):
        # 对小批量数据计算各个参数的平局梯度，反向传播算法的关键所在
        delt = [None] + [np.zeros((t.shape[0], self.batsize)) for t in self.b[1:]]
        dw = [None] + [np.zeros(w.shape) for w in self.w[1:]]
        db = [None] + [np.zeros((t.shape[0], self.batsize)) for t in self.b[1:]]

        delt[-1] = aa[-1] - y_bat  # 采用对数似然函数时的 delta_L
        db[-1] = np.mean(delt[-1], 1)
        db[-1].shape = (len(db[-1]), 1)
        dw[-1] = delt[-1]@(aa[-2].T)/self.batsize
        for i in range(self.nlayer-2, 0, -1):
            d_l = ((self.w[i+1].T)@delt[i+1])*sigmoid_d(zz[i])
            delt[i] = d_l
            b_l = np.mean(d_l, 1)
            b_l.shape = (len(b_l), 1)
            db[i] = b_l
            w_l = d_l@(aa[i-1].T)/self.batsize
            dw[i] = w_l
        return dw, db

    def update(self, x_bat, y_bat):
        # 更新参数
        zz, aa = self.forword(x_bat)
        dw, db = self.backward(zz, aa, y_bat)
        self.w = [None]+[self.t*w1-self.rate*w2 for w1, w2 in zip(self.w[1:], dw[1:])]
        self.b = [None]+[b1-self.rate*b2 for b1, b2 in zip(self.b[1:], db[1:])]

    def calcc(self, al, y):
        ind = np.argmax(y, 0)
        return - np.mean(np.log(al[ind, list(range(y.shape[1]))]))

def softmax(z):
    return np.exp(z)/sum(np.exp(z))

def sigmoid(z):
    # 激活函数
    return 1.0/(1.0 + np.exp(-z))

def sigmoid_d(z):
    # 激活函数导数
    return sigmoid(z) * (1 - sigmoid(z))

def parse_data(data):
    # 解析数据
    x_list = [sample[0] for sample in data]
    y_list = [sample[1] for sample in data]
    x = np.array(x_list)
    y = np.array(y_list)
    x = x.T
    y = y.T
    x.shape = x.shape[1:]
    y.shape = y.shape[1:]
    return x, y


if __name__ == '__main__':
    training_data, validation_data, test_data = mnist_loader.load_data_wrapper()
    training_data = list(training_data)
    test_data = list(test_data)
    test_data1 = []
    for i, data in enumerate(test_data):
        t = np.zeros((10, 1))
        t[data[1], 0] = 1.0
        test_data1.append([data[0], t])

    x, y = parse_data(training_data)
    x_t, y_t = parse_data(test_data1)
    nn = Network([784, 100, 10], batsize=10, rate=0.5, i_max=30, lam=1)
    nn.train(x, y, x_t, y_t)

数据集和详细代码参考：https://github.com/Daibingh/network-based-on-numpy

你可能感兴趣的:(机器学习)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
遥感影像的切片处理 sand&wich 计算机视觉 python 图像处理
在遥感影像分析中，经常需要将大尺寸的影像切分成小片段，以便于进行详细的分析和处理。这种方法特别适用于机器学习和图像处理任务，如对象检测、图像分类等。以下是如何使用Python和OpenCV库来实现这一过程，同时确保每个影像片段保留正确的地理信息。准备环境首先，确保安装了必要的Python库，包括numpy、opencv-python和xml.etree.ElementTree。这些库将用于图像处理
ai绘画工具midjourney怎么下载？附作品管理教程设计师早上好
Midjourney是一款功能强大的AI绘画工具，它使用机器学习技术和深度神经网络等算法，可以生成各种艺术风格的绘画作品。在创意设计、广告宣传等方面有着广泛的应用前景。那么，ai绘画工具midjourney怎么下载？本文将为您介绍Midjourney的下载以及作品的相关管理。一、Midjourney下载Midjourney的下载非常简单，只需打开Midjourney官网（点击“GetMidjour
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
机器学习-聚类算法不良人龍木木机器学习机器学习算法聚类
机器学习-聚类算法1.AHC2.K-means3.SC4.MCL仅个人笔记，感谢点赞关注！1.AHC2.K-means3.SC传统谱聚类：个人对谱聚类算法的理解以及改进4.MCL目前仅专注于NLP的技术学习和分享感谢大家的关注与支持！
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
python中zeros用法_Python中的numpy.zeros()用法江平舟 python中zeros用法
numpy.zeros()函数是最重要的函数之一,广泛用于机器学习程序中。此函数用于生成包含零的数组。numpy.zeros()函数提供给定形状和类型的新数组,并用零填充。句法numpy.zeros(shape,dtype=float,order='C'参数形状：整数或整数元组此参数用于定义数组的尺寸。此参数用于我们要在其中创建数组的形状,例如(3,2)或2。dtype：数据类型(可选)此参数用于
【NumPy】深入解析numpy.zeros()函数二七830 numpy
欢迎莅临我的个人主页这里是我深耕Python编程、机器学习和自然语言处理（NLP）领域，并乐于分享知识与经验的小天地！博主简介：我是二七830，一名对技术充满热情的探索者。多年的Python编程和机器学习实践，使我深入理解了这些技术的核心原理，并能够在实际项目中灵活应用。尤其是在NLP领域，我积累了丰富的经验，能够处理各种复杂的自然语言任务。技术专长：我熟练掌握Python编程语言，并深入研究了机
【中国国际航空-注册_登录安全分析报告】风控牛验证码接口安全评测系列安全行为验证极验网易易盾智能手机
前言由于网站注册入口容易被黑客攻击，存在如下安全问题：1.暴力破解密码，造成用户信息泄露2.短信盗刷的安全问题，影响业务及导致用户投诉3.带来经济损失，尤其是后付费客户，风险巨大，造成亏损无底洞所以大部分网站及App都采取图形验证码或滑动验证码等交互解决方案，但在机器学习能力提高的当下，连百度这样的大厂都遭受攻击导致点名批评，图形验证及交互验证方式的安全性到底如何？请看具体分析一、中国国际航空PC
机器学习流形数据降维：UMAP 降维算法小嗷犬 Python 机器学习 #数据分析及可视化机器学习算法人工智能
✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。个人主页：小嗷犬的个人主页个人网站：小嗷犬的技术小站个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。本文目录UMAP简介理论基础特点与优势应用场景在Python中使用UMAP安装umap-learn库使用UMAP可视化手写数字数据集UMAP简介UMAP（UniformManifoldApproximatio
七.正则化愿风去了
吴恩达机器学习之正则化（Regularization）http://www.cnblogs.com/jianxinzhou/p/4083921.html从数学公式上理解L1和L2https://blog.csdn.net/b876144622/article/details/81276818虽然在线性回归中加入基函数会使模型更加灵活，但是很容易引起数据的过拟合。例如将数据投影到30维的基函数上，模
机器学习-------数据标准化罔闻_spider 数据分析算法机器学习人工智能
什么是归一化，它与标准化的区别是什么？一作用在做训练时，需要先将特征值与标签标准化，可以防止梯度防炸和过拟合；将标签标准化后，网络预测出的数据是符合标准正态分布的—StandarScaler()，与真实值有很大差别。因为StandarScaler()对数据的处理是（真实值-平均值）/标准差。同时在做预测时需要将输出数据逆标准化提升模型精度：标准化/归一化使不同维度的特征在数值上更具比较性，提高分类
分享一个基于python的电子书数据采集与可视化分析 hadoop电子书数据分析与推荐系统 spark大数据毕设项目（源码、调试、LW、开题、PPT) 计算机源码社 Python项目大数据大数据 python hadoop 计算机毕业设计选题计算机毕业设计源码数据分析 spark毕设
作者：计算机源码社个人简介：本人八年开发经验，擅长Java、Python、PHP、.NET、Node.js、Android、微信小程序、爬虫、大数据、机器学习等，大家有这一块的问题可以一起交流！学习资料、程序开发、技术解答、文档报告如需要源码，可以扫取文章下方二维码联系咨询Java项目微信小程序项目Android项目Python项目PHP项目ASP.NET项目Node.js项目选题推荐项目实战|p
两种方法判断Python的位数是32位还是64位 sanqima Python编程电脑 python 开发语言
Python从1991年发布以来，凭借其简洁、清晰、易读的语法、丰富的标准库和第三方工具，在Web开发、自动化测试、人工智能、图形识别、机器学习等领域发展迅猛。 Python是一种胶水语言，通过Cython库与C/C++语言进行链接，通过Jython库与Java语言进行链接。 Python是跨平台的，可运行在多种操作系统上，包括但不限于Windows、Linux和macOS。这意味着用Py
使用最大边际相关性(MMR)选择示例：提高AI模型的多样性和相关性 aehrutktrjk 人工智能 easyui 前端 python
使用最大边际相关性(MMR)选择示例：提高AI模型的多样性和相关性引言在机器学习和自然语言处理领域，选择合适的训练示例对模型性能至关重要。最大边际相关性(MaximalMarginalRelevance,MMR)是一种优秀的示例选择方法，它不仅考虑了示例与输入的相关性，还注重保持所选示例之间的多样性。本文将深入探讨如何使用MMR来选择示例，以提高AI模型的性能和泛化能力。什么是最大边际相关性(MM
LangChain集成指南:如何利用多样化的AI提供商 aehrutktrjk 人工智能 langchain python
LangChain集成指南:如何利用多样化的AI提供商引言在人工智能和机器学习领域,LangChain已成为一个强大而灵活的框架,允许开发者轻松集成各种AI服务提供商。本文将深入探讨LangChain的集成能力,介绍如何利用不同的AI提供商来增强你的应用程序,并提供实用的代码示例。LangChain集成概览LangChain支持多种AI提供商的集成,这些集成可以分为两类:独立包集成:这些提供商有独
机器学习VS深度学习 nfgo 机器学习
机器学习（MachineLearning,ML）和深度学习（DeepLearning,DL）是人工智能（AI）的两个子领域，它们有许多相似之处，但在技术实现和应用范围上也有显著区别。下面从几个方面对两者进行区分：1.概念层面机器学习：是让计算机通过算法从数据中自动学习和改进的技术。它依赖于手动设计的特征和数学模型来进行学习，常用的模型有决策树、支持向量机、线性回归等。深度学习：是机器学习的一个子领
大数据毕业设计hadoop+spark+hive知识图谱租房数据分析可视化大屏租房推荐系统 58同城租房爬虫房源推荐系统房价预测系统计算机毕业设计机器学习深度学习人工智能 2401_84572577 程序员大数据 hadoop 人工智能
做了那么多年开发，自学了很多门编程语言，我很明白学习资源对于学一门新语言的重要性，这些年也收藏了不少的Python干货，对我来说这些东西确实已经用不到了，但对于准备自学Python的人来说，或许它就是一个宝藏，可以给你省去很多的时间和精力。别在网上瞎学了，我最近也做了一些资源的更新，只要你是我的粉丝，这期福利你都可拿走。我先来介绍一下这些东西怎么用，文末抱走。（1）Python所有方向的学习路线（
【机器学习与R语言】1-机器学习简介苹果酱0567 面试题汇总与解析 java 中间件开发语言 spring boot 后端
1.基本概念机器学习：发明算法将数据转化为智能行为数据挖掘VS机器学习：前者侧重寻找有价值的信息，后者侧重执行已知的任务。后者是前者的先期准备过程：数据——>抽象化——>一般化。或者：收集数据——推理数据——归纳数据——发现规律抽象化：训练：用一个特定模型来拟合数据集的过程用方程来拟合观测的数据：观测现象——数据呈现——模型建立。通过不同的格式来把信息概念化一般化：一般化：将抽象化的知识转换成可用
Python前沿技术：机器学习与人工智能 4.0啊 Python 人工智能 python 机器学习
Python前沿技术：机器学习与人工智能一、引言随着科技的飞速发展，机器学习和人工智能（AI）已经成为了计算机科学领域的热门话题。Python作为一门易学易用且功能强大的编程语言，已经成为了这两个领域的首选语言之一。本文将深入探讨Python在机器学习和人工智能领域的应用，以及一些前沿技术和工具。二、Python机器学习基础2.1机器学习概述机器学习是人工智能（AI）的一个关键子集，它的核心在于让
chatgpt赋能python：如何在Python中计算平均值 tulingtest ChatGpt python chatgpt numpy 计算机
如何在Python中计算平均值计算平均值是数据分析、统计和机器学习等许多领域中的常见任务。Python作为一门功能强大且易于学习的编程语言，为计算平均值提供了多种方法。在本文中，我们将介绍如何在Python中计算平均值。什么是平均值简单来说，平均值是一组数字的总和除以数字的数量。例如，对于数字序列1，3，5，7，9，平均值是(1+3+5+7+9)/5=5。平均值在数据分析中非常有用，因为它可以提供
Python 初学者入门必知： Anaconda是什么？有什么作用？怎么使用？懒大王爱吃狼 Python基础 python 开发语言 python基础 python学习 anaconda anaconda安装 python教程
初学者在学习Python时，经常看到的一个名字是Anaconda。究竟什么是Anaconda，为什么它如此受欢迎？在这篇文章中，我们将探讨Anaconda，了解Anaconda的从安装到使用的。Anaconda是一个免费开源的Python和R编程发行版，包含上千个适用于数据科学和机器学习的包。同时，配备了Spyder和Jupyternotebook等工具，初学者可以使用它们来学习Python，使用
每天五分钟玩转深度学习PyTorch：模型参数优化器torch.optim 幻风_huanfeng 深度学习框架pytorch 深度学习 pytorch 人工智能神经网络机器学习优化算法
本文重点在机器学习或者深度学习中，我们需要通过修改参数使得损失函数最小化(或最大化)，优化算法就是一种调整模型参数更新的策略。在pytorch中定义了优化器optim，我们可以使用它调用封装好的优化算法，然后传递给它神经网络模型参数，就可以对模型进行优化。本文是学习第6步(优化器)，参考链接pytorch的学习路线随机梯度下降算法在深度学习和机器学习中，梯度下降算法是最常用的参数更新方法，它的公式
一切皆是映射：AI的去中心化：区块链技术的融合 AI大模型应用之禅计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
一切皆是映射：AI的去中心化：区块链技术的融合作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming关键词：AI，区块链，去中心化，智能合约，共识机制，数据安全，隐私保护，分布式账本技术，机器学习，数据隐私1.背景介绍1.1问题的由来随着人工智能（AI）技术的快速发展，其在各个领域的应用越来越广泛，从自动驾驶、智能医疗到金融服务，AI正在改变着我们的生活。
第五届核磁机器学习班（训练营：2023.6.5~6.17）茗创科技
茗创科技专注于脑科学数据处理，涵盖（EEG/ERP,fMRI,结构像,DTI,ASL,FNIRS）等，欢迎留言讨论及转发推荐，也欢迎了解茗创科技的脑电课程，数据处理服务及脑科学工作站销售业务，可添加我们的工程师（微信号MCKJ-zhouyi或17373158786）咨询。★课程简介★基于血氧水平依赖的功能磁共振成像(fMRI)技术,利用其数据构建的功能性脑网络后,发现脑并不是一个单纯对外界刺激进行
如何有效的学习AI大模型？ Python程序员罗宾学习人工智能语言模型自然语言处理架构
学习AI大模型是一个系统性的过程，涉及到多个学科的知识。以下是一些建议，帮助你更有效地学习AI大模型：基础知识储备：数学基础：学习线性代数、概率论、统计学和微积分等，这些是理解机器学习算法的数学基础。编程技能：掌握至少一种编程语言，如Python，因为大多数AI模型都是用Python实现的。理论学习：机器学习基础：了解监督学习、非监督学习、强化学习等基本概念。深度学习：学习神经网络的基本结构，如卷
java线程的无限循环和退出 3213213333332132 java
最近想写一个游戏，然后碰到有关线程的问题，网上查了好多资料都没满足。突然想起了前段时间看的有关线程的视频，于是信手拈来写了一个线程的代码片段。希望帮助刚学java线程的童鞋 package thread; import java.text.SimpleDateFormat; import java.util.Calendar; import java.util.Date
tomcat 容器 BlueSkator tomcat Web servlet
Tomcat的组成部分 1、server A Server element represents the entire Catalina servlet container. (Singleton) 2、service service包括多个connector以及一个engine，其职责为处理由connector获得的客户请求。 3、connector 一个connector
php递归,静态变量,匿名函数使用 dcj3sjt126com PHP 递归函数匿名函数静态变量引用传参
<!doctype html> <html lang="en"> <head> <meta charset="utf-8"> <title>Current To-Do List</title> </head> <body>
属性颜色字体变化周华华 JavaScript
function changSize(className){ var diva=byId("fot") diva.className=className; } </script> <style type="text/css"> .max{ background: #900; color:#039;
将properties内容放置到map中 g21121 properties
代码比较简单： private static Map<Object, Object> map; private static Properties p; static { //读取properties文件 InputStream is = XXX.class.getClassLoader().getResourceAsStream("xxx.properti
[简单]拼接字符串 53873039oycg 字符串
工作中遇到需要从Map里面取值拼接字符串的情况，自己写了个，不是很好，欢迎提出更优雅的写法，代码如下： import java.util.HashMap; import java.uti
Struts2学习云端月影
最近开始关注struts2的新特性，从这个版本开始，Struts开始使用convention-plugin代替codebehind-plugin来实现struts的零配置。配置文件精简了，的确是简便了开发过程，但是，我们熟悉的配置突然disappear了，真是一下很不适应。跟着潮流走吧，看看该怎样来搞定convention-plugin。使用Convention插件，你需要将其JAR文件放
Java新手入门的30个基本概念二 aijuans java 新手 java 入门
基本概念:　　1.OOP中唯一关系的是对象的接口是什么,就像计算机的销售商她不管电源内部结构是怎样的,他只关系能否给你提供电就行了,也就是只要知道can or not而不是how and why.所有的程序是由一定的属性和行为对象组成的,不同的对象的访问通过函数调用来完成,对象间所有的交流都是通过方法调用,通过对封装对象数据,很大限度上提高复用率。　　2.OOP中最重要的思想是类,类是模板是蓝图,
jedis 简单使用 antlove java redis cache command jedis
jedis.RedisOperationCollection.java package jedis; import org.apache.log4j.Logger; import redis.clients.jedis.Jedis; import java.util.List; import java.util.Map; import java.util.Set; pub
PL/SQL的函数和包体的基础百合不是茶 PL/SQL编程函数包体显示包的具体数据包
由于明天举要上课,所以刚刚将代码敲了一遍PL/SQL的函数和包体的实现(单例模式过几天好好的总结下再发出来);以便明天能更好的学习PL/SQL的循环,今天太累了,所以早点睡觉,明天继续PL/SQL总有一天我会将你永远的记载在心里,,, 函数; 函数:PL/SQL中的函数相当于java中的方法;函数有返回值定义函数的 --输入姓名找到该姓名的年薪 create or re
Mockito(二)--实例篇 bijian1013 持续集成 mockito 单元测试
学习了基本知识后，就可以实战了，Mockito的实际使用还是比较麻烦的。因为在实际使用中，最常遇到的就是需要模拟第三方类库的行为。比如现在有一个类FTPFileTransfer，实现了向FTP传输文件的功能。这个类中使用了a
精通Oracle10编程SQL(7)编写控制结构 bijian1013 oracle 数据库 plsql
/* *编写控制结构 */ --条件分支语句 --简单条件判断 DECLARE v_sal NUMBER(6,2); BEGIN select sal into v_sal from emp where lower(ename)=lower('&name'); if v_sal<2000 then update emp set
【Log4j二】Log4j属性文件配置详解 bit1129 log4j
如下是一个log4j.properties的配置 log4j.rootCategory=INFO, stdout , R log4j.appender.stdout=org.apache.log4j.ConsoleAppender log4j.appender.stdout.layout=org.apache.log4j.PatternLayout log4j.appe
java集合排序笔记白糖_ java
public class CollectionDemo implements Serializable,Comparable<CollectionDemo>{ private static final long serialVersionUID = -2958090810811192128L; private int id; private String nam
java导致linux负载过高的定位方法 ronin47
定位java进程ID 可以使用top或ps -ef |grep java ![图片描述][1] 根据进程ID找到最消耗资源的java pid 比如第一步找到的进程ID为5431 执行 top -p 5431 -H ![图片描述][2] 打印java栈信息 $ jstack -l 5431 > 5431.log 在栈信息中定位具体问题将消耗资源的Java PID转
给定能随机生成整数1到5的函数，写出能随机生成整数1到7的函数 bylijinnan 函数
import java.util.ArrayList; import java.util.List; import java.util.Random; public class RandNFromRand5 { /** 题目：给定能随机生成整数1到5的函数，写出能随机生成整数1到7的函数。解法1： f(k) = (x0-1)*5^0+(x1-
PL/SQL Developer保存布局 Kai_Ge
近日由于项目需要，数据库从DB2迁移到ORCAL，因此数据库连接客户端选择了PL/SQL Developer。由于软件运用不熟悉，造成了很多麻烦，最主要的就是进入后，左边列表有很多选项，自己删除了一些选项卡，布局很满意了，下次进入后又恢复了以前的布局，很是苦恼。在众多PL/SQL Developer使用技巧中找到如下这段： &n
[未来战士计划]超能查派[剧透,慎入] comsci 计划
非常好看,超能查派,这部电影......为我们这些热爱人工智能的工程技术人员提供一些参考意见和思想........ 虽然电影里面的人物形象不是非常的可爱....但是非常的贴近现实生活.... &nbs
Google Map API V2 dai_lm google map
以后如果要开发包含google map的程序就更麻烦咯 http://www.cnblogs.com/mengdd/archive/2013/01/01/2841390.html 找到篇不错的文章，大家可以参考一下 http://blog.sina.com.cn/s/blog_c2839d410101jahv.html 1. 创建Android工程由于v2的key需要G
java数据计算层的几种解决方法2 datamachine java sql 集算器
2、SQL SQL/SP/JDBC在这里属于一类，这是老牌的数据计算层，性能和灵活性是它的优势。但随着新情况的不断出现，单纯用SQL已经难以满足需求，比如： JAVA开发规模的扩大，数据量的剧增，复杂计算问题的涌现。虽然SQL得高分的指标不多，但都是权重最高的。成熟度：5星。最成熟的。
Linux下Telnet的安装与运行 dcj3sjt126com linux telnet
Linux下Telnet的安装与运行 linux默认是使用SSH服务的而不安装telnet服务如果要使用telnet 就必须先安装相应的软件包即使安装了软件包默认的设置telnet 服务也是不运行的需要手工进行设置如果是redhat9，则在第三张光盘中找到 telnet-server-0.17-25.i386.rpm
PHP中钩子函数的实现与认识 dcj3sjt126com PHP
假如有这么一段程序： function fun(){ fun1(); fun2(); } 首先程序执行完fun1()之后执行fun2()然后fun()结束。但是，假如我们想对函数做一些变化。比如说，fun是一个解析函数，我们希望后期可以提供丰富的解析函数，而究竟用哪个函数解析，我们希望在配置文件中配置。这个时候就可以发挥钩子的力量了。我们可以在fu
EOS中的WorkSpace密码修改蕃薯耀修改WorkSpace密码
EOS中BPS的WorkSpace密码修改 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 201
SpringMVC4零配置--SpringSecurity相关配置【SpringSecurityConfig】 hanqunfeng SpringSecurity
SpringSecurity的配置相对来说有些复杂，如果是完整的bean配置，则需要配置大量的bean，所以xml配置时使用了命名空间来简化配置，同样，spring为我们提供了一个抽象类WebSecurityConfigurerAdapter和一个注解@EnableWebMvcSecurity，达到同样减少bean配置的目的，如下： applicationContex
ie 9 kendo ui中ajax跨域的问题 jackyrong AJAX跨域
这两天遇到个问题，kendo ui的datagrid，根据json去读取数据，然后前端通过kendo ui的datagrid去渲染，但很奇怪的是，在ie 10,ie 11,chrome,firefox等浏览器中，同样的程序，浏览起来是没问题的，但把应用放到公网上的一台服务器，却发现如下情况： 1） ie 9下，不能出现任何数据，但用IE 9浏览器浏览本机的应用，却没任何问题
不要让别人笑你不能成为程序员 lampcy 编程程序员
在经历六个月的编程集训之后，我刚刚完成了我的第一次一对一的编码评估。但是事情并没有如我所想的那般顺利。说实话，我感觉我的脑细胞像被轰炸过一样。手慢慢地离开键盘，心里很压抑。不禁默默祈祷：一切都会进展顺利的，对吧？至少有些地方我的回答应该是没有遗漏的，是不是？难道我选择编程真的是一个巨大的错误吗——我真的永远也成不了程序员吗？我需要一点点安慰。在自我怀疑，不安全感和脆弱等等像龙卷风一
马皇后的贤德 nannan408
马皇后不怕朱元璋的坏脾气，并敢理直气壮地吹耳边风。众所周知，朱元璋不喜欢女人干政，他认为“后妃虽母仪天下，然不可使干政事”，因为“宠之太过，则骄恣犯分，上下失序”，因此还特地命人纂述《女诫》，以示警诫。但马皇后是个例外。　　有一次，马皇后问朱元璋道：“如今天下老百姓安居乐业了吗？”朱元璋不高兴地回答：“这不是你应该问的。”马皇后振振有词地回敬道：“陛下是天下之父，
选择某个属性值最大的那条记录（不仅仅包含指定属性，而是想要什么属性都可以） Rainbow702 sql group by 最大值 max 最大的那条记录
好久好久不写SQL了，技能退化严重啊！！！直入主题：比如我有一张表，file_info，它有两个属性（但实际不只，我这里只是作说明用）： file_code, file_version 同一个code可能对应多个version 现在，我想针对每一个code，取得它相关的记录中，version 值最大的那条记录， SQL如下： select *
VBScript脚本语言 tntxia VBScript
VBScript 是基于VB的脚本语言。主要用于Asp和Excel的编程。 VB家族语言简介 Visual Basic 6.0 源于BASIC语言。由微软公司开发的包含协助开发环境的事
java中枚举类型的使用 xiao1zhao2 java enum 枚举 1.5新特性
枚举类型是j2se在1.5引入的新的类型,通过关键字enum来定义,常用来存储一些常量. 1.定义一个简单的枚举类型 public enum Sex { MAN, WOMAN } 枚举类型本质是类,编译此段代码会生成.class文件.通过Sex.MAN来访问Sex中的成员,其返回值是Sex类型. 2.常用方法静态的values()方

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他