我是一颗棒棒糖

（pytorch-深度学习）循环神经网络的从零开始实现

循环神经网络的从零开始实现

首先，我们读取周杰伦专辑歌词数据集：

import time
import math
import numpy as np
import torch
from torch import nn, optim
import torch.nn.functional as F
import sys
sys.path.append("..") 

device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')

def data_iter_random(corpus_indices, batch_size, num_steps, device=None):
    # 减1是因为输出的索引x是相应输入的索引y加1
    num_examples = (len(corpus_indices) - 1) // num_steps
    epoch_size = num_examples // batch_size
    example_indices = list(range(num_examples))
    random.shuffle(example_indices)

    # 返回从pos开始的长为num_steps的序列
    def _data(pos):
        return corpus_indices[pos: pos + num_steps]
    if device is None:
        device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')

    for i in range(epoch_size):
        # 每次读取batch_size个随机样本
        i = i * batch_size
        batch_indices = example_indices[i: i + batch_size]
        X = [_data(j * num_steps) for j in batch_indices]
        Y = [_data(j * num_steps + 1) for j in batch_indices]
        yield torch.tensor(X, dtype=torch.float32, device=device), torch.tensor(Y, dtype=torch.float32, device=device)
(corpus_indices, char_to_idx, idx_to_char, vocab_size) = load_data_jay_lyrics()

这里解释一下corpus_indices（每个字对应的索引值的排列）、batch_size（每个小批量的样本数）、num_steps（每个样本所包含的时间步数）三者之间的关系

首先 $epoch\_size = \lfloor\frac{\lfloor \frac{len(corpus\_indices) - 1 }{num\_steps} \rfloor} {batch\_size} \rfloor$
将corpus_indices分割成多个num_steps长度的sample，并记录每个sample的index，组成example_indices
将example_indices打乱
batch_size表示每一个epoch处理的sample的数量，其中每个sample处理的过程为：
- 在example_indices中按顺序选一个点x，sample = corpus_indices[x:x+num_steps]
- 循环batch_size次，就提取了batch_size个sample。

接下来用一个例子展示：

输入一个从0到29的连续整数的人工序列。
设批量大小和时间步数分别为2和6。
打印随机采样每次读取的小批量样本的输入X和标签Y。

my_seq = list(range(30))
for X, Y in data_iter_random(my_seq, batch_size=2, num_steps=6):
    print('X:', X, '\nY:', Y, '\n')

X: tensor([[18., 19., 20., 21., 22., 23.],
        [12., 13., 14., 15., 16., 17.]]) 
Y: tensor([[19., 20., 21., 22., 23., 24.],
        [13., 14., 15., 16., 17., 18.]]) 

X: tensor([[ 0.,  1.,  2.,  3.,  4.,  5.],
        [ 6.,  7.,  8.,  9., 10., 11.]]) 
Y: tensor([[ 1.,  2.,  3.,  4.,  5.,  6.],
        [ 7.,  8.,  9., 10., 11., 12.]])

由该结果可见，相邻的两个随机小批量在原始序列上的位置不一定相邻。

one-hot编码

为了将词表示成向量输入到神经网络，一个简单的办法是使用one-hot向量。

假设词典中不同字符的数量为 $N$ （即词典大小vocab_size），每个字符已经同一个从0到 $N - 1$ 的连续整数值索引一一对应。
如果一个字符的索引是整数 $i$ , 那么我们创建一个全0的长为 $N$ 的向量，并将其位置为 $i$ 的元素设成1。
该向量就是对原字符的one-hot向量。

实现one-hot函数：

def one_hot(x, n_class, dtype=torch.float32): 
    # X shape: (batch), output shape: (batch, n_class)
    x = x.long()
    res = torch.zeros(x.shape[0], n_class, dtype=dtype, device=x.device)
    res.scatter_(1, x.view(-1, 1), 1) #按列填充
    return res
    
x = torch.tensor([0, 2])
one_hot(x, vocab_size)

每次采样的小批量的形状是(批量大小, 时间步数)。

构造一个函数将这样的小批量变换成数个可以输入进网络的形状为(批量大小, 词典大小)的矩阵，矩阵个数等于时间步数。
也就是说，时间步 $t$ 的输入为 $\boldsymbol{X}_t \in \mathbb{R}^{n \times d}$ ，其中 $n$ 为批量大小， $d$ 为输入个数，即one-hot向量长度（词典大小）。

def to_onehot(X, n_class):  
    # X shape: (batch, seq_len), output: seq_len elements of (batch, n_class)
    return [one_hot(X[:, i], n_class) for i in range(X.shape[1])]

X = torch.arange(10).view(2, 5)
inputs = to_onehot(X, vocab_size)
print(len(inputs), inputs[0].shape)

output:

5 torch.Size([2, 1027])

初始化模型参数

num_inputs, num_hiddens, num_outputs = vocab_size, 256, vocab_size
print('will use', device)

def get_params():
    def _one(shape):
        ts = torch.tensor(np.random.normal(0, 0.01, size=shape), device=device, dtype=torch.float32)
        return torch.nn.Parameter(ts, requires_grad=True)

    # 隐藏层参数
    W_xh = _one((num_inputs, num_hiddens))
    W_hh = _one((num_hiddens, num_hiddens))
    b_h = torch.nn.Parameter(torch.zeros(num_hiddens, device=device, requires_grad=True))
    # 输出层参数
    W_hq = _one((num_hiddens, num_outputs))
    b_q = torch.nn.Parameter(torch.zeros(num_outputs, device=device, requires_grad=True))
    return nn.ParameterList([W_xh, W_hh, b_h, W_hq, b_q])

隐藏单元个数 num_hiddens是一个超参数。

定义模型

我们根据循环神经网络的计算表达式实现该模型。

首先定义init_rnn_state函数来返回初始化的隐藏状态。它返回由一个形状为(批量大小, 隐藏单元个数)的值为0的NDArray组成的元组。
使用元组是为了更便于处理隐藏状态含有多个NDArray的情况。

def init_rnn_state(batch_size, num_hiddens, device):
    return (torch.zeros((batch_size, num_hiddens), device=device), )

rnn函数定义了在一个时间步里如何计算隐藏状态和输出。这里的激活函数使用了tanh函数。当元素在实数域上均匀分布时，tanh函数值的均值为0。

def rnn(inputs, state, params):
    # inputs和outputs皆为num_steps个形状为(batch_size, vocab_size)的矩阵
    W_xh, W_hh, b_h, W_hq, b_q = params
    H, = state
    outputs = []
    for X in inputs:
        H = torch.tanh(torch.matmul(X, W_xh) + torch.matmul(H, W_hh) + b_h)
        Y = torch.matmul(H, W_hq) + b_q
        outputs.append(Y)
    return outputs, (H,)

测试观察输出结果的个数（时间步数），以及第一个时间步的输出层输出的形状和隐藏状态的形状。

state = init_rnn_state(X.shape[0], num_hiddens, device)
inputs = to_onehot(X.to(device), vocab_size)
params = get_params()
outputs, state_new = rnn(inputs, state, params)
print(len(outputs), outputs[0].shape, state_new[0].shape)

output:

5 torch.Size([2, 1027]) torch.Size([2, 256])

定义预测函数

定义函数基于前缀prefix（含有数个字符的字符串）来预测接下来的num_chars个字符。这个函数中将循环神经单元rnn设置成了函数参数。

def predict_rnn(prefix, num_chars, rnn, params, init_rnn_state,
                num_hiddens, vocab_size, device, idx_to_char, char_to_idx):
    state = init_rnn_state(1, num_hiddens, device)
    output = [char_to_idx[prefix[0]]]
    for t in range(num_chars + len(prefix) - 1):
        # 将上一时间步的输出作为当前时间步的输入
        X = to_onehot(torch.tensor([[output[-1]]], device=device), vocab_size)
        # 计算输出和更新隐藏状态
        (Y, state) = rnn(X, state, params)
        # 下一个时间步的输入是prefix里的字符或者当前的最佳预测字符
        if t < len(prefix) - 1:
            output.append(char_to_idx[prefix[t + 1]])
        else:
            output.append(int(Y[0].argmax(dim=1).item()))
    return ''.join([idx_to_char[i] for i in output])

先测试一下predict_rnn函数。将根据前缀“分开”创作长度为10个字符（不考虑前缀长度）的一段歌词。因为模型参数为随机值，所以预测结果也是随机的。

predict_rnn('分开', 10, rnn, params, init_rnn_state, num_hiddens, vocab_size,
            device, idx_to_char, char_to_idx)

输出：

'分开东升稻花转花细碎应说'

裁剪梯度

循环神经网络中较容易出现梯度衰减或梯度爆炸。为了应对梯度爆炸，我们可以裁剪梯度（clip gradient）。假设我们把所有模型参数梯度的元素拼接成一个向量 $\boldsymbol{g}$ ，并设裁剪的阈值是 $\theta$ 。裁剪后的梯度

$\min\left(\frac{\theta}{|\boldsymbol{g}|}, 1\right)\boldsymbol{g}$

的 $L_2$ 范数不超过 $\theta$ 。

def grad_clipping(params, theta, device):
    norm = torch.tensor([0.0], device=device)
    for param in params:
        norm += (param.grad.data ** 2).sum()
    norm = norm.sqrt().item()
    if norm > theta:
        for param in params:
            param.grad.data *= (theta / norm)

困惑度

我们通常使用困惑度（perplexity）来评价语言模型的好坏。

困惑度是对交叉熵损失函数做指数运算后得到的值。
最佳情况下，模型总是把标签类别的概率预测为1，此时困惑度为1；
最坏情况下，模型总是把标签类别的概率预测为0，此时困惑度为正无穷；
基线情况下，模型总是预测所有类别的概率都相同，此时困惑度为类别个数。

显然，任何一个有效模型的困惑度必须小于类别个数。在本例中，困惑度必须小于词典大小vocab_size。

定义模型训练函数

使用困惑度评价模型。
在迭代模型参数前裁剪梯度。
对时序数据采用不同采样方法将导致隐藏状态初始化的不同。

def data_iter_random(corpus_indices, batch_size, num_steps, device=None):
    # 减1是因为输出的索引x是相应输入的索引y加1
    num_examples = (len(corpus_indices) - 1) // num_steps
    epoch_size = num_examples // batch_size
    example_indices = list(range(num_examples))
    random.shuffle(example_indices)

    # 返回从pos开始的长为num_steps的序列
    def _data(pos):
        return corpus_indices[pos: pos + num_steps]
    if device is None:
        device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
    
    for i in range(epoch_size):
        # 每次读取batch_size个随机样本
        i = i * batch_size
        batch_indices = example_indices[i: i + batch_size]
        X = [_data(j * num_steps) for j in batch_indices]
        Y = [_data(j * num_steps + 1) for j in batch_indices]
        yield torch.tensor(X, dtype=torch.float32, device=device), torch.tensor(Y, dtype=torch.float32, device=device)

def data_iter_consecutive(corpus_indices, batch_size, num_steps, device=None):
    if device is None:
        device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
    corpus_indices = torch.tensor(corpus_indices, dtype=torch.float32, device=device)
    data_len = len(corpus_indices)
    batch_len = data_len // batch_size
    indices = corpus_indices[0: batch_size*batch_len].view(batch_size, batch_len)
    epoch_size = (batch_len - 1) // num_steps
    for i in range(epoch_size):
        i = i * num_steps
        X = indices[:, i: i + num_steps]
        Y = indices[:, i + 1: i + num_steps + 1]
        yield X, Y

def sgd(params, lr, batch_size):
    # 为了和原书保持一致，这里除以了batch_size，但是应该是不用除的，因为一般用PyTorch计算loss时就默认已经
    # 沿batch维求了平均了。
    for param in params:
        param.data -= lr * param.grad / batch_size # 注意这里更改param时用的param.data

def train_and_predict_rnn(rnn, get_params, init_rnn_state, num_hiddens,
                          vocab_size, device, corpus_indices, idx_to_char,
                          char_to_idx, is_random_iter, num_epochs, num_steps,
                          lr, clipping_theta, batch_size, pred_period,
                          pred_len, prefixes):
    if is_random_iter:
        data_iter_fn = data_iter_random
    else:
        data_iter_fn = data_iter_consecutive
    params = get_params()
    loss = nn.CrossEntropyLoss()

    for epoch in range(num_epochs):
        if not is_random_iter:  # 如使用相邻采样，在epoch开始时初始化隐藏状态
            state = init_rnn_state(batch_size, num_hiddens, device)
        l_sum, n, start = 0.0, 0, time.time()
        data_iter = data_iter_fn(corpus_indices, batch_size, num_steps, device)
        for X, Y in data_iter:
            if is_random_iter:  # 如使用随机采样，在每个小批量更新前初始化隐藏状态
                state = init_rnn_state(batch_size, num_hiddens, device)
            else:  
            # 否则需要使用detach函数从计算图分离隐藏状态, 这是为了
            # 使模型参数的梯度计算只依赖一次迭代读取的小批量序列(防止梯度计算开销太大)
                for s in state:
                    s.detach_()
            
            inputs = to_onehot(X, vocab_size)
            # outputs有num_steps个形状为(batch_size, vocab_size)的矩阵
            (outputs, state) = rnn(inputs, state, params)
            # 拼接之后形状为(num_steps * batch_size, vocab_size)
            outputs = torch.cat(outputs, dim=0)
            # Y的形状是(batch_size, num_steps)，转置后再变成长度为
            # batch * num_steps 的向量，这样跟输出的行一一对应
            y = torch.transpose(Y, 0, 1).contiguous().view(-1)
            # 使用交叉熵损失计算平均分类误差
            l = loss(outputs, y.long())
            
            # 梯度清0
            if params[0].grad is not None:
                for param in params:
                    param.grad.data.zero_()
            l.backward()
            grad_clipping(params, clipping_theta, device)  # 裁剪梯度
            sgd(params, lr, 1)  # 因为误差已经取过均值，梯度不用再做平均
            l_sum += l.item() * y.shape[0]
            n += y.shape[0]

        if (epoch + 1) % pred_period == 0:
            print('epoch %d, perplexity %f, time %.2f sec' % (
                epoch + 1, math.exp(l_sum / n), time.time() - start))
            for prefix in prefixes:
                print(' -', predict_rnn(prefix, pred_len, rnn, params, init_rnn_state,
                    num_hiddens, vocab_size, device, idx_to_char, char_to_idx))

训练模型并创作歌词

设置模型超参数

num_epochs, num_steps, batch_size, lr, clipping_theta = 250, 35, 32, 1e2, 1e-2
pred_period, pred_len, prefixes = 50, 50, ['分开', '不分开']

根据前缀“分开”和“不分开”分别创作长度为50个字符（不考虑前缀长度）的一段歌词。我们每过50个迭代周期便根据当前训练的模型创作一段歌词。

采用随机采样训练模型并创作歌词。

train_and_predict_rnn(rnn, get_params, init_rnn_state, num_hiddens,
                      vocab_size, device, corpus_indices, idx_to_char,
                      char_to_idx, True, num_epochs, num_steps, lr,
                      clipping_theta, batch_size, pred_period, pred_len,
                      prefixes)

采用相邻采样训练模型并创作歌词。

train_and_predict_rnn(rnn, get_params, init_rnn_state, num_hiddens,
                      vocab_size, device, corpus_indices, idx_to_char,
                      char_to_idx, False, num_epochs, num_steps, lr,
                      clipping_theta, batch_size, pred_period, pred_len,
                      prefixes)

MATLAB代码实现了季节优化算法（SOA）中的播种（Seeding）过程 go5463158465 MATLAB专栏算法深度学习 matlab 算法开发语言
%%淘个代码%%%微信公众号搜索：淘个代码，获取更多代码%季节优化算法（SOA）function[Seeds]=Seeding(Population,AlgorithmParams,ProblemParams,NumOfNotImprovedTrees)Seeds=nan;S
CSS学习笔记10——元素的显示与隐藏&&布局技巧之margin，三角形 green_pine_ CSS css 学习笔记前端 html
元素的显示与隐藏类似广告display显示隐藏visibility显示隐藏overflow溢出显示隐藏display属性display:none;隐藏对象display:block;除了转换为块级元素外，还有显示元素的意思display隐藏元素后，不再占有原来位置visibility可见性visibility:visible;元素可视visibility:hidden;元素隐藏visibility
MATLAB代码实现了季节优化算法（Seasonal Optimization Algorithm, SOA）来求解优化问题 go5463158465 matlab 算法深度学习 matlab 算法开发语言
%%淘个代码%%%微信公众号搜索：淘个代码，获取更多代码%季节优化算法（SOA）clearall;clc;closeall%%ProblemStatementfunc_name='F8';ProblemParams.CostFuncName=func_name;[lowerbound,upperbound,dimension,fobj]=fun_info(ProblemParams.CostFun
模型预测控制（MPC）算法介绍 go5463158465 算法算法
模型预测控制（ModelPredictiveControl，MPC）是一种先进的控制策略，广泛应用于工业过程控制、机器人控制、电力系统等领域。它基于系统的模型，通过滚动优化来预测系统未来的行为，并据此确定当前的最优控制输入。以下是对模型预测控制算法的详细解释：1.模型预测控制的基本原理MPC算法的核心思想是利用系统的数学模型预测未来一段时间内系统的输出，通过求解一个有限时域的优化问题来确定当前时刻
python代码实现了一个基于储备库计算的时间序列预测系统 go5463158465 python 算法深度学习 python numpy 开发语言
#!/usr/bin/envpython#coding:utf-8importnumpyasnpimportscipy.sparseassparsefromscipy.sparseimportlinalgimportpandasaspd#globalvariables#Thiswillchangetheinitialconditionused.Currentlyitstartsfromthefir
基于 Spring Boot 的在线教育平台设计与实现设计书 go5463158465 java spring boot 后端 java
《基于SpringBoot的在线教育平台设计与实现设计书》一、项目概述随着互联网技术的飞速发展，在线教育逐渐成为一种重要的教育模式。本项目旨在设计并实现一个功能完备、用户体验良好的基于SpringBoot的在线教育平台，为教师、学生和管理员提供一个高效便捷的教学与学习环境。该平台将涵盖课程管理、视频教学、在线测试、学习资源共享、互动交流、用户管理等多个功能模块，以满足不同用户群体在在线教育场景下的
多数元素-投票算法阿芯爱编程算法面试 java 算法数据结构
//多数元素//输入：nums=[2,2,1,1,1,2,2]//输出：2//投票算法publicstaticintmajorityElement(int[]nums){//更新多的元素状态intcount=0;//选举结果Integercandidate=null;for(intnum:nums){//选出不同的多的元素if(count==0){candidate=num;}//num==can
快速排序算法阿芯爱编程排序算法算法 java
//快速排序publicstaticvoidquickSort(int[]arr,intstart,intend){if(start=pi)right--;while(left=right)break;arr[left]=arr[left]+arr[right]-(arr[right]=arr[left]);}arr[start]=arr[left];arr[left]=pi;returnleft
10个必备Python调试技巧：从pdb到单元测试的开发效率提升指南 deephub python 单元测试机器学习人工智能开发语言
在Python开发过程中，调试是一项核心技能。无论是初级开发者还是资深工程师，掌握高效的调试技巧都能显著提升开发效率。本文将介绍10个实用的调试方法，帮助开发者更有效地定位和解决问题。1、Python内置调试器pdb的应用Python的内置调试器pdb是一个功能强大的调试工具。它能够在程序执行过程中设置断点，检查变量状态，并支持单步调试。importpdbdefbuggy_function(a,b
【python】for 循环的嵌套应用 ClearStari99 Python python 开发语言
目录：while循环的基础语法while循环的基础案例while循环的嵌套应用while循环的嵌套案例for循环的基础语法for循环的嵌套应用循环中断：break和continue综合案例学习目标：掌握for循环的嵌套使用for循环的嵌套同while一样，for循环也支持嵌套使用生活中的嵌套循环：每天都去向小美表白直到成功为止每次表白的流程是送10朵玫瑰然后表白程序中的嵌套for循环：for临时变
【python】if elif else语句 ClearStari99 Python python 开发语言
目录布尔类型和比较运算符if语句的基本格式ifelse语句ifelifelse语句判断语句的嵌套实战案例学习目标掌握ifelifelse语句进行多条件判断的语法思考某些场景下，判断条件不止一个，可能有多个。这种需求能用Python实现吗？ifelifelse语句可以实现ifelifelse语句生活中的判断：如果1动作如果2动作如果N动作否则动作程序中的判断：if条件1:条件1满足应做的事情条件1满
Python Pandas 数据 GroupBy 分组操作详解：分组、聚合与遍历敲代码不忘补水一起学 Python pandas python numpy matplotlib 开发语言数据分析大数据
PythonPandas数据GroupBy分组操作详解：分组、聚合与遍历本文详细介绍了Pandas中数据分组（GroupBy）的常用操作，包括按单列和多列分组、分组后的数据访问与聚合计算。通过实例讲解了如何使用groupby()方法对数据进行分组，并展示了如何使用first()、last()等方法获取分组后的特定数据。此外，还介绍了如何使用agg()方法进行多种聚合计算，如求和、均值和标准差，及如
第20篇：Python 开发进阶：使用Django进行Web开发详解猿享天开 python从入门到精通 python django 开发语言
第20篇：使用Django进行Web开发内容简介在上一篇文章中，我们深入探讨了Flask框架的高级功能，并通过构建一个博客系统展示了其实际应用。本篇文章将转向Django，另一个功能强大且广泛使用的PythonWeb框架。我们将介绍Django的核心概念，包括项目与应用结构、模型与数据库迁移、管理后台、模板与静态文件管理，以及如何将Django应用部署到生产环境。通过详细的代码示例和实战项目，您将
MATLAB 工具库的使用说明和案例示例 go5463158465 机器学习深度学习 matlab matlab 开发语言
以下是一些常见的MATLAB工具库的使用说明和案例示例：信号处理工具箱（SignalProcessingToolbox）：使用说明：提供了用于生成、测量、变换、过滤和可视化信号的函数和应用程序。包括重新采样、平滑、同步信号、设计和分析滤波器、估算功率谱等算法，还包括参数化和线性预测建模算法。案例：音频信号滤波%读取音频文件(audioIn,Fs)=audioread('input_audio.wa
【python】list（列表）的遍历 ClearStari99 Python python 开发语言
目录数据容器入门数据容器：list（列表）list（列表）的遍历数据容器：tuple（元组）数据容器：str（字符串）数据容器的切片数据容器：set（集合）数据容器：dict（字典、映射）数据容器的通用操作综合案例学习目标掌握使用while循环，遍历列表的元素掌握使用for循环，遍历列表的元素列表的遍历-while循环既然数据容器可以存储多个元素，那么，就会有需求从容器内依次取出元素进行操作。将容
SpringCloud两种注册中心 Annaday Spring spring spring cloud java
SpringCloud基本概念系统架构我们之前做的所有的项目都属于单体架构，下面我们将要学习更适合大型项目的分布式架构单体架构：将业务的所有功能几种在一个项目中开发，打成一个包部署。优点：架构简单、部署成本低缺点：耦合度高分布式架构：根据业务功能对系统进行拆分、每个业务模块作为独立项目开发，称为一个服务。优点：降低服务耦合、有利于服务升级拓展。缺点：架构复杂、运维、监控、部署难度高。微服务微服务是
咱们一起学 LINUX（一）：从基础起步，探寻 Linux 程序的诞生奥秘 lilye66 咱们一起学习LINUX linux c++运维
咱们一起学LINUX（一）：从基础起步，探寻Linux程序的诞生奥秘在编程的广袤世界里，Linux占据着极为重要的地位。我一直对Linux充满热情，也深知很多朋友渴望深入了解它，所以希望通过这一系列博客，与大家携手共进，一同探索Linux的奇妙之处。今天，就让我们先从Linux程序的诞生过程开启这段学习之旅。一、HelloWorld示例与程序生成步骤在编程领域，“HelloWorld”程序就像是一
Protocol buffers--python简介以及安装与使用冰雪满天 Python Protocol
简介：以下引用自官方首页文档：ProtocolbuffersareGoogle'slanguage-neutral,platform-neutral,extensiblemechanismforserializingstructureddata–thinkXML,butsmaller,faster,andsimpler.Youdefinehowyouwantyourdatatobestructur
贪心算法-455. 分发饼干小小皮卡丘啃算法贪心算法贪心算法算法 leetcode 数据结构 java
·题目描述假设你是一位很棒的家长，想要给你的孩子们一些小饼干。但是，每个孩子最多只能给一块饼干。对每个孩子i，都有一个胃口值g[i]，这是能让孩子们满足胃口的饼干的最小尺寸；并且每块饼干j，都有一个尺寸s[j]。如果s[j]>=g[i]，我们可以将这个饼干j分配给孩子i，这个孩子会得到满足。你的目标是尽可能满足越多数量的孩子，并输出这个最大数值。示例1:输入:g=[1,2,3],s=[1,1]输出
79、贪心算法-不像贪心的贪心-LeetCode-455.分发饼干烟白贪心
题目描述：假设你是一位很棒的家长，想要给你的孩子们一些小饼干。但是，每个孩子最多只能给一块饼干。对每个孩子i，都有一个胃口值g[i]，这是能让孩子们满足胃口的饼干的最小尺寸；并且每块饼干j，都有一个尺寸s[j]。如果s[j]>=g[i]，我们可以将这个饼干j分配给孩子i，这个孩子会得到满足。你的目标是尽可能满足越多数量的孩子，并输出这个最大数值。来源：力扣（LeetCode）思路：贪心专题，但是没
Python Connect OracleDB ddttoop Python3 WorkTools
Python连接Oracle数据库原文链接：https://blog.csdn.net/xinyuzxx/article/details/81703625cx_Oraclecx_Oracle模块是Python连接Oracle数据库的模块，在Python中，如果要连接Oracle，必须先安装cx_Oracle模块。cx_Oracle的下载地址：https://pypi.python.org/pypi
刷题笔记贪心算法-1 贪心算法理论基础圆圆滚滚小企鹅。刷题笔记笔记贪心算法算法 leetcode
贪心算法比较特殊，知识结构零散，而且理论考察比较少，这里只总结几个重要得部分1.贪心算法的使用条件实际做题的时候是不会给出“贪心算法”这个标签的，所以要看什么时候用，代码随想录给出的答案是没有明显特征！只能凭经验现场试2.贪心算法的解题步骤一旦看出来是可能用贪心，如何解题呢？代码随想录给的答案是：没有固定套路和代码模板，只能凭经验现想但有大致的步骤：1.找局部最优解2.模拟运行从局部最优找全局最优
开源进校园，开放原子校源行 Meetup（中南大学站）圆满结束操作系统开源
12月4日，由开放原子校源行联合龙蜥社区主办，中南大学信息与网络中心、电子信息学院联合浪潮信息承办的开放原子校源行Meetup活动（中南大学站）暨龙蜥社区操作系统动手实践课堂圆满举行。本场活动现场近70位中南大学的同学们积极参与，聆听开源文化、技术分享，并通过动手实践学习操作系统的使用技能。（图/授课现场）开源分享|开放原子校源行Meetup（中南大学站）活动在开放原子校源行Meetup活动中，中
python打包opencv为exe可执行程序 AIOT魔法师 YOLOv5和YOLOv11 opencv python 计算机视觉
网上很多教程但是呢，每次运行起来打包出来的exe，都会报错，多数是提示找不到cv2的库，或者说让安装opencv，例如下面这种：解决方案如下：1、使用opencv-python的版本为：pipinstall-ihttps://pypi.douban.com/simple/opencv-python==4.3.0</
Python 18.3 async/await weixin_34221332 python
async/await用asyncio提供的@asyncio.coroutine可以把一个generator标记为coroutine类型，然后在coroutine内部用yieldfrom调用另一个coroutine实现异步操作。为了简化并更好地标识异步IO，从Python3.5开始引入了新的语法async和await，可以让coroutine的代码更简洁易读。请注意，async和await是针对c
AGI的决策系统：从短期反应到长期规划 AI天才研究院计算机软件编程原理与应用实践大数据AI人工智能 java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
文章标题：AGI的决策系统：从短期反应到长期规划关键词：AGI，决策系统，短期反应，长期规划，算法模型，系统集成摘要：本文旨在深入探讨人工智能（AGI）决策系统的设计和实现，重点从短期反应到长期规划的转变。首先，我们将回顾AGI的发展历程和决策系统的基本概念，接着详细解析短期反应系统和长期规划系统的原理与实现。随后，本文将探讨如何将两种系统有效集成，并讨论数据收集与处理、机器学习模型在决策中的应用
AGI与量子引力的研究前景 AI天才研究院【精选大厂面试题详解】大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
1.AGI在人工智能领域的重要性题目：请简要阐述人工通用智能（AGI）在人工智能领域的意义。答案：人工通用智能（AGI）是指具有与人类智能相似的能力的人工智能系统，能够理解、学习、推理、感知和应对各种复杂环境。AGI在人工智能领域的重要性体现在以下几个方面：超越特定任务的通用能力：AGI能够处理多种不同的任务，而不仅仅是单一的任务，这使得它能够为各行各业提供更加广泛的应用。提高生产效率：AGI在自
详解Python Google Protocol Buffer 职场亮哥
本篇主要介绍如何在Python语言中使用GoogleProtocolBuffer（后续都简写为PB），包括以下几个部分：为什么要使用PB？安装GooglePB自定义.proto文件编译.proto文件解析目标py文件序列化和反序列化更复杂的Message动态编译为什么要使用PB？PB（ProtocolBuffer）是Google开发的用于结构化数据交换格式，作为腾讯云日志服务标准写入格式。因此用于
【OpenGauss源码学习 —— （VecSortAgg）】 J.Kuchiki OpenGauss postgresql gaussdb 数据库
VecSortAgg概述SortAggRunner::SortAggRunner函数SortAggRunner::init_phase函数SortAggRunner::init_indexForApFun函数SortAggRunner::set_key函数BaseAggRunner::initialize_sortstate函数SortAggRunner::BindingFp函数SortAggRu
Python 安装库报错 “python setup.py egg_info did not run successfully.“ SmallerFL 其他问题 fix Mac 环境设置安装 Python相关 python 开发语言人工智能 nlp
文章目录1.Python安装库报错2.问题解决3.参考1.Python安装库报错有时Python用pipinstall安装库的时候会报错，pythonsetup.pyegg_infodidnotrunsuccessfully.，我在安装deepspeed报错示例如下：Preparingmetadata(setup.py)...errorerror:subprocess-exited-with-er
java数字签名三种方式知了ing java jdk
以下3钟数字签名都是基于jdk7的 1，RSA String password="test"; // 1.初始化密钥 KeyPairGenerator keyPairGenerator = KeyPairGenerator.getInstance("RSA"); keyPairGenerator.initialize(51
Hibernate学习笔记 caoyong Hibernate
1>、Hibernate是数据访问层框架，是一个ORM(Object Relation Mapping)框架，作者为:Gavin King 2>、搭建Hibernate的开发环境 a>、添加jar包: aa>、hibernatte开发包中/lib/required/所
设计模式之装饰器模式Decorator（结构型）漂泊一剑客 Decorator
1. 概述若你从事过面向对象开发，实现给一个类或对象增加行为，使用继承机制，这是所有面向对象语言的一个基本特性。如果已经存在的一个类缺少某些方法，或者须要给方法添加更多的功能（魅力），你也许会仅仅继承这个类来产生一个新类—这建立在额外的代码上。
读取磁盘文件txt，并输入String 一炮送你回车库 String
public static void main(String[] args) throws IOException { String fileContent = readFileContent("d:/aaa.txt"); System.out.println(fileContent);
js三级联动下拉框 3213213333332132 三级联动
//三级联动省/直辖市<select id="province"></select> 市/省直辖<select id="city"></select> 县/区 <select id="area"></select>
erlang之parse_transform编译选项的应用 616050468 parse_transform 游戏服务器属性同步 abstract_code
最近使用erlang重构了游戏服务器的所有代码，之前看过C++/lua写的服务器引擎代码，引擎实现了玩家属性自动同步给前端和增量更新玩家数据到数据库的功能，这也是现在很多游戏服务器的优化方向，在引擎层面去解决数据同步和数据持久化，数据发生变化了业务层不需要关心怎么去同步给前端。由于游戏过程中玩家每个业务中玩家数据更改的量其实是很少
JAVA JSON的解析 darkranger java
// { // “Total”：“条数”， // Code: 1, // // “PaymentItems”:[ // { // “PaymentItemID”:”支款单ID”, // “PaymentCode”:”支款单编号”, // “PaymentTime”:”支款日期”, // ”ContractNo”:”合同号”， //
POJ-1273-Drainage Ditches aijuans ACM_POJ
POJ-1273-Drainage Ditches http://poj.org/problem?id=1273 基本的最大流，按LRJ的白书写的 #include<iostream> #include<cstring> #include<queue> using namespace std; #define INF 0x7fffffff int ma
工作流Activiti5表的命名及含义 atongyeye 工作流 Activiti
activiti5 - http://activiti.org/designer/update在线插件安装 activiti5一共23张表 Activiti的表都以ACT_开头。第二部分是表示表的用途的两个字母标识。用途也和服务的API对应。 ACT_RE_*: 'RE'表示repository。这个前缀的表包含了流程定义和流程静态资源（图片，规则，等等）。 A
android的广播机制和广播的简单使用百合不是茶 android 广播机制广播的注册
Android广播机制简介在Android中，有一些操作完成以后，会发送广播，比如说发出一条短信，或打出一个电话，如果某个程序接收了这个广播，就会做相应的处理。这个广播跟我们传统意义中的电台广播有些相似之处。之所以叫做广播，就是因为它只负责“说”而不管你“听不听”，也就是不管你接收方如何处理。另外，广播可以被不只一个应用程序所接收，当然也可能不被任何应
Spring事务传播行为详解 bijian1013 java spring 事务传播行为
在service类前加上@Transactional，声明这个service所有方法需要事务管理。每一个业务方法开始时都会打开一个事务。 Spring默认情况下会对运行期例外(RunTimeException)进行事务回滚。这
eidtplus operate 征客丶 eidtplus
开启列模式: Alt+C 鼠标选择 OR Alt+鼠标左键拖动列模式替换或复制内容(多行): 右键-->格式-->填充所选内容-->选择相应操作 OR Ctrl+Shift+V(复制多行数据,必须行数一致) -------------------------------------------------------
【Kafka一】Kafka入门 bit1129 kafka
这篇文章来自Spark集成Kafka(http://bit1129.iteye.com/blog/2174765)，这里把它单独取出来，作为Kafka的入门吧下载Kafka http://mirror.bit.edu.cn/apache/kafka/0.8.1.1/kafka_2.10-0.8.1.1.tgz 2.10表示Scala的版本，而0.8.1.1表示Kafka
Spring 事务实现机制 BlueSkator spring 代理事务
Spring是以代理的方式实现对事务的管理。我们在Action中所使用的Service对象，其实是代理对象的实例，并不是我们所写的Service对象实例。既然是两个不同的对象，那为什么我们在Action中可以象使用Service对象一样的使用代理对象呢？为了说明问题，假设有个Service类叫AService，它的Spring事务代理类为AProxyService，AService实现了一个接口
bootstrap源码学习与示例：bootstrap-dropdown（转帖） BreakingBad bootstrap dropdown
bootstrap-dropdown组件是个烂东西，我读后的整体感觉。一个下拉开菜单的设计： <ul class="nav pull-right"> <li id="fat-menu" class="dropdown">
读《研磨设计模式》-代码笔记-中介者模式-Mediator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* * 中介者模式（Mediator）：用一个中介对象来封装一系列的对象交互。 * 中介者使各对象不需要显式地相互引用，从而使其耦合松散，而且可以独立地改变它们之间的交互。 * * 在我看来，Mediator模式是把多个对象（
常用代码记录 chenjunt3 UI Excel J#
1、单据设置某行或某字段不能修改 //i是行号,"cash"是字段名称 getBillCardPanelWrapper().getBillCardPanel().getBillModel().setCellEditable(i, "cash", false); //取得单据表体所有项用以上语句做循环就能设置整行了 getBillC
搜索引擎与工作流引擎 comsci 算法工作搜索引擎网络应用
最近在公司做和搜索有关的工作，(只是简单的应用开源工具集成到自己的产品中)工作流系统的进一步设计暂时放在一边了，偶然看到谷歌的研究员吴军写的数学之美系列中的搜索引擎与图论这篇文章中的介绍，我发现这样一个关系(仅仅是猜想) -----搜索引擎和流程引擎的基础--都是图论，至少像在我在JWFD中引擎算法中用到的是自定义的广度优先
oracle Health Monitor daizj oracle Health Monitor
About Health Monitor Beginning with Release 11g, Oracle Database includes a framework called Health Monitor for running diagnostic checks on the database. About Health Monitor Checks Health M
JSON字符串转换为对象 dieslrae java json
作为前言,首先是要吐槽一下公司的脑残编译部署方式,web和core分开部署本来没什么问题,但是这丫居然不把json的包作为基础包而作为web的包,导致了core端不能使用,而且我们的core是可以当web来用的(不要在意这些细节),所以在core中处理json串就是个问题.没办法,跟编译那帮人也扯不清楚,只有自己写json的解析了.
C语言学习八结构体，综合应用，学生管理系统 dcj3sjt126com C语言
实现功能的代码： # include <stdio.h> # include <malloc.h> struct Student { int age; float score; char name[100]; }; int main(void) { int len; struct Student * pArr; int i,
vagrant学习笔记 dcj3sjt126com vagrant
想了解多主机是如何定义和使用的, 所以又学习了一遍vagrant 1. vagrant virtualbox 下载安装 https://www.vagrantup.com/downloads.html https://www.virtualbox.org/wiki/Downloads 查看安装在命令行输入vagrant 2.
14.性能优化-优化-软件配置优化 frank1234 软件配置性能优化
1.Tomcat线程池修改tomcat的server.xml文件： <Connector port="8080" protocol="HTTP/1.1" connectionTimeout="20000" redirectPort="8443" maxThreads="1200" m
一个不错的shell 脚本教程入门级 HarborChung linux shell
一个不错的shell 脚本教程入门级建立一个脚本　　Linux中有好多中不同的shell，但是通常我们使用bash (bourne again shell) 进行shell编程，因为bash是免费的并且很容易使用。所以在本文中笔者所提供的脚本都是使用bash（但是在大多数情况下，这些脚本同样可以在 bash的大姐，bourne shell中运行）。　　如同其他语言一样
Spring4新特性——核心容器的其他改进 jinnianshilongnian spring 动态代理 spring4 依赖注入
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
Linux设置tomcat开机启动 liuxingguome tomcat linux 开机自启动
执行命令sudo gedit /etc/init.d/tomcat6 然后把以下英文部分复制过去。（注意第一句#!/bin/sh如果不写，就不是一个shell文件。然后将对应的jdk和tomcat换成你自己的目录就行了。 #!/bin/bash # # /etc/rc.d/init.d/tomcat # init script for tomcat precesses
第13章 Ajax进阶（下） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Troubleshooting Crystal Reports off BW blueoxygen BO
http://wiki.sdn.sap.com/wiki/display/BOBJ/Troubleshooting+Crystal+Reports+off+BW#TroubleshootingCrystalReportsoffBW-TracingBOE Quite useful, especially this part: SAP BW connectivity For t
Java开发熟手该当心的11个错误 tomcat_oracle java jvm 多线程单元测试
#1、不在属性文件或XML文件中外化配置属性。比如，没有把批处理使用的线程数设置成可在属性文件中配置。你的批处理程序无论在DEV环境中，还是UAT（用户验收测试）环境中，都可以顺畅无阻地运行，但是一旦部署在PROD 上，把它作为多线程程序处理更大的数据集时，就会抛出IOException，原因可能是JDBC驱动版本不同，也可能是#2中讨论的问题。如果线程数目可以在属性文件中配置，那么使它成为
正则表达式大全 yang852220741 html 编程正则表达式
今天向大家分享正则表达式大全，它可以大提高你的工作效率正则表达式也可以被当作是一门语言，当你学习一门新的编程语言的时候，他们是一个小的子语言。初看时觉得它没有任何的意义，但是很多时候，你不得不阅读一些教程，或文章来理解这些简单的描述模式。一、校验数字的表达式数字：^[0-9]*$ n位的数字：^\d{n}$ 至少n位的数字：^\d{n,}$ m-n位的数字：^\d{m,n}$